快讯列表

关于 LLM评测指标 的快讯列表

时间 详情
2025-11-22
02:11
安德烈·卡帕西寻求AI“slop”量化定义与可测“slop指数”,并考虑用LLM小剧集与思考代币预算评估

据@karpathy称,他正在寻求AI“slop”的量化、可测定义,并表示目前只有直觉上的“slop指数”而缺乏正式指标。来源:@karpathy 在X,2025年11月22日。据@karpathy称,他考虑用LLM小剧集与“思考”代币预算来度量输出质量与成本。来源:@karpathy 在X,2025年11月22日。对AI与加密相关市场的交易者而言,该帖强调当前缺乏标准化LLM质量指标,这与模型评估与成本控制直接相关,是AI产品定价与基准的重要输入。来源:@karpathy 在X,2025年11月22日。

来源