Scale AI AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 Scale AI

时间 详情
2026-02-04
09:36
AI基准测试受质疑:Scale AI 2024年揭示数据污染风险分析

据推特用户@godofprompt报道,近期研究显示,AI基准测试结果存在误导性,因为测试题目已被纳入模型训练数据。Scale AI于2024年5月发布证据,指出许多AI模型在基准测试中得分超过95%,主要由于数据污染问题。这一未解决的污染问题引发了业界对模型真实能力的担忧,凸显了优化AI评估方法的必要性。

2026-02-04
09:35
Scale AI 2024年分析揭示AI基准测试数据污染问题

据Twitter用户God of Prompt指出,Scale AI于2024年5月发布的研究显示,AI模型在基准测试中获得95%以上高分,主要因为测试题目早已包含在训练数据中。这种数据污染现象导致基准测试分数失去参考价值,真实智能水平难以评估。据God of Prompt报道,行业亟需改进AI模型评估标准,以提升可信度。