AI 快讯列表关于 数据污染
| 时间 | 详情 |
|---|---|
|
2026-02-04 09:35 |
Scale AI 2024年分析揭示AI基准测试数据污染问题
据Twitter用户God of Prompt指出,Scale AI于2024年5月发布的研究显示,AI模型在基准测试中获得95%以上高分,主要因为测试题目早已包含在训练数据中。这种数据污染现象导致基准测试分数失去参考价值,真实智能水平难以评估。据God of Prompt报道,行业亟需改进AI模型评估标准,以提升可信度。 |