AI 快讯列表关于 问题解决
| 时间 | 详情 |
|---|---|
|
2026-02-04 09:35 |
最新分析:AI模型GSM8k再现能力与性能差距呈0.32相关
根据推特用户God of Prompt的报道,研究人员发现AI模型在生成GSM8k测试题方面的能力与其性能差距之间存在0.32的相关性。该发现表明,能够复述测试题的模型在面对新问题时表现更差。这意味着这些模型更倾向于记忆答案而非真正解决问题,这对当前AI评测基准的有效性提出了挑战。 |