AI评估方法 AI快讯列表

AI评估方法 AI快讯列表 | Blockchain.News

AI 快讯列表

AI 快讯列表关于 AI评估方法

时间	详情
2026-01-14 09:15	AI安全研究曝出严重问题：94%论文依赖同6项基准测试，行业需寻求新突破据@godofprompt在Twitter发布的分析显示，2020至2024年间共2847篇AI安全论文中，有94%都依赖相同的6项基准测试。更严重的是，仅需修改一行代码即可在所有基准测试中获得“最先进”成绩，却未真正提升AI安全性。这暴露出学术界AI研究方法存在系统性缺陷，大量研究只是基准测试优化而非实质性进步。对AI产业而言，这为开发更具代表性和实际意义的AI安全评估方法提供了紧迫的商业机会，有助于推动行业突破现有瓶颈。（来源：@godofprompt，Twitter，2026年1月14日）原文链接

时间

详情

2026-01-14
09:15

据@godofprompt在Twitter发布的分析显示，2020至2024年间共2847篇AI安全论文中，有94%都依赖相同的6项基准测试。更严重的是，仅需修改一行代码即可在所有基准测试中获得“最先进”成绩，却未真正提升AI安全性。这暴露出学术界AI研究方法存在系统性缺陷，大量研究只是基准测试优化而非实质性进步。对AI产业而言，这为开发更具代表性和实际意义的AI安全评估方法提供了紧迫的商业机会，有助于推动行业突破现有瓶颈。（来源：@godofprompt，Twitter，2026年1月14日）

原文链接