AI评估方法 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 AI评估方法

时间 详情
2026-01-14
09:15
AI安全研究曝出严重问题:94%论文依赖同6项基准测试,行业需寻求新突破

据@godofprompt在Twitter发布的分析显示,2020至2024年间共2847篇AI安全论文中,有94%都依赖相同的6项基准测试。更严重的是,仅需修改一行代码即可在所有基准测试中获得“最先进”成绩,却未真正提升AI安全性。这暴露出学术界AI研究方法存在系统性缺陷,大量研究只是基准测试优化而非实质性进步。对AI产业而言,这为开发更具代表性和实际意义的AI安全评估方法提供了紧迫的商业机会,有助于推动行业突破现有瓶颈。(来源:@godofprompt,Twitter,2026年1月14日)