AI安全基准 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 AI安全基准

时间 详情
2026-01-14
09:15
AI安全研究因缺乏标准基准面临发表障碍

根据推特用户@godofprompt的说法,创新的AI安全方法因缺乏公认的评测基准,常常难以发表。研究者提出新的评估AI真实世界危害的方法时,评审通常要求提供TruthfulQA等标准测试的结果,即使这些基准与新方法无关。这导致无法做定量比较的研究被拒,行业创新进展缓慢(来源:@godofprompt,2026年1月14日)。这表明开发新的AI安全基准具有商业潜力,有助于推动产业创新和应用落地。

2026-01-14
09:15
AI安全研究同行评审邮件泄露:TruthfulQA基准与实际危害减少之争

据God of Prompt报道,泄露的AI安全研究同行评审邮件揭示了业界对于标准基准(如TruthfulQA)与现实危害减少之间的分歧。部分作者专注于实际危害减少指标,而评审更重视标准化测试。此分歧导致创新安全方法若未在主流基准上表现出色,可能难以获得学术认可。这为AI安全解决方案的商业化带来挑战,开发者若无法在公认基准上展现改进,即使实际效果良好,也可能被拒绝(来源:God of Prompt,Twitter,2026年1月14日)。

2026-01-14
09:15
AI安全研究曝出严重问题:94%论文依赖同6项基准测试,行业需寻求新突破

据@godofprompt在Twitter发布的分析显示,2020至2024年间共2847篇AI安全论文中,有94%都依赖相同的6项基准测试。更严重的是,仅需修改一行代码即可在所有基准测试中获得“最先进”成绩,却未真正提升AI安全性。这暴露出学术界AI研究方法存在系统性缺陷,大量研究只是基准测试优化而非实质性进步。对AI产业而言,这为开发更具代表性和实际意义的AI安全评估方法提供了紧迫的商业机会,有助于推动行业突破现有瓶颈。(来源:@godofprompt,Twitter,2026年1月14日)

2025-12-01
23:11
Anthropic红队研究:AI代理在区块链智能合约中发现460万美元漏洞并设立新基准

据Anthropic(@AnthropicAI)在Frontier Red Team博客发布的研究显示,AI代理在区块链智能合约的模拟测试中成功发现了价值460万美元的漏洞。这项与MATSprogram和Anthropic Fellows program合作的研究还建立了评估AI检测智能合约安全性的全新基准。该成果凸显了去中心化金融平台面临的安全挑战,并推动区块链行业加速采用AI驱动的安全解决方案以应对新型金融威胁并保护数字资产(来源:@AnthropicAI,Frontier Red Team Blog,2025年12月1日)。