对抗攻击防御 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 对抗攻击防御

时间 详情
2026-01-09
21:30
Anthropic AI安全突破:1700小时红队测试未发现通用越狱方法

根据@AnthropicAI发布的信息,经过累计1700小时的红队测试,他们的新系统尚未被发现存在通用越狱方法,即没有一种攻击策略可以在多种查询场景下持续绕过安全防护。该研究已发布于arXiv(arxiv.org/abs/2601.04603),显示出Anthropic AI模型在防止提示注入和对抗性攻击方面的显著提升。对于金融、医疗和法律等行业的企业用户,这意味着AI系统的安全性和合规性大大增强,有助于降低运营风险(来源:@AnthropicAI,arxiv.org/abs/2601.04603)。