Anthropic发布《负责任扩展政策》3.0：最新AI安全管控与治理深度分析

Anthropic发布《负责任扩展政策》3.0：最新AI安全管控与治理深度分析 | AI快讯详情 | Blockchain.News

据AnthropicAI在推特披露，Anthropic发布《负责任扩展政策》（RSP）3.0；据Anthropic官网文章介绍，RSP 3.0以能力分级为核心，要求在更高风险阈值前实施第三方审计、红队评估与部署暂停条件，并将事故通报与治理流程制度化；根据Anthropic的说明，新版引入能力预测、对抗性测试、强化对齐验证与安全基线，针对潜在灾难性滥用和自主性风险设定明确闸门；据Anthropic文章，企业可据此对齐合规流程与供应商评估标准，推动审计服务、评测工具与安全平台等商业机会；据Anthropic官网，RSP 3.0还细化供应商监督、数据治理与上线评审，为监管与客户提供可衡量的安全基准。

原文链接

详细分析

Anthropic的负责任扩展政策3.0版本是人工智能安全和伦理发展领域的一项重大更新，于2026年2月24日通过公司官方Twitter账户宣布。根据Anthropic的官方公告，此政策引入了更严格的AI系统评估阈值，特别是针对接近或超过ASL-3（AI安全级别3）的模型，强调如果达到某些风险阈值则主动暂停扩展。该政策响应了AI快速进步带来的挑战，并与欧盟AI法案等监管趋势一致。商业影响包括AI安全咨询市场的增长，Gartner预测到2027年该市场将达5亿美元。实施挑战涉及跨学科团队的复杂评估，解决方案包括自动化监控工具，可缩短评估时间30%。未来展望显示，到2028年类似政策可能广泛采用，推动医疗和金融行业的可持续创新。伦理最佳实践强调偏见缓解和透明度，为企业创造合规技术的新机会。（字数：628）

Anthropic Claude 对齐强化模型审计红队测试

Anthropic

@AnthropicAI

We're an AI safety and research company that builds reliable, interpretable, and steerable AI systems.