对齐强化 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 对齐强化

时间 详情
2026-02-24
20:28
Anthropic发布《负责任扩展政策》3.0:最新AI安全管控与治理深度分析

据AnthropicAI在推特披露,Anthropic发布《负责任扩展政策》(RSP)3.0;据Anthropic官网文章介绍,RSP 3.0以能力分级为核心,要求在更高风险阈值前实施第三方审计、红队评估与部署暂停条件,并将事故通报与治理流程制度化;根据Anthropic的说明,新版引入能力预测、对抗性测试、强化对齐验证与安全基线,针对潜在灾难性滥用和自主性风险设定明确闸门;据Anthropic文章,企业可据此对齐合规流程与供应商评估标准,推动审计服务、评测工具与安全平台等商业机会;据Anthropic官网,RSP 3.0还细化供应商监督、数据治理与上线评审,为监管与客户提供可衡量的安全基准。