误拒绝率 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 误拒绝率

时间 详情
2026-01-09
21:30
Anthropic AI分类器将越狱成功率降至4.4%,但增加运营成本与误拒绝率——企业AI安全新挑战

根据Anthropic (@AnthropicAI)官方推特消息,采用新一代AI分类器后,其Claude模型的越狱成功率从86%大幅降低至4.4%。然而,这种做法带来了较高的运行成本,并使得模型更倾向于拒绝正常请求。此外,Anthropic指出系统依然易受两类攻击方式影响,显示AI安全防护仍有待加强。这一结果凸显了在企业AI安全部署中,如何平衡高效防护、运营成本与用户体验的挑战与市场机会。(来源:AnthropicAI推特,2026年1月9日)