AI 快讯列表关于 AI分类器成本
| 时间 | 详情 |
|---|---|
|
2026-01-09 21:30 |
Anthropic AI分类器将越狱成功率降至4.4%,但增加运营成本与误拒绝率——企业AI安全新挑战
根据Anthropic (@AnthropicAI)官方推特消息,采用新一代AI分类器后,其Claude模型的越狱成功率从86%大幅降低至4.4%。然而,这种做法带来了较高的运行成本,并使得模型更倾向于拒绝正常请求。此外,Anthropic指出系统依然易受两类攻击方式影响,显示AI安全防护仍有待加强。这一结果凸显了在企业AI安全部署中,如何平衡高效防护、运营成本与用户体验的挑战与市场机会。(来源:AnthropicAI推特,2026年1月9日) |