AI越狱防护 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 AI越狱防护

时间 详情
2026-01-09
21:30
Anthropic推出新一代AI宪法分类器强化Jailbreak防护

据Anthropic (@AnthropicAI)发布,Anthropic推出了新一代宪法分类器,大幅提升了AI系统对越狱攻击(jailbreak)的防护能力。新研究结合了解释性技术的实际应用,使得防护措施更具成本效益和实用性。该创新为AI企业和开发者提供了更安全的语言模型部署方案,降低了合规和运营风险,推动了AI安全治理的行业趋势(来源:Anthropic,2026)。

2025-09-16
16:19
Meta发布LlamaFirewall:保护大模型免受越狱和目标劫持的AI安全工具包,支持7亿用户免费使用

根据DeepLearning.AI报道,Meta推出了LlamaFirewall,这是一套专为保护大语言模型(LLM)免受越狱、目标劫持及生成代码漏洞的安全工具包。该工具包现已对月活跃用户不超过7亿的项目免费开放,极大降低了企业部署AI安全防护的门槛。LlamaFirewall通过先进的检测与防御机制,有效应对LLM应用中的安全挑战,有助于提升企业级AI系统的合规性和安全性,为AI安全领域带来更多创新机会(来源:DeepLearning.AI,2025年9月16日)。