AI 快讯列表关于 安全评估
| 时间 | 详情 |
|---|---|
|
2026-03-05 20:07 |
OpenAI发布链式思维可控性评估:GPT-5.4 Thinking难以隐藏推理,安全监测价值凸显
据OpenAI在Twitter发布的信息称,OpenAI推出了链式思维(CoT)可控性评估套件与研究论文,结果显示GPT-5.4 Thinking难以有效隐藏其推理过程,表明CoT监测仍是可靠的安全手段(来源:OpenAI)。据OpenAI介绍,该评估关注模型是否能刻意隐匿或操控中间推理步骤,这对安全审计与合规流程尤为关键。OpenAI表示,这一发现支撑企业部署自动化CoT日志记录、行为一致性校验与红队测试,用于识别未披露的推理路径。企业可利用该评估对模型进行基准测试、强化策略执行与链路监督,降低隐蔽提示注入与欺骗性规划在生产环境中的风险。 |
|
2025-11-19 12:17 |
Gemini 3发布:谷歌DeepMind推出最安全AI模型,强化安全评估
根据Google DeepMind官方消息,Gemini 3正式发布,被称为迄今为止谷歌最安全的AI模型(来源:Google DeepMind Twitter,2025年11月19日)。该模型经过了谷歌AI历史上最全面的安全评估,并应用前沿安全框架进行严格测试,还接受了外部行业专家的独立评估。这一举措体现了谷歌在AI企业级应用领域对安全与合规的重视,尤其适用于医疗、金融和政府等高风险行业。Gemini 3的安全优势有助于企业在AI部署过程中降低风险并满足监管要求。 |