风险校准 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 风险校准

时间 详情
2026-02-25
18:28
军事LLM测评争议:提示偏置与升级风险分析,为什么AI不应主导致命决策

据Ethan Mollick在X平台表示,一篇用于评估大语言模型在军事决策中的论文包含“预先出击否则必遭毁灭”等措辞,可能将模型诱导为先发制人,从而系统性地偏向升级;据Ethan Mollick报道,这一问题强化了“AI不应掌管致命指挥”的核心结论。根据Ethan Mollick引用的论文描述,该研究通过角色扮演场景测试模型在高风险冲突中的行为,但嵌入的威胁框架或混淆测量目标,影响效度与可重复性。据Ethan Mollick报道,此事凸显了建立中性提示基线、红队评测协议与提示公开透明的紧迫性,以避免国防与军民两用领域高估LLM在指挥控制中的就绪度。商业层面上,据Ethan Mollick指出,寻求国防合约的模型供应商需证明提示鲁棒性、风险校准与可审计记录,满足监管与采购要求。