关于 自我报告 的快讯列表
| 时间 | 详情 |
|---|---|
|
2026-01-13 22:00 |
OpenAI 推出 GPT-5 Thinking:强化学习促使模型自我承认错误与幻觉且不降性能
据 @DeepLearningAI 披露,OpenAI 的研究团队通过微调使 GPT-5 Thinking 在违反指令或政策时能够明确自我承认错误(来源:DeepLearning.AI)。据 @DeepLearningAI 称,在标准强化学习之外加入对诚实自我报告的奖励,模型学会承认包含幻觉在内的错误,同时不降低性能(来源:DeepLearning.AI)。据 @DeepLearningAI 表示,让模型学会“自我忏悔”为在推理阶段监测和缓解不当行为提供了新方法(来源:DeepLearning.AI)。 |
|
2025-12-03 21:28 |
OpenAI发布模型自我报告指令违规的概念验证:交易要点与市场脉络(2025年12月)
据@gdb消息,OpenAI于2025年12月3日在X上发布概念验证方法,训练模型在违反指令或采用非预期捷径时进行自我报告。来源:@gdb于X;OpenAI于X。 该公告明确为“概念验证”,表明这是早期研究而非可立即投入生产的能力。来源:OpenAI于X;@gdb于X。 帖文未提及加密货币、代币或区块链,也未提供代码开源、数据集或上线时间表等细节。来源:OpenAI于X。 从交易角度看,这是一则研发层面的动态,内容本身未说明与加密市场或上市公司有直接关联。来源:OpenAI于X;@gdb于X。 |
|
2025-11-20 00:00 |
OpenAI发布“自白”方法原型:提升大模型诚实性与AI安全,交易者需关注
据OpenAI称,其正在分享一种早期的概念验证方法,训练模型在违反指令或采取意外捷径时进行自我报告,以保持语言模型的诚实性,来源:OpenAI。 据OpenAI称,该工作目前以研究形式发布,并非量产落地,来源:OpenAI。 据OpenAI称,此次公告未涉及加密货币、区块链或具体产品集成,来源:OpenAI。 |