AI 快讯列表关于 OpenAI幻觉率
| 时间 | 详情 |
|---|---|
|
2026-01-08 11:23 |
PersonQA基准测试揭示OpenAI模型幻觉率飙升:o1、o3与o4-mini对比分析
据God of Prompt (@godofprompt)报道,PersonQA基准测试显示OpenAI最新大模型在幻觉率方面表现恶化。数据显示,OpenAI o1的幻觉率为16%,o3升至33%,o4-mini更高达48%。每一次模型升级都未能解决,反而加剧了事实错误问题。这一趋势对AI行业尤其是企业级应用构成挑战,可能影响敏感领域的信任度及合规性。企业在部署OpenAI模型时,需关注模型在特定领域基准测试中的表现,并要求厂商提高模型透明度以降低风险。(来源:God of Prompt @godofprompt,2026年1月8日) |