OpenAI幻觉率 AI快讯列表

OpenAI幻觉率 AI快讯列表 | Blockchain.News

AI 快讯列表

AI 快讯列表关于 OpenAI幻觉率

时间	详情
2026-01-08 11:23	PersonQA基准测试揭示OpenAI模型幻觉率飙升：o1、o3与o4-mini对比分析据God of Prompt (@godofprompt)报道，PersonQA基准测试显示OpenAI最新大模型在幻觉率方面表现恶化。数据显示，OpenAI o1的幻觉率为16%，o3升至33%，o4-mini更高达48%。每一次模型升级都未能解决，反而加剧了事实错误问题。这一趋势对AI行业尤其是企业级应用构成挑战，可能影响敏感领域的信任度及合规性。企业在部署OpenAI模型时，需关注模型在特定领域基准测试中的表现，并要求厂商提高模型透明度以降低风险。（来源：God of Prompt @godofprompt，2026年1月8日）原文链接

时间

详情

2026-01-08
11:23

PersonQA基准测试揭示OpenAI模型幻觉率飙升：o1、o3与o4-mini对比分析

据God of Prompt (@godofprompt)报道，PersonQA基准测试显示OpenAI最新大模型在幻觉率方面表现恶化。数据显示，OpenAI o1的幻觉率为16%，o3升至33%，o4-mini更高达48%。每一次模型升级都未能解决，反而加剧了事实错误问题。这一趋势对AI行业尤其是企业级应用构成挑战，可能影响敏感领域的信任度及合规性。企业在部署OpenAI模型时，需关注模型在特定领域基准测试中的表现，并要求厂商提高模型透明度以降低风险。（来源：God of Prompt @godofprompt，2026年1月8日）

原文链接