HLE AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 HLE

时间 详情
2026-02-12
21:01
Gemini 3 Deep Think 创下新基准纪录:ARC‑AGI‑2 84.6%、HLE 48.4%、Codeforces 3455 Elo 权威解析

据 Demis Hassabis 在 X(推特)发布的信息,Google DeepMind 的 Gemini 3 Deep Think 在 ARC‑AGI‑2 上取得 84.6%,在 Humanity’s Last Exam 无工具条件下达到 48.4%,并在 Codeforces 获得 3455 Elo,均为最新纪录。根据该公告,这些成绩表明其泛化与程序竞赛能力显著提升,可在企业场景中用于更可靠的科学分析、代码生成与自动化测试。依照该来源,ARC‑AGI‑2 领先与高 Elo 水平意味着更强的多步推理与错误恢复能力,为研发提效、软件交付加速与生产推理重试率降低带来可量化机会。