AI 快讯列表关于 AI修复Bug
| 时间 | 详情 |
|---|---|
|
2026-01-19 02:07 |
Claude Opus 4.5在SWE-bench真实场景AI修复Bug测试中创下80.9%新高
据Twitter用户God of Prompt报道,Claude Opus 4.5在SWE-bench verified基准测试中取得了80.9%的突破性成绩,成为首个突破80%的AI模型。SWE-bench不同于传统的算法题,而是基于真实生产环境中GitHub项目的问题,反映开发者日常面临的工作。Claude Opus 4.5能够自动修复4/5的真实软件缺陷,展现了AI在软件开发自动化和工程团队效率提升方面的巨大商业应用前景(来源:@godofprompt,2026年1月19日)。 |