工程效率 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 工程效率

时间 详情
2026-01-19
02:07
Claude Opus 4.5在SWE-bench真实场景AI修复Bug测试中创下80.9%新高

据Twitter用户God of Prompt报道,Claude Opus 4.5在SWE-bench verified基准测试中取得了80.9%的突破性成绩,成为首个突破80%的AI模型。SWE-bench不同于传统的算法题,而是基于真实生产环境中GitHub项目的问题,反映开发者日常面临的工作。Claude Opus 4.5能够自动修复4/5的真实软件缺陷,展现了AI在软件开发自动化和工程团队效率提升方面的巨大商业应用前景(来源:@godofprompt,2026年1月19日)。