AI 快讯列表关于 SWE基准
| 时间 | 详情 |
|---|---|
|
2026-02-02 16:46 |
Claude Sonnet 5对比Opus 4.5:最新泄露显示价格更低、速度更快与自主编码代理
据Twitter用户@godofprompt透露,Vertex AI在错误日志中泄露了Claude Sonnet 5的最新信息。该模型据称比Opus 4.5便宜50%以上,并保持100万上下文窗口,同时运行速度更快。值得关注的是,Claude Sonnet 5支持通过终端生成并行子代理,并在SWE-bench基准测试中达到80.9%。最引人注目的功能是“开发团队模式”,用户仅需简要说明,即可由代理自主构建完整功能。尽管消息尚未证实,但若属实,将重塑AI编码代理市场,为企业自动化提供全新商机。 |