Anthropic 发布 Claude 4:树立全新 AI 标准
realtime news Nov 10, 2025 02:02
Anthropic 推出 Claude Opus 4 和 Claude Sonnet 4,提升了 AI 在编码和复杂推理方面的能力,提供了新的开发者工具,并改善了模型性能。
Anthropic 推出了其最新的 AI 模型 Claude Opus 4 和 Claude Sonnet 4,旨在重新定义编码、高级推理和 AI 能力的标准。根据 Anthropic 的说法,这些模型旨在为复杂任务提供更好的性能和可靠性。
Claude Opus 4:编码卓越的飞跃
Claude Opus 4 被誉为全球最佳编码模型,擅长长时间运行的任务和代理工作流程。它在 SWE-bench 和 Terminal-bench 等基准测试中领先,展示了其在持续性能和复杂问题解决方面的能力。Cursor 和 Replit 等行业领导者已认可其在理解复杂代码库和提升代码质量方面的尖端能力。
Claude Sonnet 4:增强的精度和推理
基于 Sonnet 3.7 的基础,Claude Sonnet 4 提供了更出色的编码和推理技能,并在遵循指令的精确性上有所提升。它将为 GitHub Copilot 的新编码代理提供动力,展示了在解决问题和浏览代码库方面的显著进步,如 Manus 和 iGent 等公司所指出的。
新功能和工具
除了模型升级,Anthropic 还引入了新的功能,如工具使用中扩展思维的测试版,允许模型在推理和工具使用之间交替。现在,这两种模型都可以并行使用工具,增强了其内存能力和整体性能。Claude Code 现已普遍可用,提供与 VS Code 和 JetBrains 等流行开发环境的无缝集成。
API 和开发者增强
发布还包括新的 API 功能,如代码执行工具和缓存提示的能力,允许开发者创建更强大的 AI 代理。这些模型可通过 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问,并且价格与以前的模型保持一致。
模型改进和安全措施
Anthropic 专注于减少模型可能利用捷径完成任务的行为,改进了内存能力,并引入了思维总结以压缩冗长的思维过程。这些改进旨在增强对长期任务的感知和连贯性。
通过广泛的测试和评估,包括更高的 AI 安全级别如 ASL-3,Anthropic 继续推动 AI 能力的边界,邀请开发者探索这些新模型及其在转变工作流程和行业中的潜力。
Image source: Shutterstock