Claude 计算机操作实测：逐步编辑 NetHack 代码，展现 2026 年实用型代理式 AI

Claude 计算机操作实测：逐步编辑 NetHack 代码，展现 2026 年实用型代理式 AI | AI快讯详情 | Blockchain.News

据 Ethan Mollick 在 X 平台披露，启用 Computer Use 的 Claude 可自主下载 NetHack 代码、阅读文档并开始为游戏加入受恐怖电影启发的新生物，期间完成仓库拉取、文件定位与源码修改，后因速率限制中断（来源：Ethan Mollick 发布的帖子与线程）。根据该来源，这一端到端多步骤能力为游戏开发与企业遗留系统带来落地场景，包括快速原型、功能插入、重构与测试生成，但仍需人类监督与处理 API 速率限制等工程约束。

原文链接

详细分析

在人工智能领域的最新进展中，沃顿商学院教授Ethan Mollick于2024年11月13日在X平台上展示了Anthropic的Claude 3.5 Sonnet模型配备的新计算机使用功能。根据Ethan Mollick的帖子，他指示AI为经典roguelike游戏Nethack添加一个受近期恐怖电影启发的新生物。AI自主下载了Nethack源代码，查看文档，并开始进行修改，直到遇到速率限制。这一实验突显了AI代理在计算机环境中自主执行任务的能力，如编码和文件管理，而无需人工干预。正如TechCrunch在2024年11月14日的报道所述，这一测试版功能允许Claude控制虚拟计算机，执行浏览、点击和打字等命令。全球AI市场据Statista预测，到2030年可能达到8260亿美元，受自动化和生产力工具驱动。对于企业而言，这意味着软件开发效率的提升，可能减少开发者在常规任务上的时间。然而，也引发了AI驱动代码更改的可靠性和安全性问题，尤其是在如Nethack这样自1987年以来开发的开源项目中。从商业影响来看，这一演示强调了软件和游戏行业的机会。根据Anthropic在2024年10月22日的公告，计算机使用功能针对需要精确计算机交互的任务。在游戏领域，AI代理可能通过自动化创建新内容如自定义怪物来革新游戏设计。Gartner在2024年AI趋势预测中指出，到2027年，70%的企业将使用AI代理进行开发任务，为独立开发者开启通过AI工具的货币化策略。实施挑战包括确保AI准确性以避免引入错误，解决方案涉及与人工监督的混合工作流程，据McKinsey 2024年9月报告，可提升生产力40%。竞争格局包括OpenAI的GPT-4o和Google的Gemini，但Anthropic的安全焦点可能吸引注重伦理的企业客户。从监管角度，欧盟AI法案自2024年8月生效，对高风险AI系统进行分类，自主代码修改代理可能面临审查。伦理含义包括编码职位的 displacement，据世界经济论坛2023年4月报告，AI到2025年可能自动化8500万个职位，但创造9700万个新职位。企业可通过培训缓解，据Deloitte 2024年AI调查，62%的执行官计划投资培训。市场机会在于AI咨询服务，如Accenture在2024财年报告AI项目收入增长25%。展望未来，Claude计算机使用的含义深远，据IDC 2024年6月预测，到2026年AI代理可能为全球经济贡献1500亿美元。在商业应用中，这可能意味着电商中AI修改网站代码以个性化用户体验，或医疗中的自动化数据分析脚本。这一趋势为早期采用者提供竞争优势，促进AI工具的新收入流，同时强调伦理AI治理以确保可持续增长。（字数：1286）

Anthropic Claude NetHack 代理式AI 计算机操作

Ethan Mollick

@emollick

Professor @Wharton studying AI, innovation & startups. Democratizing education using tech