Claude 计算机操作实测:逐步编辑 NetHack 代码,展现 2026 年实用型代理式 AI
据 Ethan Mollick 在 X 平台披露,启用 Computer Use 的 Claude 可自主下载 NetHack 代码、阅读文档并开始为游戏加入受恐怖电影启发的新生物,期间完成仓库拉取、文件定位与源码修改,后因速率限制中断(来源:Ethan Mollick 发布的帖子与线程)。根据该来源,这一端到端多步骤能力为游戏开发与企业遗留系统带来落地场景,包括快速原型、功能插入、重构与测试生成,但仍需人类监督与处理 API 速率限制等工程约束。
原文链接详细分析
在人工智能领域的最新进展中,沃顿商学院教授Ethan Mollick于2024年11月13日在X平台上展示了Anthropic的Claude 3.5 Sonnet模型配备的新计算机使用功能。根据Ethan Mollick的帖子,他指示AI为经典roguelike游戏Nethack添加一个受近期恐怖电影启发的新生物。AI自主下载了Nethack源代码,查看文档,并开始进行修改,直到遇到速率限制。这一实验突显了AI代理在计算机环境中自主执行任务的能力,如编码和文件管理,而无需人工干预。正如TechCrunch在2024年11月14日的报道所述,这一测试版功能允许Claude控制虚拟计算机,执行浏览、点击和打字等命令。全球AI市场据Statista预测,到2030年可能达到8260亿美元,受自动化和生产力工具驱动。对于企业而言,这意味着软件开发效率的提升,可能减少开发者在常规任务上的时间。然而,也引发了AI驱动代码更改的可靠性和安全性问题,尤其是在如Nethack这样自1987年以来开发的开源项目中。从商业影响来看,这一演示强调了软件和游戏行业的机会。根据Anthropic在2024年10月22日的公告,计算机使用功能针对需要精确计算机交互的任务。在游戏领域,AI代理可能通过自动化创建新内容如自定义怪物来革新游戏设计。Gartner在2024年AI趋势预测中指出,到2027年,70%的企业将使用AI代理进行开发任务,为独立开发者开启通过AI工具的货币化策略。实施挑战包括确保AI准确性以避免引入错误,解决方案涉及与人工监督的混合工作流程,据McKinsey 2024年9月报告,可提升生产力40%。竞争格局包括OpenAI的GPT-4o和Google的Gemini,但Anthropic的安全焦点可能吸引注重伦理的企业客户。从监管角度,欧盟AI法案自2024年8月生效,对高风险AI系统进行分类,自主代码修改代理可能面临审查。伦理含义包括编码职位的 displacement,据世界经济论坛2023年4月报告,AI到2025年可能自动化8500万个职位,但创造9700万个新职位。企业可通过培训缓解,据Deloitte 2024年AI调查,62%的执行官计划投资培训。市场机会在于AI咨询服务,如Accenture在2024财年报告AI项目收入增长25%。展望未来,Claude计算机使用的含义深远,据IDC 2024年6月预测,到2026年AI代理可能为全球经济贡献1500亿美元。在商业应用中,这可能意味着电商中AI修改网站代码以个性化用户体验,或医疗中的自动化数据分析脚本。这一趋势为早期采用者提供竞争优势,促进AI工具的新收入流,同时强调伦理AI治理以确保可持续增长。(字数:1286)
Ethan Mollick
@emollickProfessor @Wharton studying AI, innovation & startups. Democratizing education using tech