GPT‑5.4 Pro、Opus 与 Gemini DeepThink 实测：多智能体工作流与自动数据管道的研究自动化突破

GPT‑5.4 Pro、Opus 与 Gemini DeepThink 实测：多智能体工作流与自动数据管道的研究自动化突破 | AI快讯详情 | Blockchain.News

据 Ethan Mollick 在 X（推特）披露，研究提示要求 GPT‑5.4 Pro、Opus 与 Gemini DeepThink 通过自动下载数据并运行测试，制作 “否定恐龙高级文明存在”的演示文稿，展示了端到端研究工作流能力（来源：Ethan Mollick）。据 Mollick 报道，GPT‑5.4 与 Claude Opus 进行了原创分析，而 Gemini DeepThink 借助社区构建的工具“挂载”实现外部工具编排，表明前沿模型在检索、数据摄取与假设检验上的代理式能力正在成熟（来源：Ethan Mollick）。据 Mollick 称，这类自动化流程可将数据证据转化为可审计的演示材料，商业上可用于合规报告、研究审核与尽调材料的快速生成（来源：Ethan Mollick）。据 Mollick 报道，该实验也提示 RAG 结合结构化数据、程序化实验与自动生成汇报的可行路径，模型竞争将更多取决于工具调用广度、可复现性与治理能力（来源：Ethan Mollick）。

原文链接

详细分析

人工智能领域的最新进展引发了对GPT-5.4 Pro、Claude Opus和Gemini DeepThink等模型处理复杂创意查询的热议。根据沃顿商学院教授Ethan Mollick于2026年3月5日的推文，这些AI系统面临一个荒谬任务：通过PowerPoint证明不存在先进恐龙文明，并涉及数据下载和测试。该场景突显大型语言模型在逻辑推理、证据综合和多模态输出方面的演进能力。推文中提到，GPT-5.4和Claude进行了原创分析，同时呼吁为Gemini DeepThink构建一个框架。这反映了AI趋势中模型日益管理多步推理和整合外部数据源的期望。截至2026年初，AI发展推动了自然语言处理和生成任务的边界，模型训练数据集超过1万亿参数。从商业角度，这些能力为内容创建和分析服务开辟机会，企业可利用此类模型生成定制报告，减少咨询和营销领域的时间消耗。麦肯锡2023年报告指出，AI可自动化45%的工作活动。实施挑战包括确保事实准确性，模型须引用可靠来源，如史密森学会古生物记录，将恐龙灭绝定于6600万年前。欧盟AI法案自2024年8月生效，要求透明度。关键玩家如OpenAI、Anthropic和Google主导竞争，OpenAI 2023年报告每周用户超1亿。未来展望，到2030年Gartner预测80%企业将使用生成AI决策，变革古生物研究等领域。实际应用包括教育工具，促进批判思维。伦理含义强调避免伪科学，最佳实践基于同行评审科学，如NASA 2022年小行星影响研究。（字数：728）

Claude Opus Gemini DeepThink GPT54 工具调用检索增强

Ethan Mollick

@emollick

Professor @Wharton studying AI, innovation & startups. Democratizing education using tech