GPT‑5.4 Pro、Opus 与 Gemini DeepThink 实测:多智能体工作流与自动数据管道的研究自动化突破 | AI快讯详情 | Blockchain.News
最新更新
3/5/2026 10:44:00 PM

GPT‑5.4 Pro、Opus 与 Gemini DeepThink 实测:多智能体工作流与自动数据管道的研究自动化突破

GPT‑5.4 Pro、Opus 与 Gemini DeepThink 实测:多智能体工作流与自动数据管道的研究自动化突破

据 Ethan Mollick 在 X(推特)披露,研究提示要求 GPT‑5.4 Pro、Opus 与 Gemini DeepThink 通过自动下载数据并运行测试,制作 “否定恐龙高级文明存在”的演示文稿,展示了端到端研究工作流能力(来源:Ethan Mollick)。据 Mollick 报道,GPT‑5.4 与 Claude Opus 进行了原创分析,而 Gemini DeepThink 借助社区构建的工具“挂载”实现外部工具编排,表明前沿模型在检索、数据摄取与假设检验上的代理式能力正在成熟(来源:Ethan Mollick)。据 Mollick 称,这类自动化流程可将数据证据转化为可审计的演示材料,商业上可用于合规报告、研究审核与尽调材料的快速生成(来源:Ethan Mollick)。据 Mollick 报道,该实验也提示 RAG 结合结构化数据、程序化实验与自动生成汇报的可行路径,模型竞争将更多取决于工具调用广度、可复现性与治理能力(来源:Ethan Mollick)。

原文链接

详细分析

人工智能领域的最新进展引发了对GPT-5.4 Pro、Claude Opus和Gemini DeepThink等模型处理复杂创意查询的热议。根据沃顿商学院教授Ethan Mollick于2026年3月5日的推文,这些AI系统面临一个荒谬任务:通过PowerPoint证明不存在先进恐龙文明,并涉及数据下载和测试。该场景突显大型语言模型在逻辑推理、证据综合和多模态输出方面的演进能力。推文中提到,GPT-5.4和Claude进行了原创分析,同时呼吁为Gemini DeepThink构建一个框架。这反映了AI趋势中模型日益管理多步推理和整合外部数据源的期望。截至2026年初,AI发展推动了自然语言处理和生成任务的边界,模型训练数据集超过1万亿参数。从商业角度,这些能力为内容创建和分析服务开辟机会,企业可利用此类模型生成定制报告,减少咨询和营销领域的时间消耗。麦肯锡2023年报告指出,AI可自动化45%的工 作活动。实施挑战包括确保事实准确性,模型须引用可靠来源,如史密森学会古生物记录,将恐龙灭绝定于6600万年前。欧盟AI法案自2024年8月生效,要求透明度。关键玩家如OpenAI、Anthropic和Google主导竞争,OpenAI 2023年报告每周用户超1亿。未来展望,到2030年Gartner预测80%企业将使用生成AI决策,变革古生物研究等领域。实际应用包括教育工具,促进批判思维。伦理含义强调避免伪科学,最佳实践基于同行评审科学,如NASA 2022年小行星影响研究。(字数:728)

Ethan Mollick

@emollick

Professor @Wharton studying AI, innovation & startups. Democratizing education using tech