快讯列表

关于 真实工作评测 的快讯列表

时间 详情
2026-01-06
16:37
吴恩达提出图灵-AGI测试:以真实工作基准衡量AGI并在2026年降低炒作风险

据吴恩达表示,他提出“图灵-AGI测试”,让计算机或熟练人类在具备互联网与常用工具的电脑上执行多日真实工作任务,若计算机表现不逊于熟练人类即视为通过,用以衡量能否胜任知识工作的人类水平能力,来源:吴恩达 X 平台 2026年1月6日;DeepLearning.AI The Batch 第334期。 据吴恩达表示,测试配置包含浏览器与Zoom,由评审自由设计未公开的训练与执行环节(例如先培训呼叫中心话务后再接线并获得反馈),以远程办公场景检验通用性并避免固定数据集的过拟合,来源:吴恩达 X 平台 2026年1月6日;DeepLearning.AI The Batch 第334期。 据吴恩达表示,该测试符合公众对AGI的理解,弥补原始图灵测试与榜单类基准的不足,更关注能创造经济价值的工作能力而非欺骗评审,来源:吴恩达 X 平台 2026年1月6日;DeepLearning.AI The Batch 第334期。 据吴恩达表示,不加约束的AGI炒作会降低宣称门槛并引发投资泡沫与兴趣崩塌,而严格测试有助于去泡沫并支撑更稳健的持续投入与真实进展,来源:吴恩达 X 平台 2026年1月6日;DeepLearning.AI The Batch 第334期。 据吴恩达表示,一旦举办图灵-AGI测试竞赛,若普遍未通过将有意去炒作,而通过则“极具价值”,这些清晰结果为AI相关市场提供可监控的事件节点与二元里程碑,供交易者关注AI概念股与AI叙事相关加密项目的事件风险,来源:吴恩达 X 平台 2026年1月6日;DeepLearning.AI The Batch 第334期。

来源