关于 混合专家模型 的快讯列表
| 时间 | 详情 |
|---|---|
|
2025-11-22 02:00 |
Moonshot AI 发布 Kimi K2 Thinking:万亿参数MoE、INT4高效推理与多次工具调用,交易者关注AI基础设施成本拐点
根据 @DeepLearningAI,Moonshot AI 推出 Kimi K2 Thinking 与 Kimi K2 Thinking Turbo,这两款模型在推理与工具调用之间循环,常发起数百次调用,并在复杂多步任务上优于其他开源可权重模型。来源:DeepLearning.AI(2025年11月22日)。 根据 @DeepLearningAI,这些模型采用万亿参数的混合专家架构,并以 INT4 精度微调,在更低成本硬件上实现强代理型性能。来源:DeepLearning.AI(2025年11月22日)。 根据 @DeepLearningAI,对于交易者而言,关键数据点是多次调用的代理工作流与在廉价硬件上的 INT4 效率,这些要素直接影响评估AI基础设施相关标的的成本与吞吐假设,包括传统与加密市场的AI赛道。来源:DeepLearning.AI(2025年11月22日)。 |
|
2025-06-05 00:00 |
DeepSeek利用Nvidia H800 GPU高效训练AI模型,推动加密市场AI应用变革
据@DeepSeek_AI透露,DeepSeek团队公布了其前沿混合专家模型DeepSeek-R1和DeepSeek-V3的高效训练方法,通过2,048块Nvidia H800 GPU和FP8等内存优化技术,大幅降低了AI训练成本(来源:DeepSeek_AI Twitter,2024年6月)。这一AI训练效率的提升,将为区块链AI项目降低开发门槛,有望推动去中心化AI协议和AI加密代币的创新,利好相关加密基础设施和公链生态发展。 |