混合专家模型 快讯列表

快讯列表

关于混合专家模型的快讯列表

时间	详情
2025-11-22 02:00	Moonshot AI 发布 Kimi K2 Thinking：万亿参数MoE、INT4高效推理与多次工具调用，交易者关注AI基础设施成本拐点根据 @DeepLearningAI，Moonshot AI 推出 Kimi K2 Thinking 与 Kimi K2 Thinking Turbo，这两款模型在推理与工具调用之间循环，常发起数百次调用，并在复杂多步任务上优于其他开源可权重模型。来源：DeepLearning.AI（2025年11月22日）。根据 @DeepLearningAI，这些模型采用万亿参数的混合专家架构，并以 INT4 精度微调，在更低成本硬件上实现强代理型性能。来源：DeepLearning.AI（2025年11月22日）。根据 @DeepLearningAI，对于交易者而言，关键数据点是多次调用的代理工作流与在廉价硬件上的 INT4 效率，这些要素直接影响评估AI基础设施相关标的的成本与吞吐假设，包括传统与加密市场的AI赛道。来源：DeepLearning.AI（2025年11月22日）。来源
2025-06-05 00:00	DeepSeek利用Nvidia H800 GPU高效训练AI模型，推动加密市场AI应用变革据@DeepSeek_AI透露，DeepSeek团队公布了其前沿混合专家模型DeepSeek-R1和DeepSeek-V3的高效训练方法，通过2,048块Nvidia H800 GPU和FP8等内存优化技术，大幅降低了AI训练成本（来源：DeepSeek_AI Twitter，2024年6月）。这一AI训练效率的提升，将为区块链AI项目降低开发门槛，有望推动去中心化AI协议和AI加密代币的创新，利好相关加密基础设施和公链生态发展。来源

时间

详情

2025-11-22
02:00

Moonshot AI 发布 Kimi K2 Thinking：万亿参数MoE、INT4高效推理与多次工具调用，交易者关注AI基础设施成本拐点

根据 @DeepLearningAI，Moonshot AI 推出 Kimi K2 Thinking 与 Kimi K2 Thinking Turbo，这两款模型在推理与工具调用之间循环，常发起数百次调用，并在复杂多步任务上优于其他开源可权重模型。来源：DeepLearning.AI（2025年11月22日）。根据 @DeepLearningAI，这些模型采用万亿参数的混合专家架构，并以 INT4 精度微调，在更低成本硬件上实现强代理型性能。来源：DeepLearning.AI（2025年11月22日）。根据 @DeepLearningAI，对于交易者而言，关键数据点是多次调用的代理工作流与在廉价硬件上的 INT4 效率，这些要素直接影响评估AI基础设施相关标的的成本与吞吐假设，包括传统与加密市场的AI赛道。来源：DeepLearning.AI（2025年11月22日）。

来源

2025-06-05
00:00

DeepSeek利用Nvidia H800 GPU高效训练AI模型，推动加密市场AI应用变革

据@DeepSeek_AI透露，DeepSeek团队公布了其前沿混合专家模型DeepSeek-R1和DeepSeek-V3的高效训练方法，通过2,048块Nvidia H800 GPU和FP8等内存优化技术，大幅降低了AI训练成本（来源：DeepSeek_AI Twitter，2024年6月）。这一AI训练效率的提升，将为区块链AI项目降低开发门槛，有望推动去中心化AI协议和AI加密代币的创新，利好相关加密基础设施和公链生态发展。

来源

关于 混合专家模型 的快讯列表

关于混合专家模型的快讯列表