快讯列表

关于 推理 的快讯列表

时间 详情
2026-01-26
16:31
微软MSFT Maia 200 AI加速器登陆Azure:CEO称推理每美元性能提升30%

根据@StockMKTNewz的消息,微软CEO萨提亚·纳德拉表示全新Maia 200 AI加速器已在Azure上线,主打行业领先的推理效率,相比现有系统实现每美元性能提升30%,来源为@StockMKTNewz。依据@StockMKTNewz转述纳德拉的说法,此次强调推理效率与性价比,体现了Azure在面向成本的AI基础设施上的推进。

来源
2026-01-26
16:01
Azure 上线 Maia 200 AI 加速器:性能每美元提升30%,FP4 超过10 PFLOPS,配备216GB HBM3e

根据 @satyanadella,微软 Maia 200 AI 加速器已在 Azure 上线,面向推理效率优化,并声称相较现有系统实现性能每美元提升30%,来源:@satyanadella。该加速器提供超过10 PFLOPS 的 FP4、约5 PFLOPS 的 FP8,以及配备 7 TB/s 带宽的 216GB HBM3e,可用于高吞吐量推理,来源:@satyanadella。此次发布聚焦于在 Azure AI 基础设施中实现规模化、成本效率更优的推理能力,来源:@satyanadella。

来源
2025-04-09
17:17
谷歌推出第七代TPU“铁木”,性能显著提升

根据@sundarpichai,谷歌在拉斯维加斯的#GoogleCloudNext活动上宣布了第七代TPU,名为“铁木”。 这个新TPU专为推理任务设计,性能比第一代云TPU提高了3600倍,效率提升了29倍。 预计今年晚些时候发布,这可能会影响依赖云计算效率的AI相关加密货币项目。

来源
2025-03-31
19:39
OpenAI将发布具备高级推理功能的新型开放权重语言模型

根据Sam Altman的消息,OpenAI计划在未来几个月内发布一款具备增强推理能力的新型开放权重语言模型。此举旨在与开发者合作提升其实用性,表明在AI应用创新方面的潜力,可能影响加密货币市场的交易策略和自动化分析工具。

来源
2025-03-25
17:01
Gemini 2.5 Pro Experimental:AI性能的突破

根据@sundarpichai的说法,Gemini 2.5 Pro Experimental是最新的AI模型,在推理和编码方面展示了最先进的能力,领先于各类基准。这项进展对于寻求增强算法性能和精确度的量化交易者至关重要。

来源
2025-02-25
18:02
Gemini 2.0 Flash-Lite:为开发者提供增强性能

根据@GoogleDeepMind,开发者现在可以通过谷歌AI Studio和GoogleCloud的VertexAI使用Gemini 2.0 Flash-Lite,其在推理、多模态、数学和事实性基准测试中提供了改进的性能。

来源
2025-02-18
07:04
DeepSeek 推出NSA:优化稀疏注意力以增强训练

根据DeepSeek,NSA(本地可训练稀疏注意力)机制通过动态分层稀疏策略、粗粒度令牌压缩和细粒度令牌选择来改善超快长上下文训练和推理能力,这有可能通过提高处理效率和减少计算负荷来增强交易算法。

来源
2025-01-27
00:33
Paolo Ardoino 讨论AI模型训练的未来与成本效率

根据Paolo Ardoino的说法,未来的AI模型训练将不再依赖于一百万个GPU的蛮力。相反,更好的模型开发将显著降低培训成本,并强调数据访问仍然是关键。Ardoino建议推理将转向本地或边缘计算,使当前在蛮力方法上的支出在事后看来显得低效。

来源