音频理解 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 音频理解

时间 详情
2026-03-26
16:09
Gemini 3.1 Flash Live重磅发布:实时音频理解与长程推理,驱动Gemini Live与Search Live

据JeffDean在X平台称,谷歌发布Gemini 3.1 Flash Live,原生支持音频理解,在真实世界有中断的场景中提升复杂指令跟随与长程推理能力(来源:Jeff Dean on X)。据Google Blog报道,该模型已在全球范围内为Gemini Live与Search Live提供支持,能够捕捉音高与语速等细节,实现更自然、高保真语音交互(来源:Google Blog)。据JeffDean表示,模型在ComplexFuncBench与Scale AI的AudioMultiChallenge上表现领先,体现其在复杂函数执行与多轮音频任务上的先进性(来源:Jeff Dean on X)。对企业而言,这为实时语音座席、客服协作助手及多模态分析等低时延、可被打断的语音工作流带来落地机会(来源:Google Blog)。