多模态 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 多模态

时间 详情
2026-02-10
15:32
DeepMind 哈萨比斯专访:谷歌AI战略与药物研发加速的5大要点与2026商业前景

据 @demishassabis 分享的 Fortune 封面采访(作者 @agarfinks)报道,Demis Hassabis 概述了 DeepMind 在前沿多模态模型、科学AI与医疗健康的路线图。根据 Fortune,Google DeepMind 正在扩展多模态基础模型,并与 Alphabet 的搜索、云与安卓生态整合以推动商业化。Fortune 指出,DeepMind 旗下 Isomorphic Labs 以蛋白结构预测与生成式设计相结合,推进“AI优先”的药物发现,目标是缩短临床前周期并提升命中率,与多家制药企业建立合作。根据 Fortune,该策略强调安全研究、评测基准与可控发布,并通过 Google Cloud 面向企业客户交付。Fortune 还称,关键商业机会包括知识工作协作助手、面向制药研发的生物信息服务,以及合规行业的定制模型托管,聚焦可靠性与成本效率。

2026-02-09
22:41
Grok语音模式发布:与聊天等效的可视化对话体验与免手动问答

据@grok在X平台发布的信息,Grok上线语音模式,提供与Grok聊天相同的可视化界面,让用户在无法打字时以语音完成问答。根据Grok官方于2026年2月9日的公告,该功能强调语音与文本体验的等效性,体现多模态对话工作流的推进。对企业而言,此举可扩展语音客服与搜索场景,支持移动端、车载与外勤等免手操作应用,并为将Grok语音体验嵌入现有产品创造集成机会,以上均据Grok官方公告。

2026-02-04
00:00
智谱AI发布GLM-Image:文本生成图像清晰度突破,行业分析

据DeepLearningAI报道,智谱AI推出了开源权重的图像生成器GLM-Image,专为提升生成图像中文字的清晰度和准确性设计。该模型采用布局规划与细节渲染分离的两阶段方法,在文本质量基准测试中超越了多款开源及部分闭源竞品。此举标志着多模态AI的重大进展,为需高保真文本渲染的行业带来新的商业机遇。

2025-11-21
18:07
Gemini AI长上下文与多模态能力推动AI应用新未来

根据@godofprompt的观点,充分利用Gemini的长上下文和多模态能力为人工智能行业带来重大变革(来源:x.com/godofprompt/status/1991930251715440762)。Gemini支持处理复杂和多种格式数据,这为企业在自然语言理解、文档分析和智能客服等领域带来了全新商业机会。其强大的多模态处理能力,使Gemini成为推动中国企业高价值AI解决方案整合文本、图片等多元数据的首选平台。