AI 快讯列表关于 多模态
| 时间 | 详情 |
|---|---|
|
2026-02-10 15:32 |
DeepMind 哈萨比斯专访:谷歌AI战略与药物研发加速的5大要点与2026商业前景
据 @demishassabis 分享的 Fortune 封面采访(作者 @agarfinks)报道,Demis Hassabis 概述了 DeepMind 在前沿多模态模型、科学AI与医疗健康的路线图。根据 Fortune,Google DeepMind 正在扩展多模态基础模型,并与 Alphabet 的搜索、云与安卓生态整合以推动商业化。Fortune 指出,DeepMind 旗下 Isomorphic Labs 以蛋白结构预测与生成式设计相结合,推进“AI优先”的药物发现,目标是缩短临床前周期并提升命中率,与多家制药企业建立合作。根据 Fortune,该策略强调安全研究、评测基准与可控发布,并通过 Google Cloud 面向企业客户交付。Fortune 还称,关键商业机会包括知识工作协作助手、面向制药研发的生物信息服务,以及合规行业的定制模型托管,聚焦可靠性与成本效率。 |
|
2026-02-09 22:41 |
Grok语音模式发布:与聊天等效的可视化对话体验与免手动问答
据@grok在X平台发布的信息,Grok上线语音模式,提供与Grok聊天相同的可视化界面,让用户在无法打字时以语音完成问答。根据Grok官方于2026年2月9日的公告,该功能强调语音与文本体验的等效性,体现多模态对话工作流的推进。对企业而言,此举可扩展语音客服与搜索场景,支持移动端、车载与外勤等免手操作应用,并为将Grok语音体验嵌入现有产品创造集成机会,以上均据Grok官方公告。 |
|
2026-02-04 00:00 |
智谱AI发布GLM-Image:文本生成图像清晰度突破,行业分析
据DeepLearningAI报道,智谱AI推出了开源权重的图像生成器GLM-Image,专为提升生成图像中文字的清晰度和准确性设计。该模型采用布局规划与细节渲染分离的两阶段方法,在文本质量基准测试中超越了多款开源及部分闭源竞品。此举标志着多模态AI的重大进展,为需高保真文本渲染的行业带来新的商业机遇。 |
|
2025-11-21 18:07 |
Gemini AI长上下文与多模态能力推动AI应用新未来
根据@godofprompt的观点,充分利用Gemini的长上下文和多模态能力为人工智能行业带来重大变革(来源:x.com/godofprompt/status/1991930251715440762)。Gemini支持处理复杂和多种格式数据,这为企业在自然语言理解、文档分析和智能客服等领域带来了全新商业机会。其强大的多模态处理能力,使Gemini成为推动中国企业高价值AI解决方案整合文本、图片等多元数据的首选平台。 |