多模态推理 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 多模态推理

时间 详情
2025-12-02
22:31
谷歌发布Gemini 3 Pro与Nano Banana Pro:多模态推理与高级图像生成AI模型引领行业新趋势

据DeepLearning.AI报道,谷歌正式推出两款旗舰AI模型Gemini 3 Pro与Nano Banana Pro,在多模态推理与图像生成领域创下新纪录(来源:DeepLearning.AI,2025年12月2日)。Gemini 3 Pro采用可调节推理水平(低、中、高)替代传统的Token预算,提升了AI模型在复杂决策与多模态任务中的灵活性和性能,并在多项AI榜单上取得突破性成绩。Nano Banana Pro则是一款利用推理能力迭代优化的高级图像生成模型,尤其擅长生成包含文本的高质量图像,目前在文本生成图像领域位居榜首。这两款模型为企业带来内容创作、流程自动化和视觉数据处理等实用AI应用,展现出广阔的商业落地和创新机会(来源:DeepLearning.AI,2025年12月2日)。

2025-11-18
22:50
Gemini 3推出百万上下文窗口与多模态推理,助力专业用户实现AI深度分析

根据@GeminiApp消息,Gemini 3为Pro和Ultra用户带来高达100万token的上下文窗口,并实现文本、图片、音频和视频的多模态推理能力。这一升级使企业用户能够深入分析体育赛事表现或通过视频音频优化运动技巧。Gemini 3的新特性为体育数据分析、媒体内容解读及个性化教练等AI应用场景带来全新商业机会(来源:@GeminiApp,2025年11月18日)。

2025-06-10
20:08
OpenAI o3-pro为ChatGPT带来网页搜索、文件分析和多模态推理等强大工具

根据OpenAI官方推特(@OpenAI,2025年6月10日),o3-pro模型为ChatGPT带来了网页搜索、文件分析、多模态视觉推理、Python代码执行和个性化记忆等高级功能。这一升级极大增强了ChatGPT在实际业务场景中的应用能力,支持企业实现自动化数据分析、研究和个性化客户服务。多模态推理与文件处理能力将o3-pro定位为企业AI解决方案,助力文档自动化、网络情报收集和定制化服务等业务机会。

2025-06-09
11:10
英国政府利用Gemini AI加速规划决策,Extract系统实现高效数据转换

根据Google DeepMind消息,英国政府推出了基于Gemini基础模型的Extract系统,旨在帮助市政规划人员更快地做出决策。Extract通过多模态推理技术,仅需40秒即可将复杂的规划文件(包括手写笔记和模糊地图)转换为可用的数字数据(来源:@GoogleDeepMind,2025年6月9日)。这一AI实际应用展示了先进人工智能在公共部门文档处理上的高效性,为政府运营自动化和数字化转型带来了新的商业机遇。