AI 快讯列表关于 高性价比AI
| 时间 | 详情 |
|---|---|
|
2025-11-12 10:30 |
xAI发布Grok-4-Fast:200万Token推理模型,速度与性价比行业领先
根据@godofprompt消息,xAI推出了Grok-4-Fast,这是一款拥有200万Token上下文窗口的AI推理模型,强调高效工程优化。该模型内置推理、函数调用和结构化输出,并提供独立的高吞吐量模式,适合不同业务场景。Grok-4-Fast的定价极具竞争力,每百万Token输入仅需$0.20,输出$0.50,比Grok-4-0709便宜6倍,同时支持缓存提示词,实现一次付费长期复用。Web搜索、X搜索、代码执行和文档搜索等工具在2025年11月21日前免费,之后每千次调用$10。这一发布推动了高端AI推理的普及,为企业用户提供了高性价比、长上下文、低延迟的AI解决方案(来源:@godofprompt Twitter)。 |
|
2025-06-17 19:10 |
谷歌发布Gemini 2.5 Pro与Flash模型,推出低延迟高性价比Flash Lite预览版
据Jeff Dean透露,谷歌的Gemini 2.5 Pro和2.5 Flash AI模型已正式上线,提供长期支持承诺,确保企业用户的模型稳定性(来源:@JeffDean, 2025年6月17日)。此外,谷歌还发布了面向低延迟和高性价比应用场景的Gemini 2.5 Flash Lite预览版,适用于高并发、实时处理等业务需求。这一举措将推动企业在实时数据处理、对话式AI及成本敏感型部署领域的创新和业务扩展(来源:@JeffDean, 2025年6月17日)。 |
|
2025-06-17 16:02 |
Google DeepMind发布2.5 Flash-Lite:最高性价比AI模型,延迟更低且多领域表现优越
据Google DeepMind官方消息,2.5 Flash-Lite是其迄今为止性价比最高的AI模型,在大多数任务中延迟低于2.0 Flash-Lite和Flash,同时在编程、数学、科学、推理及多模态基准测试中整体质量全面超越上一代。该模型有望促进生成式AI在成本敏感型企业中的普及,加速AI在企业运营、科研和产品开发中的应用(来源:Google DeepMind,Twitter,2025年6月17日)。 |