AI 快讯列表关于 开源AI模型
| 时间 | 详情 |
|---|---|
|
2025-12-02 06:09 |
DeepSeek V3.2与3.2-Speciale发布:GPT-5级开源权重、上下文管理与算力扩展推动AI代理新机遇
根据@Smol_AI报道,DeepSeek发布了V3.2与3.2-Speciale模型,具备GPT-5水平的开源权重、先进的上下文管理能力,并公布了算力扩展的透明规划(来源:news.smol.ai,2025年12月1日)。新版本包括通用代理、代码代理和搜索代理等多种AI代理管线,为企业和开发者提供了构建高效AI产品的具体路径,降低了对封闭模型的依赖。此举不仅推动了软件开发和知识管理等领域的应用创新,也为AI行业带来了更广阔的商业化机会。 |
|
2025-11-19 16:58 |
开源AI模型DeepSeek、GLM和Kimi以低成本实现接近前沿性能
根据Abacus.AI(@abacusai)发布的信息,最新的开源AI模型DeepSeek、GLM和Kimi已经实现了接近前沿的大模型性能,并将推理成本降低至原有专有模型的十分之一(来源:Abacus.AI,2025年11月19日)。这一进展让企业能够以更低的运营成本获得高性能大语言模型。同时,ChatLLM Teams等平台支持开源与闭源模型的统一集成和部署,为企业带来更高的灵活性和成本效益(来源:Abacus.AI,2025年11月19日)。 |
|
2025-11-10 18:13 |
Moonshot Kimi K2:4.6百万美元中国开源AI模型超越GPT-5,推动全球AI竞赛新格局
根据@godofprompt消息,中国AI初创公司Moonshot发布了Kimi K2模型,该模型拥有1万亿参数,训练成本仅为460万美元,远低于美国实验室在GPT-5等模型上投入的数十亿美元。Kimi K2在关键评测中超越OpenAI旗舰模型,在“人类终极考试”中取得44.9%的成绩,领先于专有模型,并在智能浏览任务中以60.2%优于GPT-5的54.9%。该模型可自动执行200-300次工具调用,展示了推理和自动化能力的突破。Kimi K2采用开源方式(MIT协议修改版),支持32B活跃参数/每token、原生int4量化提升2倍速度、256k上下文窗口,使其在普通硬件上也可商用落地。此次发布标志着AI竞赛格局转变,显示快速迭代、开放共享策略可与高投入专有模式媲美甚至超越,为AI应用和服务提供新的商业机会(来源:@godofprompt,2025年11月10日)。 |
|
2025-11-09 21:05 |
中国初创企业DeepSeek以98%更低成本开源模型冲击OpenAI,重塑AI行业竞争格局
根据推特用户@godofprompt消息,中国初创公司DeepSeek仅用600万美元和受限GPU开发出性能媲美OpenAI每百万Token需花费60美元的GPT模型,而DeepSeek模型每百万Token成本仅为0.55美元,实现98%成本降低。OpenAI为类似成果投入高达60亿美元。DeepSeek采用完全开源策略,表明中美AI技术差距迅速缩小,OpenAI的技术护城河被削弱,AI领域高估值更多依赖市场营销而非技术壁垒。对于AI产业来说,DeepSeek的创新为全球AI普及、企业级应用和价格竞争带来新机遇,也对美国AI公司现有商业模式可持续性提出挑战(来源:@godofprompt,Twitter,2025年11月9日)。 |
|
2025-10-29 12:13 |
OpenAI发布GPT-OSS-Safeguard:两款开源AI安全分类模型助力企业合规
根据OpenAI官方推特(@OpenAI),OpenAI正式推出GPT-OSS-Safeguard研究预览版,包含两款专为安全分类设计的开源AI推理模型。这些模型为企业提供了可透明定制的安全层,广泛适用于自动内容审核、风险检测与合规监测等应用场景。开放权重的模式有助于开发者根据实际业务需求进行微调和集成,推动AI安全解决方案的创新和协作。此举响应了市场对可信AI系统的强烈需求,为专注AI合规与伦理的企业带来巨大的商业机会(来源:https://openai.com/index/introducing-gpt-oss-safeguard/)。 |
|
2025-10-17 12:51 |
Google DeepMind C2S-Scale 27B开源AI模型助力发现新型癌症治疗路径,推动精准医疗创新
据Google DeepMind官方消息,其基于Gemma开源模型家族开发的C2S-Scale 27B AI模型,成功识别出能够躲避免疫系统的癌细胞,并发现了新的癌症治疗潜在路径(来源:@GoogleDeepMind)。该假说已经与耶鲁大学科学家共同在实验室中得到了验证,展示了AI在加速癌症药物研发和肿瘤学研究中的实际应用价值。C2S-Scale 27B模型的应用为制药企业和生物科技公司在精准医疗和免疫治疗领域带来了全新商业机会。 |
|
2025-09-24 21:28 |
Meta FAIR发布32B参数Code World Model (CWM):推动AI代码生成与推理新突破
根据@AIatMeta消息,Meta FAIR正式发布了Code World Model(CWM),这是一款拥有320亿参数的研究型AI模型,旨在探索世界模型在代码生成和程序推理中的变革潜力(来源:ai.meta.com/research/publications/cwm)。CWM以开源权重和代码形式对研究社区开放,赋能开发者在代码分析、自动化及提升开发效率等领域进行深度创新。这一举措彰显了Meta推动AI软件开发和世界模型研究开放合作的决心(来源:huggingface.co/facebook/cwm, github.com/facebookresearch/cwm)。 |
|
2025-09-22 22:32 |
阿里巴巴发布Qwen3-Next-80B-A3B:支持超长上下文推理的80B参数AI模型
据DeepLearning.AI报道,阿里巴巴推出Qwen3-Next-80B-A3B大模型,具备80亿参数,分为Base、Instruct和Thinking三种变体,并以Apache 2.0开源协议发布。该模型采用混合专家(mixture-of-experts)结构,用门控DeltaNet和门控注意力机制取代传统注意力层,大幅提升长上下文推理速度。模型基于Qwen3数据集的15万亿标记子集训练,并通过GSPO微调,支持多标记预测和最长262,144个token输入,极大增强了企业级生成式AI、文档分析与大规模对话应用的实用性。(来源:DeepLearning.AI Twitter,2025-09-22) |
|
2025-08-21 06:33 |
DeepSeek AI发布V3.1大模型:8400亿Token预训练,长文本处理能力大幅提升
据DeepSeek官方推特(@deepseek_ai)消息,DeepSeek AI正式发布V3.1 Base大模型,继续在8400亿token基础上进行预训练,显著增强了长文本上下文处理能力。本次升级还包括全新分词器和聊天模板的优化,全面提升了对话模型的实际应用表现。V3.1 Base与完整版模型权重已全面开源,为开发者和企业带来更高效的大语言模型部署选择,推动中文AI对话系统和自然语言处理行业的发展(来源:DeepSeek推特,2025年8月21日)。 |
|
2025-08-15 16:32 |
Google DeepMind发布Gemma 3 270M:适用于任务定制微调的小型开放AI模型
根据Google DeepMind官方消息,Gemma开源模型系列迎来新成员Gemma 3 270M(来源:Google DeepMind Twitter,2025年8月15日)。该模型体积小巧,专为任务定制微调设计,并具备强大的指令跟随能力。Gemma 3 270M非常适合企业和开发者在边缘设备及定制工作流中高效部署AI方案,满足对低延迟、可定制AI模型的市场需求,为行业用户加速AI产品开发带来重要机遇。 |
|
2025-08-11 19:45 |
GPT-OSS下载量激增:开源AI模型2025年迎来爆发式增长
根据Greg Brockman (@gdb)在推特上的消息,开源AI语言模型GPT-OSS的初始下载量表现强劲,显示出开发者和企业对开放源码大型语言模型的浓厚兴趣(来源:Greg Brockman,Twitter,2025年8月11日)。这一趋势表明,开源AI解决方案正在快速发展,有望推动技术创新并降低企业应用自然语言处理能力的门槛,为中国本地AI企业提供新的商业机会。 |
|
2025-08-05 17:26 |
GPT-OSS模型免费上线Hugging Face,原生MXFP4量化助力高效AI部署
据OpenAI官方消息,gpt-oss模型现已可在Hugging Face平台免费下载,并内置原生MXFP4量化技术,大幅提升AI部署效率。该技术显著降低了内存和计算资源需求,便于企业和研究机构将大语言模型应用于实际生产和服务场景。OpenAI在其官方博客详细列出首日支持的全部平台和部署方式,为中国本地企业利用最新生成式AI模型带来实际商机(来源:OpenAI,Twitter)。 |
|
2025-08-05 17:26 |
OpenAI研究:对gpt-oss-120b的对抗性微调显示开源大模型能力提升有限
根据OpenAI(@OpenAI)发布的消息,通过对开源大语言模型gpt-oss-120b进行对抗性微调后,尽管采用了强健的微调方法,该模型仍未能在OpenAI的Preparedness Framework下达到高能力水平。该研究方法已由外部专家审核,提高了结果的权威性。这一成果推动了开源权重AI模型在安全标准和评估体系上的进步,对于希望应用开源AI系统的企业和开发者来说,具有重要的风险评估和合规意义。研究凸显了开源大模型在实际部署中的机遇与局限性。(来源:openai.com/index/estimating-...) |
|
2025-08-05 17:26 |
OpenAI发布gpt-oss-120b与gpt-oss-20b:开源推理大模型与Apache 2.0许可
根据OpenAI官方推特(@OpenAI),公司发布了两款全新开源权重推理模型——gpt-oss-120b和gpt-oss-20b,并采用Apache 2.0许可证。这两款模型结合开源社区反馈开发,在推理能力和AI安全性方面均取得了重要突破。此次发布为AI开发者和企业提供了高性能、可定制的自然语言处理和推理工具,有助于推动企业自动化、解释性AI和智能决策等领域的创新应用,为中国AI市场带来更多实际商机(来源:OpenAI,2025-08-05)。 |
|
2025-08-05 17:03 |
gpt-oss开源AI模型发布:媲美o4-mini,可在高端笔记本和手机上运行
根据Sam Altman(@sama)在推特上的消息,gpt-oss开源AI模型正式发布,该模型性能与o4-mini相当,并且能够在高端笔记本电脑上高效运行。更小型的版本还可在手机等移动设备上运行,大幅降低了高性能AI的硬件门槛。这一突破为企业和开发者提供了在本地设备部署先进AI技术的机会,推动边缘计算、隐私保护及移动端AI应用的广泛落地(来源:Sam Altman,Twitter,2025年8月5日)。 |
|
2025-07-31 14:08 |
FLUX Krea 超越以往开源模型,接近FLUX Pro质量——AI内部评测揭示新商业机遇
根据@krea_ai发布的消息,FLUX Krea在内部评测中表现优于以往的开源FLUX模型,已接近FLUX Pro的质量水平。这一进步表明开源AI模型的能力正在快速提升,为企业和开发者提供了更高质量且开放的AI解决方案。随着模型性能提升,AI行业企业可在不依赖闭源产品的前提下实现大规模部署和创新,拓展更多业务应用场景(来源:@krea_ai,2025年7月31日)。 |
|
2025-06-26 18:16 |
Gemma 3n:领先的开源AI模型,支持单GPU/TPU,适用于边缘设备
根据Demis Hassabis在推特上的消息,最新发布的开源Gemma 3n模型是目前最强大的单GPU或TPU可运行的AI模型。Gemma 3n不仅具备卓越的多模态理解能力,还能在仅2GB内存环境下高效运行,非常适合边缘计算场景。这一模型的高效能和开源特性,为物联网、智能设备和移动应用等行业的AI边缘部署带来了巨大商业机遇(来源:@demishassabis,2025年6月26日)。 |
|
2025-06-06 17:43 |
DeepSeek-R1-0528开源AI模型性能对标OpenAI和Google,推动企业级人工智能创新
根据DeepLearning.AI报道,DeepSeek发布了其旗舰开源模型DeepSeek-R1-0528的升级版本,在多个行业基准测试中,其表现已可媲美OpenAI的o3和Google的Gemini-2.5 Pro等主流闭源模型。尽管训练细节尚未公开,该模型的进步展示了开源AI模型正逐步缩小与闭源解决方案之间的性能差距。对于需要高透明度和定制化的企业和开发者,DeepSeek-R1-0528为构建高性能、低成本AI应用带来了全新商机。这一趋势标志着企业级AI市场正向开源解决方案转型(来源:DeepLearning.AI,2025年6月6日)。 |