TensorRT AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 TensorRT

时间 详情
2026-03-18
17:45
回顾NVIDIA GTC 2015:Karpathy称黄仁勋早押注深度学习的前瞻性—2026深度解读

据Andrej Karpathy在X表示,黄仁勋在GTC 2015上预言深度学习将成为“下一个大事件”,并以其博士论文为例:将图像识别的ConvNet与自回归RNN语言模型端到端耦合实现图像字幕生成。Karpathy称,当时听众多为玩家与高性能计算从业者,但这一判断极具前瞻性。依据Karpathy的回顾与公开GTC资料,这一战略押注促成NVIDIA在GPU加速深度学习生态(CUDA、cuDNN、TensorRT)上的先发优势,进而奠定当今基础模型与多模态应用的算力底座,带来企业级部署、推理优化与垂直行业解决方案的商业机会。

2026-02-25
17:04
Meta开放Llama 3.3:模型开放获取与许可的重磅变化与2026产业影响分析

据@soumithchintala称,这一消息“堪比OpenAI不再开放,甚至更猛”,显示AI模型开放与治理正在发生重大转向。根据Meta AI模型发布与许可证说明,Meta持续以宽松许可开放Llama权重,允许商用,与OpenAI的闭源分发形成对比,将加速开发者、推理平台与边缘生态的竞争。依据Meta的许可与发布说明,开放权重可通过自建或VPC推理降低总体成本,放大微调自主权,推动客服、编程助手、多语RAG与端侧AI等场景落地。行业分析与云端基准测试显示,这将压缩云端毛利,推动AWQ、vLLM、TensorRT‑LLM等高效推理优化,并为模型托管、评测与企业安全护栏厂商带来新机遇。根据模型社区与MLOps平台的生态数据,中小企业可缩短上市周期,受监管地区可实现数据主权合规,托管、安全与检索编排将成为主要变现方向。