NVIDIA 开发基于 RAG 的 LLM 工作流以增强 AI 解决方案

NVIDIA 开发基于 RAG 的 LLM 工作流以增强 AI 解决方案 - Blockchain.News

NVIDIA 正在通过开发基于检索增强生成（RAG）的问答大型语言模型（LLMs）工作流，推动 AI 技术的进步。根据 NVIDIA 的说法，该计划旨在增强系统架构并改善系统能力与用户期望之间的对齐。

基于 RAG 的工作流革新 AI

RAG 解决方案的快速发展正在改变 AI 与用户的交互方式，尤其是在执行传统范围之外的任务，如文档翻译和代码编写。NVIDIA 的方法允许高效执行这些任务，同时最大限度地减少延迟和 token 使用。

为满足用户对网络搜索和摘要功能的需求，NVIDIA 整合了 Perplexity 的搜索 API，提高了应用程序的多功能性。公司分享了一种基本架构，用于展示可以处理各种问题的聊天应用程序。

NVIDIA 的项目使用 NIM 微服务高效部署多个模型，包括部署 llama-3.1-70b-instruct 模型。此部署由配备 A100 的 NVIDIA 节点支持，确保最小的延迟和高可用性，即使没有专门的机器学习工程师。

通过使用 NVIDIA 的 API，开发人员可以轻松将这些服务集成到自己的项目中，具体介绍可参见 NVIDIA 博客。

NVIDIA 的开发还强调使用 LlamaIndex 的 Workflow 事件，这些事件提供了一种事件驱动的、基于步骤的方法来管理应用程序的执行流程。此集成简化了扩展应用程序的过程，同时保留了向量存储和检索器等基本功能。

Chainlit 是系统的另一个重要部分，它提供了一个用户友好的界面，其中包含进度指示器和步骤摘要等功能，增强了用户体验。其对企业认证和数据管理的支持进一步巩固了其在 NVIDIA 工作流架构中的作用。

有兴趣部署类似项目的开发人员可以访问 NVIDIA 在 GitHub 上的资源，并按照详细说明设置环境和依赖项。该架构支持多模态输入和用户聊天历史，并具有进一步增强的潜力，如 RAG 重新排序和错误处理。

NVIDIA 通过 NVIDIA 和 LlamaIndex 开发者竞赛鼓励创新，邀请开发者使用这些技术创建 AI 驱动的解决方案。参赛者有机会赢取令人兴奋的奖品，包括 NVIDIA GPU 和开发积分。

对于希望深入了解这些进步的人，NVIDIA 提供了详尽的文档和示例，促进 AI 领域的创新和合作社区。

Image source: Shutterstock