LangSmith增强复杂AI代理的调试能力

realtime news   Dec 11, 2025 02:46  UTC 18:46

1 Min Read

LangSmith是大型语言模型(LLM)应用领域的重要工具,宣布推出新功能,旨在改善复杂AI代理(即深度代理)的调试过程。据LangChain博客,这些增强功能旨在解决深度代理特有的挑战,这些挑战与简单LLM应用程序有显著不同。

了解深度代理

深度代理的特点是运行时间长,通常涉及多个步骤和与用户的互动。不同于简单的LLM工作流,这些代理的运行可能持续数分钟,生成大量跟踪数据,开发者手动分析这些数据具有挑战性。这种复杂性需要高级调试工具,而LangSmith正是要提供这些工具。

增强调试的新工具

LangSmith最新的推出包括一个名为Polly的AI助手和一个名为LangSmith Fetch的命令行工具(CLI)。Polly通过分析跟踪数据并提供对提示的改进建议来辅助开发者。这个AI驱动的方法使开发者能够高效识别代理行为中的低效性或错误,尤其是在深度代理跟踪的冗长而复杂的情况下非常有用。

LangSmith Fetch这个CLI工具针对那些喜欢在集成开发环境(IDE)或编程代理(如Claude Code)中工作的开发者。它能快速访问跟踪数据,使开发者能够高效地获取、分析和处理代理执行数据。这个工具支持多种输出格式,满足不同开发者的需求,无论是用于终端检查还是将结果输入其他分析工具。

跟踪与分析

跟踪是LangSmith的核心功能,为AI代理的执行提供可见性。平台记录运行、跟踪和线程,提供代理行为的全面视图。这些数据对于调试至关重要,它帮助开发人员确认哪个过程可能导致了意外结果。

使用LangSmith,设置跟踪变得简单,使开发者能够快速将其集成到他们的工作流中。一旦设置完成,开发者可以利用AI获取对代理轨迹的洞察力,并相应地完善代理提示。

Polly:AI助手

Polly作为AI助手与LangSmith集成,以促进交互式调试。通过与Polly交互,开发者可以查询跟踪的特定方面,例如识别低效或错误。这种交互方式对于管理深度代理固有的复杂性非常有益,因为故障可能分布在多个步骤中。

此外,Polly在提示工程(Prompt Engineering)中也发挥作用,这在深度代理开发中至关重要。通过解释自然语言描述,Polly可以完善提示,以确保实现所需的代理行为,提高AI的整体效率和有效性。

结论

LangSmith的新功能在深度代理的调试方面代表了重要进步。通过提供像Polly和LangSmith Fetch这样的工具,这个平台使开发者能够更轻松和精确地应对AI代理开发的复杂性。这些创新体现了LangSmith致力于增强LLM应用功能及支持更复杂AI解决方案开发的承诺。



Read More