Search Results for "评估"
LangSmith 通过 Pytest 和 Vitest 集成提升 LLM 评估
LangSmith 引入 Pytest 和 Vitest 集成,以增强 LLM 应用评估,为开发人员提供改进的测试框架。
LangSmith 通过 Insights Agent 和 多轮评估增强代理监控
LangSmith 推出 Insights Agent 和 多轮评估,以增强代理监控并改善用户交互成果,为 AI 团队提供有价值的见解。
Harvey.ai 使用 BigLaw Bench: Arena 增强 AI 评估
Harvey.ai 引入 BigLaw Bench: Arena,这是一个用于法律任务的新 AI 评估框架,通过专家对比来提供 AI 系统性能的深入见解。
六間中央银行组成工作组评估中央银行数字货币
由全球六間中央银行——包括加拿大银行、英格兰银行、日本银行、欧洲中央银行、瑞典中央银行和瑞士国家银行以及国际清算银行(BIS)将组成工作组,以交流有关中央银行数字货币(CBDC )用例的经验。
韩国中央银行启动中央银行数字货币试点计划 以备不时之需
韩国中央银行最近宣布已启动一项评估中央银行数字货币(CBDC)发行的试点计划。韩国银行表示,目前尚无启动CBDC的计划,但是,该试点计划能令央行在未来不断变化的市场条件下作好准备。