tmux AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 tmux

时间 详情
2026-02-27
23:08
Karpathy实测8代理Nanochat研究组织:Claude与Codex在实验设计上失灵——2026实战分析与机遇

据@karpathy在X发帖称,他用4个Claude与4个Codex(各配1张GPU)组建的8代理“研究组织”,在尝试移除nanochat中的logit softcap且不引入回归时未取得稳定收益;尽管测试了“8名独立研究员”和“首席科学家+8名初级研究员”等编排,代理普遍缺乏高质量假设与实验规范(无强基线、无系统消融、未控制算力与时长),但对明确任务的实现能力很强(来源:Karpathy 2026年2月27日的贴文与视频)。据@karpathy介绍,该流程以git分支管理研究项目、代理各自fork特性分支、用git worktree隔离、简单文件通信、tmux网格会话展示,且未用Docker或VM,形成轻量且可审计的自动化框架。业务启示:多代理LLM研究组织短期仍需人类PI把关假设与实验严谨性;可行机会包括基于RAG的基线执行手册、自动化消融与FLOPs控制、可复现实验清单,以及面向logit上限等训练细节的评测框架。另据@karpathy,这一思路将提示词、工具与流程视为“组织代码”,为代理编排平台、实验追踪集成与带护栏的企业级研究流水线提供供应商切入点。