AI 快讯列表关于 人格模型
| 时间 | 详情 |
|---|---|
|
2026-02-23 22:43 |
Anthropic 人格选择模型解析:为何 Claude 像人类—5大洞见与商业影响
据 Chris Olah 在 X 上转引并评论,Anthropic 的新研究文章提出“人格选择模型”,解释为何 Claude 等助手呈现出人类化表达,源于在推理时选择稳定的人格模式,而非具备主观体验。根据 Anthropic,该模型认为大语言模型从训练数据中学习到一组连贯的社会“人格”分布,并在系统提示与上下文约束下收敛到某一人格,从而产生类人情感与自述但不等同于有感知。Anthropic 指出,这为安全与产品设计提供操作路径:通过系统提示、提示工程与微调可塑造谨慎、创造等风格,实现可控性与品牌一致性。根据 Anthropic,可检验预期包括在强系统提示下更少人格漂移,以及透明一致的人格可提升企业用户信任与满意度,适用于受监管行业的部署规范。Anthropic 还报告,团队可用定向提示审计不期望人格,并辅以强化或“宪法式”方法进行约束,以提升可靠性、降低风险并支持客服、合规与内容生成等场景。 |