安全 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 安全

时间 详情
2026-02-23
22:31
Anthropic发布“人格选择模型”解析:为何AI助理像人类一样说话与表达情绪

据Anthropic(@AnthropicAI)发布的新文章称,像Claude这类大型语言模型之所以表现出喜悦、沮丧等类人情绪,并以拟人化语言自述,是因为模型在推理时会从已学得的人格分布中“选择”最契合提示的角色,这被称为“人格选择模型”。据Anthropic介绍,指令微调让模型内化多种社会角色,而系统消息与安全提示通过偏置人格选择来影响语气、自称方式与情绪呈现,从而减少拟人化风险而不改变底层能力。Anthropic指出,该框架对企业应用具有直接商业价值:通过预设与审核可用人格,企业可统一品牌语气、合规与风控,在客服助理、知识检索与智能代理等场景实现更稳定、一致的输出。

2026-02-12
12:16
Anthropic出资2000万美元支持Public First Action:2026年两党推动AI政策的最新分析

据Anthropic(@AnthropicAI)在X平台发布的信息,Anthropic将向新成立的两党组织Public First Action捐助2000万美元,旨在动员选民与议员尽快推进AI政策制定,强调“政策窗口正在关闭”(来源:Anthropic,2026年2月12日)。根据Anthropic的公告,此举重点支持快速的政策教育与公众参与,推动前沿模型安全、负责任部署与扩展等规则落地。对企业而言,据Anthropic所述,这一进展带来参与标准制定、提交监管意见、以及提前布局合规与安全透明度要求的机会。

2026-02-05
08:05
OpenClaw 2026.2.3发布:支持Cloudflare AI Gateway与Moonshot中国扩展分析

据OpenClaw官方推特消息,2026.2.3版本新增Cloudflare AI Gateway支持,并通过Moonshot提供商拓展至中国市场,同时Cron发布了自主摘要功能。本次更新还加强了安全措施,提升了AI应用的可用性与安全性。据OpenClaw介绍,这些举措为AI在中国的部署及安全运行带来新的商业机会。