对齐研究 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 对齐研究

时间 详情
2026-03-24
17:02
OpenAI基金会最新更新:治理、资金与安全优先级深度分析

根据 Sam Altman 的说明,OpenAI 基金会在官网发布最新更新,详细阐述治理架构、资金模式与安全优先级。据 OpenAI 基金会称,更新内容包括非营利使命、董事会监督与资助机制,聚焦支持 AI 安全研究、开放科学基础设施与公共利益应用。据 OpenAI 基金会报告,基金会将推进透明研究发布、评测基准和与政策相关的科学研究,以应对先进模型的系统性风险。此外,据 OpenAI 基金会介绍,学界与民间机构可通过合作通道申请资助,面向对齐、红队评测与安全工具链的团队与初创公司,释放产业合作与合规创新机会。

2026-02-28
19:33
Anthropic安全叙事引争议:2026最新分析与商业影响

据@timnitGebru称,Anthropic被指夸大模型能力、渲染“AI末日”叙事,并宣扬其被批评为“反人本”的创始哲学,此观点源自Spiked于2026年2月22日的报道。根据Spiked的分析,争议集中在对齐研究与长期主义伦理的公共叙事,可能影响风险感知与政策议程。对企业方而言,Spiked指出该讨论或将带来监管方向的变化,包括能力宣传合规、模型风险披露与安全评测透明度等要求上升。依照Spiked的报道,这或促使模型供应商加强第三方评测、以标准化指标校准能力声明,并在安全研究与政策倡议之间保持边界,从而影响上市节奏、合规成本与企业采购门槛。

2026-02-23
18:15
Anthropic发布紧急分析:AI模型攻击升级,2026年五大防御行动指南

据AnthropicAI在Twitter表示,针对AI系统的攻击正在加剧且更为复杂,需产业、政策制定者与更广泛AI社区快速协同应对(来源:Anthropic Twitter)。据Anthropic通过该帖文指出,模型利用与提示注入等攻击威胁已影响大规模LLM在生产环境的安全性、可靠性与合规信任(来源:Anthropic Twitter)。据Anthropic称,企业应优先推进标准化、联合红队、事件共享与对齐研究等协作机制,以防范生成式AI在关键行业与受监管场景中的系统性风险(来源:Anthropic Twitter)。