AI安全标准 AI快讯列表

AI安全标准 AI快讯列表 | Blockchain.News

AI 快讯列表

AI 快讯列表关于 AI安全标准

时间	详情
2026-01-21 16:02	Anthropic发布完整AI宪章，采用CC0 1.0许可推动人工智能开放创新据Anthropic (@AnthropicAI) 官方消息，其所有主流AI模型适用的完整宪章已以Creative Commons CC0 1.0许可方式发布，允许开发者和企业自由构建和改编该框架（来源：https://twitter.com/AnthropicAI/status/2014005815376568780）。此举促进了AI安全、伦理和合规的透明标准，为企业、初创公司及研究机构提供了低门槛的治理方案，有助于推动行业协作，加速可信AI系统的开发（来源：https://www.anthropic.com/constitution）。原文链接
2025-11-17 20:20	AI伦理辩论升级：有效利他主义与AI社区讨论中的人身攻击争议根据@timnitGebru的推文，AI伦理社区关于有效利他主义的讨论日益激烈，评论区频繁出现“人身攻击”等词语（来源：@timnitGebru，2025-11-17）。这种争论反映出有效利他主义在AI研究优先级和安全标准制定中的影响力不断增强。对于AI企业而言，这一趋势强调了在道德问题上保持透明和积极沟通的重要性，有助于提升企业信誉和获得利益相关者的信任。有效利他主义在AI行业的话题热度为企业顺应道德标准和市场预期带来了新的机遇与挑战。原文链接
2025-08-05 17:26	OpenAI研究：对gpt-oss-120b的对抗性微调显示开源大模型能力提升有限根据OpenAI（@OpenAI）发布的消息，通过对开源大语言模型gpt-oss-120b进行对抗性微调后，尽管采用了强健的微调方法，该模型仍未能在OpenAI的Preparedness Framework下达到高能力水平。该研究方法已由外部专家审核，提高了结果的权威性。这一成果推动了开源权重AI模型在安全标准和评估体系上的进步，对于希望应用开源AI系统的企业和开发者来说，具有重要的风险评估和合规意义。研究凸显了开源大模型在实际部署中的机遇与局限性。（来源：openai.com/index/estimating-...）原文链接