AI 快讯列表关于 AI安全标准
| 时间 | 详情 |
|---|---|
|
2025-11-17 20:20 |
AI伦理辩论升级:有效利他主义与AI社区讨论中的人身攻击争议
根据@timnitGebru的推文,AI伦理社区关于有效利他主义的讨论日益激烈,评论区频繁出现“人身攻击”等词语(来源:@timnitGebru,2025-11-17)。这种争论反映出有效利他主义在AI研究优先级和安全标准制定中的影响力不断增强。对于AI企业而言,这一趋势强调了在道德问题上保持透明和积极沟通的重要性,有助于提升企业信誉和获得利益相关者的信任。有效利他主义在AI行业的话题热度为企业顺应道德标准和市场预期带来了新的机遇与挑战。 |
|
2025-08-05 17:26 |
OpenAI研究:对gpt-oss-120b的对抗性微调显示开源大模型能力提升有限
根据OpenAI(@OpenAI)发布的消息,通过对开源大语言模型gpt-oss-120b进行对抗性微调后,尽管采用了强健的微调方法,该模型仍未能在OpenAI的Preparedness Framework下达到高能力水平。该研究方法已由外部专家审核,提高了结果的权威性。这一成果推动了开源权重AI模型在安全标准和评估体系上的进步,对于希望应用开源AI系统的企业和开发者来说,具有重要的风险评估和合规意义。研究凸显了开源大模型在实际部署中的机遇与局限性。(来源:openai.com/index/estimating-...) |