快讯列表

关于 提示注入 的快讯列表

时间 详情
2025-12-22
19:46
OpenAI 加强 ChatGPT Atlas 安全:自动化红队与提示注入防御要点 2025

据 @gdb 表示,OpenAI 发布博文,介绍如何持续强化 ChatGPT Atlas 及其他智能体以抵御新型提示注入攻击。 来源:Greg Brockman 在 X;OpenAI 博文 Hardening Atlas Against Prompt Injection 此次更新强调对自动化红队、强化学习与快速响应循环的重投入,以保持对抗对手的领先。 来源:Greg Brockman 在 X 该公告侧重安全方法论,未在推文或链接内容摘要中披露性能指标、部署时间表或产品收入细节。 来源:Greg Brockman 在 X;OpenAI 博文 Hardening Atlas Against Prompt Injection 对交易者而言,可验证的信息是其当前安全投入与防御重点,而非新增功能、代币或变现数据。 来源:Greg Brockman 在 X;OpenAI 博文 Hardening Atlas Against Prompt Injection

来源
2025-12-18
00:00
OpenAI发布GPT-5.2 Codex安全补充说明:代理沙箱、网络访问控制与提示注入缓解

据OpenAI称,GPT-5.2 Codex系统卡补充说明记录了模型层面的缓解措施,包括针对有害任务和提示注入的专项安全训练(来源:OpenAI)。据OpenAI称,文件还明确了产品层面的缓解措施,如代理沙箱与可配置网络访问,用于约束代理的行为(来源:OpenAI)。据OpenAI称,来源仅阐述安全控制,未提供性能指标、时间线或市场指引,因此未对加密市场作出直接影响表述(来源:OpenAI)。

来源
2025-12-18
00:00
OpenAI 发布 GPT-5.2 Codex 系统卡:提示注入安全训练、代理沙盒与可配置网络访问等关键防护

据 OpenAI 表示,GPT-5.2-Codex 系统卡概述了全面安全措施,包括模型级缓解(如针对有害任务与提示注入的专业安全训练)与产品级缓解(如代理沙盒与可配置网络访问)。来源:OpenAI。针对加密交易与 DeFi 自动化的 AI 代理应用,这些已记录的控制措施明确了代理的执行与连接边界,说明代码如何在沙盒中运行以及允许的外部网络访问范围。来源:OpenAI。

来源
2025-11-12
06:00
OpenAI强调提示注入攻击:前沿AI安全挑战与防护路线图

据OpenAI称,提示注入是AI系统的前沿安全挑战,OpenAI正在阐明其攻击机制,并通过推进研究、训练模型与为用户构建防护来应对该风险(来源:OpenAI)。据OpenAI称,这些举措构成缓解路线图,重点包括研究进展、模型改进与产品级安全保护,以降低生产环境中的提示注入风险(来源:OpenAI)。

来源
2025-10-16
16:29
谷歌DeepMind播客第一部分:AI网络安全、零日漏洞、LLM漏洞与CodeMender——加密交易者应关注的要点

据@GoogleDeepMind称,其安全副总裁Four Flynn在播客中与主持人@FryRsquared讨论如何利用更先进的AI模型提升网络防御能力,第一部分现已发布(来源:Google DeepMind,X平台,2025年10月16日)。据@GoogleDeepMind称,本期涵盖多个关键环节:Project Aurora(02:00)、防守者困境(20:48)、零日漏洞(21:22)、攻击杀伤链(23:49)、LLM漏洞(25:39)、恶意软件多态与提示注入(27:00)、Big Sleep(37:00)、以及用AI修复漏洞的CodeMender(45:00)(来源:Google DeepMind,X平台,2025年10月16日)。据@GoogleDeepMind称,节目重点呈现LLM漏洞、提示注入、零日利用与AI驱动修复,这些议题直接关系到金融与加密基础设施中AI系统的安全评估(来源:Google DeepMind,X平台,2025年10月16日)。据@GoogleDeepMind称,帖文未提及具体加密资产或市场数据,但上述议题与日益采用AI工具的交易所、钱包与DeFi平台的威胁面密切相关(来源:Google DeepMind,X平台,2025年10月16日)。

来源
2025-08-26
19:00
Anthropic启动Claude浏览器安全试点以应对提示注入——AI风控交易者需关注

据@AnthropicAI称,浏览器使用带来安全挑战,尤其是提示注入攻击,该公司已启动试点以强化Claude的既有防护(来源:@AnthropicAI,2025-08-26)。据@AnthropicAI称,此次公告仅说明已具备安全措施且试点用于进一步改进,未披露时间表、指标、产品细节,亦未提及任何加密资产或市场影响(来源:@AnthropicAI,2025-08-26)。

来源
2025-04-11
18:13
使用结构化查询和偏好优化防御提示注入

根据伯克利人工智能研究中心的博客文章,他们最新的研究介绍了通过使用结构化查询(StruQ)和偏好优化(SecAlign)来防御提示注入攻击的创新技术。这些方法由陈思哲和朱利安·皮特领导,旨在通过结构化查询防止未经授权的数据操作,并通过优化偏好来符合安全协议,从而增强AI模型的安全性。

来源