28 Aug 2025 2 min read 人工智能

AI浏览器插件安全隐忧：Anthropic插件仍存11.2%攻击率，研究者称模式“灾难性”

Anthropic近期公布了其Claude浏览器插件在安全测试中的表现。在未部署安全缓解措施时，该插件面对29种攻击场景的123个测试案例，成功率高达23.6%。一个典型案例是，恶意邮件指示Claude为“邮箱卫生”目的删除用户邮件，插件未经验证即执行了删除操作。为应对这些漏洞，Anthropic已实施多项防御措施，包括网站级别权限管理，允许用户控制Claude访问特定网站；要求Claude在执行发布、购买或共享个人数据等高风险操作前，必须获得用户确认；并默认阻止Claude访问提供金融服务、成人内容及盗版内容的网站。

这些安全措施显著降低了风险，在自主模式下，攻击成功率从23.6%降至11.2%。针对四种浏览器特定攻击类型的专项测试显示，新缓解措施将成功率从35.7%降至0%。然而，独立AI研究员Simon Willison指出，剩余11.2%的攻击率依然“灾难性”，并认为在缺乏100%可靠防护的情况下，将AI代理集成到Web浏览器的模式存在根本性缺陷，难以安全构建。

安全风险已非理论。此前，Brave安全团队发现Perplexity的Comet浏览器可通过隐藏在Reddit帖子中的恶意指令，被诱导访问用户Gmail账户并触发密码恢复流程。攻击者能嵌入不可见命令，指示AI打开Gmail、提取用户邮箱地址并执行未经授权的操作。尽管Perplexity尝试修复，Brave确认其缓解措施已被绕过，安全漏洞依然存在。Anthropic计划通过此次研究预览识别并解决实际使用中出现的攻击模式，再广泛推广其Chrome扩展。在AI供应商防护不足的情况下，安全责任将转移至用户，使用这些工具于开放网络的用户正承担巨大风险，寄望终端用户做出明智的安全决策并不现实。

查看消息来源

订阅情报

推荐情报

CUDA 13.0 共享内存寄存器溢出优化：释放 GPU 性能新维度

Google 90亿美元加码弗吉尼亚AI基建与人才培养，驱动区域经济新增长

虚假警报制造者浮出水面，FBI介入调查“Swatting”犯罪团伙

Pixel 10 Pro XL：生成式AI重塑手机影像，远景拍摄达新高度

Pixel 10 Pro：AI 实用化元年，Google 旗舰再进化