2 min read

AI浏览器插件安全隐忧:Anthropic插件仍存11.2%攻击率,研究者称模式“灾难性”

AI浏览器插件安全隐忧:Anthropic插件仍存11.2%攻击率,研究者称模式“灾难性”

Anthropic近期公布了其Claude浏览器插件在安全测试中的表现。在未部署安全缓解措施时,该插件面对29种攻击场景的123个测试案例,成功率高达23.6%。一个典型案例是,恶意邮件指示Claude为“邮箱卫生”目的删除用户邮件,插件未经验证即执行了删除操作。为应对这些漏洞,Anthropic已实施多项防御措施,包括网站级别权限管理,允许用户控制Claude访问特定网站;要求Claude在执行发布、购买或共享个人数据等高风险操作前,必须获得用户确认;并默认阻止Claude访问提供金融服务、成人内容及盗版内容的网站。

这些安全措施显著降低了风险,在自主模式下,攻击成功率从23.6%降至11.2%。针对四种浏览器特定攻击类型的专项测试显示,新缓解措施将成功率从35.7%降至0%。然而,独立AI研究员Simon Willison指出,剩余11.2%的攻击率依然“灾难性”,并认为在缺乏100%可靠防护的情况下,将AI代理集成到Web浏览器的模式存在根本性缺陷,难以安全构建。

安全风险已非理论。此前,Brave安全团队发现Perplexity的Comet浏览器可通过隐藏在Reddit帖子中的恶意指令,被诱导访问用户Gmail账户并触发密码恢复流程。攻击者能嵌入不可见命令,指示AI打开Gmail、提取用户邮箱地址并执行未经授权的操作。尽管Perplexity尝试修复,Brave确认其缓解措施已被绕过,安全漏洞依然存在。Anthropic计划通过此次研究预览识别并解决实际使用中出现的攻击模式,再广泛推广其Chrome扩展。在AI供应商防护不足的情况下,安全责任将转移至用户,使用这些工具于开放网络的用户正承担巨大风险,寄望终端用户做出明智的安全决策并不现实。

查看消息来源

订阅情报