关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者1691人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以方扣押“全球坚韧船队”后 多国船员被驱逐遣返

环球网资讯 浏览 2866

定位中型轿车 比亚迪海豹07 EV官图发布

车质网 浏览 918

抖音发布2025直播治理白皮书,违规曝光量减少37%

财闻 浏览 1704

随着西班牙3-0 世界杯16强定14席 中国队对手确定 亚洲仅韩国出局

侃球熊弟 浏览 2803

让城市有“面子”更有“里子” 建设韧性城市行动方案发布

央视财经 浏览 2797

地平线苏箐:3年后 准L4级系统大概率已经量产

网易汽车 浏览 2129

特斯拉 Model Y L 交流外供电适配器上架,售价 599 元

IT之家 浏览 2517

东体:申花充分利用体能优势,亚冠失利对蓉城士气的打击或许更大

直播吧 浏览 3538

尼克斯129-101送黄蜂7连败,布伦森33分,哈特22+8+7

懂球帝 浏览 2336

对话 vivo OS 产品副总裁:AI 不会产生新的需求,通往远方是马车还是蒸汽机是产品形式问题

爱范儿 浏览 2838

科技巨头再投500亿瞄准这个赛道

中国新闻周刊 浏览 2560

郑恺晒与陈赫等10人合影,被扒P掉7处烟盒打火机,遭吐槽一群老登

萌神木木 浏览 2178

江淮受累于大众安徽亏损,受惠于尊界S800热销

道哥说车 浏览 1632

全新丰田凯美瑞上市!售价亲民,全新外观年轻动感,搭载2.5L双擎

小史谈车 浏览 1752

让多图对话AI不再"搞混":首尔多所大学发现分隔符背后的秘密

科技行者 浏览 1425

87岁画家范曾有四段婚姻 亲生后代一女一子

红星新闻 浏览 19586

媒体:爱泼斯坦案2000段视频公布 震碎三观突破下限

北京日报客户端 浏览 6005

12岁女孩手脚遭绑关厕所17天被虐亡 继母二审维持死刑

大风新闻 浏览 30978

汪小菲最重要的两个女人,一个爱,一个适合

半身Naked 浏览 3369

这是陈妍希?新剧开播后居然长这样

Yuki女人故事 浏览 2062

法拉第未来 Super One 迈入批量试制及生产阶段

IT之家 浏览 2602
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1