关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者1690人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大咖对话:从L2到L4,如何破解高阶智驾落地难题

网易汽车 浏览 2121

万科开启了第二笔中票展期

国际金融报 浏览 2080

到底什么人还在买油车?终于我悟了

汽车公社 浏览 2265

具身智能老炮再获数亿融资,移动多臂机器人已批量工业落地|36氪首发

36氪 浏览 2030

婚变传闻仅5天,窦骁大学同学为其发声

做一个合格的吃瓜群众 浏览 2666

新款小米SU7计划春节前到店 预售22.99万起

网易汽车 浏览 1551

香港警方含泪通报:要让每一位遇难者都有名字

扬子晚报 浏览 16408

美媒:泽连斯基未拒绝领土问题 要求提供更多细节

环球时报国际 浏览 7598

一天两枚火箭发射失利 中国航天科技集团发文回应

每日经济新闻 浏览 5886

让多图对话AI不再"搞混":首尔多所大学发现分隔符背后的秘密

科技行者 浏览 1425

OPPO Find X9 手机核心规格公布:6.78 英寸 1.5K OLED 直屏

IT之家 浏览 3396

狂揽450亿订单,汽零、机器人双巨头,破局重生!

飞鲸投研 浏览 1563

谷歌Pixel 10a渲染图曝光:无凸起后盖设计,配备6.2英寸屏幕

IT之家 浏览 2611

华硕灵耀14双屏2026来袭:酷睿Ultra X9加持,移动办公集大成者

IT之家 浏览 1396

大连“智”造金属螺钉骨植入材料将上市

半岛晨报 浏览 3548

净利润暴跌7912%!天域生物亏麻了

包不同 浏览 2331

即将结束非洲之旅,网红Speed受邀观战非洲杯决赛并获赠球衣

懂球帝 浏览 1691

五粮液前董事长李曙光被“双开”!卖酒类经销权牟利数额巨大,更多细节公布……

国际金融报 浏览 2710

对话 vivo OS 产品副总裁:AI 不会产生新的需求,通往远方是马车还是蒸汽机是产品形式问题

爱范儿 浏览 2838

五六十岁女性别瞎穿,教你三步解锁优雅气质,轻松告别油腻感

静儿时尚达人 浏览 2715

官方声明:王硕威不是福建舰总设计师

界面新闻 浏览 2537
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1