关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者1696人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

西尔扎提常规赛报销,新疆再不补强一号位,季后赛都难进!

篮球资讯达人 浏览 747

特朗普称让美国大型石油公司进入委内瑞拉

界面新闻 浏览 1796

慢镜头:米兰、尤文和三家英超俱乐部对热苏斯感兴趣

懂球帝 浏览 2669

今年春天最美搭配:西装+半裙,怎么穿都好看!

LinkFashion 浏览 895

牛弹琴:特朗普没想到 抓马杜罗后西方情绪总体很稳定

现代快报 浏览 6772

38岁尹正再破天花板,这一次,他让整个娱乐圈“沉默”了

温柔娱公子 浏览 2095

港科大突破:代码本技术提升AI医学图像分析稳定性

科技行者 浏览 1501

热度破9000,赵丽颖谭松韵令观众成功入坑,这部年底压轴剧太生猛

娱乐圈笔娱君 浏览 1940

冲击月销2万?乐道找回闯关“节奏”

网易汽车 浏览 2822

今天起,一场关乎14亿人的命运转折来了!

米筐投资 浏览 2648

天空:曼城想在冬窗签下一名中卫,格伊对转会曼城持开放态度

懂球帝 浏览 1700

上市15天,摩尔线程剑指英伟达腹地

虎嗅APP 浏览 2011

TA夸怀特、哲凯赖什和苏比门迪:各展所长,共同铸就关键胜利

懂球帝 浏览 1606

魏牌9年换9帅,魏建军:他们自己感觉压力大

雷达财经 浏览 1972

你适合“剪刘海”还是“露额头”?关键看这点!

Yuki女人故事 浏览 1686

三亚五星酒店再现10万房价 有人1折买3件奢侈品花1250

时代财经 浏览 17455

通航城市超260个 我国四大世界级机场群建设初具规模

央视财经 浏览 2854

欧洲各国在格陵兰岛凑出一个排兵力 丹麦驻军大幅增加

上游新闻 浏览 11289

周杰伦蹭霉霉热度翻车!又被质疑崇洋媚外,近些年口碑越来越差

萌神木木 浏览 2731

辽宁2将打强队太吃力!王岚嵚组织与得分全垮,付豪进攻失灵了!

篮球资讯达人 浏览 1691

普京批准俄罗斯与古巴军事合作协议

上观新闻 浏览 2833
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1