关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1710人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

让大模型能自己想出安全方案——KAIST团队的突破性研究

科技行者 浏览 1428

入秋包包合集!这12个有质感还不撞款!

Yuki女人故事 浏览 2876

牛弹琴:针对16岁以下的孩子 澳洲干了件前所未有的事

现代快报 浏览 7030

首次搭载Hi4-Z架构 全新坦克400上市售24.98万起

网易汽车 浏览 2551

3张照片背后,娱乐圈正在悄悄改变的一件事

传递满满正能量 浏览 1632

委内瑞拉谴责美军扣押委油轮:国际海盗行为

环球网资讯 浏览 2124

比起辣妹风,早秋这样穿的女生才是高段位吧!

Yuki女人故事 浏览 4490

邮报:未来几战将决定波特去留,他若下课西汉姆已在考虑比利奇

直播吧 浏览 3589

战斗气息十足 全新AMG GT内饰官图发布

车质网 浏览 755

华为星闪起猛了!蓝牙技术全面应战,还针对中国市场出招

雷科技 浏览 2543

绍伊古访华争分夺秒1天往返 谈好后马上给普京复命

头条爆料007 浏览 6098

美媒:美两架军机坠入南海或与燃油无关

北京晚报 浏览 2498

2025最狠理财,惊呆百万散户!

米筐投资 浏览 2067

澳海滩枪击惊魂50分钟:枪手占据天桥向下扫射

澎湃新闻 浏览 7616

OptiScaler发测试版:抢跑AMD为Vulkan游戏开启FSR 4

IT之家 浏览 1049

志愿军"冷枪英雄":用206颗子弹杀敌203人 受金成日接见

极目新闻 浏览 7730

米体:普利希奇将接受医疗检查,阿莱格里和米兰对美国队不满

懂球帝 浏览 2824

从 Meta 拆解、苹果眼镜爆料,看「不科幻但好用」的 AR 眼镜|硬哲学

爱范儿 浏览 2743

万宁突然关闭内地线上线下全部门店,连锁巨头这是怎么了?

江瀚视野 浏览 2015

德央行行长妄言:若报复中国是最后一招 那就干票大的

澎湃新闻 浏览 8376

德媒:训练中被约纳坦-塔踩到脚的斯塔尼希奇并未受重伤

懂球帝 浏览 1428
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1