关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1712人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

E句话| 他们都离婚了?

仙女事件簿 浏览 2347

百亿龙头股董事长获刑,已上诉!IPO关键期行贿官员,过程曝光

深蓝财经 浏览 2481

SpaceX:识别并切断缅甸电诈园区周边逾 2500 台“星链”设备

IT之家 浏览 2675

苹果iOS 26.2开发者预览版Beta发布:大批功能改!锁屏也能自定义液态玻璃

快科技 浏览 2554

以色列继续袭击约旦河西岸 哈马斯谴责

每日经济新闻 浏览 2492

台媒:大陆在朱日和基地复制"总统府" 不可掉以轻心

经济观察报 浏览 11875

阿根廷晋级世青赛决赛,梅西:挺进决赛啦,恭喜所有人

懂球帝 浏览 2735

古利特:皇马3个前锋无球时做的太少,贝林厄姆成为受害者

懂球帝 浏览 2172

2026款宋Pro DM-i上市 限时超级优享价9.98万元起

只懂车 浏览 1790

LV高管空降泡泡玛特,年薪300万港元

YOUNG财经 浏览 2087

乔-科尔:波特根本就没得到足够的支持,西汉姆对他有所怀疑

懂球帝 浏览 3306

女单黯淡女双坚挺,金花2025交7冠答卷

网球之家 浏览 2604

TA:维拉已与卡什就续约达成原则性协议,将续约至2029年

懂球帝 浏览 2783

小S二女儿疑曝出恋情,在墨尔本和一男子游玩

小徐讲八卦 浏览 1533

女子卷走公司2000万欲跑路 最后一刻害怕被抓放弃登机

环球网资讯 浏览 9252

以色列宣布:将扣押的数百名活动人士驱逐出境

环球时报国际 浏览 2924

孔帕尼:我们非常珍惜拜仁现在的团队氛围,会努力维护它

懂球帝 浏览 743

储能内卷的标准样本:黑马果下科技,究竟是如何速成的?

赶碳号 浏览 1721

借款人伪造公章贷款 煤企"缺席"审理被判背负上亿债务

澎湃新闻 浏览 29047

泽连斯基称俄乌和平协议无简单解决方案 普京发声

每日经济新闻 浏览 2159

性能+豪华 星途ES7GT/ES8/ET8/ET9四车发布

网易汽车 浏览 1998
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1