关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3317人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年夏天别傻傻穿一身黑,试试黑色+彩色穿搭,活力大方

静儿时尚达人 浏览 432

联通三季报:宽移用户净增规模创新高,首次披露云收入数字

南方都市报 浏览 4402

北京自闭症男童苍山走失身亡 父亲1周7天扎在单位加班

红星新闻 浏览 9180

TA夸怀特、哲凯赖什和苏比门迪:各展所长,共同铸就关键胜利

懂球帝 浏览 3205

朱丹新年晒全家福,儿女戴眼镜长相很一般

疯说时尚 浏览 3572

婚变传闻真相大白一个月,唐嫣高调官宣喜讯

叨唠 浏览 2748

为了万亿美元薪酬!马斯克取消FSD买断制,但不适合中国国情?

电车通 浏览 3312

美澳关键矿产协议被解读为旨在"对抗中国" 外交部回应

澎湃新闻 浏览 8585

解码科创成长层药企2025年成绩单

北京商报 浏览 1131

蓝军太难黑猫太黑!切尔西一周内两张脸

体坛周报 浏览 4298

礼来和诺和诺德的“网红减肥药”有望进美国医保!千元减肥药或降价85%

华尔街见闻官方 浏览 4064

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻 浏览 4549

我们给有毒染料找了个“替身”,而且它真的能吃…

中国科普博览 浏览 3556

限量3000台 广汽本田新飞度焕新价6.68万

网易汽车 浏览 3328

iPhone Air 2已在路上:升级2nm芯片 补齐影像续航短板

快科技 浏览 4010

AMD ROCm 软件堆栈更新至 7.0.2 版本,支持 Radeon RX 9060 显卡

IT之家 浏览 4459

杜兰特:超巨不在于名号而在于表现 我想一直打球直到再也打不动

罗说NBA 浏览 3374

让“死嘴”会说多说,不太好听又如何

时尚COSMO 浏览 4071

一汽丰田10月销售新车71407辆 今年累计销售65.8万辆

网易汽车 浏览 4094

泽连斯基:准备进行领土谈判

参考消息 浏览 4369

孔蒂:小麦已成长为全面的球员;对在切尔西的两年有美好回忆

懂球帝 浏览 3187
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1