关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3319人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深度搜索如何学会自我监督:来自脑科学的启发

科技行者 浏览 3191

美拉德过时了?今年冬天最火的4个颜色竟然是它们

LinkFashion 浏览 3312

埃尔法最大竞品复活了,这台新出的日系MPV有点酷!

汽车消费网 浏览 4100

满屏爱张力,现偶活过来了!

吐槽电影院 浏览 3472

5公里盘山路 超1000米落差!小鹏GX挑战东川49道拐一把过

快科技 浏览 1172

浙江稠州商业银行“共享法庭”实践,获评消费者权益保护领航企业

Daily每日财报 浏览 3542

证监会“女老虎”获刑7年!丈夫空降华兴资本后被查,包凡也受牵连

财通社 浏览 1057

新型发电领域的“超级跑车”来了!发电效率提升的秘密藏在这里

上观新闻 浏览 2839

邓莎没想到,丈夫不管的儿子成了她的“救赎”

贵州小娟 浏览 4248

陈涛:我们最后四轮赛程可以用地狱级来形容,已经没有退路了

懂球帝 浏览 4456

唯一参展的中国品牌,为何能在东京车展被“挤爆”?

道哥说车 浏览 4224

美国驻冰岛大使候选人:冰岛或成为美国"第52个州"

环球网资讯 浏览 13930

售32.99万起 2026款岚图梦想家正式上市

网易汽车 浏览 5133

阿尔特塔:英超是欧冠决赛的预演?我不认为球员会这么想

懂球帝 浏览 1022

北京现代EO 羿欧将于10月16日正式开启预售

车质网 浏览 4469

鲁尼:萨拉赫应该回撤参与协防;范戴克的进球应该算作有效

懂球帝 浏览 3997

推广|| 小预算也能戴出好质感,这个宝藏国货真的很值

黎贝卡的异想世界 浏览 4490

37岁高叶演“恶女”,连面相都变了?

娱乐圈笔娱君 浏览 4206

汪小菲又幸福了!和马筱梅搂腰拥抱好缠绵

疯说时尚 浏览 4264

新势力洗牌激烈:零跑、华为双雄争霸 方程豹斗败“蔚小理”

道哥说车 浏览 3825

英伟达发布Alpamayo汽车大模型平台 黄仁勋:这是机器理解现实世界的转折点

快科技 浏览 3389
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1