关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3158人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《长安二十四计》惊天逆转:虎贲竟是好人?

宇林网络 浏览 3597

日本太空航母野心披露 被指正谋划“太空珍珠港事件”

极目新闻 浏览 3425

甲骨文盘中涨超6%,华尔街"抄底派"料股价有望反弹90%

华尔街见闻官方 浏览 3736

郑丽文"不谈统一"让人失望了 蔡正元的话一针见血

现代小青青慕慕 浏览 9106

日媒:如何就美国突袭委内瑞拉表态 高市陷入两难

参考消息 浏览 10742

爱泼斯坦案最新文件公布 有记录显示来电人为特朗普

每日经济新闻 浏览 14338

白百何工作室放聊天记录了!锤了剧组没撒谎,东京之前就有矛盾

萌神木木 浏览 3194

一夜之间,矛盾又升级了!

米筐投资 浏览 4142

足球报:城市联赛面临高昂行政成本,赛风赛纪和裁判也是困扰

懂球帝 浏览 4267

以色列警告埃及不准使用中国导弹 特朗普突然对以下手

博览历史 浏览 36663

还没从上周财报中缓过来!博通、甲骨文再下挫,AI基础设施板块继续遭抛售

华尔街见闻官方 浏览 3425

广汽回应一半汽车芯片将由格力供应

21世纪经济报道 浏览 3069

《镖人》坚持宣传吴京李连杰,遭下沉市场排斥

萌神木木 浏览 3131

何猷君法国婚礼高调奢华,奚梦瑶行头4500万

喜欢历史的阿繁 浏览 11

秦昊带9岁女游国外,米饭百元自叹国内物价廉

松林侃世界 浏览 4081

永辉超市减持红旗连锁,套现上亿元

红星资本局 浏览 2993

外贸十强市年末或迎变局:深圳上海争夺第一,青岛杭州“抢十”

时代周报 浏览 4013

倪妮告秦雯和王家卫!?

八卦疯叔 浏览 3930

男子失业后瞒家人在车里住7天 车子手机都没电后哭了

极目新闻 浏览 31467

北约秘书长力挺特朗普:没有美国 欧洲能自保是做梦

红星新闻 浏览 6935

专栏 | 做“主语”的体验

时尚COSMO 浏览 3129
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1