关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3142人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

戴尔推入门游戏显示器SE2426HG、SE2726HG:FHD 240Hz Fast IPS

IT之家 浏览 3483

官方:田玉达加盟辽宁铁人

懂球帝 浏览 3064

男子驾车撞死闯国道野猪被判全责 特斯拉修车费超2万

红星新闻 浏览 15919

专栏 | 做“主语”的体验

时尚COSMO 浏览 3109

一边收监管“黄牌”,一边夺A股成交额冠军!北方稀土股价新高背后,关联交易存隐忧

时代周报 浏览 4329

三星:明年的 HBM 内存产能已售罄,考虑扩建生产线

IT之家 浏览 3923

突破LLM遗忘瓶颈,谷歌「嵌套学习」让AI像人脑一样持续进化

机器之心Pro 浏览 3942

卡塞米罗:我离开皇马时安帅哭了;吉马良斯是巴西下一代领袖

懂球帝 浏览 911

全尺寸货运版eVTOL样机已总装下线,「蓝霄航空」完成新一轮数千万元融资,年内累计融资近亿元|36氪首发

36氪 浏览 4228

再见了沈腾,再见了贾玲,再见了沙溢!活得好好的已经被大家怀念

阿雹娱乐 浏览 3322

小S金钟奖获奖,坦言无助的时候想打电话给大s

韩小娱 浏览 4172

江一燕官宣离婚后首发声

扒虾侃娱 浏览 4024

队报:消息人士称罗塞尼尔并不在切尔西新帅候选名单上

懂球帝 浏览 3314

古二录音被忽略的细节!秦雯闺蜜歧视妇女,业内编剧还在嫌弃观众

萌神木木 浏览 3874

特朗普称可能将军事行动扩大到墨西哥和哥伦比亚

大象新闻 浏览 3509

前10月规模以上高技术制造业利润同比增长8.0%

北京商报 浏览 3610

有了AI,课堂如何“教”与“学”?

看看新闻Knews 浏览 3954

这张外卡不白拿,40岁瓦林卡逆转取胜,最后一届澳网完美开局

网球之家 浏览 3028

美驱逐舰拦截一艘驶往伊朗港口油轮

财联社 浏览 1059

什么信号?有银行直接5.5折卖房

大猫财经Pro 浏览 3344

一夜翻盘,炫富网红蓝战非复活了

TVB的四小花 浏览 4291
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1