关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者9人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

也门胡塞武装承认在亚丁湾袭击美国船只并命中目标

海外网 浏览 12745

媒体:美军在中东遇袭3人阵亡却没动静 表现有点怂

上观新闻 浏览 13013

李永吉任朝鲜人民军总参谋长

环球网 浏览 15239

今日热点:穆祉丞崩溃;金秀贤ins秒删......

伊周潮流 浏览 11568

搭上芯片“黑马”新凯来的光伏龙头,高管集体减持,股价大跌超7%

红星资本局 浏览 1367

斯卢茨基:我更看重的是去培养人 和中国球员沟通会尽量简单直接

直播吧 浏览 13239

刘强东又拿下理想,京东汽车靠谱吗?

正在说车 浏览 384

18岁男子多次与11岁女孩发生性关系 检方曾对其不批捕

澎湃新闻 浏览 92835

林丹西班牙庆生画面:9 岁儿子举动看哭网友

东方不败然多多 浏览 990

俩小伙卖给美军无人机:建"无中国"供应链太难了

澎湃新闻 浏览 30981

保时捷将在中国设立研发中心 2022年初落户上海

新京报贝壳财经 浏览 20649

中国职业拳击手周润琪在澳乘公交遇袭 头部被刺伤昏迷

三湘都市报 浏览 7885

北极恐将夏季无冰,更多的城市将被海水淹没

趣看热点 浏览 26011

新风格 全新宝马M3纯电版新测试谍照曝光

车质网 浏览 1115

林青霞接种国产新冠疫苗:感觉良好没什么反应

趣看热点 浏览 26270

宋佳穿黑色丝袜搭配风衣变身街头女王

潮人方法论 浏览 16822

我的插混车才跑了5000多公里,厂家就通知保养,这样合理吗?

蜗牛车志V 浏览 13019

荣耀 Magic V Flip 官宣 6 月 13 日发布,折叠屏形态行业最全

IT之家 浏览 11372

适合微胖女人“不显胖”的穿搭,保暖不臃肿

静儿时尚达人 浏览 13539

王暖暖花6年才离掉婚 男方母亲曾带女子探监和他相亲

新京报 浏览 1498

全网围观,这年度夫妻撕叉大戏来了

独立鱼 浏览 1169
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1