关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1064人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

凌晨4点,超3万人现场观看!太火爆……

环球网资讯 浏览 1001

国乒女双夺冠女单却陷泥沼:8强仅杨屹韵1人 日乒4将围剿张本领衔

颜小白的篮球梦 浏览 2078

极石ADAMAS将于12月28日上市

天天电动 浏览 1348

普京:若乌方不愿和平解决 俄方就打到问题解决

国际在线 浏览 1214

海AI实验室团队揭秘:LLM训练新招数让AI学习效率提升36%

科技行者 浏览 848

上汽大众2025全年终端销售106万辆 12月单月终端销售9.6万辆

网易汽车 浏览 1175

官方:新疆足球超级联赛5月至7月举办,分为南北区共14支球队

懂球帝 浏览 149

航母“弹射三连”释放哪些信号

经济日报 浏览 2699

英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

机器之心Pro 浏览 1921

拼多多新质供给一周年:新质商品SKU数增长超五成,产业加速新质转型

财闻 浏览 2725

费迪南德:梅努抗压能力极强;卡里克的工作重点应是保持势头

懂球帝 浏览 770

保时捷纯电卡宴即将首发,PPE平台打造

车评网 浏览 1508

24架F-35A隐身战机集结西太平洋

极目新闻 浏览 2239

男生遭老师按地上强制要求剪头发 被老师勒脖子骑身上

大风新闻 浏览 6395

存储芯片成本暴涨230%!iPhone 18高配机型或迎来大幅涨价

华尔街见闻官方 浏览 984

今年最时髦的穿法:长外套+长裤,太高级了!

LinkFashion 浏览 912

欧盟考虑强制中企转让技术 彭博社:可能引发强烈反弹

环球网资讯 浏览 6186

一张图理清:美国抓捕委内瑞拉总统马杜罗始末

看看新闻Knews 浏览 1148

李迅雷:黄金暴涨、股市波动,普通人机会在哪?

首席经济学家论坛 浏览 2164

泰国为何“硬刚”特朗普 非要把仗打到底?

上观新闻 浏览 1209

《逍遥》结局揭秘:糖衣之下,是千年人妖血泪博弈

肆季娱乐 浏览 1287
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1