关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3217人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一农商行员工骗贷1600万,曾任某支行行长,以农村残疾困难户名义贷出上百万

新京报 浏览 309

77亿的工厂16亿卖 自主“捡漏”合资产能背后的车市剧变

道哥说车 浏览 3870

央视王炸定档!1月13日50集历史大剧开播

观察鉴娱 浏览 3254

柬泰签署停火联合声明 中方回应

北京日报 浏览 3430

陈乔恩老公首公开真实家境

小先生笔记 浏览 4109

德容:理解巴萨曾想卖了我,当时财政困难

懂球帝 浏览 4242

2025公益热度排名:肖战压过王一博登顶公益榜

未曾青梅 浏览 3219

名宿:拜仁选孔帕尼,如同中了头奖

体坛周报 浏览 4071

背靠腾讯、跟阿里抢商标的淘车车,“流血”冲击港股IPO

经济观察报 浏览 848

陈伟霆新剧《爱情慢慢》开机陷番位争议

梦在深巷qw 浏览 2238

湖南慈利通报“网友反映因瓶装液化气销售价格引发矛盾、广告牌被损毁”:相关部门已介入调查

环球网资讯 浏览 4414

特朗普:庞大兵力将很快抵达伊朗

参考消息 浏览 3011

鸿蒙智行鹭岛首家尚界专网用户中心开业

Report汽车 浏览 4035

马杜罗怒斥美“南方之矛”行动:国际法终将被维护

国际在线 浏览 3855

伊姐周日热推:电视剧《狙击蝴蝶》;电视剧《天书黎明》......

伊周潮流 浏览 3030

太阳报:曼联预计未来几周官宣前往沙特踢季中赛

懂球帝 浏览 3972

特朗普称俄为"纸老虎" 普京回应

央视新闻客户端 浏览 3210

欧洲提交修改版和平计划 涵盖乌克兰安全保障方式

上观新闻 浏览 3702

神奇少帅诞生!陈涛2战6分上岸,媒体人狂赞:比不靠谱洋帅强多了

奥拜尔 浏览 4174

AI应用“牛市叙事”再强化! Cloudflare(NET.US)销售额大增31% 股价狂飙至历史新高

智通财经 浏览 4171

小黑靴不流行了?今年冬天最火的靴子竟然是它

LinkFashion 浏览 3393
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1