关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者8人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

鞠躬救不了大发汽车

汽车公社 浏览 12792

辛巴或被判15年是什么情况?假燕窝事件涉案金额巨大

趣看热点 浏览 26877

REDMI K90 Pro Max 可与 iPhone / 小米 17 Pro Max 通用钢化膜

IT之家 浏览 1272

俄称击落数十架飞往莫斯科无人机

北青网-北京青年报 浏览 1241

别猜了,宝总最后跟我在一起了!

伊周潮流 浏览 13991

奇瑞“掀桌子”了!首款固态电池车星途ES8,零下30℃续航1000Km

车矩阵更懂车 浏览 219

联合国官员:加沙地带海上人道主义走廊短时间内难起效

极目新闻 浏览 12548

联想拯救者 Y700 2023 平板开启 ZUI 16 灰度推送,升级安卓 14

IT之家 浏览 11384

电动车的“36万辆奇点效应”

锦缎研究院 浏览 16087

苹果CEO库克上海两日行:看LABUBU,首次“直播带货”,直言“太爱中国人和中国文化”

澎湃新闻 浏览 1425

SRM理工学院发布:文本到视频生成技术演进图谱

科技行者 浏览 1002

38岁何洁二婚丈夫刁磊,已经开始为她“争光”了

余鴡搞笑段子 浏览 1062

男子与峨眉山猴子"搏击互殴" 景区:未收到任何道歉

封面新闻 浏览 105143

中年女人的开挂指南,避开花衣服和紧身衣,把优雅感焊在身上

静儿时尚达人 浏览 971

沙特,一部活色生香的《一千零一夜》

时尚COSMO 浏览 1230

欧盟峰会与美俄乌磋商在即 被冻结俄资产成博弈焦点

北青网-北京青年报 浏览 519

疑一则广告惹祸 特朗普宣布终止与加拿大所有贸易谈判

财联社 浏览 7159

于和伟逆袭的路上,藏着这样的一个女子

农村娱乐光哥 浏览 1383

45岁董洁北京定居,自己洗衣做饭很勤劳

无处不风景love 浏览 985

黎巴嫩真主党证实其高级领导人遭以军空袭身亡

环球网资讯 浏览 871

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者 浏览 1231
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1