关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2010人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

产品力全面提升 问界M7新老款车型对比

车质网 浏览 2958

告别关税围城,中欧和解为国产电车赢得战略缓冲

车市洞察 浏览 2002

隔空对骂!马斯克与瑞安航空CEO就“星链”安装问题爆发口水战

环球网资讯 浏览 2055

泽连斯基:乌克兰计划2027年加入欧盟

财联社 浏览 5664

沃尔沃S60也开始卷价格?最高优惠12.6万

汽车网评 浏览 2354

女子连续偷吃5个蛋挞 转身大摇大摆走掉

极目新闻 浏览 21542

权志龙风波升级!装不懂中文还无视中粉遭暴力对待,挚友被扒辱华

萌神木木 浏览 2333

埃尔法最大竞品复活了,这台新出的日系MPV有点酷!

汽车消费网 浏览 2812

华为 nova 14 Pro / Ultra 预计今年 12 月升级支持 AI 辅助构图

IT之家 浏览 2980

快手全员发开工红包:正式员工366元

三言科技 浏览 1403

任正非最新讲话:没有网络的算力是信息孤岛

澎湃新闻 浏览 2379

燃油+电动全都配 全新宝马4系最新消息曝光

乐选爱车 浏览 1791

切尔西本赛季英超10名不同球员破门,与阿森纳并列最多

懂球帝 浏览 3070

已减重10公斤的泫雅澳门演出晕倒后公开致歉

封面新闻 浏览 2836

明天会更一部灵异类电影,那就找几张鬼里鬼气的壁纸,大家收图

电影最TOP 浏览 2503

固态电池量产提速!超千万新能源车主,竟成被割的 “老韭菜”?

数字财经智库 浏览 3714

12岁女孩手脚遭绑关厕所17天被虐亡 继母二审维持死刑

大风新闻 浏览 31284

帕多瓦诺:斯帕莱蒂已成功调整球队,下一步需缩小积分差距

懂球帝 浏览 2234

速卖通正在成为更多亚马逊商家的第一阵地

华尔街见闻官方 浏览 3306

以色列总理称将召集内阁批准停火协议

央视新闻客户端 浏览 3126

汪涵老婆带82岁母亲拍照,透露从芒果离职原因

心静物娱 浏览 2460
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1