关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2099人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

刚说完战争很快结束 特朗普改口

参考消息 浏览 1160

爱泼斯坦案最新文件公布 有记录显示来电人为特朗普

每日经济新闻 浏览 13285

挥别日上 免税市场洗牌

北京商报 浏览 2138

特朗普与普京长时间通话 “会晤”与“战斧”成话题

极目新闻 浏览 3212

刘宇宁一天迎来两个喜讯,秦海璐没说谎

贵州小娟 浏览 2223

真心话大冒险开启,谁是你的双11购物车ONEPICK?

时尚COSMO 浏览 2577

华熙生物:前三季度业绩双降计提减值准备超九千万元 联营企业或以子公司自居现疑云

金证研 浏览 3009

牛弹琴:欧洲大怒 多支军队兵发格陵兰抗衡美国吞并

现代快报 浏览 2052

内娱又增新赛道,三分钟火出圈的叶祖新,坐着就抢了主角的戏

最爱酷影视 浏览 2421

海哈金喜力挺嫣然医院:为李亚鹏点赞,多年笨拙的坚持很不容易

扒虾侃娱 浏览 2058

伊朗驻华大使:美国若敢动伊朗 影响将远超各方控制

中国日报网 浏览 12495

高管减持、股东跑路、产品爆炸:上市公司的“中年危机”

诗与星空 浏览 3171

乔治亚理工学院联手微软:让AI训练效率暴增21%的神奇新方法

科技行者 浏览 2839

美防长来了 核潜艇议题搅动韩国

环球网资讯 浏览 3005

购置税红利倒计时,头部车企上演“兜底”大战

汽车点评AC 浏览 2984

刚刚,阿里千问 APP 开启公测,要做中国版ChatGPT | 附实测

爱范儿 浏览 2823

弹无虚发,凯恩德甲18次罚点全中

体坛周报 浏览 3045

机器人,又杀出了第一股

投资家 浏览 2546

《镖人》直接让陈丽君补拍而非换脸,投资达7亿

芊手若 浏览 2064

年内最高赚超65%!这批基金“专业买家”的技术不能错过

华尔街见闻官方 浏览 2241

小李子塞隆绝色出演,伍迪艾伦的绝妙讽刺剧

幕味儿 浏览 2476
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1