关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2103人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

视频:福建舰夜泊军港 航母上亮起灯光

北京日报 浏览 2116

实弹射击 禁止驶入 山东潍坊发布警告

极目新闻 浏览 3049

阿卡小遇波折三盘晋级,战袍意外陷争议:像根大葱还是致敬费德勒

网球之家 浏览 2015

TA:从多纳鲁马到塞门约,瓜帅的足球风格已从控球转变为反击

懂球帝 浏览 2139

春天的衣服没必要买太多,准备几件"卫衣",舒适减龄又大方

静儿时尚达人 浏览 381

维尔茨:能庆祝自己的成就时很不错,我喜欢在安菲尔德踢球

懂球帝 浏览 1804

麻省理工学院教授文小刚追忆杨振宁:他是近代物理的伟人

澎湃新闻 浏览 3303

特朗普:不想“浪费时间”与普京会晤

参考消息 浏览 8361

9岁小酒窝,大大方方成顶流

时尚COSMO 浏览 2721

潘江:古德温确实很匹配山西,但因种种原因离开我们确实没办法

懂球帝 浏览 2118

印媒:印度将在印巴边境地区启动大规模三军联合演习

环球网资讯 浏览 2963

不一样的温子仁,最后时刻大反转!

电影最TOP 浏览 2487

伊朗针对以色列心脏地带发起打击 对美国发出威胁

每日经济新闻 浏览 114084

黄晓明:肉白增了

娱乐圈笔娱君 浏览 2940

AI应用“牛市叙事”再强化! Cloudflare(NET.US)销售额大增31% 股价狂飙至历史新高

智通财经 浏览 3040

新赛道,世锦赛400米栏冠军博尔宣布将转战女子800米

懂球帝 浏览 3321

汽车之家官宣冬季测试真要来了:杜绝充值 喊话陈震愿意来吗

快科技 浏览 2900

记者:切尔西已经向塞门约经纪团队进行了初步询价

懂球帝 浏览 2342

2025年ETF盘点:冠军花落通信ETF,年度黑马竟是它!十大关键事件影响深远

每经牛眼 浏览 2174

六氟磷酸锂“带飞”氟化工,衢州启动“中国氟谷”的底气在哪里?

时代周报 浏览 2868

有银行今年降了七次!存款利率又双叒下调

21世纪经济报道 浏览 3198
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1