关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2011人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

钱志敏突然当庭认罪震动旁听席 刑期或减免三分之一

封面新闻 浏览 13898

美将暂停实施对华海事等301调查措施一年

财联社 浏览 9116

短剧红毯成“见光死”现场,遍地普男普女

娱乐圈笔娱君 浏览 1773

幸福!孙杨张豆豆自曝结婚3年育有一娃

818体育 浏览 257

2026款丰田皇冠陆放上市 售28.48-33.28万元

车质网 浏览 2776

vivo严打“黑公关”:索赔近千万!

互联网那些事 浏览 3108

女喜人也太难了,但也太棒了!

时尚COSMO 浏览 1916

伊朗新任最高领袖受伤内幕:遭袭前几分钟外出死里逃生

江南都市报 浏览 111950

小鹏 P7+ 汽车累计交付 8 万台

IT之家 浏览 3058

全球港口博弈拉警报?李嘉诚亮终极底牌了

大猫财经Pro 浏览 1732

杭州巨准斥资超8亿入主华是科技,能否力挽狂澜?

览富财经网 浏览 1879

71岁TVB女星与老公,经历流产后决定不生育

TVB剧评社 浏览 1899

腾讯 AI 实现肺癌基因突变预测,精度最高 99%

IT之家 浏览 3100

9月MPV销量榜大洗牌,魏牌高山首夺魁,新能源车型主导市场格局

玩车专家1 浏览 3161

拉法口岸大批援助卡车滞留 司机:不止一次被以阻拦

北青网-北京青年报 浏览 3015

今年秋冬,流行“九分”穿法,时髦又显高!

LinkFashion 浏览 2477

法国宣布推出M51.3潜射弹道导弹 称其为“重大里程碑”

环球网资讯 浏览 2941

湖人126-114勇士,库詹东缺阵,里夫斯21分伤退,波杰23+5+8

懂球帝 浏览 3104

冬天的“外套”别随便买!40+女人锁定这3款,优雅大气还保暖

静儿时尚达人 浏览 2549

意甲12月最佳候选:霍伊伦、劳塔罗、普利希奇、弗拉希奇在列

懂球帝 浏览 1939

华为商城Mate 60/Pro系列配件一折促销,9.9元买官方保护壳

IT之家 浏览 2807
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1