关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者972人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

工业知识联盟在深成立 为工业AI的可靠发展筑牢知识底座

南方都市报 浏览 2124

欧洲多国讨论部署军队 格陵兰岛坚称"不做美国人"

环球网资讯 浏览 899

麻省理工学院发明“可注射”脑机芯片,有潜力用于治疗老年痴呆症

IT之家 浏览 1672

迷雾剧场新剧:超越悬疑,窥见人心

吐槽电影院 浏览 1986

直播电商迈步“全链条监管”

北京商报 浏览 1057

美联储降息25基点 仍预计明年降息一次

华尔街见闻官方 浏览 1381

当你的代码测试出问题时,人工智能能像专业程序员一样修复吗?

科技行者 浏览 661

周末利好刷屏!中美元首通话、国常会重磅,下周一重磅发布会

看财经show 浏览 2783

蒋凡重启阿里:一场AI重构内核的千亿实验

博望财经 浏览 2043

多国欢迎加沙停火协议生效 呼吁尽快结束人道主义危机

上观新闻 浏览 2153

飞天茅台4年下跌近50%,白酒寒冬结束的信号是什么?

郭施亮 浏览 1822

媒体:美国盯上铜、银、煤炭等矿产 下一步或加税

澎湃新闻 浏览 6552

续火花:不间断的敷衍,就是真诚

时尚COSMO 浏览 1443

57岁寻亲志愿者离世:为数百人找到家 自己却未能回家

扬子晚报 浏览 19213

曹西平遗体火化,干儿子哽咽道别:谢谢四哥给我的一切

素素娱乐 浏览 798

洛里昂vs布雷斯特:姆沃戈、马肯戈首发,迪纳-埃宾贝、阿若克出战

懂球帝 浏览 2070

普通人穿衣不需要太复杂!颜色恰当、搭配和谐,高级又耐看

静儿时尚达人 浏览 8

果园8.8元"偷橘子":一晚卖几百斤 抓人的狗都累瘫了

红星新闻 浏览 14516

汽车图谱⑳|新能源车迎最强“金九” 新势力头部月销达4万量级

贝壳财经 浏览 2148

海港战武里南联海报:以物理试卷为背景,解“南”题

懂球帝 浏览 1849

中微半导涨价,最高50%!机构:AI设施投入持续加大为确定性事件

中新经纬 浏览 813
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1