关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3106人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

于文文贵州演唱会晕倒,曝被救护车拉走,连轴演出引粉丝担忧

扒虾侃娱 浏览 2828

高效训练新标杆!华人开源原生VLM-NEO,以少数据追平顶级模型

DeepTech深科技 浏览 4218

西尔扎提常规赛报销,新疆再不补强一号位,季后赛都难进!

篮球资讯达人 浏览 2256

罗志恒:三季度经济增速为何放缓?四季度经济前景如何?

首席经济学家论坛 浏览 4147

山东99-75宁波3喜1忧!高诗岩陈林坚太关键,王证神射,2外出隐患

篮球资讯达人 浏览 3004

特朗普弄混格陵兰岛与冰岛 再提北约秘书长叫他"爸爸"

鲁中晨报 浏览 20523

iPhone17在中国卖爆,苹果成为全球手机出货第一

观察者网 浏览 3066

OpenAI发力机器人与AI设备,被爆寻找美国供应商

华尔街见闻官方 浏览 2996

广汽集团辟谣“一半汽车芯片由格力供应”:并非事实

中新经纬 浏览 3074

存款“搬家”到股市?央行最新报告详解五组利率比价关系 资产配置调整和市值变化影响金融资产结构

财联社 浏览 4020

国亮新材IPO:行业产能过剩、竞争对手强大,未来发展出路在哪里

览富财经网 浏览 3880

美国步步攫取委内瑞拉石油利益:主权在委 财权在美

澎湃新闻 浏览 102992

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

天天汽车 浏览 2908

台湾省金钟奖成了“照妖镜”,小S拿奖后,破防人算是照明白了

娱乐圈笔娱君 浏览 4157

杨鸣:广东三外援轮番冲击让我们顾此失彼;今晚年轻人的表现值得表扬

懂球帝 浏览 3153

"性商教母"周媛开启线下课 学员发现台上讲师是前同事

中国新闻周刊 浏览 32779

纯电续航提升 2026款比亚迪夏将于明日上市

车质网 浏览 3899

限量 100 台 电动 MINI JCW 蒙特卡洛 60 周年版上市

网易汽车 浏览 4053

美国微软公司:10月14日起Windows 10将“停服”

财闻 浏览 4101

"最快女护士"张水华辞职后首战获第六名 本人赛后回应

每日经济新闻 浏览 7355

诋毁蚂蚁集团,粉丝超1亿“专家”被封禁,什么信号?

一见财经 浏览 1561
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1