关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2017人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

IT之家 浏览 2906

大学副教授成老赖仍开宝马用新手机 一次餐费花8000元

新京报 浏览 7482

安以恩:邦本宜裕是很“高级”的球员,我们能秒懂彼此的意图

懂球帝 浏览 2599

志愿军"冷枪英雄":用206颗子弹杀敌203人 受金成日接见

极目新闻 浏览 8036

宁德时代再出手!1月内从弃控到增资,深度绑定富临精工磷酸铁锂版图

时代周报 浏览 1802

蔚来换电和理想5C,谁能硬刚,比亚迪兆瓦闪充?

路咖汽车 浏览 1115

李斌、雷军“吹哨”,芯片危机又来了

汽车公社 浏览 1910

搭载1.5T发动机 奇瑞瑞虎5运动版官图发布

车质网 浏览 1105

夸克“C计划”浮出水面,AI超级应用卡位战升级

华夏时报 浏览 3013

伊朗总统:袭击最高领袖 等同“发动全面战争”

每日经济新闻 浏览 1948

何小鹏邀罗永浩体验 VLA:好产品不怕检验 罗永浩回应笑翻网友

快科技 浏览 974

联合杯贝尔赫斯首胜阿利亚西姆

体坛周报 浏览 2004

字母哥首秀但他还走吗? 胜公牛并未让雄鹿宽心

仰卧撑FTUer 浏览 3222

今日热点:卢靖姗韩庚官宣二胎出生;路行退出《再见爱人5》……

伊周潮流 浏览 2551

新春穿搭新趋势,天猫服饰与百大品牌共同演绎新年吉服美学

LinkFashion 浏览 1970

年味拉满,好笑戳心,春节档还得看他们!

吐槽电影院 浏览 1358

理想去年销量下滑 18.8%,摩根下调评级,理想今年能破局吗?

车毂轆 浏览 1403

终于!短剧向经典IP出手了

艳姐的搞笑视频 浏览 3097

首败!76人无缘24分逆转1分惜败绿军 恩比德丢绝杀布朗32+6

醉卧浮生 浏览 2900

被问是否会刺杀伊朗新领袖 特朗普突然"共情"了

极目新闻 浏览 32458

市民举报3600平违建存续8年 官方:违建人患病不能强拆

扬子晚报 浏览 19274
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1