关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者973人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

道指收跌0.07%,英特尔跌超7%

中新经纬 浏览 1459

揭密!中国导弹为何飞越北极圈,不走太平洋

浏览 6119

生物芯片上海国家工程研究中心四川分中心在成都揭牌

封面新闻 浏览 2048

AI信任危机加剧:Sora视频“以假乱真”,国内灰产3元“洗白”水印

蓝鲸新闻 浏览 2127

一年狂揽60亿融资!13大玩家厮杀无人配送,阿里京东美团都入局了

车东西 浏览 736

特朗普邀请俄罗斯重回西方怀抱 普京用一句话表明决心

空天力量 浏览 17106

37岁白人女子送娃上学被执法人员枪杀 特朗普:是自卫

每日经济新闻 浏览 6223

存储芯片超级周期来袭!江波龙股价两个月涨超200%!超85亿存货在手

时代周报 浏览 1870

2025年全球PC出货量近2.8亿台 笔记本超2.2亿台

快科技 浏览 956

名记:威少对去海外打球的兴趣为零,他专注于在NBA打球

懂球帝 浏览 2100

巴基斯坦总理在联大敲桌子强调"自卫权"

北京日报 浏览 1996

财经早餐:英伟达50亿美元收购英特尔股份;美股三大指数齐创历史新高

网易财经 浏览 2862

马杜罗被指遭"发小"出卖 委"二号人物"疑与美接触数月

扬子晚报 浏览 4994

《小城大事》大结局:李秋萍和杜涛的缘,在月海续写上且圆满

肆季娱乐 浏览 896

新款腾势Z9GT申报图曝光 续航大增/似推单电机版本

网易汽车 浏览 1009

500Bar新蓝鲸 CS75PLUS智慧冠军版限时价9.19万元起

网易汽车 浏览 1926

81岁“中国刻蚀机之父”拟减持:已从外籍恢复为中国籍,为办理税务需要

红星资本局 浏览 1029

兴业消费金融:筑梦美好生活 扎实推进高质量发展

财经众议院 浏览 1084

男子取170万元现金 在银行门口遭抢劫致重伤左眼失明

扬子晚报 浏览 15816

超长续航+高阶智能NOA,极狐全新阿尔法T5预售12.38万起

HiEV 浏览 2214

卡扎菲儿子被暗杀身亡:4名蒙面人员闯入住所激烈交火

红星新闻 浏览 101067
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1