关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3102人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

董子健带女儿现身公园玩 父女俩一见面就乐开花儿

翰林涛涛 浏览 4202

与AI机器人同行,中山万人徒步共迎新年

南方都市报 浏览 3241

阿里云计算如何让大语言模型吃得更聪明

科技行者 浏览 2997

俄方表示结束乌克兰危机“欧洲方案”不具建设性

环球网资讯 浏览 3679

普京指挥俄军战略核力量综合演习

环球网资讯 浏览 3341

中国停购后 美国大豆真"爆仓"了人们四处逃散

澎湃新闻 浏览 11988

媒体:美航母编队一重要舰种 已经少于中国055大驱

新民周刊 浏览 37598

泰晤士报:阿森纳关注卢克巴和利夫拉门托;贝尔塔想清理冗员

懂球帝 浏览 2124

广州策马向前,跑好第一程!

无冕财经 浏览 3109

苹果将在 2028 年款 MacBook Air 上采用 OLED 显示屏

威锋网 浏览 3906

未成年女性称被爱泼斯坦当"孵化器" 还遭公司高管强奸

红星新闻 浏览 100378

上任即取大胜,新疆主帅格兰:这不是我的功劳,是球员打得好

懂球帝 浏览 3100

诋毁蚂蚁集团,粉丝超1亿“专家”被封禁,什么信号?

一见财经 浏览 1560

仅自己可见:腾讯QQ群聊消息官宣支持元宝AI总结功能

IT之家 浏览 3562

Beats苹果iPhone 17e专用保护壳发售,399元

IT之家 浏览 2343

HWG!罗马诺:维拉1200万欧签下梅斯16岁前锋马乔已达成协议

懂球帝 浏览 3123

41岁张靓颖的现状,给所有中年女性提了个醒

科学发掘 浏览 3598

泰柬冲突急转直下,世界三个没想到

牛弹琴 浏览 3280

反转才不是「惊蛰无声」的最大看点

吐槽电影院 浏览 2371

特朗普:目前不打算供乌“战斧”导弹

央视新闻客户端 浏览 4072

理发店主阻拦城管撕广告 冲突中被1名胖城管咬伤手指

大风新闻 浏览 6117
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1