关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3099人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

穆西亚拉评心目中年度蓝阵容:巴黎五人入选,队长选择凯恩

懂球帝 浏览 3058

小鹏汽车CEO何小鹏:所有核心产品线都要走向全球市场

IT之家 浏览 3171

迪士尼,10亿美元投资OpenAI

中国基金报 浏览 3512

大衣,白色的更优雅不凡!

Yuki女人故事 浏览 2798

不只具身智能和AI,2026年的热门风口有哪些?

BT财经 浏览 2447

特朗普透露夜袭细节:"堡垒"中抓走马杜罗

新华社 浏览 3124

2025最狠理财,惊呆百万散户!

米筐投资 浏览 3149

关键时刻委少将为美军"敞开大门" 美压制委军手段披露

澎湃新闻 浏览 7179

古二录音被忽略的细节!秦雯闺蜜歧视妇女,业内编剧还在嫌弃观众

萌神木木 浏览 3826

增持回购潮背后的A股信心

北京商报 浏览 3670

比亚迪元PLUS迎来史诗级升级,续航或超650km!

刘哥谈体育 浏览 3906

阿斯:阿隆索深知西超杯意义重大,去年皇马由此开始走下坡路

懂球帝 浏览 3166

男导演曝丑闻 蒋欣的含金量还在上升

刘森森 浏览 3882

告别臃肿!这种简约的高级穿法,别拒绝

Yuki女人故事 浏览 3024

图卢兹vs梅斯:雷斯特、西迪贝首发,巴洛-图雷、哈比卜-迪亚洛出战

懂球帝 浏览 4110

中信金融资产副总裁就位 张健正式履职

21金融圈 浏览 3108

夫妇盯上2‰自然损耗规则 上千吨粮食遭盗卖价值500万

CCTV今日说法 浏览 9217

流落柬埔寨的福建女网红和家里通话 问"何时来接我"

极目新闻 浏览 9383

王家卫持续被扒!《东邪西毒》事件推锅临时工

boss外传 浏览 3840

小个子秋季穿搭指南!7件单品穿出大长腿,显高10cm

Yuki女人故事 浏览 6278

云拒科技推出Yunjue Agent:能够从零开始自我进化的助手系统

科技行者 浏览 2900
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1