关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2018人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

整形医生称泰勒·斯威夫特怀孕了

阿废冷眼观察所 浏览 3062

卡塔尔:加沙可能陷入“无战无和”局面

国际在线 浏览 2886

伊拉克国防部:已全面接管阿萨德空军基地

极目新闻 浏览 1929

曼城虐菜之战:18场18胜!哈兰德再冲英超100球 首发曝光

叶青足球世界 浏览 2462

真爱大牌返场|| 一上线就被抢空的牌子,这次居然100+就能拥有

黎贝卡的异想世界 浏览 2801

男子50多万买66台苹果手机放平台出租 如今钱机都没了

潇湘晨报 浏览 7612

宁愿净身出户与闫妮离婚,邹伟现在怎么样了?

洲洲影视娱评 浏览 3202

利雅得胜利客战利雅得体育:C罗缺阵,菲利克斯、马内先发

懂球帝 浏览 1718

苹果发布iPhone 17e

澎湃新闻 浏览 1219

智平方发布模块化具身智能服务空间“智魔方”,计划3年落地1000个

澎湃新闻 浏览 2271

看了被“烤瓷大白牙”毁了的年代剧,我怀念起了刘琳巩俐的乡土味

娱乐圈笔娱君 浏览 1924

拿到标准合同,Shams:乔丹-古德温成为太阳队第14位正式名单球员

懂球帝 浏览 3046

“耳环风波”半年后 18岁黄杨钿甜首次发文

现代快报 浏览 7575

NBA战报:爵士123-110篮网,马尔卡宁30+8+1

懂球帝 浏览 2507

穆里尼奥明确回应重返皇马传闻:别把我算进这场肥皂剧里

懂球帝 浏览 1963

西汉姆联助理教练帕科·赫梅斯澄清与努诺·埃斯皮里托·桑托的场边争执

绿茵情报局 浏览 1841

美航母大火持续超30小时后被扑灭 600多人无床可睡

环球网资讯 浏览 124329

农妇收玉米时遇山体坍塌失联4天 周边马路出现大坑

红星新闻 浏览 14045

内娱清流!这4位女星从不拍“吻戏”

喜欢历史的阿繁 浏览 3549

斯基拉:马竞计划买断冈萨雷斯,费用为3200万欧+100万欧奖金

懂球帝 浏览 3228

众泰还魂?追觅新车实车照曝光:一比一复刻宾利添越

三言科技 浏览 2528
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1