关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者507人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拉莫斯:可以接受战平浙江队的结果,球队走在正确的道路上

懂球帝 浏览 1521

《红舞鞋》剧组被曝压榨群演!工作11小时仅70元,剧方还威胁学生

萌神木木 浏览 1738

浙大团队突破:AI实现多人脸精准生成

科技行者 浏览 1586

海报荐读|AI产品情绪价值开始“分化”;无障碍出租车为何预约难

上观新闻 浏览 1298

美国已正式开始出售委内瑞拉石油

新京报 浏览 405

U23国足战越南官方阵型: 4-4-2!鲍盛鑫中场,蒯纪闻搭档向余望,胡荷韬可落位边后卫>>

懂球帝 浏览 379

‍22个观众,首日票房仅825元,这部国产烂片被《731》打惨了

靠谱电影君 浏览 2189

推广|| 她们新年状态大开挂?原来悄悄做了这笔“美丽投资”

黎贝卡的异想世界 浏览 514

媒体:日本或让美F-35战机带核炸弹部署 以"威慑中国"

枢密院十号 浏览 41703

美国抓走马杜罗计划曾外泄 美媒收到计划后未公布

新京报 浏览 555

美媒:美国曾以为贸易战能改变中国经济 但它错了

环球时报国际 浏览 12487

福建舰已完成多次海试 进度远超预期

央视新闻客户端 浏览 1751

宁愿净身出户,也要与闫妮离婚的邹伟现状如何?

律便利 浏览 1817

德约雅典冲击生涯第101冠,为什么突然成了网圈的一件大事?

网球之家 浏览 1269

媒体:美军或捅破一个巨大的马蜂窝 与俄军在伊朗硬刚

新民周刊 浏览 4649

连奕名为老婆过46岁生日 杨若兮素颜照惹争议

小徐讲八卦 浏览 695

广汽×华为乾崑联合打造 "启境"品牌正式发布

网易汽车 浏览 2297

中国又一个伙伴倒向美国 撕毁合同把矛头对准中方

博览历史 浏览 10779

收藏这篇就够了!本地人私藏的广州逛吃指南

黎贝卡的异想世界 浏览 1250

湖人胜勇士!里弗斯后场发动机,八村垒艾顿齐爆,拉拉维亚辣眼

篮球资讯达人 浏览 1756

杭州女子洗完澡一抬头 发现窗外停着一架无人机

极目新闻 浏览 1664
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1