关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者3027人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

刘嘉玲问刘晓庆:现在接戏的角色是否有限?

红星新闻 浏览 4269

冬天衣服别只选一个颜色!还可以试试这几种色彩,好看又高级

静儿时尚达人 浏览 2865

推广中奖名单-更新至2025年11月5日推广

黎贝卡的异想世界 浏览 3490

推广中奖名单-更新至2025年9月8日推广

黎贝卡的异想世界 浏览 6130

李昀锐和孟子义恋情爆热搜,新剧直接无人在意了

陈意小可爱 浏览 4181

豪门赘婿,惨被退货?

仙女事件簿 浏览 4070

一图看懂|朝鲜庆祝空军成立80周年 展示了哪些新式武器

澎湃新闻 浏览 3465

特朗普:格陵兰岛非常重要 北约若离开了美国啥也不是

澎湃新闻 浏览 12657

女演员被前夫指责害死公公 本人称愿接受刑事立案调查

极目新闻 浏览 27726

杨幂视后梦碎了?《生万物》除女主之外全员拿奖

萌神木木 浏览 2230

克洛普:斯洛特是特别好的人;当时没人告诉我还能这么花钱

懂球帝 浏览 4128

女人过了60岁打扮要得体!看这些穿搭就有灵感,简约不老气

静儿时尚达人 浏览 4100

NBA战报:马刺133-104大胜步行者取NBA5连胜,文班亚马17+12+1

懂球帝 浏览 4082

28亿次播放:她这段感情,后劲越来越猛

Yuki女人故事 浏览 2942

短剧副导演拍摄结束两天后在家猝死 两女儿刚放学回家

中国青年报 浏览 33449

闫学晶的账还没有算清,49岁李湘又“塌”了

真的八卦小学弟 浏览 2909

OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作

量子位 浏览 4100

或为黄色特别版 斯巴鲁BRZ新车型预告图发布

车质网 浏览 4256

法国队史第3次闯入U20世界杯半决赛,此前一次夺冠一次第4

懂球帝 浏览 4216

勇士124-106轻取鹈鹕,库里11中2仅9分,穆迪8记三分

懂球帝 浏览 3867

田中碧:日本球员水平在提升,想知道与巴西的差距就得比一场

懂球帝 浏览 4256
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1