关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者3093人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

德黑兰上空传出爆炸声 以色列回应

央视新闻客户端 浏览 1045

秋季穿衣别太老气横秋,看看这27套造型,时尚舒适又显高

静儿时尚达人 浏览 3918

记者:佛罗伦萨球员不满基恩500万高薪,后者态度也存在问题

懂球帝 浏览 3691

三季报丰收伴管理层大换血,洛阳钼业高光背后为何求变

华夏时报 浏览 3997

伊朗:将以“最强硬方式”回应美任何攻击

环球网资讯 浏览 2932

9个月出口571万辆车 中国汽车远征军杀出新血路

科学知识点秀 浏览 3982

美媒披露:美国司法部长邦迪被解雇内幕

参考消息 浏览 57108

中科院突破:AI实现持续学习不忘旧知

科技行者 浏览 4212

体操世锦赛男子个人全能决赛:桥本大辉夺冠,张博恒收获亚军

懂球帝 浏览 4084

上海AIGC创作者论坛成功举办,IPSH发布全球伙伴计划

澎湃新闻 浏览 4729

纯电续航215km 极狐阿尔法T5增程版官图发布

车质网 浏览 3458

博尔达拉斯:巧妇难为无米之炊,我不该承受这赛季所遭受的一切

懂球帝 浏览 3118

龙芯加速自研显卡进度:性能对标AMD RX550的9A1000将回片开始测试

快科技 浏览 201

“下沉剧宣”越来越不好用了?

时尚COSMO 浏览 3356

拯救“衰老”,这么护肤才有效率!

时尚COSMO 浏览 2602

禁毒警察被控走私毒品获刑三年半 本人称系"工作行为"

新京报 浏览 24870

男子网购"山羊绒大衣"实为绵羊毛起诉获赔 卖家已去世

红星新闻 浏览 12764

钠电池将迎规模化量产 多家上市公司抢先布局

证券时报 浏览 25

《太平年》演员演技排名,朱亚文第6,梅婷第3,第1众望所归

娱乐圈笔娱君 浏览 3047

2026年第一票房惨案诞生了

靠谱电影君 浏览 3237

看完这些上镜穿搭,国庆“美美出片”不费力

黎贝卡的异想世界 浏览 6256
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1