关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者3029人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

海盗船新键盘内嵌直播控制台,1月29日开卖!

IT之家 浏览 3217

李婉华:但凡他跟我求婚,我都不会另嫁他人

艳儿说电影 浏览 4159

刘涛为95花作配,国民女星的资源降级还是新机遇?

八卦三缺一 浏览 4815

2026款奔驰GLC AMG 43 4MATIC上市 售58.9万

车质网 浏览 3487

上新|| 我心中的“人生衬衫”,它终于来了

黎贝卡的异想世界 浏览 2205

IPO观察丨东鹏饮料再递表港交所,大单品收入占比近8成,上半年广告费超8.8亿元

红星资本局 浏览 4283

智驾双雄:大湾区杀出全球智驾新势力

21世纪经济报道 浏览 3043

来酷AI MINI PRO迷你主机上架:"Lunar Lake"平台,3799元起

IT之家 浏览 1259

美媒:美对伊朗行动选项"远超传统空袭"

新华社 浏览 3007

470场,格列兹曼追平科利亚尔并列马竞队史出场榜第5名

懂球帝 浏览 3439

美国政府联手苹果、微软、OpenAI等公司,招募1000名工程师打造"科技力量"

华尔街见闻官方 浏览 3390

兰州临街商铺突发爆炸致一死 事发路段已封锁仍在排查

大风新闻 浏览 4112

上汽通用五菱2025年累销超163.5万辆 新能源年销首超百万

网易汽车 浏览 3241

星巴克中国股权出售进入倒计时

虎嗅APP 浏览 4191

关税预期与矿山停产“共振”,伦铜首次突破1.2万美元再创历史新高

华尔街见闻官方 浏览 3431

闫学晶的账还没有算清,49岁李湘又“塌”了

真的八卦小学弟 浏览 2910

王楚钦:大家都清楚现在的局面,但谁又能说能稳吃我们呢

懂球帝 浏览 1039

1.78万亿宁德时代牵手“张雪”,造出电摩给谁骑?

野马财经 浏览 1557

郝蕾跟辛芷蕾杠上了?

大龄女一晓彤 浏览 3762

转战舞池,前意大利网球名将弗格尼尼斩获《与星共舞》冠军

懂球帝 浏览 3943

麻省理工学院教授文小刚追忆杨振宁:他是近代物理的伟人

澎湃新闻 浏览 4264
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1