关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者918人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

携程涉嫌垄断被立案调查 尾盘跳水大跌超6%

Daily每日财报 浏览 934

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者 浏览 1086

五十岁女性别总穿卫衣!这3种上衣显贵又洋气,轻松穿出无龄感

静儿时尚达人 浏览 1893

特朗普:我不知道还能活多久 很多人都想置我于死地

扬子晚报 浏览 36331

半两财经|首款eSIM手机发售 国内运营商加速“无卡化”

北青网-北京青年报 浏览 1932

三季报,茅台失速!

YOUNG财经 浏览 1865

纯电汉兰达?丰田发布新款SUV预告,向新时代低头?

正在说车 浏览 676

酷睿Ultra X9处理器388H体验:电竞级核显,续航超持久

IT之家 浏览 844

美军参联会主席警告:对伊朗动武可能带来重大风险

央视新闻客户端 浏览 166

全锦赛:江苏女篮40分狂胜山东晋级决赛 马文20分罗欣棫14+7

醉卧浮生 浏览 2126

中科大团队发布Agent-R1:让AI智能体像人类一样学习和成长的框架

科技行者 浏览 880

香港政务司司长:涉案人员处心积虑犯罪 害死这么多人

南方都市报 浏览 16786

刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈

新智元 浏览 2180

号称“能拍能打”,努比亚 Z80 Ultra 手机官宣 10 月 22 日发布

IT之家 浏览 2165

51岁的何炅自曝非常痛苦,如今谁都救不了他?

小梊搞笑解说 浏览 2056

星光730灵犀动力获中汽中心高品质混动认证等奖项

网易汽车 浏览 1838

伊朗总统最新表态:将重建核设施

政知新媒体 浏览 1816

马卡:多家英超俱乐部有意阿布德,巴萨仍有其部分所有权

懂球帝 浏览 1007

这些老电影里的穿搭技巧,绝了!

Yuki女人故事 浏览 1846

追觅俞浩内部放狠话:造车PK理想,手机跟华为小米三分天下;TP-Link芯片事业部全员解散;马斯克用亲信管理AI公司引发冲突丨雷峰早报

雷峰网 浏览 2713

马雷斯卡告别切尔西:我在离开时把切尔西留在应有的位置上

懂球帝 浏览 1060
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1