爆点资讯

JADES 由德国亥姆霍兹信息安全中心（CISPA)，富莱睿（Flexera）和西安交通大学的研究团队合作完成。本文的通讯作者为CISPA 教授张阳。

引言

回想一下，老师会如何批改考试中的开放题：如果考生只在开头写「答：」，但是后面却没有给出答案，当然不能得分；反之，如果他开头说「我不会」，却在后面写出了正确答案，那就该得分。另一方面，还有的答案看似组织良好、道理高深，却句句不在点上，那么依然只能低分；只有当回答准确且全面地涵盖了解决问题的关键要点时，其得分才较高。老师给分的依据，在于答案的实际内容和关键点，而不在于答案的开头、词藻或者形式。

可惜，目前 LLM 越狱攻击（Jailbreak）的评估往往就掉进了这些坑。常见做法要么依赖关键词匹配、毒性分数等间接指标，要么直接用 LLM 来当裁判做宏观判断。这些方法往往只能看到表象，无法覆盖得分的要点，导致评估容易出现偏差，很难为不同攻击的横向比较和防御机制的效果验证提供一个坚实的基准。

为了克服这一难题，来自CI

LLM越狱攻击威胁被系统性高估? 基于分解式评分越狱评估新范式

燃油+电动全...

乌称1200...

也门胡塞武装...

特朗普：加沙...

ED网红病，...

伊朗外长：美...

看完这些上镜穿搭，国庆“美美出片”不费力

短剧翻拍《新英雄本色》，刘萧旭主演?

官方出手，这一次谁也救不了狂妄自大的张雪峰？

最强Air！苹果全新iPad Air发布：M4芯片加持 4799元起

金莎穿娃娃领白衬衣领证，衬衫很宽松显肚子

年薪180万！众泰汽车副总裁被罢免

上海81岁外公卖房还债租房照顾2个未成年外籍外孙女

希瑞发布智能戒指 “全天候”健康生态野心初显

高市暗藏意图:引入核武器获取打击中国腹地能力

美联储年内“三连降”，2026年利率走向何方？

天空：曼联在关注雷恩中卫雅凯，他冬窗不太可能加盟

中国代表：日本必须深刻反省历史罪责停止挑衅越线

美被指向以色列通报对伊朗行动准备进展

苹果计划为 iPad Pro 引入 iPhone 17 Pro 的均热板散热

微软豪掷79亿美元投资阿联酋AI企业G42，加速中东AI设施建设

直击MWC2026|AI重构通信网络，6G“卡位战”提前到来

戚薇夫妻现身机场！李承铉穿泰迪熊大衣一头白发

这届双十一，充满了“AI味”与“本地生活味”

沉默的荣耀大结局前瞻，最惨角色出炉，果然不幸的人各有各的不幸

79岁一代文艺女神走了：终生未婚，一辈子穿西装

StereoAdapter：北大首提自监督，适配水下双目深度估计

利雅得胜利客战利雅得体育：C罗缺阵，菲利克斯、马内先发

OpenAI：人类打字速度将成通用人工智能发展瓶颈

以军称开始重新执行加沙停火协议