爆点资讯

JADES 由德国亥姆霍兹信息安全中心（CISPA)，富莱睿（Flexera）和西安交通大学的研究团队合作完成。本文的通讯作者为CISPA 教授张阳。

引言

回想一下，老师会如何批改考试中的开放题：如果考生只在开头写「答：」，但是后面却没有给出答案，当然不能得分；反之，如果他开头说「我不会」，却在后面写出了正确答案，那就该得分。另一方面，还有的答案看似组织良好、道理高深，却句句不在点上，那么依然只能低分；只有当回答准确且全面地涵盖了解决问题的关键要点时，其得分才较高。老师给分的依据，在于答案的实际内容和关键点，而不在于答案的开头、词藻或者形式。

可惜，目前 LLM 越狱攻击（Jailbreak）的评估往往就掉进了这些坑。常见做法要么依赖关键词匹配、毒性分数等间接指标，要么直接用 LLM 来当裁判做宏观判断。这些方法往往只能看到表象，无法覆盖得分的要点，导致评估容易出现偏差，很难为不同攻击的横向比较和防御机制的效果验证提供一个坚实的基准。

为了克服这一难题，来自CI

LLM越狱攻击威胁被系统性高估? 基于分解式评分越狱评估新范式

北约秘书长吕...

锦州银行落幕...

有人被拖欠工...

赵文卓夫妇送...

极氪启动跨代...

娃哈哈精密机...

东方甄选线下店开业：不卖菜卖简餐，全标品

冬季穿衣千万别花枝招展，这些基础穿搭，越简单才越高级耐看

“反向春运”火了！部分火车票低至1.9折，南京到上海只要8.5元

拉什福德社媒鼓励球队：这是马拉松不是短跑，我们会继续战斗

全新雷克萨斯ES实车，是凌志该有的样子吗？

＂商务部公告附件首次改为wps格式＂不实至少5年前已用

广汽×华为乾崑联合打造＂启境＂品牌正式发布

年销280万辆，出口134万辆后，奇瑞的下一站在哪

有品味的中年阿姨，穿衣搭配都有4个共同点，学会了优雅到老

海尔集团与蚂蚁集团签署全面战略合作协议聚焦数字支付与医疗健康

首款星闪音频耳机！华为FreeBuds Pro 5悦彰耳机开售：1499元母带级无损音质

北约将北极地区所有北欧国家纳入同一指挥体系

纽约时装周：美+好穿，不可错过的4大趋势

30万分手费vs3000万求婚钻戒：一个前妻的修养

将于2027年上市 AMG CLA猎装车谍照曝光

航母“弹射三连”释放哪些信号

李想评豆包手机为现象级AI产品努比亚回应：带来自动驾驶式体验升级

跳舞，撑不住人形机器人

研究发现：若告知消费者广告是由AI生成的，点击率会减少31%

巴基斯坦与沙特签协议被指影响超越中东引发多国震动

广汽启动自主品牌BU改革昊铂埃安渠道统筹运营

摩恩电气深V之意

全红婵换新发型！在老家摘草莓好惬意

足球报：曾有公司有意收购广西平果，但因欠账问题方面没谈拢