爆点资讯

JADES 由德国亥姆霍兹信息安全中心（CISPA)，富莱睿（Flexera）和西安交通大学的研究团队合作完成。本文的通讯作者为CISPA 教授张阳。

引言

回想一下，老师会如何批改考试中的开放题：如果考生只在开头写「答：」，但是后面却没有给出答案，当然不能得分；反之，如果他开头说「我不会」，却在后面写出了正确答案，那就该得分。另一方面，还有的答案看似组织良好、道理高深，却句句不在点上，那么依然只能低分；只有当回答准确且全面地涵盖了解决问题的关键要点时，其得分才较高。老师给分的依据，在于答案的实际内容和关键点，而不在于答案的开头、词藻或者形式。

可惜，目前 LLM 越狱攻击（Jailbreak）的评估往往就掉进了这些坑。常见做法要么依赖关键词匹配、毒性分数等间接指标，要么直接用 LLM 来当裁判做宏观判断。这些方法往往只能看到表象，无法覆盖得分的要点，导致评估容易出现偏差，很难为不同攻击的横向比较和防御机制的效果验证提供一个坚实的基准。

为了克服这一难题，来自CI

LLM越狱攻击威胁被系统性高估? 基于分解式评分越狱评估新范式

对标丰田4R...

被演唱会上的...

有了AI，课...

博斯：19轮...

当年最红的女...

新增蓝牙数字...

王诗龄放假回北京了，照片曝光很漂亮

北京一副局长骑电动车送外卖，“原以为骑手最关心社保政策，没想到他们张口就是‘别罚我款’”

卡西欧推出《回到未来》40周年联名计算器手表，包装盒形似磁带

“这条裙子”今年春天又火了！配这4双鞋减龄又好看

匿名“欢乐马”屠榜，国产视频模型批量崛起

美台讨论共同研发武器国防部回应

小鹏GX连续49道弯一把过挑战成功，低速最小0.6圈转向比

以色列的新常态：创伤、分裂与集体错觉

维持看涨！摩根大通预计金价明年底均价升至5055美元

2026年必追的四部谍战剧陈道明、于和伟领衔主演

中美欧大市场带动，全球车市1-9月销量涨5%

一口价15.99万起 2026款别克君越正式上市

广东，哪里“阳气”最旺？

尴尬的是最后输了，狄龙回喷骂自己垃圾的热火球迷：看看比分，f**k

曾成功应用于马斯克脑机接口临床实验！西门子医疗脑机接口全流程解决方案亮相

租电版本售15.79万乐道L60紫罗兰限定版上市

伊姐周日热推：电视剧《声渊》；电视剧《绝境通缉令》......

非法集资911亿元 “金融大鳄”盘继彪终审被判无期

赵本山的一双儿女，为所有人提了醒

消息称华为Mate 80单品激活150万，逆袭成年底国产旗舰第一

吊打内娱的阴湿女王，回来了

国内油价今年第七涨重返9元时代国际油价居高不下

智元精灵G2机器人正式发布，已获得数亿元订单

德云社董事长王惠凌晨发文，郭汾阳长大，触景生情