关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2848人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿维塔第21万辆正式下线

三言科技 浏览 3316

长城魏牌9年8换CEO,哈弗总经理赵永坡接任冯复之

红星资本局 浏览 3424

泽连斯基称乌方已妥协不加入北约 俄方发声

每日经济新闻 浏览 9108

湖人想要维金斯补充侧翼防守 八村垒+1个首轮签热火能同意吗?

仰卧撑FTUer 浏览 3326

绝望的日本车:搞新能源押错了宝,随时有可能被国产车一波推

小李车评李建红 浏览 3378

周杰伦蹭霉霉热度翻车!又被质疑崇洋媚外,近些年口碑越来越差

萌神木木 浏览 4074

霍英东体育基金会晚宴,多位奥运冠军现身,霍家更知郭晶晶的份量

不八卦会死星人 浏览 3428

多地突然取消!小地方,不配办马拉松了?

西部城市 浏览 3926

极狐乔心昱:北汽新能源行业首个实现L3-L4自动驾驶技术全覆盖

IT之家 浏览 3069

秋天穿衣真的很简单,看看这些造型就有灵感,舒适简约又自然

静儿时尚达人 浏览 3910

内娱女明星手撕导演,翻车了?

独立鱼 浏览 3085

Veritas67-62科罗拉多预科,张博源砍26分+6记三分率队取胜

懂球帝 浏览 3398

特朗普称实时观看马杜罗被捕 行动部署“数量庞大”空中力量

新京报 浏览 3155

满配华为全家桶 岚图追光L将上市

网易汽车 浏览 3563

从一秒起身的机器人到降本80%的数据,鹿明机器人破解具身机器人智能化困境

雷峰网 浏览 3168

今年流行的“新老钱风”,优雅又时髦,太适合春天了!

LinkFashion 浏览 2379

E句话| 邢菲为违反交通规则道歉了?

仙女事件簿 浏览 3271

华语乐坛,困在怀旧里

虎嗅APP 浏览 3381

美媒称马杜罗请求普京提供导弹等援助 佩斯科夫回应

环球时报国际 浏览 9754

李湘减肥成功,和女儿王诗龄一起回小区被偶遇,目测瘦了50斤!

娱乐团长 浏览 1259

baby相隔17年同角度怼脸拍!全脸变化肉眼可见

萌神木木 浏览 2391
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1