关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2217人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《阿凡达3》一言难尽,好看不好吃,顶级特效盖不住影迷吐槽剧情

最爱酷影视 浏览 2782

这一次,窦骁和何超莲都救不了对方

娱乐圈笔娱君 浏览 3329

特朗普:将取消一些制裁 以平抑国际油价

环球网资讯 浏览 1597

女演员被前夫指责害死公公 本人称愿接受刑事立案调查

极目新闻 浏览 26974

吉利银河星耀6全球上市 限时置换价6.88万起

网易汽车 浏览 3303

特斯拉 FSD V14 Lite 将上线,老车主率先体验

三言科技 浏览 224

男子夜钓遭枪击 家属:4人当场逃跑 伤者走回家后倒地

封面新闻 浏览 9066

米体:尤文愿承担恩-内斯里400万欧年薪,奥托利尼已到土耳其

懂球帝 浏览 2340

盛放之日·春启颐和:满园春色“想开了”

时尚COSMO 浏览 209

原配打"小三"8年后再被刑拘 "第三者":下衣被扯掉裸露

中国新闻周刊 浏览 32125

英特尔CEO确认:18A工艺已进入大规模量产,为三代产品奠定基础

IT之家 浏览 3372

胜辽宁发布会!潘江赞对手,亲承张宁将缺席三周,迪亚洛总结不足

篮球资讯达人 浏览 2429

乌外长公布无人机从匈牙利进入路线 匈外长否认

环球网资讯 浏览 3975

商竣程击败阿古特排名重返TOP300,袁悦输球后笑容被指输也是赢

网球之家 浏览 2340

阿维塔第21万辆正式下线

三言科技 浏览 2806

小维阿:马赛的压力不让我意外,我在尤文效力过

懂球帝 浏览 3335

伊朗外长:战争结束取决于确保不再发生“侵略”

极目新闻 浏览 1410

美媒破大防:越南假想美国入侵 却不忌惮中国

澎湃新闻 浏览 4304

美乌柏林两日会谈后 特朗普、泽连斯基同日发声

环球时报国际 浏览 17744

伊土两国外长:地区国家应共同应对以色列侵略扩张

环球网资讯 浏览 2929

新疆98-56大胜送四川18连败,凯文-哈里斯19+7+3,纳托尔15分

懂球帝 浏览 2323
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1