关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2992人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国又一个伙伴倒向美国 撕毁合同把矛头对准中方

博览历史 浏览 13527

杨振宁逝世享年103岁 清华大学沉痛悼念

北京青年报 浏览 4335

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者 浏览 3294

贵妇集体爱上当主持?为什么名媛访谈频频“翻车”

仙女事件簿 浏览 3163

马卡:赫伊森在高强度比赛中表现糟糕,他需要提升防守硬度

懂球帝 浏览 4004

山西多地连续阴雨致农作物发霉 当地要求"抢收抢种"

极目新闻 浏览 4463

刘浩存:明媚中绽放

时尚COSMO 浏览 1150

上市后要“去创始人化”?林清轩孙来春:企业要进入“战略利润”时代

中国商报 浏览 3256

新增1.2T发动机 新款Tata Punch官图发布

车质网 浏览 3148

1.78万亿宁德时代牵手“张雪”,造出电摩给谁骑?

野马财经 浏览 1667

储能内卷的标准样本:黑马果下科技,究竟是如何速成的?

赶碳号 浏览 3260

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

天天汽车 浏览 3040

理财的,注意这两个风险!

米筐投资 浏览 3454

AI大模型"减肥"新突破:MWS AI团队让语言模型变小却更聪明

科技行者 浏览 4311

“廓形穿衣法”太火了!掌握这5个法则让你美一整个冬天

LinkFashion 浏览 3242

让多图对话AI不再"搞混":首尔多所大学发现分隔符背后的秘密

科技行者 浏览 2870

美方在公海海域扣押悬挂俄罗斯国旗的油轮 外交部回应

澎湃新闻 浏览 14063

人类史上最贵打工合同,马斯克万亿薪酬方案获批!

汽车公社 浏览 3890

独行侠内线再多也不够?浓眉小腿拉伤至少缺阵两场

体坛周报 浏览 4100

蚂蚁集团开发的超级机器人大脑:让机器人像人一样学会做任何事

科技行者 浏览 3028

海来阿木凭《嘉禾望岗》爆火 新歌播放量10亿

科学发掘 浏览 3025
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1