关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro1092人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女友BELLA+封面 | SUPER JUNIOR银赫:二十年初心的破茧之旅

伊周潮流 浏览 3844

AI浪潮已至,重磅嘉宾云集,乌镇再启新汽车之问

AutoBusiness 浏览 2177

特朗普签署2026财年国防授权法案

财联社 浏览 1637

过时的拍照姿势,毁了多少普通女孩?

Yuki女人故事 浏览 3831

告别羽毛球自由,中产迷上匹克球

虎嗅APP 浏览 2476

俄大使:马杜罗夫妇被控制时身边没人

扬子晚报 浏览 1298

港媒曝光何超莲家中资产分配,签不签婚前协议,窦骁都捞不到好处

萌神木木 浏览 2327

天才少年姚顺雨入职腾讯后首次公开发声

21世纪经济报道 浏览 1387

抖音:卖茅台低于市场行情价将被处罚

第一财经资讯 浏览 2191

今年春天一定要拥有的4件衣服,太好看了!

LinkFashion 浏览 447

别小看这几小事,坚持到过年那状态得有多好啊?

黎贝卡的异想世界 浏览 1273

进苏超决赛,泰州主帅:队伍分工明确,三个臭皮匠顶个诸葛亮

懂球帝 浏览 2299

OpenAI更新ChatGPT使用政策,禁止提供专业医疗、法律和财务建议

IT之家 浏览 2133

卷首语 | 在动物园散步才是正经事

时尚COSMO 浏览 3993

送别聂卫平队伍长度超200米 韩国围棋名宿前来吊唁

极目新闻 浏览 5429

50岁女子当入殓师:有家属为抢房产要掀棺抬老人遗体

新京报 浏览 5436

杉杉集团重整突生变数,“民营船王”695亿资本局悬了?

野马财经 浏览 2247

全国人大代表梁伟:用AI打通中国芯片弯道超车的 “任督二脉” | 代表在这里

封面新闻 浏览 322

靳东这波转型,真是让人佩服得五体投地。

小光侃娱乐 浏览 3099

楊千嬅开live老公乱入因一事说离婚

粤睇先生 浏览 1665

AI设计出可杀灭细菌的功能性病毒,专家呼吁谨慎推进

IT之家 浏览 3278
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1