关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro1091人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"兔子警官"入围最美浙警 曾因执勤视频在网络上走红

环球网资讯 浏览 12670

飞行员举报情人诈骗700余万 被告人获刑12年

红星新闻 浏览 5108

助力AI全民创作 万兴科技(300624.SZ)旗下万兴天幕创作广场推出“视频教程共创激励计划”

智通财经 浏览 3027

北京105-74终结广东8连胜,曾凡博回归18分,徐杰伤退,萨姆纳35分

懂球帝 浏览 1542

Veritas67-62科罗拉多预科,张博源砍26分+6记三分率队取胜

懂球帝 浏览 1671

邮报:未来几战将决定波特去留,他若下课西汉姆已在考虑比利奇

直播吧 浏览 3222

苹果新品上线

都市快报橙柿互动 浏览 485

这才是50岁女人该有的冬季穿搭,既保暖又体面,想不优雅都难

静儿时尚达人 浏览 1635

娜扎被抢休息室,网友扒出疑似林允

萌神木木 浏览 2476

坦克300Hi-T宁德时代版上市 售24.98万

车质网 浏览 1547

Thinking Machines人事风波全复盘:冲刺500亿美元估值添变数

DeepTech深科技 浏览 1217

6名中国男子日本滑雪被困获救 救援费为每人100万日元

极目新闻 浏览 5451

宗馥莉“被带走”?谣言背后,一个内讧的娃哈哈

大猫财经Pro 浏览 2184

欧盟同意无限期冻结俄央行在欧洲资产

大象新闻 浏览 1636

俄乌“和平计划”又生变 欧洲“强有力”回应特朗普批评

环球网资讯 浏览 1791

《向往》口碑翻车!官方以嘉宾清闲为豪?

萌神木木 浏览 2509

半两财经|首款eSIM手机发售 国内运营商加速“无卡化”

北青网-北京青年报 浏览 2295

特朗普:芝加哥市长和伊利诺伊州州长都该入狱

新华社 浏览 17665

名记:穆阿尼将继续留在热刺,尤文今夏将再次尝试引进他

懂球帝 浏览 1053

美伊本周有望在土耳其开谈 伊朗或在核问题上松口

上观新闻 浏览 3713

【亚冠精英】阿苏埃头球路易斯建功 申花2比0首尔

体坛周报 浏览 2375
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1