关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro9人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高合汽车宣布停工停产6个月 曾宣布1月薪水缓发

太平洋汽车 浏览 13108

日本加息,“可怕”的逻辑拆解

郎club 浏览 15474

陈梦圆满“复仇”!携王曼昱晋级女双半决赛,静待阵钱天一陈幸同

乒谈 浏览 13437

2026款比亚迪海豹05 DM-i上市 售价7.98万元

车质网 浏览 1581

荷媒:德容在国家德比中受伤,他将退出本期荷兰队&伤缺两周

直播吧 浏览 19933

30个项目脱颖而出!大赛让AI与实体经济深度“握手”

上游新闻 浏览 1434

今日热点:曾艳芬提醒丝芭传媒有聊天记录;边伯贤恶评者被罚款……

伊周潮流 浏览 784

董璇,她的危机才刚刚开始

我是愈姑娘 浏览 17470

61岁吴宗宪宣布即将退出娱乐圈,留下9亿财产给3个女儿不给儿子

素素娱乐 浏览 13647

千人来珠峰"逛公园" 有人冻到绝望:以为要永远留在这

新京报 浏览 17412

减持小鹏,套现28亿,阿里继续“瘦身”?

侃见财经 浏览 13646

年仅46岁!“量子通信第一股”董事长在办公室去世,5月才上任

财通社 浏览 821

AI+消费电子硬核“出圈”,华强北亮相CEIC 2025

南方都市报 浏览 1391

时隔一年重要大会在东南沿海大省举办 出现新变化

政知新媒体 浏览 7540

流行了100年的CP?大衣+阔腿裤,不过时的高级

LinkFashion 浏览 151

伯利再挖布莱顿,邮报:前布莱顿技术总监威尔加盟斯特拉斯堡

懂球帝 浏览 1390

李昀锐孟子义被曝恋情,却双双否认

霁月文娱阁 浏览 1554

看到张译“游泳”一幕后,这片升华了

皮皮电影 浏览 13722

谣言热榜 | 六月朋友圈十大谣言新鲜出炉

中国基金报 浏览 11425

张丹峰洪欣合体逛内衣店秀恩爱 目的是直播带货

传媒一班 浏览 15948

险企投资收益波动加大 业绩分化利润水平提升

证券市场周刊 浏览 1698
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1