关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro3394人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普公布马杜罗被捕后照片

界面新闻 浏览 3199

深圳00后600多万在港抄底买房 内地客十年砸下8000亿

南方都市报 浏览 16903

媒体披露:U23国足主帅禁止球员在驻地点外卖

环球网资讯 浏览 20747

全面大撤离!李嘉诚英国“套现”2000亿

创业家 浏览 1336

抗癌不到一年,刘谦近况曝光,憔悴到认不出

乡野小珥 浏览 3428

秋冬别穿阔腿裤了!裙子才是粗腿女孩的救星!

Yuki女人故事 浏览 4128

辽宁2将打强队太吃力!王岚嵚组织与得分全垮,付豪进攻失灵了!

篮球资讯达人 浏览 3592

杨颖素颜现身小海绵学校,被赞最美妈妈

科学发掘 浏览 797

蚂蚁集团开发的超级机器人大脑:让机器人像人一样学会做任何事

科技行者 浏览 3404

纯电续航可达700km AMG GLC 53 EQ谍照曝光

车质网 浏览 3581

E句话|李雨桐又来锤薛之谦了?

仙女事件簿 浏览 2906

纯电续航325km 小鹏P7+增程版申报信息曝光

车质网 浏览 4435

剑南春丨曼联客场2-2热刺,德利赫特读秒绝平,姆伯莫建功

懂球帝 浏览 4468

巴菲特被曝已清仓比亚迪,持股期间比亚迪股价涨超38倍

澎湃新闻 浏览 5168

统治力!罗诗芳卫冕全运会女子举重59公斤级金牌!

体坛周报 浏览 4364

邵佳一:我们应该配得上三分,在休息室里我祝贺了队员们

懂球帝 浏览 4607

朝鲜晚上举行盛大阅兵式 现场画面披露

央视新闻客户端 浏览 3547

31省份去年人口出生率数据公布:哪些省份生娃多?

第一财经资讯 浏览 4648

黄晓明刚带娃去过,Angelababy后脚也来了?

今古深日报 浏览 1396

库克交棒,特努斯接掌 4 万亿帝国:AI 时代的真正大考才刚开始

钛媒体APP 浏览 1733

被家暴16次女子得70%共同财产及10万赔偿 共140万余元

极目新闻 浏览 9798
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1