关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro1073人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

携程迎来监管风暴

华尔街见闻官方 浏览 1295

网红嘴哥捐款10万元驰援李亚鹏

娱慧 浏览 1319

车贷“高息高返”被叫停后:提前还贷需排队,有银行违约金比例最高达15%

时代周报 浏览 2275

提升冬日幸福感的8件小事,放松又治愈

LinkFashion 浏览 2004

专家:特朗普对中国无牌可打了 没想到蠢到打起波音牌

澎湃新闻 浏览 2443

云南外援奥斯卡连续七场联赛参与进球,刷新个人中超最长纪录

懂球帝 浏览 2244

九旬李明启谈到容嬷嬷为自己发声

蜜桔娱乐 浏览 2220

吴佩慈发大S照片悼念:我失去的岂止是一个好朋友

素素娱乐 浏览 1022

媒体:高市内阁就"雷达照射"贼喊捉贼 遭批国家的耻辱

新民晚报 浏览 18717

飞天茅台批价首次跌破1700元,机构称“白酒需求仍在磨底阶段”

YOUNG财经 浏览 2316

浙江大学最新突破:AI换脸技术迎来电影级质量革命

科技行者 浏览 1463

市场关键时点前夕,伦敦金属交易所交易一度中断两小时,铝锌等金属受影响

华尔街见闻官方 浏览 127

进行大量体能训练恢复,博格巴:我好像签约了马拉松俱乐部

懂球帝 浏览 2937

邵佳一:我们应该配得上三分,在休息室里我祝贺了队员们

懂球帝 浏览 2378

赵丽颖坦白自己近期“消失”的原因

湘村大余 浏览 2301

英超前六相互交锋积分榜:曼联、维拉积12分最多,阿森纳9分

懂球帝 浏览 1216

申万宏源:牛市1.0高点看26年春季 关注储能、存储、创新药与国防军工

智通财经 浏览 2110

东体:申花充分利用体能优势,亚冠失利对蓉城士气的打击或许更大

直播吧 浏览 3158

三只松鼠3个月两次调价,部分坚果礼拟从明日起出厂价上涨

红星资本局 浏览 1287

赵本山:从家喻户晓到一夜消失

脑洞乌托邦小乌 浏览 1796

网络安全AI说丨警惕U盘里的“不速之客”

海外网 浏览 2771
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1