关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro1461人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

不计成本的超跑梦想:Ascari Ecosse的传奇往事

老爷车 浏览 2129

已婚已育三年,朴信惠真的老了好多

娱人细品 浏览 1628

轮圈选择丰富/金标开放选装 新一代SU7更多细节

网易汽车 浏览 1641

这张外卡不白拿,40岁瓦林卡逆转取胜,最后一届澳网完美开局

网球之家 浏览 1638

成本上升、缺芯、亚洲销量下滑,本田汽车全年利润预期下调 21%

IT之家 浏览 2585

蚂蚁集团开发的超级机器人大脑:让机器人像人一样学会做任何事

科技行者 浏览 1500

华为“二代”:孟晚舟与姚安娜,截然不同的路

清欢娱乐八卦 浏览 2082

看大疆做全景相机,不要只看两份报告

连线Insight 浏览 2473

佘诗曼四封视后、黄宗泽终结陪跑、李施嬅六度梦碎:TVB视帝视后,实力还是玄学?

仙女事件簿 浏览 1420

海昌智能IPO:“母子”共同“闯关”,重大关联交易或成拦路虎

览富财经网 浏览 1629

深夜,全线大跌!“超级风暴”突袭!

券商中国 浏览 1001

晚点独家丨大定突破今年4万产能上限,新ES8帮蔚来赢得更多机会

晚点LatePost 浏览 3558

国亮新材IPO:行业产能过剩、竞争对手强大,未来发展出路在哪里

览富财经网 浏览 2592

拆解助贷“六小强”三季报

北京商报 浏览 2222

格里马尔多:穆帅说我是超级球员?被最伟大教练之一夸很荣幸

懂球帝 浏览 2545

苹果新品上线

都市快报橙柿互动 浏览 940

假期4大变量共振 哪些是A股正向催化剂?

财联社 浏览 1058

中方回应是否放松稀土出口管制

财联社 浏览 12021

官方通报贵州习水食物中毒事件:学生89人住院

界面新闻 浏览 21349

吴子嘉问"上任后如何收拾民进党" 郑丽文回应

海峡导报社 浏览 8879

京沪高铁:一道复杂的算术题

锦缎研究院 浏览 1907
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1