爆点资讯

这项由香港科技大学广州校区xLeaF实验室团队完成的研究于2026年2月发表在预印本平台，论文编号为arXiv:2601.23000v1。研究团队提出了一种名为Mano的全新优化器，能够大幅提升大型语言模型的训练效率，同时显著降低计算成本和内存消耗。

训练大型语言模型就像是在教授一个拥有数千亿个参数的超级大脑学习语言，这个过程需要消耗巨额的计算资源和电力。现有的训练方法就好比让学生用最笨拙的方式学习数学——要么只看到局部信息而忽视整体结构，要么过度追求完美而丢失了重要细节。当前最流行的AdamW优化器就像一个只会逐个检查每道题目的老师，完全忽略了题目之间的内在联系和整体规律。而另一种叫做Muon的优化器虽然能够统一处理所有维度的信息，但在这个过程中却丢失了宝贵的曲率信息，就像为了保持答题速度一致而忽略了题目的难易程度。

研究团队从一个全新的角度来思考这个问题。他们发现，传统的流形优化方法虽然在数学理论上很优美，但在实际的大模型训练中表现很差，这让很多研究者对这类方法失去了信心。然而，港科大的研究团队没有放弃，而是创新性地改造了这些方法。

他们的核心洞察是这样的

港科大广州校区突破大模型训练瓶颈：让AI学习像数学考试高效

多家车企公布...

周年庆专场|...

德国财长访问...

限时19.6...

委内瑞拉外长...

伊朗民众：伊...

口碑爆棚，票房扑惨，最争议的大片来了

一瓶丝瓜水在拼多多卖出270万件！国货护肤品用十九年，写下不涨价的承诺

芯片圈“大佬”IPO梦碎，牵出千万受贿案！

靠创新药结束连续8年亏损局面，百济神州烧百亿研发终迎转机

你恐慌我贪婪！约500亿资金借道ETF蜂拥进场，主力机构正重金下注这些板块（附名单）

美媒：美国下水一艘新军舰中国已造好三艘差距惊人

【原声】阿韦洛亚，最后一个穆里尼奥主义者

俄大使：美袭击时委防空系统远程预警站通信出问题

户外品牌除了炸山就没有出路了吗？

吉林延边州珲春市发生5.5级地震震源深度560千米

媒体：特朗普提出中美＂G2＂概念日本不安拼命找存在感

德国15人“大军”突然撤离格陵兰原因公布

《大生意人》将至，陈晓出演一代商王，或可比肩《乔家大院》

将于东京车展首发全新丰田卡罗拉官图曝光

贝克汉姆长子在说谎？英国媒体爆料婚纱实情

美政府寻求查封数十艘与委内瑞拉有关联的油轮

男子夜钓遭枪击家属：4人当场逃跑伤者走回家后倒地

穆西亚拉评心目中年度蓝阵容：巴黎五人入选，队长选择凯恩

刘一诺承认跟檀健次恋爱过！称被司晓迪刺激才公开，檀健次刚否认

23分钟16+8轻松打卡：30岁李梦仍国产最强锋线被曝启动留洋计划

特斯拉涉嫌虚假宣传驾驶辅助，或被禁售30天

农妇收玉米时遇山体坍塌失联4天周边马路出现大坑

日本知名女星结婚：酷似高圆圆曾和林志玲老公交往

精致詹詹，美媒晒出詹姆斯更衣室座位边摆满护肤品的照片