关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者1948人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"民营船王"33亿元入主杉杉 继母长子内斗2年双双出局

都市快报橙柿互动 浏览 2254

柬埔寨提高获取公民身份投资门槛:至少需100万美元

红星新闻 浏览 18445

B股,最后的金矿?

36氪财经 浏览 931

李开复,在成都投了一家“0卡糖”

投中网 浏览 2225

10月25日车圈早报:赵长江发文离开比亚迪

车市红点 浏览 2109

千问App宣布投入30亿元启动春节活动,2月6日上线

大象新闻 浏览 781

2-4遭海牛逆转,国安追平队史中超主场单场丢球纪录

懂球帝 浏览 2014

奖金1.5万元,破赛事新纪录,张水华拿下2026年第一个冠军

数字财经智库 浏览 1181

珍珠专场|| 无论18岁还是80岁,总是会为它再一次心动

黎贝卡的异想世界 浏览 1120

2025长剧全网收视榜,《以法之名》跌至第10,第一播放量高达22亿

娱乐圈笔娱君 浏览 1113

特朗普"朋友"1.3亿美元捐款到账 还不够美军发1天工资

红星新闻 浏览 6492

《营救汪星人》成毅正在透支自己的观众缘

娱乐圈笔娱君 浏览 863

这样的“恶女”人设,真太爽了!

伊周潮流 浏览 1804

范雨林:实力硬汉却不红,娶普通人低调过日子

失宠的小野猪 浏览 1072

余承东展示鸿蒙智行门锁安全设计:安全是最大的豪华

三言科技 浏览 2215

长盘决胜!法国杯惊现44轮点球大战,贝蒂讷22-21取胜晋级

懂球帝 浏览 1629

墨西哥总统:骚乱平息 瓜达拉哈拉机场遭占领消息不实

都市快报橙柿互动 浏览 36927

伊姐周六热推:电视剧《小城大事》;电视剧《轧戏》......

伊周潮流 浏览 1115

豪华MPV的"新解法" 吉利银河V900上市26.98万起售

车评社Auto 浏览 883

木兰视野:在不确定中锚定长期价值,需要战略与定力

中国企业家杂志 浏览 1392

站在2025年底,小红书商业正跨过一个新门槛

36氪 浏览 1401
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1