关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者3942人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

超离谱判罚!米内罗进球被吹,马纳法染黄,媒体人:亚冠意义何在

奥拜尔 浏览 3870

国家禁止亏本卖车,价格战就能不打了?

汽车公社 浏览 3147

双电机还不够?三电机都来了 新款阿维塔12申报图曝光

网易汽车 浏览 3148

赖清德被迫取消窜访斯威士兰 更多细节披露

澎湃新闻 浏览 34814

安以恩:邦本宜裕是很“高级”的球员,我们能秒懂彼此的意图

懂球帝 浏览 3657

给央视《小城大事》演技最好10位演员排名,赵丽颖第5,第1无争议

皮皮电影 浏览 3015

Robotaxi发生伤人事故 哈啰出行自动驾驶业务暂停运营

界面新闻 浏览 21222

邮报:纽卡中卫丹-伯恩遭遇肺穿孔和肋骨骨折,将缺阵六周

懂球帝 浏览 3398

泰国达叻府5县实施宵禁

新京报 浏览 3397

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者 浏览 3943

长盘决胜!法国杯惊现44轮点球大战,贝蒂讷22-21取胜晋级

懂球帝 浏览 3664

南部战区:正告菲方停止在南海挑起事端

北京日报客户端 浏览 4933

马斯克暗示 SpaceX明年IPO?

北京商报 浏览 3460

阿斯:皇马想延续阿拉巴和吕迪格的成功,以免签的方式签中卫

懂球帝 浏览 2828

李在明告诉CNN:不能将中国拒之门外

环球网资讯 浏览 7159

崔东树:2025年全国汽车市场总体走势较强 新能源商用车景气度走高

智通财经 浏览 3440

未来智能完成亿元级A轮融资,蚂蚁集团领投、启明创投超额跟投

雷科技 浏览 4194

响应“人工智能+”国家行动,方舟健客(06086)“杏捷大模型”通过国家备案,为AI+慢病管理注入新动能

智通财经 浏览 3789

被曲解的雷军:“安全至上”与“好看第一”并不冲突

虎嗅APP 浏览 3612

格列兹曼:媒体曾报道梅西对我不满,但比赛中他主动让点给我

懂球帝 浏览 4219

亏损超10.6亿,中美观众差评出奇一致,好莱坞年度票房惨案来了

靠谱电影君 浏览 4014
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1