关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者1572人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

执法过严?拓王之战首节裁判合计吹罚21次犯规并出现31次罚球

懂球帝 浏览 1831

理想亏6亿终结11季度盈利纪录,李想卖旧手机重回苦日子?

BT财经 浏览 1200

万科的“至暗时刻”

翠鸟资本 浏览 1733

带病出战,李昊发着烧踢满了U23国足与泰国U23的比赛

懂球帝 浏览 603

突发!一辆理想MEGA行驶中起火爆燃!

电动知家 浏览 1752

在韩国创特斯拉最低价 "廉价版"特斯拉亚洲开售

电动知家 浏览 495

9系大六座旗舰SUV又添一员 智己LS9预售33.69万起

网易汽车 浏览 1525

苏丹快速支援部队宣布同意实行人道主义停火

国际在线 浏览 1530

E句话|工作室宣布向涵之单身?

仙女事件簿 浏览 653

“China Shopping”热展现中国制造全球吸引力

环球网资讯 浏览 1929

曝白百何资源受影响!好友还在嘴硬,多位业内下场内涵:太任性了

萌神木木 浏览 1475

配华为舱内激光视觉技术 华境S明年上半年上市

网易汽车 浏览 667

牛弹琴:中国的强烈愤怒还在继续 日本有三个没想到

北京日报客户端 浏览 42080

CBA常规赛第一阶段排名:广厦第一,上海第二,四川23连败垫底

懂球帝 浏览 366

赵震:中国青训最需要解决的是体系问题,应坚持搞校园足球

懂球帝 浏览 864

郑丽文当选提三大原则 称绝不让台湾成为"麻烦制造者"

海峡导报社 浏览 5151

李平康:国安在谈一名东欧外教,其人在北京&还是以前的渠道

懂球帝 浏览 1587

徐峥这一出手,若不出意外,这部耗资7亿的大片估计得“封神”

娱乐圈笔娱君 浏览 319

这件衣服今年太火了!时髦女人都在穿

LinkFashion 浏览 1667

动力系统升级 新款方程豹豹5谍照曝光

车质网 浏览 2604

伊能静儿子逛成都,恩利吃美食被辣出表情包

疯说时尚 浏览 1720
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1