关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者3871人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

加冕荷兰射手王+助攻王!德佩:又一破纪录时刻,而且远未结束

懂球帝 浏览 4088

华为,车企通向“百万级”的捷径?

道哥说车 浏览 3259

美澳签85亿矿产大单 特朗普对澳大使说"我不喜欢你"

红星新闻 浏览 8580

大S纪念雕像揭幕时间曝光 具俊晔小S揭开黑色帆布

扒虾侃娱 浏览 2848

准美术生持枪闯海湖庄园被击毙:来自特朗普铁粉家庭

新民周刊 浏览 38635

AI眼镜厂商,正在集体拒交“智商税”

钛媒体APP 浏览 3459

清华大学等多所顶尖院校联手揭秘智能数据准备革命

科技行者 浏览 2827

8亿买入5%股份!四川国资战略入股湖南百亿锂电龙头,标的前三季度净利大增118.85%

红星资本局 浏览 4011

奔驰A级车延至2028年,新车型同步推进

MOTO 浏览 4748

赖清德声称打造所谓"台湾之盾"防空系统 国台办回应

界面新闻 浏览 4139

“亚洲巴菲特”,大手笔押注黄金

财通社 浏览 2925

乐道汽车全年累计交付破10万台 成交均价升至25万+

网易汽车 浏览 3314

钱天一国乒第1美女,见男友家长好事将近

二疯说球 浏览 3423

本田东京车展亮相0系列电动概念车 揭示未来出行

网易汽车 浏览 3891

官方:马来西亚裁判组将执法成都客战首尔,纳西鲁丁担任主裁

懂球帝 浏览 3925

中科院理化所:在自融合液态金属变形机制方面取得新进展

IT之家 浏览 2982

香港火灾已致超40人遇难 3名工程负责人涉"误杀"被捕

界面新闻 浏览 28993

销售渠道改为“单城单店”模式?丰田中国:仅少数地区试点|早报

汽车服务世界 浏览 3907

女人会不会打扮很重要!配色不老气、穿衣不拖沓,耐看又大方

静儿时尚达人 浏览 1380

以色列民众反对进攻加沙 民意与政府撕裂加剧

海外网 浏览 4687

拉莫斯:可以接受战平浙江队的结果,球队走在正确的道路上

懂球帝 浏览 3968
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1