关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2719人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

四部门召开动力及储能电池行业企业座谈会:规范价格竞争

界面新闻 浏览 41

恩佐:对凯塞多只有钦佩之情,能在切尔西和他并肩作战很开心

懂球帝 浏览 2684

老派,但是好看

电影最TOP 浏览 1658

高盛暂停为与芝商所事故相关的数据中心公司发售债券

华尔街见闻官方 浏览 2281

曝尊界明年将推6款新车 超豪汽车市场要变天了?

正在说车 浏览 1875

媒体:中国元首时隔11年再次访韩 在韩国引发很大反响

新民周刊 浏览 13531

司晓迪隐藏聊天记录牵扯背后产业链!上不了热搜,一深扒就删帖

萌神木木 浏览 1986

美国同意提供安全保障 美乌“和平计划”将提交俄方

环球网资讯 浏览 2208

这谁能想到!能伸手“救”日产汽车一把的,会是比亚迪

小李车评李建红 浏览 2805

比亚迪唐9系旗舰SUV测试 要从BBA嘴里"抢肉吃"?

车矩阵更懂车 浏览 1741

雷克萨斯,凭什么2025还能逆势增长?

汽车人传媒 浏览 1813

伊利诺伊大学香槟分校打造AI助手:让机器像人一样记住你的偏好

科技行者 浏览 1869

镁信健康将亮相第八届进博会,发布三大产业级AI应用方案|进距离

上观新闻 浏览 2757

李梦系穿搭,就这么养成了

时尚COSMO 浏览 1532

希门尼斯:我们踢了一场好比赛;希望勒诺尔芒能尽快回归

懂球帝 浏览 2788

一文读懂索提诺比率(附索提诺比率选出的牛基--普通股票型)

一地基毛 浏览 2841

车企“灵魂论”彻底“失声”?

盖世汽车 浏览 3496

CBA第22轮最佳阵容:段昂君8三分首次客胜北京 四字新星生涯之战

醉卧浮生 浏览 1642

申万宏源:2025年科技牛只是小菜,2026年下半年将迎来全面牛

金石随笔 浏览 2582

这届大美人,怎么入冬撞衫率100%

时尚COSMO 浏览 2305

流行了100年的CP?大衣+阔腿裤,不过时的高级

LinkFashion 浏览 1685
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1