关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者3941人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

萨顿:枪手踢得很不错,失利会让他们变得更加强大

懂球帝 浏览 1235

57岁具俊晔又瘦了很多,背影憔悴走路不稳

素素娱乐 浏览 1247

净利润减少超50%,珍酒李渡能靠“大珍”走出低谷吗?

征探财经 浏览 2402

"韩国顶流"被追缴200亿韩元税款:至少赚了1000亿韩元

新民周刊 浏览 4230

春节互联网大厂红包大战背后是AI流量密码?

BT财经 浏览 2811

蔡卓妍老公露面回应会努力赚钱养家,微笑默认生孩子计划

素素娱乐 浏览 1043

首发搭Momenta最强模型 上汽大众ID.ERA 9X突围9系红海

上海汽车报 浏览 2116

何小鹏:中美自动驾驶同处第一梯队;好未来发布AI智能体“九章龙虾”|早资道

封面新闻 浏览 2090

最有种的女明星

江湖人称艾掌门 浏览 3901

影视大佬吴敦离世,贾静雯林志颖发文悼念

素素娱乐 浏览 2864

果然,51岁钟汉良还是赢了

温柔娱公子 浏览 2723

采用SSP全新平台 新款奥迪A4最新消息曝光

乐选爱车 浏览 4298

40余名高二学生被强收7500元网课费 两地教育局调查

大风新闻 浏览 17472

全新旗舰SUV 蔚来ES9将于第二季度正式上市

车质网 浏览 3051

足球报:海牛资金有困难,但追加奖金第一时间就发到球队手中

懂球帝 浏览 3933

蔚来年底盈利:超越短期目标,重塑自己的竞争力

百姓评车 浏览 4197

内德维德:我一直很喜欢加斯佩里尼,罗马有这样的教练是幸运

懂球帝 浏览 4098

“官僚主义”缠身的亚马逊,开始被多面夹击

虎嗅APP 浏览 3751

马特塔:对阵佛罗伦萨首次首发,品尝错失的意甲滋味

绿茵情报局 浏览 1537

特朗普又想打电话调停泰柬冲突 泰方强硬表态

澎湃新闻 浏览 8279

太二不做酸菜鱼了?告别酸菜鱼的太二想干啥?

江瀚视野 浏览 3079
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1