关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者1742人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

温州85后接棒,百亿企业大“换血”

中国企业家杂志 浏览 1671

OpenAI与亚马逊签署380亿美元算力采购协议,减少对微软依赖

IT之家 浏览 1732

最强充电宝国标将至,英集芯推出蓝牙智能方案引领行业升级

时代周报 浏览 1371

限时补贴价28.99万起 2026款传祺向往M8上市

网易汽车 浏览 897

优质IPO企业站上资本C位

北京商报 浏览 1215

迈瑞医疗市值跌了三千亿,第三次上市,74岁李西廷越来越忙

懂财帝 浏览 2016

进行大量体能训练恢复,博格巴:我好像签约了马拉松俱乐部

懂球帝 浏览 2502

湖人惨败尼克斯!双核轰52分喜忧参半,艾顿无球权,防守真拉胯!

篮球资讯达人 浏览 572

推广中奖名单-更新至2025年9月30日推广

黎贝卡的异想世界 浏览 1979

续航或超800km?后驱长续航版特斯拉Model Y现身工信部目录

Nice好车 浏览 2124

芬兰总统谈俄乌停火:美国“有利可图”

上观新闻 浏览 1365

美国驻冰岛大使候选人:冰岛或成为美国"第52个州"

环球网资讯 浏览 11465

苹果计划为 iPad Pro 引入 iPhone 17 Pro 的均热板散热

威锋网 浏览 1791

格拉斯纳:期待与埃泽的碰面,但在比赛中我们只会全力争胜

懂球帝 浏览 1850

迪士尼将对OpenAI进行10亿美元股权投资

第一财经资讯 浏览 1098

今年第三次!53万的理想MEGA烧了,奶爸:不敢想象

说财猫 浏览 1832

豪华MPV的"新解法" 吉利银河V900上市26.98万起售

车评社Auto 浏览 679

三种动力配置 星光560将于1月15日上市

网易汽车 浏览 828

一周AI大事:谷歌Gemini学会“接管”你的电脑、马斯克机器人被手卡住了

网易科技报道 浏览 2033

强一股份IPO:始终稳居首位的大客户,未来是否还能带来丰厚利润

览富财经网 浏览 1641

媒体:美军武器靠拆零件续命 对美国或是一种致命伤

新民周刊 浏览 7483
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1