关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者10人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以军夜间大规模空袭加沙城 坦克已入城

每日经济新闻 浏览 1104

请准备好钱!成都车展重磅豪华SUV都在这

车市红点 浏览 19824

奈飞联合创始人向慈善机构捐赠所持四成股权,价值超11亿美元

澎湃新闻 浏览 11971

佩洛西要FBI调查"亲俄分子" 被批"诽谤"和"妄想"

环球网资讯 浏览 12166

最终票房24亿?张艺谋《第二十条》逆袭,中国大导演的荣光回来了

肥罗大电影 浏览 12073

对话全国政协委员、360集团创始人周鸿祎:理解“人工智能+”

经济观察报 浏览 11864

吴尊打篮球鼻梁受伤流血,在线求助自曝伤口很深

叶公子 浏览 14107

夏季衬衫如何穿出高级感?记住这三个技巧就够了

虎哥说衣不二 浏览 18554

房贷利率率先跳水 美国楼市或迎来新一轮上行周期

火星宏观 浏览 12507

又一位难得的好演员,突然走了

独立鱼 浏览 258

手机行业的上半年:卷不动了,家家开始挤牙膏

钛媒体APP 浏览 14798

福特烈马最强对手:坦克330下月上市,搭载3.0T双涡轮发动机

车快评 浏览 12000

39岁郭碧婷复出 胖一大圈越来越像向太

叶公子 浏览 14010

俄国防部称缴获2辆德制"豹2A6" 媒体:普京笑了

直新闻 浏览 16010

百花奖被骂上热搜!网友爆笑吐槽提名:张译调剂了,王宝强转专业

萌神木木 浏览 10239

罗永浩还了4个亿是真的吗?他还要拍一部纪录片叫真还传

趣看热点 浏览 25699

AI,人类历史上最后一次科技革命?你准备好“上桌”了吗

北京商报 浏览 478

登贝莱:踢什么位置教练说了算,我很喜欢中锋位置

懂球帝 浏览 914

关系藏不住了?小S二女儿被曝恋情

小梊搞笑解说 浏览 527

日本主妇真会穿!衬衫T恤也能穿得洋气

八分搭配 浏览 15595

业界呼吁取消绿牌,“北京免摇号、上海可省十万”将成历史?

时代财经 浏览 17662
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1