关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2967人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《风林火山》亏了4.2亿,古天乐终于拿出这部藏了6年的动作大片

靠谱电影君 浏览 3141

女人过了60岁打扮要得体!看这些穿搭就有灵感,简约不老气

静儿时尚达人 浏览 3131

奔驰A级车延至2028年,新车型同步推进

MOTO 浏览 3796

六氟磷酸锂“带飞”氟化工,衢州启动“中国氟谷”的底气在哪里?

时代周报 浏览 2872

埃弗顿vs富勒姆:格拉利什、皮克福德首发,劳尔-希门尼斯、莱诺出战

懂球帝 浏览 2942

把孩子气的!某新能源车一配置被小学生投诉,车企一本正经回应了

小李车评李建红 浏览 1200

L90 产品故事:放下理想主义执念,接受必要的 “庸俗”

晚点LatePost 浏览 2235

寻找隐形冠军|意想不到的它

海外网 浏览 1993

莱巴带伤轰16ACE击败张帅,新赛季目标再夺大满贯,小商取开门红

网球之家 浏览 2258

特朗普签行政令征收25%新关税 加密货币超24万人爆仓

每日经济新闻 浏览 8299

控股股东拟出让超1亿股!川股德龙汇能筹划控制权变更 今年股价涨幅近60%

红星资本局 浏览 3186

“恐怖电影成真” 美国男子盗窃人骨公开售卖

澎湃新闻 浏览 7369

张馨予晒妈妈织的围巾!被称呼为宝宝好幸福

阿雹娱乐 浏览 1741

遭拒绝后,派拉蒙仍坚持以30美元/股收购华纳兄弟

财闻 浏览 2103

孙越没想到,岳云鹏竟因一个动作口碑逆转

无处不风景love 浏览 2127

女友BELLA+封面 | SUPER JUNIOR-D&E 双子星的友情叙事诗

伊周潮流 浏览 4820

输深圳采访!杨鸣满意表现,苦恼调整空间不大,谈下场给小将机会

篮球资讯达人 浏览 2059

29.2万辆!难怪比亚迪9月跟“疯了”一样,原来是给这几天憋大招

小李车评李建红 浏览 3292

细节调整 新款享界S9纯电版申报图曝光

车质网 浏览 3299

特朗普或为中国制造三大机遇,中国如何利用?

浏览 25771

特朗普向60国发出邀请之际 多国正商量怎么对付美国

新民周刊 浏览 6451
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1