关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2974人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新版《聊斋》杀青,六个单元主演全亮相,林允、宋祖儿倾力加盟

最爱酷影视 浏览 3942

粉色涂装 雷克萨斯Glam LX概念车发布

车质网 浏览 3201

未来四个月,汽车市场的目标增速-11.82%?

DearAuto 浏览 3958

新华鲜报|引导AI发展!网络安全法完成修改

新华社 浏览 3086

两部门:不得变相强制网络交易平台内经营者承担退款不退货等售后责任

YOUNG财经 浏览 2115

以色列又对加沙开火 内塔尼亚胡被指曾想请示特朗普

澎湃新闻 浏览 2950

有纯电/增程 极狐全新阿尔法T5预售12.38万起

网易汽车 浏览 3169

企业来出题!首届重庆市AI大模型创新应用大赛落幕

上游新闻 浏览 3179

五六十岁“穿衣见品味”!这4个搭配小技巧,比同龄人显气质

静儿时尚达人 浏览 5047

官方声明:王硕威不是福建舰总设计师

界面新闻 浏览 2909

以总理"碰瓷"中国 媒体:找错了对象更开错了药方

看看新闻Knews 浏览 14717

马斯克的Grok AI聊天机器人再现严重故障:混淆邦迪海滩枪击事件

IT之家 浏览 2453

邓超金鸡奖闹乌龙,苏有朋扯出吴奇隆

丁丁鲤史纪 浏览 2327

Pro or Ultra:消息称 iQOO 15 确定会有高配版,目前还在打磨中

IT之家 浏览 3119

中国观众认定的烂片,北美观众当成宝,首周末破4.3亿夺全球冠军

靠谱电影君 浏览 3242

17岁日乒一姐状态堪忧:亚锦赛再败苦主 近五战最远8强各种被逆转

颜小白的篮球梦 浏览 3261

以军空袭加沙警车致8名警察死亡

国际在线 浏览 1085

U20世界杯4强出炉

体坛周报 浏览 3230

有偶像包袱别演戏!《沉默的荣耀》于和伟干饭,打脸多少假吃演员

娱乐圈笔娱君 浏览 3174

美伊26日谈判在即 是否对伊朗动武:白宫先内讧了

每日经济新闻 浏览 1425

50岁蒋勤勤这状态绝了!新西兰海边生图似神女

阿握聊事 浏览 1088
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1