爆点资讯

这项由加州大学洛杉矶分校计算机科学系主导，联合微软亚洲研究院完成的研究，发表于2025年，目前处于同行评议阶段。有兴趣深入了解技术细节的读者可以通过arXiv:2603.29002v1查询完整论文。

当我们使用ChatGPT或其他大语言模型时，可能并不知道背后发生了什么。每当你输入一个长长的问题，或者上传一篇文档让AI分析时，计算机其实在进行着一场复杂的"记忆游戏"。研究团队发现，现在的AI系统就像一个拥有海量记忆但检索效率低下的图书馆，需要花费大量时间和电力来寻找相关信息。

现代大语言模型越来越强大，能处理的文本也越来越长。以最新的模型为例，它们能够一次性阅读和理解长达100万个词汇的文档，这相当于一本中等厚度的小说。然而，这种强大能力背后隐藏着巨大的计算成本。当模型处理这样的长文档时，需要消耗高达69GB的GPU内存，相当于一台高端游戏电脑的全部内存容量的数倍。

为了解决这个问题，研究人员开发了各种优化技术，比如稀疏注意力机制（只关注重要的部分内容）、检索增强生成（从外部数据库获取信息）和上下文记忆压缩（将信息压缩存储）。然而，这些技术看似各不相同，实际上

异构系统实现大模型推理加速与成本优化能力提升

米体：尤文愿...

71岁朱时茂...

Qwen3....

内塔尼亚胡遭...

频曝食安问题...

以色列继续袭...

美国抓走马杜罗计划曾外泄美媒收到计划后未公布

伊朗指责美以策划动乱哈梅内伊呼吁伊朗人民保持团结

涉水加强福特烈马亚马逊限量版上市售价39.98万

郑丽文赴美前表态：不当＂麻烦制造者＂不会拖美国下水

40岁宋仲基带老婆参加友人婚礼，被误认成徐帆

被指住宿环境差广东一高校回应：没那么夸张是误会

汤杯爆冷，14冠王印尼1-4不敌法国，队史首次止步小组赛

裙子专场|| 一周想穿7天，没想到它这么实用

卢浮宫抢劫案两嫌疑人均30多岁一人试图登机离境被抓

哥伦比亚挫败一起针对军方设施的未遂袭击

幂式“美拉德穿搭”太时髦了！显白又气质，谁穿谁好看！

俄外长称俄正与北约和欧洲处于“真正的战争”之中

贾国龙宣战失败，西贝亏损超6亿元，到底谁的责任？

AI闭环交易再引争议：OpenAI入股Thrive Holdings，或瞄准更多私募

【IT之家开箱】口袋中的完全体哈苏：OPPO 哈苏专业影像套装图赏

被问是否会刺杀伊朗新领袖特朗普突然＂共情＂了

腾讯元宝宣布“任务”功能上线：一句话安排时间，到点就提醒

波音圣路易斯地区罢工持续近三月，谈判陷入僵局

2025全球十大工程成就发布，DeepSeek、人形机器人等入选

台学者：台当局不办光复节活动人民无法接受

荣耀MagicOS 10升级设备数突破1000万力争春节前都能升

美股三大指数收盘齐创新高，英特尔涨超22%

2000多年楚王大墓被盗＂摸金校尉＂在村里租房3年寻墓

中国被指与伊朗接近达成超音速导弹采购协议外交部回应