关闭广告

用图片来存储记忆,AI助手可以更聪明地处理长对话了

科技行者2931人阅读


提到人工智能助手,你可能经常遇到一个烦人的问题:当对话越来越长时,AI似乎越来越健忘。为什么会这样呢?这不是因为AI变笨了,而是因为大语言模型有一个硬性限制——它们的"注意力窗口"就像一个大脑的工作记忆,容量是有限的。当信息堆积得太多时,重要的细节就开始模糊,AI开始犯错。

这项由美团、中国科学技术大学和新加坡国立大学的研究团队发表于2026年1月的突破性研究,提出了一个全新的解决方案。他们的论文《MemOCR:用于高效长视野推理的布局感知视觉记忆》(论文编号:arXiv:2601.21468v1)介绍了一种完全不同的思维方式——与其像记笔记一样用文字堆砌信息,不如用图片来存储记忆,让关键信息在视觉上更突出。听起来有点奇怪?不妨跟我一起深入理解这个聪明的创意。

想象一下,你正在做一个很长的采访记录。如果你用普通方式记笔记,你会列出所有信息:姓名、背景、关键观点、补充细节等等,每一条信息都占用同样的空间。但如果你用一个更聪明的方式,你会用大字号标题强调人名,用粗体突出关键观点,用小字体记录辅助信息,这样即使记录被压缩得很小,重要信息仍然清晰可辨。这正是MemOCR所做的事情。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日在野党提议自卫队改名国防军 中方回应

北京青年报-北京头条 浏览 4693

自曝落后25年!福特CEO称绝不会再错过中国,能兑现吗?

车宇世界 浏览 3524

豪华平权大6座SUV 风云T11预售19.99万元起

网易汽车 浏览 4239

9系大六座旗舰SUV又添一员 智己LS9预售33.69万起

网易汽车 浏览 3847

双11|| 今年我只想回购这些!

黎贝卡的异想世界 浏览 4090

马德里竞技,贝蒂斯国王杯四分之一决赛对手

绿茵情报局 浏览 3009

公司中标后县政府迟迟不签约 百万元前期投入"打水漂"

新京报 浏览 9116

法兰克福3-4柏林联合,伯克戴帽,伯卡特点射,瓦希送助攻

懂球帝 浏览 4827

《逐玉》注水风波升级!315评论区沦陷

萌神木木 浏览 2252

马卡:皇马目前没考虑施洛特贝克,弗里克很欣赏他但转会不易

懂球帝 浏览 3095

52岁影后自曝交往小20岁男友,二人曾被偶遇逛街

娱乐看阿敞 浏览 4183

河南一村委会欠债被判还钱 "村书记"连10+10都不会算

上游新闻 浏览 19730

邮报:未来几战将决定波特去留,他若下课西汉姆已在考虑比利奇

直播吧 浏览 4870

xbench实验室发布:如何让AI代理真正走进普通用户的日常生活?

科技行者 浏览 2872

国米取胜后距榜首1分,罗马如果能客胜米兰将独自领跑积分榜

懂球帝 浏览 3993

欧盟高官:美国对格陵兰岛的威胁“极其令人担忧”

国际在线 浏览 3100

小米智能门锁 4 Pro 双摄版发布,预售价 2464.15 元

IT之家 浏览 4181

最高法公开征求意见!“开门杀”保险赔偿不明确或成过去时

北京商报 浏览 3861

全球股市最强风口,彻底拦不住了?

财经锐眼 浏览 2904

马斯克称新款特斯拉Roadster是“超越汽车范畴的特殊产品”

IT之家 浏览 4966

机器人“农民”来了!智能“秒杀”杂草,不用一滴农药

上观新闻 浏览 2629
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1