关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2910人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普拿中俄当幌子被北欧官员拆穿:完全不属实

上观新闻 浏览 2117

以军称袭击黎巴嫩真主党多个军事目标

极目新闻 浏览 2714

雪道已开,Ski-Core正在接管这个冬天

时尚COSMO 浏览 2432

曼奇尼自曝若阿莫林下课其可执教曼联!失业一年,在法国遇到拉爵

罗米的曼联博客 浏览 3191

《双轨》空降逻辑混乱,赛车泰拳伪骨科叠加,虞书欣演技难撑人设

不八卦会死星人 浏览 2460

唐嫣客串新剧遭群嘲!戴假发被吐槽像女装大佬,疑和马思纯抢番位

萌神木木 浏览 2295

内讧了,郭昊文&赵柏清刚开场就激情对喷,随后双双被DNP

懂球帝 浏览 1068

遭拒绝后,派拉蒙仍坚持以30美元/股收购华纳兄弟

财闻 浏览 2106

乔治亚理工和微软团队重磅推出:让AI推理更聪明的"思维开关"技术

科技行者 浏览 3034

内维尔:姆伯莫的射门相当离谱且草率,他需要改进临门一脚

懂球帝 浏览 2468

湖南慈利通报“网友反映因瓶装液化气销售价格引发矛盾、广告牌被损毁”:相关部门已介入调查

环球网资讯 浏览 3324

伊朗船只逼近美航母 美连开数炮全打空

每日经济新闻 浏览 1056

王一博风波升级!吐槽肖战等十几位明星

阿废冷眼观察所 浏览 1355

一个手机壳卖200,这家深圳公司靠什么掏空老外钱包?

花朵财经 浏览 1968

方永飞怼雷军,“行业不敢说的话全被他讲透了”

车轱辘话V 浏览 2371

东方财富实控人其实的妻子和父亲近期套现约93亿

YOUNG财经 浏览 3266

俄白“西方-2025”联合军演结束

环球网资讯 浏览 4015

人民币汇率破7,“6时代”下对我们带来哪些影响?

郭施亮 浏览 2329

丝袜称明年随心参赛无视强制参赛规则,高芙称女网更有趣更具悬念

网球之家 浏览 3003

伊朗最高领袖哈梅内伊转入地堡 日常事务交由儿子接管

极目新闻 浏览 6434

图卢兹vs梅斯:雷斯特、西迪贝首发,巴洛-图雷、哈比卜-迪亚洛出战

懂球帝 浏览 3124
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1