关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者3843人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

30岁后越来越美的女人,只穿滋养自己的衣服

LinkFashion 浏览 4703

“窝囊”35年没人理!直到遇66岁迟蓬才大火

苏子Vlog一 浏览 3197

国投瑞银被起诉背后

时代周报 浏览 3014

标配激光雷达和四驱 魏牌高山7上市售28.58万

网易汽车 浏览 4196

赫斯基:斯洛特应该调整战术体系,将萨拉赫撤出首发

懂球帝 浏览 4070

“港版淡马锡”撑腰,大模型第三股要来了?前微软副总干出业内最强商业化

财通社 浏览 821

《寻秦记》成为香港影史首日最高开画票房冠军

皮皮电影 浏览 3097

伊朗伊斯兰革命卫队:战争的结束由伊朗决定

界面新闻 浏览 2186

美方人士:中国明天就能瘫痪美国经济 而美国无能为力

澎湃新闻 浏览 4180

怒砸15亿,全明星阵容,年底压轴大片来了

独立鱼 浏览 2695

纽卡vs阿森纳双方公布首发

体坛周报 浏览 3792

问界M6主打运动操控,正面对垒小米YU7

驾仕派 浏览 2845

一夜翻盘,炫富网红蓝战非复活了

TVB的四小花 浏览 4236

5名中国游客在巴厘岛车祸死亡 伤者:司机一点伤没有

扬子晚报 浏览 44054

台媒滚动播放九三阅兵 国防部回应

北京日报 浏览 4757

2025长剧全网收视榜,《以法之名》跌至第10,第一播放量高达22亿

娱乐圈笔娱君 浏览 3104

一汽丰田10月销售新车71407辆 今年累计销售65.8万辆

网易汽车 浏览 3865

从美国到东南亚,TikTok电商重心转移

虎嗅APP 浏览 4885

连续被血洗!今年前十个月的涨幅,币圈一个月跌完了

华尔街见闻官方 浏览 3863

预计北京车展首发亮相 吉利银河战舰开启全球征名

网易汽车 浏览 2239

40岁C罗确认:美加墨世界杯将是生涯最后1届!或2年后在沙特退役

我爱英超 浏览 3832
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1