关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2903人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大S离世一周年,S Hotel酒店大门被木板封住

素素娱乐 浏览 1766

中央一号文件来了!今年有哪些“新表述”?

农民日报 浏览 1937

芯天下弃A转港,2025年前三季度业绩扭亏,毛利率回升至18%|港E声

时代周报 浏览 2116

熊园:“十五五”大方向已定,如何跟踪?

首席经济学家论坛 浏览 3123

李湘王岳伦酒店同住引热议,女儿成和解纽带?

最美的开始 浏览 2418

王健林限高已解除,虚惊一场?

财视传播 浏览 3683

和马蓉离婚9年后,自己的一双儿女开始为他争光了

TVB的四小花 浏览 3980

人均25元的素食自助,排爆商场

餐饮老板内参 浏览 3043

百年老字号的资本挑战:携创收单品安宫牛黄丸,同仁堂医养四冲港股|港E声

时代周报 浏览 1985

牛弹琴:特朗普迎最高兴一天 还求以方赦免内塔尼亚胡

映象网 浏览 7125

贵妇集体爱上当主持?为什么名媛访谈频频“翻车”

仙女事件簿 浏览 2019

巴特勒临时休战引热议!勇士官方评论区炸锅:被交易还是有急事?

罗说NBA 浏览 2070

版博会观察:冰箱贴凭啥成文创顶流?AI+版权如何焕新意?

南方都市报 浏览 3121

E句话|福原爱,再婚怀孕

仙女事件簿 浏览 2352

媒体:民进党为突破僵局推动"绿白合" 柯文哲不能犯浑

海峡导报社 浏览 7835

原来做自媒体的“成功心法”都是同一个

黎贝卡的异想世界 浏览 3069

特斯拉前全球销售主管爆猛料

电动知家 浏览 2483

宏胜集团法定代表人变更,郑群娣接棒祝丽丹

21世纪经济报道 浏览 2932

37岁的赵丽颖“消失”5个月后一反常态?

小椰的奶奶 浏览 3193

苏格兰11月世预赛大名单:麦克托米奈、罗伯逊领衔

懂球帝 浏览 2874

极狐乔心昱:北汽新能源行业首个实现L3-L4自动驾驶技术全覆盖

IT之家 浏览 2072
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1