关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者1529人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

低成本、高锐度布局风口上的创新药

一地基毛 浏览 1528

基本半导体递交赴港IPO申请

证券时报 浏览 1185

哈啰“豪赌”Robotaxi,联手阿里和宁德能否比萝卜快跑“跑更快”?

汽扯扒谈 浏览 2567

男子自带3瓶茅台被服务员调包 摸酒瓶辨温度识破伎俩

封面新闻 浏览 6171

成败AI:谷歌市值超越苹果

北京商报 浏览 673

曲刚:要付出最大努力来打好比赛,罗德里格伤势已没问题

懂球帝 浏览 1779

年末避险情绪抬升 公募选股遵循涨价硬逻辑

证券时报 浏览 1455

2026新年礼:欢迎来到「灵感剧场」

时尚COSMO 浏览 840

《逍遥》大结局:最恨妖的人却成了妖,秉烛的宿命太扎心!

肆季娱乐 浏览 784

6000万贱卖总部大楼,“中国催收大王”也被催收了…

深蓝财经 浏览 972

首败!76人无缘24分逆转1分惜败绿军 恩比德丢绝杀布朗32+6

醉卧浮生 浏览 1580

2-2!英超疯狂之战:1-2落后 10人曼联压哨绝平 0分变1分

叶青足球世界 浏览 1524

特朗普称认定委内瑞拉现政府是“外国恐怖组织”

极目新闻 浏览 1000

抢滩“双11”,浙江跨境商家为速卖通备货10万棵圣诞树

财闻 浏览 1951

从“贝塔躺赢”到“阿尔法精选”!公募2026年南下新打法曝光

券商中国 浏览 701

卫衣+半裙=早秋流行混搭套路,时髦极了!

Yuki女人故事 浏览 2759

曾经最具知名度的播音员病逝 丈夫也是央视知名主持人

环球网 浏览 16580

搭载1.5T插混系统 探岳L PHEV申报图曝光

网易汽车 浏览 699

谢孟伟拘留期满被释放,连发两条视频召集粉丝

娱慧 浏览 2221

岚图汽车2025年交付150169辆 同比增87%

网易汽车 浏览 823

法尔克:皇马和切尔西将争夺于帕,签字费是他与拜仁续约障碍

懂球帝 浏览 1731
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1