关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者793人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

星空相册|天宇上演木星伴弦月

新华社 浏览 1070

媒体:王沪宁参加台湾代表团审议 信号很明确

直新闻 浏览 82192

冲垮理想销量的不是黑公关,而是技术上的逃课

无相商业趋势 浏览 11295

调离后"消失"2年多的宁夏"老虎"被公诉 细节首次披露

政知新媒体 浏览 78297

冬天“半身裙”最丑的3种穿法!

Yuki女人故事 浏览 375

骗取生育保险基金,主犯获刑十年!国家医保局曝光典型案例

环球网资讯 浏览 951

口碑爆棚,票房扑惨,最争议的大片来了

独立鱼 浏览 829

独家对话招行行长王良

21金融圈 浏览 11378

国王连秀操作:1年360万签威少 5年1.4亿美元提前续约基根-穆雷

醉卧浮生 浏览 1015

30.78万元起!领克新09EM-P实力几何?

汽车投诉网 浏览 12599

如何穿好吊带单品?第一步就是自信

《红秀GRAZIA》 浏览 14751

中秋看热巴的嫦娥装,又双叒叕被撩到了

时尚COSMO 浏览 945

中国新能源汽车渗透率58.37%创历史新高

大象新闻 浏览 1022

三巨头集体瞄准港股市场,新茶饮第二股将花落谁家?

南方都市报 浏览 12939

周冬雨越来越好看 这穿搭价格也不一般

一只可可 浏览 15111

高贤贞澄清当年与赵寅成机场同框绯闻:旁边还有宋仲基李敏镐等人

好丹 浏览 12627

河南村庄设环保监测点发通知限制燃油车进村 当地回应

大风新闻 浏览 13696

傅园慧再回应包车被勒索:还是很喜欢东北 下次还来

极目新闻 浏览 79282

搭载地平线征程6E 全新MG4 530将于10月底开启交付

网易汽车 浏览 860

单臂抡扣点燃全场!王浩然14中5 砍下全队最高的20分

直播吧 浏览 15595

比亚迪香港4门店同时遭破坏,代理商:已报案,将配合港警调查

环球网资讯 浏览 16185
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1