关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者2251人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美财长挑拨中阿关系称"米莱要将中国赶走" 阿根廷回应

澎湃新闻 浏览 6358

看AI变身游戏达人:莫斯科研究院开发超快视觉智能测试平台KAGE

科技行者 浏览 1155

336万年薪请来的CEO,上任两个月就“失联”,高鑫零售的转型阵痛期

红星资本局 浏览 958

离婚14年,宁静汪峰再传绯闻,前夫儿子为她争光

枫尘余往逝 浏览 2135

德央行行长妄言:若报复中国是最后一招 那就干票大的

澎湃新闻 浏览 7883

伊朗:若油气设施遭袭 将摧毁地区所有国家油气设施

红星新闻 浏览 39068

拉斯帕多里:意大利拥有成功所需的一切;我对加盟马竞很满意

懂球帝 浏览 1785

记者:维拉和埃弗顿也有意路易斯-恩里克,伯恩茅斯的报价最具体

懂球帝 浏览 1034

红军城陷落在即 俄军或迎巴赫穆特后最大胜利

北京日报客户端 浏览 1993

男子同时筹备"2场婚礼" 被抓正与"未来岳父母"谈婚房

鲁中晨报 浏览 8374

先锋来袭 丰田卡罗拉概念车新车图解

车质网 浏览 316

五十岁女性别总穿卫衣!这3种上衣显贵又洋气,轻松穿出无龄感

静儿时尚达人 浏览 2142

小维阿:马赛的压力不让我意外,我在尤文效力过

懂球帝 浏览 2071

工信部曝光9台“狠角色”新车:A6L 3.0T功率提升,奇瑞五菱新作

蜗牛车志V 浏览 1596

史上最强财报背后,苹果仍差临门一脚

虎嗅APP 浏览 2113

沈逸:美国威胁不买中国"地沟油" 已被拆解得体无完肤

澎湃新闻 浏览 6327

美方拟禁止中国航司飞越俄罗斯领空 中国航司联名回复

澎湃新闻 浏览 6204

普京与特朗普通电话 讨论伊朗局势

环球网资讯 浏览 128

都灵主帅:我很尊重斯帕莱蒂,我们必须带着创造历史的信念比赛

懂球帝 浏览 2054

中国色特别策划 | 故宫技艺与古意新生

时尚COSMO 浏览 1727

荣耀 MagicPad3 Pro 13.3 平板电脑核心参数公布:165Hz LCD 面板

IT之家 浏览 2909
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1