关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4193人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿里主动加码外卖大战,谁能笑到最后?

陆玖商业评论 浏览 3230

周深香港跨年唱到凌晨!5万人嗨翻无投诉

贵州小娟 浏览 3287

Google与约翰霍普金斯大学联手打造AI"审计官"

科技行者 浏览 3521

车企增收不增利,钱到哪儿去了

帮宁工作室 浏览 3167

2026春夏八大流行趋势,早穿早美!

Yuki女人故事 浏览 3003

爆冷!莫布利29+8骑士崩盘输猛龙 巴特尔三分6中6引3人20+

醉卧浮生 浏览 4096

保剑锋被前妻手撕,不愧是插刀教成员

萌神木木 浏览 2888

采用东风汽车平台 Jeep计划推出全新车型

车质网 浏览 4202

杭州女子洗完澡一抬头 发现窗外停着一架无人机

极目新闻 浏览 4264

迪士尼官宣10亿美元投资OpenAI,允许Sora生成米老鼠等视频

IT之家 浏览 3739

OpenAI创始团队对簿公堂,马斯克称创办初衷为拯救人类

环球网资讯 浏览 1178

户外赛道竞速,坦博尔、伯希和冲刺港股突围

斑马消费 浏览 4375

《今日说法》主持人李晓东从央视离职 曾买茶叶被骗

封面新闻 浏览 9544

时尚启蒙必看片单,终于更新了

时尚COSMO 浏览 1343

抛弃糟糠之妻和6岁儿子,李成儒后悔吗

白面书誏 浏览 4173

盛合晶微冲刺IPO 募资扩产引争议

北京商报 浏览 4028

18.68万起!新款小鹏G7/P7+增程版上市

网易汽车 浏览 3313

刘强东"10年1元年薪"到期 网友曾调侃章泽天离婚分5元

红星资本局 浏览 21968

上年纪的女人穿衣别焦虑,试试这几个搭配套路,优雅还减龄

静儿时尚达人 浏览 4084

广发证券:本轮港股春季躁动会缺席吗?

智通财经 浏览 3631

2025最流行的摩卡慕斯色,配牛仔蓝太好看了!

LinkFashion 浏览 4854
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1