关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4054人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

受贿1.89亿余元 重庆市委原常委陆克华一审被判死缓

央视新闻客户端 浏览 92869

自杀还是他杀 爱泼斯坦案两位尸检法医"致命争论"披露

红星新闻 浏览 30626

春天第一条裙子,这么穿!

黎贝卡的异想世界 浏览 2262

众泰汽车重组出现变数?

车业杂谈 浏览 2914

慢镜头:米兰、尤文和三家英超俱乐部对热苏斯感兴趣

懂球帝 浏览 4001

小鹏汽车正式登陆卡塔尔 多款产品亮相

网易汽车 浏览 3287

山东省首家国际顶尖科学家工作室启动,聚焦阿秒激光技术领域

财闻 浏览 2091

【西甲】皇萨对决:姆总+贝林PK亚马尔+拉师傅

体坛周报 浏览 4034

Fermín Soneira接棒兰博基尼CTO 7月1日正式上任

网易汽车 浏览 792

小S复出拿奖瞬间泪崩,多次提及姐姐大S求保佑

萌神木木 浏览 3992

上海交大突破:AI精准学习人类审美偏好

科技行者 浏览 3918

以称打死两名越过加沙地带“黄线”人员

环球网资讯 浏览 3886

韩国称朝鲜有2吨高浓缩铀 中方回应

北京日报 浏览 4684

媒体:美军或捅破一个巨大的马蜂窝 与俄军在伊朗硬刚

新民周刊 浏览 7433

乌克兰空军:一架苏-27战机在该国东部坠毁 飞行员死亡

环球网资讯 浏览 3382

72岁患癌老人办生前告别式 四十多名宾客来到现场发言

极目新闻 浏览 12964

65岁林俊贤广东景区打工,年过6旬老成“龙王”,努力赚钱不丢人

温柔娱公子 浏览 4227

米切尔:我罚球少是因为不假摔;不敢多聊,我朋友都被罚款了

懂球帝 浏览 836

中行风险总监卸任,薪酬曾超131万元

华美财经 浏览 3065

美英之后,韩国也对太子集团出手了,陈志到底搞了多少钱?

北向财经 浏览 4101

部分苹果 iPhone 17 Pro/Max 用户反馈机身褪色

IT之家 浏览 4132
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1