关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者1512人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

长沙女子双节返程 发现母亲在大米里藏了1000元现金

潇湘晨报 浏览 2432

袁悦苦战182分钟惨胜后遭调侃打球兼项马拉松,吴易昺疑似又伤了

网球之家 浏览 475

中国AI半导体加速“脱英伟达”,半导体国内自给率到2026年将提高至8成

财闻 浏览 102

抢滩“双11”,浙江跨境商家为速卖通备货10万棵圣诞树

财闻 浏览 1759

《逍遥》大结局:秉烛结束了红烨,肖瑶曾为妖王!

肆季娱乐 浏览 596

媒体人:玉昆接近签约前浙江队主帅乔迪,还相中一名巴西前腰

懂球帝 浏览 1072

张艺谋审美真牛!《玉茗茶骨》从娜扎到程潇,都不及张慧雯古典

温柔娱公子 浏览 410

女单黯淡女双坚挺,金花2025交7冠答卷

网球之家 浏览 1418

拉比奥:我在米兰很好地融入了球队,我和迈尼昂的关系很亲近

懂球帝 浏览 1656

若羽臣:抖音已成为公司重要渠道之一

北京商报 浏览 346

英国防大臣称想"绑架"普京 俄方:痴人说梦

界面新闻 浏览 460

投机永不眠!加密货币失宠 币圈玩家转战预测市场

智通财经 浏览 230

这件衣服今年太火了!时髦女人都在穿

LinkFashion 浏览 1466

翻车舞台!张远魔改《夜的第七章》,拉垮黄霄云

黔乡小姊妹 浏览 778

伊能静再婚11年首晒比基尼照,腰臀曲线引热议

柠檬有娱乐 浏览 188

上天的小鼠为何更瘦?这场跨年科学对话透露了很多航天趣事|科学家·马上回答

封面新闻 浏览 676

时隔34年维京队再夺挪超冠军,球迷冲入球场内疯狂庆祝

懂球帝 浏览 1007

利物浦官方:库伊特、斯科特尔等人参加对多特传奇的慈善赛

懂球帝 浏览 14

股市:更大的想象空间来了

小白读财经 浏览 179

欧盟峰会与美俄乌磋商在即 被冻结俄资产成博弈焦点

北青网-北京青年报 浏览 828

内塔尼亚胡:以色列将不得不做出"痛苦且重大"让步

环球网资讯 浏览 2835
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1