关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4051人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

梁靖崑2-3张本智和!决胜局被逆转太保守!男团0-1落后日本!

篮球资讯达人 浏览 4260

门多萨:为马竞效力是儿时梦想,身边队友小时候在电视上看过

懂球帝 浏览 2810

第三届CATA航空大会在京举办

北京商报 浏览 4101

欧豪:16岁送外卖,21岁遇到贵人谢霆锋

韩驰 浏览 3203

15年离婚拉锯落幕,“中国巴菲特”失去沃华医药实控权

野马财经 浏览 3809

东南大学团队首次揭示:视觉欺骗如何让AI"看走眼"

科技行者 浏览 2975

华为“二代”:孟晚舟与姚安娜,截然不同的路

清欢娱乐八卦 浏览 3475

拉总:诺坎普改叫梅西球场?不合适

体坛周报 浏览 3436

定位中型轿车 比亚迪海豹07 EV官图发布

车质网 浏览 2382

Dockcase Selfix背屏保护壳亮相,适配iPhone 17 Pro系列

IT之家 浏览 3412

专家:诺贝尔化学奖获奖项目产业化或率先在中国实现

上观新闻 浏览 17224

美院硕士在母校附近摆摊卖包子火了 父母也来陪他创业

都市快报橙柿互动 浏览 14874

全新A6L领衔 一汽奥迪2026年新车预览

网易汽车 浏览 2533

2026年最火单品,竟然是一只20年前的机车包?

LinkFashion 浏览 3202

智元机器人公布面向机器人的人工智能策略训练专利

财闻 浏览 2154

消失4年后,主持人程雷官宣一则喜讯

除夕烟火灿烂 浏览 3543

以军多次袭击加沙 哈马斯谴责其违反停火协议

环球网资讯 浏览 3740

借小贝之力,三狮欲赴迈阿密集训

体坛周报 浏览 4061

前球员:湖人时期的奥尼尔无法统治当今NBA;约基奇会是90年代的独角兽

懂球帝 浏览 3442

英伟达CEO黄仁勋:“上帝级AI”还很遥远,但世界仍需向前发展

IT之家 浏览 3048

以方袭击后 美副总统表态:加沙停火协议仍在维持

国际在线 浏览 3961
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1