关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4058人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小米雷军回应被贴“营销大师”标签:营销不是坏事,但产品是基础

IT之家 浏览 3082

微胖女孩冬天怎么穿衣?看看这27套冬季穿搭LOOK,保暖又显瘦

静儿时尚达人 浏览 3323

穆杰塔巴呼吁:争取经济和文化斗争胜利 让敌人"失望"

上观新闻 浏览 866

赵伟:增量财政资金落地

首席经济学家论坛 浏览 4099

台湾艺人修杰楷、陈柏霖涉嫌逃避兵役被台检拘提问话

界面新闻 浏览 4060

再论快船用鲍威尔交换科林斯 后者17场后被甩卖卢指导难辞其咎?

仰卧撑FTUer 浏览 3740

台湾名嘴蔡正元:黄海8天实弹演习只是前菜

看看新闻Knews 浏览 2683

发球都不会的球员混进ITF职业比赛!引国外网友和专家愤怒

网球之家 浏览 3170

继与霉霉恋情谣言后,里弗斯被传约会网红

艺兔体坛 浏览 3156

从嬉皮士到硅谷教父,他写了一本关于“维修”的书

DeepTech深科技 浏览 1268

重生之《泰坦尼克号》没沉

江湖人称艾掌门 浏览 2268

新款享界S9纯电版曝光 尾部细节调整

网易汽车 浏览 4226

窦泽成下赛季重返美巡赛

体坛周报 浏览 4134

惨烈!马刺三人遭遇伤病被逆转14分 文班亚马或休10天造黑七?

颜小白的篮球梦 浏览 1237

冬天的毛衣,越“大”越好看!

LinkFashion 浏览 2893

何穗:新生亦重生

时尚COSMO 浏览 2195

杨幂“咽2口吃播”:明星极致自律的健康隐忧

巧妹电影 浏览 3457

AMD ROCm 软件堆栈更新至 7.0.2 版本,支持 Radeon RX 9060 显卡

IT之家 浏览 4218

猎奇智能IPO背后藏着七大富豪!80后湖北大佬造光模块设备年入5亿

野马财经 浏览 2840

衣服不用准备太多,找到一些实用的单品才最重要,百搭又有性价比

静儿时尚达人 浏览 852

普京:“海燕”核动力巡航导弹完成“决定性试验”

极目新闻 浏览 4059
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1