关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者951人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

住建部部长倪虹:长远看我国房地产发展仍有较大潜力和空间

人民网 浏览 158

受性骚扰风波影响!黄子佼主持节目宣布更换主持人

网易娱乐 浏览 16042

实拍斯巴鲁PERFORMANCE-B STI概念车:传奇随时可以复活,无奈量产成本太高

驾仕派 浏览 788

私处粉嫩整形,春节挤爆美容院

她刊 浏览 12976

剧版哈利波特官宣 改编原作小说全新演员阵容

网易娱乐 浏览 19371

起底视觉中国:上百名员工撬动50万名摄影师,一张图片平台抽水七八成

时代财经 浏览 14309

戴尔推入门游戏显示器SE2426HG、SE2726HG:FHD 240Hz Fast IPS

IT之家 浏览 99

运营商 AT&T“人人免费得 iPhone 16 Pro”广告被裁定为虚假宣传

IT之家 浏览 836

标晚:热刺临时主帅梅森预计将留队,辅佐新帅波斯特科格鲁

直播吧 浏览 16649

这24套简约帅气的穿搭模板,学起来好简单,看起来更有层次感

静儿时尚达人 浏览 11785

潘功胜最新讲话7大要点!涉稳定币,信息量满格

21金融圈 浏览 893

超模“辣妈”米兰达可儿罕见素颜亮相

时尚丽人风行 浏览 19602

宝马的保守与变革:MINI 披上新势力外衣

晚点LatePost 浏览 11382

港报社论:“毁台”传言加剧岛内“疑美”情绪

参考消息 浏览 19513

被记者三次问及加拿大是否已申请加入“奥库斯”,加防长回避

环球网资讯 浏览 18885

对中国起重机征25%关税,美国各大港口集体反对

第一财经 浏览 11048

加量不加价 阿维塔11鸿蒙版智享升级版30万起

网易汽车 浏览 12999

Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了

量子位 浏览 12333

吉利汽车集团10月销量307133辆 同比增长35%

网易汽车 浏览 802

明星工作室接连注销,娱乐圈又有大瓜要来了吗?

趣看热点 浏览 26658

乌军从阿夫杰耶夫卡撤军 称俄军集结5万兵力

每日经济新闻 浏览 12898
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1