关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者1567人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

金工守艺人陈英泽:一锤定音,锻出山川意向

时尚COSMO 浏览 534

报道称美方将启动关键矿产储备计划 中方回应

财联社 浏览 3734

媒体:美国对台军售 本质是在加重中华人民共和国负担

新民周刊 浏览 6539

AI,人类历史上最后一次科技革命?你准备好“上桌”了吗

北京商报 浏览 1658

50+妈妈冬季穿搭范本:“短羽绒服+阔腿裤”,保暖时髦不费力

静儿时尚达人 浏览 301

零跑销量相当于小米与理想之和——属于老实人的胜利

DearAuto 浏览 1410

礼来下调Zepbound减肥药现金价格,最低至每月299美元,股价下挫1%

华尔街见闻官方 浏览 1068

上映27天被观众赶出院线!网播也救不了它,事实证明烂片已无市场

娱乐圈笔娱君 浏览 325

星际之门计划捧红了这家公司,化废弃能源为AI算力,估值达百亿

DeepTech深科技 浏览 1603

特斯拉三季度净利同比暴跌4成!马斯克透露五大关键进展,为天价薪酬拉票

车东西 浏览 1514

解码2025年SUV销量王,藏在爆款里的家庭用车消费新逻辑

百姓评车 浏览 591

推动新场景大规模应用要打通哪些堵点?专访工信部赛迪研究院胡国栋丨聚焦国常会

封面新闻 浏览 1429

助力识别、延缓或逆转老年疾病,全新“自然奖项”问世

上观新闻 浏览 2202

业绩失速,传音控股盯上非洲“电驴”

斑马消费 浏览 902

新能源购置税免征时代,正在结束

盖世汽车 浏览 1548

真爱大牌返场|| 一上线就被抢空的牌子,这次居然100+就能拥有

黎贝卡的异想世界 浏览 1407

低价“银行直供房”激增,有房产价格低于市价25%

第一财经 浏览 1440

连衣裙+运动鞋,今秋最美穿法!舒适又时髦!

Yuki女人故事 浏览 1493

盛合晶微冲刺IPO 募资扩产引争议

北京商报 浏览 1491

为嫁"高富帅"与母亲互殴 31岁女子道歉:给他花90多万

潇湘晨报 浏览 5904

弃理从文,他走出不同寻常的电影路

幕味儿 浏览 1584
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1