关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3264人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

郑丽文第二波人事公布:张荣恭、萧旭岑任国民党副主席

海峡导报社 浏览 8589

欧盟考虑强制中企转让技术 彭博社:可能引发强烈反弹

环球网资讯 浏览 7374

抖音发布2025直播治理白皮书,违规曝光量减少37%

财闻 浏览 2272

擅自使用军机形象进行宣传 理想汽车回应

澎湃新闻 浏览 3961

伊姐周日热推:电视剧《依依向北风》;电视剧《水龙吟》......

伊周潮流 浏览 2844

最高续航430km 五菱缤果S置换补贴价6.38万起

网易汽车 浏览 3917

女子年初砸60万买黄金国庆后花20万买白银基金:真运气

潇湘晨报 浏览 17494

美媒刊文:不要虚张声势了 放弃"战胜中国"的想法吧

环球时报国际 浏览 13265

拜仁独撑门面,德甲遭遇欧冠至暗一周

体坛周报 浏览 2203

随着西班牙3-0 世界杯16强定14席 中国队对手确定 亚洲仅韩国出局

侃球熊弟 浏览 3388

六旬女子做痔疮手术9天后突然去世 当地卫健委介入

极目新闻 浏览 7852

美媒:大批美军机突然飞往欧洲

环球时报国际 浏览 2302

威胁要对盟国加征关税后 特朗普亲率代表团出席达沃斯

澎湃新闻 浏览 11807

可能被“没收”一半股权,谷歌创始人逃离硅谷

字母榜 浏览 2291

朱珠:逐渐淡然,依旧鲜活

时尚COSMO 浏览 2571

普京批准俄罗斯与古巴军事合作协议

上观新闻 浏览 3407

格拉维纳:政府应给予意大利足球更多资金支持;联赛体系需重塑

懂球帝 浏览 637

葡媒:被换下后发生争执,卢克巴吉奥已经向穆帅和全队道歉

懂球帝 浏览 13

美对委军事打击造成至少40人死亡

界面新闻 浏览 2334

板块轮动到谁了?沪指逼近4000点,机构正大幅买入这些主题ETF

每经牛眼 浏览 3205

房产中介兼职送外卖:除了干中介 自己什么都不会

经济观察报 浏览 9103
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1