关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者4264人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

公募基金业绩比较基准迎规范,证监会、中基协公开征求意见

华夏时报 浏览 4199

生育津贴直接发放至个人 这些地方已实现

央视财经 浏览 4346

阿特金森帅位岌岌可危!上季当选年度最佳教练 曾获骑士老板力挺

罗说NBA 浏览 3671

微创、高效、直达大脑!我国科学家开辟脑卒中病灶给药新路径

环球网资讯 浏览 3265

马筱梅晒定制红包,把婆婆张兰放感谢第一位

大中国 浏览 2704

股份行AIC扩容至三家

北京商报 浏览 3995

全网爆火的“鲨鱼裤”太丑了!巨显腿粗!

Yuki女人故事 浏览 4425

城区油耗2L级 长安逸动/CS75 PLUS蓝鲸超擎抢订价7.99万起

网易汽车 浏览 1331

“四十不惑”的吉利 信力不信命

网易汽车 浏览 3133

金正恩罢免朝鲜内阁副总理杨胜虎:不适合现在的位置

红星新闻 浏览 13021

阿里巴巴:全球首个企业级Agent平台“悟空”来了

财闻 浏览 2256

头灯焕新设计 新款宾利飞驰测试谍照曝光

车质网 浏览 1186

女子被逼嫁给大15岁男子喝农药轻生 钱被母亲拿走买房

大风新闻 浏览 14415

号称“租手机赚钱”,知名平台突然爆雷!有员工抵押房产上班两月,套牢130多万元,投资者:我66台iPhone没了

每日经济新闻 浏览 3996

豪门离婚,窦骁能分到多少?

江湖人称艾掌门 浏览 4200

夫妇盯上2‰自然损耗规则 上千吨粮食遭盗卖价值500万

CCTV今日说法 浏览 9418

钟楚曦到底僭越了什么

虎嗅APP 浏览 4081

真爱大牌破价|| 回购多年,这次竟然破天荒200+

黎贝卡的异想世界 浏览 4292

约翰霍普金斯大学:让卫星"慧眼"像人类一样逐步发现地面变化

科技行者 浏览 3317

江苏省委省政府成立调查组 对南京博物院开展全面调查

北京日报客户端 浏览 31949

两种容量、最高纯电续航超320公里,极氪8X电池信息揭晓

IT之家 浏览 3374
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1