关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者2733人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

和任正非聊一聊,会有新品牌?

道哥说车 浏览 2907

向海外要增量?小鹏发布三款全球车,何小鹏:小鹏在海外市场增速会比国内更快

时代财经 浏览 1750

冯小刚携徐朵亮相芭莎盛典,21岁养女气质蜕变

露珠聊影视 浏览 1784

美媒:泽连斯基未拒绝领土问题 要求提供更多细节

环球时报国际 浏览 7598

杭州一家有两位百岁老人:同年同月同日生 被指心态好

极目新闻 浏览 11449

走过那个夏天,甜茶终于站上金球奖之巅

时尚COSMO 浏览 1390

26款奔驰“小S级”售价亲民,外观豪华,车长超5米,搭载2.0T轻混

小史谈车 浏览 1033

房产中介兼职送外卖:除了干中介 自己什么都不会

经济观察报 浏览 8528

国米球员身价变更:图拉姆下跌1500万欧,博尼上涨1200万欧

懂球帝 浏览 1990

张继科与女友张蕊被拍 被传隐婚生子?

达达哥 浏览 2202

绝望的日本车:搞新能源押错了宝,随时有可能被国产车一波推

小李车评李建红 浏览 2026

2025羽绒服8大流行趋势,温暖时髦过冬天!

LinkFashion 浏览 2166

避免引发恐慌 中东多国收紧社媒敏感信息管控

环球网资讯 浏览 576

李湘账号被封才2天,与释永信关系真相大白

陈意小可爱 浏览 1640

《疯狂动物城2》之后,更炸的大片来了

独立鱼 浏览 1914

巴平民被枪杀 特朗普扬言“冲进加沙铲除哈马斯”

参考消息 浏览 8740

大S墓碑没自己名字,且一个中文都没有,具俊晔立深情人设引热议

扒虾侃娱 浏览 1446

郭富城三胎还是女儿!狗仔拍到其扁嘴照,方媛发声强调不在乎性别

萌神木木 浏览 2776

累坏了,库尼亚打进扳平球+中框1次,贡献解围2次拦截2次

懂球帝 浏览 1801

爱尔眼科,暗藏玄机!

飞鲸投研 浏览 1669

弃理从文,他走出不同寻常的电影路

幕味儿 浏览 2745
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1