关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5014人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

香港科技大学突破:让电脑"看懂"视频中每个像素的3D运动轨迹

科技行者 浏览 3385

高德杀入美团百度腹地,马云其实要和刘强东大决战?

BT财经 浏览 4136

尹锡悦看守所内收超6.5亿韩元代管金 系总统年薪2.5倍

鲁中晨报 浏览 8772

2月销量普跌,三大中国车企仅吉利超20万辆

驾仕派 浏览 2688

2025年度综艺榜单:在“苟住”与“破局”之间

仙女事件簿 浏览 3518

2月19日正式发布 全新奥迪RS 5预告图曝光

车质网 浏览 3061

98年翻版金城武,“正统男港星”终于又出现了

时尚COSMO 浏览 3643

天空体育:热刺高层在考虑所有选项,尚未决定弗兰克的去留

懂球帝 浏览 3265

消失5个月后泰禾黄其森“归来”

地产深度报道 浏览 3368

81岁冯淬帆去世,曾悼念许绍雄时自曝已病入膏肓,苟延残喘的活着

扒虾侃娱 浏览 4082

深圳00后600多万在港抄底买房 内地客十年砸下8000亿

南方都市报 浏览 16665

“大空头”11亿空单瞄准英伟达和Palantir,AI泡沫真的来了吗?

郭施亮 浏览 4187

陈妍希这婚,离晚了

她刊 浏览 3558

被大空头狙击的明星AI股Palantir,华尔街怎么看

第一财经资讯 浏览 4191

可可成本大增 亿滋国际承压

北京商报 浏览 4088

航拍画面披露:日本被指昼夜赶建军事基地

环球网资讯 浏览 3762

新美联储通讯社:美联储暗示暂停降息行动,新债王:今天或是鲍威尔任内最后一次

华尔街见闻官方 浏览 3734

DO:热刺若降级,绝大多数球员薪资将被削减约50%

懂球帝 浏览 2585

搭第四代MBUX系统 奔驰纯电GLC亮相2026 CES

车质网 浏览 3363

女鞋巨头,集体“脱鞋”谋变

斑马消费 浏览 3286

伊朗高级将领:若遭美国攻击 以色列将成为首要报复目标

极目新闻 浏览 3008
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1