关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家5019人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

有偶像包袱别演戏!《沉默的荣耀》于和伟干饭,打脸多少假吃演员

娱乐圈笔娱君 浏览 4380

近7场1胜6负,河床近期战绩非常糟糕

懂球帝 浏览 4385

今年秋天最好看的5件风衣!

LinkFashion 浏览 4835

比亚迪双旗舰谍照来了!大汉/大唐,更大、更强

车市红点 浏览 3595

省委书记、省长等18位省领导 一下火车直奔企业车间

政知新媒体 浏览 9607

白电三巨头最新财报出炉!小米高管:友商越急,我们越稳!

互联网那些事 浏览 4211

美称空袭叙利亚西北部 打死一名与“基地”组织关联头目

新华社 浏览 3424

五一档三部电影扑街,《10间》格外尴尬

阿裤趣闻君 浏览 1144

范雨林:实力硬汉却不红,娶普通人低调过日子

失宠的小野猪 浏览 3288

媒体:高市"拜鬼"同天允许出口杀伤性武器 日本露獠牙

国是直通车 浏览 36135

马刺加时134-130爵士取季前赛3连胜,文班22+7,贝利20+7

懂球帝 浏览 4393

章子怡百花晚会偶遇30年好友曾黎

泪满过眼 浏览 3190

莱巴透露战斯瓦泰克的两大关键,丝袜称气温还这么高会手足无措

网球之家 浏览 3255

新官上任三把火,特朗普的第一把火会烧给谁?

浏览 27402

17岁男生提供电话卡给网诈团伙被判8个月 称获利997元

红星新闻 浏览 10086

女子遭家暴驾车逃跑致丈夫身亡获刑11年 已上诉称无罪

红星新闻 浏览 8984

今年冬天最经典的4双鞋,年年穿都好看!

LinkFashion 浏览 3990

三季报发布,中国人寿总保费规模创历史同期新高

证券市场周刊 浏览 4384

广东大胜西班牙球队1喜3忧!二老老寒腿,张昊无球权,张皓嘉辣眼

篮球资讯达人 浏览 4225

重要信号,楼市将变!

博闻财经 浏览 3691

西尔扎提常规赛报销,新疆再不补强一号位,季后赛都难进!

篮球资讯达人 浏览 2497
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1