关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3483人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

记者问美防长戴"俄国旗颜色领带" 五角大楼:你妈买的

环球网资讯 浏览 7502

56岁陈红颜值回春,参加路演不惧高清镜头,她满脸皱纹依旧美丽

温柔娱公子 浏览 2864

E句话| 梁小龙去世,成龙周星驰发文悼念

仙女事件簿 浏览 1676

泡椒凤爪“塌房”,有友食品躺枪

斑马消费 浏览 624

美威胁停买"中国油" 专家:或闹乌龙 为"废弃食用油"

环球时报新闻 浏览 6498

直瀑式格栅/3种座椅布局 第三代豪越L正式亮相

网易汽车 浏览 2505

TA:维尼修斯认为自己在球队整体表现不佳的情况下被区别对待

懂球帝 浏览 2048

朱啸虎们押注的300元AI玩偶,先得跑赢「退货潮」

豹变 浏览 2604

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者 浏览 1703

至高6000元购车红包 长安启源推限时购车福利

网易汽车 浏览 955

美国演员约翰尼-德普现场观看博卡比赛,并与里克尔梅合影

懂球帝 浏览 2308

安以恩:邦本宜裕是很“高级”的球员,我们能秒懂彼此的意图

懂球帝 浏览 2282

ABB与英伟达共同推进吉瓦级数据中心建设,800VDC供电架构引关注

环球网资讯 浏览 2904

被自称前女友的网友实名举报涉毒 短剧"顶流":别搞我

极目新闻 浏览 5925

万亿“宁王”,又出手

中国基金报 浏览 2694

爆火的“表演饭”,开始被年轻人避雷

餐饮老板内参 浏览 2417

澳大利亚刚插手台海就收噩耗 中方杀鸡儆猴停特殊待遇

时时有聊 浏览 16895

“北溪”爆炸案一嫌疑人被引渡至德国受审

极目新闻 浏览 2206

许利民:曾凡博确实非常优秀,祝贺他回归首秀奉献如此精彩表现

懂球帝 浏览 1851

多纳鲁马:曼奇尼和巴洛特利都推荐我来,他们让我更坚定选择

懂球帝 浏览 2564

2025年,他们集齐了十二枚臂章

我们的太空 浏览 1488
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1