关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家348人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

王心凌的新瓜太猛了!翻红才1年,又被渣男毁了?

8号风曝 浏览 12287

朝鲜察打一体无人机亮相 酷似美军"死神"

澎湃新闻 浏览 13950

以部长喊话布林肯:现在对哈马斯要用“大棒”

环球网资讯 浏览 11982

多位珠海市民称更换新表后燃气用量激增 珠海燃气回应

南方都市报 浏览 62667

上海这一夜,张子枫腰身撩人,惠英红华贵霸气

不八卦会死星人 浏览 15370

胡昌升当选黑龙江省长胡昌升个人资料介绍

趣看热点 浏览 115393

在参加G1比赛过后的训练时,“浓眉”戴维斯一直都非常生气

趣看热点 浏览 24460

刘海波被指在万达地位很重要 常随王健林会见各地领导

新民周刊 浏览 84231

2024年第一次油价下跌或在本周三进行 但预计跌幅不大

智车情报局 浏览 11759

山西最大煤企原董事长受贿上亿:他到哪“老乡”施工队到哪,还收受上百只活羊

澎湃新闻 浏览 11329

日本首次向海外部署F35战机

央视军事 浏览 13492

中国男篮世预赛五看点:乔帅执教首秀 周琦亮相新人谁能一鸣惊人

厝边人侃体育 浏览 18178

NBA官方:大洛佩斯获得2022-23赛季鲍勃-兰尼尔社区关怀奖

直播吧 浏览 14310

40万买纯电MPV,还送你一棵万元名树?

Autolab 浏览 9561

美国通胀反弹

北京商报 浏览 11679

德佬:我本来不想让KK的团队得逞,但最终不得不把他卖掉

懂球帝 浏览 392

有钱人变老了:“新中年”消费崛起前夜

巨潮WAVE 浏览 18428

记者:博格巴已经开始康复训练,好消息是没有肌肉损伤

直播吧 浏览 13242

外媒称以军士兵在加沙地带焚烧食物

央视新闻客户端 浏览 11772

“网红”雷军,还会有2.0版吗?

酷玩实验室 浏览 10183

只有9平米!苹果Vision Pro运动边界范围首次曝光

智东西 浏览 14638
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1