关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4808人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杰哈德指责加沙“和平委员会”组成服务于以方利益

极目新闻 浏览 3046

直言“薪资不及预期”!上任仅3个月,上市公司财务负责人“闪辞”

红星资本局 浏览 1560

霸榜热搜,尺度惊人,他绝对值得你追

Yuki女人故事 浏览 2805

《再见爱人5》收官,评论区被骂翻

白面书誏 浏览 3087

AI重塑就业版图 专项政策护航转型之路

北京商报 浏览 2900

官宣!这座“一线”省份,继续力挺省会

西部城市 浏览 4025

小鹏将推出长途增程混合动力X9,单次续航1600公里

MOTO 浏览 4990

梦想100万亿美元,追觅CEO却忙着网络通缉

金角财经 浏览 2871

全球首份动力电池循环经济研究报告发布

网易汽车 浏览 2973

海外收入占比低 远信储能赴港IPO

北京商报 浏览 3027

TA:温格擅长从宏观层面谈论足球,他不适合参与修改足球规则

懂球帝 浏览 3032

DiDi联手香港科大首创自动旅行规划AI

科技行者 浏览 3923

解锁刘浩存的「红运」密码 | 高清镜头后的底气

时尚COSMO 浏览 966

伊朗针对以色列心脏地带发起打击 对美国发出威胁

每日经济新闻 浏览 115178

极狐汽车4月销量16532辆 同比增长101.7%

网易汽车 浏览 788

许利民:如此困难的情况下大家坚持到了最后,取胜全靠精神力

懂球帝 浏览 2965

闫妮姚晨合拍大片,梦回《武林外传》

蕾爸退休日记 浏览 3922

媒体:美方28点计划引全球哗然 泽连斯基将背负骂名

经济观察报 浏览 15690

@全球内容创作者:广东喊你来创造,政策大礼包备好了

智谷趋势 浏览 3925

禁毒警察被控走私毒品获刑三年半 本人称系"工作行为"

新京报 浏览 24813

保安打人赔35万结案13年后15人被公诉 被害人从未控告

澎湃新闻 浏览 10087
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1