关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1310人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

修杰楷承认造假!逃役失败因贾静雯怀孕提前退伍,面临牢狱之灾

萌神木木 浏览 562

6月新势力销量:你别说,带“油箱”真好卖

汽车公社 浏览 10497

第二十七届高交会将于下周举办,中国太空游项目将全球首发

南方都市报 浏览 360

入秋包包合集!这12个有质感还不撞款!

Yuki女人故事 浏览 739

速战速胜!东部战区陆军某旅开展空地协同演练

环球网资讯 浏览 17994

Nature|尺寸与光电转换效率创世界纪录,上海科学家团队携手龙头企业突破大尺寸钙钛矿光伏模组产业化关键技术

上观新闻 浏览 469

武磊谈亚洲杯目标:争取超上届8强战绩!会把输港队的压力变动力

我爱英超 浏览 12570

涉及核武触碰反击条款 俄战略预警雷达遭袭引多方焦虑

环球网资讯 浏览 10776

高德重走商业化老路,腾讯、百度迎来反超机会?

蓝鲸新闻 浏览 1120

乌军趁乱反攻无果 原因是俄军密集布置的地雷阵

枢密院十号 浏览 15476

被曲解的雷军:“安全至上”与“好看第一”并不冲突

虎嗅APP 浏览 161

丹麦羽毛球公开赛今日打响,石宇奇迎来世锦赛后首次亮相

懂球帝 浏览 730

足球世界杯赛事那些国足历史冷知识,国足没有一位主教练任期超过四年

趣看热点 浏览 25605

港媒曝朱茵沽货套现!卖2处房产狂赚千万,两房产都与袁某人有关

文艺圈娱乐号 浏览 12675

接近完工!韩国高调展示国产隐形战机进展

环球网 浏览 26147

官宣:歼31出了新型号,全球独创侧面双弹舱

浏览 10501

伊能静儿子万圣节cos照曝光 穿黑丝透视装姿势妖娆

萌神木木 浏览 13084

她是钟小姐的穿搭榜样,从20岁到70岁,每一套都让人想copy

黎贝卡的异想世界 浏览 480

手机壳店老板娘婚内出轨 与情夫多次在店里发生关系

花点时间 浏览 86886

徒步甘孜失温女生不排除植物人风险:刚刚从卫校毕业

鲁中晨报 浏览 723

刘亦菲巴黎时装周生图赢麻了 自信又松弛

新金牌娱乐观察家 浏览 19308
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1