关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家315人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

解放军家底子不够厚?3艘航母造完,还得干

浏览 9565

“芭比粉”平反后 用对粉色了没?

《红秀GRAZIA》 浏览 14067

长江证券:求解,新年经济

网易财经 浏览 11583

霍启刚夫妇带儿子看舞剧,朱玲玲一同前往

娱乐团长 浏览 11965

华为鸿蒙全新MPV曝光!车长5米2,比腾势D9豪华,你看好吗?

网上车市 浏览 10848

博主自驾路过泸沽湖被强购门票 官方称系历史遗留问题

上游新闻 浏览 89354

秦岚魏大勋海南再被偶遇!情侣装好甜

一诺小海 浏览 18176

"最恨踢假球"的李铁栽了 足坛落马人员被查前屡唱高调

上游新闻 浏览 73046

卷翻了!刘强东砸100亿 向拼多多开战!

中国基金报 浏览 18152

美5名海军陆战队员在坠机事故中死亡

央视新闻客户端 浏览 11275

塔图姆谈防守华子:我所做的全部就是想告诉他 别想在今天爆发

直播吧 浏览 11777

《琅琊榜3》能否继续,孔笙表示剧本还在改,怕是“有生之年”了

最爱酷影视 浏览 10057

RMC体育:沙特代表已抵达巴黎,与内马尔会谈了解他转会的兴趣

直播吧 浏览 19210

官宣!张伟丽大战闫晓楠,争夺UFC冠军金腰带,中国德比创造历史

体坛扒客 浏览 11744

美媒称巴勒斯坦民众举白旗撤离遭以军射击

环球网资讯 浏览 11714

凯迪拉克锐歌将在3月迎来软件升级 国内用户有望同步

智车情报局 浏览 11389

国家统计局:6月上旬生猪价格环比持平

国家统计局网站 浏览 15309

记者:深足6月14日补发部分奖金,但今年队员还没收到过工资

直播吧 浏览 15351

Shams:太阳预计杜兰特能够在3月底&4月初回归

直播吧 浏览 18490

美国宣布从伊拉克撤军,特朗普的计划遭到多方反对

趣看热点 浏览 24828

掉队!第一省会,急了!

城市财经 浏览 10068
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1