关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家2693人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

太突然,宜家中国宣布:关闭7家商场

深蓝财经 浏览 708

詹姆斯谈保罗退役:希望他能好好享受最后的赛季,他已无遗憾

懂球帝 浏览 1467

董明珠的言语经常惹争议,但是她做的事为何都做对了?

BT财经 浏览 621

美政府停摆15天白宫放话要裁1万人 女法官颁令叫停

红星新闻 浏览 7179

米体:罗马全力追求卡拉斯科,已向利雅得青年提交首份报价

懂球帝 浏览 777

中超第27轮传球成功率榜:国安89.6%居首,时隔5轮再次登顶

懂球帝 浏览 1760

遭美国施压 卡尼:加拿大无意与中国达成自由贸易协定

环球网资讯 浏览 4743

美股开盘三大指数涨跌不一 英伟达跌近2%

证券时报 浏览 1445

新能源车双税新政发布,郑州消费者该“下手”还是“等等”?

大象新闻 浏览 2034

特斯拉Q3销量首超梅赛德斯奔驰,一个时代终结了?

江瀚视野 浏览 1981

五六十岁女性别瞎穿,教你三步解锁优雅气质,轻松告别油腻感

静儿时尚达人 浏览 1862

百年变局之下,广汽的“破局”之道

智谷趋势 浏览 1066

命名Peaq 斯柯达全新纯电七座SUV今年发布

车质网 浏览 800

邮报:利物浦体能教练正帮维尔茨提升身体素质,从而适应激烈对抗

直播吧 浏览 2571

新华社:2026世界有7大悬念 或将深刻影响国际政经格局

新华社 浏览 6803

第一次见有人被官方认证吹牛!内娱这位“老师”简直让人笑掉大牙

娱乐圈笔娱君 浏览 1628

记者问批评球员是否担心更衣室反对,穆帅:你爸对你永远都很好?

懂球帝 浏览 1480

巴黎时装周|来看,全世界最美的衣服

LinkFashion 浏览 2011

朱媛媛离世5月后,辛柏青再传坏消息

乡野小珥 浏览 1731

国庆出游,就要这么“出彩”!

Yuki女人故事 浏览 2729

突发!万科郁亮辞任

财通社 浏览 859
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1