关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3863人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国拿出比稀土更致命的王牌美国"破防" 万斯:要冷静

时时有聊 浏览 7176

她连上5次春晚,私下却和恩师同居怀孕被骗流产

律便利 浏览 3071

紫牛头条|“龙虾”控制微信发红包传言是玩笑,全民养“虾”让不少网友产生“AI焦虑”

扬子晚报 浏览 1222

瓜帅:维拉一直是最难对付的对手;多库的1对1能力让他很特别

懂球帝 浏览 3078

海南封关,就能半价买豪车了?

汽车公社 浏览 2469

阿莱格里:有的球员值1亿有的值100万,让1亿的上就是容易赢

懂球帝 浏览 2139

日政坛震荡首相或换人 石破茂一句话判高市早苗"死刑"

北回归线 浏览 13465

穆勒:我认为这场美职联决赛非常棒;再次见到梅西他们很开心

懂球帝 浏览 2508

大众中国市场2025年交付269.38万辆,同比减少8%

IT之家 浏览 2057

韩华航空航天公司与挪威签署9.22亿美元火箭发射器供应合同

财闻 浏览 1865

首艘美国船被罚之际 特朗普调2艘航母部署中国周边

现代小青青慕慕 浏览 6733

专访陶一伟:离开特斯拉,用300美元“开源手”挑战老东家

蓝鲸新闻 浏览 3043

惨!周星驰电影5天票房仅86万,时代抛弃你时,连句再见都不会说

娱乐圈笔娱君 浏览 2556

警方通报荣梓杉李禹熹纠纷

韩小娱 浏览 2868

三年半亏19亿,行政处罚超400条,享道出行IPO了

市值Observation 浏览 2911

纯电移动"游戏机" 索尼本田合资AFEELA 1亮相CES

网易汽车 浏览 2115

写了10年流行色,今年这个真的很适合亚洲人

黎贝卡的异想世界 浏览 2477

萨巴伦卡取得年终总决赛两连胜

体坛周报 浏览 2904

卫报:西汉姆是老板沙利文的一言堂,缺乏监督也不尊重专业知识

懂球帝 浏览 3701

50+女人的穿搭封神技巧来了,抓准这4点,轻松穿出简约高级感

静儿时尚达人 浏览 2079

冬天的“销冠”,已被羽绒服预定

时尚COSMO 浏览 2208
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1