关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家2063人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

慢镜头:米兰、尤文和三家英超俱乐部对热苏斯感兴趣

懂球帝 浏览 1079

果然冬天穿大衣才更显气质优雅,中年女人学会这些技巧,时尚好看

Yuki时尚酱 浏览 13915

中泰证券裁员,不想做投行了?

BT财经 浏览 16795

美CPI降温别高兴太早:经济学家怀疑政府关门导致数据失真,有人指明显出错

华尔街见闻官方 浏览 436

刚说淘汰中国激光雷达,最后希望的 Luminar 就破产了?

差评XPIN 浏览 421

15岁女孩被同学父亲强奸后宿舍产子 辍学带娃陷入困境

上游新闻 浏览 89578

拍AV,成为日本00后女孩的“最好出路”

她刊 浏览 16314

吕丽君女儿正脸照罕曝光,犹如翻版刘銮雄!

娱乐团长 浏览 437

提升冬日幸福感的8件小事,放松又治愈

LinkFashion 浏览 893

伊姐周六热推:电视剧《余生有涯》;电视剧《猎豹》......

伊周潮流 浏览 1435

短剧泛滥成灾,燃起观众热潮与烦恼

喜欢历史的阿繁 浏览 63

中国驻美大使谢锋向拜登总统递交国书 拜登欢迎其履新

新京报 浏览 91028

名记:威少对去海外打球的兴趣为零,他专注于在NBA打球

懂球帝 浏览 1311

Sam Altman、Hinton中国首秀!国内最硬核AI内行盛会圆满闭幕,国产大模型「悟道3.0」全面开源

新智元 浏览 16872

杨明洋:感谢罗慕洛为我助攻,也感谢南通球迷一直支持我

懂球帝 浏览 1344

霍建华酒后和女粉合影满脸通红 不修边幅满眼迷醉

盖饭娱乐官方号 浏览 19722

马斯克:我更喜欢磷酸铁锂电池 可充电到100%

盖世汽车 浏览 20629

众星时装周路透:张嘉倪瘦脱相,刘涛低调素颜

盖饭娱乐官方号 浏览 19847

被这些中年妈妈美到了!原来发不过肩,搭配优雅,到老也高级

静儿时尚达人 浏览 13323

今年爆火的“知识分子”穿搭 优雅又高级

巧百搭 浏览 15545

限韩令太正确!全智贤辱华不道歉,林允儿发文挑衅,韩星嚣张得治

不八卦会死星人 浏览 1932
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1