关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4923人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

春季穿衣没那么复杂!有这些穿搭值得借鉴,高级舒适又不老套

静儿时尚达人 浏览 937

外国女教师性侵16岁男学生数月上百次 详情炸裂

胡侃社会百态 浏览 39540

中年女人想穿得时髦,少穿羽绒服+紧身裤,换成这些好看保暖

静儿时尚达人 浏览 3813

ESPN:因内马尔的身体状况和高额薪资,桑托斯不急于和他续约

懂球帝 浏览 4317

聚焦进博|中资银行“金”点子护航进博会

国际金融报 浏览 3998

媒体:欧盟触碰伊朗"红线" 伊朗对欧洲的批评很醒目

环球网资讯 浏览 9702

苹果M5芯片,击败高通新旗舰

半导体行业观察 浏览 4388

这年头长得好看也成错了?!

伊周潮流 浏览 2166

波兰官员称中方不愿迫使俄结束乌克兰危机 外交部回应

澎湃新闻 浏览 4871

成本3元卖60元,“99%高纯”磷虾油实测核心成分为0!百年同仁堂“栽”在贴牌上

国际金融报 浏览 3560

星空相册|天宇上演木星伴弦月

新华社 浏览 4417

美印友谊的中流砥柱被FBI大张旗鼓拘捕 被控"串通中国"

澎湃新闻 浏览 9747

大众与众08实车曝光 提供两种动力可选

车质网 浏览 4096

U23亚洲杯身价榜:中国第三力压日韩,沙特居首伊朗次席

懂球帝 浏览 3279

佩罗内谈2-0尤文:我们已形成胜利心态,相信自己能赢任何球队

懂球帝 浏览 4205

无论女人多大年纪,秋天都要准备几件“针织衫”,温柔舒适

静儿时尚达人 浏览 4044

内维尔:姆伯莫的射门相当离谱且草率,他需要改进临门一脚

懂球帝 浏览 3564

闪迪SSD将涨价超100%!且必须全款

快科技 浏览 3112

农妇遭错判寻衅滋事罪被羁押507天 获30万元国家赔偿

扬子晚报 浏览 5565

媒体:执政半年 李在明抓住了一个关键窗口期

澎湃新闻 浏览 9306

小鹏旗下又一公司秘密提交IPO

电动知家 浏览 3358
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1