关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4803人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

顶流男星陷“禁演”罗生门?

仙女事件簿 浏览 2276

视帝扛起大旗,终于有90后当主角的年代剧了

娱乐圈笔娱君 浏览 2923

湾区晚会名场面:小沈阳和女儿同框,肖战台下合照,歌手真唱翻车

萌神木木 浏览 3877

蚂蚁阿福声明:问答结果中无任何广告推荐、不存在商业排名

三言科技 浏览 2581

美股存储芯片全线爆发,美光科技猛涨10%,闪迪涨超9%,英特尔涨超7%,国际油价突破100美元

21世纪经济报道 浏览 747

AI再次降维打击人类 仅用1小时破译500年未解的"天书"

上观新闻 浏览 8050

“烟管裤”今年冬天爆火,怎么搭都时髦!

LinkFashion 浏览 3381

以军称打死哈马斯高级指挥 哈马斯发声

每日经济新闻 浏览 3364

迪马济奥:亚特兰大中卫斯卡尔维尼左腿屈肌拉伤,将缺阵3周

懂球帝 浏览 4209

E句话|工作室宣布向涵之单身?

仙女事件簿 浏览 2748

上海机场48岁总经理因个人原因辞职,上任仅9个月,去年年薪上百万元

红星资本局 浏览 4064

温州推出外卖后厨“AI 智能评价处置”系统

IT之家 浏览 4866

希金斯晋级斯诺克北爱赛八强

体坛周报 浏览 4048

50+女性秋季穿搭新思路:告别卫衣,这4类上衣让你显嫩又有质感

静儿时尚达人 浏览 3982

跟队:拜仁内部不会轻易谈论让伦纳特-卡尔踢世界杯的话题

懂球帝 浏览 4121

最爱发钱老板开工刷屏:2小时订单破亿 客户排队交钱

极目新闻 浏览 38830

"90后"王兴兴:小学时想当科学家 同学一句话启发了我

中国新闻周刊 浏览 9301

柬方:若停火持续72小时 泰国将遣返18名被俘柬士兵

潇湘晨报 浏览 3313

原来做自媒体的“成功心法”都是同一个

黎贝卡的异想世界 浏览 4007

2026首个巡回赛惨案诞生,萨巴伦卡化身早餐外卖员用时47分钟下班

网球之家 浏览 3178

海哈金喜力挺嫣然医院:为李亚鹏点赞,多年笨拙的坚持很不容易

扒虾侃娱 浏览 3071
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1