关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家344人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

研究生当海鸟监测员:日薪300元 报名竞争非常大

红星新闻 浏览 79991

克莱三分命中数达到2284记 超越杰森-特里排名历史第9!

直播吧 浏览 11737

今秋这件“瘦瘦衫”必穿!巨in巨洋气,上身瘦十斤!

Yuki女人故事 浏览 337

哈哈哈哈哈哈哈哈哈哈哈哈!!!

时尚COSMO 浏览 12040

美团:“明厨亮灶”补贴将增加至5亿元,已有30万商家加入

IT之家 浏览 361

不用等AI毁灭人类了!谷歌前CEO预言:明年美大选“一团糟”

财联社 浏览 14168

中国核动力潜艇在台湾附近发生事故?谣传!

澎湃新闻 浏览 13895

诸葛亮到底有多牛?死前留下一计,骗过了所有人,至今还是个谜 

趣看热点 浏览 24604

比亚迪:仰望U8豪华版预计8月正式上市,9月开启陆续交付

界面新闻 浏览 14503

鲁媒预测国足首发:徐新、吴曦搭档中场,张玉宁冲锋谢鹏飞登场

直播吧 浏览 11495

当朴敏英再演都市丽人,味道很对!

时尚COSMO 浏览 12089

滑板飞盘骑行穿搭图鉴 春季户外运动从头帅到脚

潮流有货 浏览 18400

王传福一统天下,分封十八路诸侯?

态℃ 浏览 14066

杨学增:连续客战使队伍出现一些伤病和疲劳 与浙江实力差距较大

直播吧 浏览 18169

女星直播带货收20万酬劳 3个月卖不到300被起诉

扒圈818 浏览 18371

一条百褶裙24套不重复穿搭 这位博主好会穿

七柒时尚笔记 浏览 18229

与中国“交好”,拿盟友“开刀”,战略已明朗

浏览 21642

马尔代夫:印度军事人员3月15日前须撤出

央视新闻客户端 浏览 11749

传腾讯正与Meta洽谈在中国销售Quest VR头显

爱集微 浏览 17925

京东二季度收入2879亿元 净利润66亿元

网易科技报道 浏览 13723

梁汝波内部讲话:多次提及“危机感”,2024年字节要“逃逸平庸的重力”

网易科技频道 浏览 11690
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1