关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家318人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

江西通报考生迟到37分钟进入考场:因暴雨受困跑步到达

江西省教育考试院 浏览 89979

日媒:日本政府试图暗改武器出口范围

环球网资讯 浏览 14510

恒大地产因信批违规被证监会立案调查

财联社 浏览 84323

2023年夏天鞋履趋势是“BIRKENSTOCK效应”?

潮人 浏览 14016

有钱人变老了:“新中年”消费崛起前夜

巨潮WAVE 浏览 18407

媒体:瓦格纳去了白俄罗斯 更戏剧性的一幕发生了

上观新闻 浏览 14429

美最高法院驳回苹果诉Epic Games案 后者需求也遭驳回

手机中国 浏览 11511

东方空间引力一号国内首次完成火箭垂直状态远距离海上运输试验

IT之家 浏览 10075

TA分析切尔西转会:寻求至少再引进一名进攻球员,已询问了伊萨克

直播吧 浏览 9849

普京酝酿的“重大行动”,会给中国带来机遇?

浏览 21421

王毅和乌外长一见面 对方就主动紧紧握住王毅的手

环球时报新闻 浏览 18607

跌破发行价!市值较巅峰蒸发80%!美团跌落神坛?

上游新闻 浏览 11568

汇丰在美国法院受挫,因“挖角硅谷银行员工并窃取商业机密”面临超10亿美元诉讼

界面新闻 浏览 11344

新版《聊斋》杀青,六个单元主演全亮相,林允、宋祖儿倾力加盟

最爱酷影视 浏览 311

美媒:美国陷入困境 拜登正对内塔尼亚胡失去耐心

环球网资讯 浏览 75706

乐视被指是"打工人天花板" 其负债仍超过200亿

潇湘晨报 浏览 68551

广东再发现变异新冠,这一次是来自尼日利亚

趣看热点 浏览 748385

Vision Pro被科技博主吹爆,却难掩四大致命硬伤,初代产品谨慎买

雷科技 浏览 15418

数据网站晒恩比德荣誉:6次全明星&5次最佳阵容 22-23赛季MVP

直播吧 浏览 13290

不降价的蔚来也优惠了!最高降4万,ET5降到19.8万起?

Nice好车 浏览 11547

中了一个亿的支付宝锦鲤信小呆发布视频,讲述她中奖后这几年的经历和现状

趣看热点 浏览 24429
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1