关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4718人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

电动Jeep曝新国产计划:或使用猛士技术,首车在2027年上市

明镜pro 浏览 4126

人类会彻底沦为无用阶级吗?

虎嗅APP 浏览 3464

小将谢泼德与考文垂签下职业合同,球员受到曼联、阿森纳关注

懂球帝 浏览 3436

“花式”揽储:有银行送鸡蛋吸引他行储户,多家中小银行上调存款利率……

中国基金报 浏览 3060

亚马逊美股盘前涨幅扩大至5%

证券时报 浏览 3412

为“打击贩毒” 美军调派“福特”号航母至加勒比海

央视新闻客户端 浏览 2867

今年秋冬流行“漏斗领外套”,时髦又高级!

LinkFashion 浏览 3343

东体:地区超重塑观众的心理认同,足协应让草根和职业贯通

懂球帝 浏览 4016

年度总结|| 2025年学会的8件小事

黎贝卡的异想世界 浏览 3141

对话比亚迪路天:王朝的真正对手 是"未来的自己"

网易汽车 浏览 3657

巴基斯坦俾路支省反恐行动打死145名恐怖分子

上观新闻 浏览 2840

台陆军运输群车队两辆军用卡车相撞 画面披露

环球网资讯 浏览 3819

魅族 22 手机推送 Flyme 12.3.1.3A 稳定版更新

IT之家 浏览 3802

俄美乌首次三方会谈在阿联酋举行

环球网资讯 浏览 2854

陈坤儿子的生母,早在14年前就公开了?

归史 浏览 4571

麻省理工学院教授文小刚追忆杨振宁:他是近代物理的伟人

澎湃新闻 浏览 4199

美媒:乌克兰向美国提交对最新“和平计划”的回复

澎湃新闻 浏览 3306

人类史上最大抄家案?华人受害,美国却狂揽1070亿

大猫财经Pro 浏览 3637

美乌柏林两日会谈后 特朗普、泽连斯基同日发声

环球时报国际 浏览 18319

香!嘴巴跟着他真是享福了

吐槽电影院 浏览 3489

马杜罗社交平台发布照片 配文称"被绑架已11天"

红星新闻 浏览 8597
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1