关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3613人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奇瑞瑞虎9家族全面上市 抢鲜价12.79万起

网易汽车 浏览 3517

王祖贤隐退真相曝光!王晶坦言两点

妙知 浏览 2889

牛弹琴:中国的强烈愤怒还在继续 日本有三个没想到

北京日报客户端 浏览 42969

插混车纯电续航超过210km,增程车怎么办?

汽车公社 浏览 1915

跨年晚会:王俊凯水中热舞 王嘉尔加入时代少年团

扒虾侃娱 浏览 1941

NVIDIA推出ChronoEdit:让AI图像编辑拥有物理常识的革命性技术

科技行者 浏览 2648

马斯切拉诺:拿不拿金靴对梅西的生活不会有太大改变

懂球帝 浏览 3022

会打扮的中年女人,冬季穿搭靠这3个套路封神!保暖还时髦

静儿时尚达人 浏览 2268

委内瑞拉防长:特朗普封锁加勒比海域是“妄想”

每日经济新闻 浏览 2184

投资铜条1公斤280元 网友再也不敢叫"破铜烂铁"了

北京商报 浏览 6289

190万赞的爆款女孩,等待代表作

时尚COSMO 浏览 1792

基准新规划定过渡期!近75%基金“及格线”或需调整

券商中国 浏览 2742

广东U20 1-0上海U20,张志雄绝杀

懂球帝 浏览 2669

英国防大臣称想"绑架"普京 俄方:痴人说梦

界面新闻 浏览 1844

长安林肯航海家燃油 SUV 新增“启航版”上市,24.59 万元

IT之家 浏览 3446

创新推出ACE SXFI蓝牙耳机,699元

IT之家 浏览 1634

赚了钱,反而有人说小鹏不是“小鹏”了?

速度计 浏览 2258

《王牌对王牌》:玩不到一起真尴尬

洲洲影视娱评 浏览 2636

延迟写《南京照相馆》?好电影,确实是对比出来的

娱乐官已上任 浏览 3667

大衣,白色的更优雅不凡!

Yuki女人故事 浏览 1541

警方通报小米成都车祸: 驾驶员涉嫌酒后驾驶

网易汽车 浏览 3059
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1