关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家2348人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

轴距进行加长 奥迪A7L旅行版国内谍照曝光

车质网 浏览 334

高芙输球后更衣室摔拍遭外界批评,萨巴一句女人比男人耐热惹争议

网球之家 浏览 226

警方通报于朦胧坠亡,3位造谣者被处罚,调取监控排除刑事嫌疑

扒虾侃娱 浏览 2384

9个月出口571万辆车 中国汽车远征军杀出新血路

科学知识点秀 浏览 1318

2026年量产 特斯拉Cybercab将于进博会首发

车质网 浏览 1449

朱元璋变脸 研究学者:"鞋拔子脸"异像并非其真实面容

环球网资讯 浏览 18134

黄仁勋,亲赴台积电“要产能”

华尔街见闻官方 浏览 1300

范雨林:实力硬汉却不红,娶普通人低调过日子

失宠的小野猪 浏览 542

澳大利亚刚插手台海就收噩耗 中方杀鸡儆猴停特殊待遇

时时有聊 浏览 15696

《骄阳似我》顾漫花巨资买《遇见》《信仰》不是为庄序偏爱太明显

亦暖追剧随笔 浏览 481

A股利好,一夜之间多家公司密集宣布

21世纪经济报道 浏览 897

伊姐十一热推:电视剧《沉默的荣耀》;电视剧《是风动、是心动》......

伊周潮流 浏览 1508

张柏芝又飞澳洲陪Lucas读书,独自拿八九件行李

八斗小先生 浏览 103

让多图对话AI不再"搞混":首尔多所大学发现分隔符背后的秘密

科技行者 浏览 16

以硬核智能定义超值神车 尚界H5交付破10000台

网易汽车 浏览 1335

中国观众认定的烂片,北美观众当成宝,首周末破4.3亿夺全球冠军

靠谱电影君 浏览 1667

雷军直播四小时回应质疑

大象新闻 浏览 572

特斯拉成简配“鲶鱼”,中国品牌如何应对?

百姓评车 浏览 1430

ACEMAGIC阿迈奇预告M1A PRO+迷你主机,搭载锐龙AI Max+ 395

IT之家 浏览 1019

特朗普转发针对古巴强硬言论:鲁比奥将成"古巴总统"

环球时报国际 浏览 9899

中企在拉美花22个月建成的铜矿无法投产:总统换人了

每日经济新闻 浏览 7920
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1