关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家312人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年最好看的10件半裙

LinkFashion 浏览 14899

“输血”5亿美元恒大汽车不太够,虚虚实实的白衣骑士看不懂

北京商报 浏览 13285

李书福:马来西亚供应链成本比中国高30%,吉利将建立本土化体系

第一财经资讯 浏览 9891

7位割双眼皮的女星 大方承认口碑更好

FancyMusic 浏览 13637

专家:胡塞武装接连攻击 美方组建多国部队是火上浇油

北京日报客户端-长安街知事 浏览 72406

增速惊人:我国今年已有100万人买30万元以上的汽车

36氪 浏览 14031

重庆又来了个鼠头鸭

顾子明说 浏览 14562

张艺谋新片《狙击手》定档7月30日,网友直呼拍片子的速度很快

趣看热点 浏览 26706

为上清华15次参加高考 35岁广西考生:真没有那个实力

半岛晨报 浏览 90083

一线城市楼市全面复苏,点燃全国房地产?2024楼市大事件来了

资本百科 浏览 11472

售价47.8-66.8万元 2025款捷豹F-PACE正式上市

网易汽车 浏览 9490

大S向柴智屏表明离婚意向,妈妈称大S说的是气话

趣看热点 浏览 26899

3年200亿 高景太阳能高估值暗藏风险

北京商报 浏览 14580

布林肯抵达越南 欲将美越升级为全面战略伙伴关系

环球网资讯 浏览 17735

陈赫持股贤合庄被列入经营异常 其为第一大合伙人

网易娱乐 浏览 18411

这四种风格的裙子 千万不要轻易尝试

潮人方法论 浏览 14687

唐玄宗苦恼武则天的烂摊子这人一当宰相瞬间解决问题

趣看热点 浏览 24044

火箭老板宣布未来退役哈登球衣:他创造了很多回忆

网易体育 浏览 25566

已生龙凤胎?何超莲近照曝光 身材纤瘦力破谣言

扒虾侃娱 浏览 15110

张继科新身份出炉:成某俱乐部技术顾问 深陷赌博丑闻消失9个月

醉卧浮生 浏览 11515

记者:34岁前锋伊哈洛免签加盟沙特俱乐部麦加统一

直播吧 浏览 13204
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1