关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家2682人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者 浏览 1733

英国美女狱警与重刑犯多次发生不正当关系 让囚犯把风

中国新闻周刊 浏览 2967

中国加速构建具身智能数据标准体系 “浦江X”平台发布

上观新闻 浏览 2397

奇瑞QQ3量产版曝光! 轴距2米7配8155芯片

Ai爱车 浏览 1036

下半场7中0背锅?威少8+10+7吞三连败 美记:本有机会染指最佳PG

颜小白的篮球梦 浏览 1208

说它抄袭,打脸了吧

独立鱼 浏览 704

今日热点:《怪奇物语》番外动画剧预告;NEWBEAT签约摩登天空……

伊周潮流 浏览 1460

诺贝尔文学奖得主迷恋中国 要求全家改用筷子吃饭

中国新闻周刊 浏览 1972

徐帆带徐朵参加活动,徐朵发文回应质疑

无处不风景love 浏览 819

说一个令很多人不安的事:比亚迪,越来越像理想了

小李车评李建红 浏览 1957

TA:温格擅长从宏观层面谈论足球,他不适合参与修改足球规则

懂球帝 浏览 805

界外球都判错!西亚昏哨8次不利判罚气炸U23国足众将,王钰栋质问

我爱英超 浏览 811

国企董事长上门殴打他人被行拘3天 本人拒绝回应

大风新闻 浏览 5119

何晴一生演遍四大名著,负了刘威嫁了许亚军,最后陪伴她的却是他

不八卦会死星人 浏览 1019

三星One UI 8.5前瞻:基于安卓16,引入情景感知AI

IT之家 浏览 1444

中企在非洲因环境问题引争议 遭800亿美元天价索赔

澎湃新闻 浏览 38645

恰20:今天我们运气不错,我们要努力达到我们应得的位置

懂球帝 浏览 1749

普通人穿衣别太发愁,学会这些基础穿搭,舒适大方又省时间

静儿时尚达人 浏览 1940

上海工厂生产 廉价版特斯拉Model 3韩国开售

车质网 浏览 680

全网围观,这年度夫妻撕叉大戏来了

独立鱼 浏览 1609

科学家重构常见抗癌药物:使其疗效提升两万倍,同时副作用更低

IT之家 浏览 1750
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1