关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家2870人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“国产GPU四小龙”扎堆上市,摩尔线程会成为史上最赚钱新股吗?

郭施亮 浏览 1566

斋戒期间突尼斯联赛下午一点比赛,终场哨响两队球员体力不支均趴窝

懂球帝 浏览 140

岛内民调:63%台湾民众不愿自身或家人上战场

海峡导报社 浏览 1178

好心载同事却出车祸遭索赔 法院:司机承担60%赔偿责任

极目新闻 浏览 7294

厂房沉降纠纷缠身,熊猫乳品两大募投项目延期

时代周报 浏览 1131

格林伍德2025年联赛打进22球法甲最多,为2018年后马赛首人

懂球帝 浏览 1379

郭宇欣刘萧旭太原盛典现场互动 太甜了

生性洒脱 浏览 1669

刘强东朋友圈疑曝光,自嘲在老婆面前失去没自信

柠檬有娱乐 浏览 1931

“这件羽绒服”今年冬天又火了,怎么搭都时髦保暖!

LinkFashion 浏览 1423

企业在自然保护区建研学机构烂尾7年 致百亩农田荒废

封面新闻 浏览 7144

高市一度被贴上"安倍女孩"的标签 潜在内阁成员被披露

政知新媒体 浏览 7170

养乐多卖不动了?

斑马消费 浏览 2114

纳帅:特尔施特根是否在豪门不是关键,重要的是他要上场比赛

懂球帝 浏览 1831

宝马M3旅行版正式上市 售价94.39万元

车质网 浏览 1609

“长安系”再落关键子:王辉亲掌阿维塔董事长

网易汽车 浏览 2953

女生希望"慢慢相处" 男子以送早餐为名进酒店实施性侵

红星新闻 浏览 11245

男子假期嫖娼被抓7年后被银行发现辞退 官司打到高院

扬子晚报 浏览 8159

微软官方确认:Windows 11任务管理器出问题了!

快科技 浏览 1933

命运多舛的英伦跑车:解读Marcos Mantis历史

老爷车 浏览 1235

山西多地连续阴雨致农作物发霉 当地要求"抢收抢种"

极目新闻 浏览 2303

京东把榜一大哥整不会了

老斯基财经 浏览 1964
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1