关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4666人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

看看这些穿搭就知道,秋季穿衣很简单,找对方法舒适又得体

静儿时尚达人 浏览 3760

泽连斯基:下周计划与欧洲伙伴举行会谈

北青网-北京青年报 浏览 2324

10000亿中芯国际,一剑封喉!

飞鲸投研 浏览 3364

国米官方:博尼左膝轻微扭伤,将在下周接受进一步评估

懂球帝 浏览 3262

冬天就要和金靖一样穿得暖呼呼的

时尚COSMO 浏览 3136

以军夜间大规模空袭加沙城 坦克已入城

每日经济新闻 浏览 4593

闫学晶和儿子接连道歉 儿子连说两遍"娘的错儿子担"

北京日报 浏览 13304

双十一购物不烧脑!看AI全能搭子荣耀Magic8如何重塑消费体验

新熵 浏览 3931

宽基ETF被抢筹,市场风格走向何方?

国际金融报 浏览 3275

纳帅:尊重马扎加入阿尔及利亚,但选择国家队应出于自豪感

懂球帝 浏览 3733

9.4分剧王回归,封神到最后一秒

独立鱼 浏览 3314

全球车企一哥,急需纯电车市场!

懂车之道 浏览 3369

特朗普:美国还将增加航空母舰数量

每日经济新闻 浏览 3122

“恨海情天仙品CP”郭晓婷王天辰将合体拍杂志

手工制作阿歼 浏览 2255

现场视频:解放军无人机视角看台北101大厦

央视新闻 浏览 2183

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者 浏览 2979

茸城她故事丨毋冬梅:以柔肩担重任,用匠心筑梦浩瀚星河

上观新闻 浏览 2303

惨!周星驰电影5天票房仅86万,时代抛弃你时,连句再见都不会说

娱乐圈笔娱君 浏览 3407

价格倒挂加剧,经销商危机恐反噬整车厂

汽车人传媒 浏览 4689

诺丁汉森林公布扩建主场计划,将把主场扩建到52000座

懂球帝 浏览 3244

Robotaxi发生伤人事故 哈啰出行自动驾驶业务暂停运营

界面新闻 浏览 21109
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1