关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3597人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今日热点:电影《得闲谨制》定档;成毅回应《两京十五日》拍摄受伤……

伊周潮流 浏览 2247

2019年资金荒隐现?全球货币市场流动性趋紧信号显现

华尔街见闻官方 浏览 2772

中航大学:AI聊天机器人的"假身份证"攻击如何骗过智能助手

科技行者 浏览 2843

十五五规划建议共15个部分61条 分三大板块

界面新闻 浏览 5216

牌桌被掀,中国模型换了一种赢法

36氪 浏览 1814

网红基金,历史性暴跌

中国新闻周刊 浏览 1630

34年来首次 普京下令起草恢复核武器试验提议

红星新闻 浏览 2585

50岁女人穿衣,记得色不过三、衣不紧身,照着穿想不气质都难

静儿时尚达人 浏览 2776

她与名导同居多年被抛弃,如今复出却无人问津

吴蒂旅行ing 浏览 2251

4岁女童在温泉酒店泳池溺水 两名女子跪地抢救20分钟

红星新闻 浏览 91436

文旅上市潮,进入Next Level

斑马消费 浏览 2794

雷军怒了!澄清其言论被断章取义

电动知家 浏览 2053

今日热点:王鹤润方向王玉雯道歉;正午阳光辟谣《琅琊榜3》阵容信息……

伊周潮流 浏览 733

朱珠:逐渐淡然,依旧鲜活

时尚COSMO 浏览 2228

“小棕鞋”今年春天太流行了!这3双怎么搭都好看

LinkFashion 浏览 892

队报:比赛中拉门斯的长传频繁且精准,推动了曼联的战术转型

懂球帝 浏览 2762

2026款小米SU7即将上市!最高纯电续航902Km

小史谈车 浏览 765

以军空袭加沙多地致至少28人死亡

环球网资讯 浏览 1540

美媒感叹:中美已不存在贸易战了 中国巨轮势不可挡

澎湃新闻 浏览 14252

一年要卖出400万辆车,零跑汽车发布未来十年战略

贝壳财经 浏览 2023

月销破2万辆 极狐年销翻番在望 摸到准一线门槛

乐逗汽车 浏览 2548
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1