关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者1971人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

豆瓣逆天9.6,世间再无如此大师云集的神作!

幕味儿 浏览 2260

桑德兰前锋伊西多尔:亨利发信息祝贺我,鼓励我继续前进

懂球帝 浏览 3651

采用六座布局 阿维塔旗舰SUV谍照首曝

车质网 浏览 219

Linux之父Linus配新电脑了!特别要求Intel锐炫B580显卡

快科技 浏览 2528

普通人冬天就该这么穿,衣服不昂贵、搭配不老气,简单又日常

静儿时尚达人 浏览 2461

虐囚事件发酵高官引咎辞职 以总理称遭"严重公关危机"

上观新闻 浏览 2884

C罗再谈曼联:架构出错阿莫林无法创奇迹,为此难过希望尽快复兴

罗米的曼联博客 浏览 2886

50+女性秋季穿搭新思路:告别卫衣,这4类上衣让你显嫩又有质感

静儿时尚达人 浏览 2895

50+女性秋冬穿搭指南,4个让年龄法则成为加分项,越穿越优雅

静儿时尚达人 浏览 1316

十五运会开幕式收视出炉!最高破3.9%,刘德华上场涨出小高峰

萌神木木 浏览 2338

今年春天最流行的4件卫衣,照着穿就很好看

LinkFashion 浏览 1209

AI代写论文公司曾申请精英人才商标

大象新闻 浏览 2715

荣耀“既Pro又Air”新机设计线稿首曝

IT之家 浏览 2105

Meta裁员后续:田渊栋被过河拆桥,姚顺雨等集体「抢人」

机器之心Pro 浏览 2920

赫罗纳3-3皇家奥维耶多,比尼亚斯破僵,戴维-卡尔莫扳平比分

懂球帝 浏览 3023

男子疑心梗住院被急诊医生误诊 转入普通病房后身亡

大风新闻 浏览 12749

知情人士:特朗普考虑有限打击逼伊朗达成协议

环球网资讯 浏览 1335

牛弹琴:印度耍流氓太不地道 难怪巴基斯坦要发飙

北京日报客户端 浏览 12937

罗马诺:鲍勃转会富勒姆谈判进最后阶段,曼城坚持要3500万镑

懂球帝 浏览 1918

辛纳晋级中网男单八强

体坛周报 浏览 3485

Krystal,终于等到你!

时尚COSMO 浏览 2028
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1