关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者3118人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以AI治AI 推动智能向善 巨量引擎商业安全开放日在京举办

一点财经 浏览 4097

上汽大众2025全年终端销售106万辆 12月单月终端销售9.6万辆

网易汽车 浏览 3273

聚辰半导体冲刺港股:9个月营收9.3亿利润3.1亿陈作涛控制24%股权

雷递 浏览 3078

售价更低 荣威i5新版本车型发动机参数下调

车质网 浏览 4248

詹姆斯正建造两栋豪宅!11000平米一分为二:为布朗尼准备婚房?

罗说NBA 浏览 3339

新年专场|| 你们都找我要链接的好物,这次终于补货了

黎贝卡的异想世界 浏览 2915

002931,董事会提前换届! “人形机器人第一股”实控人进驻

证券时报e公司 浏览 182

中国机器人组团出征CES,加速进化首日售出数十台,魔法原子海外收入占比过半

红星资本局 浏览 3093

《一路繁花2》首波口碑,一针见血!

崽下愚乐圈 浏览 4095

高市早苗曾叫嚣台湾有事日本必入

极目新闻 浏览 4019

算法工程师想在女友面前秀技术“养龙虾”,结果文件夹被全删 周鸿祎称“龙虾”更像个实习生

红星新闻 浏览 2243

有爱,大马丁赛前与家乡球队阿尔多希维的球迷交换球衣

懂球帝 浏览 4195

皮尔斯:如果我和詹姆斯年纪相同,他绝对不可能拿到4座冠军

懂球帝 浏览 4127

孙俪、罗晋53集都市职场剧,阵容强大,值得一看

楠鱼 浏览 4873

即将结束非洲之旅,网红Speed受邀观战非洲杯决赛并获赠球衣

懂球帝 浏览 3097

汽车破窗有店铺销量陡增 新能源汽车双层玻璃无效

快科技 浏览 4229

记者:联赛结束后海港队的人就说过,申花队要买拉斐尔-拉唐

懂球帝 浏览 2940

特尔:定位球让英超观赏性变差了,看着很无聊

懂球帝 浏览 2267

搭激光雷达/纯电续航506km 长安启源全新Q05开启盲订

网易汽车 浏览 4308

北京自闭症男童苍山走失身亡 父亲1周7天扎在单位加班

红星新闻 浏览 8984

徐正源:永不言弃是成都强大的DNA 韦世豪伤情要等明天才有结果

直播吧 浏览 4920
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1