关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者1979人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

满配华为全家桶 岚图追光L将上市

网易汽车 浏览 2447

470场,格列兹曼追平科利亚尔并列马竞队史出场榜第5名

懂球帝 浏览 2350

业主84万元新房被粪水环绕 管道一天直排粪水10余次

潇湘晨报 浏览 6028

郝蕾暗讽辛芷蕾,内娱回到十年前了?

大龄女一晓彤 浏览 2683

美军曾复刻马杜罗住宅进行破门演练 动手第一步是断电

红星新闻 浏览 9687

马斯克的「移动客厅」又火了:20人座无方向盘,每公里才3毛钱

机器之心Pro 浏览 2304

马克龙透露约20国将组建"威慑部队" 以保障乌克兰安全

看看新闻Knews 浏览 32418

两女生称花90多元入住成都民宿 在空调管道发现摄像头

极目新闻 浏览 105471

未成年女性称被爱泼斯坦当"孵化器" 还遭公司高管强奸

红星新闻 浏览 99323

张雪峰团队峰学蔚来复播,全网泪目!

销售与管理 浏览 257

熊园:10月新房和二手房销售均走弱

首席经济学家论坛 浏览 2854

看完《阿凡达3》,心情很复杂

独立鱼 浏览 1783

孔蒂:球迷应忽略球队的谣言;欧洲裁判比意甲好?我不聊这个

懂球帝 浏览 2872

广东大胜西班牙球队1喜3忧!二老老寒腿,张昊无球权,张皓嘉辣眼

篮球资讯达人 浏览 3035

桑托斯3-1科林蒂安,罗埃塞点射破门,巴雷亚尔传射

懂球帝 浏览 3279

"闪赎闪卖"一座万达广场 王健林也玩起"资本游戏"?

BT财经 浏览 2410

每体:老佛爷想立即解雇阿隆索,但身边人士说服他不让其下课

懂球帝 浏览 2334

罗永浩质疑大金中央空调;摩尔线程首款AI电脑发布丨邦早报

创业邦 浏览 2310

阿森纳本赛季3次单场通过角球打进至少2球,同期英超球队最多

懂球帝 浏览 2031

政府“停摆”持续,美国家核安全管理局千余名员工将被强制休假

界面新闻 浏览 3141

亚历山大:我不会做招惹对手说垃圾话的事,只会拿30分赢球走人

懂球帝 浏览 3078
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1