关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者3069人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

委代总统称遭美威胁:马杜罗已死

每日经济新闻 浏览 2930

76岁“欢喜哥”许绍雄病危,tvb多名艺人紧急探望,众人神情严肃

不八卦会死星人 浏览 3879

有望首次入选全明星的球员:湖人里夫斯在列 杨瀚森队友有戏

仰卧撑FTUer 浏览 3396

俄总理签署决定 允许俄国防部终止多项双边协议

财联社 浏览 2742

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

IT之家 浏览 3951

收视爆了,梅婷一出手,就破了央视尺度!这剧能过审真是逆天

娱乐圈笔娱君 浏览 2943

特朗普施压伊朗:美军舰队规模比在委内瑞拉的还大

大风新闻 浏览 6951

名记:穆阿尼将继续留在热刺,尤文今夏将再次尝试引进他

懂球帝 浏览 2860

荣耀林林:整个行业成本趋势非常恶劣,二手机不排除会涨价

IT之家 浏览 3280

美官员:已收到伊朗通过巴基斯坦转交的谈判新方案

界面新闻 浏览 981

追觅俞浩内部放狠话:造车PK理想,手机跟华为小米三分天下;TP-Link芯片事业部全员解散;马斯克用亲信管理AI公司引发冲突丨雷峰早报

雷峰网 浏览 4735

记者:弗里克听说自己的明夏离队传闻后说“又是胡说八道”

懂球帝 浏览 3825

男子为女儿买房花30万装修 如今却站在门口不敢进去

1818黄金眼 浏览 33926

兰博基尼Murciélago 无可争议的“大佬级”超跑

CLauto酷乐汽车 浏览 3022

牛弹琴:特朗普没想到 抓马杜罗后西方情绪总体很稳定

现代快报 浏览 8108

IEA:如果有需要,仍可进一步动用更多石油储备

华尔街见闻官方 浏览 2077

大相径庭,维拉上赛季英超前五轮过后高居第3,本赛季仅第18

直播吧 浏览 4777

张雨绮风波持续发酵,曝多个商务被取消

扒虾侃娱 浏览 2992

委内瑞拉空军基地遭美袭击后 导弹碎片四散

极目新闻 浏览 3099

经济观察报:深圳4-4卓尔涉5000万的假球,没赢是李铁不想输

懂球帝 浏览 4068

苹果发布第二代Vision Pro开发者连接带,传输速率提升至20 Gbps

IT之家 浏览 3964
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1