关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者1975人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

财经早餐:英伟达50亿美元收购英特尔股份;美股三大指数齐创历史新高

网易财经 浏览 3868

马斯切拉诺:拿不拿金靴对梅西的生活不会有太大改变

懂球帝 浏览 3155

购置税全免 iCAR V27量产下线开启预定

网易汽车 浏览 2054

浪姐7乱成一锅粥,谁都没想到翻红担当竟然是她

黎贝卡的异想世界 浏览 232

牛弹琴:中国的两个邻国大打出手了 战况很惨烈

大象新闻 浏览 6455

田震国籍争议再发酵:明星养病选国外总造质疑

娱乐欣赏图 浏览 2313

甜了10年,超多暧昧细节,全网求他俩原地结婚

Yuki女人故事 浏览 1876

香港火灾初步调查结果:贴在窗户上的发泡胶板高度易燃

南方都市报 浏览 17167

留几手为闫学晶叫屈?称网友自卑敏感

小徐讲八卦 浏览 2060

宝马将采取油电并存策略,董事会成员高乐称“内燃机永不会消失”

IT之家 浏览 3905

五年十代攻关 浙大成功培育高锌水稻“全能选手”

环球网资讯 浏览 3152

曾毅手表事件休整后首次露面,发布新团队全家福

迷迭香的记忆a 浏览 2273

《御赐小仵作2》空降续集开播!最新口碑出炉,观众评价一针见血

娱乐圈笔娱君 浏览 2023

售17.98万起 方程豹钛7首周上险量为1257台

网易汽车 浏览 3771

贾跃亭发布大消息:旗下机器人业务重大进展

电动知家 浏览 1922

加沙地带民防部门:以军袭击一车辆 同一家庭9人死亡

央视新闻客户端 浏览 3147

美拉德+黑蓝白,太好看了!

Yuki女人故事 浏览 3610

技能养宠人,好麻烦,好费钱!

时尚COSMO 浏览 3046

美威胁停买"中国油" 专家:或闹乌龙 为"废弃食用油"

环球时报新闻 浏览 6802

2026年央视春晚彩排开始!沈腾马丽回归,但呼声最高的是他们

娱乐圈笔娱君 浏览 2110

媒体:特朗普暂缓对伊朗动武决定

财联社 浏览 1937
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1