关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者0人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国“智”造闪耀国际舞台,“维度I型”无人机成功出海

红星新闻 浏览 1446

《阿凡达3》票房预估214亿,195分钟一刀不剪,力争影史第一

娱乐圈笔娱君 浏览 716

以军称继续在加沙地带多地展开军事行动

环球网资讯 浏览 11292

新奥能源研究院院长刘敏胜:探索球形环氢硼聚变技术,开发商用聚变能源

红星新闻 浏览 1452

12岁青训球员解约被索要18万违约金后 又遭索赔266万

新京报 浏览 15703

OpenAI CEO将重返董事会

雷递 浏览 12387

小个子不要为显高发愁 一条牛仔裤轻松搞定

男士穿衣搭配杂志 浏览 20361

胖东来员工与顾客争执获补偿 公司发布8页调查报告

金羊网 浏览 90696

零跑D19定档10月16日,旗舰SUV全球首秀

网易汽车 浏览 2187

上班族秋天穿什么?衬衫为主、外套选择基础款,得体又大方

静儿时尚达人 浏览 2483

一个阮经天,打脸了多少内娱“影帝”,还有号称投资几亿的烂片

最爱酷影视 浏览 12840

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 2030

红海危机持续发酵 著名咨询公司警告:供应链受损程度已显著超过疫情早期

智通财经 浏览 13319

深圳“清朗”行动发布通报:查处一批恶意营销、滥用AI账号

南方都市报 浏览 236

千万富翁王晓举寻亲成功,妻子举动让人泪目

史行途 浏览 2150

雅阁降5万,凯美瑞降3万,日系车为了销量真“拼”了?

车域无疆 浏览 11083

境外网友发图称福建舰甲板裂缝 美智库驳斥

环球网资讯 浏览 16362

多给2分钟来背锅?大帝25分钟20+6丢绝杀 马克西才该为失利担责

颜小白的篮球梦 浏览 1233

直接避开佟丽娅基因,陈思诚儿子帅出新高度,父子如复制粘贴

娱乐圈笔娱君 浏览 1909

特朗普遇到"反关税"广告:再给加拿大加10%关税

红星新闻 浏览 6670

说它抄袭,打脸了吧

独立鱼 浏览 139
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1