关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者914人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

致敬 S14 第五冠队服,雷蛇推出巨甲虫 V2 Faker 款游戏鼠标垫

IT之家 浏览 2196

向太儿子向佑近照流出 威胁父母“不给钱我就去借”

鲁中晨报 浏览 5613

国盾量子董事长吕品去世:上任半年多 年仅46岁

时代周报 浏览 1334

活塞13连胜追平队史纪录!揭秘东部黑马再次蜕变:冲击队史第4冠

罗说NBA 浏览 1568

精读季报丨好气!姜诚管理规模掉到115亿元,相较巅峰缩水1/4

一地基毛 浏览 788

这双鞋太流行了,比芭蕾鞋更少女,比玛丽珍更优雅

LinkFashion 浏览 1652

美日通电话后欧洲集体变脸 日本对华提出一个新要求

博览历史 浏览 30040

美国11月密歇根大学消费者信心创逾三年新低,短期通胀预期上升

华尔街见闻官方 浏览 1818

金鸡奖成“照妖镜?

柠檬有娱乐 浏览 1702

章子怡晒照为女儿醒醒庆生!

韩小娱 浏览 970

从50天4场到21天0场!34岁张水华被处分后静悄悄 为工作牺牲爱好

风过乡 浏览 1214

“单亲妈妈”叶珂哄娃引热议 网友:黄晓明不管么

韩小娱 浏览 1466

武汉女子遭遇APP投资骗局:起诉被驳回 警方又不立案

上游新闻 浏览 7782

新增蓝牙数字钥匙 迈腾3000万辆甄选款17.49万起

网易汽车 浏览 2123

大众中国市场2025年交付269.38万辆,同比减少8%

IT之家 浏览 926

曾经的环球小姐冠军,却一手好牌打得稀烂

历来纵横 浏览 2070

特朗普:格陵兰岛非常重要 北约若离开了美国啥也不是

澎湃新闻 浏览 10589

2025最流行的摩卡慕斯色,配牛仔蓝太好看了!

LinkFashion 浏览 2899

梁靖崑一脸沮丧令人心疼!10-6手握赛点被逆转 腰伤困扰他9个月

颜小白的篮球梦 浏览 1531

“这条裙子”今年冬天火出圈,全世界的时髦女人都在穿

LinkFashion 浏览 1235

30万的玛莎拉蒂,被一抢而空!超跑皇后暴击中国人

象视汽车 浏览 1235
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1