关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者2041人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

对话工程院院士王浩:我国独创的“河湖长制”值得向“全球南方”国家推广

封面新闻 浏览 2996

2025年10月我国新能源汽车销量占比超50% 历史首次!

智车情报局 浏览 2969

冲击330万目标!尹同跃再“吹牛”:AI追赶特斯拉,推17款AI车

明镜pro 浏览 1975

十年前,我们万万想不到

牛弹琴 浏览 2324

40余名高二学生被强收7500元网课费 两地教育局调查

大风新闻 浏览 16501

官方:新疆足球超级联赛5月至7月举办,分为南北区共14支球队

懂球帝 浏览 1372

还是这些穿搭适合初春季节!外套不多买、常穿裙子,优雅舒适

静儿时尚达人 浏览 336

官方:斯特拉斯堡中场帕普-迪奥普租借加盟图卢兹

懂球帝 浏览 2171

傅聪团队新作:OnePiece!通用生成式推荐模型新范式

学术头条 浏览 2930

共建链上数商生态,推动区块链与实体经济深度融合

文汇报 浏览 3104

特雷·扬和老鹰正式协商分手 奇才有意围绕CJ报价

体坛周报 浏览 2149

两人偷渡到柬电诈园"赚钱":一天骗五六个人应该差不多

大风新闻 浏览 19309

赵少康为何不参选国民党主席 陈文茜:他怕妻女怕得要死

海峡导报社 浏览 8096

向华强说娱乐圈明星美女他看不上眼:除了向太其他都没什么了不起

韩小娱 浏览 1994

中国“智”造闪耀国际舞台,“维度I型”无人机成功出海

红星新闻 浏览 3304

NBA战报:活塞122-117步行者取NBA12连胜,西亚卡姆24分

懂球帝 浏览 2705

PPIO姚欣:智能体需要全新的操作系统|MEET2026

量子位 浏览 2392

马斯克Grok 4.2炒股收益率夺冠

财闻 浏览 2014

特朗普:我说服了自己暂缓对伊朗采取军事行动

澎湃新闻 浏览 2015

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者 浏览 1918

律所主任疑"借款"9亿失联 客户有上百人最年长者88岁

界面新闻 浏览 6518
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1