网易有道推出业内首个14语种无口音免文本语音克隆模型

2026-06-23 16:25

　　新浪科技讯 6月23日下午消息，近日，网易有道发布“子曰4.0”TTS语音合成引擎Confucius4-TTS，是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。该模型在跨语种语音克隆、免参考文本建模、情感韵律迁移和本地化部署等关键维度上达到国际最前沿水平，现已面向全球用户全量开源。

　　目前，网易有道Confucius4-TTS已全面支持中文、英语、西班牙语等14种语言的自然流利表达。

　　同时，网易有道Confucius4-TTS实现了全面突破：第一，用户仅需提供3秒音频素材，模型即可完成音色克隆。克隆音色与原声相似度超过85%，克隆任务准确度高达97%。第二，支持14种语言无缝切换，消除跨语种口音壁垒。第三，实现情感韵律的无损跨语种迁移，Confucius4-TTS能自动提取、解析参考音频中的情感特征。

　　据悉，Confucius4-TTS引入了GPT式语义大模型作为主干，搭配基于SSL预训练特征和ECAPA-TDNN的可学习说话人编码器，并采用Flow Matching流匹配生成框架。目前，网易有道已将该模型全量开源。Confucius4-TTS采用Apache开源协议，面向全球开发者开放完整模型权重和配套工具链，商用没有限制。开发者可以下载54G完整资源包，本地离线部署运行。

责任编辑：宋雅芳

网易有道推出业内首个14语种无口音免文本语音克隆模型

推荐文章

美股前瞻 | AI风向标来袭！英伟达股东大会凌晨开始、美光财报盘后发布；布油跌破75美元创战后新低；海力士或7月10日登陆美股

年中盘点 | 港股IPO半场五大榜单出炉！一手劲赚3.4万港元，最赚钱、最热门、最能涨的都是谁？

SK海力士据报将向韩国监管机构提交文件 推进美国ADR上市计划

中信证券港股策略：关注高解禁比例标的及行业龙头解禁对股价的短期扰动

谷歌一夜蒸发15000亿，只因失去了两个人

SpaceX通过债市募资250亿美元 认购需求显示市场心态谨慎

抛售SpaceX，买入特斯拉？

资金复盘 | 北水逆势抄底港股近104亿港元！加仓中芯国际、建滔集团，抛售阿里巴巴

SK海力士据报将向韩国监管机构提交文件推进美国ADR上市计划

SpaceX通过债市募资250亿美元认购需求显示市场心态谨慎