网易有道发布14语种无口音语音克隆模型并全面开源

2026-06-23 16:47

【环球网科技报道记者李文瑶】6月23日消息，近期，网易有道发布“子曰4.0”TTS语音合成引擎Confucius4-TTS，这是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。

据网易有道介绍，Confucius4-TTS已全面支持中文、英语、西班牙语、法语、德语、韩语、泰语、越南语等14种语言。用户仅需提供3秒音频素材，无需参考文本与前期训练，模型即可完成音色克隆，相似度超过85%，克隆任务准确度达97%。输入中文音频，模型可使用原声音色输出多语种语音，且全程保持音色高度一致。模型还能自动提取参考音频中的情感特征，实现语调、韵律与情绪的完整迁移。

在底层架构上，Confucius4-TTS引入了GPT式语义大模型作为主干，搭配可学习说话人编码器，并采用Flow Matching流匹配生成框架，不再沿用传统的声码器方案。

值得关注的是，网易有道已将模型全量开源，采用Apache开源协议，面向全球开发者开放完整模型权重和配套工具链，商用无限制。开发者可下载54GB完整资源包进行本地离线部署。

网易有道发布14语种无口音语音克隆模型并全面开源

推荐文章

美股前瞻 | AI风向标来袭！英伟达股东大会凌晨开始、美光财报盘后发布；布油跌破75美元创战后新低；海力士或7月10日登陆美股

年中盘点 | 港股IPO半场五大榜单出炉！一手劲赚3.4万港元，最赚钱、最热门、最能涨的都是谁？

SK海力士据报将向韩国监管机构提交文件 推进美国ADR上市计划

中信证券港股策略：关注高解禁比例标的及行业龙头解禁对股价的短期扰动

谷歌一夜蒸发15000亿，只因失去了两个人

SpaceX通过债市募资250亿美元 认购需求显示市场心态谨慎

抛售SpaceX，买入特斯拉？

资金复盘 | 北水逆势抄底港股近104亿港元！加仓中芯国际、建滔集团，抛售阿里巴巴

SK海力士据报将向韩国监管机构提交文件推进美国ADR上市计划

SpaceX通过债市募资250亿美元认购需求显示市场心态谨慎