简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

网易有道推出业内首个14语种无口音免文本语音克隆模型

2026-06-23 16:25

  新浪科技讯 6月23日下午消息,近日,网易有道发布“子曰4.0”TTS语音合成引擎Confucius4-TTS,是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。该模型在跨语种语音克隆、免参考文本建模、情感韵律迁移和本地化部署等关键维度上达到国际最前沿水平,现已面向全球用户全量开源。

  目前,网易有道Confucius4-TTS已全面支持中文、英语、西班牙语等14种语言的自然流利表达。

  同时,网易有道Confucius4-TTS实现了全面突破:第一,用户仅需提供3秒音频素材,模型即可完成音色克隆。克隆音色与原声相似度超过85%,克隆任务准确度高达97%。第二,支持14种语言无缝切换,消除跨语种口音壁垒。第三,实现情感韵律的无损跨语种迁移,Confucius4-TTS能自动提取、解析参考音频中的情感特征。

  据悉,Confucius4-TTS引入了GPT式语义大模型作为主干,搭配基于SSL预训练特征和ECAPA-TDNN的可学习说话人编码器,并采用Flow Matching流匹配生成框架。目前,网易有道已将该模型全量开源。Confucius4-TTS采用Apache开源协议,面向全球开发者开放完整模型权重和配套工具链,商用没有限制。开发者可以下载54G完整资源包,本地离线部署运行。

责任编辑:宋雅芳

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。