網易有道發佈14語種無口音語音克隆模型並全面開源

2026-06-23 16:47

【環球網科技報道記者李文瑤】6月23日消息，近期，網易有道發佈「子曰4.0」TTS語音合成引擎Confucius4-TTS，這是業內首個支持14種語言跨語種無口音、且無需參考文本即可完成語音克隆的開源模型。

據網易有道介紹，Confucius4-TTS已全面支持中文、英語、西班牙語、法語、德語、韓語、泰語、越南語等14種語言。用户僅需提供3秒音頻素材，無需參考文本與前期訓練，模型即可完成音色克隆，相似度超過85%，克隆任務準確度達97%。輸入中文音頻，模型可使用原聲音色輸出多語種語音，且全程保持音色高度一致。模型還能自動提取參考音頻中的情感特徵，實現語調、韻律與情緒的完整遷移。

在底層架構上，Confucius4-TTS引入了GPT式語義大模型作為主干，搭配可學習説話人編碼器，並採用Flow Matching流匹配生成框架，不再沿用傳統的聲碼器方案。

值得關注的是，網易有道已將模型全量開源，採用Apache開源協議，面向全球開發者開放完整模型權重和配套工具鏈，商用無限制。開發者可下載54GB完整資源包進行本地離線部署。

網易有道發佈14語種無口音語音克隆模型並全面開源

推薦文章

華盛早報 | 美光盤后飆升近16%！炸裂財報引爆芯片股，納指期貨應聲漲2%；黃仁勛豪言AI進入盈利時代；高通全面進軍AI數據中心

港股概念追蹤 | 曝蘋果摺疊屏iPhone敲定7月底量產 產業鏈有望迎來高速發展拐點(附概念股)

美股前瞻 | AI風向標來襲！英偉達股東大會凌晨開始、美光財報盤后發佈；布油跌破75美元創戰后新低；海力士或7月10日登陸美股

中信證券港股策略：關注高解禁比例標的及行業龍頭解禁對股價的短期擾動

谷歌一夜蒸發15000億，只因失去了兩個人

SpaceX通過債市募資250億美元 認購需求顯示市場心態謹慎

拋售SpaceX，買入特斯拉？

資金覆盤 | 北水逆勢抄底港股近104億港元！加倉中芯國際、建滔集團，拋售阿里巴巴

港股概念追蹤 | 曝蘋果摺疊屏iPhone敲定7月底量產產業鏈有望迎來高速發展拐點(附概念股)

SpaceX通過債市募資250億美元認購需求顯示市場心態謹慎