繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

小參數垂類模型性能大幅提升 有道大模型翻譯質量實測獲佳績

2025-03-12 11:33

來源:中國網

近日,國產大模型已在垂直賽道實現關鍵性跨越。3月11日,網易有道宣佈完成翻譯底層技術迭代,基於自主研發的子曰翻譯大模型2.0,在測試中實現翻譯質量超越國內外主流通用大模型,達行業第一。此次突破,也標誌着國產大模型在專業領域取得實質性進展,通過數據、算法等技術創新,使得小參數垂類模型實現性能大幅提升。

據瞭解,搭載全新大模型的翻譯已在有道詞典、有道翻譯及有道翻譯官內上線,提供標準模型、高級模型兩種不同參數選擇,用户可免費使用全新AI翻譯,體驗更精準、優質的翻譯服務。與此同時,有道詞典筆X7系列也已升級為最新的翻譯大模型,其余型號將陸續更新。

有道翻譯首頁

目前,有道全系翻譯產品擁有超10億用户。QuestMobile數據顯示,從2019年至今,網易有道詞典已連續六年榮獲「中國互聯網APP TOP50賽道用户規模NO.1」,持續佔據教育工具領域榜首。

繼率先推出統計機器翻譯及神經網絡翻譯(NMT)后,有道再次領銜行業,在翻譯技術上實現重大突破,使子曰翻譯大模型2.0的整體性能實現質的飛躍。

根據國際權威翻譯評測集WMT和Flores200的最新測試數據顯示,子曰翻譯大模型2.0在中英互譯領域的譯文專業度和穩定性較前代版本均有顯著提升。除此之外,在涵蓋人文學科、商科、生活服務、醫療、科學等19個垂直領域的多學科對比測試中,子曰翻譯大模型2.0與國內外主流通用大模型及專業翻譯模型展開「全面競技」,數據顯示,子曰翻譯大模型2.0在專業性、準確性、語言慣例和風格等方面,展現出了更高的翻譯準確率、流暢度,模型翻譯質量達到行業第一。

經歷了10個月的技術更迭,子曰翻譯大模型2.0從數據、算法、評估三個層面進行技術突破,最終以14B小參數垂類模型實現高水準翻譯性能,這也再次展現出有道在教育大模型發展上的垂直專業優勢。

在數據層面,有道收集並嚴格清洗了高質量的翻譯語料數據,並由英語專八認證人員及職業譯員進行精細化人工標註,使得模型擁有海量的優質數據資源庫,增強其在多樣化翻譯場景的應對能力。

在算法層面,有道以子曰大模型為基礎,進行二次預訓練,進一步打造了更具專業性與針對性的翻譯基座大模型,結合大模型蒸餾技術、大模型融合技術、Online DPO技術等多項手段,有效避免了大模型的災難性遺忘問題,並在運行效率、準確性、流暢性等翻譯性能上實現了大幅提升。

在評估層面,藉助翻譯數據沉澱,有道自主研發了翻譯評估模型Reward Model,其準確率超越了COMET——當前最先進的評估指標之一,為子曰翻譯大模型的性能評估提供可靠的量化依據及完善的人工評估方案,多維度對模型的翻譯結果進行評估和分析。

事實上,隨着DeepSeek等開源模型的應用範圍逐漸擴大,「場景+數據」越來越成為AI應用的護城河。作為深耕翻譯領域17年的代表,有道在該領域內的數據及資源積累,使其能夠以高質量語料訓練強化模型的翻譯性能,展現出更強的領域專業性和翻譯任務針對性,使得小參數垂類模型的翻譯質量反超通用大模型。

「通用大模型比的是參數大、算力強,但翻譯這件事,參數堆不出專業度;當通用大模型競逐參數規模時,我們還是更相信垂類模型的未來價值——用專業的垂直應用真正解決專業場景的痛點,這也正是我們持續努力和進化的方向。」網易有道相關負責人表示。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。