繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

專訪時空壺CEO:不懼蘋果入局,AI翻譯耳機遠未到終局

2025-11-12 09:30

作者丨歐雪

編輯丨袁斯來

當巨頭都想做點軟硬件結合時,它們動動手指,足以震碎很多創業公司腳下的冰面。

在AI翻譯準確率突破95%的2025年,AI翻譯耳機或許是最容易被巨頭吞噬的硬件品類。它們不需要做什麼硬件層面的改動,只需要集合軟件功能。

過去一兩年,幾乎每個安卓廠商都在自己的耳機里加入了翻譯功能。但直到9月10日凌晨,當蘋果宣佈AirPods要推出實時翻譯功能后,翻譯耳機的創業者們才真切感覺到寒意——全球TWS中,蘋果一家就佔了23%的份額。

翻譯是個顯而易見的需求,迟早會成為所有大廠耳機的標配。這場衝擊並不意外。

其實,2023年左右,AI翻譯軟件免費后,大量白牌早就充斥市場。不想卷價格的獨立廠牌殺出重圍后,又不得不直面巨鱷撕咬。

深圳企業時空壺(Timekettle)是堅持下來的硬件廠商之一。翻譯行業競爭愈演愈烈時,時空壺2024年其營收達2億元,2025年累計營收持續大幅增長,連續六年行業第一,累計用户超過百萬,覆蓋全球170多國。

時空壺創始人田力出身華為。或許和過去的行業經歷有關,時空壺一直堅持硬件優先。其旗下翻譯耳機定價千元,通過硬件實現「邊説邊譯」,努力還原自然的對話體驗。

而面對蘋果的AI功能,時空壺創始人田力有他自己的應對。「巨頭的邏輯是在現有生態上疊加翻譯功能,」時空壺創始人田力表示,「而我們的邏輯是重構整個跨語言交流系統。」

這不是時空壺獨一家的挑戰。「整個翻譯行業來看,行業的成熟度都還不夠。」田力稱。這是一個需求細分的時代,他們必須在無數縫隙中找到差異化定位。

田力認為,目前AI更多是直譯,能理解文化語境自然翻譯的,可能只有10%到20%。AI是技術理性的一個高峰,它能完成基礎的翻譯,但語言需要情感賦予更多意義。一個要讓人持續使用的翻譯產品,決不能只有工具屬性。

語言障礙是一個古老且普遍的問題,翻譯這個職業存在了數千年。」田力表示,「人類翻譯很多時候不是逐詞翻譯,而是理解你的意圖並準確表達出來。」

對此,大公司未必有耐心去做持續、細微的優化。這也成為創業公司的機會。 

我們和田力做了一次對話,和他討論了目前的市場競爭以及AI耳機的未來走向。

 

行業尚在早期

硬氪:你覺得目前AI翻譯領域的競爭狀況如何?

田力:我們其實不是很關注業內競爭,這是一個很真實的回答。最核心的原因在於,我覺得整個行業的成熟度還不夠。現在比誰做得好就像「比爛」,沒太大意義。

目前行業的競爭烈度其實不高,但作為業內跑得較前面一點的企業來説,我們確實會受到更多的模仿,比如雙向同傳、外放對話這些模式都是我們先做的。

我們的核心始終是解決問題,尤其是解決人們的交流障礙。語言障礙是一個古老且普遍的問題,翻譯這個職業存在了數千年,解決這個問題極具價值。我們不想盲目追逐熱點,而是希望有一天,用户不再記得我們是做耳機還是硬件,而是知道我們能幫助他們克服語言障礙。

硬氪:那你怎麼看待谷歌、蘋果等大廠也進入翻譯領域?會有壓力嗎?

田力:首先再次表示,我們其實不是特別關注競爭,因為這個行業確實還不夠成熟。其次,巨頭的邏輯是在其現有生態上「疊加功能」(如蘋果在AirPods上加翻譯),而我們的邏輯是「重構整個交流系統」。出發點不同,最終解決方案的效率和體驗也會不同。

硬氪:那與競爭對手相比,時空壺的核心護城河是什麼?

田力:我覺得還是在認知層面上。我們關注點在於交流場景本身,而非某種具體的硬件形態。我們從一開始就不是單純地聚焦於耳機這種形態,而是思考耳機這種交互體驗能否讓兩個人交流得更自然。如果做不到,我們就會對耳機進行改造。這也就是為什麼我們前幾代產品甚至沒有使用藍牙耳機芯片,因為我們的重心根本不在打電話這些傳統功能上。隨着時間推移,這種底層邏輯會形成品牌、用户心智上的護城河。

W4 AI同傳耳機-骨聲紋識別技術(圖源/企業)

硬氪:時空壺海外收入佔比達70%,在適應不同市場的文化、語言和政策時,遇到過哪些意想不到的挑戰?

田力:最有挑戰性的還是對用户的理解。在中國,大量場景與商務洽談相關。但在美國,作為移民大國,約20%的人口是移民,其中約50%的移民,也就是2000多萬人,英語水平有限。很多人在跨國移民生活中會用到我們的產品,這在國內可能覺得新奇,但在國外卻很常見。 

硬氪:目前公司的財務狀況如何?是否盈利?

田力:公司已經實現盈利。我們並不刻意追求營收的高速增長,而是更注重保持健康的盈利能力和產品成熟度。在行業早期,追求竭澤而漁的增長反而會帶來反噬。

硬氪:目前很多翻譯設備依賴雲端大模型。但業界也有「端側AI」的強烈趨勢。時空壺是否會考慮佈局「端側AI」?

田力:端側AI對我們來説非常重要,因為在很多地方網絡條件並不理想。人們對我們的產品要求很高,一旦網絡不好,兩個人就無法交流,立刻陷入困境。所以,端側AI是我們必須佈局的。

硬氪:未來會考慮除了「語音」外其他的多模態交互方式嗎?比如手勢、語氣?

田力:這是一個很大膽的想法。像一些眼鏡公司所做的多模態輸入,通過手勢來理解意圖是比較難的,因為手勢是非標準化的。

但你提到的語氣,我覺得這部分相對可以標準化。比如憤怒、疑問、困惑或高興的語氣,是可以逐漸往標準化方向推進的。這也是我們內部正在研究的方向。

 

AI翻譯離自然還很遠

硬氪:你覺得AI翻譯和人工翻譯這兩者未來的關係會是怎樣的?時空壺怎麼定義兩者的關係?

田力:我們把AI翻譯也像自動駕駛一樣分成了L1到L5,我認為現在大家能做到的大概是一個L3的水平。而人類的水平,特別是對於那種高級的譯員水平,他毫無疑問是L4甚至L5的。

L3和L4、L5最大的區別,我覺得本質上在於信任程度。L3只是可用,而L4和L5則是你真正可以放心地將事情交給它,讓它幫你去交流和解決問題。

這里面的迭代包含兩個方面,第一是它需要像人一樣有同理心,能夠理解並傳達你真正想表達的意思,而不僅僅是直譯。人類翻譯很多時候就是這樣,不是逐詞翻譯,而是理解你的意圖並準確表達出來,這就是從L3到L4的一個關鍵分界線。第二則是產品本身,交互體驗上還有很多細節需要打磨。

硬氪:從L3到L4的躍遷,你覺得大概要多久?

田力:我覺得可能樂觀的話,大概需要2到3年。因為這里面有兩個部分需要共同進化,前者屬於整個業界都在推進的領域,是大智能體系下的一個分支;而后者則需要產品公司去細緻琢磨,用户在體驗層面還能如何進一步提升。

硬氪:在用户體驗層面,其實不同語言中的文化隱喻、俚語很多。時空壺怎麼嘗試理解和保留這些「言外之意」?

田力:我覺得這恐怕是整個行業面臨的問題,僅靠一己之力很難全部搞定。目前我們能做的,可能是在收集語料方面做一些工作,比如在中英、西班牙語等語言上進行更多嘗試。但從長期來看,像谷歌這樣的大公司會做一些基礎性的工作,我們則可以站在巨人的肩膀上,專注於我們更擅長的細節部分。

硬氪:那你覺得目前AI翻譯對文化理解的程度有多少?

田力:我覺得目前可能只有10%到20%,大家還是剛往直譯的角度去做嘗試。但我相信時間不會太長,可能再過半年左右,你就會看到我們的產品有顯著進化。

比如,現在產品已經分為基本AI翻譯和大模型翻譯兩種模式。從技術角度看,這是不同的技術路徑。但從消費者角度看,他們關注的是翻譯能否善解人意,還是完全不改變原意、不曲解的死板翻譯。到時候你會看到這兩種模式會有顯著區別。

硬氪:那對於翻譯中出現的「幻覺」(胡編亂譯)或錯誤,你如何看待和界定其中的責任?

田力:實事求是地説,比如在美國,我們的產品在醫療機構也有一些應用場景。但目前來看,相關責任的界定還並不清晰。

就像自動駕駛汽車出車禍后法律界定尚不明確一樣,目前,我們的應用更多還處於L3層面,主要是輔助性質的。不過,AI翻譯還沒有達到像自動駕駛那樣嚴肅的程度,畢竟自動駕駛涉及人命關天的問題。

W4Pro AI同傳耳機 商務洽談(圖源/企業)

硬氪:下一代AI翻譯設備會是什麼樣子?時空壺有沒有一些最新的研究方向可以分享?

田力:最理想的未來產品其實很簡單,使用時能達到我們現在自然溝通的效果。但我們都清楚,距離這個目標還很遠,這正是我們正在努力的方向。

目前,我們始終圍繞兩條技術主線展開工作。第一是收音質量,即使在複雜環境下也能精準收音。這與傳統耳機的最大區別在於,傳統耳機強調收音乾淨,而我們不僅要求乾淨,還要求音質足夠好,以便傳輸到雲端后能讓機器更好地識別和翻譯。第二是AI本身的智能層面,比如能否支持更多小語種,以及在同理心和更精準的意義翻譯上做得更好。

未來2-3年,最核心、最壓倒一切的目標就是將產品體驗從L3提升到L4。我們相信,一旦實現這個目標,公司的業績、利潤等財務指標都自然不再是問題。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。