繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

年度服務時長首破萬億分鍾,聲網乘對話式AI東風

2025-11-03 21:13

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

(來源:北京商報)

2021年2月,特斯拉CEO馬斯克在Clubhouse語音聊天,Clubhouse服務商Agora, Inc(聲網母公司,以下簡稱"聲網")一炮而紅。四年間,聲網股價有漲有跌,近日聲網創始人兼CEO趙斌宣佈,聲網年度服務分鍾數首次突破1萬億分鍾,同時發佈多款新品,這個在多模態大模型、音頻應用等背后的公司再獲曝光度。多模態大語言模型的出現讓計算機具備了類人的實時語音對話能力,Deepgram和Opus Research 調研顯示,67%的企業已將語音AI智能體置於戰略核心位置,84%的企業計劃在未來一年增加相關投入。2024年四季度以來,聲網連續三個季度扭虧,這一系列數據是聲網的利好信號,不過技術層面的挑戰和巨頭的擠壓也客觀存在。

"2024年5月,OpenAI稱很快的時間內釋放多模態交互的Agent(智能體)進入ChatGPT。秋季,全球所有用户基本上都可以使用給ChatGPT打電話的功能,這就是對話式人工智能體to C(用户)的場景。"

"10月,OpenAI和Agora聯合推出全球第一個Realtime API(一款低延迟語音交互API),這就是對話式人工智能體to B(企業)的原點。"聲網AI RTE(實時互動技術)產品線負責人姚光華以實例介紹對話式AI的場景和toB結合模式。

一年前,聲網常將生成式AI掛在嘴邊,一年后將對話式AI作為長期的戰略投入,OpenAI的風向是其做此選擇的原因之一。

從技術的層面,MiniMax開放平臺解決方案高級總監馮雯解讀了對話式AI的框架:"Voice (聲音)Agent探測對方是否在説話,獲得這樣的信息后,交給ASR(自動語音識別)識別對方説的是什麼內容,再交給大語言模型進行處理,不同場景會有不一樣的要求,通過文字轉語音,然后播報語音。隨着大家對大語言模型、對話式AI更多地暢想和場景的要求,每個環節都有許多技術升級。"

近日,聲網推出的多款產品也圍繞對話進行。

其中對話式AI引擎2.0讓AI更懂開口對話的時機,能分辨是誰在講話,支持更多ASR和TTS(文本轉語音)供應商,用户可根據自己的需求選擇想要的語種和音色,也可進行電話外呼;對話式AI Studio是針對對話式AI引擎進行編排的平臺,聲網對話式AI模型評測平臺會向客户推薦延時、成本最符合需求的產品,用户可以通過API(應用程序編程接口)集成,也可以通過Studio編排;發佈對話式AI開發套件,是爲了讓客户和開發者更快地集成Convo AI(對話式AI)。

反觀用户端,根據聲網發佈的對話式AI場景熱力榜單,AI語音助手、AI社交和陪伴、AI潮玩是排名前三的場景。AI語音助手領域包括ChatGPT、豆包、智譜清言、MiniMax等;AI社交和陪伴領域包括Talkie、Grok 4、Soul等;AI潮玩包括珞博-Fuzozo、賦之-EBO Air 2 Plus等。

和其他技術一樣,在支持對話式AI發展的過程中,RTE‌仍有進步空間。"目前對話式AI存在800毫秒的端到端語音延迟是合理的目標,要做到更極致的話,未來還會繼續努力。"馮雯説。

行業數據顯示,僅21%的用户對現有AI對話體驗滿意,部分服務的用户流失率高到"不可接受"。究其根源,人類對話中僅有7%的信息來自語言內容,超過90%的信息感知依賴於語調、表情和肢體語言等非語言要素。要實現真正的"類人對話",企業必須系統性攻克低延迟響應、自然打斷、上下文管理、情感理解與表達等複雜挑戰。

"對話式AI將成為下一代AI Infra(人工智能基礎設施)的重要部分",趙斌表示。以AI 陪伴為例,ARK Invest 預測這一賽道有機會從3000萬美元上漲到700億—1500億美元,聲網對話式 AI相關用量在2025年第三季度實現151%的環比增長。

這是一個全新市場,但如何將其轉化為實實在在的營收和利潤,需要時間,機會和挑戰同時擺在聲網和同行面前。2025年二季度聲網營收3430萬美元,同比增長0.5%,淨利潤150萬美元,同比扭虧。

北京商報記者 魏蔚

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。