熱門資訊> 正文
2024-12-08 08:03
(報告出品方/作者:國泰君安證券,李博倫、伍巍)
1. 投資分析
隨着 AI 應用進程提速以及場景落地案例持續涌現,疊加雲端應用與終端智 能雙輪驅動產業升級,AI 賽道公司迎來重要發展機遇。建議重點關注以下 方向:具備產品力驅動的頭部應用企業,尤其是在既有領域已形成技術壁 壘和用户粘性的公司;在雲端應用創新和終端智能升級方面具備先發優勢 的企業,以及在醫療、金融、教育等高壁壘場景已實現商業化落地的公司; 在中文語料建設領域具備核心技術和資源積累的企業。這些公司將在 AI 應 用生態完善過程中獲得持續性競爭優勢。
2. 國內 AI 應用加速崛起,AI 出海勢頭強勁
2.1. 創新賽道蓄勢待發,垂類 AI 應用仍處於快速擴張期
中國 AI 軟件在全球前十榜單佔據二席。以豆包為代表的頭部應用月活超 5000 萬,顯示出較強的用户規模優勢。從 AI 產品榜發佈的 10 月 AI 應用 MAU 數據看,ChatGPT 以 2.58 億月活穩居全球榜首,但中國 AI 企業產品 同樣表現突出。具體來看:字節跳動旗下豆包以 5130 萬月活位居全球第二, 月環比增長 9.10%,領先 Nova 等其他國際競品;在全球前十榜單中,除豆 包外,Talkie AI(2062 萬月活)也成功入榜。在出海賽道,字節跳動佈局的 Gauth 表現最為亮眼,月活 1626 萬、環比增長 69.22%,體現出中國 AI 企 業在海外市場的強勁拓展勢頭。
海外 AI 市場創意工具高速增長,頭部產品月環比增速超 400%。根據 AI 產 品榜 10 月數據,海外 AI 創意工具賽道呈現爆發式增長:Artrix(AI 藝術生成) 環比增長 401.82%,下載量突破 300 萬;SelfyzAI(AI 照片舞蹈)環比增長 183.18%,全球活躍用户達 150 萬;Donna(AI 音樂製作)環比增長 136.29%, 月活躍度超 80 萬。這一增長態勢表明,海外 AI 市場在經過 ChatGPT 等產 品培育后已趨於穩定,用户需求正加速向垂直細分領域延伸。
中國 AI 市場仍處通用平臺競爭階段,頭部企業優勢明顯。AI 產品榜國內 10 月增速數據中,通用 AI 平臺主導着國內市場增長,月之暗面的 Kimi 智 能助手以 36.45%的月環比增速位居增長榜首,日活躍用户突破 500 萬;緊 隨其后的是騰訊元寶(增速 34.39%)和智譜清言(增速 20.59%)。值得注意的 是,抖音系 AI 產品矩陣有星繪、貓箱、豆包三個產品全部進入增速前十, 體現出在國內 AI 市場快速普及階段,大型科技公司正通過產品創新和規模優勢持續擴大市場份額。
AI 應用獲客效率呈現明顯分化,垂直賽道轉化率顯著領先。根據 AI 產品 榜最新數據,儘管 ChatGPT 以 4685 萬的月新增下載量位居全球榜首,但其 下載量/MAU 比值僅為 18.15%。相比之下,字節跳動旗下 AI 教育產品 Gauth 表現突出,新增下載量/MAU 比值高達 82.29%,充分展現了垂直賽道的高 效獲客能力。此外,Remini(41.72%)、Genius(43.55%)等創意工具產品也都 實現了較高的轉化效率。
國內 AI 市場呈現雙軌發展態勢,垂類應用顯示出更強勁的增長潛力。 AI 產品榜數據顯示,豆包憑藉 1611 萬新增下載量領跑國內市場,但在轉化效 率方面,騰訊元寶(55.43%)、星繪(55.22%)等垂類應用表現更為出色。值得 注意的是,國內前十產品中有半數下載量/MAU 比值高於 30%,其中 Kimi 智能助手達到 45.91%,智譜清言達到 36.62%,表明國內垂類 AI 應用市場 正處於快速擴張期。
2.2. AI 網站出海呈差異化佈局,爆款頻出
在以 AI 為核心驅動的網站中,ChatGPT 以 37.8 億月訪問量獨佔鰲頭。從 AI 產品榜 10 月數據看,市場呈現明顯的分層特徵:第一梯隊是以 ChatGPT 為代表的純 AI 對話產品,ChatGPT 月訪問量達 37.8 億,環比增長 17.16%; 第二梯隊是搜索引擎的 AI 升級版本,New Bing 以 18.6 億訪問量位居次席, 但需要注意其流量可能包含傳統搜索請求;第三梯隊包括 Canva(8.17 億)、 Salesforce(1.14 億)等傳統 SaaS 服務商,但其 AI 功能僅作為附加特性,實際 AI 業務規模需要謹慎評估,榜單中的純 AI 產品數據更能反映實際的服務 滲透水平。
ChatGPT 憑藉產品創新實現了純 AI 應用領域的重要突破。2024 年 5 月, OpenAI 重磅發佈了具備音頻和視覺理解能力的 AI 語音助手,同時推出了 最新的旗艦 AI 模型 ChatGPT 4o。在當月,ChatGPT 的訪問量出現了顯著提 升,一舉超越 Bing 成為訪問量第一的 AI 相關網站。考慮到 Bing 的訪問量 中包含大量傳統搜索引擎的流量貢獻,ChatGPT 作為純 AI 原生應用卻能實 現對 Bing 的超越,並在此后繼續持續增長,快速拉開了與其他產品間的差 距,充分證明了其產品實力和當下無可撼動的市場競爭力。
豆包 AI 憑藉強勁增長勢頭步入國內 ChatBots 第一梯隊。根據 AI 產品榜的10 月數據,作為字節跳動旗下的 AI 對話產品,豆包實現了 25.01%的環比 增長,訪問量達到 17.13M,增速在頭部 AI 產品中位居前列。此前以 Kimi 和文心一言為代表的頭部產品分別以 29.28M 和 21.25M 的月訪問量佔據領 先地位,但其增速分別為 16.63%和 2.86%,相比之下,豆包憑藉更快的增 長速度正在快速縮小與頭部產品的差距已經成為國內AI對話市場新的重要 競爭者。
中國 AI 企業在出海賽道呈現差異化佈局,其中視頻生成領域出現突破性增 長。從 AI 產品榜 10 月的 AI 網站出海數據來看,教育和創意工具是中國企 業主攻的兩大方向,其中字節跳動旗下 Gauthmath 以 1938 萬月訪問量位居 榜首。特別值得關注的是視頻生成賽道的快速崛起:MiniMax 旗下海螺 AI 憑藉生成式視頻技術實現環比增長 2772.92%,遠超其他出海產品,與同賽 道的 Pika Art(增長 787.65%)一起,顯示出 AI 視頻生成工具正迎來爆發 期。這一增長態勢也反映出海外市場對高質量 AI 視頻內容的強勁需求,以 及中國企業在視頻生成技術上的競爭優勢。不過從整體訪問量看,出海產品 的規模仍相對有限,單個產品月訪問量均未突破 2000 萬,表明市場仍處於 培育期。
MiniMax 通過海螺 AI 在文生視頻領域實現技術突破,進軍國際第一梯隊。 MiniMax 由前字節跳動 AI 實驗室負責人創立,核心團隊來自 Google、微 軟、字節跳動等科技巨頭。截至目前已完成多輪融資,投資方包括高瓴創投、 五源資本等知名機構。海螺 AI 依託自研的萬億參數 MoE(混合專家)架構 模型 abab 6.5,實現了 200k tokens 的超長文本處理能力。其視頻生成模型 abab-video-1 能夠生成 1280×720 分辨率、25 幀每秒、時長 6 秒的高質量視 頻,尤其在複雜動態場景渲染和人物動作細節方面表現卓越。在第三方機構 進行的全球獨立測試中,海螺AI的畫質、流暢性和連貫性評分均位居前列, 標誌着中國企業在高端 AI 視頻生成領域實現重要突破。公司已開放海螺 AI 的 API 接口,支持開發者將其視頻生成和多模態處理能力集成到應用中。
全球市場正經歷多個細分賽道的突破性增長。除視頻生成工具外,客服機 器人(Chaport,290.76%)、SEO 工具(AISEO,212.29%)等垂直應用也 實現了超 200%的環比增速。相比之下,國內市場呈現出不同的增長特徵: 一是增速普遍較低,排名第一的百度搜索 AI 助手增速為 49.94%;二是細分 賽道更加多元,從代碼輔助(Marscode,47.13%)到金融服務(同花順問財, 16.65%)再到設計工具(Pixso AI,12.98%),呈現出場景深耕的發展趨勢; 三是頭部產品體量普遍較大,如 360AI 搜索(2.88 億)、Kimi(2928 萬) 等,表明國內市場已形成相對穩定的用户規模。
AI 應用的用户粘性與市場規模呈現顯著解耦,表明產品力而非用户規模是 決定用户深度參與的關鍵。從 AI 產品榜發佈的 10 月人均時長數據可見, 訪問量與用户粘性之間並不存在明顯的正相關關係。以 Character AI 為例, 其 2.15 億月訪問量配合 14 分 25 秒的人均使用時長,顯示出規模與粘性的 良好平衡;而 Superhuman 雖然月訪問量僅為 225 萬,卻實現了 20 分 53 秒 的高使用時長,位居榜單第二。這種"小而美"與"大而強"並存的現象説明: 第一,AI 應用市場已進入差異化競爭階段,單一賽道內可以同時存在規模 導向與精品路線;第二,用户規模增長不會自然帶來使用時長的提升,產品 是否能提供差異化價值纔是核心;第三,某些細分場景(如郵件助手 Superhuman)雖然總盤子較小,但用户需求強度高,更容易培養出高粘性的 核心用户羣。
2.3. AI 應用場景各具特色,市場表現懸殊
AI 應用的使用場景決定了其設備端口的流量分佈特徵。根據 SimilarWeb 數 據,以文檔協作和設計為主的 AI 工具如 Notion 和 Canva 呈現出顯著的桌 面端偏好,其桌面端佔比分別高達 93.5%和 87.3%,這反映了專業生產力工 具對大屏操作和精確控制的剛性需求。相比之下,以社交陪伴為主的 Character AI 則呈現出截然相反的分佈特徵,其移動端佔比達到 80%,説明 休閒娛樂場景更依賴移動設備的便攜性和即時性。而 ChatGPT 和 Bing 作為綜合性 AI 搜索工具,則在桌面端和移動端之間保持相對均衡的分佈,這體 現了通用型 AI 工具需要同時滿足用户在不同場景下的使用需求。
AI 搜索引擎中,360AI 搜索依靠持續的技術創新和產品優化確立了行業領 先地位。從 2024 年 1 月公測開始,該產品經歷了快速發展,通過不斷完善 搜索功能和用户體驗,在 7 月份首次超越 Perplexity AI 成為全球 AI 原生搜 索引擎流量第一。產品採用"AI+搜索引擎"而非傳統的"搜索引擎+AI"模式, 在專業搜索能力方面建立了明顯優勢。到 2024 年 8 月,其搜索服務已支持 識別超過 1 億種意圖分類,涵蓋 4000 種基礎分類和 1000 多種專業領域, 為其保持行業領先地位奠定了堅實基礎。
360AI 搜索全新的 CoE 架構部署和多項重要功能升級助力其在 8 月份實現 超 120%的訪問量提升。AI 產品榜顯示,8 月訪問量達到 208.1M,環比增 長 122.26%,月獨立訪客量(MAU)突破 8000 萬。這一增長可能源於兩個 關鍵變化:第一,360AI 搜索於 8 月 1 日宣佈與包括智譜 AI、商湯科技等 15 家主流大模型廠商建立合作,構建 CoE 專家網絡架構,實現了精準的模 型調度機制;第二,8 月 20 日推出了"簡潔回答"、"標準回答"、"深入回答 "三種搜索模式,並支持用户自主選擇不同大模型重新生成答案;這些舉措 使其進一步拉大與競品的差距,比如同期祕塔 AI 搜索的 MAU 僅為 2000 萬。
虛擬角色類AI產品展現出顯著的贏家通吃效應。AI產品榜10月數據顯示, 行業龍頭 Character AI 以 214.67M 的月訪問量遙遙領先於第二名 JanitorAI 的 63.89M,領先優勢超過 3 倍。訪問量前三名產品(Character AI、JanitorAI 和 SpicyChat AI)的訪問量合計佔據了該品類前十總流量的 88%,而排名第 6 到第 10 位的產品月訪問量均不足 5M,且多數呈現負增長態勢。這種極度 集中的流量分佈特徵表明,AI 角色扮演賽道已經進入存量競爭階段,頭部 效應日益凸顯。用户在選擇時表現出明顯的羊羣效應,更傾向於選擇用户基 數大、互動體驗更豐富的平臺,這使得頭部產品能夠通過規模效應持續擴大 其競爭優勢。
AI PPT賽道呈現出獨特的地域多元化競爭格局。AI產品榜10月數據顯示, 該賽道前五名產品的公司分別來自美國(Gamma)、匈牙利(Prezi)、西班牙 (Slidesgo)、中國(AiPPT)和德國(Pitch)。這種分散的市場格局很可能源於辦 公軟件的深度本地化需求——不同地域的用户在演示文稿的風格偏好、內 容結構和表達方式上存在顯著差異。這一特徵使得本地化公司能夠依託對 本土文化的深度理解建立差異化優勢,從而在全球市場中佔據重要位置。這 種多元化的競爭格局表明,AI 辦公賽道的成功不僅取決於技術實力,更需 要對用户文化習慣的深度理解。
AI 圖片生成市場正上演反直覺的藍海困局,功能趨同將市場推向紅海化。 根據 SimilarWeb 提供的過去半年來的數據,AI 圖片生成作為新興技術市場, 頭部平臺的競爭卻日趨白熱化。從頭部網站的流量總量看,在過去 6 個月 時間里,AI 圖片生成的總量幾乎沒有增長。產品層面,各平臺的功能和應 用場景卻在不斷趨同,將一個本應充滿創新的市場推向紅海化。Yodayo 在 5 月初周度 310 萬的流量如今只剩 50 萬左右,恰恰印證了在缺乏差異化創 新的情況下,即便是處於爆發期的市場,也會對同質化競爭者進行殘酷的淘 汰,而過度聚焦用户爭奪也可能抑制了根本性創新的動力。
AI 文生視頻領域新興平臺異軍突起,但產品生命周期短暫、后勁不足的特 徵也日益凸顯。根據 SimilarWeb 的數據,進入者如 KlingAI 和 HailuoAI 展 現出驚人的增長速度,尤其是 HailuoAI,從 9 月中旬開始迅速崛起,到 11 月初已超越 Loom 成為行業流量冠軍,周流量突破 370 萬。與此同時,從數 據中可以觀察到AI文生視頻產品往往在一個大幅提升后容易陷入頹勢的特 點,這種現象可能源於 AI 文生視頻的商業化價值尚未被充分挖掘,目前用 户多出於追求新鮮感而使用,缺乏持續的使用動力,AI 文生視頻在用户留 存和商業化方面仍需進行更深入的探索。
3. AI 場景落地百花齊放,爆款應用異軍突起
3.1. 頭部玩家齊發力 AI 軟件應用,雲端應用創新步入快車道
雲端 AI 應用在 2024 年迎來重要突破,全球科技巨頭紛紛推出創新產品與 解決方案。從產品形態來看,呈現出明顯的區域化特徵:北美企業專注通用 性能力的突破,如 Microsoft、Anthropic 等推出的新一代企業 AI 工具;歐 洲企業強調合規與安全,以 SAP 為代表的解決方案深度整合行業需求;而 亞太企業則在場景適配方面展現優勢,阿里雲、字節跳動等在本土化應用層 面取得突破。這種差異化發展趨勢,不僅體現在技術路線的選擇上,更反映 在商業模式和市場策略的制定中,推動全球雲端 AI 應用形成獨特的區域競 爭格局。 歐美與中國企業在 AI 辦公工具上呈現差異化創新路徑,全面重塑企業生產 效率。微軟 2024 年 2 月推出的 Microsoft 365 Copilot for Sales 實現了全流程 銷售智能化,包括客户意向分析、銷售文檔生成、商機預測等功能,並通過 與 Dynamics 365 深度整合,打通了銷售全鏈路數據,每用户 50 美元/月的 年費定價反映了其在提升銷售效率方面的實際價值。2024 年 10 月 Anthropic 發佈的 Claude 3.5 Sonnet 引入了新的計算機使用功能,使得用户能夠通過 API 指導 Claude 像人類一樣操作計算機,包括查看屏幕、移動光標和輸入 文本。
頭部玩家紛紛在自身優勢領域發力 AI 革新應用。在中國市場,2024 年 5 月發佈的阿里雲通義千問 2.5 重點解決了中文語境下的商務寫作和數據分析 問題,特別是在財務報表解讀、商業計劃書撰寫等場景中展現出獨特優勢。 字節跳動火山引擎·雲雀則創新性地將 AI 融入協同辦公流程,實現了跨部 門文檔智能流轉、多語言實時協作等功能。歐洲市場的 SAP AI Core 着重於 解決企業數據安全問題,在保護企業數據隱私的同時,實現了 ERP 系統的 智能化升級,包括採購預測、庫存優化等具體應用場景。
騰訊 ima 將 RAG 技術與個性化知識管理相結合,開創了 AI 助手從通用工 具向個人專屬智能助理演進的新範式。2024年10月發佈的騰訊ima Copilot, 通過"全網信源+個人知識庫"的雙層數據架構,實現了個性化的知識獲取與 應用。特別是在知識庫層面,其採用 RAG 技術將用户個人知識進行向量化 存儲並掛載到大模型上,這種設計實現了 AI 助手的記憶功能,使其能夠隨 着用户使用逐步形成個性化的知識體系和表達風格。這種進化式的學習模 式,使 AI 助手從通用型工具轉變為真正理解用户專業背景和思維方式的智 能夥伴,為 AI 助手的發展開創了新方向。AI 助手的競爭正從單純的模型能 力比拼,轉向更注重用户個性化體驗和長期價值積累的方向發展。
3.2. 體驗全模態輸入自由,生態融合是 AI 應用的重要方向
多模態 AI 創作工具進入革新階段,百度自由畫布打通公私域數據,預計帶 動行業進入生態融合新賽道。2024 年 11 月,百度在世界大會上發佈的"自 由畫布"標誌着 AI 創作工具進入新階段。該產品通過打通百度文庫和網盤(用户超 10 億)兩大應用,首次實現了公域知識與私域數據的融合創作。 目前產品已進入邀測階段,根據百度官方數據,該產品首日獲得 20 萬用户 預約。從商業模式看,自由畫布的推出將帶動整個 AI 生產力工具賽道向生 態融合方向發展。
自由畫布的一站式全模態創作能力顯著降低了用户使用門檻。該產品支持 100 多種格式的文件輸入,包括文本類(doc、pdf、excel)和多模態類(jpg、 mp3/mp4 等)素材,用户只需通過拖拽或圈選即可完成素材導入。在內容創 作環節,平臺採用直觀的可視化操作方式,用户通過簡單的鼠標圈選和提示 詞輸入即可完成複雜的創作任務。這種簡化的操作流程顯著降低了 AI 創作 工具的使用門檻,讓普通用户也能輕松駕馭 AI 創作。 自由畫布的多層次調用機制體現了深度的 AI 理解能力。產品支持對素材進 行預處理標記和分層利用,AI 系統能夠理解並記住用户的標記偏好,在后 續創作中精準調用相關內容。這種基於深度理解的智能調用機制,讓 AI 創 作突破了簡單的內容拼接和生成,實現了更符合用户意圖的精準創作,推動 了 AI 創作工具向更智能化的方向發展。
產品的閉環設計彰顯了面向未來的產品思維。自由畫布不僅整合了從素材 輸入到內容創作的全流程功能,還提供了與主流社交平臺的分享接口和雲 端存儲能力。這種端到端的閉環設計滿足了創作者一站式的需求,更重要的 是為未來更多場景的拓展預留了空間。通過持續積累用户創作數據和使用 習慣,產品可以不斷優化和進化,形成良性的數據增長閉環,這種面向未來的產品設計思路為 AI 創作工具指引了新的發展方向。
3.3. 深耕垂直領域的資深玩家搶佔 AI 時代變現的先發優勢
AI 在垂直領域實現從通用能力到場景深耕的轉變,各地頭部企業圍繞行業 痛點推出創新解決方案。
3.3.1. 醫療 AI 加速產業化落地,診療服務全面升級
全球醫療 AI 加速產業化落地,醫療保健領域的 AI 應用得到更多重視。2024 年,全球大量 AI 醫療應用落地,IBM Watson Health 推出的 AI 藥物研發平 台顯著加速新療法開發流程;微軟 Azure AI Health Insights 平臺強化了醫療 預測分析能力;飛利浦 HealthSuite 平臺則通過實時數據整合提升患者管理 效率。在診斷領域,谷歌 Health 發佈的乳腺癌檢測 AI 工具較傳統鉬靶檢查 展現出更高準確率,西門子醫療推出的 AI 增強型影像軟件大幅提升了放射 診斷精度。醫療 AI 正從實驗室走向規模化商業應用階段。 潤達醫療"CDx 良醫小慧"通過突破數據處理和模型精度兩大技術難點,實 現了醫療場景的全方位 AI 賦能。2024 年 9 月,潤達醫療基於 6 年積累的 近 10 萬條數據標註和治理規則,成功開發了 CDx 醫療數據基座,可將臨牀 文本記錄轉化為全結構化數據,目前已支持檢驗、超聲、CT、核磁、病理 等近百個維度的醫療數據處理。在模型研發方面,該公司通過在盤古通用大 模型基礎上構建醫療垂域大模型,並邀請北京阜外、華山等多家知名醫院的 臨牀專家參與模型優化,有效解決了 AI 在醫療場景中的"幻覺"問題,確保 了模型輸出結果的專業性和可靠性。
潤達醫療的 AI 解決方案已在多個醫療細分場景實現商業落地。"CDx 良醫 小慧"已在體檢、藥房、檢驗等多個醫療場景實現規模化應用。在美年大健 康的體檢場景中,該方案通過 AI 機器人"健康小美"將服務模式升級為"體檢 2 小時,健康服務 365 天";在智慧檢驗領域,通過與生物梅里埃合作打造 智慧微生物檢測和管理體系;在藥房場景中,已與廣西柳藥集團啟動"桂中 大藥房智慧升級計劃"。
3.3.2. 金融大模型專注領域內知識,驅動行業能力躍遷
金融行業大模型應用進入產業化階段,頭部金融機構自研模型將重塑行業 競爭格局。全球領先金融機構正在加速佈局專業金融大語言模型。彭博社 2023 年推出的 BloombergGPT 擁有 500 億參數規模,專注於金融數據分析 和市場研究。2024 年 1 月,摩根大通發佈 DocLLM,專門用於處理複雜的 金融文檔。在開源領域,AI4Finance 社區推出的 FinGPT 為中小金融機構提 供了可定製化的解決方案。這些專業模型的出現標誌着金融科技正從通用 AI 應用向行業專用模型演進,預計將在投研、風控、客服等場景率先實現 商業化落地。
恆生電子的 LightGPT 通過建立分層評測體系和場景化應用,形成了金融 大模型從通用能力向專業場景深度應用的系統性解決方案。2023 年 10 月 發佈的 LightGPT 採用"L0-L1-L2"三層能力評測體系,將金融大模型的能力 劃分爲通用能力、金融領域能力和金融場景能力,這種分層設計確保了模型 在基礎能力和專業應用之間的平衡。特別是在 L2 層面,模型覆蓋了投顧、 投研、運營、合規等五大場景的 80 種金融專屬任務,體現出顯著的垂直領 域優勢。在落地層面,恆生電子通過"重塑+嵌入"雙模式推進大模型應用, 既打造了光子·文曲等獨立產品,又通過插件形式將 AI 能力嵌入現有業務 系統,實現了技術創新與業務場景的深度融合。 金證股份通過 K-GPT 提供了自主研發的金融領域 AI 解決方案。金證股份 在 AI 領域的佈局始於 2018 年,通過五年持續迭代,於 2023 年 12 月發佈 了 K-GPT。K-GPT 基於 Transformer 架構,通過領域預訓練和場景化精調, 將智能語義檢索引擎與文檔處理平臺(IDP)緊密結合,形成了完整的金融 知識體系。其應用已實現從早期的單點智能監管突破,到如今覆蓋營銷、投 研、風控等多個核心金融場景的全面佈局。
同花順 HithinkGPT 通過強大的數據積累和技術創新,在金融垂域實現了 突破性進展。根據同花順信息,2024 年 1 月發佈的 HithinkGPT 基於萬億級 金融語料訓練,在 17 個金融行業考試中平均得分達 75.9 分,顯著優於主流 開源模型。問財產品基於 HithinkGPT 實現了五大能力升級,覆蓋 15 個業 務矩陣和 50 余類技能,特別是在實時數據獲取、專業投顧建議和風險控制 等方面形成獨特優勢,其 99.5%的風險召回率體現了金融場景下的高可靠 性,併成為首個通過網信辦備案的金融對話大模型。
3.3.3. 法律大模型縱深發展,賦能司法效率提升
法律領域的垂直大模型呈現出專業化、安全性和實用性的特徵。2023 年初 Harvey AI 發佈的大模型和 Thomson Reuters 旗下 Casetext 發佈的 CoCounsel 兩大法律大模型的成功應用,展現了 AI在專業領域的突破。在專業性方面, 這些模型通過法律文獻訓練和律所實踐數據的持續優化,能夠勝任合同分 析、盡職調查等核心業務;在安全性方面,兩者都採用專用服務器和加密技 術保護客户數據,確保法律信息的私密性;在實用性方面,Harvey AI 經過 全球最大律所之一 Allen & Overy 的 4 萬次測試,證明 AI 在法律領域的應 用能顯著提升律師工作效率。
華宇萬象法律大模型在多個法律服務場景實現落地應用。產品於 2023 年 7 月的法律科技大會發布,已為法官提供智慧閱卷、庭審輔助等功能,為檢察 官、律師提供文書寫作輔助,同時在企業法務領域實現規章制度智能解讀和 風險預警等應用。憑藉與大模型獨角獸企業智譜 AI 的戰略合作關係,華宇 軟件在 AI 法律應用領域的創新發展將獲得堅實的技術保障。
通達海聯合基層法院共建大模型,展現出法律科技公司服務基層的新路徑。 2024 年 10 月,通達海與香洲法院共建的香法 AI 入駐珠海模數空間,該產 品實現了標準化法律業務指引、精準化法律知識推送、智能化司法決策輔助 等功能,並已在審判實務中顯著提升效率。 通達海構建了"感知智能+認知智能"雙引擎的法律人工智能架構。感知智能 引擎通過圖像識別、OCR 識別等技術,對卷宗、證據等實體材料進行智能 分析,實現材料類型識別、內容識別和精細化編目,其中 OCR 綜合識別正 確率達 95.5%,證據材料綜合識別率達 98.5%;認知智能引擎則基於自然語 言理解和法律大模型技術,構建了 280 多個要素化信息抽取模型,在法律 諮詢、量刑預測、智能文書生成、案件事實歸納等九大核心場景實現了 95% 的模型準確率和召回率。
3.3.4. AI 教育工具轉向深度學科訓練,多場景互動重塑學習體驗
ChatGPT 正在顛覆傳統教育科技企業的商業模式,在線搜題平臺 Chegg 的 衰落就是典型案例。據《華爾街日報》2024 年 11 月報道,Chegg 面臨用户 需求轉變的嚴峻挑戰:Needham 的調查顯示,2024 年秋季使用 Chegg 的大 學生比例降至 30%,而選擇 ChatGPT 的比例上升至 62%。這一轉變的核心 在於用户不再滿足於獲取簡單答案,而是希望通過 AI學習完整的解題思路。 儘管 Chegg 已與 Scale AI 合作開發 AI 系統,將服務重心轉向提供更豐富的 解題幫助,但其收入持續下滑,反映出傳統教育科技企業在 AI 時代轉型的 困境。 教育領域的 AI 應用實現了從通用助教工具向專業學科輔導轉變,頭部產品 開始深耕學科能力訓練場景。以專業領域切入為代表的是 Microsoft 推出的 Reading Coach,該產品專注於提升學生的英語閲讀理解能力,通過 AI 生成 個性化故事內容來訓練學生的閲讀技能。在中國市場,好未來發布了九章大 模型,面向全球科研機構,以解題和講題算法為核心。Coursera 正式在其所 有付費課程中引入 AI 輔導助手"Coach"功能,該功能可以根據學習者的課 程進度提供個性化的知識講解。從交互方式看,這些產品均採用了實時對話 模式,並結合了知識圖譜技術來保證答案的準確性。另外,后續 o1 思維鏈 模式的發展也將進一步拓寬教育 AI 的邊界。
多鄰國的 AI 佈局展現出長期深耕的戰略思維。早在 2021 年,公司就開始與 OpenAI 展開合作,將 GPT-3 應用於英語測試業務;后續又在 GPT-4 發 布首日推出 Max 訂閲服務,提供 AI 解答和角色互動功能。公司通過自研 Birdbrain 模型優化教學內容,同時藉助 OpenAI 模型提升對話生成能力,這 種"自研+合作"的雙輪驅動模式,讓多鄰國在保持教學專業性的同時不斷提 升用户體驗。 多鄰國在 2024 年 9 月底推出重要產品創新,通過 AI 視頻通話及冒險功能 重構語言學習體驗。新功能基於 OpenAI 及自研大模型支持,推出了 AI 角 色"拽姐",能實現接近真人的對話體驗,包括自然的語氣變化、思考停頓等 細節。用户可以與"拽姐"進行視頻通話練習,也能在學校、商店、派對等多 個生活場景中共同探索和解決問題,將語言學習融入具體情境,實現從單向 練習到沉浸式學習的躍升。
3.3.5. AI 技術重構商業變現,數字營銷加速落地
AppLovin 的 AI 廣告引擎 AXON 2.0 憑藉卓越的廣告匹配效率,正引領數 字廣告領域的技術革新。該產品於 2024 年第三季度展現出強勁的市場表現, 基於 AXON 2.0 開發的智能廣告方案 eDiscovery 安裝率從 2023 年的 17%顯 著提升至目前的平均 82%,充分證實了 AI 在提升廣告投放精準度方面的突 出優勢。作為 AppLovin 轉型的核心產品,AXON 2.0 不僅推動公司從遊戲 發行商成功轉變為 AI 廣告技術先驅,更是通過其高效的應用內廣告變現 (IAA)能力,提供了一條可靠的商業化路徑。
3.3.6. 數字人技術賦能,情感與商業價值雙向突破
數字人技術展現出情感陪伴和商業營銷的雙重應用價值。娛樂層面,數字 人可作為虛擬形象進行互動,或展開數字人直播;情感層面,數字人通過多 模態交互和專業知識庫的支持,為用户提供個性化的心理陪伴服務;商業層 面,數字人降低了內容製作門檻,讓營銷視頻的生產更高效且成本更低。這 種技術與場景的深度融合,正推動數字人從概念創新走向規模化應用。 科大訊飛在數字人技術上實現多維度突破,展現出數字人交互的新範式。 2024 年 1024 開發者節發佈的星火超擬人數字人率先實現了語義貫穿的"口 脣-表情-動作"生成,使數字人的表現更加自然流暢。該產品通過統一的神 經網絡實現端到端建模,支持語音視頻實時對話,能精準匹配語音內容與肢 體動作,還具備場景識別能力,可以辨識攝像頭中的具體物體和狀態。更重 要的是,用户能夠創建個性化的數字分身,自定義包括性格、背景在內的多 個維度,體現出數字人技術從標準化向個性化的演進。
魔琺科技推出了全棧式數字人解決方案。魔琺通過"有言"、"有光"、"有靈" 三款產品覆蓋了數字人應用的主要場景:其中"有言"平臺能夠實現 3D 視頻 一鍵生成,集成了 AIGC 三維動畫、超寫實形象、運鏡和聲音等技術,顯著 提升視頻製作效率;"有光"專注於 AI 驅動的 3D 超寫實數字人直播,支持 實時語音驅動和智能互動;"有靈"則面向企業級應用,通過 AIGC 技術規模 化復刻"金牌員工"能力,支持全域多端的 7×24 小時專業服務。這些應用已 在培訓、電商、金融、快消、廣電等領域得到廣泛應用,展現了 AI 數字人 技術的商業化落地潛力。
出門問問 WetaAvatar 4.0 數字人取得引擎技術突破。引擎採用"運動預測+ 人臉驅動"雙模塊架構,運動預測模塊通過語音分析技術提取關鍵參數,實 現嘴型動畫與語音的精準同步;人臉驅動模塊則結合預生成驅動視頻和靜 態圖片,生成包含嘴型變化、面部表情和肌肉運動的全面運動場,顯著提升了數字人的表現力。新一代引擎在視頻合成速度、背景渲染、人物分離等方 面均實現優化,其音畫同步性指標 Sync-C 普遍高於上一代產品。目前引擎 已經應用於國內產品奇妙元和國際產品 DupDub。
萬興科技發佈的萬興播爆展現了 AIGC 在商業領域的突破性應用價值。 2023 年 3 月發佈的萬興播爆基於 AI 技術實現了真人視頻的一鍵生成,通 過內置的百余套專業級場景模板和超逼真多國籍 AI 數字人,支持中英西法 德意日韓等 120 多個國家的語種和口音,可在幾分鍾內完成傳統需要數周 的視頻製作流程。這一產品顯著降低了出海營銷門檻,相比傳統外籍演員拍 攝方式可節省 80%以上預算,特別適合電商帶貨、產品介紹等場景。
4. 端側 AI 應用加速普及,推動智能化生活升級
AI 端側應用通過本地處理實現快速響應與隱私保護,引領智能終端的下一 代技術革新。端側 AI 應用通過在本地設備(智能手機、IoT 終端、車載系統 等)直接運行 AI 算法,將傳統依賴雲端的圖像識別、語音交互等功能轉移到 設備端實現。這種架構在降低網絡延迟的同時確保數據隱私安全,使設備即 使在離線狀態下也能持續提供智能服務。隨着算力提升和模型優化,端側 AI 正從簡單的感知智能向複雜決策能力演進,在更多應用場景持續拓展。
4.1. AI AGENT 和機器人引領 AI 產業革命
AI Agent 作為新一代數字化員工,憑藉理解、規劃、執行的全鏈路能力, 正加速融入企業運營體系。AI Agent 不僅是簡單的工具,更像是需要系統性 培養的數字員工,企業需要通過專業數據構建和技能訓練,使其深度理解企 業文化和業務流程。這些數字員工可以執行營銷活動、支持客户、優化芯片、 協助軟件編寫,甚至是作為實驗室助理或首席執行官導師。為此,英偉達創 建了生命周期平臺 nemo,讓生態系統能夠更容易地構建人工智能代理,能 夠創建、交付、持續改進人工智能代理。nemo 為每個階段提供庫,從數據 創建、訓練、微調、合成數據生成、評估到護欄。關於人和人工智能的關係, 英偉達認為人工智能不會取代 50%人的工作,而是人工智能將為 100%的人 完成 50%的工作。
人工智能為機械系統注入新動能,智能機器人有望成為世界上最重要的產 業之一。儘管機器人已顯著提升製造業生產力,但機器人行業長期發展停 滯,擴張困難。主要原因在於傳統機器人過於專用化、缺乏靈活性,難以適 應不同場景。相比之下,人工智能具備自適應和學習能力,靈活性更強。因 此,現在可以將這種通用人工智能技術應用到具身人工智能或物理機器人 領域,推動機器人技術實現突破。這一過程需要構建三個計算系統:首先是 傳統的人工智能系統;第二是模擬訓練系統,為 AI 提供學習環境和合成數 據;最后,經過驗證、訓練和評估后,將模型部署到物理機器人中。為此, 英偉達專門開發了面向機器人的 Jetson 處理器。藉助這一技術,機器人不 僅能感知周圍環境,還能將文本指令轉化為關節運動,從而實現更靈活的操 作。
英偉達發佈強化學習虛擬系統 IsaacLAB,致力於為人類和機器人提供系統 化訓練方案。英偉達在該系統中構建了三個核心工作流程:第一個是羣組模 仿,通過採集人類示範動作,並利用域隨機化技術生成數百個類似場景,幫 助機器人掌握泛化能力;第二個是分組,運用生成式 AI 技術創建大量隨機 化的環境和任務場景,豐富機器人的訓練樣本;第三個是羣組控制,這是一 個模型提煉框架,能夠將所有已習得的任務和技能整合到統一模型中,使機 器人實現多樣化的運動技能。 AI 將賦能機器人引領工廠革命。傳統軟件一直扮演工具角色,而 AI 突破 了這一定位,成為具備技能、能夠自主執行任務的智能主體。未來工廠將會 有兩個 AI 系統,其一是數字化 AI Agent,與辦公室員工協同工作;其二是 實體化的 AI 機器人系統,承擔物理世界的生產任務。許多企業、媒體認為 製造實體產品纔有真正的價值和意義,而軟件是虛擬的東西,因此不信任軟 件的價值。但未來機器人和 AI 的結合將會更加釋放軟件的價值。 英偉達宣佈將與軟銀合作,為日本帶來並建立人工智能基礎設施,共同建 設日本最大的人工智能工廠。英偉達和軟銀計劃整合無線通信、計算機和 5G-RAN 基帶,將傳統電信網絡升級改造為 AI-RAN 系統,實現語音、數 據、視頻的承載。未來雙方還會將新型人工智能分佈在軟銀的上萬個站點中。 這一佈局最終將形成覆蓋全日本的 AI 智能網絡。隨着 AI 基礎設施的建立, 新行業和新公司有望會孕育新的商機。 過去基站主要用於傳輸電信和互聯網瀏覽等服務,但現在隨着緊密相連的 智能網絡的發展,AI 網絡將成為日本基礎設施的核心。英偉達和軟銀展望 未來,認為個人 AI 助手將如同 PC 和智能手機一樣普及,成為個人生活的 智能伴侶,在旅行規劃、教育指導等方面提供全方位服務,並通過深度瞭解 用户的健康、教育等狀況,成為他們的「雙胞胎 AI 助手」。因而,這也對每 個主權國家、政府都建立自己的主權數據中心提出了要求和挑戰。
4.2. AI 手機:硬件升級提速,終端智能邁入新階段
三星率先發布搭載端側 AI 的 Galaxy S24 系列,帶動 2024 年 AI 手機市場 快速起步。三星 Galaxy S24 系列於 2024 年 1 月首次實現了端雲結合的 AI 架構,在通話翻譯、圖像處理和語音轉寫三大場景實現純端側處理。該系列 搭載高通驍龍 8 Gen3 處理器,通過端側模型預處理確保個人信息不出設備, 同時實現毫秒級響應。其中,實時通話翻譯功能完全在本地進行,無需聯網 即可實現多語言實時對話;本地 AI 還能進行照片智能修復和多人會議實時 轉寫,體現了端側 AI 在提升用户體驗同時保護隱私的典型優勢。
端側 AI 應用成為 2024 年手機行業創新重點。小米在 2024 年 2 月發佈的14 Ultra 搭載首個 AI 大模型計算攝影平臺 Xiaomi AISP,通過整合 CPU、 GPU、NPU 和 ISP 實現 60TOPS 算力,首次將 AIGC 技術應用於 100 倍數 碼變焦的實時處理;OPPO 在 2024 年 1 月的 Find X7 系列中率先集成了端 側 AIGC 消除、AI 通話摘要功能;vivo 則在 2023 年底推出了從 10 億到 1750 億參數的五款不同規模端側模型,構建起較為完整的 AI 能力矩陣。 終端廠商基於端雲混合架構探索 AI 落地路徑,行業共識逐步形成。根據聯 發科、IDC、OPPO 在 2024 年 2 月發佈的《AI 手機白皮書》,AI 手機需具 備高效算力調度、環境感知、自學習和創作四大核心能力。目前各大廠商採 用端側預處理與雲端協同的技術路線,在保護用户隱私的同時確保功能實 時性。根據 Counterpoint Research 預測,2024 年生成式 AI 手機出貨量將突 破 1 億部,到 2027 年市場佔比有望達到 40%,顯示出強勁的增長潛力。 華為在 HarmonyOS NEXT 中首次實現 AI 能力操作系統級下沉,開創端側 智能新範式。根據 IT 之家 2024 年 6 月信息,華為不同於市面上簡單集成 大模型的 AI 產品,而是通過軟硬芯雲整合構建了鴻蒙原生智能架構,使 AI 與操作系統深度融合。這種系統級融合使得小藝智能體能夠常駐導航條,用 户可通過全局拖拽方式直接處理文字、圖片、文檔,實現摘要、潤色、提取 表格等功能;同時,搭載盤古大模型的小藝具備 23 類 TOP 場景的記憶感知 能力,任務成功率達 90%,已實現與 300 多個重點服務的無縫對接。這種 將 AI 能力下沉到系統層的架構創新,極大提升了端側 AI 的應用效率。
蘋果通過 Apple Intelligence 構建全方位端側 AI 架構。蘋果在 iOS 18 中推 出了 Apple Intelligence 系統。基礎 AI 能力通過設備端處理實現,包括文本 校對、圖像清理和自然語言理解等,對於更復雜的計算需求,系統會調用基 於 Apple Silicon 的服務器集羣進行 Private Cloud Compute,確保數據隱私不 被收集存儲。這一架構支持多樣化的端側應用場景:在寫作工具方面,能夠 進行文本校對、重寫和摘要;在圖像處理上,支持移除干擾元素和自然語言 搜索;在個人助理方面,全新設計的 Siri 可通過設備端上下文理解實現更自 然的交互,並能跨應用執行復雜任務。
Agent 類 AI 應用迎來落地關鍵期,智譜 Phone Use 通過語音交互打開手機 控制新場景。2024 年 11 月,智譜 AI 基於 AutoGLM 智能體和 GLM-4-Voice 將AI應用擴展至"Phone Use"領域,可以模擬人類完成微信點贊、淘寶購物、 訂票等複雜操作。目前這一 Phone Use 能力已適配微信、淘寶、美團等 8 款 主流應用。在交互效率方面,Phone Use 突破了傳統語音助手的單一指令模 式,支持多輪對話和複雜任務執行,為用户提供更自然的操作體驗。相比傳 統 AI 助手僅能通過 API 調用的方式,AutoGLM 的 Phone Use 技術為端側 AI Agent 在手機市場的拓展提供了參考方向。
端側 AI 手機的競爭焦點已從功能堆砌轉向用户隱私與體驗的平衡突破。傳 統雲端 AI 模式雖然算力充沛,但隱私風險和網絡依賴限制了其發展空間。 新一代手機廠商通過端雲結合架構,既確保個人信息不出設備,又能實現毫 秒級響應,標誌着終端智能已找到兼顧隱私與體驗的最優解。這種基於用户 核心需求的創新,將成為未來 AI 手機競爭的關鍵砝碼。 終端智能正從單一功能走向全場景協同,AI 手機的競爭邏輯已轉向生態構 建。目前各大手機廠商紛紛佈局系統級 AI 架構,不再侷限於簡單的功能集 成,而是着眼於打造端側智能生態。這種轉變意味着,手機廠商的競爭重點 將從硬件規格轉向場景生態,誰能率先構建起完整的智能場景閉環,誰就能 在下一輪行業變革中佔據先機。
4.3. AI PC:全場景智慧加速,應用生態革新
英特爾酷睿 Ultra 處理器為 AI PC 帶來革命性突破。2024 年 9 月,英特爾 發佈 Ultra 200V 系列處理器,為 AI PC 帶來突破性的性能提升和能效優化。 這一新品在三大 AI 引擎架構上實現全面突破:CPU 整體功耗較上代降低 50%,NPU 性能提升 4 倍,GPU 首次採用 Xe2 圖形微架構帶來平均 30%的 性能提升,整體平臺算力高達 120 TOPS。通過與 100 多家 ISV 和開發者的 合作,該處理器已支持超過 300 個 AI 加速功能,並針對 500 多種 AI 大模 型進行了優化。
聯想新一代 ThinkPad 將端側 AI 延伸至智能場景交互,開創商用電腦新形 態。聯想於 2024 年 9 月推出的 ThinkPad X1 Carbon Gen 13 等新品,突破了 傳統的 AI 應用方式,搭載高通驍龍 X Elite,支持 Copilot,新增 Smart Modes 智能模式可根據場景自動調整性能,如檢測到背后有人時自動為屏幕打碼; Smart Share 功能通過 AI 虛擬傳感器實現手機與 PC 的觸碰傳輸。聯想還將 在 Yoga Pro 9i 等機型上率先搭載 Creator Zone 軟件套件,基於 Stable Diffusion 模型提供自然語言生成視覺內容的能力。
鴻蒙生態春季溝通會上,華為首次將自研的盤古大模型引入 PC 端。華為 2024 年新發布的 MateBook X Pro 搭載了 AI 概要功能,通過盤古大模型可 實現會議實時轉寫、音視頻快速總結等智能應用;同時還首發推出AI空間, 作為一站式 AI 能力聚合入口,不僅集成了文心一言、訊飛星火、智譜清言 等第三方大模型,還精選了超過 100 個 AI 智能體,覆蓋辦公、學習、創作 等多個場景。
華為 MateBook X Pro AI 算力在硬件層面得到突破,實現了多項智能體驗 的升級。MateBook X ProAI 搭載英特爾酷睿 Ultra 9 處理器,在僅 980g 的 輕量機身中實現了 40W 的持續性能釋放。通過 AI 賦能,該產品帶來了多 項智能體驗升級:AI 慧眼讓視頻會議中的人像清晰度提升 50%,AI 音效提 供三種智能降噪模式,AI 字幕支持實時翻譯和會議記錄導出,此外華為 AI 還積極賦能第三方應用,例如首發支持 WPS AI、與萬興喵影的合作,成為 市場首款支持 AI 特效調用 NPU 的筆記本。
華勤技術與榮耀深度合作,積極參與 AI PC 市場。2024 年 2 月的 MWC 2024 巴塞羅那發佈會上,榮耀推出 MagicBook Pro 16,該產品由華勤提供 研發製造服務,搭載英特爾酷睿 Ultra 處理器,支持本地 AI 智能搜圖、文 檔總結等 AI 功能。作為聯想等品牌的長期 ODM 合作伙伴,華勤依託 "2+N+3"產品線佈局和在智能硬件領域的深厚經驗,已具備從產品設計、硬 件配置到軟件生態的全方位研發能力,有望在 AIPC 快速發展的浪潮中佔據 重要位置。
AI PC 的差異化競爭已從硬件轉向場景創新與生態構建的深水區。傳統 PC 廠商曾依靠處理器性能和輕薄程度獲取溢價,但在 AI 時代,聯想通過 Smart Modes 等場景感知功能、華為通過 AI 空間生態平臺的路徑顯示,未來的競 爭優勢將更多來自對用户場景的深度理解和生態資源的整合能力。這意味 着 PC 行業的競爭模式正在發生根本性轉變。 ODM 廠商有望通過 AI PC 浪潮實現向產業鏈上游的突破。華勤從單純代 工向全方位研發服務轉型的案例表明,AI PC 帶來的不僅是終端形態的革 新,更是整個產業鏈重構的契機。在這輪變革中,具備深厚硬件積累和靈活 創新能力的 ODM 廠商,有機會突破傳統代工模式的天花板,在產業鏈中獲 得更大的話語權。
4.4. 智能駕駛:端到端模型破局,多模態感知提速
2024 年端到端 AI 駕駛模型成為技術發展主流,降低系統開發複雜度。端 到端大模型的引入使得智能駕駛功能更加接近真實的人類駕駛體驗,減少 了人工規則的介入。從落地產品看,特斯拉 FSD V12.4 於 2024 年 6 月已開 始向首批用户推送測試,採用端到端神經網絡架構;小鵬推出的 XNet+規控大模型 XPlanner 及大語言模型 XBrain 等端到端方案已在 2024 年 5 月實現 量產;華為 ADS 3.0 端到端類人駕駛技術也已發佈,計劃於 2025 年開始商 用。 多模態 AI 模型在端側實現感知決策能力提升,推動 ADAS 功能進化。AI 技術在智能駕駛中的應用範圍不斷擴大,多模態 AI 模型在端側實現了圖像 識別、雷達和激光雷達數據處理等核心功能。華為推出的 ADS 3.0 系統採 用端雲協同架構,將基礎感知、預警等高頻任務放在本地處理,有效提升了 系統響應速度。生成式 AI 技術也在 ADAS 領域得到應用,用於提升自適應 巡航、車道保持等功能的智能化水平。在視覺處理方面,飛凌微等企業推出 的車載視覺處理芯片,為端側智能駕駛視覺解決方案提供了支持。 特斯拉 FSD V12 作為端到端 AI 應用的重要里程碑,在 2024 年持續迭代。 最新發布的 FSD 12.4.1 版本實現了從方向盤扭力監測向基於神經網絡的攝 像頭駕駛員監測系統的轉變,通過 AI 技術實時分析駕駛員眼睛狀態、視線 方向等行為數據,大幅提升了駕駛安全性。根據馬斯克介紹,FSD V12.4 相 比 12.3 版本的接管率改善了 5-10 倍,且整合了此前割裂的 FSD 和非 FSD 分支,其改進幅度堪稱 FSD V13,特斯拉預計通過持續的版本更新,有望實 現用户幾乎無需手動接管的智能駕駛體驗。
小鵬汽車率先推出了國內首個量產上車的端到端大模型。根據小鵬 520 AI DAY 披露,其端到端解決方案包含深度視覺感知神經網絡 XNet、規劃大模 型 XPlanner 和大語言模型 XBrain 三個核心組件,通過超過 10 億里程的視 頻訓練數據支持,實現每兩天一次的快速迭代。這套系統顯著提升了智能駕 駛性能,使前后頓挫減少 50%、違停卡死減少 40%、安全接管減少 60%。 特別值得注意的是,基於這套端到端架構,XNet 能通過 200 萬個網格實現 對現實世界的 3D 重構,感知範圍擴大至 1.8 個足球場,而 XPlanner 則通過 海量數據(維權)訓練實現更接近人類的駕駛策略。
地平線最新發布的 SuperDrive 方案展現了端到端架構的創新應用。根據地 平線披露,該方案採用動態、靜態、OCC(Occupancy 佔用網絡)三網合一 的端到端感知架構,顯著提升了系統性能,使遮擋準召率提升 70%,同時將 動態代碼行數降低 90%、網絡負載降低 50%。特別是在數據驅動的交互博 弈算法支持下,系統在複雜交通場景中展現出更接近人類駕駛員的決策能 力,使擁堵場景下的變道成功率提升 50%,路口通過率提升 67%。
黑芝麻智能發佈第三代 DynamAI NN 神經網絡處理器,在 AI 芯片端側計 算進行創新。2024 年 5 月發佈的該處理器通過原生支持 Transformer 架構強 化了對高階自動駕駛算法的處理能力,同時採用新型存取架構在保證大模 型所需高帶寬的前提下顯著降低了 DDR 成本。可見車載端 AI 芯片已經開 始突破帶寬瓶頸,向支持更復雜 AI 模型的方向演進。
端到端 AI 模型正在顛覆傳統的智能駕駛技術路線。與傳統的"感知-規劃-控 制"分層架構不同,端到端模型通過直接從輸入到輸出的映射大幅簡化了系 統架構,如小鵬 XNet 將違停卡死減少 40%、特斯拉 FSD V12 提升接管率 5-10 倍的數據都驗證了這一路徑的優勢。這種範式轉變不僅降低了開發復 雜度,更重要的是開創了一種更接近人類駕駛認知的技術方向,預示着智能 駕駛的發展將進入新階段。
4.5. 從單一設備演進到智能助手,AI 賦能新型智能終端創新
小米小愛音箱 Pro 將 AI 在應用於智能音箱領域,實現更精準的空間感知。 新一代產品通過六麥陣列式聲源定位和波束成型技術,結合 AI 深度學習算 法,實現了在複雜噪聲環境下的精準空間感知。在多設備部署環境中,系統 能夠基於説話人的朝向和距離自動判斷最優響應設備,使聲音交互更加自 然流暢。這些技術升級使智能音箱在實際應用場景中的識別準確率和響應 效率得到顯著提升。
智能眼鏡迎來 AI 賦能拐點,百度佈局高端市場並帶動供應鏈變革,新一輪 AIoT 創新周期顯現。小度 AI 眼睛於 2024 年 11 月發佈,產品整機重量 45g, 集成了 1600 萬像素超廣角攝像頭、四陣列麥克風和防漏音揚聲器單元,能 夠實現第一視角拍攝、邊走邊問、視聽翻譯等多模態交互功能。基於文心大 模型和重構的 DuerOS AI 原生操作系統,小度 AI 眼睛使設備的多輪交互能 力提升 7 倍。此外,其創新電路架構實現了 56 小時待機、5 小時以上連續 聆聽,並支持 30 分鍾快充,為其作為 AI Agent 的持續服務提供了堅實保 障。
科大訊飛 iFLYBUDS 耳機通過多項 AI 技術的融合應用,推動辦公體驗變 革。在硬件層面,產品搭載雙麥克風拾音系統,結合 CVC 通話降噪技術, 確保了清晰的語音質量。在軟件層面,耳機採用語音活動檢測和通道降噪算 法,顯著提升了語音指令識別的準確性。產品支持實時錄音轉寫功能,可無 縫對接微信、Skype、釘釘和騰訊會議等主流會議平臺。在會議過程中,內 置的生成式 AI 能夠自動過濾通話中的語氣詞和冗余內容,智能提煉重要信 息,幫助用户把握會議要點。 字節跳動 Ola Friend 耳機展現 AI 耳機多場景應用潛力。字節跳動推出的 Ola Friend 耳機通過接入豆包 AI 大語言模型,在多個生活場景中實現了 AI輔助功能的創新應用。在旅遊場景中,耳機可以提供實時語言翻譯和當地信 息查詢服務;在英語學習場景下,能夠進行發音糾正和口語練習指導;在日 常社交中,則可以通過 AI 助手提供實時交流建議。產品在音質方面也進行 了優化,滿足用户在不同場景下的聽音需求。
多模態感知技術正在重塑智能終端的交互邊界。新一代終端通過集成先進 的感知硬件和 AI 算法,顯著提升了環境理解能力。這種感知能力的躍升不 僅提升了產品體驗,更重要的是拓展了人機交互的新維度,使設備能更好地 適應和響應複雜的現實場景需求。 AI 正在讓智能終端從固定場景突圍走向全場景融合。傳統智能硬件往往囿 於單一功能定位,如音箱主打語音控制、耳機專注音頻體驗。而新一代終端 通過 AI 賦能實現了跨場景能力,從字節 OlaFriend 集成翻譯、學習、社交 功能,到百度 AI 眼鏡支持視聽、導航、交互等多模態應用,都展現出智能 終端正從專用工具向全能助手演進。這種融合趨勢將給智能終端市場帶來 新一輪創新周期。 端側 AI 的發展已從單一功能創新走向全方位突破。在手機、PC、智能駕駛 和新型智能終端等領域,廠商正通過端雲協同架構和多模態技術提升用户 體驗,通過場景創新和生態佈局構築競爭優勢,只有搶佔技術高地的廠商才 能夠搶佔市場先機。
5. 多方協力推動中文語料積累,AI 應用生態日益完善
5.1. 中文語料匱乏成發展瓶頸,數據共享與合規問題亟待解決
數據質量直接決定 AI 模型性能上限,成為產業發展瓶頸。GPT-3 在訓練前 有 45TB 的純文本數據,經過質量過濾后,有效數據僅佔 1.27%,這種低效 率正在加劇算力資源的緊張。特別是在預訓練+微調成為新範式的背景下, 高質量數據對模型性能的影響更為關鍵,這促使產業界從以模型為中心加 速轉向以數據為中心。 高質量數據面臨耗盡危機,亟需尋找新的突破路徑。《Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning》預測顯示, 高質量語言數據將於 2026 年耗盡,這種稀缺性正在重塑產業格局。特別是 在中國 AI 領域,數據供給生態不完善、獲取成本高等問題更為突出。面對 這一挑戰,採用技術手段自動合成數據正成為重要解決方案,Gartner 預計 到 2024 年,用於訓練大模型的數據中將有 60%來自合成數據。 中文數據短板讓數據緊缺進一步加劇,制約着國產大模型的突破。根據阿 里研究院 2024 年 5 月的數據,目前全球網站中,中文語料內容佔比僅為1.3%,遠低於英文的 59.8%。特別是在金融、醫療、法律等專業領域,高質 量中文訓練數據更為稀缺。這些問題不僅限制了國產大模型的性能提升,也 在一定程度上影響了中國AI技術在國際市場的競爭力。從產業發展趨勢看, 中文語料建設的短板正催生巨大的市場機會,預計未來將有更多資本和技 術力量投入這一領域。
數據孤島和共享障礙成為產業發展的掣肘,數據共享平臺、提供數據中間 件服務等新型業態有望成為重要方向。與英語世界的 Common Crawl 等開 放數據機構相比,中文世界缺乏有效的數據共享機制。各大平臺基於商業競 爭考慮,對數據共享持謹慎態度,這種封閉生態不利於行業整體發展。當前 中文數據的割裂狀態不僅增加了數據獲取成本,也影響了語料的整體質量 和覆蓋面。特別是在用户行為數據、交互場景數據等高價值數據領域,行業 壁壘更為明顯。開源共訓模式的興起有望改變這一現狀,特別是在中國有望 成為全球最大數據圈的背景下,數據開放共享的價值更為突出。 語料建設從重規模向重質量轉型,催生新的商業機遇。"大力出奇跡"的發展 模式已經難以為繼,從數據清洗、標註到合規諮詢,從中間件服務到數據交 易平臺,一系列新型數據服務業態正在形成。特別是在構建合成數據和專業 數據集方面,具備相關能力的企業將獲得更大的發展空間。 版權與監管約束限制數據開放,體系建設亟待完善。中文數據在開放共享 方面面臨諸多法規政策限制,大量高價值公共數據因版權和合規問題難以 轉化為訓練語料。雖然政府部門和國有企業掌握着豐富的數據資源,但受制 於數據安全、隱私保護等監管要求,開放程度仍然有限。同時,現有中文大 模型過度依賴英文數據訓練的問題也日益凸顯,導致模型輸出存在明顯的 文化語境缺失,對本地化應用形成掣肘。這一現狀催生了對合規數據服務的 迫切需求,專業的數據合規諮詢、治理服務有望成為新的業務增長點。
5.2. 中文語料資源加速累積,行業聯盟協同發力
中文語料建設進入快速發展期,產業化進程明顯提速。2024 年上半年,中 國 AI 語料建設迎來多個具有里程碑意義的重大項目。其中最具代表性的是 智源研究院 4 月發佈的中文互聯網語料庫 CCI 2.0,該項目總規模達 500GB, 涵蓋 1.25 億個網頁的高質量數據內容,為大模型訓練提供了可靠的中文語 料支撐。CCI 2.0 的重要性不僅體現在其規模上,更在於其建立了嚴格的數 據質量管理體系,通過多輪清洗和質量把控,確保了語料的準確性和可用性。 同期,中國互聯網協會召開的"大模型中文語料庫的發展現狀與高質量發展 路徑"研討會,深入探討了數據清洗和合規操作的標準化問題,為行業發展 指明瞭方向。 多方聯動構建數據生態,產業協同效應逐步顯現。2024 年 7 月世界人工智 能大會期間,語料主題論壇的召開成為行業發展的重要催化劑。會上發起的 "語料生態服務大模型可持續發展倡議"獲得 50 余家企業響應,展現了產業 各方協同推進的決心。該倡議着重強調構建數據共享、資源合作和第三方服 務的生態機制,為打破數據孤島提供了可行路徑。特別值得關注的是論壇上 推出的語料運營平臺 1.0,該平臺集成了數據採集、清洗、標註、測試和應 用的全流程工具鏈,極大提升了語料供給的效率和質量。通過產業聯盟的方 式推動技術創新和標準制定,不僅降低了單個企業的研發成本,也加快了行 業整體的進步速度。
數據交易與開源項目雙輪驅動,市場空間持續擴大。伴隨行業發展提速,中 文 AI 語料的基礎設施建設也在加快推進。上海數據交易所 2023 年 9 月推 出的語料交易掛牌項目,為數據的規範化流通提供了重要渠道。雲測數據、 浪潮信息等企業通過共建機制積極參與語料生態建設,形成了良性的市場 格局。在開源領域,多模態語料庫"書生·萬卷"和騰訊的"AI 向善語料庫"為 行業發展注入了新的活力。基礎設施的完善為新型商業模式的發展創造了 條件,特別是在垂直領域應用中,專業化的數據服務平臺開始嶄露頭角,圍 繞特定場景提供定製化的語料解決方案。從產業鏈角度看,基礎設施的完善 將賦能整個生態的升級,為上下游企業創造更大的發展空間。
5.3. 語料產業鏈上下游協同發力,推動中國語料生態建設
5.3.1. 多元數據源構建 AI 語料上游基礎,驅動模型專業化發展
數據供給正在從量變走向質變,合規授權成為重要分水嶺。從供給端看,互 聯網公司、媒體平臺和專業出版機構通過多渠道採集構建了龐大的多模態 數據庫,其中,中文在線等頭部企業已累積超 60TB 高質量正版數據,並與 多家 AI 模型公司建立深度合作關係。數據授權和合規建設正成為產業鏈上 遊的新焦點,這種趨勢將加速淘汰不合規的數據供應商,推動市場向規範化 方向發展,具備優質數據源和完整授權體系的企業將在行業競爭中佔據有 利地位。 隨着 AI 應用向各行業滲透,垂直領域的專業數據價值日益突出。在金融領 域,同花順、恆生電子等專業機構積累了大量交易和金融數據;消費領域中 的值得買、匯納科技等機構在零售和電商場景數據方面具有優勢;大宗商品 領域的上海鋼聯、卓創資訊等機構則在能源、物流等數據積累上佔據重要地 位;航運領域以中遠海科為代表的企業在交通運輸數據方面也形成了獨特 優勢。這些專業數據的價值主要體現在三個方面:一是具有極強的時效性, 能支撐實時決策;二是專業性強,涉及核心業務流程;三是獲取門檻高,需 要長期積累和專業處理。隨着 AI 應用從通用場景向專業領域滲透,具備深 度行業積累的專業數據服務商有望在細分市場中獲得更大發展空間。
5.3.2. 中游環節平臺升級,寡頭構建技術和數據的雙重壁壘
AI 數據產業鏈中游呈現寡頭競爭格局,技術和數據的雙重壁壘強化了頭部 企業的優勢地位。核心企業普遍具備兩大特徵:一是擁有大規模專有數據資 產,如拓爾思積累的 2000 億條高質量公開數據;二是掌握深厚的技術積累, 如科大訊飛在語音技術領域的領先優勢。既掌握核心技術,又擁有大規模的 專有數據資產的雙重壁壘將使企業在市場競爭中具備持續領先優勢。此外, 這些企業正從單一技術服務商向整體解決方案提供商轉型,通過"技術+數 據+服務"的深度整合提升市場壁壘。
5.4. 國產語料建設新鋭,夯實語料根基
拓爾思已在 AI 語料建設領域形成全方位競爭優勢,依託超 2000 億條高質 量公開數據和強大的數據處理能力確立了領先地位。拓爾思擁有 40 多項發 明專利和 1000 多項軟件著作權,特別是在自然語言處理領域,通過持續創 新已實現文本的語義理解、分類、情感分析等核心功能,為智能客服、智能 寫作等應用場景提供了有力支撐。在多模態內容處理方面,公司掌握自主可 控的底層技術,能夠同時處理文本、音視頻等多種類型數據,並在虛擬人智 能對話、內容生成等新興領域取得突破。 2023 年 6 月發佈的拓天大模型在媒體、政務、金融等領域取得顯著成果。 拓天大模型基於超過 10 年的高質量數據積累,以及萬家以上企業級用户實 踐,具備內容生成、多輪對話、語義理解等十大基礎能力。2024 年 5 月拓 爾思與華為簽署全面合作協議,共同推進數智化轉型,這一戰略合作有望進 一步提升公司的市場競爭力。同時,公司通過"海貝"數據庫的數據資產平臺, 已在政府、媒體、金融等行業積累了大量優質客户,持續鞏固其行業領先地 位。
海天瑞聲成為國內首批完成大模型全流程語料佈局的企業。根據接待調研 公告,公司已構建包括預訓練、指令微調和偏好對齊的全鏈條語料體系,涵 蓋"中文對話預訓練數據集"、"多語種語音模型預訓練及微調數據集"、"視覺 模型預訓練及微調數據集(圖像-文本、視頻-文本)"等核心產品。特別是在垂 直領域,公司重點開發了醫療、金融、法律、藝術等專業領域標註資源庫, 截至 2024 年三季度已為近 20 家境內外大模型企業、科研機構提供訓練語 料服務。
海天瑞聲在多語種語料資源積累方面確立領先優勢。截至 2024 年三季度, 海天瑞聲已沉澱超過 205 個語種/方言的語料覆蓋能力,特別是在一帶一路 沿線國家的小語種資源建設上顯著領先同業;同時構建了 130 個多語種發 音詞典,積累詞條超 1200 萬條。2024 年公司聯合清華大學啟動多語種語音 大模型研發計劃,通過自研數據清洗技術,進一步提升多語種語料處理效率, 強化了公司在語料建設領域的核心競爭力。
博彥科技通過"數據+技術+生態"的融合模式構建差異化優勢。公司自主研 發的"人工智能計算平臺"提供從數據樣本標註、模型部署到推理服務的一站 式 AI 開發能力,通過"可視化"操作和"零代碼"開發大幅降低了 AI 應用的開 發門檻。2024 年 7 月推出的"企業數據價值運營方案"致力於消除數據孤島, 通過匯聚行業數據構建專業化語料庫。特別是在醫藥等垂直領域,公司通過 系統性的數據整合,打造了專業度極高的 AI 模型訓練體系。另外,公司擁 有全方位生態合作體系,創新驅動能力強勁。公司與百度、華為、阿里、科 大訊飛等國內外大模型廠商建立了深度的生態及技術合作關係,成為文心 一言等產品的首批生態合作伙伴。
(轉自:金融小博士)