熱門資訊> 正文
2025-04-03 19:03
2025 年春節前后,DeepSeek 橫空出世,改變了全球 AI 產業的市場格局與發展範式。DeepSeek 爆火進一步激發了「邊緣 + AI」的市場剛需,顯著降低了大模型在邊緣設備的部署及運營成本。一時間,各類應用紛紛接入 DeepSeek,包括搜索引擎、機器人、汽車、智能手機等。
移遠通信產品總監王韜在「綻放通信之美—預見端側 AI 未來」主題直播中指出,DeepSeek 推動端側 AI 從被動智能邁向主動智能,但也引發了關於算力、算法與應用的新思考和新挑戰。移遠通信提供的端側大模型解決方案,深度融合 LLM(大語言模型)、RAG(檢索增強生成)與 Agent(智能體)等前沿技術,賦能端側 AI 方案創新。
DeepSeek帶來端側AI發展新範式
端側 AI 並非新興概念。早期,產業藉助 DSP 等專用芯片處理語音識別、圖像增強等基礎任務。隨着芯片算力提升,產業開始探索將複雜算法融入終端設備。2021 年前后,將 AI 大模型能力植入端側興起,標誌着端側 AI 進入認知智能階段。根據頭豹研究院發佈的《2024 年中國端側 AI 場景應用分析:智能終端與邊緣計算的融合創新》報告,2023 年中國端側 AI 市場規模達 1939 億元,預計 2028 年將增至 19071 億元,年均複合增長率為 58%。
從千億級邁向萬億級,端側 AI 后續更大的增量源於端側應用與邊緣計算、AI 大模型的融合。這種融合從技術架構、場景創新和產業生態三個維度重塑端側 AI 的邊界。移遠通信產品經理王柯指出,相較於雲端 AI,端側 AI 實時性更佳,推理成本更低,且保障了用户隱私安全。此外,端側 AI 使大模型推理擺脫網絡依賴,在信號不佳或無網絡服務區域也能提供推理服務。
然而,將雲端AI 大模型部署到端側面臨諸多難題。比如,如何平衡端側推理效率與模型能力,怎樣實現硬件、軟件與商業模式的協同發展等。在 DeepSeek 出現前,端側 AI 發展的難題是雲端依賴與端側限制並存。端側設備受算力、存儲和功耗制約,難以承載超 10B 參數的大模型,需藉助雲端協同完成複雜任務,這導致響應延迟和隱私風險。同時,模型功能單一,無法支持多模態交互或主動決策。
DeepSeek 的出現對端側 AI 發展具有革新意義。它採用創新的 MoE(混合專家)架構,如在 DeepSeek-V3 模型中,每層包含 256 個路由專家和 1 個共享專家,每個 Token 僅激活 8 個專家,大幅降低了訓練和推理成本;通過高效蒸餾技術,將大模型推理能力遷移至更小、更高效的版本,彌補了小推理模型 Self-play 學習的不足;此外,DeepSeek-R1-Zero 實驗性版本表明,僅通過強化學習就能獲得強大推理能力。
DeepSeek 的方法論使端側能夠獨立完成複雜任務,將應用決策權從雲端真正下放至邊端。王柯認為,DeepSeek 闡釋了一種 「少即是多」 的 AI 大模型部署理念,進一步推動模型小型化發展。現階段,3B 或 4B 參數級別的模型已等效於之前的 7B 參數模型。
移遠通信產品經理羅錚談到,從硬件角度看,DeepSeek 的一大優勢在於以更小體量模型帶來更強能力,這使得小算力芯片、小容量存儲及小 BOM 就能實現高性能端側 AI 方案。
當前,端側 AI 大模型主要落地場景包括 AI PC、AI 手機、AI 可穿戴設備、AI 智能家居、AI 智能汽車、AI 零售等。機器人應用,尤其是人形機器人,則是端側 AI 落地的藍海市場。端側 AI 大模型部署通過技術架構革新和場景適配能力突破,推動機器人產業向更高階的自主化、智能化方向發展。一方面,端側部署大模型可提升機器人實時性和可靠性,通過本地化運算大幅降低數據傳輸延迟,使機器人能在毫秒級的時間內完成環境感知 - 決策 - 執行閉環,滿足工業場景中精準抓取、避障等高實時性需求;另一方面,端側部署大模型還可提升機器人交互性能,支持視覺、語音、觸覺等多模態數據實時融合處理,使服務型機器人實現更自然的擬人化交互。
移遠通信產品經理沈鋒稱,對於機器人等端側 AI 應用而言,DeepSeek 帶來的直觀影響是能以更低成本實現相同性能,使越來越多領域願意投資端側 AI。
移遠通信為端側AI落地提供一站式解決方案
正如移遠通信幾位產品經理在直播中所分享,移遠通信為端側 AI 落地提供涵蓋智能硬件、算力、算法和服務的完整解決方案,助力用户快速實現端側 AI 從概念到落地的商業轉化。
高效支持主流 AI 大模型
AI 大模型是 AI Agent 的核心。目前,移遠大模型解決方案可實現 AI 模型的端側部署,支持通義千問、DeepSeek 等主流 AI 大模型。
針對當下大熱的 DeepSeek,DeepSeek-R1 版本專注於強化學習技術路線,其蒸餾版本參數範圍為 1.5B 至 70B。得益於蒸餾技術,這些小模型雖體量小但性能強勁,是端側 AI 部署的理想選擇。目前,移遠通信高算力AI智能模組 SG885G已能穩定運行 DeepSeek-R1 蒸餾小模型,並完成了針對性微調。
實測數據顯示,移遠通信 SG885G 模組運行 DeepSeek-R1 蒸餾小模型的方案,其生成 Tokens 的速度超每秒 40 個 Tokens。按人類講話速度換算,人類每分鍾能講 300 - 400 個字,約 500 - 600 個 Tokens。因此,能支持每秒準確輸出 10 個Tokens 的 AI 模型即可滿足商業落地條件。
未來,隨着性能持續優化,該方案的速度還將進一步提升,為智能終端設備賦予更強大的 AI 能力。該方案適用於智能機器人、智能座艙、機器視覺、個性化虛擬助理、平板電腦、老人監護、智能家居、AI 玩具及可穿戴設備等多元場景。
王柯表示,在眾多廠商還在探索如何支持 DeepSeek 模型時,移遠通信已率先取得突破,這充分彰顯了移遠通信技術團隊卓越的工程化能力,能夠快速完成方案設計、模型微調、端側部署和資源調度等工作。
在端側 AI 交互至關重要的語音交互領域,移遠通信大模型解決方案在全語音鏈路上實現無縫銜接與高效運行,涵蓋 KWS 語音喚醒、VAD 人聲檢測、ASR 語音識別和 TTS 語音播報等主流功能,助力用户快速實現基於語音的無感交互。
滿足端側 AI 廣泛需求的模組產品矩陣
邊緣計算智能模組是AI Agent 的基石。移遠通信面向端側 AI 應用提供豐富的模組產品。SG885G-WF 是該公司目前在端側 AI 領域主推的一款智能模組,集成高通 QCS8550 芯片,綜合算力高達 48 TOPS,並提供 LCM、攝像頭、觸摸屏、I2S、PCIe、UART、USB、I2C 等豐富接口資源。為滿足端側 AI 在不同算力、成本、功耗方面的需求,移遠通信還提供包括但不限於以下產品系列:
■ 基於高通 QCS8250 的 SG865W 系列,算力為 15 TOPS;
■ 基於高通 QCM6490 的 SG560D 系列,算力為 12 TOPS;
■ 基於展鋭 UIS7885 的 SG530C 系列,算力為 8 TOPS;
■ 基於瑞芯微 RK3568 的 SG368Z 系列,算力為 1 TOPS。
移遠AI智能模組SG885G-WF
羅錚介紹,總體而言,移遠通信的智能模組可覆蓋 1 TOPS 到 48 TOPS 的算力需求,公司還在規劃 80 - 100 TOPS 甚至更高算力的產品,以滿足客户在端側 AI 不斷增長的算力需求。
同時,移遠通信也打造了有利於用户方案實現的開發板,比如MWC 2025上公司推出QuecPi Alpha智能生態開發板,基於高通躍龍QCS6490處理器打造,AI算力高達12 TOPS,能夠滿足眾多AIoT應用場景中對物體識別、圖像識別等功能的多樣化需求。這些硬件方案都能靈活支持安卓、Linux 和 Ubuntu 等操作系統,充分滿足客户在高端機器人和端側 AI 方面的開發需求。移遠通信的軟硬件產品組合及背后的技術服務,能讓用户便捷地完成不同算力平臺間的切換,加速產品升級迭代進程。
智能模組 + AI 大模型,重構端側 AI 應用
如前所述,移遠通信的智能模組和大模型解決方案有着豐富的應用場景。下面通過具體案例,看看移遠通信如何藉助智能模組 + AI 大模型賦能端側 AI 應用。
第一個案例是當下熱門的 AI 機器人。基於移遠通信端側大模型解決方案中的 SG885G-WF 智能模組和全語音鏈路架構,服務機器人能對指令、提問或求助迅速響應,準確理解用户意圖,並以清晰自然的語音反饋,實現無感交互。尤其值得一提的是,得益於 SG885G-WF的高算力,移遠「大模型+AI 機器人」解決方案在離線狀態下也能提供完整 AI 性能。
這一方案使服務機器人在終端市場具備巨大應用價值,涵蓋醫療康養、智能客服、接待導覽和零售導購等領域。在具體落地過程中,移遠通信技術團隊提供高效、全面的工程化支持,助力客户產品快速進入市場,並形成差異化競爭優勢。比如,在醫療康養領域,德壹機器人基於移遠通信集成SG885G-WF模組的端側AI解決方案推出了全能王AI具身機器人,支持8自由度3D視覺導航,融合尖端AI技術、中醫理療智慧與具身智能,重新定義了智能理療服務邊界。
沈鋒認為,DeepSeek 等 AI 大模型的推出為機器人行業發展注入新活力,重塑了機器人的 「大腦」。現階段,機器人僅具備一些基礎能力,交互方面存在較大欠缺,AI 大模型的加入將改善這一狀況。未來,落地到終端的AI機器人會越來越多,這將是一個在未來 5 年增長率極高的領域。
第二個案例是 AI 智能無人零售解決方案,移遠通信通過大模型重新定義無人零售的交互體驗。在 MWC 2025 上,移遠通信宣佈推出圍繞 「動態視覺 + 邊緣計算」 構建的全新 AI 智能無人零售解決方案。該方案基於移遠高性能5G AI算力模組 SG560D,支持先進的全鏈路商品識別算法,識別準確率高達 99%,還具備創新的上新平臺等軟硬件服務,可無縫對接客户應用程序。除 SG560D 模組搭載的QCM6490平臺外,移遠通信這套方案還能兼容更多算力平臺,滿足零售機廠商的差異化競爭需求。
目前,移遠 AI 智能無人零售解決方案已與興元科技 「喵星人」 智能售貨機等多家客户產品完成系統集成,並進入實地場景測試階段。
結語
作為端側 AI 生態的重要構建者,移遠通信正通過「智能模組 + AI 大模型」雙輪驅動,重塑端側 AI 的產業格局。其一站式大模型解決方案深度融合 DeepSeek 等前沿 AI 模型,結合SG885G-WF 等高性能AI模組,成功突破端側部署的算力瓶頸與工程難題,在機器人、智能零售、汽車電子等場景中,構建起 「本地決策 - 實時交互 - 隱私保護」 的閉環能力。
未來,移遠通信將持續深化算力平臺迭代,推出 80 – 100 TOPS 甚至更高算力的智能模組,結合場景化算法優化,將 AI 大模型的能力拓展至更廣泛的端側 AI 場景。
(轉自:移遠通信)