繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

直擊WAIC:蘿卜快跑入選「國家隊」,AI數字人技術升級,百度全棧自研殺瘋了

2025-07-26 20:18

(來源:機器之心)

機器之心報道

編輯:楊文、澤南

AI超級實用的落地,只有這家玩明白了。

前幾天,奧特曼在採訪中透露,親自體驗 GPT-5 后,被其強大的能力嚇到。有個自己都搞不懂的問題,模型卻能一下答出來,那一刻他甚至覺得自己在擅長的領域也有些「無力」。

儘管 AI 進展飛快,但總有人質疑:真正落地的 AI 不多,很多所謂的新技術,可能只是炒作。

目光轉向剛剛開幕的世界人工智能大會 WAIC,我們會發現 AI 實用化的落地應用其實並不少。

智駕正被全網熱議,會場內外,有很多無人駕駛車輛忙碌的身影,它們是大會的官方接駁車輛。

走進展區,數字人主播正在與人們互動,TA 們語氣自然,知識淵博,反應比你還快,可以説已經達到了頂級主播的水準。

這一波展示,像是把我們一下拉進了未來世界。更有意思的是,這些貼近我們生活且有用的 AI 技術都來自一家公司,而且是全棧自研的。

中國最火 RoboTaxi 出海,半年拿下兩城

在今年的世界人工智能大會(WAIC)上,百度蘿卜快跑入選「中國人工智能產業創新成果展」,成為本屆大會的「國家隊」代表之一。此外,大會還傳來好消息 —— 百度等一批科技公司獲得了上海智能網聯汽車示範運營牌照,Robotaxi 正式駛入浦東核心區。

不知從何時開始,國內大街上穿梭的蘿卜快跑成爲了稀松平常的事物。在社交網絡上一些有關新鮮事物的話題下,不時可以看到對於無人出租的好評。

出行服務是自動駕駛商業化落地的關鍵場景,就在今年,全球無人駕駛行業展現出了前所未有的發展速度,Waymo、特斯拉、蘿卜快跑等玩家的進展不斷。轟轟烈烈的 RoboTaxi 大潮中,蘿卜快跑做到了覆蓋範圍廣,用户口碑好。

截至目前,蘿卜快跑已為全球用户提供了超過 1100 萬次出行服務,僅在國內,他們的無人駕駛車隊就已駛入北京、深圳、武漢、重慶等十多個城市,如果拉出一條最近業務擴展的時間線,你會發現它的發展速度很快。

今年 3 月,蘿卜快跑首次出海,宣佈與迪拜道路交通局(RTA)簽署戰略合作協議,在迪拜市區開展無人駕駛規模化測試和服務。雙方計劃在迪拜部署超過 1000 輛無人駕駛汽車。蘿卜快跑還宣佈與阿聯酋自動駕駛出行公司 Autogo 達成戰略合作,打造阿布扎比地區規模最大的無人車隊。

6 月,香港特別行政區運輸署發佈消息稱,蘿卜快跑已獲批在香港東涌的指定路段和時段開展測試,進⼀步豐富其自動駕駛應用場景。這是自去年 11 月蘿卜快跑獲批香港首個自動駕駛車輛先導牌照后在港發展的最新進展。

短短半年內,蘿卜快跑的測試範圍從最初的機場周邊逐步延伸至北大嶼山核心區域,如今已深入東涌城市生活圈,測試範圍已延伸至交通情境更復雜的道路。

蘿卜快跑在香港已開始測試。 蘿卜快跑在香港已開始測試。

就在 7 月 15 日,蘿卜快跑與 Uber 達成了戰略合作伙伴關係,計劃未來將無人駕駛出行服務拓展至美國及中國內地以外的全球多個市場。

這就意味着以后 RoboTaxi 會無縫融入人們的日常生活。服務上線后,乘客將可以用 Uber App 呼叫到由蘿卜快跑提供服務的無人駕駛車輛。數千輛蘿卜快跑會接入 Uber 的全球出行網絡。據介紹在今年年底前,雙方將率先在亞洲和中東地區部署蘿卜快跑第六代無人駕駛車,未來將逐步擴展至全球更多市場。

在技術逐漸成熟,政策支持的加持下,蘿卜快跑的商業模式已經獲得了進一步驗證,預示着中國自動駕駛技術已經具備快速複製和落地的能力。

也許再過不了多久,我們的出行方式就會因為 RoboTaxi 發生轉變。

AI 老羅帶貨 5500 萬后,百度又放大招

除了蘿卜快跑,百度還在數字人上下足了功夫。

前不久的 618 大促,百度的羅永浩數字人在社交平臺刷屏。

直播間里,AI 老羅和 AI 朱蕭木插科打諢、段子頻出,叭叭地講了 6 個多小時,共吸引超 1300 萬人次觀看,GMV 更是突破 5500 萬元,一度創下數字⼈直播帶貨新紀錄。

沒想到,短短一個月,百度的數字人技術又升級了。

這次 WAIC 上,百度發佈新一代數字人技術 NOVA,預計在今年 10 月份上線,超頭主播能力復刻將進入規模化量產時代。這也意味着,普通用户也能像大主播一樣專業帶貨了。

NOVA 的技術亮點之一就是劇本模式的升級

過去,數字人主播只能照着腳本念臺詞,語氣生硬、表情刻板,但現在的 NOVA 依託文心 4.5 Turbo 的大師級劇本模式,將普通腳本升級為劇本,可以根據商品信息、參考知識以及人設要求等,實時調整主播的語調、表情和動作。

前段時間刷到馮唐的視頻號,越看越不對勁,里面的動作來來回回就那幾個,點頭、擺手,還一卡一卡的。説實話,傳統數字人之所以一眼假,很大程度上是因為動作僵硬。

NOVA 數字人在動作生成上也進行了改進,不再是簡單的動作複製,而是能夠貼合話術場景精準生成符合語義的複雜動作,甚至在業界首次實現雙人互動。直播中,倆數字人可以隨時插話、打斷而不穿幫。

此外,NOVA 的語音克隆技術也達到了新的高度,能夠完美復刻主播的聲音和氣口,甚至連口頭禪都能準確捕捉。

就以羅永浩數字人為例,它在直播中時不時蹦出一句老羅經典口頭禪「聽懂了沒?」「明白了吧?」,隨便拋出的金句也都是熟悉的老羅的味道。

在雙人講品中,倆數字人也可以默契配合,無縫接話,不會說了下句忘了上句。講到激動處它們可以手舞足蹈、語速加快;商品賣爆時能興奮到聲調拔高,已經達到與真人主播難辨真假的程度。

據瞭解,這樣的高效復刻能力,僅需要 10 分鍾的真人樣本。也就説,你傳 10 分鍾自己的視頻,NOVA 能還你一個超真實的數字人,實現聲音、動作與氛圍的精準匹配。

Nova 數字人技術的另一大突破就是 AI 大腦的升級,讓數字人能夠向頂級主播水平進階——搭載的 AI 大腦可實時接收直播數據並自主決策,調度多智能體完成問答互動,並結合熱點輸出風格化內容。

在問答環節,AI 大腦的高效性和精準度又讓數字人能夠快速回應觀眾提問。同時,基於用户的歷史行為,AI 大腦能夠主動發起問題,引導觀眾在直播中互動,並通過多輪追問和解答有效引導用户的購買意向。

AI 大腦還通過智能決策和多智能體協同,實現了更為靈活的互動方式。比如,基於直播間實時熱度及轉化情況,靈活調度助播專家、運營專家、場控專家等多個角色智能體, 實現智能發福袋、開價、控庫存等玩法,提升帶貨轉化。

對於觀眾和直播者來説,數字人技術帶來了真正實用級的體驗。

百度全棧自研背后

要打造「數百萬個超級應用」

不論是加速出海的智駕,還是不斷製造爆款的數字人,百度的 AI 應用背后都是一套全棧自研的技術體系在提供支撐。值得一提的是,本次 WAIC,百度的智算集羣和飛槳深度學習平臺,與蘿卜快跑一起入選了「中國人工智能產業創新成果展」,這無疑也是對百度 AI 全棧能力的又一強力肯定。

從 AI 掀起第一個浪頭時,百度就意識到了 AI 的真正價值在於應用,而不僅僅是技術的炫技。

基於這一戰略思維,百度成功布局了一個龐大的 AI 應用矩陣。

除了蘿卜快跑和 Nova 數字人這兩大代表成果外,百度還在傳統搜索、網盤以及智能辦公等多個領域,實現 AI 應用的全面落地。

例如,今年 3 月份百度正式上線的秒噠平臺,以 「⼀句話做應用 + 多智能體協作 + 多工具調用 」的技術組合,顛覆了傳統開發流程。用户可以通過自然語言描述需求,自動生成完整功能代碼,極大提升了開發效率。

而百度文庫和百度網盤的升級版,則通過多模態的 AI 能力提升了內容管理、知識創作和共享的效率,推動了 AI 技術在傳統產品中的深度應用。

百度之所以能夠在 AI 應用層面持續推進,正是依託其強大的 AI 全棧自研架構。作為國內最早投身 AI 研發的企業之一,百度從算力、框架、模型到應用構建起一個完整的 AI 生態系統

百度的 AI 全棧架構首先在算力層面實現關鍵突破,核心支撐來自自研的崑崙芯 P800 和百舸 AI 異構計算平臺。

今年,百度成功點亮國內首個全自研三萬卡集羣,支持多個千億參數大模型全量訓練,同時滿足千家客户百億參數大模型的高效精調需求。這一成果不僅保障了國產算力供給,還顯著降低了訓練與推理成本。在算力管理方面,百舸平臺通過兼容多芯片、適配主流框架、異構資源調度等方式,實現了高達 99.5% 的有效訓練時長,並優化了推理效率與穩定性。

在框架層,飛槳作為國內首個自主研發的深度學習平臺,成爲了國內外多個行業的技術基礎。飛槳框架具備高度的靈活性,能夠支持大規模的 AI 模型訓練和推理任務,同時與百度的其他技術組件深度融合,提升了模型訓練的效率。飛槳不僅支持多種硬件平臺,還為開發者提供了簡潔易用的接口,極大降低了 AI 技術的應用門檻。

此外,飛槳還是中國市場上唯一可與全球兩大主流深度學習框架美國 TensorFlow 、 PyTorch 正面交鋒的深度學習框架,這意味着中國打造了自主可控的人工智能操作系統。

在模型層,百度構建了以文心大模型為核心的多層次模型體系,持續推動生成式 AI 能力向產業落地。文心大模型具備跨模態、強推理、低成本等核心特性,廣泛應用於搜索、推薦、智能助手等互聯網產品中,同時賦能製造、金融、能源、城市治理等多個行業。

2025 年 4 月,百度發佈文心 4.5 Turbo 和 X1 Turbo 兩大旗艦模型,推理速度提升顯著,價格分別下降 80% 和 50%,在多個權威評測中達到 SOTA 水平。近期發佈的 IDC 報告顯示,文心大模型在 8 大維度調研中獨佔 7 項滿分,綜合實力最強。

2025 年 6 月,百度正式開源文心 4.5 系列模型,覆蓋 47B、3B 等參數規模,提供 MoE 與稠密結構版本,成為國內少有的完全開源的通用大模型。這一系列進展不僅體現百度在模型層的技術領先,也為推動 AI 大模型的普惠化和產業落地提供了堅實支撐。

與傳統的「技術炫技」不同,百度的 AI 全棧架構始終聚焦於如何將技術應用於實際需求中,並且通過靈活的技術整合將 AI 應用推向更廣泛的市場。正如百度 CEO 李彥宏所言:「我們不只是要推出一個超級應用,而是要打造數百萬個超級有用的應用。」

越來越多的實踐證明,百度「AI 超級有用」的道路是對的, 且越走越寬了。隨着全棧架構持續演進,百度的目標不止於打造明星產品,而是讓 AI 真正「飛入尋常百姓家」,成為驅動現實場景創新的底層動力。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。