繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

羅永浩數字人百度開播,如何保留羅氏幽默?

2025-06-20 13:52

文|王雅迪

ID | BMR2004 

6月17日,在百度AI Day開放日上,百度官宣打造業界首個超頭主播「羅永浩數字人」,併發布了高説服力數字人的四項技術突破。6月16日,「羅永浩數字人」直播首秀吸引了超1300萬人次觀看,商品交易總額(GMV)突破5500萬元,其中部分核心品類帶貨量反超真人直播。

今年4月,百度率先發布了高説服力數字人,把AI數字人帶入了3.0階段,成爲了一個像真人一樣的、形神音容高度協調、會思考決策、能協作完成特定任務的超級智能體,此次百度打造的「羅永浩數字人」就是典型代表。

百度副總裁、電商總經理平曉黎坦言,之所以在這個時間點嘗試和交個朋友合作老羅的數字人,是高説服力數字人發佈帶來的底氣。得益於文心大模型4.5的發佈、人像視覺大模型、語音大模型的精進,以及多智能體協同架構的上線,高説服力數字人不僅語言腳本質量實現了質的提升,可以使數字人出口成章,腳本到劇本模型的升級能夠實現表情、動作、語言的協調一致,同時,數字人還擁有能夠自主思考決策的AI大腦,不僅可以與直播用户實時互動,還可以調度多智能體完成特定任務。

和老羅合作要跨越哪些難點?

據悉,6月16日,「羅永浩數字人」剛開播26分鍾,帶貨金額就超過了前一場真人直播1小時的GMV,最終這場數字人直播GMV超過了5500萬元,帶貨效果媲美5月23日真人場直播的5000萬元,並且直播間用户的平均觀播時長超過了真人場直播。

相對不錯的成績背后,百度正在嘗試突破兩大難點問題。

平曉黎指出,「老羅的數字人是當下電商數字人領域的無人區,還沒有人挑戰過生成超頭主播的數字人直播。首先,從老羅直播看,他和老搭檔朱蕭木之間的你來我往,配合非常好,眉眼傳情,默契度滿分,而我們見過的都是單數字人,雙人數字人還能互動是第一個難點;個人風格是超頭主播的靈魂,讓數字人還原老羅風格且有梗有趣,是第二個難點。」

羅永浩作為超頭IP,有着極強的用户號召力,用户不僅會詢問價格和商品詳情,還會在直播間「抖包袱」調侃他。面對這些前所未有的複雜任務場景,數字人技術面臨着很高的挑戰。值得一提的是,百度此次推出的數字人選擇了「雙人」模式。

平曉黎表示,之所以選擇「雙人」,就是要做市面上還沒有的內容形式。其次,頭部主播

雙人直播是其特點,尤其老羅經常是雙人直播,他有搭檔。從雙人直播的角度來看,在真正的直播架構里,除了主播、副播以外,整個直播間還有很多小的智能體,每個智能體都是一個任務。

她舉例説明,助播智能體是氛圍組,在適時的時候可以鼓個掌,所以可以理解為大的主播和副播也是兩個數字人的智能體。真正一場真人直播雖然看到的是兩個人,實際背后看不到的還有20個人,而在數字人直播間通過多智能體架構,沒有人數限制,且可以實現24小時不停播。

此次「羅永浩數字人」直播時長超過了6個小時。對此,平曉黎解釋道,「這是因為老羅是頭部主播,任何一次曝光對他來講都是一種‘使用’,他需要有一定的稀缺性,不能一天24小時、一年365天都直播,稀缺性就不夠了。但技術上可以實現更長的時間。」

多模協同下的「四大」突破

在高説服力數字人的基礎之上,此次百度電商慧播星再一次迭代,圍繞慧播星首席體驗官羅永浩實現了體驗、內容、視覺、效果的四大突破。

一是體驗突破。通過復刻羅永浩與助播朱蕭木的絲滑配合,上線了業界首個雙數字人互動直播間,給營銷轉化和C端體驗,打開了新的想象空間;

二是內容新突破。得益於文心4.5 Turbo的升級,通過深度訓練,使數字人做到了「懂創作」,帶貨時塑品專業度更高,數字人可以「有個性」,甚至能「玩梗」,為數字人注入了靈魂;

三是視覺新突破。此次「羅永浩數字人」直播,是業內首個多模態高度融合的數字人應用場景,實現了在直播實時環境下的超長演繹,做到了動作、表情、語調等貼合話術,且穩定可控;

四是效果新突破。AI大腦基於直播間信號靈活控場,數字人可以主動邀評、高頻互動,極大提升了用户沉浸感。通過多智能體實時調度,在數字人直播間實現了和真人直播間一樣的互動玩法,如抽獎、發福袋等。

這些突破的背后,離不開百度多模協同的數字人技術。該技術基於文心4.5 Turbo,實現了融合多模規劃與深度思考的劇本生成。通過劇本驅動數字人多模協同,實現了動態決策的實時交互,使數字人的「神、形、音、容、話」達到高度統一。最終呈現出一個具備高表現力、內容吸引人,且「人—物—場」可自由交互的超擬真數字人。

百度集團副總裁吳甜介紹道,劇本生成技術包含臺詞生成、多模驅動和動態交互三部分。以「羅永浩數字人」劇本為例,基於文心大模型4.5 Turbo生成的劇本,展現了主播的個人特色,具備典型的羅氏幽默風格,並能夠實現雙人主播的內容協同,動態實現豐富的實時互動。通過文本自控的語音合成大模型,實現高復原的語音合成能力,再結合直播臺詞及發音人特徵,合成風格恰當、自然流暢的聲音。

為解決「羅永浩數字人」直播雙人聲音配合的難點,百度採用對話上下文編碼器,將對話歷史輸入和當前對話進行語音合成的統一推理計算,最終實現流暢、自然的雙人對話效果。在數字人形象生成以及驅動方面,通過結合多模態視頻理解、跨模態信號生成、視頻生成等技術,克服了高可控交互,高精度、長時間一致性保持等難點,實現了高一致性超擬真「羅永浩數字人」長視頻生成。

「AI+直播」成本優於真人直播?

據羅永浩所屬機構交個朋友代表、公司副總裁吳加錄表示,百度的AI能力與交個朋友的直播運營經驗和供應鏈資源實現了技術與場景的完美結合,這類「技術+IP」的協同模式也將為行業探索智能化轉型提供實踐樣本。

這個樣本的直播效果是否達到了成本上可接受的範圍、能否大規模實現複製,針對外界比較關心的這一問題,平曉黎給出瞭解答。

她透露,老羅直播間的成本是可接受的,但預期整個規模化需要大概三個月到半年的時間。這個規劃更多是指不需要太多百度輔助的情況下,由商家、達人獨立操作,雖然還需要一定時間,但成本問題不大,單個數字人制作成本已經控制在千元左右。目前,百度數字人已經運轉一年多,其商業模式已經能夠跑通,因為比真人直播便宜很多。

同時,平曉黎還強調,這要看跟誰比,老羅直播間製作成本看似花費挺多時間,是因為其真人直播的籌備也需要花很長時間,老羅每場直播的成本都非常高。相比之下,如果一個普通的商家開一場直播,最低的一個月主播費也可以達到上萬元。然而,百度數字人可以降到千元,成本低很多。」

以新會陳皮的源頭產地商家廣芸堂為例,過去做真人直播時,一直受主播差旅、時間調配這些高額成本所困。數字人助其突破了這一限制,藉助技術優勢,一邊直觀呈現原料生長的真實環境,一邊通過靈活切鏡,把陳皮的色澤紋理、觸感細節等細微品質,全方位清晰展示,將「產地直採、品質可控」的核心優勢,從抽象概念轉化為可視化、可感知的體驗,直接助推GMV實現160%的增長 。

夢蝶和繁星計劃打造主播數字人

百度電商商業業務部負責人、數字人創新業務部負責人吳晨霞表示,慧播星作為業界首家實現「AI大腦」多智能體調度的產品,實現了靈活場控,並支持一個數字人直播間上線多種玩法,有效提升了用户轉化。「羅永浩數字人」首秀大捷,標誌着慧播星產品力邁向全新階段。

爲了推動更多主播數字人的打造,百度電商還推出兩大計劃:一是「夢蝶計劃」將通過流量扶持、超頭主播數字人打造以及預算扶持,實現百度優選超頭主播的數量倍增;二是「繁星計劃」則將再次追加10萬個慧播星數字人,投入1億元數字人消費補貼、千萬級別的運營扶持,幫助更多的普通人、中小企業開啟數字人直播。

值得一提的是,此次「618」期間羅永浩在百度開播,揭開了其與交個朋友戰略合作的序幕。據悉,羅永浩正式出任慧播星首席體驗官,以超頭部主播能力引領慧播星發展。百度將一起在「AI+直播」領域探索,打造AI實踐、共建行業技術標準、助力達播出海等,同時,羅永浩以「真人+數字人」的形式在百度電商常態化開播。

平曉黎對數字人直播抱有很大的期待。在她看來,只要直播商家有降本的需求,基本上都可以採用真人與數字人混播方式。如果數字人可以提供比真人更好的效果,他就一定會用數字人。現階段商家面對一些平臺的限制,因此沒有辦法完全應用數字人。新物種的出現還需要一個漸進的過程,技術如何與生態位的融合達到平衡,並且讓C端用户也逐步地接受都需要時間,但其發展前景是值得期待的。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。