熱門資訊> 正文
2023-07-13 22:15
又一個重要玩家入局大模型賽道。
7 月 13 日,京東雲峰會在北京開幕。會上,京東正式推出了千億規模的言犀大模型,以及言犀 AI 開發計算平臺,並展示了京東基於大模型,開發的一系列服務京東原有業務的產品和解決方案。
與華為、火山、阿里等國內雲廠商相似,京東同樣是從行業應用而非 ChatGPT 這樣的 C 端產品切入大模型賽道。京東雲表示,言犀大模型的訓練數據來源於 70% 的通用大數據和 30% 的京東數智供應鏈原生數據,這使得言犀大模型從誕生之初,就有更強的產業屬性,從而更好的解決產業問題。
要讓大模型真正服務千行百業,除了老生常談的在技術和基礎設施層面解決訓練成本、部署成本和推理成本等問題,還要讓開發、部署大模型這件事本身變得更加簡單。使得原來需要數個 AI 科學家才能完成的工作,讓幾個普通程序員也能「手到擒來」。
京東雲基於大模型開發了一系列平臺工具和應用產品。會上,各個工具和產品的負責人一一登臺,現場演示了生成、訓練、部署自己的行業 AI 大模型,以及利用 AI 大模型開發的工具來尋醫問診、生成 AI 商圖的實踐操作。每一項工具和應用的使用,可以説都是「傻瓜式」操作,比如只需要五步勾選幾個選項就能生成各種各樣的大模型,其難度不會超過填寫一個網上的調查問卷。
在雲巨頭們紛紛 All in 的大模型賽道,京東雲並不是「種子選手」。看起來沒有太多 AI 大牛和噱頭的京東雲,選擇了最接地氣的方式,召開了自己的第一場大模型發佈會。
但就像極客公園此前多次説過的那樣,今天大模型領域比拼的不是誰的技術背景、算力更強,誰的參數更大,而是誰能真正解決行業使用大模型的難題,讓技術真正服務於產業,服務於消費者。而務實的京東雲,完全有可能會是這個大目標下的一匹黑馬。
01、言犀大模型和 AI 開發計算平臺
會上,京東詳細介紹了言犀大模型的技術底座,以及基於京東雲過去積累的 AI 技術能力和計算資源,開發的面向行業客户的言犀 AI 開發計算平臺。
京東從 2017 年就開始佈局人機交互,並在之后涉足大語言模型。2021 年,京東推出了十億級模型 K-PLUG,2022 年推出了百億級規模的 Vega,而本次大會上,展示的則是千億級規模的言犀大模型。
京東探索研究院院長何曉冬介紹,言犀大模型有三大特徵:產業原生,價值驅動,開放協同。
產業原生,指的是訓練大模型的數據,除了 70% 來自通用數據,還有一部分來自京東原有的零售、物流、金融、健康等業務場景,使得言犀具備產業認知能力,同時京東每年產生的數百億交互數據會作為大模型的「燃料」,幫助言犀持續強化迭代。
價值驅動,指的是利用前沿的算法能力,提升模型的推理速度、降低部署成本、提高迭代效率,從而讓模型有更高的應用價值。
開放協同,是指基於京東雲的計算集羣(天琴α)和自研向量數據庫,用更強的算力來加快模型迭代和部署速度。
值得一提的是,讓大模型持續升級迭代是今天行業需要解決的關鍵問題之一,而這個問題的鑰匙之一就是向量數據庫。京東自研了向量數據庫 Vearch,可以支持百億級向量搜索,目前該數據庫已經開放給國內首個開源軟件基金會——原子基金會。
與大模型基座一同發佈的「言犀 AI 開發計算平臺」,則是基於言犀大模型解耦出的基礎能力,集成了超過 100 種場景的 AI 算法和工具,打造的一個低代碼 MaaS 平臺。
京東雲介紹,行業用户可以在這個平臺上完成從訓練模型到應用服務部署的全周期管理。之前需要 10 余人的科學家團隊工作,現在只需要 1-2 個算法人員,通過平臺即可完成從數據準備、模型訓練到模型部署的全流程,訓練效率提升 2 倍,推理提效 6.2 倍,成本節約近 90%。
如下圖所示,發佈會現場,京東雲演示了言犀 AI 計算平臺構建的工作流程。
在言犀上構建行業大模型,基礎底座可以選擇言犀或其他開源大模型。
基於選擇的參數訓練大模型,並在原有模型的基礎上,加入新的數據持續迭代。
何曉東介紹,未來,言犀大模型將實施三步走戰略。第一步,2023 年 7 月推出言犀大模型;第二步,2023 年下半年,在京東內部應用到核心業務,打造標杆實踐;第三步,2024 年上半年,全面開放,服務產業。
02、京東的大模型應用實踐
會上,京東雲還介紹了一系列京東內部基於言犀大模型打造的應用和實踐,具體可以分成兩類:一類是基於京東原有的電商、物流、健康、金融等業務場景,開發的行業應用;另一類則是基於大模型的技術能力開發的原生應用,比如在數字人、具身智能等領域的實踐。
具體如下:
京東健康多年來累積了大量的行業數據和資源,包括累計超 3000 萬高質量臨患對話,百萬級規模醫學知識圖譜,醫療專家團隊,覆蓋線上 140 余科室的醫生、藥師、營養師、心理醫生。
基於這些數據和能力,京東訓練了健康大模型和行業應用。大模型的多輪交互、工具調用、總結摘要、圖文多模態等能力,幫助京東健康在多場景升級應用:有服務用户的個人健康助手、隨訪管理;還有服務醫生、藥師的診療助手、醫療文案書寫、科研助理、診療服務調度等。
會上,京東雲展示了一個醫療問診案例。
傳統的 AI 醫療問診,往往是一次提問而 AI 直接回答一大串內容,從結果來看這樣的做法和搜索引擎相似。而真正的醫師(包括互聯網醫師)往往是通過多輪提問,為缺少醫療知識的患者答疑解惑,從而更準確地判斷病情。
而引入大模型的多輪交互和學習能力以后,如上圖所示,AI 可以像醫生一樣通過一輪輪提問,更準確地判斷患者病情,並給出相應的醫療判斷和建議。
以前的物流網絡建設,更多是基於物理世界的運營自動化。隨着產業智能化推進,利用仿真技術建立物理世界的數字孿生體,實現智能預測,成為物流科技的升級方向。
京東物流超腦基於多模態大模型實現實時交互、根因分析和智能決策,並將隨着技術的不斷更新迭代,逐步具備實時自動生成全局最優的供應鏈解決方案的能力。針對供應鏈全鏈路,提供輔助決策、運營優化,以及一線作業智能助手等能力,實現降本增效,推動供應鏈物流進入大模型時代。
在倉內智能交互建模方面,實現對倉庫佈局問題的智能化原因分析。例如輸入,請分析在今年雙 11 大促的佈局堵點。系統經過分析,會回答,效率堵點為地狼貨架數目不夠,建議增加一排貨架。這極大的減少了傳統方法花在調研、分析上的成本。
在金融營銷場景的應用探索中,京東金融數十年在行業理解、營銷流程、運營策略等知識的積累,解決了諸如關鍵性任務,動態適應性、用户體驗等問題,大幅優化了營銷運營流程,降低運營人員的學習成本與操作成本。
最終實現了方案生產效率上百倍提高。將過去涉及產品/研發/算法/設計/分析師等 5 類以上職能才能完成的流程,壓縮至 1 人;同時,一個入口的全新交互模式,讓人機交互次數從 2000 次降低至少於 50 次,將操作效率提升了超過 40 倍。
在電商領域,基於京東積累的商品數據和大模型,可以更好地理解商品特徵,從而幫助商家自動化生成商品圖片、賣點等營銷素材,提升商家運營工作效率和營銷內容質量。
如上圖所示,通過一張商品圖片,可以快速生成電商運營需要的商品主圖,營銷海報圖和商詳圖等,滿足快速開店、上品、營銷的需求,每套圖成本降低 90%,周期從 7 天縮短到半天。
值得一提的是,在產品層面,京東雲並不在追求單純的技術能力,而是以實踐需求優先。比如在生成商圖上,除了提供文生圖這樣的多模態能力,京東雲還提供了圖生圖,比如在多個生成圖片均不滿意的情況下,商户可以提供其滿意的營銷素材作為參照,讓 AI 更快生成用户需要的宣傳圖片。
在當下大火的數字人領域,京東也推出了相應的產品和工具。甚至在活動開始時,京東雲還讓京東數字人與歌手一起同台獻唱。
京東雲多模態數字人集合了最前沿的、綜合性的、多模態的人機交互技術,言犀數字人大模型將單人數據進行參數差異化遷移,可通過提供極少量樣本素材,以對話交互模式實現從形象、音色、背景視覺、知識庫到短視頻等全鏈路內容自動生成,支持 5 分鍾簡易拍攝,支持生成大姿態(如側臉/走動/手勢),支持動態局部高清與語義驅動的肢體動作編排。
基於京東雲自研電商領域知識增強模型 K-PLUG,僅需在直播后臺上傳商品鏈接,便能夠智能「閲讀」商品詳情,找到關鍵的規格、賣點等信息,自動生成更真實、生動、可閲讀性強的直播文案。據統計,商家原先寫出 50 個 SKU 的直播腳本需要至少五小時,使用 K-PLUG 模型只需要一鍵生成,極大提升了直播間運營效率。目前,京東雲多模態數字人已經入駐 4000+品牌直播間,帶動超 8 億元 GMV。
最后還有一個彩蛋,是當下最火的大模型行業應用之一,具身智能。也就是大模型與機器人技術的結合。
在這一塊各家企業都還處於早期探索階段,與前幾天的華為一樣,京東雲也沒有闡釋太多,而是播放了一段實拍的概念 Demo。視頻中,何曉東坐在辦公桌前,桌子上有一個白色的機械臂,他用自然語言命令言犀為他拿一樣東西,機械臂就按照他的命令完成了所有的動作。
免責聲明:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,亦並非旨在提供任何投資意見。有關內容不構成任何專業意見、買賣任何投資產品或服務的要約、招攬或建議。本頁面的內容可隨時進行修改,而本公司毋須另作通知。本公司已盡力確保以上所載之數據及內容的準確性及完整性,如對上述內容有任何疑問,應徵詢獨立的專業意見,本公司不會對任何因該等資料而引致的損失承擔任何責任。以上內容未經香港證監會審閲。