熱門資訊> 正文
2024-10-31 23:58
文/陳鋒
今年5月,IBM發佈了《2024年CEO調研報告》,其中有兩組數據尤為值得關注。
根據該調研報告,59%的受訪CEO認為,未來企業的競爭優勢,取決於誰擁有最先進的生成式AI;62%的CEO表示,他們需要重新制定商業策略,才能在未來贏得勝利。
得益於大模型技術和生成式AI的推動,整個人工智能領域,也迎來了新的範式轉移——正加速從AI 1.0時代,邁向AI 2.0時代。
AI 2.0時代的重要特徵在於,人工智能會從之前點狀的創新應用,逐步規模化發展到賦能企業業務流程的各個環節,並逐步向產業深水區發展。
上述背景下,連線Insight觀察到,當下中國AI產業也在加速涌現出新趨勢:
一方面,基座大模型底層技術還在不斷迭代,但更多玩家開始思考,怎麼將大模型落地到各個產業中去,賦能到具體的業務場景,儘快跑通商業化路徑;
另一方面,隨着越來越多的企業開始擁抱大模型及生成式AI,AI產業鏈也在加速成熟和分化,上下游產業角色和環節在不斷增多。
AI產業鏈條中的每一個玩家,都面臨着抉擇:要充當什麼角色?聚焦到哪些領域或場景?怎麼落地?等等。
其中,我們注意到,已經在AI領域深耕了十年的商湯科技,選擇了一條難而正確的路——從AI基礎設施到大模型到應用,全棧佈局。
前段時間的「2024商湯十周年國際論壇:邁向AI 2.0共融新時代」的大會上,商湯科技董事長兼首席執行官徐立表示,當下正處於AGI的轉折點,在人工智能2.0時代,商湯的核心戰略是無縫集成數字基礎設施、人工智能模型和應用,集團將以此為基礎,推動新一輪創新。
在這背后,商湯為什麼要選擇全棧佈局?它的底氣源於何處?這一戰略又將把它帶向何處?
1、破解AI 2.0時代成本難題,商湯要做各行各業的「水電煤」
面對生成式AI浪潮,企業們面臨的關鍵問題,早已不是「要不要佈局大模型」了,而是「怎麼擁抱大模型」「怎麼用大模型來賦能業務」。
但在AI 2.0時代,跑通大模型的應用路徑,其實並不容易。
徐立最近在一次論壇上表示,生成式AI或者AI 2.0時代,除了模型的通用性之外,最大的特點是成本結構由「研發人員密集型」轉化爲了「算力資源密集型」。
具體來看,大模型訓練、生成式AI應用,不僅對GPU或異構計算的需求大幅增加,傳統的CPU算力已經無法滿足,還對GPU集羣的計算效率、穩定性等方面提出了諸多要求。
此外,算力也不是簡單的堆砌,而是要為大模型進行優化的複雜系統性工程。
不過算力成本過高、算力資源的浪費,又是當前業界普遍存在的現象,這也就導致,如今的AI解決一個問題,自身所花費的成本和代價,可能比帶來的好處還要大。
怎麼應對這個挑戰?商湯的解法是,把AI三要素「算力、算法、數據」都基礎設施化,同時通過「大裝置-大模型-應用」這一三位一體的核心戰略,以應用驅動模型,以模型帶動算力優化,推動大模型迅速迭代,並降低推理成本。
2021年,商湯提出了「大裝置」的概念,是中國首個提出新一代AI基礎設施思考、並付諸行動的廠商。2022年,作為商湯AI基礎設施重要載體的人工智能計算中心AIDC正式投入運營。
目前,SenseCore商湯大裝置已經搭建起了完善的AI基礎設施架構,包括AI原生算力基礎設施、大模型生產平臺、模型即服務等等。
比如圍繞大模型的訓練,SenseCore商湯大裝置對外提供專家服務,覆蓋大模型規劃和大模型訓練兩個階段。
在大模型規劃階段,商湯通過提供大模型開發諮詢服務和大模型代訓練服務,能讓客户快速理解大模型開發訓練的關鍵節點和潛在痛點。
而在大模型訓練階段,商湯大裝置也提供了從數據、訓練到推理的大模型全生命周期服務,保障大模型開發成果落地。
在推理部署階段,商湯SenseCore MaaS(大模型即服務)萬象模型開發平臺,基於領先的商湯日日新千億級大模型,提供高效率和一站式大模型生產和應用全流程工具鏈,助力企業與開發者構建原生AI應用,提升業務效能。
目前,商湯大裝置萬象已廣泛服務於政務、運營商、金融、互聯網、汽車、泛科技等多個行業客户,以高效的模型精調和推理部署,實現多種業務場景的提智增效。
根據IDC近日發佈MaaS報告《中國模型即服務(MaaS)及AI大模型解決方案市場追蹤,2024H1》。報告顯示,2024年上半年,商湯科技(商湯大裝置萬象)以14.8%的市場份額位居第二。
在SenseCore商湯大裝置這一AI基礎設施之上,客户不僅能開發、訓練大模型,也可以調用平臺上豐富的模型資源庫,來生成特定的垂直行業模型,也能開發原生AI應用——SenseCore商湯大裝置,某種程度上已經成了各行各業做大模型、做生成式AI應用的「水電煤」。
從長遠視角來看,圍繞AI基礎設施的持續佈局,有望幫助商湯在AI 2.0時代佔據先發優勢。
一方面,過去十年里,商湯其實一直在專注於AI底層基礎設施與模型應用,積累起了可觀的算力規模和技術資源。
徐立認為,過去十年的AI 1.0時代的經驗,讓商湯更瞭解市場需要什麼樣的AI產品和服務。他説,商湯是最懂模型的算力服務商,最懂算力的模型服務商。
截至今年7月,商湯大裝置的總算力規模達到了20000PFLOPS,已有超過5.4萬塊GPU。
在AI基礎設施市場,商湯的影響力也在穩步提升。
IDC近期發佈的《中國智算服務市場(2023下半年)跟蹤》報告顯示,商湯科技在中國雲計算基礎設施廠商中脫穎而出,躋身中國GenAI IaaS服務廠商TOP3,居於GenAI IaaS領域第一梯隊。
另一方面,商湯對AI基礎設施的持續投入,也會拓寬商湯在AI 2.0時代的商業化空間。
「電力和通信流量都是基礎設施,一套基礎設施就能服務千行百業,但是早期的成本也都居高不下,隨着技術的迭代以及使用人數的擴大,邊際成本就忽略不計了」,徐立認為,現在AI基礎設施正處於這一轉折點。
2、從更多行業到更多AI應用,商湯將大模型能力加速落地
今年是商湯成立的第十年,不難發現的是,過去多年圍繞AI技術的持續投入和佈局下,商湯正在「雙輪驅動」:
不僅有深厚的傳統的AI業務,而且加速佈局生成式AI業務。
今年上半年,商湯收入為17.40億元,同比增長了21.4%,其中最值得注意的是,從營收結構來看,生成式AI的收入為人民幣10.51億元,同比大幅增長了255.7%,佔集團收入的佔比提升到了60.4%。
商湯的這一切換進程中,不容忽視的一點是,商湯不只是搭建起了以SenseCore商湯大裝置為核心的AI底層基礎設施,而是在進一步深化其與大模型的深度協同。
商湯今年將「無縫集成數字基礎設施、人工智能模型和應用」定為核心戰略,思路和目標也很明確,即面向未來,商湯不僅要成為AI基礎設施提供商,也要成為AI 2.0時代的AI模型提供商。
背后的邏輯在於,一方面,如我們上文所述,「大裝置+大模型」的深度協同,很大程度上能夠推動AI產業高效率、低成本、規模化的AI創新和落地。
另一方面,AI基礎設施之上,如何將大模型的能力、生成式AI的能力加速下沉到爆發式增長的長尾細分場景,纔是關鍵。
對商湯而言,自己做大模型就變得越發重要。
自2023年4月首次發佈「日日新SenseNova」大模型體系以來,商湯在大模型領域的迭代速度和落地進程,一直在加快。
一邊,是商湯已經打造出了愈發豐富的基座大模型,包括語言大模型(SenseChat-5)、多模態大模型(SenseChat-Vision)、語音大模型(Nova-tts-1)、文生圖大模型(SenseMirage)、向量大模型(Nova-Embedding),等等。
今年7月,商湯科技發佈了國內首個具備流式原生多模態交互能力大模型「日日新SenseNova 5.5」,綜合性能較之前的「日日新5.0」提升了30%。
據介紹,在多模態能力上,「日日新SenseNova 5.5」在大部分核心測試集指標上,都對標甚至超過了Open AI的GPT-4o。
另一邊,商湯科技還加速迭代出了面向不同場景、不同行業的垂直行業大模型和解決方案,實際落地進展也在加快。
舉個例子,基於「商量」這一大語言模型,商湯科技迭代出了面向醫療行業的醫療大模型「大醫」,在多個醫療任務評測集上,「大醫」的能力同樣超越了GPT-4o。
今年6月,基於「大醫」,商湯科技與上海人工智能實驗室合作,攜手多家單位,共同發起了創新項目「漸凍症知識問答助手」,后者擁有專業的醫療知識庫基礎,可以為漸凍症患者提供全天候、全面的漸凍症互動答疑。
近日,在中國計算機大會上,「大醫」從近百個項目中脫穎而出,憑藉着在公益領域的突出貢獻,成功入選了2024「CCF十大技術公益優秀案例」。
在其他領域和場景,商湯也在加速將大模型能力,轉化為能落地到實際場景的產品應用,比如代碼小浣熊、辦公小浣熊、秒畫、擬人大模型等等。
今年上半年,已經有超過3000家行業頭部企業使用了商湯的大模型及智算服務,「日日新」大模型的整體調用量,實現了400%的增長。
3、結語
近兩年,從大模型浪潮的爆發 ,到基於大模型技術的生成式AI,AI產業的技術變革正不斷加速,而以商湯科技為代表的一眾AI企業,正努力縮短從技術變革到場景拓寬的距離。
某種程度上,這讓商湯既能着眼於當下,也為未來做好了準備。
徐立表示,商湯科技目前是「兩條腿」走路:
一條腿是傳統AI,基於技術的不斷成熟,商湯能不斷降低成本、加速海內外市場拓展,聚焦利潤貢獻;另一條腿則是新一代的AI大模型,商湯的目標是儘快實現盈虧平衡,這條腿增長很快,且能看得到未來。前者保證商湯「走得夠快」,后者保證「走得夠遠」。
不難發現,當幾乎所有玩家都在期待AGI時代到來時,正沿着這條全棧佈局的路徑紮實走下去的商湯科技,實際上已經拿到了通向AGI的船票。