繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

金鍾:OpenAI大內鬥,對中國AI大模型發展有哪些啟示?

2023-11-24 07:17

  【文/觀察者網專欄作者 金鍾】

  相信大家這幾天已經吃飽了關於美國科技新星企業OpenAI內部人事鬥爭的大瓜了。短短几天內,公司創始人阿爾特曼被董事會開除,跳槽入職微軟,最后再勝利歸來,驅逐了其他董事會成員。劇情一波三折,演員表現自然,臺詞真情投入,好萊塢大片也不過如此。

  11月23日又有爆料稱,阿爾特曼被解僱之前,幾名研究人員向公司董事會發出了一封信,警告一項被稱為「Q*」的人工智能可能威脅到人類。這封信件也是促使董事會罷免Altman的原因之一。對此,阿爾特曼和OpenAI公司還沒有迴應,相信未來我們還會看到更多的幕后故事。

  拋開八卦不提,OpenAI內部激烈的權力鬥爭背后是今年以來狂熱的AI市場迅猛發展,各方都已經認準了這個利益廣闊的投資風口,才導致對行業當前的領頭羊企業的控制權進行如此激烈的爭奪。

  在OpenAI的人事鬥爭背景下,AI淘金熱潮中最關鍵的「賣鏟子」的芯片企業英偉達發佈第三季度財報,在AI芯片和遊戲芯片需求高漲的推動下,英偉達三季度收入達到去年同期的3倍。但是美國政府最新的芯片禁運命令,將導致相當一部分以前可以出售給中國的芯片將無法繼續賣給國內企業。

  美國政府從去年開始對國內的芯片禁運已經升級過好幾輪了,雖然每一次英偉達等歐美芯片企業都會研發出一些針對中國需求的特供版芯片,以此繞過禁運措施,但是這些特供版芯片和歐美科技企業拿到的AI芯片,在性能上有着相當大的差距。直觀的説,AI芯片的性能關係到運行大語言模型時候的計算能力,算力的差距直接帶來的就是運算時間和運算所需要的能源消耗之間的差距。這也是美國芯片禁運的主要目的,阻礙國內企業訓練、發展自己AI大語言模型的速度。

  那麼美國禁運AI芯片,對AI大語言模型在國內的應用到底影響有多大呢?

  根據當前已知的AI大語言模型應用情況,我們可以粗略地將大語言模型的應用分成兩類,一類是「to B」即企業應用場景,另一類則是「to C」即通用消費者應用場景。

  目前大語言模型在企業應用場景中最有前途的用途是什麼?我們還是可以從今天最受追捧的「賣AI鏟子」的企業英偉達身上找答案。

  在10月底到11月初美國電子電氣工程師學會(Institute of Electrical and Electronics Engineers,IEEE)的一個國際會議上,英偉達首席科技官在主題演講中詳細描述了英偉達是如何開發一個公司內部專用的大語言模型。

  英偉達自用的大語言模型,數據來源於自身過去30年積累的代碼、程序文檔、芯片設計文檔、測試結果、糾錯報告以及內部技術討論的通訊記錄等等,而發展自用AI模型,則是希望通過訓練大語言模型達到三個目的:

  第一是建立一個面對年輕工程師的內部機器人,通過理解年輕工程師的提問並從過去的資料數據中尋找答案,讓年輕工程師可以從內部機器人這里獲得大部分技術問題的正確解答,減輕有經驗的資深工程師答疑的負擔,從而讓那些經驗豐富的工程師可以更多的將工作時間集中在開發新產品這些更有創造性的工作上。

  第二個目的則是簡化芯片設計流程,減少在芯片設計和測試時編寫複雜代碼的需要。

  第三個目的則是簡化在芯片測試過程中的報錯和糾錯分析報告,讓以往長達幾十頁的複雜報錯報告簡化成幾個自然段,並針對技術人員和管理人員提供不同的測試報告總結。

  英偉達的AI芯片目前是各家AI模型研發不可或缺的基建產品,這家公司對於如何應用大語言模型來提高企業生產力的決策和選擇,對於其他企業思考如何在內部工作中應用大語言模型有着很大的啟示意義。

  簡單總結一下,我們可以發現當前水平下,大語言模型對於提高那些知識密集型行業或者企業的生產力,效果是最好的。這個提高生產力的關鍵點就是幫助知識型企業內部更有效率地分配最重要的資源率,而這個最重要的資源就是知識企業中核心技術人員的工作時間,讓這些核心技術精英們可以花費更多的時間在設計新產品架構和攻克新技術難關這些最有價值的工作上,那些耗時過長並且回報較小的工作則交給AI來完成。

  英偉達不是唯一發現類似的AI「to B」應用場景的企業,不少其他美國大科技企業也都發現,目前AI大語言模型最有效果的應用,就是幫助開發者減輕處理繁雜瑣碎工作的難度和節省這些時間。比如説在開發一個新的軟件功能模塊時,通過公司自用的大語言模型,從過去浩如煙海的技術文檔中尋找、總結相關的代碼説明和需求分析,這樣可以更快更準確地將新軟件開發需求確定下來,效果好的時候可以縮短三分之一的項目開發時間。

  當然,知識密集型企業不僅限於IT科技公司,法律、金融、生物醫藥甚至現在許多高端製造企業都可以歸入其中,而大語言模型對於英偉達提高生產效率的作用,恐怕也可以同樣作用於這些行業的企業身上。

  而對於這些行業來説,他們在應用AI時很有一些共性。

  比如説企業訓練AI模型的數據往往來自於企業內部,而且格式和語言類型相對標準固定。律師事務所日常面對的法律條款和法律文書,金融企業面對的各種財務報表,IT企業面對的程序代碼和技術文檔等等,這些數據往往有着相當標準的格式和大量反覆使用、定義明確的專業名詞。因此,單個企業自身的業務數據庫從數據量到語言複雜程度上,都遠遠小於整個互聯網上幾十億網民創造出來的繁雜內容。

  另一個應用特點則是企業內部用户向AI模型提問的問題類型也相對嚴肅集中,基本侷限在技術和業務方面的疑問,不像廣大網民對網上已經公佈的通用型AI大語言模型五花八門的提問,天南海北無所不包,甚至有人專門選擇偏僻晦澀的知識點和邏輯複雜的問題來找樂子。

  以上應用場景的差別也帶來了一個「to B」和「to C」之間的重要區別:訓練數據庫之間的量級差距。面向通用場景下的ChatGPT 4大語言模型共有1750億個參數,訓練數據庫據說有13萬億個離散文本單元(token)。而英偉達的內部大語言模型公司訓練數據則只包含了240億個token,規模只有ChatGPT 4的0.2%左右。

  據說國內目前幾個公開測試的大語言模型,訓練數據庫規模也大多在萬億token以上,已經遠遠超越英偉達這樣的業界龍頭企業的需求了。而除了幾個互聯網平臺企業之外,國內大部分企業自身產品研發過程積累的數據量,恐怕沒有英偉達這麼多。

  數據規模和複雜程度在很大程度上決定了訓練模型所需算力的多少,而算力需求又很大程度上決定了對於硬件設備尤其是芯片性能的需求。所以,企業內部自用的AI模型所需的算力和芯片性能,也遠遠不如類似ChatGPT 4這樣的通用型模型那麼誇張。

  國內的AI芯片雖然因遭到禁運而落后於歐美先進水平,導致在運算成本和時間上都比國外訓練AI模型花費更高,但是國內企業已經進口的現有AI芯片,包括國內自主設計、製造的AI芯片,已經足以完成這些針對企業內部提高生產效率的專門AI大語言模型的訓練和應用。用一個比喻來描述這個現象,遊戲玩家們必須要買最新的4090顯卡來流暢運行最新的3A大作,因為老顯卡往往帶不動這些遊戲。但如果只是玩一些如仙劍奇俠傳1這樣的老遊戲,顯卡對於遊戲運行流暢度的影響就不那麼重要了,玩家們也沒必要一定要去血拼4090。

  從英偉達這樣的龍頭科技企業的投入方向來看,目前AI模型對於生產力刺激最明顯最有效的應用方向,依舊是應用在企業內部的這些場景項目。而這些方向也恰恰是用國內算力完全可以實現,受到國外芯片禁運影響最小的應用場景。

  當然,這並不是説國內和國外在企業內部AI應用上就沒有差距了,從大語言模型軟件的開發和調試,以及企業內部數據、知識的整理和將AI模型應用與實際科研結合這些問題上,國內知識密集型企業大多還是落后一些距離,但是相比「to C」的通用消費者應用上,這個方向受到的硬件制約最少,追上國際先進水平的阻力最小,而產生的潛在經濟回報卻最大。

  與「to B」領域的相對樂觀前景不同,由於起步晚、財力有限,再加上芯片禁運的影響,國內在大語言模型「to C」的通用性應用上差距更大,短期追趕難度也更高。當OpenAI在剛剛結束的開發者大會上提出要搞應用商店平臺,類似十幾年前移動互聯網剛開始發展時候的蘋果應用商城,在形成產業生態和搶佔商業應用市場方面佔了先河。國內的通用型大語言模型在技術上還落后OpenAI一至兩代,加上硬件受限嚴重,短期內雖然可以搶佔國內市場,但是依然無力在國際市場上與國外的廠商進行競爭。

  在「to C」領域,目前最現實的策略依然是儘量緊緊跟隨,從國外探索驗證過的通用領域里面選擇商業最成熟的模式再進行投入,這樣可以最好發揮有限資本的使用效果。

  面對現實,在繼續推動國內自身半導體軟硬件和設備研發國產化的同時,在知識密集型企業中推動利用專門的AI模型來提高研發效率,是符合中國經濟挑戰的最有效應對策略。一方面中國產業升級和向高端產品攻關的重任恰好落在這些知識密集型企業身上,如果AI模型的應用可以提升企業研發和生產效率,這就有助於國內加速突破外部封鎖,完成產業升級的主要戰略目標。另一方面,這些企業開發適合自身的AI模型,本身也會為國內半導體軟硬件廠商提供寶貴的需求和產品驗證的機會,這和美國各個科技大廠向英偉達下單,為英偉達的產品持續升級換代提供了大量資金是一個道理。

  因此,目前在AI產業化的進程上,中國還處在追趕世界先進水平的地位上。面對外部封堵持續升級的現狀,最現實有效的從AI發展中獲益的方式,恐怕就是加快推動研發AI模型在企業層面的應用落地,切實利用AI促進實體經濟的生產力進步,為AI大語言模型的應用從PPT上落地到實際生產研發過程中尋找突破口,這反過來也可以支持AI領域更快更好的發展。

責任編輯:尉旖涵

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。