劍指AI算力霸主英偉達 Cerebras發佈自研超算訓練的開源大模型

2023-03-29 00:57

財聯社3月29日訊（編輯史正丞）當地時間周二，硅谷AI芯片公司Cerebras Systems發佈7款類似於GPT的大語言模型。除了發佈開源大模型外，展現了一條不用英偉達GPU、不接OpenAI接口也能實現「大模型自由」的道路。

（來源：公司官網）

單純從數據來看，這次Cerebras發佈的7個大模型參數量介於1.11億至130億之間。作為對比，谷歌的多模態視覺語言模型PaLM-E具有5620億個參數；同樣在本月發佈的GPT-4模型雖然尚未公佈確切數據，但有媒體援引內部人士透露，參數量大約是GPT-3（1750億）的6倍。

按照目前人類對AI的認知，模型越大，最終能夠滿足的需求就更加複雜。當然，規模較小的模型也有自己的用武之地，例如可以配置在手機、智能音箱中。同時也有研究顯示，規模較小的模型如果經過多次訓練，準確率反倒能變得更高。

但如同上文所述，Cerebras本身是一家芯片公司，所以訓練模型用的是自家的Andromeda AI超級計算機，其中部署了16套CS-2系統。非常具有記憶點的是，Cerebras生產的AI芯片WSE-2的尺寸約為英偉達A100芯片的56倍，核心數量達到85萬個，同樣是A100芯片的123倍。這塊芯片使用的是臺積電7nm工藝，售價超過200萬美元。

（來源：Cerebras芯片）

所以周二發佈的多款模型，本身也是Cerebras向AI算力霸主英偉達發出的戰書。在OpenAI的ChatGPT點燃全球科創圈子的熱情后，雖然有許多芯片公司試圖撬動英偉達牢牢佔據的市場，但取得實際成果的並不多。許多知名企業，也通過直接用英偉達的全套服務來訓練自家的AI產品，從而快速取得成績。

面向潛在的客户，Cerebras也強調自己的芯片具有訓練時間短、同等預算下準確率高等優點，是目前世界上已經公開的大模型中生產性價比最高的方案。公司CEO Andrew Feldman也確認，使用Cerebras訓練出來的模型，未來也能在英偉達的系統中繼續訓練和定製化。

多少有些嘲諷OpenAI發佈GPT-4后不再開源的做法，Cerebras也在周二宣佈公司訓練出來的7個大模型全部在Apache-2.0許可的條件下向研究社區開放，包括模型本身、訓練算法和權重，以此打造行業開源的標杆。

Cerebras表示，任何人只需要向這些高度精準的預訓練模型一定數量的數據，就能以很少的工作量，開發出功能強大垂直行業應用程序。

劍指AI算力霸主英偉達 Cerebras發佈自研超算訓練的開源大模型

（來源：公司官網）

（來源：Cerebras芯片）

推薦文章

4月財報預告 | Q1財報季來襲！美股銀行股打頭陣，特斯拉、蘋果、Sandisk等明星股緊隨其后！

一周財經日曆 | 事關美聯儲權利交接！「沃什提名確認聽證會」或推迟；臺積電攜手銀行股下周公佈業績

港股周報 | 美伊短暫停火，港股狂歡！長飛光纖年內累漲超330%，兩倍做多海力士周漲超42%；「Token第一股」迅策上市百天市值破千億港元

CoreWeave獲Anthropic數十億美元AI算力協議，股價大漲11%

美股機會日報 | 美伊談判在即！特朗普稱「非常樂觀」，伊朗副外長：各方已達成共識；美國3月CPI或「爆表」！降息空間「極限壓縮」

周內最高狂飆50%！港股半導體板塊集體爆發，哪些標的邏輯「最硬」？

一圖IPO | 「萬元肉籤」頻出！港股Q1打新勝率近9成，思格新能、羣核科技正在火熱認購中

華盛早報 | 以黎擬談判，停火有望？標普、納指七連漲；特朗普警告伊朗勿收霍爾木茲通行費；阿里、宇樹或下周官宣出海合作