熱門資訊> 正文
2025-08-13 19:25
炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
「前華為麒麟SoC總架構師、寒武紀前CTO梁軍,迴應朋友圈事件。」
整個芯片行業都知道,2022年寒武紀前CTO梁軍的離職事件,也看到他在2025年1月通過朋友圈公開了與寒武紀之間的糾紛。
但鮮有人真正瞭解梁軍到底是一個怎樣的人,及其與前東家之間分歧背后的複雜背景。
以昉擎科技CEO的新身份,梁軍對雷峰網獨家分享了他創業的想法,也首次公開講述了那些他與寒武紀的往事。
他告訴我們,昉擎的整個技術方案跟此前完全不同,其提出了「上下文相關」和「上下文無關」分離的分佈式計算結構,將任務分配給更為適用的硬件架構進行處理,這在全球範圍內尚無相似的路徑。
「這樣的系統是有機會不受現在CUDA這套生態約束的。」梁軍説道。
而關於與寒武紀之間的糾紛,梁軍與寒武紀CEO陳天石的矛盾爆發於2021年12月14日,陳天石在自己辦公室里對梁軍説:
「你的權力比董事長還大!」
「我現在不怕你了。」
三天后,梁軍在公司的IT權限被關閉,此前向他匯報的團隊,都被直接劃歸陳天石麾下。這發生在寒武紀的大算力AI芯片思元590剛剛投片之際。
三個月后,寒武紀發佈公告,稱「公司核心技術人員梁軍因與公司存在分歧,通知公司解除勞動合同」。自此,梁軍正式離職,不再擔任公司任何職務。
讓梁軍真正難以釋懷的,是他離職后在公司內部廣泛流傳的一句話:「寒武紀上市前給員工的股票發得少,是因為都給了梁軍。」
他很氣憤,「員工持股平臺‘艾加溪’里我一分沒拿,陳天石自己拿了約400萬股。」
雙方的矛盾最終在2025年1月公開。1月20日,梁軍在朋友圈發文表示:他被提起訴訟,公司要求他以合計約5.2萬元的價格,轉讓其持有的合計約1152萬股寒武紀公開發行的A股股票,該案件將於1月23日在北京市海淀法院開庭。而梁軍方面也向海淀法院提起勞動爭議訴訟,要求法院裁定其與寒武紀之間的勞動關係,並要求賠償股權激勵損失超42億元人民幣。
這場庭審定於1月23日進行,而前一日(1月22日)正是寒武紀的公司年會。
法院提前三天通知了梁軍開庭(因為最少是提前三天),當時他的律師在外地,留給梁軍及其法律團隊的準備時間極為有限,在這種倉促與被動中,梁軍選擇在朋友圈公開此事。
2024年全年,他已經多次向法院提出請求,要求將案件以公開審理的方式進行。但這一訴求最終未被採納。
這不僅是個人層面的權益之爭,也揭示了創業公司中,早期核心人員在公司治理和股權結構中所面臨的典型問題。(早期創業公司股權糾紛的更多內幕,歡迎添加微信 YONGGANLL6662 互通有無。)
在這場紛爭背后,更不容忽視的是梁軍在中國AI芯片發展歷程中的深度參與與技術貢獻。
回顧梁軍的技術履歷,從華為海思麒麟SoC總架構師,到寒武紀CTO,他見證了國產AI芯片技術的關鍵十年。在寒武紀的五年里,他主導推出了首顆7nm AI訓練芯片——思元290,並主導了思元370、590等高性能芯片的研發,以及思元100、270、290、370的量產。
這次在北京與梁軍的面對面對談,讓外界有機會透過樑軍的視角,瞭解國產AI芯片發展的往事。
帶着過去的經驗和對未來的判斷,梁軍將開啟新事業,要做一家卓爾不羣的科技公司,作為國內最懂AI芯片的人,他又有怎樣的思考和判斷?
以下是我們和梁軍的對話,為便於理解,訪談內容經編輯:
01
回望寒武紀早期:與華為合作,成為估值暴漲的芯片獨角獸
雷峰網:你在2017年加入了寒武紀,當時寒武紀僅成立一年,而你已經是麒麟SoC的首席架構師,是在之前有了解過他們嗎?
梁軍:2014年,我在華為負責手機SoC期間,每年都會抽出專門的時間看論文,那年看到了陳雲霽發表的論文(《DianNao:一種小尺度的高吞吐率機器學習加速器》,其提出了國際首個深度學習處理器框架,該論文第一作者為陳天石),就大概瞭解了他們的研究方向。
當時蘇箐想做貼近AI的技術,但方向不太明確,我就建議他去找陳雲霽聊聊,但聊完沒有后續,因為寒武紀還沒成立。
真正合作是2016年,我負責研發麒麟970,ES(Engineer Sample,工程樣品)版本剛好有空余的芯片面積可以放置AI處理器,就想到了陳雲霽做的IP,於是約了陳雲霽聊,陳雲霽帶着劉道福(寒武紀聯合創始人)來華為北研所講了兩個小時,我聽完基本就明白了他們的邏輯。
后來,我在海思內部匯報了寒武紀的IP,高管同意了這個方案,於是我們就把寒武紀的IP放進麒麟970的工程樣片,當時不算商業行為,更多的是「你情我願」。
雷峰網:所以華為跟寒武紀的合作,其實並不是你加入寒武紀之后才推動的。
梁軍:內外部視角會有一個時間差,麒麟970是2017年秋季發佈的,但芯片的研發和生產是一個長周期的過程,所以研發和生產的時間會比產品發佈的時間早出許多。
麒麟970 ES版本在2016年就從晶圓代工廠回來了,麒麟970 CS(Customer Sample,客户樣品)版本所使用的寒武紀IP在2016年就已經交付給海思。麒麟980所使用的IP版本,在2016年12月我們就已經和陳雲霽談完IP規格,寒武紀同時啟動開發工作。
后來,我從海思離職時,海思基於市場考慮,又臨時補了一個裁剪版本,那個合同我未參與。在2016年,雙方的IP授權協議就已經簽署了。
但是我從海思離職是由於其他原因,和2016年我決定採用寒武紀的IP沒有關係,和寒武紀公司關係也不大,這一點海思高層也完全知曉。
雷峰網:華為跟寒武紀在2019年就解除了合作,合作的時間並不長,這對華為的產品體系有什麼影響?
梁軍:其實在2016年簽訂合同的時候,雙方心里就都有數,寒武紀拿到華為的訂單並非一個長久的事情,這只是在當時的情境下,華為選擇的一個過渡方案。
寒武紀IP的價值,並非設計有斷層式的領先,而是幫助華為在當時快速建立對AI系統的認知閉環。2017年,搭載了寒武紀IP之后,華為的SoC補全了AI功能,所以當時華為整個組織對AI的認知要比國內其他所有公司都提前1-2年。
昇騰體系后來發展很快,當年通過引入寒武紀IP搶出1年時間窗口期很關鍵,華為有整個底層系統以及應用場景,能在實際的產品體驗中不斷獲得反饋,其認知體系會很不一樣,所以選擇寒武紀的IP來卡那個時間節點,沒有錯。
雷峰網:你在2017年正式加入了寒武紀,當時跟公司是怎麼談的?
梁軍:我跟陳天石談Offer的時候,其實兩個人的關注點不太一樣。我關注的重點是把股權寫進薪酬項,他關注的應該是我加入后對寒武紀融資進程的影響。
2017年8月18日,寒武紀宣佈完成1億美元A輪融資,由國投創業領投,阿里巴巴創投、聯想創投等聯合投資。但實際上,根據招股書顯示,這輪融資是在2018年纔開始交割的(也就是梁軍入職之后),阿里的那筆投資是2018年5月份MLU100發佈后,7月份資金才真正到賬。
雷峰網:所以你覺得你是被「預埋」進融資里的?
梁軍:我們雙方談合同的時候,股份是按照寒武紀A輪融資后的股比給我算的,但當時的融資款項其實都還沒有到位,看時間線我入職后交割了一部分投資款,我主導MLU100量產以后,阿里的投資款才交割。
在陳天石本人親筆簽署的入職意向書中,明確約定我入職后將於2017年一次性獲授一筆股權,中科寒武紀在2017年10月18日召開的股東會也對這筆股權授予有決議,這也是我持有的艾溪合夥的份額的來源,所有的事實,發生時間是匹配的。
另一方面,寒武紀當時拿着跟華為合作的合同在市場上進行融資,合同代表着寒武紀已經有真實的收入、產品有實際的使用場景,2017年底到2018年初,寒武紀開始收到版税費,這也讓寒武紀的估值水漲船高,融資歷程順利了許多,因為風險投資機構們之前就沒見過一個能賺錢的初創芯片公司,所以就有很多投資機構搶着投寒武紀。
雷峰網:寒武紀發展其實很快,從成立到上市只用了4年,你加入后主要負責哪些工作?
梁軍:我加入寒武紀之前很多事情都是陳雲霽在負責,我加入后接手了研發工作,並從頭建設了產品等體系。當時寒武紀主要的團隊班子是中科院計算所出來的,團隊的成員學習能力不錯,但比較缺乏商業化的經驗,也沒有交付過面向商業市場的芯片和系統產品。
2017年入職后,我研究了公司之前的設計,早期做的產品其實是一個單核的版本,沒有完整的並行編程模型,研究了一個月之后我就改動了很多設計,重做了SoC和編程模型,往后的芯片開發、量產以及硬件體系都是我在負責,軟件團隊也向我匯報,MLU200系列芯片完成開發以后,我花在軟件團隊管理上的時間越來越多。
雷峰網:你當時有沒有從海思帶人過去?
梁軍:我不願意從海思招人,這個做法不合適,2018年加入寒武紀的一般是已經離開海思的前員工,從時間節點上看,2018年其實是海思的高光期,願意離職加入創業公司的人也比較少。
雷峰網:軟件易用性差是早期寒武紀產品面臨較多的反饋,中間是走過了什麼彎路?
梁軍:一代的軟硬件系統沒有嚴格定義的並行編程模型,所以做並行計算有很多問題。2017年11月,我把整個編程模型在二代產品里做完了,MLU100投片后,軟件團隊的成員也承認MLU100原有的那套軟件確實不太行。我們用軟件實現200系列的編程模型,由於缺乏一些硬件支持,做不到完全一致,所以在外界看來就不那麼兼容。
2020年之前,底層軟件的設計在通用性和性能最優之間更偏向於追求特定場景下的性能最優,犧牲了通用性。而面對市場和銷售的現實局面,獲取單個客户的銷售收入是難以支撐整個研發的投入的,同時訓練產品對底層軟件通用性的要求遠遠高於推理產品。
因此,2020年初趁着疫情出差不方便,業務線壓力暫緩,迎來一段寶貴的空窗期,於是我們就下定決心做了調整。之后在2021年我明確了推理和訓練兩個業務合併軟件版本的要求,團隊努力達成了目標,國內的主要友商在那個時間點做不到這一點。
雷峰網:當時你負責的思元290直接選擇7nm的製程,跳過了12nm這一成熟製程,這樣的選擇是不是冒了一些風險?
梁軍:其實風險不高。按照臺積電的節奏,最新的工藝首先用在手機芯片,然后慢慢提升芯片的良率,后面就可以給更大規模的芯片,包括AI芯片使用。所以2018年臺積電推出了7nm的製程工藝,2020年英偉達的A100就是用7nm工藝生產的,同一個工藝,手機芯片會快兩年。
所以選擇7nm的工藝是提前有技術預判的,能夠知道臺積電的生產不會面臨太大的困難,因為歷史上都是這樣的節奏。
雷峰網:思元590在國內還是廣泛受到認可的,你怎麼看待這代產品?
梁軍:590是2021年投片的,那是我做得比較不錯的一個項目,內部對此都是有預期的,比較超乎我預期的是國內其他廠商到2025年還沒追上當時這個水準。
雷峰網:有人告訴我們,你離開寒武紀之后,很多之前你一句話能決定的事情,現在要對接半個月,你怎麼看待這樣的現象?
梁軍:海思有一段時間的組織方式是各種疑難問題都交給系統工程師去解決, 做出技術方案交給開發團隊執行,講的通俗一點對系統工程師的要求是十項全能選手,在我負責手機SoC技術的那幾年,我的組不只是架構團隊,也包括所有的手機SoC領域的系統工程師。
我有很長一段時間的工作狀態是每天早晨8點半開始工作,前一天晚上發給我匯報狀態,請求給出技術意見的郵件大概在50-100封,我花2個小時讀完所有郵件,理解所有技術細節,給出技術決策,做的慢了這一天就干不了別的事情,習慣了。
雷峰網:有人評價你比較強勢,好處是效率比較高,壞處是會忽略很多人的意見想法,對此你怎麼看?
梁軍:看個人感受吧,我是架構師背景,架構師的職責是設計簡潔的規則,根據簡潔的規則演繹出複雜系統。如果遇到試圖打破基本規則的意見,會更傾向於維護基本的規則,雖然很多時候意見的提出方並不能意識到這一點。但其實也有很多之前的同事,對我做事的方式很理解。
02
當制度滯后於承諾:早期創業公司面臨的股權糾紛及信任危機
雷峰網:當時你在寒武紀負責研發和產品體系,這就意味着陳天石管理的是銷售團隊?
梁軍:對,銷售團隊由陳天石管理,但負責研發和產品就不可避免地需要與銷售團隊打交道,因為產品最終銷售不出去,是誰的責任,這很難界定清楚。寒武紀情況最好的時間就是2021年的下半年,因為我去管理一些銷售的工作,不去管的話很容易被「攻擊」產品沒有做好。從另外一個方面講,產品是有機會窗口的,面對市場競爭,錯過機會窗口的代價很大。
雷峰網:所以參與了銷售團隊的工作,是導致你們矛盾爆發的導火索嗎?
梁軍:原先寒武紀的售前支持和售后支持的團隊就是由我負責,所以我要配合銷售團隊的工作,不可避免地與銷售團隊打交道。
當時也有特殊情況,原來負責推理產品的員工因為個人身體原因做了工作調整,因為一時找不到合適的人選,由我兼任直接管理整個推理產品團隊,因為產品規劃、售前和技術支持各資源團隊原本就向我匯報,當我直接管理推理產品時,原有的緩衝沒有了,放大了矛盾。
可以公開講的是之前就有人推波助瀾。2019年下半年,有員工在知乎上匿名發帖稱:「CEO是董事長,CTO是CEO」,后來頗花了一些精力要求知乎把匿名的帖子刪除了,但是我不能確定陳天石的真實想法。
隨后2020年的時候,寒武紀北京辦公室在致真大廈D座,我的辦公室從11樓搬到13樓,13樓是新辦公室,那個辦公室門口有個攝像頭,一開始我真沒注意,直到有一天我發現有銷售團隊的人進我的辦公室后被訓了,那個攝像頭其實就是專門用來觀察誰進了我的辦公室,攝像頭的安裝是辦公室裝修的時候就安排好了的。攝像頭安裝在公共區域,公司里所有人都能看見。
雷峰網:「攝像頭事件」之后,又發生了什麼,讓你最終走向離職?
梁軍:2021年12月14日,我跟陳天石進行了最后一次對話,他跟我説的第一句話是:「你的權力比董事長還大!」然后又說了一句:「我現在不怕你了。」
三天后,2021年12月17日,我的公司IT權限就被關閉了。他發了「總經理決定」,將原本向我匯報的所有團隊改成向他匯報。
12月17日是周五,我周末就緊急找了律師,12月21日在律師幫助下,我發了一封郵件給陳天石,郵件主要確認兩件事情:一,我是否仍然是寒武紀的副總經理;二,公司是否關閉了我的IT權限。
雷峰網:收到郵件之后,公司有什麼反應?
梁軍:發出這封郵件后的兩天,12月23日,公司安排委託人前往天津,對天津玄算九號(寒武紀的股權平臺)做了變更備案,備案了一個2021年12月23日的合夥人會議決議,決議的第五條是「原合夥協議廢止,通過新的合夥協議」,同時備案了新的合夥協議,新的合夥協議里新增了一條條款——第35條。
到了2023年2月,寒武紀持股委員會發郵件給我,要求我轉讓玄算九號里所持有的股份,由「天津玄思」進行回購,我沒有同意,於是天津玄思就根據之前新增的第35條條款,在2023年5月份起訴我。
2023年11月,在海淀法院組織的庭前談話中,原告的代理律師在庭前談話中表示「梁軍不是寒武紀的員工」。
雷峰網:但有很多證據證明你是寒武紀的員工。
梁軍:對,這麼做的原因在於陳天石本人簽署的我的入職意向書里關於股權的約定,被寫進了薪酬項下,對方試圖否定我與寒武紀之間曾存在勞動關係,進而否定入職意向書的法律效力,再進而否定入職意向書里關於股權的約定。招股書上也有明確的表述我是寒武紀的員工,甚至我還是招股書的簽字人。之后我向法院提供了社保記錄、勞動關係的情況説明等相關材料。
2024年10月,我正式在海淀法院提起起訴,主要有兩條內容:
第一條,請法院確認我與中科寒武紀自2017年10月18日至2022年2月10日期間存在勞動關係。
第二條,請求中科寒武紀賠償超過42億元人民幣的股權激勵損失。
雷峰網:關於股權的糾紛,公司還有其他的案例嗎,結果如何?
梁軍:之前公司請了個非常優秀的運營專家,寒武紀從100人的規模做到了1000人的過程中,她在組織建設和流程規範制定上發揮了很大作用,公司跟其約定的待遇是一半現金、一半股權。上市公司的股票解禁需要三年,也就是説她的股權在2023年7月份就解禁,但5月份的時候她就被公司裁了,並且公司要求以原價回購股權。
后面她以非法裁員申請勞動仲裁,勞動仲裁判她贏了。中科寒武紀公司上訴至海淀法院一審,現在在等待海淀法院審理。
雷峰網:你覺得出現這樣的股權糾紛,后面對公司的影響大嗎?
梁軍:對公司的影響還是比較大的,因為信任基礎瓦解了。創業公司最重要的就是股權激勵,加入早期創業公司的人看重的都是股權,但員工的股權最后變得有點像「理財工具」。
招股書顯示,2019年9月(寒武紀上市前),陳天石向納什均衡轉讓了1.8億元價值的股份(向艾溪合夥以36000元對價轉讓了2.43%的股份)。
而后,其又用這筆資金購入了寒武紀中層以下員工的持股平臺「艾加溪」的股份,當時艾加溪持有的中科寒武紀的股份是17元一股,他用6000多萬元購入了通過艾加溪間接持有的中科寒武紀約400萬股的股份,大概佔艾加溪平臺40%的股權,現在市值20多億元。(注:天津玄算一號及天津玄算二號為員工持股平臺艾加溪的主要股東,其在艾加溪平臺出資比例超90%,而陳天石又是天津玄算一號及天津玄算二號的主要股東。)
這筆股權如果用於招人,大概能招10-20個阿里P9級別的人,那寒武紀就上了一個臺階,招人的效益比股份增值的效益要大得多。
但是最讓我不滿的是,我離開寒武紀之后,內部流傳出一個聲音説:上市前給員工發的股票比較少,是因為員工的股權激勵大部分都給了我,我對這件事情特別氣憤,因為我間接持有的所有中科寒武紀的股份均依據陳天石本人親自簽署的入職意向書獲得,艾加溪平臺我一股都沒持有。
雷峰網:后來你發的朋友圈在整個行業內的影響很大,是這個事情導致的嗎?
梁軍:發朋友圈是2025年1月21日,法院提前三天通知我開庭(因為最少提前三天),當時我的律師還在外地,幾乎沒有給我們留出反應的時間。
1月23日開庭,1月22日是寒武紀的年會。
雷峰網:在朋友圈里面你也提到,你對寒武紀發起訴訟,這是在被起訴股權之后發生的?
梁軍:首先,寒武紀持股委員會2023年年初發郵件稱要回購我持有的公司股份,要求我按出資額將我在艾溪合夥的股份轉讓給新註冊的合夥企業寒武眾志,將我在天津玄算九號的股份轉讓給天津玄思。
所以是用寒武眾志和天津玄思的名義在2023年5月對我發起訴訟,寒武紀這個主體並沒有出面。
后續我要求法院公開審理,但原告向法院遞交了申請,申請中寫明因涉及上市公司中科寒武紀機密,申請閉門審理。對此,我就要求追加中科寒武紀進來作為第三人,但是未獲得法院支持。
在訴訟過程中,原告的代理律師不止一次表示「梁軍不是寒武紀的員工」,因此我於2024年10月在海淀法院發起了訴訟。
雷峰網:距離你發朋友圈已經過去半年,現在官司的進度怎麼樣?
梁軍:還在等待一審判決,更多的細節就不展開講了。
雷峰網:你希望最終雙方能達成什麼結果?
梁軍:既然大家不是一路人,就各走各的路,把賬算清楚就好了。從已經發生的事實看,錢上的糾葛如果要徹底的瞭解,依賴於雙方的認知水平,僅從一方出發難以解決。
發生衝突后,其單方面去修改合夥協議,而我做為中科寒武紀的前副總經理、CTO,要給法院準備正式文件,説明我確實和中科寒武紀曾經存在勞動關係,以及存在勞動關係的時間,這就像是被拖進爛泥地摔跤,過程很不堪。從另一個角度看,在爛泥地上摔跤也是人生經歷,我對人性的認知相比以前深刻很多。
03
基於分佈式計算架構,昉擎科技有機會突破CUDA的生態約束
雷峰網:你深度參與了國產AI芯片行業的發展,覺得行業發生的最大變化是什麼?
梁軍:行業的變化是很明顯的,2022年是一個節點,在這之前CV模型(Computer Vision Model,計算機視覺模型)很碎,而且模型變化特別多,沒有一個占主導地位的模型,對於追趕者要求同時適配如此多的模型,對軟件的要求比較高,2023年之后基本上都統一到Transformer Decoder Only的模式,基礎模型歸一化,整個底層的設計就發生了變化,對整個系統的規模還有通信的要求都上升了,系統設計里通信佔越來越大的比重。
雷峰網:傳統CV到Transformer之后,很多人都在討論NPU和GPGPU的路線要怎麼去選擇,你怎麼看待這個問題?
梁軍:這個問題的本質在於英偉達是先發者,擁有最多的社區開發人員,所以其上層軟件系統非常全面,社區每天還在持續開發新的特性,做各種優化。你只要搭上CUDA這條船,就能夠自動獲得很多特性。如果你在英偉達之外開發一套系統,會面臨比較大的壓力,一方面沒有英偉達有錢,另一方面是生態上有很多風險,無法兼容CUDA會降低客户的使用體驗,在銷售端就會變得困難,所以選擇NPU還是GPGPU,首先是一個商業的考量,其次纔是技術的考量。
雷峰網:現在AI芯片都在推崇更大的算力,怎麼看待這樣的現象?
梁軍:當你要大規模訓練模型的時候,你肯定希望用最短的時間完成模型的訓練,所以你追求整個系統的性能,訓練是偏向於絕對的性能。
但是這並不是市場的全部,因為市場是有多樣性的。具體到推理的話,推理的問題在於支持基礎功能以后,產品要有性價比,我這里講的性價比包括客户導入新的硬件平臺所支付的成本,很多市場擠不進去的原因在於產品性價比不如英偉達。
客户的需求可以簡單分成兩種:一種是業務需要最快的速度上線,這種階段由於英偉達有生態優勢,與其競爭會有較大壓力。另一個是客户的系統和需求已經穩定了,需要的是優化成本,在基礎模型都已經統一成Transformer Decoder Only的背景下,這對中國公司而言是一些機會,你就是投錢投人把整個系統做好,在控制客户切換平臺的成本,控制自己投入的支持成本的約束下來承接訂單。從2025年開始,中國的模型開始在開源社區佔據主導地位,對此也有很大助力。
雷峰網:現在AI芯片都在貼着算法演進,算法變化又非常快,芯片企業在技術架構上怎麼保持前瞻性?
梁軍:本質上看,這套系統是一套並行的系統,所以核心是你在最開始搭建通用的編程以及基礎性的架構(不一定是GPGPU),然后根據算法需求去做一些定製加速,並非從一開始就做非常定製化的系統。英偉達就是這樣,它首先建立了一個通用的GPGPU的架構,包括指令集、核的設計、互聯以及編程模型,以及在此之上的工具鏈,軟件棧。
根據算法需求同步設計最合適的硬件去做加速,同時又謹慎的維護編程的通用性不受影響。英偉達的PTX指令集的演進,一直遵循這個原則,所以算法的變化並不構成架構設計的一個障礙,雖然英偉達Tensor Core的設計,已經演進到相當複雜。
對於一家創業公司而言,如果做完硬件再去跟進軟件,然后發現硬件的通用性不夠,要對底層架構進行修改,那之前的所有在軟件上的投入就變成了負擔,而非正資產,核心是從一開始就特別小心的去做權衡取捨,在維護編程的通用性和專用硬件做性能加速之間的平衡上要謹慎。
雷峰網:那昉擎如何去做這個權衡取捨?
梁軍:採用SIMT(單指令多線程)路線,做類似CUDA的編程模型是一個選擇,但是仍要面對CUDA是英偉達的私有系統的現實約束。2021年下半年RISC-V RVV(RISC-V向量擴展) V1.0版本發佈之后,就多了一個選擇。從客户的角度,採購新的硬件計算平臺,同時也是做軟件投資,採用開源的指令集設計而非私有指令集,對客户而言軟件投資的風險會大幅降低。
從純技術角度看,RISC-V RVV缺乏面向AI計算的一些基礎特性,但整體架構層面的完成度還可以,指令集的定義出發點是面向通用計算,在此基礎上做適當擴展就可以了。
從我們的角度看,兩種路線屬於尺有所長,寸有所短,沒有強烈偏好。任何一種路線做好了都可以滿足市場需求,但是在維護編程的通用性和專用硬件做加速之間做適當的平衡,在此方面的需求是一致的,需要軟硬件團隊對此有正確的認知。NVIDIA PTX指令集的演進是很好的參考,英偉達在這方面是業界最佳水準。
雷峰網:現在基於RISC-V去做AI芯片的公司也很多,各家有什麼差別?
梁軍:現在不同的公司做出來的產品可能差幾個量級,因為RISC-V本身缺乏一些面向AI計算所需要的特性,而AI的整個系統和計算核的設計思路和傳統的CPU核設計思路差別很大,有的公司按照傳統CPU思路做出來的產品就不太適用於AI計算。
專門做AI計算每一個環節其實都需要重新做,你只是用RISC-V的指令集,其他的東西包括指令的擴展和實現都要從頭開始做。
雷峰網:選擇分佈式架構這個路線,能繞過CUDA生態嗎?
梁軍:昉擎採用上下文相關和上下文無關分離的分佈式架構做了設計,從2012年CNN( Convolutional Neural Network 卷積神經網絡)開始到目前為止,上下文相關和上下文無關的概念其實一直存在於算法的演進當中,只是在之前CV時代沒有那麼明顯,Transformer時代讓這個架構更明顯,我們預期Transformer之后仍會維持這樣的算法結構。
我們的認知是上下文相關和上下文無關分離,不僅僅是算法結構,同時也是一種可擴展的計算架構,行業內近期有關於Attention和FFN分離的熱烈討論,我們認為上下文相關(context aware)和上下文無關(context free)分離是更合適,更抽象的表述是,具體到Transformer網絡體現為Attention和FFN分離,昉擎以后也會使用上下文相關與上下文無關相分離這樣的表述。
採用分佈式的計算架構,系統的設計從一維擴展變成了二維擴展,也重構了設備的交互模式。昉擎基於這個原生異構系統的角度去切入市場,是有機會不受CUDA生態約束的。
雷峰網:你提到了重構設備的交互模式,所以昉擎是會切入窄場景但高頻剛需的AI硬件,像可穿戴設備那些場景?
梁軍:AI硬件最大的問題是沿用傳統的SoC思路去做,這會面臨內存容量受限、內存帶寬受限以及性能受限的約束。行業討論説把模型做小,然后放到單個設備里面,這就會犧牲很多模型的能力,這是現有方案面臨的問題。分佈式架構中,上下文相關處理輸入輸出,上下文無關處理模型權重,這樣在兩個維度上各自擴展,可以從兩個維度去定義系統,有機會做出顛覆性的產品。
手機的SoC系統改成分離式架構之后,手機、智能眼鏡、智能耳機、智能手錶等設備都可以作為獨立的輸入輸出處理器接入權重處理器,或者講傳統意義上的SoC處理上下文相關部分,系統里新增一個權重處理器處理上下文無關部分。所以只要你認為模型的能力會越來越強,各種IO處理器,像耳機,眼鏡這部分設備只需要接入權重處理器就可以獨立完成更多的功能,在現有的系統定義里這些設備是手機SoC的附屬設備,在新的系統里這些設備和手機SoC是對等的。我們認為這樣的設計,有機會開拓出新的系統形態,創造出新的市場。
雷峰網:昉擎是第一個做分佈式架構的公司,如果其他企業跟進,市場留給你們的窗口期有多長?
梁軍:其他廠商跟進來做這個事情不可避免,但是分佈式架構需要設計面向延迟優化設計的系統,而傳統GPU的設計思路是面向吞吐做優化,所以整個設計的思路和實現方式完全不一樣,昉擎有比較充足的時間窗口期。
其他公司如果跟進,那它們之前的積累就變成了負擔,而非資產。此外,這個領域的技術此前較少受到關注,我們也在積極申請知識產權保護。
從技術演進的角度看,分佈式架構只是第一步,在引入分佈式架構以后,可以更清楚的認知到計算範式的轉移,從以處理器為中心的計算系統設計轉移到以Memory為中心的計算系統設計,在AI模型大行其道的當下,計算範式的轉移是事實,但是還未被廣泛的認知,這也是近年來存內計算和近存計算等概念行業內聲音很大的真正原因,只是當下的討論很大程度上是從硬件視角出發的認知,從計算範式轉移的角度會有全新的解釋。
無論KV Cache, 還是權重,在很大程度上都可以定義為Memory,有一些計算的屬性,但是更多的表現爲Memory,只不過不是傳統意義上的輸入地址,讀寫數據的Memory,而是有新增的計算以及通信的屬性。
我們的看法,沿着這個路線走下去,有機會定義出新型的Memory器件。做這種前沿的技術開發以及產品定義,也是昉擎做為創業公司存在的價值所在。
所以有其他廠商跟進,對昉擎而言不算壞事情,説明我們的技術路線得到行業內其他公司的認同。我們也有自信,因為我們起步早,也希望我們的技術路線得到其他廠商的認同。
雷峰網:那在產品體系上,昉擎是怎樣去做規劃的?
梁軍:昉擎的第一代產品是給市場驗證分佈式系統,所以主要目的是做出一款具備超出市場預期的性能及可用性的產品,讓市場瞭解到這是一條可行的路。
隨后就要開始做下一代產品,昉擎面臨的核心問題是在技術平臺準備完畢后,找到一個最方便切入且效果最好的領域。
雷峰網:那現在找到這個產品領域了嗎?
梁軍:有具體方向,但目前不方便公開。
雷峰網:從華為到寒武紀,你有豐富的團隊管理經驗,現在怎麼去搭建昉擎的團隊?
梁軍:昉擎的團隊建設非常精干,我們的目標是做技術領先的公司,團隊人少是優勢,因為更多的時間可以用於思考技術本身,而非管理,從實際執行的過程看,當前我維持這一判斷。
雷峰網:那之前的這兩段經歷,對你創業有什麼幫助?
梁軍:我是2000年加入華為,一直到2012年都在做網絡芯片的架構設計,之后負責手機SoC的技術方案。我把架構師這個角色分為幾個檔次:
第一檔,是有能力合理設計簡潔的規則,並能夠根據簡潔的規則演繹出複雜的系統;
第二檔,是在開發以及系統演進的過程中,有能力維護基礎的規則不被違背,並根據系統演進需要定義規則的演進;
第三檔,是可以認知到好的架構設計,對比在開發團隊能力以及進度要求等約束下可以執行好的架構設計,二者之間的區別,是能夠有意識地做出合理的取捨。
我在做網絡芯片時是在第二個檔次上做事,十年前我負責手機SoC技術時,是在第三個檔次上做事,我對架構師這個角色的認知是頂級水準,在華為的過往經歷對此幫助極大。
從產品方面,我負責手機SoC的技術以后,一直在競爭最激烈的市場上,和全球最頂級的公司做競爭,這段經歷使得我對產品的認知提升到了一個新的層面。
在海思的最后幾年,我有很多精力投入在技術管理工作。行業內很多人講芯片產品體系是「預研一代、開發一代、量產一代」,這個説法最早其實是我在2015年年初在海思內部提出來的。當時麒麟950剛完成投片,我在內部提出以此為標誌,組織進入了一個新的階段,開始有固定的一年一代的產品節奏,爲了適應這個變化,我明確指出用「預研一代、開發一代、量產一代」做為方法論來管理各個技術領域,每個領域每年依據產品節奏都要分別審視三個維度的工作。
由於這個説法簡單又好理解,后來就被各個領域的團隊做為工作的指導原則。也是因為負責手機SoC這種複雜系統的技術工作,纔有機會對技術管理怎麼做有深刻認知。
到了寒武紀之后,我是寒武紀的77號員工,經歷了公司從100人擴張到1000人的階段,建立了各個技術平臺,研發和產品體系,「親自賣貨」的經歷使得我對整個商業閉環的認知,對公司運營的認知,相比之前有很大的提升。過去數年的經歷,我對人性的認知相比之前深刻很多。有意思的是這麼折騰一圈,我對技術和產品的認知,相比之前又上了一個大臺階,所以現在做創業公司,自我感覺處在歷史上最好的狀態。