繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

專訪智源研究院總工程師林詠華:告別割裂的「煙囪式」創新需要開源統一生態

2025-03-08 10:20

每經記者 可楊    每經編輯 魏官紅    

今年春節期間,林詠華閲讀了馬斯克的自傳,書中寫到獵鷹一號到三號歷經多次失敗,馬斯克帶領團隊在粗陋的環境中進行試驗,直到第四次發射成功,這也勾起了她的回憶。

林詠華是IBM中國研究院的首位女性院長,如今供職於北京智源人工智能研究院,任副院長兼總工程師。早年間,她與團隊在戈壁灘的惡劣環境中和海峽渡輪甲板上的熱浪中進行實驗,最終驗證了系統和技術的可用性,這些經歷至今仍影響着她。

「所有的科研第一要十分注重細節,第二不能在象牙塔里做科研,甚至連仿真環境都未必可以,一定要上‘戰場’。」在接受《每日經濟新聞·賽博NBD》專訪時,林詠華表示。

從探索IT(信息技術)與通信的交叉創新,到提出「AI for AI」,再到如今打造統一開源的技術棧,試圖扭轉產業對單一封閉生態的依賴——打破技術邊界,已經成為林詠華職業生涯的註腳,她是一位技術革新者,致力於改變桎梏行業發展的底層邏輯。

林詠華總是站在技術的前沿。

在IBM的前期,她最初的研究方向是IT和通信領域的跨界創新。在她加入IBM的第8年,人工智能產業升溫,熱潮翻湧,也成為她邁入人工智能產業的契機。

「人機對決」是人工智能技術躍升的關鍵節點之一,人類與機器交鋒的瞬間,人工智能的邊界被重新定義,激發了向前一步的決心。

2011年,IBM的電腦系統Watson(沃森)在美國電視智力競賽節目《Jeopardy!》(即《危險邊緣》)中戰勝了兩位人類冠軍。Watson的成功,促使IBM將公司戰略全面轉向AI(人工智能),這樣的轉變不僅發生在IBM,而是發生在全世界。

2009年,李飛飛團隊提出ImageNet,她認為如果AI要像人類一樣理解世界就需要海量的數據,次年,李飛飛發起了ImageNet大型視覺識別挑戰賽(ILSVRC),「深度學習革命」緩慢拉開帷幕。

IBM的主動轉型與深度學習的熱潮,讓林詠華開始思考,自己的經驗如何才能為人工智能提供新的視角。

「我當時做的是無線通訊和信號處理,通信信號的編解碼運算複雜度並不比深度學習少。」在通信領域,信號的編解碼運算極其複雜,林詠華做過一個計算:每發送一個比特的數據,所需的計算量要高於CNN網絡(卷積神經網絡)。

這意味着,通信技術專家在計算優化方面的某些經驗積累可以遷移到AI領域。當時,通信系統早已大量使用FPGA(現場可編程門陣列)等加速板卡,來協同優化效率並支持雲端部署,這種算法與硬件協同優化的思維方式,同樣適用於AI領域。

「遷移學習的出現和今天的大模型有異曲同工之妙。」林詠華解釋道,遷移學習是指先訓練一個通用的基礎模型(Backbone),然后通過大量其他領域的用戶數據微調學習,使基礎模型能夠適應不同應用場景。例如,先訓練一個計算機視覺模型,再利用醫療數據對其微調,以識別醫療影像中的病變。

遷移學習的出現,讓林詠華開始思考,能否讓AI模型訓練徹底自動化?

林詠華的設想是,發揮團隊在系統領域的優勢,讓用户只需要上傳數據,系統會自動選擇合適的基礎模型(Backbone),並匹配最優的遷移學習算法,啟動訓練。訓練完成后,用户可以直接在雲端部署模型,甚至一鍵自動生成FPGA、GPU(圖形處理器)等不同硬件的核心代碼,實現完全自動化部署。

「這不僅符合IBM的AI戰略轉型方向,也最大化了我們團隊在算法和硬件協同優化方面的積累。」林詠華回憶道,「AI for AI」這一概念,最終成功落地,被IBM實現產品化,並在全球推廣。

AI的落地還是太慢了。

從技術到產品落地,是林詠華從二十年前開始思考的課題。

「無論是以前的無線通信中的信號處理還是今天的AI,每年可能不到1%的文章里的算法有機會真正用到產業界、工業界,如果這兩條線一直割裂,是不會對產業有推動的。」林詠華表示。

2019年底,林詠華離開IBM。「在IBM研究院,我看到很多好的AI技術的產品化需要解決方案團隊等部門的配合才能落地市場,周期很長。」從一項好的技術變成一個好的產品,仍有層層壁壘,她感到這是在「隔靴搔癢」。

離開IBM后,林詠華曾經短暫地投身產業,選擇「AI for 農業」,但是產業界的情況同樣複雜,「我發現,很多AI技術只能解決一部分問題,仍有很多問題需要進一步的研究才能解決」。

在工業環境中,AI面對的是高度標準化的生產流程,可以依靠小模型完成特定任務。但農業不是標準化生產流程,面臨更多複雜場景,在這里,機械臂跟不上人手的速度,AI的決策速度也遠遠高於機械執行速度,導致落地困難。「新的技術往往得是‘有錢’的領域纔敢先用。雖然農業領域很需要AI,但是利潤太低,很多地方不會投入。」她分析道。

「如果我繼續在一個企業里做這方面的研究,對企業來説太奢侈了,因為研究是需要不斷投入。」2021年底,林詠華加入智源,她説,再次進入一個研究機構,是因為看到有很多應該用AI直接解決的問題,AI當時的能力和機械臂等硬件的能力遠遠不夠。

在智源,林詠華和她所帶領的技術團隊一起正面臨一場新的浪潮——DeepSeek所帶來的大模型普及。

「我的媽媽和婆婆已經80多歲了,上周末她們同時在不同的羣里説,有一個很好的軟件叫DeepSeek,她們一直在上面問各種各樣老人家關心的問題。」這讓林詠華覺得這一波熱潮已經完全到來,「DeepSeek深入到老百姓,不再受限於過去只能通過企業或政府採買的形式,這倒逼很多企業儘快上線,所以我認為很重要的一個障礙被推開了。」

另一個尚未被推開的障礙在於成本。

她以DeepSeek為例,如果企業想要部署,可能需要英偉達H100服務器,8張卡還不夠,要2台,成本極其高昂。因此,大模型要想可持續發展,必須解決高昂的算力問題。

這涉及兩個問題:一是上層算法和系統的優化,二是底層硬件的多樣化,只有芯片多樣化,才能拉低硬件的門檻。當前,AI芯片市場幾乎被英偉達的CUDA生態壟斷,全球超過95%的AI訓練和推理任務都基於CUDA開發,而其他芯片廠商往往各自為戰,形成了割裂的「煙囪式」生態。

要打破這種困境,智源尋找到的路徑是開源。例如,DeepSeek推出時,智源就開發並開源了DeepSeek-R1多芯片版本,讓用户只需五行命令,就能在非英偉達的AI芯片服務器上部署DeepSeek-R1全流程。

當前,絕大多數模型的開發仍然圍繞CUDA生態進行,包括DeepSeek,林詠華希望,未來開發者可以在一個開源統一的生態下進行訓練和推理。

這正是智源推動FlagOS的原因,FlagOS是一個面向大模型、支持異構算力的智能計算「操作系統」。

「我們希望上層的用户算法、開發者、模型廠商可以更便捷,不用因為切換芯片公司導致需要替換整個底層架構而擔憂,就如同用户可以基於Linux的操作系統上運行MySQL。」林詠華闡述稱,統一的生態需要通過開源的方式進行共創,如果不開源,每個環節都以商業談判和不同的商業條款來制約,不同的芯片廠商無法參與貢獻,統一的生態就更無從談起了。

在林詠華看來,開源的最大優勢就是共創。一個模型的第一版開源后,全球的開發者可以接力迭代,讓它在極短時間內迅速優化,比如多模態模型LLaVA,短時間內已經衍生出多個版本,每個版本都比前一代更強。「大家像傳遞接力棒一樣,同時資金和人才的投入不需要受制於一個機構自己的經濟實力。」

林詠華始終不喜歡在「象牙塔」里做科研。

在瓊州海峽的海域中央,林詠華曾在輪船甲板上,頂着40攝氏度的高温,跟團隊一起完成新研發的無線通訊技術的驗證。在山西五臺縣零下20多度超低温的環境中,林詠華團隊通過無線通訊的方式,實現了當時移動通信無法覆蓋的測試。

「通訊需要在不同環境里驗證,雖然我們可以在模擬信道的環境中驗證,但實際上很多問題是無法在模擬環境中能夠被發現的。」數次穿梭在酷暑與極寒中,林詠華最終帶領團隊第一次用「標準的IT服務器架構+虛擬化雲計算」支持了2G、3G、4G的無線接入網絡;與中國移動等全球領先的運營商一同,開拓了C-RAN(Cloud RAN),把傳統無線領域的專用設備用軟件定義的方式在雲平臺上運行,如今,C-RAN已經成為5G通信架構的核心。

「科研第一要十分注重細節,第二不能在象牙塔里做科研,一定要上‘戰場’。」這是長期以來林詠華對科研的態度,這個態度同樣影響着她在智源的探索。

林詠華很喜歡自己的總工程師的頭銜,在技術世界里,女性往往是少數派,偏見也可能隨之而來。

臉書(Facebook)的前女性高管謝麗爾·桑德伯格在《向前一步》中提到,有能力的人因自我懷疑而苦惱,這種現象有它的學名——「負擔症候羣」(imposter syndrome)。無論男女都容易出現這樣的症狀,但女性會更嚴重,也會更多地受其限制。

林詠華有同樣的感受,如果同樣坐在一個桌子上,但當不介紹自己的背景,不主動「推銷」自己時,尤其在技術領域,女性很多時候不會是第一個被提問的人。

如何讓別人知道自己能做這件事?只有主動「推銷」自己。這件事無關性別,對誰都不容易,只是女性需要更多的主動推銷,纔有可能贏得更多的機會。

「一定要勇敢一些。」這是林詠華給想要從事人工智能技術的年輕女性提出的第一個建議。

她的第二個建議是,利用好自己的優勢。當女性希望做到更具領導力時,合作是一個很重要的問題,也是一個難題,如果能夠協作更多的團隊,那麼她有機會比男性更有競爭力。

如果要成為一個出色的研究員或者一個出色的技術領導人,「以身作則」是更重要的事。如今,林詠華仍會每周閲讀新鮮出爐的論文、下載最新模型調試試用,來掌握第一手的技術信息。「技術負責人一定要有足夠的觸覺去感受外面的世界,否則我們很容易閉門造車。」

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。