繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

吳恩達年終總結:2025是AI工業時代的黎明

2025-12-30 14:56

(來源:機器之心)

編輯|冷貓、+0

2025 年已經走到了尾聲。

關注 AI 圈的讀者們都知道,今年是各路 AI 巨頭神仙打架的一年,是人才大戰架構重組極其頻繁的一年,是大模型軍備競賽出奇白熱化的一年,也是 AI 基礎設施建設如火如荼的一年……

在這精彩絕倫的一年的結尾,我們的老朋友:斯坦福大學計算機科學客座教授,前百度 AI 負責人,前谷歌大腦負責人吳恩達老師,發表了今年的保留節目:一封信,和一篇 2025 的人工智能領域年度總結。

年末寄語:三把金鑰匙

元旦假期將至,學生們美妙的寒假以及春節假期也近在眼前。「永遠不要停止學習」是假期前的老生常談,尤其是希望在蓬勃進化的,高度競爭的人工智能領域內謀求發展機會的人。應當做什麼,怎麼做,吳恩達在今年的信中給出了他的見地。

以下是公開信全文:

親愛的朋友們:

又一年,AI 以驚人的速度向前推進,為所有人 —— 包括剛進入這個領域的新手 —— 創造了前所未有的軟件開發機會。事實上,許多公司現在最大的困擾之一,就是找不到足夠多真正懂 AI 的工程師。

每年冬季假期,我都會留出一段時間來學習和動手構建項目,希望你們也能如此。這不僅能幫助我打磨已有技能、掌握新知識,也能實實在在地推動你的技術職業發展。

要真正具備構建 AI 系統的能力,我建議你做到三點:

  • 系統地學習 AI 課程

  • 持續動手構建 AI 系統

  • (可選)閲讀研究論文

下面我解釋為什麼這三點都如此重要。

我常聽到一些開發者建議別人:「別學了,直接上手做就行。」這是非常糟糕的建議!除非你已經身處一個經驗豐富的 AI 開發者社羣中,否則在沒有理解 AI 基礎的情況下貿然動手,很容易導致你重複發明輪子,或者更糟糕的是,把輪子重新發明得一團糟。

舉個例子,在面試中,我見過不少候選人:自己重新發明了一套標準的 RAG 文檔切分策略;重複實現了已經成熟的 Agentic AI 評估方法;寫出了結構混亂、難以維護的 LLM 上下文管理代碼。如果他們提前上過幾門相關課程,就會更清楚哪些「積木」已經存在於行業中。他們當然仍然可以選擇從零實現這些模塊,甚至發明出比現有方案更好的方法,但至少能避免浪費數周時間走彎路。

因此,結構化學習至關重要。

而且説實話,我個人覺得上課非常有趣。與其看 Netflix,我更願意隨時打開一門優秀 AI 講師的課程來學習。

同時,僅僅上課是不夠的。有許多重要的經驗,只有通過親手實踐才能真正學到。學習飛機是如何運作的理論,對於成為一名飛行員當然非常重要,但從來沒有人只靠上課就學會開飛機。在某個時刻,真正坐進駕駛艙是不可或缺的!好消息是:隨着高度智能化(highly agentic)的編程助手出現,動手構建的門檻已經比以往任何時候都低。而當你開始學習 AI 的各種構建模塊時,它們常常會激發你對「還能做些什麼」的新想法。如果我一時找不到項目靈感,我通常會去上幾門課,或者讀一些研究論文。這樣堅持一段時間后,我總會冒出一大堆新的項目想法。而且,説實話,我覺得「做東西」本身真的很有趣,也希望你能體會到這種樂趣!

最后,並不是每個人都必須這樣做,但我發現如今就業市場上最強的一批候選人,幾乎都會偶爾閲讀研究論文。雖然在我看來,論文比課程難啃得多,但它們包含了大量尚未被翻譯成更易理解形式的前沿知識。我會把讀論文的優先級排在課程和實踐之后,但如果你有機會提升閲讀論文的能力,我仍然強烈建議你這樣做。(你也可以看看我以前講過的一段關於如何讀論文的視頻。)上課和動手構建對我來説很有趣,讀論文則更像是一種「磨練」,但從論文中偶爾閃現的洞見,真的令人愉悦。

祝你度過一個美好的寒假,新年快樂。除了學習和創造,也希望你能多花時間陪伴親人 —— 那同樣非常重要!

Love,

Andrew

年終總結:AI工業時代的黎明

2025年着實是精彩絕倫的一年。

作為每年的保留節目,吳恩達的年終總結都能帶我們回顧全年最重要的人工智能事件和發展趨勢。

2022年,是AI 的璀璨之年,生成文本、圖像、視頻、音樂和代碼的系統即將到來,引發了關於創造力的未來問題的討論。

2023年,是創新與焦慮的一年,生成式 AI 浪潮席捲了各行各業,其不斷擴大的能力引發了智能機器可能會使人類過時的擔憂。

2024年,是暴風雪般進步的一年,人工智能取得了突破性進展。智能代理系統提升了推理、使用工具和控制桌面應用程序的能力。小型模型迅速普及,其中許多比其前輩更強大且價格更低廉。

2025年,或將被銘記為 AI 工業時代的黎讓我們跟隨吳恩達的視角,探索2025年最具代表性的AI大事。

  • 文章鏈接:https://www.deeplearning.ai/the-batch/issue-333/

思考型模型解決更大的問題

去年年末,OpenAI 推出了首個推理模型 o1,將一種具備代理能力的推理工作流內嵌其中。今年 1 月,DeepSeek-R1 向世界展示瞭如何構建這種能力。結果是:數學與編程性能立刻提升,問題回答更準確,機器人能力更強,AI 智能體取得快速進展。

在 2025 年初,模型只有在被明確提示時纔會執行推理策略。如今,大多數新的大語言模型都會默認這樣做,從而在廣泛任務上顯著提升了性能。

  • 最早的一批推理模型通過 RL 訓練,專門用於正確求解數學問題、準確回答科學問題,生成能通過單元測試的代碼。例如,o1-preview 在 AIME 2024 上比其非推理前身 GPT-4o 高出 43 個百分點,在 GPQA Diamond上高出 22 個百分點;在 Codeforces 編程題中,其表現位於人類競技選手的 第 62 百分位,而 GPT-4o 僅為 第 11 百分位。

  • 當推理模型學會使用諸如計算器、搜索引擎或 bash 終端等工具時,表現會進一步提升。例如,在一項涵蓋 100 個領域、考察多模態理解與技術專長的高難度測試中,帶工具的 OpenAI o4-mini 達到 17.7% 的準確率,比不使用工具時高出 3 個多百分點。

  • 機器人動作模型也通過 RL 學會推理。例如,通過獎勵 ThinkAct 達成目標位置,使其在機器人任務上的表現相較於不具備思考能力的模型(如 OpenVLA)提升了約 8%。

  • 推理模型還幫助智能體應對複雜問題。例如,AlphaEvolve 使用 Google Gemini 反覆生成、評估並修改代碼,最終為現實世界問題產出了更快的算法。其中一個成果是,它提出了一個用於解釋微生物耐藥性的長期未解問題的假説;人類科學家幾乎在同一時間獨立提出並驗證了相同假説。

推理能力顯著提升了 LLM 的性能,但更優輸出也伴隨着成本。Gemini 3 Flash 在開啟推理時運行 Artificial Analysis 的 Intelligence Index 基準共消耗 1.6 億 tokens(得分 71),而關閉推理僅消耗 740 萬 tokens(得分明顯更低,為 55)。此外,生成推理 tokens 會延迟輸出,這也給 LLM 推理服務商帶來了更大的性能壓力。不過,研究人員正在努力提高效率。Claude Opus 4.5 與 GPT-5.1 在高推理設置下取得了相同的 Intelligence Index 分數,但前者消耗 4800 萬 tokens,后者則消耗 8100 萬 tokens。

鉅額薪酬吸引頂尖 AI 人才

領先的 AI 公司展開了一場激烈的人才爭奪戰,用堪比職業體育明星級別的薪酬,從競爭對手那里挖走頂尖人才。

7 月,Meta 發起大規模招聘,為新成立的 Meta Superintelligence Labs 組建團隊,向來自 OpenAI、Google、Anthropic 等頂級 AI 公司的研究人員開出高達數億美元的待遇。作為迴應,Meta 的競爭對手反過來從 Meta 及彼此之間挖走關鍵員工,使 AI 人才的市場價值被推至前所未有的高度。

據《華爾街日報》報道,在成功招募 Alexandr Wang 及其核心團隊成員之后,Meta 首席執行官 Mark Zuckerberg 列出了一份「心願清單」。

  • 爲了説服人們跳槽,Zuckerberg 甚至親自登門拜訪,有時還會帶上自制的湯。這項努力成功招募了包括 OpenAI 的 Jason Wei 和 Hyung Won Chung 在內的人才,兩人均為推理模型的核心研究者。

  • 《華爾街日報》稱,曾與 OpenAI 前 CTO Mira Murati 共同創立 Thinking Machines Lab 的 Andrew Tulloch,最初拒絕了 Meta 提出的方案,其中包括價值 15 億美元 的獎金。幾個月后,他改變主意,加入了 Meta。

  • Meta 還聘請了曾主管 Apple AI 模型的 Ruoming Pang。據彭博社報道,其薪酬方案在數年內累計高達數億美元。Meta 的報價超過了 Apple 除 CEO 之外最高層管理者的薪酬,而 Apple 選擇不予匹配。

  • 在這場人員流動中,Microsoft AI CEO Mustafa Suleyman 從 Google 帶走了 20 多名研究人員和工程師,其中包括工程副總裁 Amar Subramanya。

  • Elon Musk 的 xAI 從 Meta 挖走了十多名 AI 研究人員和工程師。Musk 抨擊競爭對手的報價「瘋狂」,並強調自己公司「極端以能力為導向」的文化,以及股權更具增長潛力。

隨着 2026 年的到來,AI 招聘格局已發生巨大變化。據《華爾街日報》報道,爲了抵禦獵頭挖角,OpenAI 提供了比競爭對手更高比例的股票型薪酬,加快了新員工期權的歸屬進度,併發放高達 150 萬美元 的留任獎金。

儘管 2025 年出現了關於 AI 泡沫的討論,但對於計劃投入數百億美元建設 AI 數據中心的公司來説,高薪是完全理性的選擇:如果你願意在硬件上花這麼多錢,為什麼不拿出其中一小部分用於支付人才薪酬呢?

數據中心建設狂潮席捲全球

頭部 AI 公司紛紛宣佈了龐大的建設計劃,預計在未來幾年內將豪擲數萬億美元,並消耗數吉瓦(GW)的電力。

僅今年一年,AI 行業的資本支出就突破了 3000 億美元,其中大部分用於建設處理 AI 任務的新數據中心。這還僅僅是「前菜」,各大公司正在規劃堪稱宏偉的藍圖——建設規模堪比小鎮、能耗相當於中型城市的設施。據麥肯錫預測,爲了建設足夠的算力以滿足預期的推理和訓練需求,這場競賽的成本到 2030 年可能高達 5.2 萬億美元

  • OpenAI: 1 月,OpenAI 啟動了與甲骨文(Oracle)、軟銀(SoftBank)及阿聯酋投資公司 MGX 合作的 5000 億美元「星際之門」(Stargate)項目。公司最終宣佈計劃在全球建設 20 吉瓦的數據中心產能,並預測需求量將是該數字的 5 倍。OpenAI CEO 薩姆·奧特曼表示,希望最終能實現每周增加 1 吉瓦的產能。

  • Meta: 2025 年在基礎設施項目上投入約 720 億美元,高管表示該數字在 2026 年還將大幅上升。其 Hyperion 項目包括在路易斯安那州農村地區建設一個價值 270 億美元、容量為 5 吉瓦的數據中心。

  • : 2025 年全球數據中心項目支出達 800 億美元,其中包括位於威斯康星州和亞特蘭大的設施,它們將通過專用光纖網絡連接,作為一個巨大的超級計算機運行。公司還承諾將其在歐洲的雲和 AI 產能擴展至 200 個數據中心。

  • 亞馬遜: 預計 2025 年基礎設施支出將達 1250 億美元,2026 年還將投入更多。其耗資 110 億美元的「雷尼爾計劃」(Project Rainier)是位於印第安納州的一個 2.2 吉瓦數據中心,將運行 50 萬塊 Amazon Trainium 2 芯片。此外,亞馬遜計劃在 2025 年至 2029 年間斥資約 140 億美元擴建澳大利亞的數據中心,並在德國投資約 210 億美元。

  • Alphabet(谷歌母公司): 預計 2025 年基礎設施支出高達 930 億美元,高於此前預測的 750 億美元。公司宣佈了一項 400 億美元的計劃,到 2027 年在得克薩斯州增加 3 個數據中心。此外,還承諾在印度投入 150 億美元,在德國宣佈了約 60 億美元的投資,並在澳大利亞、馬來西亞和烏拉圭推出了新建或擴建項目。

儘管存在對 AI 泡沫的擔憂,但基礎設施建設熱潮正在為原本不温不火的經濟帶來實實在在的增長。哈佛大學經濟學家 Jason Furman 指出,2025 年上半年美國GDP的增長几乎全部來自數據中心和 AI 領域的投資。在此階段,有證據支持這樣一種觀點:2025 年拉開了新工業時代的序幕。

智能體讓代碼編寫更高效

編程已成為智能體工作流中具有最直接商業價值的應用場景。Claude Code、Google Gemini CLI、OpenAI Codex 以及其他應用,將「編程智能體」變成了 AI 巨頭之間競爭最激烈的戰場之一。爲了留在牌桌上,規模較小的競爭對手也紛紛開發了自己的智能體模型。

當 2024 年首個開創性的智能體代碼生成器 Devin 問世時,它將 SWE-Bench 編程挑戰基準測試的最高水平(SOTA)從 1.96% 提升到了 13.86%。到了 2025 年,使用最新大語言模型的編程智能體已能常態化地完成超過 80% 的同類任務。

  • 2024 年底,推理模型的出現立即提升了編程能力並降低了成本,因為推理能力使智能體能夠規劃任務,並將具體執行交給成本更低的模型去完成。到 2025 年底,Gemini 3 Pro、Claude Opus 4.5 和 GPT-5.2 已成為編程和智能體工作流領域的頂尖模型。

  • Z.ai 的 GLM-4.5 和月之暗面的 Kimi K2 成為開放權重模型中的熱門選擇,使自動編程類初創公司得以大幅削減成本。7 月發佈的 Qwen3-Coder 提供了一個龐大的 4800 億參數模型,該模型在超過 5 萬億 Token 的代碼數據上進行了訓練,性能幾近匹敵 Claude Sonnet 4。

  • Anthropic 圍繞 Claude 構建了一套智能體框架,打造出了 Claude Code 應用。該應用在 2 月一經推出便大受歡迎,確立了智能體編程系統應有的標準。OpenAI 隨即做出迴應,推出了基於其 GPT-5 系列編程專用版構建的 Codex 應用。

  • 模型製造商與集成開發環境(IDE)開發者之間展開了一場拉鋸戰。這導致 Anysphere (Cursor) 和 Cognition AI (Windsurf) 等熱門 IDE 提供商開始構建自己的模型。反之,Google 也構建了自己的 IDE——Antigravity,並於 11 月首次亮相。

智能體系統不斷推高 SWE-Bench 這一熱門編程基準測試的上限,促使研究人員尋找替代的方式來評估其性能。這些努力催生了 SWE-Bench Verified、SWE-Bench Pro、LiveBench、Terminal-Bench、𝜏-Bench 和 CodeClash 等新基準。

2025 年初,大多數觀察家還認為智能體僅擅長生成常規代碼、文檔和單元測試,而在處理更高階的戰略性問題上,資深人類工程師和產品經理的表現依然更勝一籌。但到了年底,許多公司報告稱已開始自動化資深級別的任務。Microsoft、Google、Amazon 和 Anthropic 均表示,他們自身來越多的代碼正由 AI 生成。

更多細節,請參閱年度總結原文。

結語:去親手構建未來

回望 2025,我們似乎見證了一場關於「規模」的遊戲。

在這一年,AI 終於脱離了單純的算法競賽,演變成一場涉及人才、算力、基建和能源的工業革命。從超大規模數據中心到能耗巨大的算力集羣,科技巨頭們正以前所未有的資源投入,加速實現通往 AGI 的技術跨越。

這種宏大的敍事往往讓人感到渺小,甚至焦慮。當 AI 的進化速度以「天」為單位,當頂尖人才的薪酬變成天文數字,普通開發者和從業者的位置在哪里?吳恩達給出了答案。

雖然 2025 是 AI 變得最「重」的一年,但它也是 AI 開發變得最「輕」的一年。推理模型的成熟和編程智能體的進化,極大地拉低了創造的門檻。正如吳恩達所言,現在是軟件開發前所未有的黃金時代。巨頭們負責鋪設電網和鐵路(基礎設施),而每一位開發者、學生、研究者,則擁有了在這些軌道上建造飛船的權利。

最好的預測未來的方式,就是去親手構建它。

祝你在即將到來的 2026 年,保持好奇,永遠不要停止學習。

新年快樂!

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。