熱門資訊> 正文

AlphaEvolve交出一周年炸裂成績單，AI自我改進不再科幻

2026-05-08 20:29

AlphaEvolve轉眼已經發布一年。

就在剛剛，谷歌低調地放出了一份炸裂的年度成績單。

好家伙，AlphaEvolve這一年間居然干了這麼多事——

幫陶哲軒解數學難題，給量子芯片重新畫電路，優化電網調度，加速藥物篩選，甚至直接改了下一代TPU的硅片設計。

這些都在説明： AlphaEvolve已經不是實驗室里的玩具了。

這個由Gemini驅動的進化式編程智能體，用一年時間從論文里的概念驗證，變成了谷歌核心基礎設施的一部分。

正如有網友評論到的：這種遞歸自我改進真是太瘋狂了！

和人類最頂尖的大腦，並肩作戰

先從最讓人瞪大眼睛的部分説起。

在基因組學領域，AlphaEvolve優化了谷歌的DeepConsensus模型，直接把DNA測序的變異檢測錯誤率砍掉了30%。

PacBio的高級總監Aaron Wenger評價説，這意味着研究人員有可能發現此前隱藏的致病突變——也就是説，AI優化的算法，可能會幫人類找到新的救命線索。

在量子計算領域，AlphaEvolve給谷歌的Willow量子處理器設計了新的量子電路方案，錯誤率比傳統優化方法低了整整10倍。

注意，不是10%，是10倍。這直接讓一批此前跑不了的分子模擬實驗變成了現實。

但真正讓圈內人坐不住的，是數學。

AlphaEvolve和陶哲軒（Terence Tao）合作，攻克了Erdős提出的經典數學難題。

陶哲軒是誰不用多説——菲爾茲獎得主、UCLA數學教授、被公認為當世最聰明的數學家之一。

他的評價是這樣的：AlphaEvolve這類工具正在給數學家提供「非常有用的新能力」，尤其是在優化問題上，它可以快速測試潛在的不等式是否存在反例、驗證極值猜想，「極大地改善了我們對問題的直覺，也讓我們更容易找到嚴格證明」。

一個AI系統，讓一位數學史上排名前十的頭腦由衷地說出「非常有用」——這本身就是一個歷史性的信號。

除此之外，AlphaEvolve還刷新了旅行商問題（TSP）的已知最優解，改進了Ramsey數的下界紀錄。

這些都是組合數學里的經典老難題，幾代數學家啃了幾十年，而一個AI編程智能體，用進化搜索的方式，找到了人類直覺從未抵達過的解。

工程戰線：AI開始優化自己的「身體」

如果説科研突破還可以歸為「聰明的工具」，AlphaEvolve在谷歌內部基礎設施上乾的事情，就已經不是「工具」兩個字能概括的了。

最炸裂的一條：AlphaEvolve提出了一種「反直覺」的電路設計方案。

這個方案反直覺到什麼程度？

谷歌的芯片工程師第一反應大概率是「這不對」——但跑完測試發現，它不僅對，而且比人類設計的更高效。

於是谷歌做了一個決定：把這個AI設計的電路直接集成進了下一代TPU的硅片里。

Jeff Dean，谷歌首席科學家，親自背書了這件事。

他的原話是：「AlphaEvolve從我們AI技術棧最底層的硬件開始優化。它提出的電路設計如此反直覺卻又如此高效，以至於被直接集成進了下一代TPU的硅片。這是TPU大腦幫助設計下一代TPU身體的最新案例。」

注意這句話的分量：TPU是訓練Gemini的硬件，Gemini是驅動AlphaEvolve的大腦，而AlphaEvolve現在在設計下一代TPU。

商業戰線：從實驗室走進真金白銀

通過Google Cloud，AlphaEvolve已經在多個行業落地。

金融科技公司Klarna用它優化了最大的transformer模型，訓練速度直接翻倍，同時模型質量還提升了。物流公司FM Logistic用它優化旅行商問題的路線規劃，效率提升10.4%，每年少跑15000公里。計算化學公司Schrödinger用它加速分子力場的訓練和推理，速度提升約4倍——藥物研發的篩選周期從幾個月壓縮到幾天。

一年前AlphaEvolve發佈時，圈內最大的疑問是：這到底是一個驚艷的demo，還是一個真正能用的系統？

一年后的成績單回答了這個問題：它不僅能用，而且已經深入到了谷歌最核心的基礎設施里，從芯片硅片到數據庫內核，從量子計算到商業客户的生產環境。

但AlphaEvolve最關鍵的戰績，其實不在上面任何一條。

讓我們把Jeff Dean那句話再讀一遍：「TPU大腦正在設計下一代TPU身體。」

翻譯成更直白的語言就是：訓練AI的芯片，正在被AI自己重新設計。

新芯片造出來之后，會訓練出更強的AI，更強的AI會設計出更好的芯片——這是一個閉環。

AI造AI：遞歸自我改進

就在AlphaEvolve交出成績單的同一天，IEEE Spectrum——全球工程技術領域最權威的媒體之一——刊發了一篇長文：Recursive Self-Improvement Edges Closer In AI Labs（遞歸自我改進正在AI實驗室中逼近現實）。

遞歸自我改進（RSI）這個詞，過去十年基本只出現在兩個場景：AI安全研究者的警告報告里，和科幻小説里。

IEEE Spectrum用一整篇特稿把它從這兩個場景拽了出來，放到了工程現實的桌面上。

而讓這篇報道真正炸開的，是Anthropic聯合創始人Jack Clark同期給出的預測：到2028年底，有60%以上的概率，出現一個AI系統可以完全自主地訓練出自己的下一代。

他在自己的newsletter Import AI 第455期中寫道，他花了數周時間閲讀了數百份公開數據源，最終得出這個結論。

他承認自己「不確定社會是否準備好了」。

這不是一個推特上的隨口一説。Clark是Anthropic的聯合創始人，也是AI安全和政策領域最有影響力的公共知識分子之一。

當這樣一個人松口承認「早期信號已經出現」的時候，本身就是信號。

如今，三條線索已經擺在桌面上。

Anthropic承認Claude Code寫下了公司大部分代碼，Dario Amodei公開説工程師效率提升了20%-40%。

換句話説，造Claude的代碼，很大一部分是Claude自己寫的。

谷歌這邊，AlphaEvolve在設計訓練自己的芯片。

再看學術界，2026年3月發表在Nature上的AI Scientist系統，已經能自主跑完「提想法—做實驗—寫論文—同行評審」的全流程。

當AI可以參與改進下一代AI時，一家公司的護城河就不再是模型參數量、數據規模或者算力儲備——而是自演化的速度。

當然，IEEE Spectrum的報道也呈現了另一面的聲音。

Allen Institute for AI的Nathan Lambert提出了「有損自我改進」（Lossy Self-Improvement）的概念——隨着AI系統變得越來越複雜，自我改進的飛輪可能因為摩擦增大而減速，而不是無限加速。

Meta的研究者Jason Weston和Jakob Foerster則主張，比起純粹的自我改進，「人機共同改進」纔是更現實、也更安全的路線。

不過話說回來，當AI在反向設計自己跑着的芯片，陶哲軒這種級別的數學家已經把它當研究搭檔，Claude寫了Anthropic大部分代碼時——

你説AI自我提升這扇門有沒有被推開？

其實早就推開了。

現在，唯一值得關心的問題只剩下ASI多久能夠到來。

參考資料：

https://deepmind.google/blog/alphaevolve-impact/

https://spectrum.ieee.org/recursive-self-improvement

https://www.anthropic.com/product/claude-code

https://arxiv.org/abs/2506.13131

https://www.nature.com/articles/s41586-026-10265-5

本文來自微信公眾號「新智元」，作者：新智元，36氪經授權發佈。

AlphaEvolve交出一周年炸裂成績單，AI自我改進不再科幻

和人類最頂尖的大腦，並肩作戰

工程戰線：AI開始優化自己的「身體」

商業戰線：從實驗室走進真金白銀

AI造AI：遞歸自我改進

推薦文章

美股機會日報 | 伊朗稱高濃縮鈾不得運往國外；特朗普再出手！美國政府20億美元佈局量子計算；SpaceX正式遞表衝刺納斯達克

一圖看懂 | 連續兩季盈利！蔚來Q1經營利潤0.66億元，交付量超8萬輛；毛利率創近四年新高

SpaceX更多IPO細節披露：去年虧損49億美元，馬斯克掌握85%投票權，股票分階段解禁

英偉達上調股息，市場投資者擔憂其未來增長前景

伊朗戰事引發市場集體焦慮！美財長發話：收益率與通脹上升是 「暫時的」

美國聯邦航空管理局：SpaceX計劃五年內實現每年10000次發射

SpaceX IPO招股書首度曝光：星鏈年賺113億美元，航天業務虧損，估值劍指1.8萬億美元！

5月21日外盤頭條：特朗普稱處理伊朗問題進入最后階段 英偉達Q1營收同比大增85% SpaceX IPO招股書首度曝光

伊朗戰事引發市場集體焦慮！美財長發話：收益率與通脹上升是「暫時的」

5月21日外盤頭條：特朗普稱處理伊朗問題進入最后階段英偉達Q1營收同比大增85% SpaceX IPO招股書首度曝光