繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

AlphaEvolve交出一周年炸裂成績單,AI自我改進不再科幻

2026-05-08 20:29

AlphaEvolve轉眼已經發布一年。

就在剛剛,谷歌低調地放出了一份炸裂的年度成績單。

好家伙,AlphaEvolve這一年間居然干了這麼多事——

幫陶哲軒解數學難題,給量子芯片重新畫電路,優化電網調度,加速藥物篩選,甚至直接改了下一代TPU的硅片設計。

這些都在説明: AlphaEvolve已經不是實驗室里的玩具了。

這個由Gemini驅動的進化式編程智能體,用一年時間從論文里的概念驗證,變成了谷歌核心基礎設施的一部分。

正如有網友評論到的:這種遞歸自我改進真是太瘋狂了!

和人類最頂尖的大腦,並肩作戰

先從最讓人瞪大眼睛的部分説起。 

在基因組學領域,AlphaEvolve優化了谷歌的DeepConsensus模型,直接把DNA測序的變異檢測錯誤率砍掉了30%。

PacBio的高級總監Aaron Wenger評價説,這意味着研究人員有可能發現此前隱藏的致病突變——也就是説,AI優化的算法,可能會幫人類找到新的救命線索。

在量子計算領域,AlphaEvolve給谷歌的Willow量子處理器設計了新的量子電路方案,錯誤率比傳統優化方法低了整整10倍。

注意,不是10%,是10倍。這直接讓一批此前跑不了的分子模擬實驗變成了現實。

但真正讓圈內人坐不住的,是數學。

AlphaEvolve和陶哲軒(Terence Tao)合作,攻克了Erdős提出的經典數學難題。

陶哲軒是誰不用多説——菲爾茲獎得主、UCLA數學教授、被公認為當世最聰明的數學家之一。

他的評價是這樣的:AlphaEvolve這類工具正在給數學家提供「非常有用的新能力」,尤其是在優化問題上,它可以快速測試潛在的不等式是否存在反例、驗證極值猜想,「極大地改善了我們對問題的直覺,也讓我們更容易找到嚴格證明」。

一個AI系統,讓一位數學史上排名前十的頭腦由衷地說出「非常有用」——這本身就是一個歷史性的信號。

除此之外,AlphaEvolve還刷新了旅行商問題(TSP)的已知最優解,改進了Ramsey數的下界紀錄。

這些都是組合數學里的經典老難題,幾代數學家啃了幾十年,而一個AI編程智能體,用進化搜索的方式,找到了人類直覺從未抵達過的解。

工程戰線:AI開始優化自己的「身體」

如果説科研突破還可以歸為「聰明的工具」,AlphaEvolve在谷歌內部基礎設施上乾的事情,就已經不是「工具」兩個字能概括的了。

最炸裂的一條:AlphaEvolve提出了一種「反直覺」的電路設計方案。

這個方案反直覺到什麼程度?

谷歌的芯片工程師第一反應大概率是「這不對」——但跑完測試發現,它不僅對,而且比人類設計的更高效。

於是谷歌做了一個決定:把這個AI設計的電路直接集成進了下一代TPU的硅片里。

Jeff Dean,谷歌首席科學家,親自背書了這件事。

他的原話是:「AlphaEvolve從我們AI技術棧最底層的硬件開始優化。它提出的電路設計如此反直覺卻又如此高效,以至於被直接集成進了下一代TPU的硅片。這是TPU大腦幫助設計下一代TPU身體的最新案例。」

注意這句話的分量:TPU是訓練Gemini的硬件,Gemini是驅動AlphaEvolve的大腦,而AlphaEvolve現在在設計下一代TPU。

商業戰線:從實驗室走進真金白銀

通過Google Cloud,AlphaEvolve已經在多個行業落地。

金融科技公司Klarna用它優化了最大的transformer模型,訓練速度直接翻倍,同時模型質量還提升了。物流公司FM Logistic用它優化旅行商問題的路線規劃,效率提升10.4%,每年少跑15000公里。計算化學公司Schrödinger用它加速分子力場的訓練和推理,速度提升約4倍——藥物研發的篩選周期從幾個月壓縮到幾天。

一年前AlphaEvolve發佈時,圈內最大的疑問是:這到底是一個驚艷的demo,還是一個真正能用的系統?

一年后的成績單回答了這個問題:它不僅能用,而且已經深入到了谷歌最核心的基礎設施里,從芯片硅片到數據庫內核,從量子計算到商業客户的生產環境。

但AlphaEvolve最關鍵的戰績,其實不在上面任何一條。

讓我們把Jeff Dean那句話再讀一遍:「TPU大腦正在設計下一代TPU身體。」

翻譯成更直白的語言就是:訓練AI的芯片,正在被AI自己重新設計。

新芯片造出來之后,會訓練出更強的AI,更強的AI會設計出更好的芯片——這是一個閉環。

AI造AI:遞歸自我改進

就在AlphaEvolve交出成績單的同一天,IEEE Spectrum——全球工程技術領域最權威的媒體之一——刊發了一篇長文:Recursive Self-Improvement Edges Closer In AI Labs(遞歸自我改進正在AI實驗室中逼近現實)。

遞歸自我改進(RSI)這個詞,過去十年基本只出現在兩個場景:AI安全研究者的警告報告里,和科幻小説里。

IEEE Spectrum用一整篇特稿把它從這兩個場景拽了出來,放到了工程現實的桌面上。

而讓這篇報道真正炸開的,是Anthropic聯合創始人Jack Clark同期給出的預測:到2028年底,有60%以上的概率,出現一個AI系統可以完全自主地訓練出自己的下一代。

他在自己的newsletter Import AI 第455期中寫道,他花了數周時間閲讀了數百份公開數據源,最終得出這個結論。

他承認自己「不確定社會是否準備好了」。

這不是一個推特上的隨口一説。Clark是Anthropic的聯合創始人,也是AI安全和政策領域最有影響力的公共知識分子之一。

當這樣一個人松口承認「早期信號已經出現」的時候,本身就是信號。

如今,三條線索已經擺在桌面上。

Anthropic承認Claude Code寫下了公司大部分代碼,Dario Amodei公開説工程師效率提升了20%-40%。

換句話説,造Claude的代碼,很大一部分是Claude自己寫的。

谷歌這邊,AlphaEvolve在設計訓練自己的芯片。

再看學術界,2026年3月發表在Nature上的AI Scientist系統,已經能自主跑完「提想法—做實驗—寫論文—同行評審」的全流程。

當AI可以參與改進下一代AI時,一家公司的護城河就不再是模型參數量、數據規模或者算力儲備——而是自演化的速度。

當然,IEEE Spectrum的報道也呈現了另一面的聲音。

Allen Institute for AI的Nathan Lambert提出了「有損自我改進」(Lossy Self-Improvement)的概念——隨着AI系統變得越來越複雜,自我改進的飛輪可能因為摩擦增大而減速,而不是無限加速。

Meta的研究者Jason Weston和Jakob Foerster則主張,比起純粹的自我改進,「人機共同改進」纔是更現實、也更安全的路線。

不過話說回來,當AI在反向設計自己跑着的芯片,陶哲軒這種級別的數學家已經把它當研究搭檔,Claude寫了Anthropic大部分代碼時——

你説AI自我提升這扇門有沒有被推開?

其實早就推開了。

現在,唯一值得關心的問題只剩下ASI多久能夠到來。

參考資料:

https://deepmind.google/blog/alphaevolve-impact/ 

https://spectrum.ieee.org/recursive-self-improvement 

https://www.anthropic.com/product/claude-code 

https://arxiv.org/abs/2506.13131 

https://www.nature.com/articles/s41586-026-10265-5 

本文來自微信公眾號「新智元」,作者:新智元,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。