熱門資訊> 正文

地理學的AlphaEvolve？MIT斯坦福讓AI自我生長、懂地理、懂世界

2025-10-28 11:00

以下或許是一位地理科研工作者的日常：爲了讓所需的地理模型表現得更好，他不斷和大模型（如ChatGPT）對話，嘗試改進代碼或修復bug。

大模型給出的初版答案往往並不完美，於是研究者又會根據結果提出新的修改意見。就這樣一來一回，經過不斷交互，代碼逐漸被打磨得完善。

這種「和大模型互動、改進算法」的方式，已經成為地理研究的常見操作。

那問題來了：能不能更進一步？——讓這種交互—改進的過程自動發生，讓AI不再只是幫手，而是真正像科學家一樣，自己去進化地理模型？

MIT和斯坦福學者提出了GeoEvolve，嘗試了這樣一種探索：

🌍把地理知識「嵌入」AI，讓它的進化更靠譜、更接近地理學原理；

🤖讓大模型不只是輔助工具，而是成為能夠自主改進算法的「科研合作者」。

傳送門：https://arxiv.org/abs/2509.21593

項目地址：https://vezarachan.github.io/GeoEvolveWebPage/

GeoEvolve 已經開源為 Python 包，可直接安裝使用（pip install geoevolve）。

研究背景

地理空間建模是理解氣候變化、推動城市可持續發展的關鍵工具。

但傳統方法往往依賴專家經驗：提出假設、設計算法、不斷調參改進。

近年來，大語言模型（LLMs）展現了自動進化代碼的潛力。比如Google最新推出的AlphaEvolve，就能讓AI自己嘗試、變異、優化算法。

然而，這類系統有一個天然短板——它們並不懂地理。如果完全放任AI去進化，很容易「跑偏」，生成的模型缺乏地理學上的合理性。

正因如此，GeoEvolve的提出構建了一個結合AI自主進化與地理知識引導的新框架。

GeoEvolve框架

如圖1所示，可以把GeoEvolve想象成一個「由導師和博士生組成的GeoAI研究團隊」：

內循環：AI扮演博士生，基於初始代碼，互相交流，不斷試錯、生成和改進算法；

外循環：一個「導師」——地理知識庫（GeoKnowRAG）在旁提醒，確保演化方向符合空間理論。

GeoEvolve的四個核心模塊分別是：

代碼進化器(自動生成和變異候選算法)，

代碼分析器(診斷問題、提出改進思路)，

地理知識檢索器（GeoKnowRAG，提供空間學理論與經典方法），

知識驅動提示生成器(把複雜的地理知識轉化為AI能理解的優化指令)。

通過這套雙循環機制，GeoEvolve不僅能寫代碼，更能逐漸學會像地理學家一樣思考。

整個GeoEvolve的輸入，只有三樣：

原始模型——需要改進的地理模型（甚至可以是一張「白紙」的空白模型）；

評價指標——衡量模型優劣的標準（比如RMSE、MAE）；

提示語——給大模型的一句話任務説明（例如：「請幫我改進這個Kriging模型」）。

圖1.GeoEvolve所依賴的基本思想，地理知識引導下的算法進化。虛線框表示通用的算法生成引擎(例如AlphaEvolve)。外部流程展示了本文提出的知識引導型算法生成方法，專門面向地理空間建模場景。

圖2展示了GeoEvolve詳細的框架。

GeoEvolve旨在通過結合進化式代碼生成與結構化地理空間知識，實現地理空間模型的自動發現。

與通用的代碼智能體不同，GeoEvolve融合了來自空間建模文獻與經典算法的領域知識，從而能夠探索並發現新的地理空間算法。

它由四個主要部分組成：(1)代碼進化器，(2)演化代碼分析器，(3)地理知識檢索器，以及(4)知識驅動提示生成器。

這些組件共同構成了一個閉環的代碼生成、評估與改進過程，從而推動地理空間模型的自動化發現。

圖2.GeoEvolve的框架

如圖3所示，爲了避免AI在進化過程中「跑偏」，GeoEvolve引入了一個專門的地理知識檢索模塊（GeoKnowRAG）。

它相當於一個「地理知識庫」，收集了來自Wikipedia、arXiv和GitHub的核心資料，包括空間自相關、異質性、Kriging、地理加權迴歸等經典概念與算法。

系統會把這些知識轉化為結構化數據庫，並在AI進化時調用，通過智能檢索與融合（RAG-Fusion），為代碼生成提供有理論支撐的提示。

這樣，AI就能在「懂地理」的前提下進行算法改進，確保進化出的模型既聰明又可靠。

圖3.GeoKnowRAG的框架

案例研究：對Kriging的自動化改進

Ordinary Kriging是地質統計學中最經典的空間插值方法，被廣泛應用於環境監測、氣候分析和資源勘探。

但它的核心算法提出已久，后續研究更多是「外掛式」的結合，比如與迴歸模型結合形成regression kriging，而對Kriging本身結構的改進幾乎沒有新的突破。

GeoEvolve得到的全新Kriging model

在實驗中，GeoEvolve在保留Kriging核心的基礎上，通過進化和知識引導自動注入了多項改進，僅選取幾個為例展示：

自適應經驗變差圖估計

原始方法用固定分箱，容易受異常值影響。

GeoEvolve借鑑統計學方法，引入Silverman分箱規則、分位數分箱和截尾均值，自動確定合適的區間數量。

多起點全局擬合

傳統擬合容易陷入局部最優。

GeoEvolve用多起點優化+L1或加權最小二乘，保證參數物理意義合理（如變程不為負）。

自適應數據變換

在數據偏態嚴重時，GeoEvolve會自動選擇合適的對數變換+偏移量，保證殘差分佈更合理，預測更穩定。

上述改進如果單獨來看，也許只是一些「漸進式增強」；但當它們被GeoEvolve自動組合、進化，並在真實實驗中顯著提升預測精度時，就展現出強大的效果。

將GeoEvolve-Kriging與其他自動化算法發現的Kriging模型進行對比，選取澳大利亞某礦區的銅（Cu）、鉛（Pb）、鋅（Zn）預測作為實驗場景。

如表格所示，結果差異十分明顯：

原始Kriging：表現最差，預測誤差最高；

OpenEvolve-Kriging：在部分指標上有所改善，但在鋅元素預測中反而退步；

加入地理知識提示的OpenEvolve：並沒有帶來額外提升，説明缺乏針對性的知識很難真正幫助算法演化；

GeoEvolve（無知識庫版本）：已經顯著優於OpenEvolve，但仍不及完整版本；

完整GeoEvolve-Kriging：始終表現最佳，在三種金屬元素的預測中都取得了最低RMSE和MAE。

具體來説，GeoEvolve相比OpenEvolve-Kriging，RMSE分別降低了11.3%（Cu）、20.9%（Pb）、13.5%（Zn）；相較於原始Kriging，降低幅度更是達到15.4%、21.2%、13.0%。

這清楚地表明，結構化的地理知識庫（GeoKnowRAG）在算法進化中起到了關鍵作用，讓AI不僅能寫出代碼，更能在「懂地理」的前提下進化出更強的插值模型。

總結

GeoEvolve的實驗結果告訴我們：AI不只是會修改代碼，它還可以在地理學知識的引導下，自主進化出更強的經典模型。這意味着：

未來的地理建模，不一定總是研究人員「手工設計」，然后基於LLMs進行修改；

我們可以讓算法開發過程完全自動化，讓AI不斷試錯、吸收知識，最終學會像地理學家一樣思考；

GeoEvolve展示了一條通向可信賴的GeoAI的新道路，也為AI-for-Science在地理科學和可持續發展中的應用打開了可能。

或許在不久的將來，AI將不僅是工具，更是科研合作者。

參考資料：

Luo，P.，Lou，X.，Zheng，Y.，Zheng，Z.andErmon，S.，2025.GeoEvolve: Automating Geospatial Model Discovery via Multi-Agent Large Language Models. arXiv preprint arXiv:2509.21593

本文來自微信公眾號「新智元」，作者：新智元，編輯：KingHZ，36氪經授權發佈。

地理學的AlphaEvolve？MIT斯坦福讓AI自我生長、懂地理、懂世界

研究背景

GeoEvolve框架

案例研究：對Kriging的自動化改進

總結

推薦文章

戴爾押注人工智能服務器需求增長，預計業績將實現更高增速

誰將接替美聯儲主席鮑威爾？盤點5位最終候選人

馬斯克吐槽傳統車企不願使用特斯拉的FSD技術：「他們不想要，簡直瘋了！」

螞蟻收購耀纔要約延時4個月並增加按金 利好？利空？

「美聯儲是時候退居幕后了」！貝森特徹底攤牌：聯儲需要簡化運作機制

華盛早報 | 谷歌搶飯碗！英偉達深夜閃崩緊急發聲；特朗普心腹哈塞特有望掛帥美聯儲

蔚來高管解讀Q3財報：對實現第四季度盈利有信心

美股機會日報 | 經濟數據轉弱！美國9月零售銷售數據、核心PPI均不及預期；阿里巴巴績后一度大漲5%

螞蟻收購耀纔要約延時4個月並增加按金利好？利空？