熱門資訊> 正文
2025-10-28 11:00
以下或許是一位地理科研工作者的日常:爲了讓所需的地理模型表現得更好,他不斷和大模型(如ChatGPT)對話,嘗試改進代碼或修復bug。
大模型給出的初版答案往往並不完美,於是研究者又會根據結果提出新的修改意見。就這樣一來一回,經過不斷交互,代碼逐漸被打磨得完善。
這種「和大模型互動、改進算法」的方式,已經成為地理研究的常見操作。
那問題來了:能不能更進一步?——讓這種交互—改進的過程自動發生,讓AI不再只是幫手,而是真正像科學家一樣,自己去進化地理模型?
MIT和斯坦福學者提出了GeoEvolve,嘗試了這樣一種探索:
🌍把地理知識「嵌入」AI,讓它的進化更靠譜、更接近地理學原理;
🤖讓大模型不只是輔助工具,而是成為能夠自主改進算法的「科研合作者」。
傳送門:https://arxiv.org/abs/2509.21593
項目地址:https://vezarachan.github.io/GeoEvolveWebPage/
GeoEvolve 已經開源為 Python 包,可直接安裝使用(pip install geoevolve)。
地理空間建模是理解氣候變化、推動城市可持續發展的關鍵工具。
但傳統方法往往依賴專家經驗:提出假設、設計算法、不斷調參改進。
近年來,大語言模型(LLMs)展現了自動進化代碼的潛力。比如Google最新推出的AlphaEvolve,就能讓AI自己嘗試、變異、優化算法。
然而,這類系統有一個天然短板——它們並不懂地理。如果完全放任AI去進化,很容易「跑偏」,生成的模型缺乏地理學上的合理性。
正因如此,GeoEvolve的提出構建了一個結合AI自主進化與地理知識引導的新框架。
如圖1所示,可以把GeoEvolve想象成一個「由導師和博士生組成的GeoAI研究團隊」:
內循環:AI扮演博士生,基於初始代碼,互相交流,不斷試錯、生成和改進算法;
外循環:一個「導師」——地理知識庫(GeoKnowRAG)在旁提醒,確保演化方向符合空間理論。
GeoEvolve的四個核心模塊分別是:
代碼進化器(自動生成和變異候選算法),
代碼分析器(診斷問題、提出改進思路),
地理知識檢索器(GeoKnowRAG,提供空間學理論與經典方法),
知識驅動提示生成器(把複雜的地理知識轉化為AI能理解的優化指令)。
通過這套雙循環機制,GeoEvolve不僅能寫代碼,更能逐漸學會像地理學家一樣思考。
整個GeoEvolve的輸入,只有三樣:
原始模型——需要改進的地理模型(甚至可以是一張「白紙」的空白模型);
評價指標——衡量模型優劣的標準(比如RMSE、MAE);
提示語——給大模型的一句話任務説明(例如:「請幫我改進這個Kriging模型」)。
圖1.GeoEvolve所依賴的基本思想,地理知識引導下的算法進化。虛線框表示通用的算法生成引擎(例如AlphaEvolve)。外部流程展示了本文提出的知識引導型算法生成方法,專門面向地理空間建模場景。
圖2展示了GeoEvolve詳細的框架。
GeoEvolve旨在通過結合進化式代碼生成與結構化地理空間知識,實現地理空間模型的自動發現。
與通用的代碼智能體不同,GeoEvolve融合了來自空間建模文獻與經典算法的領域知識,從而能夠探索並發現新的地理空間算法。
它由四個主要部分組成:(1)代碼進化器,(2)演化代碼分析器,(3)地理知識檢索器,以及(4)知識驅動提示生成器。
這些組件共同構成了一個閉環的代碼生成、評估與改進過程,從而推動地理空間模型的自動化發現。
圖2.GeoEvolve的框架
如圖3所示,爲了避免AI在進化過程中「跑偏」,GeoEvolve引入了一個專門的地理知識檢索模塊(GeoKnowRAG)。
它相當於一個「地理知識庫」,收集了來自Wikipedia、arXiv和GitHub的核心資料,包括空間自相關、異質性、Kriging、地理加權迴歸等經典概念與算法。
系統會把這些知識轉化為結構化數據庫,並在AI進化時調用,通過智能檢索與融合(RAG-Fusion),為代碼生成提供有理論支撐的提示。
這樣,AI就能在「懂地理」的前提下進行算法改進,確保進化出的模型既聰明又可靠。
圖3.GeoKnowRAG的框架
Ordinary Kriging是地質統計學中最經典的空間插值方法,被廣泛應用於環境監測、氣候分析和資源勘探。
但它的核心算法提出已久,后續研究更多是「外掛式」的結合,比如與迴歸模型結合形成regression kriging,而對Kriging本身結構的改進幾乎沒有新的突破。
GeoEvolve得到的全新Kriging model
在實驗中,GeoEvolve在保留Kriging核心的基礎上,通過進化和知識引導自動注入了多項改進,僅選取幾個為例展示:
自適應經驗變差圖估計
原始方法用固定分箱,容易受異常值影響。
GeoEvolve借鑑統計學方法,引入Silverman分箱規則、分位數分箱和截尾均值,自動確定合適的區間數量。
多起點全局擬合
傳統擬合容易陷入局部最優。
GeoEvolve用多起點優化+L1或加權最小二乘,保證參數物理意義合理(如變程不為負)。
自適應數據變換
在數據偏態嚴重時,GeoEvolve會自動選擇合適的對數變換+偏移量,保證殘差分佈更合理,預測更穩定。
上述改進如果單獨來看,也許只是一些「漸進式增強」;但當它們被GeoEvolve自動組合、進化,並在真實實驗中顯著提升預測精度時,就展現出強大的效果。
將GeoEvolve-Kriging與其他自動化算法發現的Kriging模型進行對比,選取澳大利亞某礦區的銅(Cu)、鉛(Pb)、鋅(Zn)預測作為實驗場景。
如表格所示,結果差異十分明顯:
原始Kriging:表現最差,預測誤差最高;
OpenEvolve-Kriging:在部分指標上有所改善,但在鋅元素預測中反而退步;
加入地理知識提示的OpenEvolve:並沒有帶來額外提升,説明缺乏針對性的知識很難真正幫助算法演化;
GeoEvolve(無知識庫版本):已經顯著優於OpenEvolve,但仍不及完整版本;
完整GeoEvolve-Kriging:始終表現最佳,在三種金屬元素的預測中都取得了最低RMSE和MAE。
具體來説,GeoEvolve相比OpenEvolve-Kriging,RMSE分別降低了11.3%(Cu)、20.9%(Pb)、13.5%(Zn);相較於原始Kriging,降低幅度更是達到15.4%、21.2%、13.0%。
這清楚地表明,結構化的地理知識庫(GeoKnowRAG)在算法進化中起到了關鍵作用,讓AI不僅能寫出代碼,更能在「懂地理」的前提下進化出更強的插值模型。
GeoEvolve的實驗結果告訴我們:AI不只是會修改代碼,它還可以在地理學知識的引導下,自主進化出更強的經典模型。這意味着:
未來的地理建模,不一定總是研究人員「手工設計」,然后基於LLMs進行修改;
我們可以讓算法開發過程完全自動化,讓AI不斷試錯、吸收知識,最終學會像地理學家一樣思考;
GeoEvolve展示了一條通向可信賴的GeoAI的新道路,也為AI-for-Science在地理科學和可持續發展中的應用打開了可能。
或許在不久的將來,AI將不僅是工具,更是科研合作者。
參考資料:
Luo,P.,Lou,X.,Zheng,Y.,Zheng,Z.andErmon,S.,2025.GeoEvolve: Automating Geospatial Model Discovery via Multi-Agent Large Language Models. arXiv preprint arXiv:2509.21593
本文來自微信公眾號「新智元」,作者:新智元,編輯:KingHZ,36氪經授權發佈。