大模型推動地理科學邁向地理智能

中國科學院院士周成虎
➤相比通用語言大模型,“坤元”更熟悉地理學的語言模式、專業術語和領域知識,在地理學基準測試集上的準確性提升了31.3%
➤未來“坤元”計劃打造出一個地理科研協作大平台,每個科學家和科研團隊都能夠擁有專屬的地理大模型,每個科研人員都可以通過平台共享數據、模型或者尋求跨學科合作,通過這樣的方式來與數百萬科學家一起協同工作
➤大模型本質上還是一個生成式人工智能,所以大模型採集的數據、形成的分析結果到底是對還是錯,最終還需要通過人來判斷,確保大模型生成及分析結果的準確性與可靠性
文 |《瞭望》新聞周刊記者 扈永順
“坤”指大地;“元”指起始,也指神經元。“坤元”寓意為大地的神經元系統,我國科學家以“坤元”命名了全球首個地理科學大模型。
日前,由中國科學院地理科學與資源研究所聯合中國科學院青藏高原研究所、中國科學院自動化研究所研發的“坤元”大模型發布,旨在拓寬普通大眾的地理視野,增強地理科技工作者的智力,加速重大地理科學發現。
“今天‘坤元’作為地理科學大模型的起步,也希望能夠在此基礎上集聚全球地理信息,融匯全域的地理空間知識,構建能夠服務人類可持續發展等複雜問題求解的新科技體系,進而促進新的地理科學發展,推動地理科學邁向地理智能。”“坤元”大模型科學顧問、中國科學院院士周成虎向《瞭望》新聞周刊記者介紹。
“坤元”大模型更懂地理
《瞭望》:研發“坤元”大模型的契機是什麼?
周成虎:今天我們正迎來新一輪的科技革命和産業變革,以生成式人工智能為核心的現代人工智能技術正在重塑我們的社會,人工智能正成為科學研究的新工具。
地理科學包含了自然、人文、社會、經濟等多個學科領域,是一個高度綜合性的學科。大模型可以把不同時期地理知識統一在一個時空框架下,為解決全球氣候變化、可持續發展問題提供新的科技手段。這是我們研發“坤元”地理科學大模型的初衷。
早在三年前我們就一直在思考,地理科學涉及太多知識,它的大模型應該怎麼做。我們從做知識圖譜到知識庫的管理然後開始做大模型,這是個慢慢演變的過程。為什麼我們能做?
第一,中國科學院地理科學與資源研究所是全球最大的地理科學研究所,擁有豐富的科研積累和人才團隊;
第二,中國科學院擁有眾多各類研究所,有數學、自動化等學科的科研力量,通過多個學科研究者的聯合和協同,例如把計算機、信息科學和地理學的人組合在一起,能實現科學與技術的提升;
第三,我們有強大的計算能力,中國科學院有做國産智能芯片的企業,有算力的支撐。
相比於通用大模型,“坤元”更聚焦於地理科學領域,它已學習了300萬篇地理科學領域的相關科技文獻、98部經典教材、88部經典著作、34部標準規範,還有1萬張專題地圖、10萬份專業圖表和5萬條專業問答。“坤元”構建了涵蓋全譜係地理科學知識的語料庫,增強了其在處理地理相關任務時的專業性和精確性。這種專門化的模型在特定領域應用上有很大的優勢,也能滿足更精細化的需求。
《瞭望》:“坤元”大模型的應用優勢體現在哪些方面?
周成虎:“坤元”是一個以地理科學語言和地理科學思維為支撐的科學大模型,具備“懂地理”“精配圖”“知人心”“智生圖”等特點,實現了地理專業問題解答、地理學文獻智能分析、地理數據資源查詢、地理數據挖掘分析、專題地圖繪製等功能。
在“懂地理”方面,研發團隊建立了涵蓋4大類、16小類的地理全學科語料庫,提供320億詞元供大模型自監督學習,並製作了4萬餘條高質量地理學指令進行模型微調。相比通用語言大模型,“坤元”更熟悉地理學的語言模式、專業術語和領域知識,在地理學基準測試集上的準確性提升了31.3%。
在“精配圖”方面,團隊自主研發了面向多層次地圖信息的多模態檢索技術、支持地理認知與圖形表達的知識推理技術。這些技術使得“坤元”能夠在解答地理學提問的同時,根據生成的文字答案檢索不同地理要素,並匹配地理景觀照片、專題地圖或示意圖表呈現給提問者。
在“知人心”方面,團隊創新提出了基於“認知啟航—應用智導—前沿研析”框架的用戶畫像精準判別與響應技術,保證“坤元”能夠充分考慮地理知識愛好者、地理學專業學生以及科研人員等不同人群地理科學知識儲備的差異情況,以圖文共現的方式給出適配用戶知識結構的地理學專業問題解答。
在“智生圖”方面,團隊基於“坤元”開發的科研助手,可以根據用戶指令完成概念理解、數據獲取、信息分析、製圖等流程,最終生成用戶需要的專業地理圖表。
推動地理科學向地理智能邁進
《瞭望》:目前“坤元”大模型已經發揮了哪些作用?
周成虎:“坤元”擁有相當於千萬個博士的龐大知識儲量,它意味着原來在發表論文時一個人的工作會得到千萬個博士的幫助。現在我們已經使用“坤元”來完成研究的輔助工作,例如文獻的輔助閱讀工作、撰寫綜述以及輔助撰寫論文等。文獻輔助閱讀方面,做一項具有創新性的研究,會需要很多前沿研究支持,以前檢索、閱讀一段時間內的文獻經常會存在漏網之魚,這個過程也非常辛苦,“坤元”有助於解決這些問題。它還能從上百萬篇文獻中凝練出需要的內容,寫成一段綜述文字供參考。論文輔助撰寫方面,它可以根據我們給出的論文框架、數據、圖表等輔助論文的撰寫。
在“坤元”大模型支持下,我們已經開展了一系列研究試驗,已在高水平期刊發表學術論文十余篇。
《瞭望》:如何利用大模型推動地理科學向地理智能邁進?
周成虎:地理科學大模型驅動地理科學研究範式變革,目標是將地理科學研究從各個研究組、各個課題或各個區域的小作坊模式轉變為平台科研模式,將“坤元”打造成為地理科學領域研究者之間的重要協作工具。
“坤元”大模型研製分三個階段:第一個階段是發布“坤元”地理科學語言大模型,它了解地理學概念與知識體系,支持知識問答和文獻歸納,實現文配圖、文生圖,成為一名合格的“地理學家”。第二個階段是訓練地理識圖大模型,或者叫地圖大模型,能夠進行通用、專題地圖的學習和認知,具備空間分析和歸納能力,既可以解釋地圖,也可以生成地圖,成為一名“地圖學家”。第三個階段是將基於大模型打造一系列地理專業智能體,能夠提供綜合性地理問題智能解決方案,可以創造地理分析的方法,成為一名“地理智能科學家”。
未來“坤元”計劃打造出一個地理科研協作大平台,每個科學家和科研團隊都能夠擁有專屬的地理大模型,每個科研人員都可以通過平台共享數據、模型或者尋求跨學科合作,通過這樣的方式來與數百萬科學家一起協同工作。
中國科學院地理科學與資源研究所承擔的中國科學院基礎與交叉前沿科研先導專項(B類)“數據—模型驅動地理智能系統與典型場景應用研究”專項啟動及實施方案專家論證會已於4月召開,旨在推動地理信息系統向地理智能系統跨越革新,搶佔國際地理智能制高點。“坤元”的研發正是在該專項的支持下,按照既定的研究框架有序推進。

多模態地理科學大模型“坤元”的運行機房(2024 年9 月 19 日攝) 李鑫攝 / 本刊
加速大模型落地應用
《瞭望》:如何平衡“坤元”大模型不斷增強的能力與地理信息安全的關係?
周成虎:“坤元”大模型的訓練、使用要遵照我國關於地理信息安全的所有法律條文。我們在研發過程中也特別注重知識産權和地理信息安全,確保我們所使用的訓練語料不存在侵權和涉密問題。目前階段“坤元”主要支撐科研任務,能夠支撐科研就意味着“坤元”能很快走向支撐行業或者業務工作。在這個階段,我們會與相關業務部門進行合作,遵照我國相關法律法規,確保地理信息安全。
此外,需要注意的是,大模型本質上還是一個生成式人工智能,所以大模型採集的數據、形成的分析結果到底是對還是錯,最終還需要通過人來判斷,確保大模型生成及分析結果的準確性與可靠性。
《瞭望》:你是遙感應用方面的專家,在遙感大模型建設方面,你有哪些建議?
周成虎:當前,人類對遙感數據的獲取能力超越了以往任何一個歷史時期。對地觀測技術的進步和高分辨率對地觀測衛星的密集發射,代表着我國已構建了自主全球觀測系統,進入了遙感大數據時代,而海量的遙感大數據也給遙感應用帶來了新挑戰。
2022年8月,中國科學院空天信息創新研究院發布了“空天·靈眸”大模型,這是首個面向跨模態遙感數據的生成式預訓練大模型,旨在構建一個通用的多模態多任務模型,為遙感領域多行業應用提供一套通用便捷、性能優良的解決方案,填補了跨模態生成式預訓練模型在遙感專業領域的空白。
今天語言大模型已經超越了常規的自然語言理解,特別是ChatGPT的出現讓人工智能應用進入了普惠時代。那麼,遙感大模型是不是也可以將遙感應用帶入普惠時代?這就需要學術界和工業界共同聯手研究、攻克遙感大模型的底層技術。
我們的遙感大模型不僅要關注地物分類與信息提取,還要關注地理系統參數的定量反演。在遙感應用中,無論是提取、分類還是地學參數反演,都需要非常多的專業模型。如何將專業模型嵌入大模型中?這也是今天遙感大模型面臨的挑戰和難點。我認為,一是要在現有學習的基礎上將多語義結合起來,將遙感的地學知識和模型組合起來;二是將多樣化的地學任務適配器建起來,爭取讓每一個任務都有自己的適配器,或者開拓成千上萬個應用軟體,在這個大模型基礎上把每一項任務都做得像專家水平。
未來,要抓住時代機遇拓展遙感大模型,有了大數據、大模型,進一步推動中國遙感應用的變革,加速向地理智能時代邁進。□