AI4S重塑科研未來
➤在積極利用AI提升知識積累效率的同時,我們需審慎思考,如何確保科學成果的質量與深度不被速度稀釋,並將最終的解釋權、決策權等“認知主動權”牢牢掌握在人類自己手中
文 |《瞭望》新聞周刊記者 錢沛杉
11月27日晚,DeepSeek發布其最新數學模型DeepSeekMath-V2,以自驗證方式突破了目前AI在深度推理方面的局限,展現了強大的定理推理能力。DeepSeek方面&&,Math-V2讓大模型在數學領域不再只是“做題家”,而有可能依靠自身全面、嚴謹的數學推理能力對科學研究産生深遠影響。
將AI引入科學研究並非全新事物。在國內,2018年,中國科學院院士、北京大學國際機器學習研究中心主任鄂維南率先引入AI4S(人工智能驅動科學研究)概念,認為傳統科研模式效率較低、學科間壁壘較高,AI可以實現跨學科融合,加速突破。
特別是,當傳統物理模型在極端複雜的系統前束手無策時,數據驅動範式可以跳過對微觀機制的繁瑣推演,利用算法直接從海量數據中尋找規律、構建“隱性”模型,為應對氣候變化等緊迫挑戰,提供可行路徑。
這種模式已影響滲透到科學研究的多個環節,在多個領域催生重大突破,實現科研效率的指數級提升。
在生命科學領域,去年獲諾貝爾化學獎的“阿爾法折疊2”AI模型(Alpha Fold2)將蛋白質結構預測周期從數十年縮短至數天,解決了領域內長期困擾的折疊難題;在材料科學領域,科研人員利用AI模擬不同元素組合的性能,縮短新材料設計周期;在環境科學領域,AI實現多模態數據的自動對齊與分析,為森林火災的預防、監測與生態恢復等提供了更準、更快的解決方案……
一系列顯著成果,“刺激”多國加速布局發展AI4S:2024年以來,美國通過行政令、政策文件及專項報告系統性提升AI4S戰略地位;歐盟自2022年起開始布局科學AI發展,2025年加快進度,發布“人工智能大陸行動計劃”,持續布局歐洲科學AI戰略;建設科學AI在線服務平台AI-on-Demand並推動成立AI科學專家組。
我國同樣高度重視AI4S發展,從國家部委到地方政府層面積極應對,陸續推出支持政策。國家層面,2023年科技部會同國家自然科學基金委啟動“人工智能賦能科學研究”專項部署工作後,今年8月國務院印發《關於深入實施“人工智能+”行動的意見》,第一項重點行動即“人工智能+”科學技術,要求加快探索人工智能驅動的新型科研範式,加速“從0到1”重大科學發現進程。《中共中央關於制定國民經濟和社會發展第十五個五年規劃的建議》也提出,以人工智能引領科研範式變革。
地方層面,今年7月上海、北京均&&了支持AI4S發展的專項計劃,推出了科學智能“百團百項”工程和《加快人工智能賦能科學研究高質量發展行動計劃(2025—2027年)》等舉措。
政策層面的高度重視支持推動了該領域的快速發展,但與此同時,AI預測成果無法快速轉化為實際生産力、數據孤島問題仍存、複合型人才缺口較大等情況仍存。
學界與業界呼籲,構建包含複合型人才培養體系、多領域協作的開放平台等在內的新型科研生態,並恪守科學倫理,堅持以人為本、科技向善。

在浙江烏鎮舉辦的 2025 年世界互聯網大會“互聯網之光”博覽會現場,一家企業工作人員展示人形機器人同步模仿精細動作(2025 年 11 月 6 日攝) 黃宗治攝 / 本刊
AI挑戰科學研究“游戲規則”
過去,科學家們主要通過理論推導、實驗觀察和計算機模擬來探索世界。如今,AI4S帶來了科學研究的另一種可能,即從海量數據中尋找規律。
“海洋科學作為一門實驗科學,其經典理論框架已趨於完善。當前學科的一個重要發展方向是追求更高分辨率的觀測,旨在通過精細化的尺度研究來突破傳統大尺度理論的瓶頸。”中國海洋大學物理海洋教育部重點實驗室教授陳顯堯介紹。
以預測厄爾尼諾-南方濤動(ENSO)現象為例,受系統混沌性和大氣海洋耦合過程季節變化等因素影響,ENSO在春季的預測準確度明顯低於其他季節,成為氣候預測中的一大難點。2019年,科學家運用機器學習模型突破了這一難題,將可預測時間長度延長數月,並為解釋其物理過程提供了新思路。
“AI並非擁有了超乎人類的知識,而是關注到了被人類研究者因先驗知識和經驗而忽視的物理過程。這些過程雖被觀測記錄,但傳統上被視為‘噪音’而非關鍵因子。AI的無偏見學習揭示了這些次要因素在長期預測中的決定性作用。”陳顯堯認為,AI的引入絕非簡單的工具性應用,而是推動動力學理論與觀測數據的有機融合。它突破人類思維的可能局限,幫助科學家發現新的科學&&,推動理論創新。
這一模式挑戰了傳統科學研究的“游戲規則”,在學界引發諸多爭議。“經典科學範式是‘自上而下’的,數據驅動範式是‘自下而上’的。”受訪者説,在經典科學範式概念下的科學發現,目標是“理解因果”優先,而AI4S的目標則是“實現預測”優先,兩者標準存在根本性差異。
標準的調整引發科研體系形態變化——
科研基礎設施上,AI4S的根基從傳統的精密儀器,轉向了以大型計算中心、專用算法庫和高質量數據庫為核心的新型基礎設施。這源於其對海量數據和強大算力的根本依賴。
科研人才角色上,一些科學家的工作重心發生轉變。過去科研中軟體是被動工具,而生成式AI和強化學習模型,更像是能自主設計實驗、提出假設的“能動夥伴”。科學家的核心任務從“如何操作”轉變為“如何定義問題、評估結果和引導方向”,形成“人機混合智能”協同探索模式。
科研組織方式上,受上述變動影響,科研活動從傳統PI制(課題組長負責制)的“小作坊”模式,向跨學科、平台化、網絡化的大團隊協作轉型。
多位學者認為,AI4S不是對傳統科研範式的替代,而是深度融合。中國工程院院士孫凝暉認為,AI4S的終極目標不是替代科學家,而是通過工具進化賦能人類認知進化,“正如望遠鏡擴展了人類的視野,顯微鏡打開了微觀世界的大門,AI正在成為人類探索未知的‘第三隻眼睛’”。
克服現實推進阻礙
中國科學院高能物理研究所研發的Dr.Sai多智能體協同系統,實現高能物理分析全流程自動化,並成功復現四夸克粒子發現過程;北京大學開發的DeepFlameRocket火箭燃燒智能倣真軟體,實現對火箭發動機的全流程數值模擬……
如果將2024年稱為AI4S的發展元年,2025年,AI4S從概念驗證和工具普及進入深度融合和規模化應用的發展階段,在基礎設施構建、平台工具研發、交叉學科應用等方面取得進展。
受訪者認為,當前,AI4S不再僅局限於個別案例,而是滲透影響到了各個基礎學科和工業研發的毛細血管中,科學發現進入人機協同、加速創新時代。但作為新生事物,在現實推進過程中,仍面臨幾方面阻礙。
打通數據孤島。高質量AI-Ready的科學數據稀缺是我國AI4S發展的核心挑戰。據了解,AI-Ready數據集是指經過系統化處理、標注和結構化的數據集合,專為人工智能模型的訓練和評估設計。這類數據集通常具備高質量、標準化格式和清晰的標注,能夠顯著降低數據預處理的門檻,幫助研究人員和開發者快速投入模型開發。
北京大學深圳研究生院副院長、科學智能學院執行院長田永鴻認為,海量、高質量的科學數據是AI4S發展的基礎,但此類數據仍嚴重短缺。
一方面,高質量數據集的獲取成本高昂。在生命科學領域,有業內人士統計,僅單一類別的蛋白質結構實驗數據,採集成本就超過8萬元,訓練AI模型通常需要百萬量級的樣本,其成本遠超普通科研團隊承受範圍。
另一方面,數據標注環節存在突出瓶頸。以冷凍電鏡圖像為例,其標注工作需依賴結構生物學家或電鏡專家等專業人員,耗時較長。業內人士透露,國內某生物物理研究機構曾組織20名博士,全職工作6個月,才完成1萬張圖像標注。這種高度依賴專業人力的標注模式,在效率和規模上難以滿足AI訓練需求,成為制約AI科研應用的關鍵因素之一。
此外,AI4S領域數據共享存在制約。田永鴻介紹,科研活動長期以課題組或機構為單位開展,數據分散在不同實驗室、機構、個人的電腦中,形成“數據孤島”。數據所有權、知識産權以及科研競爭關係等因素,阻礙了科學數據的開放共享。
例如,生命健康領域的醫療數據因隱私保護限制,科研可用率較低;材料科學領域數據“碎片化和孤島化”現象嚴重,數據規模小,共享機制不完善。
一位長期從事科學數據管理的專家&&:“數據質量直接決定AI模型的可靠性。如果沒有足夠多、足夠好的數據,再先進的算法也是無源之水。”
人類驗證能力成瓶頸。工業和信息化部原副部長王江平在相關論壇發言中&&,“AI一天的預測成果,人類需要十年驗證”的現象在AI4S領域普遍存在,“AI科學發現能力指數級增長,人類的實驗驗證和産業化應用能力仍在線性爬坡,這種巨大的能力鴻溝導致海量AI預測成果如同洪水被堵,淤積在實驗室無法轉化為實際生産力。”
王江平分析,造成“堰塞湖”現象的主要原因一是標準缺失,AI預測結果缺乏統一評估體系;二是驗證瓶頸,自動化實驗能力不足,“預測—驗證”鏈條不暢;三是政策約束,倫理審查嚴、審批周期長,加之投資風險高,抑制了企業投入意願。
田永鴻認為,這一現象屬於長期待解決的難題,有望通過AI計算設計實驗方案,自動化平台執行並反饋結果,形成“設計—執行—驗證”的循環,縮小科研與産業化的鴻溝。
複合型人才短缺。AI4S及更廣泛的人工智能所需的複合型人才短缺,是當前我國科技産業發展面臨的核心挑戰之一。
金融機構高盛在《全球人工智能産業布局》報告中預測,到2030年,中國人工智能産業的人才缺口將超過500萬;麥肯錫報告中提到的數字同樣不容樂觀:到2030年,中國的AI人才供應僅市場需求的1/3。
複合型人才缺口體現在數量上,也在質量上。田永鴻説,傳統人工智能人才培養側重於編程、數學和計算機基礎,而科學智能要求學生不僅掌握AI技術,還須具備紮實的數理基礎與特定學科知識,包括物理、化學、生物等,“這意味着學生需要同時理解科學問題的本質和AI的求解方法,是典型的多學科深度交叉領域”。這種人才標準的升級,加劇了複合型人才的緊缺狀況。
構建科研新生態
AI4S帶來的挑戰,是“游戲規則”變換在撞擊現有體系時産生的結構性張力。
應對這些挑戰,有學者認為,需在現有科研組織方式上,構建面向人工智能時代的新型科研生態。這包括培養既懂AI又懂專業的複合型人才,推動數據開放共享以破解“數據孤島”,並建立適應人機協同的科研評價與倫理治理體系。
構建複合型人才培養體系。轉變傳統的“專門人才”培養模式,積極構建面向AI4S的複合型人才培養體系。一方面重視培養具備深厚AI技術理論基礎和實踐應用能力的專業人才;另一方面完善交叉學科人才培養體系,促進科研人員跨學科學習。
北京大學深圳研究生院聚焦AI4S人才短板,設立科學智能學院,推行“雙導師制”。
田永鴻介紹,“雙導師制”是由一位科學導師與一位AI導師共同指導學生,科學導師負責把握重要科學問題方向,AI導師則設計技術路線。雙導師從一開始即共擔責任,解決合作意願與知識産權分配問題。同時,學院設立專門的交叉學科學位評定分會,從制度上保障跨學科論文的評審質量,使學生歸屬清晰、評價有據。
“這一模式將交叉人才培養從過去的零散合作轉變為系統化、制度化的體系,為複合型創新人才的成長提供了堅實基礎。”田永鴻説。
陳顯堯認為,人才培養的關鍵,在於引導學生從傳統的理論思維範式,轉向並掌握一種與AI相結合的思維方式,“我們正處在實踐的初級階段,有效的方法是讓學生從解決具體科學問題入手,在實踐中親眼見證這種新方法的可行性,從而逐步建立新的科研思維路徑。”
平台建設向平台模式轉變。傳統的個體科學家或單一研究團隊開展科學研究的“作坊模式”已不能適應AI4S的研究方式,“平台模式”能夠整合來自不同領域的多元主體,形成研究網絡。培育AI4S創新聯合體,促進數學、計算機科學、建模仿真與各學科的協作,是打造世界領先創新集群的關鍵。
國內高校和研究機構已布局多家AI4S研發平台。如,中國科學院建立ScienceOne基於科學基礎大模型的智能科研平台;北京科學智能研究院研發的“玻爾科研空間站”AI科研平台集成“讀文獻—做計算—做實驗—多學科協同”等功能等。
但AI4S領域的共性技術平台建設仍側重於基礎支撐層,成果仍以個別研發案例為主,缺少針對半導體、新能源、新材料等細分場景下單一類別的專業支撐平台。
對此,受訪者建議,應面向重點應用領域,構建一批AI4S共性技術研發平台,依託雲廠商,以及醫藥健康、新材料、工業等重點領域優勢企業,協同高校院所、科研機構和創新企業組建各領域創新聯合體,探索通過成立合資公司、共建乾濕閉環實驗室、搭建高能級創新平台等,加速科技工程創新突破。
推動科研數據共享。田永鴻認為,數據共享是釋放AI4S潛力的基礎,須加快打破“數據孤島”,推動科研數據的有效整合與開放共享。
受訪者建議,加速推進AI4S關鍵領域“科研數據可信空間”建設,促進醫藥健康、新材料、工業等領域的高質量科學數據和合成數據資源的集中,加強科學數據的標準化建設,創新數據資源共享的技術和制度,引導數據的可信流通和交易。
田永鴻建議加強數據、工具、人才、模型四要素的協同進化——數據需要標準化工具加工,通過人才訓練模型,模型再反哺數據更新。“未來,我們希望能集研發數據採集、模型訓練、科學發現與實驗驗證閉環融合,成為全流程智能化實驗設施與設備,打造覆蓋主要研究機構、科學設施和實驗室的數智雲化協同科學研究平台網,讓科學家遠程調用資源,最大化發揮數據價值。”田永鴻説。
推動科學倫理治理。在倫理治理方面,需要從科學共同體自治走向社會共治。AI4S帶來算法不透明性、算法歧視、數據隱私問題以及結果的不可解釋性等倫理挑戰。需強化AI4S的科技倫理治理研究,加強科技倫理宣傳與教育,建立健全AI4S的社會共治體系和機制。
受訪者&&,當前階段,AI的主要作用是加速科學發現,其優勢是在現有範式下進行高效預測與計算。但真正顛覆性的科研突破,仍依賴人類獨有的科學直覺、對複雜事實的深刻辨析,以及融入了情境與文化背景的宏觀判斷。
在積極利用AI提升知識積累效率的同時,我們需審慎思考,如何確保科學成果的質量與深度不被速度稀釋,並將最終的解釋權、決策權等“認知主動權”牢牢掌握在人類自己手中。□