AI for Science:科學研究新范式
4月18日,一名男子在德國漢諾威工業博覽會上與一款智能機器人握手
當前,AI for Science已成為全球人工智慧發展的新前沿,加速了科學研究的范式變革,帶來科研模式的重構和新一輪科技革命。
文/《環球》雜志記者 張漫子
編輯/黃紅華
隨著數字化時代的到來,科技創新轉化為直接生産力的速度越來越快。站在科學的分水嶺上,人工智慧(AI)若想發展為更加通用的“智慧”,則無法繞開“科學”這一命題,用AI學習科學原理,解決科學問題成為必經之路。
為貫徹落實《新一代人工智慧發展規劃》,科技部會同自然科學基金委近期聯合啟動了“人工智慧驅動的科學研究”(AI for Science)專項部署工作。圍繞基礎學科關鍵問題和重點領域科研需求布局“人工智慧驅動的科學研究”前沿科技研發體係。
當前,AI for Science已成為全球人工智慧發展的新前沿,加速了科學研究的范式變革,帶來科研模式的重構和新一輪科技革命。
AI的下一個主戰場
既有的科學研究存在兩種基本范式,分別是基于大量數據歸納的開普勒范式和基于物理建模演繹的牛頓范式。但隨著維數的增加,計數量呈現指數增長的趨勢,一方面,數據驅動的辦法面臨著缺乏數據及數據分析工具的困境,另一方面,從模型驅動角度看,解決實際問題的過程總是陷入精度和速度難以兩全的矛盾。中國科學院院士鄂維南認為,“無論從數據驅動的角度,還是從模型驅動的角度,人工智慧都有巨大的發展空間。”
近年來,以機器學習,尤其是深度網絡神經為代表的AI技術發展提供了破局的新思路。對于大量復雜的高維函數而言,作為特殊函數的深度神經網絡可以進行有效擬合逼近,不僅提供了行之有效的數據分析方法,也能對海量數據的高效模擬實現尺度和精度的平衡。
2018年,鄂維南在全球首次提出“AI for Science”概念,強調利用AI學習科學原理、創造科學模型來解決實際問題,使之成為科學研究的新范式。中國科學技術大學教授胡素磊認為,AI在科學研究中的應用主要包括計算、設計和理論突破這三大步。
目前,AI for Science已得到國內外學界和業界的普遍認可,2020年初,美國能源部發布《AI for Science報告》以促進人工智慧在科學上的應用,涵蓋高能物理和材料科學到計算技術等領域;2022年7月,微軟研究院在全球成立AI for Science研究院——微軟研究院科學智能中心。
AI for Science結合機器學習擬合高維函數的強大能力,推動科學研究從單打獨鬥的“小農作坊”模式走向“安卓模式”的平臺科研,直面産業需求,通過規模化和去中心化的測試加速科研和産業的對接,大大提升科研效率和生産力。“要實現安卓模式,需要把科學計算流程抽象化和標準化。”鄂維南説,大家共同建設大平臺,共用基本的模型、演算法、數據庫和知識庫等基礎設施,在此基礎上開發各自團隊感興趣的應用,通過“滾雪球效應”加速科研創新和成果應用。
AI for Science極大地拓展了科學和人工智慧的邊界,將成為AI的下一個主戰場,其快速發展離不開“數據-模型-演算法-算力-人才”的共同進步。在中國工程院院士、中科院計算所研究員孫凝暉看來,盡管我們過去已經做了大量研究,但不同板塊間的資訊流還沒有全部打通,引入人工智慧的方法最關鍵是要打通人、機、物之間的資訊流,“通過這三者的高速迭代,拓展原本科學研究的邊界,求解更復雜的問題。”
AI真正落地的重要途徑
“AI for Science涉及的應用場景,包括工業制造、材料、藥物等都是實體經濟不可或缺的,所以它是AI真正落地的一個重要途徑。”鄂維南説。
作為一種長度單位,一奈米只有一米的十億分之一(一根頭髮絲的直徑約等于六萬奈米),令人震驚的是,正是如此小到“令人咋舌”的奈米卻能釋放出巨大的能量。世界奈米能源研究領域奠基人、中科院外籍院士王中林團隊發明的摩擦奈米發電機,可以收集環境中低頻次、低振幅的微小的震動機械,比如人體的心跳、呼吸,空氣、水乃至血液的流動等,並將其轉化為電能提供給奈米器件。摩擦奈米發電機還可以加以應用,作為無需外部電源的自驅動感測器,而且其對接觸物體的材料沒有要求,只要人有微小的動作,就能産生並傳遞電信號,進而影響控制一係列相關操作。王中林舉了個例子,在醫療方面,將傳感裝置放在脖子、指尖或手腕的任何位置,利用纖維之間的觸動來監測身體狀況,不僅能監測脈搏的跳動,也能通過脈搏提取更多生理參數,分析有沒有高血壓等潛在隱患,從而對人體進行係統性監測。
在大數據時代,語言、動作、形態等都是非常重要的數據,王中林説,“自驅動就是收集數據,這些數據是AI時代分析一切的根據,相信自驅動係統在物聯網時代能有重要應用。”
清華大學化工係教授張強以高比能電池研究為例,闡釋能源化學與數據科學融合發展的新進展。在能源行業,國家碳中和目標的提出對儲能技術提出了更高要求。傳統的鋰離子電池儲能技術雖仍佔據主導,但其能量密度難以滿足社會高速發展對能源的需求,電解液作為鋰離子電池中離子傳輸的載體發揮著關鍵作用。張強表示,人工智慧技術能夠加速先進電解液的設計開發與實踐,傳統的實驗員一次往往只能做一個實驗,但現在通過多次高通量的實驗可以使幾十乃至上百個實驗通過一個樣品實現。另外,傳統的電解液溶劑開發效率不高,在張強團隊建立了機器學習的模型後,通過訓練機器學習模型來預測溶劑分子和相應電解液性質,並在實驗中驗證反饋機器學習模型的結果,不僅對電解的屬性有了深入理解,也能利用模型預測電解液性質,為選擇合適的電解液提供有效方法。
“數據科學會帶來新的研究范式,對于構築高效的儲能器件,實現碳達峰碳中和的宏偉目標提供了一個重要的助力手段。”張強説,“機器學習方法能幫助知識發現,在碳中和的時代使命中,能源化學和數據科學逐漸融合在一起,實驗、理論和數據正在成為能源化學研究的三駕馬車。”
在國外,人工智慧在賦能化學、生命科學等領域也取得較大進展。近期,瑞士洛桑聯邦理工學院和英國羅切斯特大學的研究人員設計出由大語言模型驅動的化學引擎ChemCrow,能夠簡化有機合成、藥物發現和材料設計等化學任務的推理過程,且經測試其給出的事實資訊準確有效。
此外在2022年英國《自然》雜志(Nature)的一篇論文中,谷歌旗下的AI公司DeepMind發布的AlphaTensor人工智慧係統,能顯著提高矩陣乘法的運算效率,解決了數學領域一個已困擾多年的問題;在2021年美國《科學》雜志公布的十大年度科學突破中,預測蛋白質結構的AI模型Alpha Fold位列其中,研究人員可以使用人工智慧模型來設計應用于疫苗、建築材料或奈米機器上的全新蛋白質,能基本預測此前人類尚未被解析的蛋白質組結構,中國科學院院士施一公認為,“這是人工智慧對科學領域最大的一次貢獻,也是人類在21世紀取得的最重要的科學突破之一。”
認識發展路徑螺旋式上升的規律
任何一場曠日持久的科技革命都並非一蹴而就,而是遵循著一條曲折前進、螺旋上升的發展路徑。近年來,隨著人工智慧的快速發展,AI for Science也逐漸從星星之火發展成燎原之勢。但在鄂維南院士看來,“我們還有很多事情要做。”在科研層面,一方面要持續加大投入,中國科學技術大學教授胡素磊認為,對于構效關係復雜的材料體係,只要投入足夠多的研究人員和科研資源,AI計算模型也能實現突破,也要破除“失敗實驗不報道”的局限,無論成功與否都要對實驗進行記錄,在錯誤中尋找潛在的新機會。另一方面,必須面向産業定義真實的問題。AI for Science不僅是開發科學研究的平臺和工具,也要探索在産業界的垂直落地,總結問題並提出解決方案。在藥物研發、基因研究、生物育種、新材料研發等人工智慧與科學研究緊密結合的重點領域取得係列突破,包括改變工業研發模式,如利用高精度模擬實現材料定向設計;突破研發瓶頸,在生物醫藥領域探索難成藥靶標的藥物發現;等等。
在工具層面,勇于革新。鄂維南認為,DeepModeling開源平臺、物理模型都可以視作工具層面,部分人認為AI for Science只是一個由數據驅動的范式,非常有局限性。盡管基本原理層面的革新更具本質性,但“怎麼使用這些基本原理真正幫助我們解決實際問題”也不容忽視。深勢科技創始人兼首席科學家張林峰表示,“開源是軟件的一種去中心化的分布式的評審方式。”一個軟件如何作為基礎設施應用于各行各業,讓更多的人使用,倒逼開發者對開源方案進行調整升級,進而在協同開發的方式下推動“技術的迭代、場景的試錯、人才體係的建設和整個生態的打造”。
在創新層面,調整優化科研資源配置,把期望真正寄托在年輕人身上,為其打造成長發展的平臺,鼓勵更多科研工作者為了初心去奮鬥,在原始創新的道路上躬耕不綴。
在文化層面,培育創新文化。鄂維南説,“一個事情沒火之前沒有人關注,不聞不問,一旦火了很多人都衝過去了,這個現象很普遍。”人們科研的精力和注意力是有限的,發展人工智慧,需要用挑戰性的場景和問題推動底層係統性創新,而不是盲目跟風炒熱點,重復造輪子,“需要開始樹立‘既然別人做了,我就不再去做’的思維模式,培育‘不扎堆、不聚集’的創新文化。”
站在科技革命的時代轉角,AI for Science呼喚各行各業的人們打破壁壘,凝聚共識,擁抱人工智慧時代的新變化和新機遇。“盡管范式這個詞在國內常被庸俗化,但AI for Science毋庸置疑是科學研究的一個新范式。”鄂維南説,面向未來,AI for Science還有巨大的想像空間待開發,幫助我們加快走完從科學研究到産業創新的“最後一公里”。
來源:2023年5月3日出版的《環球》雜志 第9期
《環球》雜志授權使用,如需轉載,請與本刊聯繫。
更多內容敬請關注《環球》雜志官方微博、微信:“環球雜志”。