科技自立自強之專家説|許錦波:望向生物産業下一站-新華網
新華網 > > 正文
2024 06/13 08:52:45
來源:新華網

科技自立自強之專家説|許錦波:望向生物産業下一站

字體:

新華網北京6月13日電 題:科技自立自強之專家説|許錦波:望向生物産業下一站

記者 陳聽雨

藍鯨體型龐大,蚍蜉朝生暮死。地球上的生物複雜多樣,差異巨大,但從本質上説,都以碳元素為有機物質基礎。碳基構成了基本的蛋白質、核酸、嘌呤、嘧啶,其中,蛋白質是一切生命活動的物質基礎。

“蛋白質的結構決定功能。DNA儲存着我們的遺傳信息,然而在細胞中真正執行功能的是蛋白質。”計算生物學家、分子之心創始人兼首席科學家許錦波教授在接受新華網專訪時&&,“準確測定蛋白質三維結構對理解蛋白質的功能非常重要。當前,AI技術已經顛覆了蛋白質結構預測,但這只是一個開始,下一個爆發點將是AI蛋白質設計。AI蛋白質優化與設計上的突破,有望引發未來生物産業的顛覆性突破、乃至生物經濟的重構。”   

圖為計算生物學家、分子之心創始人兼首席科學家許錦波教授。 新華網 朱家齊 攝

蛋白質折疊:現代分子生物學“皇冠上的明珠”

在人體中,蛋白質就像一台精心組裝的機器,它的零件是人體內的20余種氨基酸。氨基酸分子遵照我們生命的密碼——基因序列中蘊含的遺傳信息指令,像珠子一樣有序綴連起來,形成多肽鏈,構成蛋白質的一級結構。氨基酸分子連接成多肽鏈後,蛋白質分子的建造還未結束,還需要進一步折疊成三維結構才能發揮功能。可是基因序列只決定氨基酸序列的合成,並不包含更多信息指導它如何折疊成獨特的三維結構。

氨基酸序列折疊方式的秘密蘊含在自身之中,它們自設計自己如何折疊。一維多肽鏈中的氨基酸分子好似懂得互相溝通一樣,它們有些相互排斥,有些彼此吸引,形成螺旋、折疊成褶皺,構成蛋白質的二級結構。接着進一步折疊成獨特的空間結構,像一根毛線繞成線團那樣,構成蛋白質的三級結構。

整個蛋白質折疊的過程看似隨機,卻又仿佛遵循着一張設計藍圖,一旦組成蛋白質的氨基酸序列確定下來,它的折疊方式也就完全確定了。

“蛋白質在生物體中能發揮多種多樣的功能,很大程度上取決於它們的三維結構,‘看清’它們的結構對理解其功能至關重要。但想要破解這種結構需要花很長的時間,有些甚至難以完成。”許錦波説。

在過去幾十年中,科學家通過晶體衍射、核磁共振、冷凍電鏡等實驗技術來測定蛋白質中所有原子的三維坐標。但這些方式耗時長、花費高、成功率低,導致蛋白質結構預測始終是生物科學領域懸而未決的難題之一,因此被稱作現代分子生物學“皇冠上的明珠”。

目前地球上已知的蛋白質約有兩億種,每一種蛋白質都有獨特的空間結構。自然界經過漫長的生命進化過程,蛋白質分子在瞬息間就能自發完成整個折疊過程。但科學家若想通過計算氨基酸分子間的相互作用來預測其折疊方式,則要窮盡所有可能的蛋白質構型,需要的時間將超過整個宇宙的年齡。

AI顛覆蛋白質結構預測:這只是一個開始

“現在通過使用AI技術,可以在很短的時間內精確算出蛋白質的三維構象。”許錦波説。

在生物計算領域深耕20餘年,許錦波一直致力於用計算機算法、尤其是人工智能算法及大數據技術解決蛋白質結構預測、優化、設計等問題,將AI蛋白質技術推向産業應用。

2016年,許錦波發明的RaptorX-Contact方法,全球首次證明AI可以大幅提升蛋白質結構預測精度,在蛋白質結構預測這一領域取得了實質性的進展。

在許錦波看來,AI特別適合用來解決生命科學中的問題。“經過幾十年的發展,生命科學領域發明了很多非常好的實驗技術,特別是一些高通量技術可以大規模、高效地産生海量的、多模態、多維度、複雜的實驗數據,比如基因測序。而從數據中提取規律,找到模式,是AI的專長,AI剛好可以用來處理這些數據。”他説。

許錦波介紹,通過AI預測蛋白質結構,極大提升了人們對蛋白質的認知,理解蛋白質如何行使其生物功能,認識蛋白質與非蛋白質之間的相互作用,進而讓人們更好地理解生命的分子過程,這對生物學、醫學和藥學等領域具有重要影響。

他舉例稱,比如通過AI蛋白質結構預測,可以更快速地找到準確的蛋白質靶點,幫助藥物研發人員設計更加有效的藥物分子。

“計算與生物學的結合,最成功的案例就是AI蛋白質結構預測,這是目前為止,AI對生物學、乃至對整個科學界最大的貢獻。但這只是剛剛開始,還遠未到結束的時候。”許錦波説。

許錦波認為,AI蛋白質結構預測不可忽視的價值,更在於對蛋白質設計的推動和驗證。運用AI,我們可以根據特定的功能需求設計自然界不存在的蛋白質或改造已有的蛋白質。“下一個爆發點將是AI蛋白質設計,這是實現對蛋白質有效利用的必由之路,將為藥物研發、新材料、環境保護、綠色農業、食品等領域帶來革命性的變化,有可能引發生物産業的顛覆性突破,乃至生物經濟的重構。”

AI蛋白質設計:更具價值的顛覆性技術

許錦波從2019年就開始使用預訓練機制研發蛋白質設計算法,並取得了很好的成果。2021年9月,許錦波回國創業。2022年1月,他創立了分子之心(MoleculeMind)。

隨着ChatGPT引爆生成式AI與大語言模型的浪潮,大模型在生物醫藥、生物製造等垂直産業領域的應用,逐步引發關注。

在許錦波看來,AI可以很好地處理自然語言,類似的方法也可以用來處理蛋白質的氨基酸序列,構成蛋白質的系列大模型。

“一個蛋白質是非常大的分子,但蛋白質也是由幾十個、幾百個甚至上千個氨基酸通過化學鍵串聯在一起的。我們可以把每個氨基酸理解為一個詞,把一個蛋白質的分子式理解成一個句子,這個句子裏面可能只有20個詞,通過不同的排列順序重復使用這些詞構成,這樣蛋白質的氨基酸序列就和自然語言有了一定的相似度。”許錦波説。

但是,蛋白質又遠比自然語言要複雜。一方面我們可以用自然語言去處理蛋白質序列;另外一方面,又要考慮蛋白質本身結構特別複雜的特殊性,他説。

分子之心在AI蛋白質預測、優化與設計等關鍵技術領域,擁有十余項全球領先的AI算法,並基於此研發了AI蛋白質優化和設計&&MoleculeOS,填補了世界範圍內沒有功能完整AI蛋白質設計與優化&&的空白。

許錦波介紹,目前,MoleculeOS已應用於産業中,面向藥物設計、生物製造等領域的需求,進行多肽、抗體、酶和小蛋白的研究和設計,“用生成而非發現的方法設計出具有特定功能的蛋白質産品,變革藥物設計和合成生物學産業模式,開啟可編程藥物、可編程生物製品定向進化新時代。”

與此同時,分子之心還在研發集成序列、結構、功能和進化的産業級AI蛋白質生成大模型NewOrigin(達爾文)。NewOrigin大模型擁有百億級參數,學習了海量高度專業、多樣的蛋白質大數據,綜合運用最新的AI技術,優化算法和物理學方法,可根據結構和功能需求直接生成具有特定功能的蛋白質,滿足ChatGPT等通用大模型難以企及的蛋白質生成需求。

“相較於傳統的生物實驗方法和計算方法,大模型可以大幅度降低濕實驗測試的費用和時間。通過使用AI技術,可以創造出一些自然界不存在的、或者很難找到的蛋白質,這些蛋白質真正具有我們所需要的功能,可以對藥物設計、生物育種、環境保護、高性能材料等領域帶來巨大影響。”許錦波説。

比如,在創新藥研發領域,AI蛋白設計正在推動大分子創新藥研發範式變革,將傳統的篩選“試錯”模式變成可預測、可編程,從而提升研發效率和成功率,降低成本。AI不僅可以發現全新靶點,還可以設計合成全新的藥物分子,從而設計更好的藥物。

在合成生物學領域,AI蛋白質優化與設計技術賦能合成生物學,可設計更高效的催化酶,生成創新蛋白質材料、易降解且能循環使用的環保材料、對人類無毒無殘留的綠色農藥、更營養安全美味的蛋白質食物、更綠色環保高效的化工産品等。

“現在,我把科研事業的主要目標放在産業應用上,希望能運用前沿、創新的AI蛋白質技術,去解決一些以前解決不了的産業問題,從而為生物産業乃至生物經濟帶來更多變革。”許錦波説。

在許錦波看來,做科學研究,有兩個標準。“第一個是從學術的角度來説,做研究要有原始創新,要盡可能地做一些原創的、從0到1的工作。另外就是要從産業的角度去考慮,要學以致用,研發出來的東西是否能解決真實的問題和重要的問題?這是我現在利用AI技術去改變生物産業的主要出發點。”他説。

【糾錯】 【責任編輯:朱家齊】