1月9日,清華大學智能産業研究院(AIR)聯合清華大學生命學院、清華大學化學系在《科學》雜誌發表論文《深度對比學習實現基因組級別藥物虛擬篩選》。該論文研發了一個AI驅動的超高通量藥物虛擬篩選平台DrugCLIP, 篩選速度對比傳統方法實現百萬倍提升,同時在預測準確率上也取得顯著突破。依託該平台,團隊打通了從AlphaFold結構預測到藥物發現的關鍵通道,首次完成了覆蓋人類基因組規模的藥物虛擬篩選,為後AlphaFold時代的創新藥物發現帶來新可能性。

長期以來,藥物研發面臨“高風險、高投入、低成功率”的難題,在靶點發現與先導化合物篩選階段,受限於傳統工具的計算能力,絕大多數潛在靶點和化合物仍未被充分探索。如何在廣闊的生物與化學空間中精準高效地發現活性化合物,是當前創新藥物研發面臨的核心挑戰。
據了解,為突破虛擬篩選規模瓶頸,DrugCLIP創新性地構建了蛋白口袋與小分子的“向量化結合空間”,將傳統基於物理對接的篩選流程轉化為高效的向量檢索問題。該模型結合對比學習、3D結構預訓練與多模態編碼技術,能在三維結構層面精準建模蛋白-配體間的相互作用。訓練後的高潛力分子將自然聚集於目標蛋白口袋的向量鄰域,能夠有效支撐快速的大規模虛擬篩選。依託這一機制,DrugCLIP在128核CPU+8張GPU的計算節點上,能實現毫秒級打分與萬億級日吞吐能力,篩選100萬個候選分子僅需0.02秒,日處理能力達31萬億次,對比傳統方法實現了百萬倍提升。

基於DrugCLIP的超高速全基因組虛擬篩選
團隊與清華大學閆創業教授團隊合作,在去甲腎上腺素轉運體(NET)的臨床相關靶點上開展了系列生物實驗驗證。團隊使用DrugCLIP模型從160萬個候選分子中篩選出約100個高評分分子,同位素配體轉運實驗檢測顯示,其中15%為有效抑製劑,其中12個分子結合能力優於現有抗抑鬱藥物安非他酮。相關複合物結構已通過冷凍電鏡解析,進一步驗證了DrugCLIP篩選結果的生物學可信度。
值得關注的是,DrugCLIP支持對AlphaFold預測的蛋白結構和apo(無配體)狀態下的蛋白口袋進行篩選,擴大了其在真實藥物發現場景中的適用性。團隊和清華大學劉磊教授團隊合作,針對E3泛素連接酶TRIP12(thyroid hormone receptor interactor 12)進行了虛擬篩選與實驗驗證。過往研究發現,TRIP12是多種腫瘤、帕金森綜合徵的潛在靶點,但是TRIP12缺少已知的小分子配體和複合物結構。團隊使用DrugCLIP模型,從160萬個候選分子中高通量篩選出約50個高評分分子,SPR實驗證實,其中10個分子與TRIP12有結合能力,兩個親和力較高的分子也對TRIP12的泛素連接酶活性有一定的抑制活性。
此外,依託DrugCLIP,團隊首次完成了人類基因組規模的虛擬篩選項目,覆蓋約1萬個蛋白靶點、2萬個結合口袋,分析超過5億個小分子,富集出200萬餘個高潛力活性分子,構建了目前已知最大規模的蛋白-配體篩選數據庫。該數據庫已面向全球科研社區開放,為基礎研究與早期藥物發現提供了強大數據支持。
DrugCLIP平台現已免費開放,用戶無需本地部署,通過網頁上傳蛋白結構即可啟動篩選任務。平台集成口袋/分子編碼、向量檢索、可視化與結果分析等功能,支持多種分子庫調用與自定義上傳,廣泛適用於科研機構與企業用戶。
未來,DrugCLIP將與科研産業生態合作夥伴深度合作,在抗癌、傳染病、罕見病等方向加速新靶點與First-in-class藥物的發現。團隊將持續優化引擎性能、拓展支持模態,助力構建一個更智能、高效與普惠的全球藥物創新生態。




