眾所周知,整個宇宙充滿著無數分子。
這些分子中又有多少具有潛在的類似藥物的特性,可用於開發挽救生命的藥物呢?是百萬級?還是十億級?又或是萬億級?
答案是:10的60次方。
如此龐大的數字,大大延緩了新藥的研發進度,像新冠等快速傳播的疾病,目前遲遲未有特效藥,也是因為分子種類和數量太大,遠遠超出了現有藥物設計模型可以計算的範圍。
MIT的一個研究團隊偏不信這個邪。不算是吧,那把之前的模型加加速總可以吧?
這一加速,就是1200倍。
他們研究了一款名為「EquiBind」的幾何深度學習模型,該模型比之前最快的計算分子對接模型「QuickVina2-W」快了1200倍, 成功地將類藥物分子與蛋白質結合,減少了藥物試驗失敗的機會和成本。
研究論文即將發表在ICML 2022。
「EquiBind」是基於前身「EquiDock」研發的,「EquiDock」使用了已故的麻省理工學院AI研究員Octavian-Eugen Ganea開發的技術,去結合兩種蛋白質。 Ganea也是「EquiBind」論文的合著者。
在藥物開發開始之前,研究人員必須找到有前途的藥物樣分子,這些分子可以在藥物發現的過程中正確地結合或「停靠」在特定的蛋白質標靶上。
在與蛋白質成功對接後,結合藥物(配體),可以阻止蛋白質發揮作用。如果這種情況發生在細菌的一種基本蛋白質上,它可以殺死細菌,從而保護人體。
然而,不論是從經濟角度分析,還是從計算角度分析,藥物發現的過程都可能是昂貴的,研發過程動輒耗資數十億美元,並且在FDA最終批准之前,會進行超過十年的開發和測試。
更重要的是,90%的藥物在人體試驗後因為沒有效果或副作用過多而失敗。
所以製藥公司收回這些成本的方法之一就是,提高最終成功研發藥物的價格。
目前,尋找有希望的候選藥物分子的計算過程是這樣的:大多數最先進的計算模型依賴大量的候選樣本,再加上評分、排名和微調等方法,以獲得配體和蛋白質之間的最佳「匹配」。
Hannes Stärk是MIT電子工程與電腦科學系的一年級研究生,也是這篇論文的主要作者,他把典型的「配體-蛋白質」結合方法比喻為「試圖把鑰匙放進有很多鑰匙孔的鎖中」。
典型的模型在選擇最佳模型之前會花費時間對每個「適合度」進行評分。相較之下,「EquiBind」無需事先了解蛋白質的目標口袋,只需一步就能直接預測出精確的關鍵位置,稱為「盲對接」。
與大多數需要多次嘗試才能找到配體在蛋白質中的有利位置的模型不同,「EquiBind」已經具有內建的幾何推理功能,可幫助模型學習分子的潛在物理特性,並成功地進行歸納。以便在遇到新的或無法識別的資料時成功泛化,以做出更好的預測。
這些發現的發布迅速引起了業內專業人士的注意,其中包括Relay Therapeutics首席數據官Pat Walters。
Walters建議,研究小組可以在一種現有的用於肺癌、白血病和胃腸道腫瘤的藥物和蛋白質上去嘗試他們的模型。儘管大多數傳統的對接方法都未能成功地結合這些蛋白質上的配體,但「EquiBind」成功了。
Walters說:「EquiBind為對接問題提供了一種獨特的解決方案,它結合了姿態預測和結合位點識別。」
「並且這種方法利用了來自數千個公開的晶體結構的訊息,有可能會以新的方式影響該領域。」
Stärk表示:「當其他所有方法都完全錯誤或僅有一個正確時,我們很驚訝,因為EquiBind能夠把它放進正確的口袋,看到這個結果,我們是十分激動的!」
儘管「EquiBind」已經收到了大量的來自業內專業人士的回饋,而這些回饋幫助了團隊考慮計算模型的實際用途,但Stärk仍希望在7月即將舉行的ICML上找到不同的觀點。
Stärk表示:「我最期待的回饋是關於如何進一步改進該模型的建議。」
「我想和這些研究人員討論,告訴他們我認為下一步可以怎麼做,並鼓勵他們繼續前進,將模型用於他們自己的論文和方法中。目前已經有很多研究人員聯繫了我們,詢問我們這個模型是否會對他們的問題有用。」
此外,這篇文章同樣也是為了紀念Octavian-Eugen Gane,他為幾何機器學習研究做出了至關重要的貢獻,並慷慨地指導了許多學生,他是個有著謙遜靈魂的傑出學者。
今年上半年,他在一次健行中永遠離開了我們。
以上是提速1200倍! MIT開發新一代藥物研發AI,吊打舊模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!