北大&望石智慧提出全新模型:彌合化學反應預訓練與條件分子生成之間的鴻溝!
化學反應是藥物設計和有機化學研究的基礎。研究界越來越需要一種能夠有效捕捉化學反應基本規則的大規模深度學習框架。
近日,來自北京大學和望石智慧的研究團隊提出了一種新方法來彌合基於反應的分子預訓練和生成任務之間的差距。
受到有機化學機制的啟發,研究人員開發了一種新的預訓練框架,使其能夠將歸納偏差納入模型中。這個提出的框架在執行具有挑戰性的下游任務時取得了最先進的結果。透過掌握化學知識,該框架克服了目前依賴少量反應模板的分子生成模型的局限性。在大量的實驗中,該模型產生了高品質的可合成藥物樣結構
總的來說,該研究向各種基於反應的應用程式的大規模深度學習框架邁出了重要一步。
研究以《Bridging the gap between chemical reaction pretraining and conditional molecule generation with a unified model》為題,於2023 年12 月5 日發佈在《Nature Machine Intelligence》上。
論文連結:https://www.nature.com/articles/s42256-023-00764-9
深度學習模型已經在許多科學研究領域中廣泛應用。預訓練框架對於新任務的無縫整合起到了積極作用,可以加快建模過程,特別是在標記資料有限的情況下
藥物設計和有機化學研究的基礎是化學反應。目前,資料探勘的研究和應用已經使得深度學習模型可以用於化學反應。基於這些數據,已經有許多數據驅動的研究深入研究化學反應的表徵學習
表徵學習是指從數據中自動學習有用的特徵,然後將其用於各種下游任務。現有方法忽略了有機化學的基本理論,限制了其性能。
基於化學反應的分子生成
除了反應分類任務外,基於化學反應的分子生成也是一個重要的應用。在早期的研究中,通常採用基於模板的逐步分子生成策略
這些基於模板的方法在很大程度上依賴預定義的構建模組和反應,這縮小了可訪問的化學空間。在反應產物預測領域也發現了類似的趨勢,其中基於模板的方法不能外推到複雜的反應;這個問題可以透過使用無模板方法來解決。
在基於反應的分子生成任務中,無模板方法也表現出了優於基於模板方法的泛化優勢。然而,現有的無模板分子生成方法只能基於預先定義的反應物庫來產生分子。除此之外,對於藥物設計中的先導化合物或先導化合物優化階段,利用化學反應作為編輯工具來修改給定的結構是更有利的。產生的化學庫將重點放在可以用更少的反應步驟合成的化學空間的子集。
一個新、全面的化學反應深度學習框架
在此,研究人員提出了一個新的、全面的化學反應深度學習框架,稱為Uni -RXN。旨在解決兩個基本任務:自監督表徵學習和條件生成建模。
展示:Uni-RXN的組成與方法。 (引自:論文)
與現有方法不同,研究人員提出了一套專門針對化學反應精心設計的自監督任務。這些任務包括反應中心預測、主反應物與子反應物配對、反應物-產物配對。在對具有挑戰性的反應任務的廣泛評估中,Uni-RXN 方法超越了最先進的水平,證明了其有效捕捉化學反應領域知識的能力。所獲得的有希望的結果為廣泛的下游應用鋪平了道路
#透過有效捕捉化學規則,Uni-RXN 非常適合生成任務。與依賴從預定義反應物庫中選擇片段的傳統方法不同,Uni-RXN 將分子結構作為輸入條件並產生相應反應物的表示,同時保持反應內的排列不變性。利用密集向量相似性搜尋包的強大功能,Uni-RXN 能夠從大型反應物和試劑庫中高效檢索反應物。隨後,採用反應預測模型來產生產物輸出。
與僅探索化學空間的有限子集的基於模板的方法相比,Uni-RXN 在產生更廣泛的可合成藥物樣結構方面表現出卓越的性能。這項特點使其特別適合虛擬 library 枚舉,並得到全面統計分析和案例研究的支持。
Uni-RXN 方法有許多優勢,可以為具有挑戰性的化學反應分類任務產生豐富的表達。相對於其他基準模型,Uni-RXN 在每個類別僅提供4 個數據點的情況下,準確率達到了58.7%
重寫後的內容:化學反應分類的準確度見表1。 (資料來源:論文)
Transformer 模型可以用來區分最佳化和未最佳化的化學反應資料。此外,編碼器也可以輕鬆應用於結構條件的生成
#需要重新改寫的內容是:圖表展示了Uni-RXN的檢索效能和注意力權重。 (資料來源:論文)
研究結果強調了所提出的模型所產生的分子具有有利的特性,這使得它們非常適合於藥物發現任務。此模型可以產生更多具有類似藥物特性和可合成性的分子
#圖示:Uni-RXNGen 流程與效能。 (資料來源:論文)
與分子對接等虛擬篩選方法結合,此生成模型可以實現高效的構效關係研究。此模型產生的巨大的可合成類藥物化學空間可以提高藥物再利用或命中分子搜尋的真陽性率。
以上是北大&望石智慧提出全新模型:彌合化學反應預訓練與條件分子生成之間的鴻溝!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

想像一下,一個人工智慧模型,不僅擁有超越傳統運算的能力,還能以更低的成本實現更有效率的效能。這不是科幻,DeepSeek-V2[1],全球最強開源MoE模型來了。 DeepSeek-V2是一個強大的專家混合(MoE)語言模型,具有訓練經濟、推理高效的特點。它由236B個參數組成,其中21B個參數用於啟動每個標記。與DeepSeek67B相比,DeepSeek-V2效能更強,同時節省了42.5%的訓練成本,減少了93.3%的KV緩存,最大生成吞吐量提高到5.76倍。 DeepSeek是一家探索通用人工智

AI,的確正在改變數學。最近,一直十分關注這個議題的陶哲軒,轉發了最近一期的《美國數學學會通報》(BulletinoftheAmericanMathematicalSociety)。圍繞著「機器會改變數學嗎?」這個話題,許多數學家發表了自己的觀點,全程火花四射,內容硬核,精彩紛呈。作者陣容強大,包括菲爾茲獎得主AkshayVenkatesh、華裔數學家鄭樂雋、紐大電腦科學家ErnestDavis等多位業界知名學者。 AI的世界已經發生了天翻地覆的變化,要知道,其中許多文章是在一年前提交的,而在這一

波士頓動力Atlas,正式進入電動機器人時代!昨天,液壓Atlas剛「含淚」退出歷史舞台,今天波士頓動力就宣布:電動Atlas上崗。看來,在商用人形機器人領域,波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後,短短十幾小時內,就已經有一百多萬觀看。舊人離去,新角色登場,這是歷史的必然。毫無疑問,今年是人形機器人的爆發年。網友銳評:機器人的進步,讓今年看起來像人類的開幕式動作、自由度遠超人類,但這真不是恐怖片?影片一開始,Atlas平靜地躺在地上,看起來應該是仰面朝天。接下來,讓人驚掉下巴

本月初,來自MIT等機構的研究者提出了一種非常有潛力的MLP替代方法—KAN。 KAN在準確性和可解釋性方面表現優於MLP。而且它能以非常少的參數量勝過以更大參數量運行的MLP。例如,作者表示,他們用KAN以更小的網路和更高的自動化程度重現了DeepMind的結果。具體來說,DeepMind的MLP有大約300,000個參數,而KAN只有約200個參數。 KAN與MLP一樣具有強大的數學基礎,MLP基於通用逼近定理,而KAN基於Kolmogorov-Arnold表示定理。如下圖所示,KAN在邊上具

谷歌力推的JAX在最近的基準測試中表現已經超過Pytorch和TensorFlow,7項指標排名第一。而且測試並不是JAX性能表現最好的TPU上完成的。雖然現在在開發者中,Pytorch依然比Tensorflow更受歡迎。但未來,也許有更多的大型模型會基於JAX平台進行訓練和運行。模型最近,Keras團隊為三個後端(TensorFlow、JAX、PyTorch)與原生PyTorch實作以及搭配TensorFlow的Keras2進行了基準測試。首先,他們為生成式和非生成式人工智慧任務選擇了一組主流

今天我想分享一個最新的研究工作,這項研究來自康乃狄克大學,提出了一種將時間序列資料與自然語言處理(NLP)大模型在隱空間上對齊的方法,以提高時間序列預測的效果。此方法的關鍵在於利用隱空間提示(prompt)來增強時間序列預測的準確性。論文標題:S2IP-LLM:SemanticSpaceInformedPromptLearningwithLLMforTimeSeriesForecasting下載網址:https://arxiv.org/pdf/2403.05798v1.pdf1、問題背景大模型

特斯拉機器人Optimus最新影片出爐,已經可以在工廠裡打工了。正常速度下,它分揀電池(特斯拉的4680電池)是這樣的:官方還放出了20倍速下的樣子——在小小的「工位」上,揀啊揀啊揀:這次放出的影片亮點之一在於Optimus在廠子裡完成這項工作,是完全自主的,全程沒有人為的干預。而且在Optimus的視角之下,它還可以把放歪了的電池重新撿起來放置,主打一個自動糾錯:對於Optimus的手,英偉達科學家JimFan給出了高度的評價:Optimus的手是全球五指機器人裡最靈巧的之一。它的手不僅有觸覺

目標偵測在自動駕駛系統當中是一個比較成熟的問題,其中行人偵測是最早得以部署演算法之一。在多數論文當中已經進行了非常全面的研究。然而,利用魚眼相機進行環視的距離感知相對來說研究較少。由於徑向畸變大,標準的邊界框表示在魚眼相機當中很難實施。為了緩解上述描述,我們探索了擴展邊界框、橢圓、通用多邊形設計為極座標/角度表示,並定義一個實例分割mIOU度量來分析這些表示。所提出的具有多邊形形狀的模型fisheyeDetNet優於其他模型,並同時在用於自動駕駛的Valeo魚眼相機資料集上實現了49.5%的mAP
