精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質互作
蛋白質是生命的基石,參與幾乎所有生物過程。了解蛋白質如何相互作用對於解釋細胞功能的複雜性至關重要。
2. 新方法:配對相互作用的蛋白質序列
洛桑聯邦理工學院(EPFL)的 Anne-Florence Bitbol 團隊提出了一種配對相互作用的蛋白質序列的方法。該方法利用了在多個序列比對上訓練的蛋白質語言模型的強大功能。
3. 方法優點
此方法對於小型資料集表現良好,並且可以透過監督方法改進蛋白質複合物的結構預測。
4. 研究成果發表
該研究以「Pairing interacting protein sequences using masked language modeling」為題,於 2024 年 6 月 24 日發佈在《PNASPNAS》。
蛋白質間的相互作用對細胞功能至關重要,它們確保了信號傳導的特定性和多蛋白複合體(如分子馬達或受體)的形成。預測蛋白質-蛋白質相互作用及其複合體結構是計算生物學和生物物理學的重要課題。
儘管 AlphaFold 等深度學習方法在蛋白質單體結構預測上取得重大進展,但對於複合體結構的預測性能仍不如同單體預測,且存在異質性。 AlphaFold 首先建構查詢蛋白序列的同源多序列比對(MSA),而 MSA 的品質對預測準確度極為關鍵。
異源多聚體的配對MSA
對於涉及多種鏈的蛋白質複合體(異源多聚體),配對MSA 能提供交互夥伴間的協同進化信息,有助於推斷鏈間接觸,但建構正確配對的MSA 是一大挑戰;尤其是在真核生物中,因存在眾多同源蛋白且非依賴於基因組鄰近性。
協同進化方法
目前,結合基因組鄰近性、近似同源性、基於系統發生的方法及協同進化策略等手段來應對這一挑戰,其中協同進化方法雖數據需求大,但在優化配對和預測複合體結構方面展現出潛力,特別是透過最大化協同演化訊號來匹配同源蛋白。
DiffPALM:一種可微分配對方法
EPFL 的Anne-Florence Bitbol 團隊開發了一種配對相互作用蛋白質序列的方法,該方法利用了在多序列比對(MSA) 上訓練的蛋白質語言模型的強大功能,例如MSA Transformer 和AlphaFold 的EvoFormer 模組。這使它能夠高度準確地理解和預測蛋白質之間的複雜相互作用。
基於這些,研究人員提出了使用基於對齊的語言模型(DiffPALM)的可微分配對,這是一種使用 MLM 預測同源詞匹配的可微分方法。
DiffPALM 在從普遍存在的原核生物蛋白質資料集中提取的淺層 MSA 的困難基準測試中,它的表現遠勝於現有的協同進化方法。當提供已知的相互作用對作為範例時,DiffPALM 性能會進一步快速提高。
基於協同進化的配對方法,主要研究蛋白質序列在緊密相互作用時如何隨著時間的推移一起進化——一種蛋白質的變化可能導致其相互作用分子的變化。這是分子和細胞生物學中一個極其重要的課題,在 MSA 上訓練的蛋白質語言模型可以很好地捕捉這一點。
之後,團隊將 DiffPALM 應用於真核蛋白質複合物的同源物匹配難題。為此,研究人員將 DiffPALM 配對的序列作為 AFM 的輸入。在測試的複合物中,使用 DiffPALM 在某些情況下可以顯著改善 AFM 的結構預測。它還實現了與使用基於直系同源物的配對相媲美的性能。
The applications of DiffPALM are obvious in the field of basic protein biology, but its applications extend beyond that, as it has the potential to become a powerful tool in medical research and drug development. For example, accurate prediction of protein interactions can help understand disease mechanisms and develop targeted treatments.
Researchers have made DiffPALM freely available and hope that widespread adoption by the scientific community will further advance computational biology and enable researchers to explore the complexity of protein interactions.
DiffPALM combines advanced machine learning techniques with efficient processing of complex biological data, marking a major step forward in computational biology.
It not only enhances scientists’ understanding of protein interactions, but also opens up new avenues of medical research, potentially leading to breakthroughs in disease treatment and drug development.
Paper link:
https://www.pnas.org/doi/10.1073/pnas.2311887121
Related reports:
https://phys.org/news/2024-06-ai-based-approach-protein -interaction.html
以上是精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質互作的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

在現代製造業中,精準的缺陷檢測不僅是確保產品品質的關鍵,更是提升生產效率的核心。然而,現有的缺陷檢測資料集常常缺乏實際應用所需的精確度和語意豐富性,導致模型無法辨識特定的缺陷類別或位置。為了解決這個難題,由香港科技大學廣州和思謀科技組成的頂尖研究團隊,創新地開發了「DefectSpectrum」資料集,為工業缺陷提供了詳盡、語義豐富的大規模標註。如表一所示,相較於其他工業資料集,「DefectSpectrum」資料集提供了最多的缺陷標註(5438張缺陷樣本),最細緻的缺陷分類(125個缺陷類別

編輯|KX時至今日,晶體學所測定的結構細節和精度,從簡單的金屬到大型膜蛋白,是任何其他方法都無法比擬的。然而,最大的挑戰——所謂的相位問題,仍然是從實驗確定的振幅中檢索相位資訊。丹麥哥本哈根大學研究人員,開發了一種解決晶體相問題的深度學習方法PhAI,利用數百萬人工晶體結構及其相應的合成衍射數據訓練的深度學習神經網絡,可以產生準確的電子密度圖。研究表明,這種基於深度學習的從頭算結構解決方案方法,可以以僅2埃的分辨率解決相位問題,該分辨率僅相當於原子分辨率可用數據的10%到20%,而傳統的從頭算方

開放LLM社群正是百花齊放、競相爭鳴的時代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等許多表現優良的模型。但是,相較於以GPT-4-Turbo為代表的專有大模型,開放模型在許多領域仍有明顯差距。在通用模型之外,也有一些專精關鍵領域的開放模型已被開發出來,例如用於程式設計和數學的DeepSeek-Coder-V2、用於視覺-語言任務的InternVL

對AI來說,奧數不再是問題了。本週四,GoogleDeepMind的人工智慧完成了一項壯舉:用AI做出了今年國際數學奧林匹克競賽IMO的真題,並且距拿金牌僅一步之遙。上週剛結束的IMO競賽共有六道賽題,涉及代數、組合學、幾何和數論。谷歌提出的混合AI系統做對了四道,獲得28分,達到了銀牌水準。本月初,UCLA終身教授陶哲軒剛剛宣傳了百萬美元獎金的AI數學奧林匹克競賽(AIMO進步獎),沒想到7月還沒過,AI的做題水平就進步到了這種水平。 IMO上同步做題,做對了最難題IMO是歷史最悠久、規模最大、最負

2023年,幾乎AI的每個領域都在以前所未有的速度進化,同時,AI也不斷地推動著具身智慧、自動駕駛等關鍵賽道的技術邊界。在多模態趨勢下,Transformer作為AI大模型主流架構的局面是否會撼動?為何探索基於MoE(專家混合)架構的大模型成為業界新趨勢?大型視覺模型(LVM)能否成為通用視覺的新突破? ……我們從過去的半年發布的2023年本站PRO會員通訊中,挑選了10份針對以上領域技術趨勢、產業變革進行深入剖析的專題解讀,助您在新的一年裡為大展宏圖做好準備。本篇解讀來自2023年Week50

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

編輯|KX逆合成是藥物發現和有機合成中的關鍵任務,AI越來越多地用於加快這一過程。現有AI方法性能不盡人意,多樣性有限。在實踐中,化學反應通常會引起局部分子變化,反應物和產物之間存在很大重疊。受此啟發,浙江大學侯廷軍團隊提出將單步逆合成預測重新定義為分子串編輯任務,迭代細化目標分子串以產生前驅化合物。並提出了基於編輯的逆合成模型EditRetro,該模型可以實現高品質和多樣化的預測。大量實驗表明,模型在標準基準資料集USPTO-50 K上取得了出色的性能,top-1準確率達到60.8%。
