首頁 科技週邊 人工智慧 精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質互作

精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質互作

Jul 16, 2024 am 01:18 AM
人工智慧 蛋白質 理論 生物計算

精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質互作

1. 蛋白質相互作用的重要性

蛋白質是生命的基石,參與幾乎所有生物過程。了解蛋白質如何相互作用對於解釋細胞功能的複雜性至關重要。

2. 新方法:配對相互作用的蛋白質序列

洛桑聯邦理工學院(EPFL)的 Anne-Florence Bitbol 團隊提出了一種配對相互作用的蛋白質序列的方法。該方法利用了在多個序列比對上訓練的蛋白質語言模型的強大功能。

3. 方法優點

此方法對於小型資料集表現良好,並且可以透過監督方法改進蛋白質複合物的結構預測。

4. 研究成果發表

該研究以「Pairing interacting protein sequences using masked language modeling」為題,於 2024 年 6 月 24 日發佈在《PNASPNAS》。

精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質互作

蛋白質間相互作用的預測

蛋白質間的相互作用對細胞功能至關重要,它們確保了信號傳導的特定性和多蛋白複合體(如分子馬達或受體)的形成。預測蛋白質-蛋白質相互作用及其複合體結構是計算生物學和生物物理學的重要課題。

儘管 AlphaFold 等深度學習方法在蛋白質單體結構預測上取得重大進展,但對於複合體結構的預測性能仍不如同單體預測,且存在異質性。 AlphaFold 首先建構查詢蛋白序列的同源多序列比對(MSA),而 MSA 的品質對預測準確度極為關鍵。

異源多聚體的配對MSA

對於涉及多種鏈的蛋白質複合體(異源多聚體),配對MSA 能提供交互夥伴間的協同進化信息,有助於推斷鏈間接觸,但建構正確配對的MSA 是一大挑戰;尤其是在真核生物中,因存在眾多同源蛋白且非依賴於基因組鄰近性。

協同進化方法

目前,結合基因組鄰近性、近似同源性、基於系統發生的方法及協同進化策略等手段來應對這一挑戰,其中協同進化方法雖數據需求大,但在優化配對和預測複合體結構方面展現出潛力,特別是透過最大化協同演化訊號來匹配同源蛋白。

DiffPALM:一種可微分配對方法

EPFL 的Anne-Florence Bitbol 團隊開發了一種配對相互作用蛋白質序列的方法,該方法利用了在多序列比對(MSA) 上訓練的蛋白質語言模型的強大功能,例如MSA Transformer 和AlphaFold 的EvoFormer 模組。這使它能夠高度準確地理解和預測蛋白質之間的複雜相互作用。

基於這些,研究人員提出了使用基於對齊的語言模型(DiffPALM)的可微分配對,這是一種使用 MLM 預測同源詞匹配的可微分方法。

精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質互作

圖示:DiffPALM 在小型 HK-RR MSA 上的表現。 (資料來源:論文)

DiffPALM 在從普遍存在的原核生物蛋白質資料集中提取的淺層 MSA 的困難基準測試中,它的表現遠勝於現有的協同進化方法。當提供已知的相互作用對作為範例時,DiffPALM 性能會進一步快速提高。

基於協同進化的配對方法,主要研究蛋白質序列在緊密相互作用時如何隨著時間的推移一起進化——一種蛋白質的變化可能導致其相互作用分子的變化。這是分子和細胞生物學中一個極其重要的課題,在 MSA 上訓練的蛋白質語言模型可以很好地捕捉這一點。

精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質互作

圖示:使用不同配對方法的 AFM 效能。 (資料來源:論文)

之後,團隊將 DiffPALM 應用於真核蛋白質複合物的同源物匹配難題。為此,研究人員將 DiffPALM 配對的序列作為 AFM 的輸入。在測試的複合物中,使用 DiffPALM 在某些情況下可以顯著改善 AFM 的結構預測。它還實現了與使用基於直系同源物的配對相媲美的性能。

精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質互作

圖示:正例的影響、MSA 深度以及對另一對蛋白質家族的擴展。 (資料來源:論文)

The applications of DiffPALM are obvious in the field of basic protein biology, but its applications extend beyond that, as it has the potential to become a powerful tool in medical research and drug development. For example, accurate prediction of protein interactions can help understand disease mechanisms and develop targeted treatments.

Researchers have made DiffPALM freely available and hope that widespread adoption by the scientific community will further advance computational biology and enable researchers to explore the complexity of protein interactions.

DiffPALM combines advanced machine learning techniques with efficient processing of complex biological data, marking a major step forward in computational biology.

It not only enhances scientists’ understanding of protein interactions, but also opens up new avenues of medical research, potentially leading to breakthroughs in disease treatment and drug development.

Paper link:
https://www.pnas.org/doi/10.1073/pnas.2311887121

Related reports:
https://phys.org/news/2024-06-ai-based-approach-protein -interaction.html

以上是精度媲美AlphaFold,EPFL的AI方法從序列中匹配蛋白質互作的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
<🎜>掩蓋:探險33-如何獲得完美的色度催化劑
2 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1677
14
CakePHP 教程
1430
52
Laravel 教程
1333
25
PHP教程
1278
29
C# 教程
1257
24
位元組跳動剪映推出 SVIP 超級會員:連續包年 499 元,提供多種 AI 功能 位元組跳動剪映推出 SVIP 超級會員:連續包年 499 元,提供多種 AI 功能 Jun 28, 2024 am 03:51 AM

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

突破傳統缺陷檢測的界限,\'Defect Spectrum\'首次實現超高精度豐富語意的工業缺陷檢測。 突破傳統缺陷檢測的界限,\'Defect Spectrum\'首次實現超高精度豐富語意的工業缺陷檢測。 Jul 26, 2024 pm 05:38 PM

在現代製造業中,精準的缺陷檢測不僅是確保產品品質的關鍵,更是提升生產效率的核心。然而,現有的缺陷檢測資料集常常缺乏實際應用所需的精確度和語意豐富性,導致模型無法辨識特定的缺陷類別或位置。為了解決這個難題,由香港科技大學廣州和思謀科技組成的頂尖研究團隊,創新地開發了「DefectSpectrum」資料集,為工業缺陷提供了詳盡、語義豐富的大規模標註。如表一所示,相較於其他工業資料集,「DefectSpectrum」資料集提供了最多的缺陷標註(5438張缺陷樣本),最細緻的缺陷分類(125個缺陷類別

數百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science 數百萬晶體資料訓練,解決晶體學相位問題,深度學習方法PhAI登Science Aug 08, 2024 pm 09:22 PM

編輯|KX時至今日,晶體學所測定的結構細節和精度,從簡單的金屬到大型膜蛋白,是任何其他方法都無法比擬的。然而,最大的挑戰——所謂的相位問題,仍然是從實驗確定的振幅中檢索相位資訊。丹麥哥本哈根大學研究人員,開發了一種解決晶體相問題的深度學習方法PhAI,利用數百萬人工晶體結構及其相應的合成衍射數據訓練的深度學習神經網絡,可以產生準確的電子密度圖。研究表明,這種基於深度學習的從頭算結構解決方案方法,可以以僅2埃的分辨率解決相位問題,該分辨率僅相當於原子分辨率可用數據的10%到20%,而傳統的從頭算方

英偉達對話模式ChatQA進化到2.0版本,上下文長度提到128K 英偉達對話模式ChatQA進化到2.0版本,上下文長度提到128K Jul 26, 2024 am 08:40 AM

開放LLM社群正是百花齊放、競相爭鳴的時代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等許多表現優良的模型。但是,相較於以GPT-4-Turbo為代表的專有大模型,開放模型在許多領域仍有明顯差距。在通用模型之外,也有一些專精關鍵領域的開放模型已被開發出來,例如用於程式設計和數學的DeepSeek-Coder-V2、用於視覺-語言任務的InternVL

GoogleAI拿下IMO奧數銀牌,數學推理模型AlphaProof面世,強化學習 is so back GoogleAI拿下IMO奧數銀牌,數學推理模型AlphaProof面世,強化學習 is so back Jul 26, 2024 pm 02:40 PM

對AI來說,奧數不再是問題了。本週四,GoogleDeepMind的人工智慧完成了一項壯舉:用AI做出了今年國際數學奧林匹克競賽IMO的真題,並且距拿金牌僅一步之遙。上週剛結束的IMO競賽共有六道賽題,涉及代數、組合學、幾何和數論。谷歌提出的混合AI系統做對了四道,獲得28分,達到了銀牌水準。本月初,UCLA終身教授陶哲軒剛剛宣傳了百萬美元獎金的AI數學奧林匹克競賽(AIMO進步獎),沒想到7月還沒過,AI的做題水平就進步到了這種水平。 IMO上同步做題,做對了最難題IMO是歷史最悠久、規模最大、最負

PRO | 為什麼基於 MoE 的大模型更值得關注? PRO | 為什麼基於 MoE 的大模型更值得關注? Aug 07, 2024 pm 07:08 PM

2023年,幾乎AI的每個領域都在以前所未有的速度進化,同時,AI也不斷地推動著具身智慧、自動駕駛等關鍵賽道的技術邊界。在多模態趨勢下,Transformer作為AI大模型主流架構的局面是否會撼動?為何探索基於MoE(專家混合)架構的大模型成為業界新趨勢?大型視覺模型(LVM)能否成為通用視覺的新突破? ……我們從過去的半年發布的2023年本站PRO會員通訊中,挑選了10份針對以上領域技術趨勢、產業變革進行深入剖析的專題解讀,助您在新的一年裡為大展宏圖做好準備。本篇解讀來自2023年Week50

為大模型提供全新科學複雜問答基準與評估體系,UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 為大模型提供全新科學複雜問答基準與評估體系,UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 Jul 25, 2024 am 06:42 AM

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

準確率達60.8%,浙大基於Transformer的化學逆合成預測模型,登Nature子刊 準確率達60.8%,浙大基於Transformer的化學逆合成預測模型,登Nature子刊 Aug 06, 2024 pm 07:34 PM

編輯|KX逆合成是藥物發現和有機合成中的關鍵任務,AI越來越多地用於加快這一過程。現有AI方法性能不盡人意,多樣性有限。在實踐中,化學反應通常會引起局部分子變化,反應物和產物之間存在很大重疊。受此啟發,浙江大學侯廷軍團隊提出將單步逆合成預測重新定義為分子串編輯任務,迭代細化目標分子串以產生前驅化合物。並提出了基於編輯的逆合成模型EditRetro,該模型可以實現高品質和多樣化的預測。大量實驗表明,模型在標準基準資料集USPTO-50 K上取得了出色的性能,top-1準確率達到60.8%。

See all articles