


Diterbitkan dalam sub-jurnal Nature, model Transformer topologi meramalkan interaksi protein-ligan berbilang skala untuk membantu pembangunan dadah
Aplikasi kecerdasan buatan baharu akan membantu penyelidik meningkatkan keupayaan pembangunan dadah mereka.
Projek ini dipanggil TopoFormer dan dibangunkan oleh pasukan antara disiplin yang diketuai oleh Profesor Guowei Wei dari Jabatan Matematik di Michigan State University.
TopoFormer mengubah maklumat tiga dimensi molekul kepada data yang boleh digunakan oleh model interaksi ubat berasaskan AI biasa, memperluaskan keupayaan model ini untuk meramal keberkesanan ubat.
"Dengan kecerdasan buatan, anda boleh menjadikan pembangunan ubat lebih cepat, lebih cekap dan lebih murah," kata Wei, yang juga di fakulti Jabatan Biokimia dan Biologi Molekul dan Jabatan Kejuruteraan Elektrik dan Komputer.
Profesor Wei menjelaskan bahawa di Amerika Syarikat, membangunkan ubat mengambil masa kira-kira sepuluh tahun dan menelan belanja kira-kira $2 bilion. Percubaan dadah mengambil masa kira-kira separuh daripada masa, manakala separuh lagi dibelanjakan untuk mencari calon rawatan baharu untuk diuji.
TopoFormer berpotensi untuk memendekkan masa pembangunan. Dengan cara ini, kos pembangunan ubat dapat dikurangkan, seterusnya menurunkan harga ubat untuk pengguna hiliran.
Kajian itu bertajuk "Pengubah struktur-ke-jujukan berbilang topologi yang didayakan untuk ramalan interaksi protein-ligan" dan diterbitkan dalam "Nature Machine Intelligence" pada 24 Jun 2024.
"Terdapat lebih daripada 20,000 protein dalam badan kita," kata Wei "Apabila penyakit berlaku, sebahagian atau salah satu daripadanya menjadi sasaran
Langkah pertama, adalah untuk memahami mana atau salah satu daripada protein ini oleh penyakit yang mana. Protein ini juga disasarkan oleh penyelidik yang berharap untuk mencari molekul yang boleh menghalang, mengurangkan atau mengatasi kesan penyakit.
"Apabila saya mempunyai matlamat, saya cuba mencari sejumlah besar ubat yang berpotensi untuk matlamat khusus itu," kata Wei.
Apabila saintis mengetahui protein mana yang perlu disasarkan oleh ubat, mereka boleh menyuapkan protein dan jujukan molekul ubat yang berpotensi ke dalam model komputer tradisional. Model ini boleh meramalkan cara ubat dan sasaran akan berinteraksi, membimbing pembangunan dan ubat yang hendak diuji dalam ujian klinikal.
Walaupun model ini boleh meramalkan beberapa interaksi berdasarkan komposisi kimia ubat dan protein semata-mata, mereka juga mengabaikan interaksi penting yang datang daripada bentuk dan struktur tiga dimensi atau 3D molekul.
Ibuprofen, yang ditemui oleh ahli kimia pada tahun 1960-an, adalah contohnya. Terdapat dua molekul ibuprofen berbeza yang mempunyai jujukan kimia yang sama tetapi struktur 3D yang berbeza sedikit. Hanya satu susunan boleh mengikat protein yang berkaitan dengan kesakitan dan menghilangkan sakit kepala.
Guowei Wei berkata: "Model pembelajaran mendalam semasa tidak dapat menerangkan bentuk ubat atau protein apabila meramalkan cara ia berfungsi bersama
Seni bina Transformer memperkenalkan teknologi baharu yang memanfaatkan mekanisme perhatian untuk analisis data jujukan merentas domain. Diilhamkan oleh ini, pasukan Wei membangunkan model Transformer topologi, TopoFormer, menyepadukan Persistent Topological Hyperdigraph Laplacian (PTHL) dengan rangka kerja Transformer.
Tidak seperti Transformer tradisional yang mengendalikan urutan protein dan ligan, TopoFormer memasukkan kompleks ligan protein 3D. Ia menukarkan kompleks ini kepada jujukan invarian topologi dan bentuk homotopik melalui PTHL, dengan itu menangkap interaksi fizikal, kimia dan biologinya pada pelbagai skala.
Pra-dilatih mengenai set data yang pelbagai, TopoFormer dapat memahami interaksi molekul yang kompleks, termasuk kesan stereokimia yang tidak jelas dalam jujukan molekul. Penalaan halus pada set data tertentu boleh menangkap interaksi terperinci dalam kompleks dan ciri-cirinya berbanding keseluruhan set data, dengan itu mempertingkatkan aplikasi pembelajaran mendalam hiliran.
- Untuk memfokuskan analisis, penyelidik menggunakan potongan 20 Å atau, lebih tepat lagi, 12 Å untuk mengenal pasti reassortant dan atom protein berdekatan dalam jarak yang ditetapkan.
- Kemudian, TopoFormer menukar struktur molekul 3D kepada jujukan topologi melalui modul benam jujukan topologi, menggunakan PTHL untuk analisis berbilang skala. Proses ini membenamkan pelbagai interaksi fizikal, kimia dan biologi ke dalam jujukan vektor.
- TopoFormer menggunakan kompleks protein-ligan yang tidak berlabel untuk pra-latihan yang diselia sendiri dan penyahkod pengekod Transformer untuk membina semula jujukan topologi. Peringkat ini menyediakan model untuk memahami dinamik protein-ligan tanpa ketiadaan data berlabel dengan mengukur ketepatan dengan membandingkan pemasukan output dan input.
- Selepas pra-latihan, TopoFormer memasuki peringkat penyeliaan halus kompleks berlabel, di mana vektor pembenaman awal menjadi ciri utama untuk tugas hiliran seperti pemarkahan, pemeringkatan, dok dan penyaringan. Setiap tugas mempunyai pengepala khusus dalam modul peramal.
- Untuk memastikan ketepatan dan mengurangkan berat sebelah, TopoFormer menyepadukan berbilang model pembelajaran mendalam transformasi topologi yang dimulakan dengan benih yang berbeza dan melengkapkannya dengan model berasaskan jujukan.
- Keluaran akhir ialah konsensus ramalan berbeza ini, menjadikan TopoFormer model komprehensif untuk menganalisis interaksi protein-ligan, memanfaatkan kedua-dua cerapan topologi dan pembelajaran mendalam.
Ilustrasi: Prestasi TopoFormer dalam tugasan pemarkahan dan penarafan. (Sumber: Kertas)
Pendekatan ini membenarkan penggunaan hyperedges terarah pelbagai dimensi untuk memodelkan interaksi kompleks melangkaui sambungan berpasangan mudah. Tambahan pula, orientasi tepi ini menggabungkan sifat fizikal dan kimia, seperti keelektronegatifan dan tenaga pengionan, untuk memberikan perwakilan yang lebih bernuansa daripada kaedah tradisional. Para penyelidik menunjukkan keupayaan ini dengan membezakan dua isomer B7C2H9 dengan hyperedges terarah, menunjukkan keupayaan kaedah untuk membezakan secara berkesan antara konfigurasi unsur.
Apabila mengkaji kompleks protein-ligan, penyelidik menggunakan graf hiperarah topologi sebagai perwakilan awal dan mempertingkatkannya lagi dengan teori PTHL untuk menganalisis ciri geometri dan topologinya.
Melukis inspirasi daripada sistem fizikal seperti struktur molekul, di mana pengendali Hoch Laplacian dimensi sifar dikaitkan dengan pengendali tenaga kinetik Hamiltonian sistem kuantum yang jelas, penyelidik memanjangkan analogi diskret kepada super topologi kepada graf. Nilai eigen dari matriks Laplacian ini memberikan gambaran tentang sifat objek topologi, sama dengan spektrum tenaga sistem fizikal.
Berbanding dengan homologi berterusan tradisional, kaedah PTHL menandakan kemajuan besar dengan menganalisis rangkaian struktur yang lebih luas melangkaui kompleks simpleks. Ia menangkap maklumat homologi asas dan cerapan geometri, termasuk nombor Betti dan evolusi bentuk homotopik, melalui spektrum anharmonik pengendali Laplacian yang berterusan.
Hasil analisis menunjukkan bahawa ia memberikan pencirian yang lebih komprehensif berbanding homologi tradisional. Kepelbagaian nilai eigen sifar pengendali Laplacian (bersamaan dengan nombor Betti) mengesahkan bahawa kaedah ini mengandungi maklumat pengekodan bar, menyediakan rangka kerja yang kuat untuk memahami kompleks protein-ligan.
Untuk menangkap interaksi atom kompleks dalam kompleks protein-ligan, termasuk daya kovalen, ionik dan van der Waals, para penyelidik menggunakan PTHL untuk melakukan analisis berbilang skala. Pendekatan ini membolehkan pemeriksaan interaksi skala silang dengan mengubah jujukan topologi berdasarkan parameter penapisan, dengan itu membantu model Transformer mengenal pasti berat yang diletakkan setiap skala pada sifat seperti pertalian mengikat.
Interaksi unsur, termasuk ikatan hidrogen, daya van der Waals, dan susunan π, adalah asas untuk kestabilan dan kekhususan kompleks protein-ligan. Untuk menganalisis interaksi ini pada peringkat unsur, penyelidik memperkenalkan analisis khusus unsur dalam pembenaman jujukan topologi.
Kaedah ini membina sub-hipergraf berdasarkan unsur berat biasa dalam protein dan ligan, menjana interaksi pengekodan matriks Laplacian khusus unsur dalam kompleks. Teknologi ini mengekstrak ciri fizikal dan kimia terperinci yang meningkatkan pemahaman model Transformer tentang dinamik kompleks dalam interaksi protein-ligan.
Kesimpulan
Untuk meringkaskan, TopoFormer dilatih untuk membaca satu bentuk maklumat dan menukarnya kepada yang lain. Dalam kes ini, ia memerlukan maklumat tiga dimensi tentang cara protein dan ubat berinteraksi berdasarkan bentuknya dan membina semulanya menjadi maklumat satu dimensi yang boleh difahami oleh model semasa.
Model baharu ini dilatih mengenai puluhan ribu interaksi protein-ubat, di mana setiap interaksi antara dua molekul direkodkan sebagai sekeping kod atau "perkataan." Kata-kata ini dirangkai bersama untuk membentuk perihalan kompleks dadah-protein, mencipta rekod bentuknya.
"Dengan cara ini, anda mempunyai banyak perkataan yang dirangkai seperti ayat."
Model lain yang meramalkan interaksi ubat baharu boleh membaca ayat ini dan memberikannya lebih banyak konteks. Jika ubat baharu adalah sebuah buku, TopoFormer boleh menukar idea cerita kasar kepada plot yang lengkap, sedia untuk ditulis.
Pautan kertas: https://www.nature.com/articles/s42256-024-00855-1
Laporan berkaitan: https://phys.org/news/2024-06-drug-discovery-ai-3d -typical.html
Atas ialah kandungan terperinci Diterbitkan dalam sub-jurnal Nature, model Transformer topologi meramalkan interaksi protein-ligan berbilang skala untuk membantu pembangunan dadah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas











Dalam pembuatan moden, pengesanan kecacatan yang tepat bukan sahaja kunci untuk memastikan kualiti produk, tetapi juga teras untuk meningkatkan kecekapan pengeluaran. Walau bagaimanapun, set data pengesanan kecacatan sedia ada selalunya tidak mempunyai ketepatan dan kekayaan semantik yang diperlukan untuk aplikasi praktikal, menyebabkan model tidak dapat mengenal pasti kategori atau lokasi kecacatan tertentu. Untuk menyelesaikan masalah ini, pasukan penyelidik terkemuka yang terdiri daripada Universiti Sains dan Teknologi Hong Kong Guangzhou dan Teknologi Simou telah membangunkan set data "DefectSpectrum" secara inovatif, yang menyediakan anotasi berskala besar yang kaya dengan semantik bagi kecacatan industri. Seperti yang ditunjukkan dalam Jadual 1, berbanding set data industri lain, set data "DefectSpectrum" menyediakan anotasi kecacatan yang paling banyak (5438 sampel kecacatan) dan klasifikasi kecacatan yang paling terperinci (125 kategori kecacatan

Editor |KX Sehingga hari ini, perincian dan ketepatan struktur yang ditentukan oleh kristalografi, daripada logam ringkas kepada protein membran yang besar, tidak dapat ditandingi oleh mana-mana kaedah lain. Walau bagaimanapun, cabaran terbesar, yang dipanggil masalah fasa, kekal mendapatkan maklumat fasa daripada amplitud yang ditentukan secara eksperimen. Penyelidik di Universiti Copenhagen di Denmark telah membangunkan kaedah pembelajaran mendalam yang dipanggil PhAI untuk menyelesaikan masalah fasa kristal Rangkaian saraf pembelajaran mendalam yang dilatih menggunakan berjuta-juta struktur kristal tiruan dan data pembelauan sintetik yang sepadan boleh menghasilkan peta ketumpatan elektron yang tepat. Kajian menunjukkan bahawa kaedah penyelesaian struktur ab initio berasaskan pembelajaran mendalam ini boleh menyelesaikan masalah fasa pada resolusi hanya 2 Angstrom, yang bersamaan dengan hanya 10% hingga 20% daripada data yang tersedia pada resolusi atom, manakala Pengiraan ab initio tradisional

Komuniti LLM terbuka ialah era apabila seratus bunga mekar dan bersaing Anda boleh melihat Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 dan banyak lagi. model yang cemerlang. Walau bagaimanapun, berbanding dengan model besar proprietari yang diwakili oleh GPT-4-Turbo, model terbuka masih mempunyai jurang yang ketara dalam banyak bidang. Selain model umum, beberapa model terbuka yang mengkhusus dalam bidang utama telah dibangunkan, seperti DeepSeek-Coder-V2 untuk pengaturcaraan dan matematik, dan InternVL untuk tugasan bahasa visual.

Bagi AI, Olimpik Matematik tidak lagi menjadi masalah. Pada hari Khamis, kecerdasan buatan Google DeepMind menyelesaikan satu kejayaan: menggunakan AI untuk menyelesaikan soalan sebenar IMO Olimpik Matematik Antarabangsa tahun ini, dan ia hanya selangkah lagi untuk memenangi pingat emas. Pertandingan IMO yang baru berakhir minggu lalu mempunyai enam soalan melibatkan algebra, kombinatorik, geometri dan teori nombor. Sistem AI hibrid yang dicadangkan oleh Google mendapat empat soalan dengan betul dan memperoleh 28 mata, mencapai tahap pingat perak. Awal bulan ini, profesor UCLA, Terence Tao baru sahaja mempromosikan Olimpik Matematik AI (Anugerah Kemajuan AIMO) dengan hadiah berjuta-juta dolar Tanpa diduga, tahap penyelesaian masalah AI telah meningkat ke tahap ini sebelum Julai. Lakukan soalan secara serentak pada IMO Perkara yang paling sukar untuk dilakukan dengan betul ialah IMO, yang mempunyai sejarah terpanjang, skala terbesar dan paling negatif

Pada tahun 2023, hampir setiap bidang AI berkembang pada kelajuan yang tidak pernah berlaku sebelum ini. Pada masa yang sama, AI sentiasa menolak sempadan teknologi trek utama seperti kecerdasan yang terkandung dan pemanduan autonomi. Di bawah trend berbilang modal, adakah status Transformer sebagai seni bina arus perdana model besar AI akan digoncang? Mengapakah penerokaan model besar berdasarkan seni bina MoE (Campuran Pakar) menjadi trend baharu dalam industri? Bolehkah Model Penglihatan Besar (LVM) menjadi satu kejayaan baharu dalam penglihatan umum? ...Daripada surat berita ahli PRO 2023 laman web ini yang dikeluarkan dalam tempoh enam bulan lalu, kami telah memilih 10 tafsiran khas yang menyediakan analisis mendalam tentang aliran teknologi dan perubahan industri dalam bidang di atas untuk membantu anda mencapai matlamat anda dalam bidang baharu. tahun. Tafsiran ini datang dari Week50 2023

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

Editor |. KX Retrosynthesis ialah tugas kritikal dalam penemuan ubat dan sintesis organik, dan AI semakin digunakan untuk mempercepatkan proses. Kaedah AI sedia ada mempunyai prestasi yang tidak memuaskan dan kepelbagaian terhad. Dalam amalan, tindak balas kimia sering menyebabkan perubahan molekul tempatan, dengan pertindihan yang besar antara bahan tindak balas dan produk. Diilhamkan oleh ini, pasukan Hou Tingjun di Universiti Zhejiang mencadangkan untuk mentakrifkan semula ramalan retrosintetik satu langkah sebagai tugas penyuntingan rentetan molekul, secara berulang menapis rentetan molekul sasaran untuk menghasilkan sebatian prekursor. Dan model retrosintetik berasaskan penyuntingan EditRetro dicadangkan, yang boleh mencapai ramalan berkualiti tinggi dan pelbagai. Eksperimen yang meluas menunjukkan bahawa model itu mencapai prestasi cemerlang pada set data penanda aras standard USPTO-50 K, dengan ketepatan 1 teratas 60.8%.

Editor |. ScienceAI Berdasarkan data klinikal yang terhad, beratus-ratus algoritma perubatan telah diluluskan. Para saintis sedang membahaskan siapa yang harus menguji alat dan cara terbaik untuk melakukannya. Devin Singh menyaksikan seorang pesakit kanak-kanak di bilik kecemasan mengalami serangan jantung semasa menunggu rawatan untuk masa yang lama, yang mendorongnya untuk meneroka aplikasi AI untuk memendekkan masa menunggu. Menggunakan data triage daripada bilik kecemasan SickKids, Singh dan rakan sekerja membina satu siri model AI untuk menyediakan potensi diagnosis dan mengesyorkan ujian. Satu kajian menunjukkan bahawa model ini boleh mempercepatkan lawatan doktor sebanyak 22.3%, mempercepatkan pemprosesan keputusan hampir 3 jam bagi setiap pesakit yang memerlukan ujian perubatan. Walau bagaimanapun, kejayaan algoritma kecerdasan buatan dalam penyelidikan hanya mengesahkan perkara ini
