Pertama sekali, izinkan saya berkongsi dengan anda latar belakang penemuan dadah yang berkaitan.
Dadah Bidang penemuan sangat hangat sejak beberapa tahun kebelakangan ini, terutamanya penggunaan AI untuk membantu syarikat farmaseutikal dalam kerja penemuan ubat mereka, termasuk penyelidikan dan pembangunan ubat. Proses penyelidikan dan pembangunan ubat mempunyai kitaran yang sangat panjang Biasanya, proses penyelidikan dan pembangunan ubat pertama untuk jenis penyakit klinikal tertentu memerlukan berbilion dana dan lebih daripada sepuluh tahun. Ia terutamanya dibahagikan kepada peringkat berikut:
(1) Penyelidikan mengenai sasaran penyakit dan pengenalpastian protein teras penyakit.
(2) Sahkan keberkesanan ubat sebelum ujian klinikal: termasuk penyelidikan tentang ketoksikan ubat, keberkesanan, dos, dsb.
(3) Ujian klinikal.
(4) Kelulusan dan pensijilan FDA.
Jadi kitaran proses pembangunan ubat tradisional adalah sangat panjang. Di samping itu, dari pengiktirafan awal lebih daripada 10,000 ubat, 5 ubat memasuki peringkat percubaan klinikal, dan akhirnya hanya 1 ubat yang diluluskan untuk pemasaran. Dalam konteks ini, cara membantu syarikat farmaseutikal memilih ubat yang berkesan daripada ubat calon dengan lebih cepat, dan cara menyiasat terlebih dahulu kesan, peranan, keberkesanan, dsb. ubat dalam fasa ujian klinikal telah menjadi topik penyelidikan yang hangat , di mana AI, terutamanya teknologi rangkaian saraf dalam, boleh mempercepatkan proses penyelidikan dan pembangunan dadah.
Kandungan yang dikongsi hari ini tidak melibatkan pemeriksaan dadah terutamanya tertumpu kepada kesan sampingan dan keberkesanan ubat calon. Tujuan penyelidikan utama adalah Mengurangkan ketoksikan dadah dan meningkatkan keberkesanan ubat.
Seperti yang ditunjukkan dalam gambar di atas, DDI (Drug-Drug Interaction) merujuk kepada interaksi antara dadah. Menjalankan analisis silang antara ubat penyelidikan dan ubat sedia ada untuk menemui kesan sampingan ubat penyelidikan, seperti kesannya pada badan, dsb., dan menemui dan mengelaskannya terlebih dahulu melalui eksperimen. Untuk contoh mudah, "ubat dibahagikan kepada tiga bahagian oleh racun". Dalam banyak kes, ia berlaku apabila ubat digabungkan dengan ubat lain, interaksi kimia antara dua atau lebih ubat. Gambar di sudut kanan bawah menunjukkan tiga ubat Itraconazole adalah ubat yang berkaitan dengan tumor Jika ia dicampur dengan abemaciclib, ia akan menyebabkan kesan sampingan yang serius, seperti kegagalan hati, hati dan buah pinggang pesakit boleh membawa akibat yang serius. Jika abeciclib dan dabrafenib dicampur, ia akan menyebabkan penurunan kepekatan serum dan menyebabkan penyakit lain. Oleh itu, sejumlah besar ujian diperlukan dalam proses membangunkan ubat baru, tetapi adalah mustahil untuk menggunakan orang sebenar untuk menguji, dan hanya boleh diuji dengan tikus atau haiwan lain.
Kandungan yang dikongsi hari ini adalah untuk menggunakan rangkaian saraf pelbagai mod untuk meramalkan DDI ubat terlebih dahulu berdasarkan bahan sedia ada (termasuk dalam pembangunan dan diketahui), alahan, dsb.
Seperti yang ditunjukkan dalam rajah di atas, interaksi ubat boleh diringkaskan sebagai matriks DDI, yang menerangkan hasil interaksi ubat, seperti ubat d1 (abexiclib) dan d2 (dabrafenib) Akan menyebabkan y1 ( kepekatan serum menurun). Kajian ini termasuk 37,264 data DDI, melibatkan 572 ubat (d) dan 65 keputusan tindak balas (y, seperti penurunan kepekatan serum, dll.). Dan berdasarkan data ini, Graf Pengetahuan Dadah (DKG) telah dibina: nod adalah ubat dan tepi adalah hubungan antara ubat. Tiga kali ganda DKG ialah {D: dadah, R: hubungan antara dadah, T: entiti ekor}.
Selain data di atas, model multimodal juga menggabungkan ciri heterogen dadah (HF, Ciri Heterogen): {Sasaran: sasaran, substruktur: Komposisi/struktur kimia, enzim: enzim}, dimensi setiap ciri adalah berbeza, contohnya, maklumat sasaran ialah protein. Akhir sekali, matriks DDI, DKG dan HF digabungkan pada taburan kebarangkalian yang sama untuk pemodelan.
Rangka kerja model MDNN multi-modal heterogen akan diperkenalkan seterusnya .
Model ini dirujuk sebagai MDNN Data asas terbahagi kepada dua bahagian: Matriks DDI dan data heterogen Kerangka model terutamanya terdiri daripada tiga bahagian berikut:
(1) Berdasarkan bahagian DKG: Terutamanya dengan membina graf pengetahuan dadah untuk menyatakan maklumat tentang komponen dadah itu sendiri (bahan aktif, bahan toksik), hubungan antara ubat, dsb.
(2) Berdasarkan bahagian HF: Terangkan ubat itu sendiri dengan menyepadukan data ciri heterogen seperti sasaran, enzim dan molekul struktur.
(3) Rangkaian neural gabungan pelbagai mod: Gabungkan kedua-dua bahagian data ciri DKG dan HF dengan berkesan, dan lakukan gabungan data Pemodelan bersatu.
Berikut akan memperkenalkan proses pembinaan berdasarkan DKG.
Gambar di atas menunjukkan kandungan utama graf pengetahuan dadah, dan gambar kiri ialah matriks DDI Matriks mengandungi hampir 600 ubat, dan maklumat komposisi dan tindakan ubat-ubatan ini disimpan dalam pangkalan data (DrugBank). Gambar di sebelah kanan menunjukkan contoh maklumat dadah dalam "Bank Dadah", seperti enzim, pembawa, sasaran dan ciri-ciri asas heterogen lain Empat daripadanya adalah agak penting dengan mengambil ubat DB05812 sebagai contoh, sebagai tambahan kepada sasaran , Selain enzim dan struktur molekul, terdapat juga pembawa dan pengangkut Walau bagaimanapun, kedua-dua jenis data ini agak jarang dan tidak mempunyai banyak dimensi seperti ciri-ciri lain. kedua-dua data ini tidak digunakan buat masa ini. Data utama yang digunakan ialah sasaran, enzim, dan struktur molekul.
Seperti yang ditunjukkan dalam rajah di atas, graf pengetahuan terutamanya terdiri daripada nod dan tepi, di mana nod adalah ubat dan ramuan, dan tepi adalah hubungan. Hubungan yang ditunjukkan oleh triplet dalam contoh ialah hubungan komponen toksik, iaitu, terdapat hubungan komponen toksik antara ubat nod "DB05812" dan komponen nod "P02768". Berdasarkan tiga kali ganda hubungan ramuan dadah yang diperolehi daripada "Bank Dadah", graf pengetahuan DKG terbentuk, yang mengandungi 572 jenis ubat Tepi (hubungan) tiga dipanggil hubungan semantik secara keseluruhannya. Bahan-bahan Terdapat 1043 jenis nod entiti ekor. Setiap DKG boleh mengekstrak maklumat yang sepadan daripada "Bank Dadah" mengikut keperluan tugas dan membinanya, jadi DKG adalah bersamaan dengan subgraf dalam graf pengetahuan "Bank Dadah".
Berdasarkan DKG, dua jenis maklumat diringkaskan Rajah di atas menunjukkan semantik model maklumat perhubungan pembinaan. Berdasarkan komponen toksik, mula-mula hitung produk dalam ubat (d) dan hubungan (r) dalam lapisan sebelumnya, dan jumlahkannya melalui berat lapisan semasa (W1) untuk mendapatkan fungsi π maklumat tepi dan nod dadah dijumlahkan bersama melalui fungsi π, dan kemudian melakukan penjumlahan wajaran fungsi π dan komponen lapisan sebelumnya (t) untuk mendapatkan e, iaitu maklumat tepi diperoleh.
Begitu juga, rajah di atas menunjukkan pembinaan model maklumat struktur topologi graf . Selain komponen toksik, ubat juga mungkin mengandungi berbilang hubungan komponen lain (tepi, iaitu e) ubat yang sama dan berat sepadannya W2 boleh disambungkan untuk akhirnya memperoleh E yang sepadan dengan setiap ubat. Melalui kaedah di atas, tepi DKG dan maklumat struktur topologi digabungkan dan diwakili dengan berkesan.
Seperti yang ditunjukkan di bawah, sebagai tambahan kepada maklumat sampingan dan maklumat DDI yang dinyatakan di atas , Terdapat juga maklumat multi-modal yang sangat kaya dalam ubat-ubatan: ubat yang sama boleh bertindak pada pelbagai sasaran juga mempunyai struktur molekul yang berbeza, yang mewakili sifat molekul mereka yang sepadan akan bertindak balas di bawah tindakan enzim yang berbeza . Ketiga-tiga jenis maklumat ini divektorkan, dan kemudian persamaan antara ubat-ubatan diukur melalui persamaan Jaccard mudah untuk mendapatkan matriks persamaan yang sepadan.
Final Fusion Ketiga-tiga matriks persamaan memperoleh E' yang sepadan dengan setiap ubat, iaitu maklumat berdasarkan ciri-ciri isomer ubat diperolehi. Dimensi vektor ciri ini juga kecil, termasuk maklumat mengenai 1162 sasaran, 583 struktur dan 202 enzim.
Seperti yang ditunjukkan dalam rajah di atas, keputusan DKG E dan HF E' setiap ubat akhirnya disambung dan dicantum melalui lapisan gabungan untuk mendapatkan:
Kemudian gunakan fungsi softmax untuk mendapatkan lapisan output:
Keseluruhan rangka kerja model adalah seperti yang ditunjukkan di atas Struktur rangka kerja tidak rumit, tetapi ia menggabungkan maklumat ubat dengan agak berkesan.
Seterusnya, saya akan berkongsi kesan model dengan anda.
Rajah di atas menunjukkan hasil perbandingan dengan algoritma yang lebih biasa digunakan pada masa ini, MDNN algoritma Ia telah mencapai keputusan terkini dalam Acc, AUC, F1, AUPR, Precision, Recall dan penunjuk penilaian lain. (Algoritma di atas tidak dimasukkan ke dalam algoritma GNN.)
Rajah di atas menunjukkan Gabungan MDNN DKG, Perbezaan antara kesan HK dan tiada gabungan. Adalah mudah untuk melihat bahawa hasil gabungan adalah lebih baik daripada menggunakan salah satu kaedah sahaja.
Analisis pelarasan parameter pelbagai mod, iaitu, kepekaan parameter adalah seperti yang ditunjukkan dalam rajah di atas, masing-masing menunjukkan pelbagai penunjuk penilaian apabila parameter seperti bilangan lapisan rangkaian neural l dan bilangan nod Ns turun naik yang sepadan.
Selain itu, analisis berbilang tugas telah dilakukan, dan tugas Model ramalan telah dibina melalui set latihan Untuk meramalkan DDI antara ubat dalam set latihan dan ubat dalam set ujian, model ramalan tugas B juga dibina melalui set latihan, tetapi meramalkan DDI antara ubat dalam set ujian. Jika set latihan dan ubat set ujian dipisahkan dengan ketat, kesan ramalan model akan berkurangan dengan ketara.
Masih banyak masalah yang perlu diselesaikan dalam bidang penyelidikan dan pembangunan dadah: bagaimana untuk menemui/menyaring ubat dengan berkesan dan bukannya hanya mengkaji DDI.
Akhir sekali, untuk meringkaskan kandungan yang dikongsi kali ini, algoritma MDNN itu sendiri tidak rumit. . kesan Graf pengetahuan membina ciri data berbilang modal berdasarkan ciri-ciri ubat itu sendiri (sasaran, struktur molekul, enzim), dan akhirnya menyepadukan kedua-dua ciri ini untuk membina model MDNN.
(2) Memperbaiki masalah ramalan DDI
(3) Perbandingan dengan kaedah sedia ada, MDNN berfungsi; terbaik pada set data.Tetapi dalam aplikasi praktikal, model MDNN masih mempunyai banyak bidang yang memerlukan pengoptimuman dan penambahbaikan lanjut, seperti metodologi yang lebih baik atau data yang lebih baik.
5. Sesi Soal Jawab
S1: Adakah set data "Bank Dadah" adalah set data awam?
A2: Selain biofarmaseutikal, terdapat banyak aplikasi dalam bidang e-dagang. Sebagai contoh, dalam set data kelas Item Pengguna, Pengguna mempunyai banyak maklumat berbilang modal, seperti pekerjaan, umur, tag beli-belah, dsb. Produk item juga mempunyai banyak maklumat dan terdapat banyak hubungan antara mereka, seperti membeli-belah, penilaian, kegemaran, klik, dsb. Tingkah laku. Jika data domain mematuhi bentuk heterogen, anda boleh cuba menggunakan kaedah ini untuk analisis Kesukarannya terletak pada membina graf pengetahuan dalam domain tertentu.
Atas ialah kandungan terperinci Aplikasi model DNN multimodal dalam tugas ramalan interaksi dadah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!