Sifat bahan ditentukan oleh susunan atomnya. Walau bagaimanapun, kaedah sedia ada untuk mendapatkan pengaturan sedemikian sama ada terlalu mahal atau tidak berkesan untuk banyak elemen.
Kini, penyelidik di Jabatan Nanoengineering UC San Diego telah membangunkan algoritma kecerdasan buatan yang boleh meramalkan struktur dan dinamik mana-mana bahan, sama ada sedia ada atau baharu, ciri hampir serta-merta. Algoritma, yang dipanggil M3GNet, digunakan untuk membangunkan pangkalan data matterverse.ai, yang mengandungi lebih daripada 31 juta bahan yang belum disintesis yang sifatnya diramalkan oleh algoritma pembelajaran mesin. Matterverse.ai memudahkan penemuan bahan teknologi baharu dengan ciri-ciri luar biasa.
Penyelidikan yang bertajuk "Potensi interatomik pembelajaran mendalam graf universal untuk jadual berkala", telah diterbitkan dalam "Sains Pengiraan Alam pada 28 November 2022 "superior .
Pautan kertas: https://www.nature.com/articles/s43588-022-00349-3
Untuk penyelidikan bahan berskala besar, potensi interatomik berskala linear (IAP) yang cekap diperlukan untuk menerangkan permukaan tenaga berpotensi (PES) berdasarkan interaksi banyak jasad antara atom. Walau bagaimanapun, kebanyakan IAP hari ini disesuaikan untuk julat bahan kimia yang sempit: biasanya satu elemen atau paling banyak tidak lebih daripada empat atau lima elemen.
Baru-baru ini, pembelajaran mesin PES telah muncul sebagai pendekatan yang sangat menjanjikan untuk pembangunan IAP. Walau bagaimanapun, tiada kajian telah menunjukkan IAP yang boleh digunakan secara universal merentas jadual berkala dan merentasi semua jenis kristal.
Sepanjang dekad yang lalu, kemunculan kod struktur elektronik yang cekap dan boleh dipercayai serta rangka kerja automasi pemprosesan tinggi telah membawa kepada pembangunan pangkalan data persekutuan yang besar bagi data bahan pengiraan. Sebilangan besar data PES telah terkumpul semasa kelonggaran struktur, iaitu, struktur perantaraan dan tenaga, daya dan tegasan yang sepadan, tetapi kurang perhatian telah diberikan kepada data ini.
"Sama seperti protein, kita perlu memahami struktur bahan untuk meramalkan sifatnya." "Apa yang kami perlukan ialah AlphaFold untuk bahan. "
AlphaFold ialah algoritma kecerdasan buatan yang dibangunkan oleh Google DeepMind untuk meramalkan struktur protein. Untuk membina bahan yang setara, Ong dan pasukannya menggabungkan rangkaian saraf graf dengan interaksi banyak badan untuk membina seni bina pembelajaran mendalam yang universal merentas semua elemen jadual berkala , berfungsi dengan ketepatan tinggi.
Graf matematik ialah perwakilan semula jadi bagi hablur dan molekul, dengan nod dan tepi mewakili atom dan ikatan di antara masing-masing. Model rangkaian neural graf bahan tradisional telah terbukti sangat berkesan untuk ramalan sifat bahan umum, tetapi kekurangan kekangan fizikal dan oleh itu tidak sesuai untuk digunakan sebagai IAP.
Penyelidik membangunkan seni bina graf bahan yang secara eksplisit menggabungkan interaksi banyak badan. Pembangunan model diilhamkan oleh IAP tradisional, dan dalam kerja ini, tumpuan akan diberikan pada penyepaduan interaksi tiga badan (M3GNet).
Rajah 1: Gambarajah skematik potensi graf berbilang badan dan blok pengiraan utama. (Sumber: Kertas)
Penandaarasan pada Set Data IAP
Sebagai penanda aras awal, penyelidik memilih Ong dan rakan sekerja set data DFT pelbagai tenaga dan daya unsur yang dijana sebelum ini untuk nikel kubik (fcc) pemusatan muka, kuprum fcc, litium padu (bcc) pemusatan badan, bcc molibdenum, silikon berlian dan germanium berlian.
Jadual 1: Perbandingan ralat antara model M3GNet dan model sedia ada EAM, MEAM, NNP dan MTP pada set data elemen tunggal. (Sumber: kertas)
Seperti yang dapat dilihat daripada Jadual 1, M3GNet IAPs dengan ketara mengatasi potensi berbilang badan klasik prestasi mereka juga setanding dengan ML-IAP berasaskan persekitaran tempatan. Perlu diingatkan bahawa walaupun ML-IAP boleh mencapai ralat tenaga dan daya yang lebih kecil sedikit daripada M3GNet IAP, fleksibilitinya dalam mengendalikan kimia berbilang unsur akan dikurangkan dengan banyak, memandangkan penambahan berbilang elemen pada ML-IAP selalunya menghasilkan Bilangan regresi letupan gabungan pekali dan keperluan data yang sepadan. Sebaliknya, seni bina M3GNet mewakili maklumat unsur setiap atom (nod) sebagai vektor benam yang boleh dipelajari. Rangka kerja sedemikian mudah diperluaskan kepada kimia berbilang komponen.
Seperti GNN lain, rangka kerja M3GNet mampu menangkap interaksi jarak jauh tanpa meningkatkan jejari cutoff untuk pembinaan ikatan. Pada masa yang sama, tidak seperti model GNN sebelumnya, seni bina M3GNet masih mengekalkan perubahan berterusan dalam tenaga, daya dan tegasan apabila bilangan ikatan berubah, yang merupakan keperluan utama untuk IAP.
IAP Universal untuk jadual berkala
Untuk membangunkan IAP bagi keseluruhan jadual berkala, pasukan menggunakan struktur kristal DFT terbesar di dunia One pangkalan data terbuka mengenai kelonggaran (Projek Bahan).
Rajah 2: Taburan set data MPF.2021.2.8. (Sumber: kertas)
Pada dasarnya, IAP boleh melatih tenaga sahaja, atau gabungan tenaga dan daya. Dalam amalan, M3GNet IAP (M3GNet-E) yang dilatih hanya pada tenaga tidak boleh mencapai ketepatan yang munasabah dalam meramal daya atau tegasan, dengan min ralat mutlak (MAE) lebih besar daripada min sisihan mutlak data. Model M3GNet yang dilatih dengan tenaga + daya (M3GNet- EF) dan tenaga + daya + tegasan (M3GNet-EFS) memperoleh tenaga dan daya MAE yang agak serupa, tetapi tegasan MAE M3GNet- EFS adalah kira-kira separuh daripada model M3GNet-EF .
Untuk aplikasi yang melibatkan perubahan kekisi, seperti kelonggaran struktur atau simulasi dinamik molekul NpT, ramalan tegasan yang tepat adalah perlu. Penemuan menunjukkan bahawa memasukkan ketiga-tiga sifat (tenaga, daya, dan tekanan) dalam latihan model adalah penting untuk mendapatkan IAP praktikal. IAP M3GNet-EFS akhir (selepas ini dirujuk sebagai model M3GNet) mencapai purata 0.035eV setiap atom, dengan purata tenaga, daya dan ujian tekanan MAEs 0.072eVÅ−1 dan 0.41GPa, masing-masing.
Rajah 3: Ramalan model pada set data ujian berbanding pengiraan DFT.
Pada data ujian, ramalan model dan kebenaran tanah DFT sepadan dengan baik, seperti yang ditunjukkan oleh kelinearan tinggi dan nilai R2 padaan linear antara DFT dan ramalan model. Taburan kumulatif ralat model menunjukkan bahawa 50% daripada data mempunyai ralat tenaga, daya, dan tegasan masing-masing kurang daripada 0.01 eV, 0.033 eVÅ−1, dan 0.042 GPa setiap atom. Suhu Debye yang dikira oleh M3GNet adalah kurang tepat, yang boleh dikaitkan dengan ramalan modulus ricih M3GNet yang agak lemah, bagaimanapun, ramalan modulus pukal adalah munasabah.
M3GNet IAP kemudiannya digunakan untuk mensimulasikan aliran kerja penemuan bahan di mana struktur DFT akhir tidak diketahui secara priori. Kelonggaran M3GNet dilakukan pada struktur awal daripada dataset ujian sebanyak 3,140 bahan. Pengiraan tenaga bagi struktur santai M3GNet menghasilkan MAE sebanyak 0.035 eV setiap atom, dan 80% bahan mempunyai ralat kurang daripada 0.028 eV setiap atom. Taburan ralat struktur santai menggunakan M3GNet adalah hampir dengan struktur akhir DFT yang diketahui, menunjukkan potensi M3GNet untuk membantu mendapatkan struktur yang betul dengan tepat. Secara umumnya, kelonggaran M3GNet menumpu dengan cepat.
Rajah 4: Struktur hablur santai menggunakan M3GNet. (Sumber: kertas)
Penemuan bahan baharu
M3GNet boleh mengendurkan sebarang objek dengan tepat dan cepat kristal struktur dan meramalkan tenaga mereka, menjadikannya sesuai untuk penemuan bahan berskala besar. Para penyelidik menjana 31,664,858 struktur calon sebagai titik permulaan, menggunakan M3GNet IAP untuk melonggarkan struktur dan mengira jarak tenaga yang ditandatangani ke badan cembung Projek Bahan (Ehull-m); .
Sebagai penilaian lanjut prestasi M3GNet dalam penemuan bahan, penyelidik mengira kadar penemuan sebagai pensampelan seragam 1000 struktur bahan stabil DFT (Ehull− dft ≤ 0). Kadar penemuan kekal menghampiri 1.0 sehingga ambang Ehull-m kira-kira 0.5 eV setiap atom, dan kekal pada nilai yang agak tinggi iaitu 0.31 pada ambang paling ketat 0.001 eV setiap atom.
Rajah 5: Nisbah kestabilan DFT sebagai fungsi ambang Ehull−m untuk sampel seragam 1000 struktur. (Sumber: kertas)
Untuk set bahan ini, penyelidik juga membandingkan kos masa kelonggaran DFT dengan dan tanpa pra-kelonggaran M3GNet. Keputusan menunjukkan bahawa tanpa pra-kelonggaran M3GNet, kos masa kelonggaran DFT adalah lebih kurang 3 kali ganda daripada pra-kelonggaran M3GNet.
Rajah 6: Pecutan DFT menggunakan pra-kelonggaran M3GNet. (Sumber: Kertas)
Daripada 31 juta bahan dalam matterverse.ai hari ini, lebih 1 juta dijangka berpotensi stabil. Ong dan pasukannya berhasrat untuk mengembangkan dengan ketara bukan sahaja bilangan bahan, tetapi juga bilangan atribut yang boleh diramalkan oleh ML, termasuk atribut bernilai tinggi untuk volum data kecil menggunakan pendekatan berbilang kesetiaan yang mereka bangunkan sebelum ini.
Selain kelonggaran struktur, M3GNet IAP juga mempunyai aplikasi yang meluas dalam simulasi dinamik bahan dan ramalan prestasi.
"Sebagai contoh, kami sering berminat dengan kadar resapan ion litium dalam elektrod atau elektrolit bateri litium-ion. Lebih cepat resapan, lebih cepat bateri boleh dicas atau dinyahcas," Ong berkata. "Kami telah menunjukkan bahawa M3GNet IAP boleh digunakan untuk meramalkan kekonduksian litium bahan dengan ketepatan yang tinggi. Kami amat percaya bahawa seni bina M3GNet ialah alat transformatif yang dapat mengembangkan keupayaan kami untuk meneroka kimia dan struktur bahan baharu."
Untuk mempromosikan penggunaan M3GNet, pasukan telah mengeluarkan rangka kerja sebagai kod Python sumber terbuka pada Github. Terdapat rancangan untuk mengintegrasikan M3GNet IAP sebagai alat ke dalam pakej simulasi bahan komersial.Atas ialah kandungan terperinci Biasa kepada keseluruhan jadual berkala unsur, AI meramalkan struktur dan sifat bahan serta-merta. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!