물질의 성질은 원자의 배열에 따라 결정됩니다. 그러나 그러한 배열을 얻기 위한 기존 방법은 많은 요소에 대해 너무 비싸거나 비효율적입니다.
이제 UC 샌디에고 나노공학과의 연구원들은 기존 물질이든 새로운 물질이든 모든 물질의 구조적 및 동적 특성을 거의 즉각적으로 예측할 수 있는 인공 지능 알고리즘을 개발했습니다. M3GNet이라는 알고리즘은 기계 학습 알고리즘으로 속성을 예측하는 3,100만 개 이상의 아직 합성되지 않은 물질을 포함하는 Matterverse.ai 데이터베이스를 개발하는 데 사용되었습니다. Matterverse.ai는 뛰어난 특성을 지닌 새로운 기술 소재의 발견을 촉진합니다.
이 연구의 제목은 "A universal graph deep learning interatomicpotent for the periodic table"이며 2022년 11월 28일 "Nature Computational Science"에 게재되었습니다.
논문 링크: https://www.nature.com/articles/s43588-022-00349-3
대규모 재료 연구를 위해서는 다중 분석이 필요합니다. 원자 간 신체 상호작용 위치 에너지 표면(PES)을 설명하는 데 사용되는 효율적인 선형 규모의 원자간 전위(IAP)입니다. 그러나 오늘날 대부분의 IAP는 좁은 범위의 화학물질(보통 단일 요소 또는 4~5개 이하의 요소)에 맞게 맞춤화되어 있습니다.
최근에는 PES용 머신러닝이 IAP 개발에 있어 특히 유망한 접근 방식으로 떠올랐습니다. 그러나 주기율표와 모든 유형의 결정에 걸쳐 보편적으로 적용 가능한 IAP를 입증한 연구는 없습니다.
지난 10년 동안 효율적이고 신뢰할 수 있는 전자 구조 코드와 높은 처리량의 자동화 프레임워크의 출현으로 전산 재료 데이터의 대규모 연합 데이터베이스가 개발되었습니다. 구조적 완화, 즉 중간 구조와 그에 상응하는 에너지, 힘 및 응력에 대한 많은 양의 PES 데이터가 축적되었지만 이러한 데이터에 대한 관심은 적었습니다.
"단백질과 마찬가지로 물질의 특성을 예측하려면 물질의 구조를 이해해야 합니다."라고 이번 연구의 주저자인 Shyue Ping Ong이 말했습니다. "우리에게 필요한 것은 재료용 AlphaFold입니다."
AlphaFold는 Google DeepMind가 단백질 구조를 예측하기 위해 개발한 인공지능 알고리즘입니다. 물질적 등가물을 구축하기 위해 Ong과 그의 팀은 다체 상호 작용과 그래프 신경망을 결합하여 주기율표의 모든 요소에 걸쳐 다재다능하고 효율성이 뛰어난 딥 러닝 아키텍처를 구축했습니다.
수학적 그래프는 결정과 분자를 자연스럽게 표현하며, 노드와 가장자리는 각각 원자와 원자 사이의 결합을 나타냅니다. 전통적인 재료 그래프 신경망 모델은 일반적인 재료 특성 예측에 매우 효과적인 것으로 입증되었지만 물리적 제약이 부족하여 IAP로 사용하기에는 적합하지 않습니다.
연구원들은 다체 상호 작용을 명시적으로 통합하는 재료 그래프 아키텍처를 개발합니다. 모델 개발은 전통적인 IAP에서 영감을 얻었으며, 이 작업에서는 삼체 상호 작용(M3GNet)의 통합에 중점을 둘 것입니다.
그림 1: 다물체 그래프 잠재력 및 주요 계산 블록의 개략도. (출처: 논문)
IAP 데이터 세트 벤치마킹
초기 벤치마크로 연구원들은 이전에 Ong과 동료들이 면 중심 입방(fcc)에 대해 생성한 원소 에너지와 힘의 다양한 DFT 데이터 세트를 선택했습니다. ) 니켈, FCC 구리, 체심 입방(bcc) 리튬, bcc 몰리브덴, 다이아몬드 실리콘 및 다이아몬드 게르마늄.
표 1: 단일 요소 데이터 세트에서 M3GNet 모델과 기존 모델 EAM, MEAM, NNP 및 MTP 간의 오류 비교. (출처: Paper)
표 1에서 볼 수 있듯이 M3GNet IAP는 기존 다중 몸체 잠재력보다 훨씬 우수하며 성능도 로컬 환경 기반 ML-IAP와 비슷합니다. ML-IAP는 M3GNet IAP보다 약간 더 작은 에너지 및 강제 오류를 달성할 수 있지만 ML-IAP에 여러 요소를 추가하면 종종 결합된 폭발 횟수 회귀가 발생하므로 다중 요소 화학을 처리하는 유연성이 크게 감소합니다. 계수 및 해당 데이터 요구 사항. 이에 비해 M3GNet 아키텍처는 각 원자(노드)의 요소 정보를 학습 가능한 임베딩 벡터로 표현합니다. 이러한 프레임워크는 다성분 화학으로 쉽게 확장됩니다.
다른 GNN과 마찬가지로 M3GNet 프레임워크는 결합 구성을 위한 컷오프 반경을 늘리지 않고도 장거리 상호 작용을 캡처할 수 있습니다. 동시에 이전 GNN 모델과 달리 M3GNet 아키텍처는 결합 수가 변경됨에 따라 에너지, 힘 및 응력의 지속적인 변화를 유지하며 이는 IAP의 핵심 요구 사항입니다.
주기율표에 대한 범용 IAP
전체 주기율표에 대한 IAP를 개발하기 위해 팀은 DFT 결정 구조 완화에 대한 세계 최대 규모의 개방형 데이터베이스 중 하나(재료 프로젝트)를 사용했습니다.
그림 2: MPF.2021.2.8 데이터 세트의 분포. (출처: 논문)
원칙적으로 IAP는 에너지만 훈련하거나 에너지와 힘을 조합하여 훈련할 수 있습니다. 실제로 에너지에 대해서만 훈련된 M3GNet IAP(M3GNet-E)는 힘이나 응력을 예측하는 데 합리적인 정확도를 달성할 수 없으며, 평균 절대 오차(MAE)는 데이터의 평균 절대 편차보다 훨씬 큽니다. 에너지 + 힘(M3GNet-EF) 및 에너지 + 힘 + 응력(M3GNet-EFS)으로 훈련된 M3GNet 모델은 상대적으로 유사한 에너지 및 힘 MAE를 얻었지만 M3GNet-EFS의 스트레스 MAE는 M3GNet-EF 모델의 절반 정도였습니다. .
구조적 완화 또는 NpT 분자 역학 시뮬레이션과 같은 격자 변화와 관련된 응용 분야의 경우 정확한 응력 예측이 필요합니다. 연구 결과에 따르면 모델 훈련에 세 가지 속성(에너지, 힘, 압력)을 모두 포함하는 것이 실용적인 IAP를 얻는 데 중요합니다. 최종 M3GNet-EFS IAP(이하 M3GNet 모델)는 평균 에너지, 힘 및 압력 테스트 MAE가 각각 0.072eVÅ-1 및 0.41GPa로 원자당 평균 0.035eV를 달성했습니다.
그림 3: DFT 계산과 비교한 테스트 데이터 세트에 대한 모델 예측.
테스트 데이터에서는 DFT와 모델 예측 간 선형 적합성의 높은 선형성과 R2 값에서 알 수 있듯이 모델 예측과 DFT 실제값이 잘 일치합니다. 모델 오류의 누적 분포는 데이터의 50%가 원자당 각각 0.01eV, 0.033eVÅ−1 및 0.042GPa 미만의 에너지, 힘 및 응력 오류를 가짐을 보여줍니다. M3GNet에 의해 계산된 Debye 온도는 덜 정확합니다. 이는 M3GNet의 전단 계수 예측이 상대적으로 좋지 않기 때문일 수 있지만 체적 계수 예측은 합리적입니다.
M3GNet IAP는 최종 DFT 구조가 선험적으로 알려지지 않은 재료 발견 워크플로우를 시뮬레이션하기 위해 적용됩니다. M3GNet 완화는 3,140개 재료의 테스트 데이터 세트에서 초기 구조에 대해 수행되었습니다. M3GNet 완화된 구조의 에너지 계산은 원자당 0.035eV의 MAE를 산출했으며, 재료의 80%는 원자당 0.028eV 미만의 오류를 가졌습니다. M3GNet을 사용한 완화된 구조의 오류 분포는 알려진 DFT 최종 구조의 오류 분포와 유사하며, 이는 M3GNet이 올바른 구조를 얻는 데 정확하게 도움이 될 가능성이 있음을 나타냅니다. 일반적으로 M3GNet의 완화는 빠르게 수렴됩니다.
그림 4: M3GNet을 사용한 결정 구조의 완화. (출처: Paper)
신소재 발견
M3GNet은 임의의 결정 구조를 정확하고 신속하게 완화하고 에너지를 예측할 수 있어 대규모 소재 발견에 이상적입니다. 연구원들은 M3GNet IAP를 사용하여 구조를 완화하고 재료 프로젝트 볼록 선체(Ehull-m)까지의 부호 있는 에너지 거리를 계산하여 출발점으로 31,664,858개의 후보 구조를 생성했습니다. 1,849,096개의 재료는 원자당 0.01eV 미만의 Ehull-m을 가졌습니다.
재료 발견에 대한 M3GNet의 성능에 대한 추가 평가로서, 연구원들은 Ehull-m이 0.001 eV/atom(Ehull−dft ≤ 0)인 약 180만 개의 재료에서 1000개의 구조를 균일하게 샘플링하는 DFT 안정 재료로서의 발견 비율을 계산했습니다. 비율. 발견률은 원자당 약 0.5eV인 Ehull-m 임계값까지 1.0에 가깝게 유지되며, 가장 엄격한 임계값인 원자당 0.001eV에서는 합리적으로 높은 값인 0.31을 유지합니다.
그림 5: 1000개 구조의 균일 샘플에 대한 Ehull−m 임계값의 함수로서 DFT 안정성 비율. (출처: 논문)
이 자료 세트에 대해 연구원들은 M3GNet 사전 완화가 있는 경우와 없는 경우의 DFT 완화 시간 비용도 비교했습니다. 결과는 M3GNet 사전 완화가 없으면 DFT 완화 시간 비용이 M3GNet 사전 완화의 비용의 약 3배임을 보여줍니다.
그림 6: M3GNet 사전 완화를 사용한 DFT 가속. (출처: Paper)
현재 Mattverse.ai에 있는 3,100만 개의 재료 중 100만 개 이상이 잠재적으로 안정적일 것으로 예상됩니다. Ong과 그의 팀은 재료의 수뿐만 아니라 이전에 개발한 다중 충실도 접근 방식을 사용하여 소량 데이터 볼륨에 대한 높은 가치 속성을 포함하여 ML이 예측할 수 있는 속성의 수도 크게 확장할 계획입니다.
M3GNet IAP는 구조적 완화 외에도 재료 동적 시뮬레이션 및 성능 예측에도 널리 사용됩니다.
“예를 들어, 우리는 리튬 이온 배터리의 전극이나 전해질에서 리튬 이온의 확산 속도에 관심을 갖는 경우가 많습니다. 확산이 빠를수록 배터리를 더 빨리 충전하거나 방전할 수 있습니다.”라고 Ong은 말했습니다. "우리는 M3GNet IAP를 사용하여 재료의 리튬 전도성을 높은 정확도로 예측할 수 있음을 입증했습니다. 우리는 M3GNet 아키텍처가 새로운 재료 화학 및 구조를 탐색하는 능력을 크게 확장할 수 있는 혁신적인 도구라고 굳게 믿습니다." M3GNet을 홍보하기 위해 팀은 프레임워크를 Github에 오픈 소스 Python 코드로 출시했습니다. M3GNet IAP를 상용 재료 시뮬레이션 패키지에 도구로 통합할 계획이 있습니다.
위 내용은 주기율표 전체에 공통적으로 적용되는 AI는 물질의 구조와 특성을 즉시 예측합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!