과학자들은 실험 데이터를 정확하게 설명하는 의미 있는 공식을 찾는 것을 목표로 합니다. 자연 현상의 수학적 모델은 도메인 지식을 기반으로 수동으로 생성할 수도 있고, 기계 학습 알고리즘을 사용하여 대규모 데이터 세트에서 자동으로 생성할 수도 있습니다. 학계에서는 관련 사전 지식과 관련 함수 모델을 병합하는 문제를 연구해 왔으며, 일반 논리 공리에 대한 사전 지식과 일치하는 모델을 찾는 것이 해결되지 않은 문제라고 믿고 있습니다.
IBM 연구진과 삼성 AI팀 연구진은 공리적 지식과 실험 데이터로부터 자연 현상 모델의 원리 분석을 수행하기 위해 논리적 추론과 기호 회귀를 결합하는 방법인 "AI-Descartes"를 개발했습니다.
이 연구의 제목은 "AI-Descartes를 통한 파생 가능한 과학적 발견을 위한 데이터 및 이론 결합"이며 2023년 4월 12일 "Nature Communications"에 게재되었습니다.
인공 신경망(NN)과 통계 회귀는 데이터의 패턴과 관계를 자동으로 발견하는 데 자주 사용됩니다. NN은 기본 함수가 일반적으로 예측에만 사용되는 '블랙박스' 모델을 반환합니다. 표준 회귀에서는 함수 형태가 미리 결정되어 있으므로 모델 발견은 매개변수 피팅에 해당합니다. 기호 회귀(SR)에서는 함수 형태가 미리 결정되지 않고 주어진 목록의 연산자(예: +, -, ×, ¼)로 구성되어 데이터에서 계산됩니다.
SR 모델은 일반적으로 NN 모델보다 "해석하기" 쉽고 데이터가 덜 필요합니다. 따라서 실험 데이터에서 기호적으로 자연법칙을 발견하려면 SR이 NN이나 고정형 회귀보다 더 효과적일 수 있습니다. NN과 SR의 통합은 최근 신경기호 AI 연구의 주제였습니다. SR의 주요 과제는 데이터에 적합한 많은 모델 중에서 과학적으로 의미 있는 모델을 식별하는 것입니다. 과학자들은 의미 있는 기능을 정확성과 복잡성의 균형을 맞추는 기능으로 정의합니다. 그러나 특정 데이터 세트에 대해 이러한 표현이 많이 존재하며 모든 표현이 알려진 배경 이론과 일치하는 것은 아닙니다.
또 다른 접근 방식은 알려진 배경 이론으로 시작하는 것이지만 현재 알려진 공리 세트에서 실험 데이터와 일치하는 정리를 생성할 수 있는 실용적인 추론 도구는 없습니다. ATP(Automatic Theorem Provers)는 주어진 논리 이론에 대한 추측을 증명할 수 있는 가장 널리 사용되는 추론 도구입니다. 계산상의 복잡성은 ATP의 주요 과제입니다. 일부 논리 유형에서는 추측이 결정 불가능하다는 것을 증명합니다.
게다가 형식 추론 도구를 사용하여 논리 이론에서 모델을 도출하는 것은 산술 및 미적분 연산자가 포함될 때 특히 어렵습니다. 예를 들어 강화 학습을 사용하여 검색 프로세스를 안내함으로써 ATP의 성능을 향상시키는 데 기계 학습 기술이 사용되었습니다.
파생 가능한 모델은 경험적으로 정확할 뿐만 아니라 예측 가능하고 통찰력이 있어야 합니다.
IBM 연구팀과 삼성 AI팀 연구진은 새로운 수학적 최적화 기반 SR 방법과 추론 시스템을 결합하여 이러한 모델을 얻으려고 했습니다. 그 결과 SR을 통해 데이터에서 공식을 추출한 다음 일련의 공리에서 공식 파생 가능성에 대한 증거를 제공하거나 불일치 증거를 제공하는 엔드투엔드 검색 시스템 "AI-Descartes"가 탄생했습니다. 모델이 파생 가능하지 않은 것으로 입증되면 연구자들은 공식이 파생 가능한 공식에 얼마나 가까운지를 나타내는 새로운 측정값을 제안하고 추론 시스템을 사용하여 이러한 측정값을 계산합니다.
그림: 시스템 개요. (출처: Paper)
기계 학습과 추론을 결합한 초기 작업에서 과학자들은 논리 기반 설명을 사용하여 이미지를 생성하는 GAN 신경 아키텍처의 출력을 제한했습니다. 미리 지정된 제약 조건을 충족하는 기능적 형태를 검색하기 위해 기계 학습 도구와 추론 엔진을 결합하는 팀도 있습니다. 이는 초기 데이터 세트에 새로운 포인트를 추가하여 학습 방법의 효율성과 최종 모델의 정확도를 향상시키는 것입니다. 일부 팀은 사전 지식을 활용하여 추가 데이터 포인트를 생성하기도 합니다. 그러나 이러한 연구에서는 학습할 함수 형태에 대한 제약만 고려했을 뿐 일반적인 배경 이론 공리(다른 법칙을 설명하는 논리적 제약 및 현상과 관련된 측정되지 않은 변수)는 포함하지 않았습니다.
논문의 제1저자이자 삼성 AI 연구 과학자인 크리스티나 코넬리오(Cristina Cornelio)는 AI-Descartes가 다른 시스템에 비해 몇 가지 장점을 제공하지만 가장 주목할만한 특징은 논리적 추론 능력이라고 말했습니다. 데이터에 잘 맞는 후보 방정식이 여러 개 있는 경우 시스템은 어떤 방정식이 배경 과학 이론에 가장 잘 맞는지 식별합니다. 또한 추론 능력은 대규모 언어 모델에서 제한된 논리 기능을 갖고 때로는 기본 수학을 엉망으로 만드는 ChatGPT와 같은 "생성 AI" 프로그램과도 시스템을 차별화합니다.
"우리 작업에서 우리는 기존 배경 이론에서 통찰력을 도출하기 위해 수세기 동안 과학자들이 사용해온 기계 학습 시대에 더 일반적인 데이터 기반 방법과 제1원리 방법을 결합하고 있습니다. "이 조합은 다음을 허용합니다. 우리는 두 가지 방법을 모두 활용하고 다양한 응용 분야에 대해 보다 정확하고 의미 있는 모델을 만들 수 있습니다."
AI-Descartes라는 이름은 17세기를 참조한 것입니다. 자연 현상을 믿었던 수학자이자 철학자 René Descartes에 대한 찬사입니다. 세상은 몇 가지 기본 물리 법칙으로 설명될 수 있으며 논리적 추론은 과학적 발견에 핵심적인 역할을 했습니다.
그림: 시스템 구현의 과학적 방법에 대한 설명. (출처: 논문)
이 팀의 연구원들은 논리적 추론과 상징적 회귀를 결합하는 것이 배경 이론과 영역의 좋은 일반화와 크게 일치하기 때문에 물리적 현상에 대한 의미 있는 상징적 모델을 얻는 데 큰 가치가 있음을 입증했습니다. 실험 데이터보다 크다. 회귀와 추론을 결합하면 SR이나 논리적 추론만 사용하는 것보다 더 나은 모델이 생성됩니다.
개별 시스템 구성 요소의 개선 또는 교체와 귀추적 추론 또는 실험 설계와 같은 새로운 모듈의 도입은 전체 시스템의 기능을 확장합니다. 추론과 회귀의 심층 통합은 데이터 중심 모델과 제1원리 기반 모델을 통합하는 데 도움이 되며 과학적 발견 프로세스에 혁명을 일으킬 수 있습니다. 사전 지식과 일치하는 모델을 발견하면 과학적 발견이 가속화되고 기존 발견 패러다임을 초월할 것입니다.
팀은 모델을 사용하여 케플러의 행성 운동 제3법칙, 아인슈타인의 상대론적 시간 팽창 법칙, 랭뮤어의 흡착 이론을 도출했으며, 연구에 따르면 유사한 오류가 있는 데이터를 구별하기 위해 논리적 추론을 사용할 때 후보 공식을 공식화할 때, 모델은 소수의 데이터 포인트에서 주요 패턴을 발견할 수 있습니다.
그림: 관련 집합과 거리의 시각화. (출처: 논문)
"이 작업에서는 배경 이론의 공리가 무엇인지, 그리고 만약 인간이 하나라도 놓치거나 틀린 경우에는 공식적이고 컴퓨터가 읽을 수 있는 방식으로 기록해 줄 인간 전문가가 필요합니다. UMBC의 화학, 생화학 및 환경 공학 조교수인 타일러 조셉슨(Tyler Josephson)은 "시스템이 작동하지 않을 것"이라고 말했습니다. "미래에는 이 작업 부분을 자동화하여 더 많은 과학 분야를 탐구할 수 있기를 희망합니다.
궁극적으로 팀은 AI-Descartes가 실제 과학자처럼 생산적이고 새로운 과학적 접근 방식에 영감을 줄 수 있기를 바랍니다. Cornelio는 "우리 작업의 가장 흥미로운 측면 중 하나는 과학 연구의 상당한 발전 가능성입니다."라고 말했습니다.
논문 링크: https://www.nature.com/articles/s41467-023-37236-y
관련 보고서: https://techxplore.com/news/2023-04-ai-scientist-combines-theory-scientific.html
위 내용은 새로운 'AI 과학자”는 이론과 데이터를 결합하여 과학 방정식을 발견합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!