Tsinghua 팀은 지식 기반 그래프를 제안합니다. Transformer 사전 훈련 프레임워크: 분자 표현 학습을 개선하는 방법
분자 특성 예측을 용이하게 하려면 신약 개발 분야에서 효과적인 분자 특징 표현을 배우는 것이 매우 중요합니다. 최근 사람들은 자기 지도 학습 기술을 사용하여 그래프 신경망(GNN)을 사전 훈련함으로써 데이터 부족 문제를 극복했습니다. 그러나 자기 지도 학습을 기반으로 하는 현재 방법에는 두 가지 주요 문제가 있습니다. 명확한 자기 지도 학습 전략이 부족하고 GNN의 제한된 기능입니다.
최근 Tsinghua University, West Lake University 및 Zhijiang Laboratory의 연구팀이 지식을 제안했습니다. 지침 KPGT(Knowledge-guided Pre-training of Graph Transformer)는 크게 향상된 분자 표현 학습을 통해 분자 특성에 대한 개선되고 일반화 가능하며 강력한 예측을 제공하는 자기 지도 학습 프레임워크입니다. KPGT 프레임워크는 분자 그래프용으로 특별히 설계된 그래프 변환기와 지식 기반 사전 학습 전략을 통합하여 분자의 구조적, 의미적 지식을 완벽하게 포착합니다.
KPGT는 63개 데이터 세트에 대한 광범위한 컴퓨터 테스트를 통해 다양한 분야에서 분자 특성 예측에 탁월한 성능을 입증했습니다. 또한, 두 가지 항종양 표적에 대한 잠재적인 억제제를 식별함으로써 신약 발굴에서 KPGT의 실제 적용 가능성을 검증했습니다. 전반적으로 KPGT는 AI 지원 약물 발견 프로세스를 발전시키기 위한 강력하고 유용한 도구를 제공할 수 있습니다.
이 연구의 제목은 "분자 표현 학습 개선을 위한 지식 기반 사전 훈련 프레임워크"이며 2023년 11월 21일 "Nature Communications"에 게재되었습니다.
분자 특성을 실험적으로 결정하려면 상당한 시간과 자원이 필요하며, 원하는 특성을 가진 분자를 식별하는 것은 약물 발견에서 가장 중요한 과제 중 하나입니다. 최근 몇 년 동안 인공지능 기반 방법은 분자 특성을 예측하는 데 점점 더 중요한 역할을 하고 있습니다. 분자 특성을 예측하기 위한 AI 기반 방법의 주요 과제 중 하나는 분자의 특성화입니다
최근 몇 년 동안 딥 러닝 기반 방법은 분자 특성을 예측하는 데 잠재적으로 유용한 도구로 부상했습니다. 간단한 입력 데이터를 효과적으로 특성화하는 탁월한 능력. 특히 RNN(Recurrent Neural Network), CNN(Convolutional Neural Network), GNN(Graph Neural Network)을 포함한 다양한 신경망 아키텍처는 단순화된 분자 입력부터 라인 입력 시스템에 이르기까지 다양한 형식의 분자 데이터를 모델링하는 데 능숙합니다. SMILES)을 분자 이미지와 분자 다이어그램으로 변환합니다. 그러나 마커 분자의 제한된 가용성과 화학적 공간의 광대함은 특히 배포되지 않은 데이터 샘플을 처리할 때 예측 성능을 제한합니다.
자연어 처리 및 컴퓨터 비전 분야에서 자기 지도 학습 방법의 놀라운 성과를 통해 이러한 기술은 GNN을 사전 훈련하고 분자의 표현 학습을 개선하는 데 적용되어 다운스트림 분자 특성 예측 작업에서 상당한 결과를 얻었습니다. . Progress
연구원들은 분자 특성을 정량적으로 설명하는 추가 지식을 자기 지도 학습 프레임워크에 도입하면 이러한 문제를 효과적으로 해결할 수 있다고 가정합니다. 분자는 현재 확립된 계산 도구를 사용하여 쉽게 얻을 수 있는 분자 설명자 및 지문과 같은 많은 정량적 특성을 가지고 있습니다. 이러한 추가 지식을 통합하면 풍부한 분자 의미론적 정보를 자기 지도 학습에 도입할 수 있으므로 의미론적으로 풍부한 분자 표현의 획득이 크게 향상됩니다.
일반적으로 기존의 자기 지도 학습 방법은 GNN을 핵심 모델로 사용합니다. 그러나 GNN은 모델 용량이 제한되어 있습니다. 또한 GNN은 원자 간의 장거리 상호 작용을 포착하는 데 어려움을 겪을 수 있습니다. 그리고 Transformer 기반 모델은 판도를 바꾸는 모델이 되었습니다. 이는 매개변수 수가 증가하고 장거리 상호 작용을 포착하는 능력이 특징이며, 분자의 구조적 특징을 종합적으로 모델링하는 유망한 접근 방식을 제공합니다
자기 지도 학습 프레임워크 KPGT
이 연구에서 연구원들은 KPGT라는 자기 지도 학습 프레임워크는 분자 표현 학습을 향상시켜 다운스트림 분자 특성 예측 작업을 촉진하기 위해 개발되었습니다. KPGT 프레임워크는 LiGhT(Line Graph Transformer)라는 백본 모델과 지식 기반 사전 학습 정책이라는 두 가지 주요 구성 요소로 구성됩니다. KPGT 프레임워크는 분자 그래프 구조를 정확하게 모델링하도록 특별히 설계된 고용량 LiGhT 모델을 결합하고 지식 기반 사전 학습 전략을 활용하여 분자 구조와 의미 지식을 포착합니다.
연구팀은 ChEMBL29 데이터 세트 Molecule, LiGhT는 지식 기반 사전 학습 전략
재작성된 콘텐츠: 다이어그램: KPGT 개요를 통해 사전 학습되었습니다. (출처: 논문)
KPGT는 분자 특성 예측에서 기본 방법보다 성능이 뛰어납니다. 여러 기본 방법과 비교하여 KPGT는 63개 데이터 세트에서 상당한 개선을 달성했습니다.
또한 KPGT를 사용하여 두 가지 항종양 표적인 조혈 전구 키나제 1(HPK1)과 섬유아세포 성장 인자 수용체(FGFR1)의 잠재적 억제제를 식별하는 데 성공함으로써 KPGT의 실제 적용이 입증되었습니다.
연구 한계
효과적인 분자 특성 예측에 있어서 KPGT의 장점에도 불구하고 여전히 몇 가지 한계가 있습니다.
우선, 추가 지식의 통합이 제안된 방법의 가장 중요한 특징입니다. KPGT에서 사용되는 200개의 분자 설명자와 512개의 RDKFP 외에도 다양한 유형의 추가 정보 지식을 통합할 수 있는 잠재력이 있습니다. 또한 추가 연구를 통해 3차원(3D) 분자 형태를 사전 학습 프로세스에 통합하여 모델이 분자에 대한 중요한 3D 정보를 캡처하고 잠재적으로 표현 학습 기능을 향상시킬 수 있습니다. KPGT는 현재 약 1억 개의 매개변수와 200만 개의 분자에 대한 사전 훈련을 갖춘 백본 모델을 사용하고 있지만 대규모 사전 훈련을 탐색하면 분자 표현 학습에 더 실질적인 이점을 제공할 수 있습니다.
전반적으로 KPGT는 효과적인 분자 표현 학습을 위한 강력한 자기 지도 학습 프레임워크를 제공하여 인공 지능 지원 약물 발견 분야를 발전시킵니다.
논문 링크: https://www.nature.com/articles/s41467-023-43214-1
위 내용은 Tsinghua 팀은 지식 기반 그래프를 제안합니다. Transformer 사전 훈련 프레임워크: 분자 표현 학습을 개선하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











확산은 더 잘 모방할 수 있을 뿐만 아니라 "창조"할 수도 있습니다. 확산 모델(DiffusionModel)은 이미지 생성 모델입니다. AI 분야에서 잘 알려진 GAN, VAE 알고리즘과 비교할 때 확산 모델은 먼저 이미지에 노이즈를 추가한 다음 점차적으로 노이즈를 제거하는 프로세스를 취합니다. 원본 이미지의 노이즈를 제거하고 복원하는 방법이 알고리즘의 핵심 부분입니다. 최종 알고리즘은 임의의 잡음이 있는 이미지에서 이미지를 생성할 수 있습니다. 최근 몇 년 동안 생성 AI의 경이적인 성장으로 인해 텍스트-이미지 생성, 비디오 생성 등에서 많은 흥미로운 애플리케이션이 가능해졌습니다. 이러한 생성 도구의 기본 원리는 이전 방법의 한계를 극복하는 특수 샘플링 메커니즘인 확산의 개념입니다.

키미: 단 한 문장이면 단 10초만에 PPT가 완성됩니다. PPT가 너무 짜증나네요! 회의를 하려면 PPT가 있어야 하고, 주간 보고서를 작성하려면 PPT가 있어야 하며, 누군가를 부정행위를 했다고 비난하려면 PPT를 보내야 합니다. 대학은 PPT 전공을 공부하는 것과 비슷합니다. 수업 시간에 PPT를 보고 수업 후에 PPT를 하는 거죠. 아마도 데니스 오스틴이 37년 전 PPT를 발명했을 때, 언젠가 PPT가 이렇게 널리 보급될 것이라고는 예상하지 못했을 것입니다. 우리가 PPT를 만들면서 힘들었던 경험을 이야기하면 눈물이 납니다. "20페이지가 넘는 PPT를 만드는 데 3개월이 걸렸고, 수십 번 수정했어요. PPT를 보면 토할 것 같았어요. 한창 때는 하루에 다섯 장씩 했는데, 숨소리까지 냈어요." PPT였어요." 즉석 회의가 있으면 해야죠.

베이징 시간으로 6월 20일 이른 아침, 시애틀에서 열린 최고의 국제 컴퓨터 비전 컨퍼런스인 CVPR2024가 최우수 논문 및 기타 수상작을 공식 발표했습니다. 올해는 우수논문 2편, 최우수 학생논문 2편 등 총 10편의 논문이 수상하였습니다. 컴퓨터 비전(CV) 분야 최고 학회는 매년 수많은 연구기관과 대학이 모여드는 CVPR이다. 통계에 따르면 올해 총 1만1532편의 논문이 제출돼 2719편이 채택돼 합격률 23.6%를 기록했다. Georgia Institute of Technology의 CVPR2024 데이터 통계 분석에 따르면 연구 주제 관점에서 가장 많은 논문이 이미지 및 비디오 합성 및 생성입니다(Imageandvideosyn

널리 사용되는 프로그래밍 언어인 C언어는 컴퓨터 프로그래밍에 종사하려는 사람들이 꼭 배워야 할 기본 언어 중 하나이다. 그러나 초보자의 경우 새로운 프로그래밍 언어를 배우는 것이 다소 어려울 수 있습니다. 특히 관련 학습 도구와 교육 자료가 부족하기 때문입니다. 이번 글에서는 초보자가 C 언어를 시작하고 빠르게 시작할 수 있도록 도와주는 프로그래밍 소프트웨어 5가지를 소개하겠습니다. 최초의 프로그래밍 소프트웨어는 Code::Blocks였습니다. Code::Blocks는 무료 오픈 소스 통합 개발 환경(IDE)입니다.

우리는 LLM이 대규모 데이터를 사용하여 대규모 컴퓨터 클러스터에서 훈련된다는 것을 알고 있습니다. 이 사이트는 LLM 훈련 프로세스를 지원하고 개선하는 데 사용되는 다양한 방법과 기술을 소개합니다. 오늘 우리가 공유하고 싶은 것은 기본 기술에 대해 심층적으로 살펴보고 운영 체제 없이도 수많은 "베어 메탈"을 LLM 교육을 위한 컴퓨터 클러스터로 전환하는 방법을 소개하는 기사입니다. 이 기사는 기계가 생각하는 방식을 이해하여 일반 지능을 달성하기 위해 노력하는 AI 스타트업 Imbue에서 가져온 것입니다. 물론 운영 체제가 없는 "베어 메탈"을 LLM 교육을 위한 컴퓨터 클러스터로 전환하는 것은 탐색과 시행착오로 가득 찬 쉬운 과정이 아니지만 Imbue는 마침내 700억 개의 매개변수를 사용하여 LLM을 성공적으로 교육했습니다. 과정이 쌓이다

PyCharm Community Edition 빠른 시작: 자세한 설치 튜토리얼 전체 분석 소개: PyCharm은 개발자가 Python 코드를 보다 효율적으로 작성하는 데 도움이 되는 포괄적인 도구 세트를 제공하는 강력한 Python 통합 개발 환경(IDE)입니다. 이 문서에서는 PyCharm Community Edition을 설치하는 방법을 자세히 소개하고 초보자가 빠르게 시작할 수 있도록 구체적인 코드 예제를 제공합니다. 1단계: PyCharm Community Edition 다운로드 및 설치 PyCharm을 사용하려면 먼저 공식 웹사이트에서 다운로드해야 합니다.

Machine Power Report 편집자: Yang Wen 대형 모델과 AIGC로 대표되는 인공지능의 물결은 우리가 살고 일하는 방식을 조용히 변화시키고 있지만 대부분의 사람들은 여전히 그것을 어떻게 사용하는지 모릅니다. 이에 직관적이고 흥미롭고 간결한 인공지능 활용 사례를 통해 AI 활용 방법을 자세히 소개하고 모두의 사고를 자극하고자 'AI in Use' 칼럼을 론칭하게 됐다. 또한 독자들이 혁신적인 실제 사용 사례를 제출하는 것을 환영합니다. 영상 링크 : https://mp.weixin.qq.com/s/2hX_i7li3RqdE4u016yGhQ 최근 샤오홍슈에서는 혼자 사는 소녀의 인생 브이로그가 인기를 끌었습니다. 몇 가지 치유의 말과 함께 일러스트레이션 스타일의 애니메이션을 단 며칠 만에 쉽게 익힐 수 있습니다.

제목: 기술 초보자가 꼭 읽어야 할 책: C언어와 Python의 난이도 분석, 구체적인 코드 예제가 필요한 오늘날의 디지털 시대에 프로그래밍 기술은 점점 더 중요한 능력이 되었습니다. 소프트웨어 개발, 데이터 분석, 인공 지능과 같은 분야에서 일하고 싶거나 관심 있는 프로그래밍을 배우고 싶다면 적합한 프로그래밍 언어를 선택하는 것이 첫 번째 단계입니다. 많은 프로그래밍 언어 중에서 C 언어와 Python은 널리 사용되는 두 가지 프로그래밍 언어이며 각각 고유한 특성을 가지고 있습니다. 이번 글에서는 C언어와 Python의 난이도를 분석해보겠습니다.
