Tencent와 Peking University 팀은 처음부터 항체를 설계하여 대규모 언어 모델을 사전 훈련하고 Nature 하위 저널에 게시했습니다. Editor |. Teknologi KX

AI telah mencapai kemajuan besar dalam membantu reka bentuk antibodi. Walau bagaimanapun, reka bentuk antibodi masih banyak bergantung pada pengasingan antibodi khusus antigen daripada serum, yang merupakan proses intensif sumber dan memakan masa.

Untuk menyelesaikan masalah ini, pasukan penyelidik Tencent AI Lab, Peking University Shenzhen Graduate School dan Xijing Digestive Disease Hospital mencadangkan model bahasa besar generasi antibodi terlatih (PALM-H3) untuk penjanaan de novo antibodi dengan kekhususan pengikatan antigen yang diperlukan Antibodi buatan yang unik CDRH3 mengurangkan pergantungan pada antibodi semula jadi.

Selain itu, model ramalan pengikat antigen-antibodi berketepatan tinggi A2binder direka untuk memadankan jujukan epitop antigen dengan jujukan antibodi untuk meramalkan kekhususan dan pertalian pengikatan.

Ringkasnya, kajian ini mewujudkan rangka kerja kecerdasan buatan untuk penjanaan dan penilaian antibodi, yang berpotensi untuk mempercepatkan pembangunan ubat antibodi dengan ketara.

Penyelidikan berkaitan bertajuk "Generasi de novo antibodi SARS-CoV-2 CDRH3 dengan model bahasa besar generatif terlatih" telah diterbitkan dalam "Nature Communications" pada 10 Ogos.

Tencent와 Peking University 팀은 처음부터 항체를 설계하여 대규모 언어 모델을 사전 훈련하고 Nature 하위 저널에 게시했습니다.

Pautan kertas: https://www.nature.com/articles/s41467-024-50903-y

Ubat antibodi, juga dikenali sebagai antibodi monoklonal, memainkan peranan penting dalam kesan terapi biologi. Dengan meniru tindakan sistem imun, ubat-ubatan ini secara terpilih boleh menyasarkan agen penyebab penyakit seperti virus dan sel kanser. Ubat antibodi adalah pendekatan yang lebih spesifik dan berkesan daripada rawatan tradisional. Ubat antibodi telah menunjukkan hasil yang positif dalam merawat pelbagai penyakit.

Membangunkan ubat antibodi ialah proses kompleks yang melibatkan pengasingan antibodi daripada sumber haiwan, memanusiakannya dan mengoptimumkan pertaliannya. Tetapi perkembangan ubat antibodi masih banyak bergantung pada antibodi semula jadi.

Data jujukan protein boleh dilihat sebagai bahasa, jadi model pra-latihan berskala besar dalam bidang pemprosesan bahasa semula jadi (NLP) telah digunakan untuk mempelajari corak perwakilan protein. Pelbagai model bahasa protein telah dibangunkan. Walau bagaimanapun, menjana antibodi dengan pertalian tinggi untuk epitop tertentu kekal sebagai tugas yang mencabar kerana kepelbagaian antibodi yang tinggi dan kekurangan data pasangan antigen-antibodi yang tersedia.

Untuk menangani cabaran di atas, pasukan Tencent AI Lab mencadangkan model bahasa berskala besar generasi antibodi terlatih PALM-H3 untuk mengoptimumkan dan menjana rantau penentu kesempurnaan rantaian berat 3 (CDRH3), yang memainkan peranan penting dalam kekhususan dan kepelbagaian antibodi memainkan peranan penting.

Untuk menilai pertalian antibodi yang dihasilkan oleh PALM-H3 untuk antigen, penyelidik menggunakan gabungan dok antigen-antibodi dan kaedah berasaskan AI.

Para penyelidik juga membangunkan A2binder untuk menilai pertalian antibodi-antigen. A2binder membolehkan ramalan pertalian yang tepat dan boleh digeneralisasikan, walaupun untuk antigen yang tidak diketahui.

Rangka kerja PALM-H3 dan A2Binder

Aliran kerja dan rangka kerja model PALM-H3 dan A2binder ditunjukkan dalam rajah di bawah.

Tencent와 Peking University 팀은 처음부터 항체를 설계하여 대규모 언어 모델을 사전 훈련하고 Nature 하위 저널에 게시했습니다.

Ilustrasi: Gambaran keseluruhan aliran kerja PALM-H3 dan A2binder. (Sumber: kertas)

PALM-H3 direka untuk menjana urutan CDRH3 de novo dalam antibodi. Rantau CDRH3 memainkan peranan paling penting dalam menentukan kekhususan mengikat antibodi untuk urutan antigen tertentu. PALM-H3 ialah model seperti pengubah yang menggunakan model antigen berasaskan ESM2 sebagai pengekod dan Roformer antibodi sebagai penyahkod. Kajian itu juga membina A2binder untuk meramalkan pertalian mengikat antibodi yang dihasilkan secara buatan.

Pembinaan PALM-H3 dan A2binder merangkumi tiga langkah: Pertama, para penyelidik telah melatih dua model Roformer masing-masing pada rantai berat antibodi tidak berpasangan dan urutan rantai ringan. Kemudian, A2binder dibina berdasarkan ESM2 terlatih, Roformer rantai berat antibodi dan Roformer rantai ringan antibodi, dan dilatih menggunakan data pertalian berpasangan. Akhirnya, PALM-H3 telah dibina menggunakan ESM2 terlatih dan Roformer rantai berat antibodi dan dilatih pada data antigen-CDRH3 berpasangan untuk menjana CDRH3 de novo.

A2binder boleh meramal dengan tepat kebarangkalian pengikatan antigen-antibodi, pertalian

Prestasi A2binder dinilai dengan membandingkan keupayaannya untuk meramalkan pertalian dengan beberapa kaedah asas.

A2binder berfungsi dengan baik pada set data perkaitan, sebahagiannya disebabkan oleh pra-latihan pada jujukan antibodi, yang membolehkan A2binder mempelajari corak unik yang terdapat dalam jujukan ini.

Tencent와 Peking University 팀은 처음부터 항체를 설계하여 대규모 언어 모델을 사전 훈련하고 Nature 하위 저널에 게시했습니다.

그림: 사전 훈련된 모델과 훈련되지 않은 모델의 잠재적 기능 비교 및 항체-항원 결합 특이성을 예측하는 데 있어 A2Binder와 기본 방법의 성능 비교. (출처: 논문)

결과는 A2binder가 모든 항원-항체 친화성 예측 데이터 세트에서 기본 모델 ESM-F보다 더 나은 성능을 발휘한다는 것을 보여줍니다(후자는 동일한 프레임워크를 가지고 있지만 사전 훈련된 모델 ESM2 치환임), 이는 항체 서열을 사용한 사전 훈련이 관련 다운스트림 작업에 유익할 수 있음을 시사합니다.

친화성 값 예측에서 모델의 성능을 평가하기 위해 연구원들은 선호도 값 레이블이 포함된 두 개의 데이터 세트 14H 및 14L도 활용했습니다.

Tencent와 Peking University 팀은 처음부터 항체를 설계하여 대규모 언어 모델을 사전 훈련하고 Nature 하위 저널에 게시했습니다.

A2binder는 Pearson 상관관계 및 Spearman 상관관계 지표 모두에서 모든 기준 모델보다 성능이 뛰어납니다. A2binder는 14H 데이터세트에서 0.642(3% 개선), 14L 데이터세트에서 0.683(1% 개선)의 Pearson 상관관계를 달성했습니다.

그러나 A2binder 및 기타 기본 모델의 성능은 다른 데이터 세트에 비해 14H 및 14L 데이터 세트에서 약간 떨어졌습니다. 이 관찰은 이전 연구와 일치합니다.

PALM-H3는 고결합 확률 항체 생성에 탁월합니다

연구원들은 PALM-H3에서 생성된 항체와 천연 항체의 차이점을 탐구했습니다. 항체의 차이. 그들의 서열은 상당히 다른 것으로 밝혀졌지만, 생산된 항체의 결합 확률은 이러한 차이에 의해 크게 영향을 받지 않았습니다. 동시에 구조적 차이로 인해 결합 친화력이 감소합니다. 이러한 결과는 항체 라이브러리의 네트워크 분석 및 기능성 단백질 서열 생성에 대한 이전 연구와 일치합니다.

Tencent와 Peking University 팀은 처음부터 항체를 설계하여 대규모 언어 모델을 사전 훈련하고 Nature 하위 저널에 게시했습니다.

Illustration: 기준 방법과 인공 및 천연 항체의 유사성 분석을 통한 성능 비교. (출처: 논문)

전반적으로 PALM-H3는 천연항체와는 달리 높은 결합력을 지닌 다양한 항체 서열을 생성할 수 있는 것으로 나타났다.

또한 연구진은 ClusPro와 SnugDock을 통해 PALM-H3의 성능을 검증했습니다. PALM-H3는 SARS-CoV-2의 HR2 영역에 있는 안정화 펩타이드인 CDRH3 서열에 대한 항체를 생성할 수 있습니다. 새로운 CDRH3 서열을 생성하고 생성된 서열 GRREAAWALA가 천연 CDHR3 서열 GKAAGTFDS에 비해 항원 안정화 펩타이드의 표적화를 향상시켰다는 것을 검증했습니다. #… 계산 구조 생성 방법. (출처: 논문)

또한 PALM-H3는 새로운 SARS-CoV-2 변종 XBB CDRH3 서열에 대해 더 높은 친화성을 갖는 항체를 생성할 수 있습니다. 결과 시퀀스 AKDSRTSPLRLDYS는 소스인 ASEVLDNLRDGYNF보다 XBB에 대해 더 강한 친화력을 갖습니다. Tencent와 Peking University 팀은 처음부터 항체를 설계하여 대규모 언어 모델을 사전 훈련하고 Nature 하위 저널에 게시했습니다.

또한 PALM-H3는 전통적인 순차적 돌연변이 전략이 직면한 국소 최적의 함정을 극복할 뿐만 아니라 E-EVO 접근법에 비해 항원 결합 친화도가 더 높은 항체를 생성합니다. 이는 항체 설계에서 PALM-H3의 장점을 강조하여 서열 공간을 보다 효율적으로 탐색하고 특정 에피토프를 표적으로 하는 고친화성 바인더를 생성할 수 있게 해줍니다.

시험관 내 실험

또한 연구진은 웨스턴 블로팅, 표면 플라스몬 공명 분석, 슈도바이러스 중화 등의 체외 실험도 진행했습니다. 실험은 PALM-H3 설계 항체의 효과에 대한 핵심 검증을 제공했습니다.

Illustration: 인공 및 천연 항체의 결합 친화도 및 중화에 대한 시험관 내 테스트. (출처: 논문)

PALM-H3 SARS-CoV-2 야생형에 대해 생성된 두 가지 항체, Alpha, Delta 및 XBB 변형 스파이크 단백질은 이러한 실험에서 원래 수준보다 높은 수준을 달성했습니다. 항체의 중화 효능. 이러한 습식 실험실 실험의 강력한 경험적 결과는 컴퓨터 예측 및 분석을 보완하여 PALM-H3 및 A2binder가 알려진 항원과 새로운 항원에 대해 높은 특이성과 친화력을 가진 강력한 항체를 생성하고 선택하는 능력을 검증합니다. Tencent와 Peking University 팀은 처음부터 항체를 설계하여 대규모 언어 모델을 사전 훈련하고 Nature 하위 저널에 게시했습니다.

요약하면, 제안된 PALM-H3는 대규모 항체 사전 훈련 능력과 전역 특징 융합의 효율성을 통합하여 우수한 친화도 예측 성능과 고친화도 항체 설계 능력을 제공합니다. . 또한 직접적인 서열 생성과 해석 가능한 중량 시각화 덕분에 친화력이 높은 항체를 설계하는 데 효율적이고 해석 가능한 도구가 됩니다.

위 내용은 Tencent와 Peking University 팀은 처음부터 항체를 설계하여 대규모 언어 모델을 사전 훈련하고 Nature 하위 저널에 게시했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!