AI가 또 대단한 성과를 냈습니다.
이번 새로운 AI 머신러닝 알고리즘 '이카루스'는 암세포와 정상세포의 유전적 특성 차이를 해독할 수 있습니다.
이 연구는 MDC 생물정보학자인 Altuna Akalin 팀에 의해 완료되었으며 Nature 부저널 "Genome Biology"에 게재되었습니다.
논문 주소: https://genomebiology.biomedcentral.com/articles/10.1186/s13059-022-02683-1#Sec8
소속 기관, MDC (Max Delbrück 센터)는 독일 4대 연구 기관 중 하나인 헬름홀츠 협회(Helmholtz Association)의 16개 연구 센터 중 하나이기도 합니다.
그렇게 큰 배경이 있는데, 이 연구가 왜 그렇게 중요한가요?
광대한 데이터 세트에서 '공통적인 특성'을 가려내면 인간은 확실히 AI만큼 좋지 않습니다.
암세포와 정상세포를 구별하려면 암세포 사이의 공통적인 특징을 가려내야 합니다.
이번 MDC 연구팀이 개발한 이카루스는 일련의 게놈 특징으로 구성되어 있으며 다양한 종류의 암에서 흔히 나타나는 종양세포의 공통 패턴(Pattern)을 발견했습니다.
또한 알고리즘은 암과 관련이 없는 유전자 유형도 감지했습니다.
그래서 연구팀은 간단한 질문을 던졌습니다.
다양한 암 유형에 걸쳐 종양 세포와 정상 세포를 정확하게 구별하는 분류기를 만드는 것이 가능할까요?
그래서 이카루스가 태어났습니다. 여기에는 두 가지 단계가 포함됩니다.
1. 전문적으로 주석이 달린 여러 단일 세포 데이터 세트를 통합하여 유전자 세트 형태로 포괄적인 종양 세포 특성을 발견합니다.
2. 종양과 정상을 엄격하게 구별하기 위해 강력한 로지스틱 회귀 분류기를 훈련합니다. 맞춤형 셀-셀 네트워크를 사용하여 셀 라벨을 네트워크 기반으로 전파합니다.
팀 리더인 Altuna Akalin은 다음과 같이 말했습니다:
견고하고 민감하며 재현 가능한 in silico 종양 세포 분류기를 개발하기 위해 우리는 이미 다양한 시퀀싱 기술을 사용하여 얻은 다양한 암 유형의 여러 단일 샘플을 테스트하고 있습니다. 다양한 실험 환경에 대한 적합성을 결정하기 위한 세포 데이터 세트입니다.
논문의 첫 번째 저자인 Jan Dohmen은 전문가들이 이미 건강한 세포와 암세포를 명확하게 구분하고 있는 상황에서 적절한 훈련 데이터를 얻는 것이 주요 과제라고 말했습니다.
단일 세포 시퀀싱 데이터 세트는 종종 매우 복잡합니다.
이는 각 세포에서 서로 다른 수의 유전자가 검출되거나 샘플이 항상 동일한 방식으로 처리되지 않기 때문에 개별 세포의 분자 특성에 대해 포함된 정보가 그다지 정확하지 않다는 것을 의미합니다.
Dohmen과 연구 공동 책임자인 Vedran Franke 박사는 다음과 같이 말했습니다.
우리는 충분한 데이터 세트를 얻기 위해 수많은 출판물을 선별하고 몇몇 연구 그룹에 연락했습니다. 팀은 궁극적으로 폐암과 대장암 세포의 데이터를 선택하여 알고리즘을 훈련한 다음 다른 유형의 종양의 데이터 세트에 적용했습니다.
훈련 단계에서 Ikarus는 "서명 유전자 목록"을 찾은 다음 이를 사용하여 세포를 분류해야 합니다.
우리는 다양한 방법을 시도하고 개선한 결과 Ikarus는 결국 두 개의 목록을 사용하게 되었습니다. 하나는 암 유전자에 대한 목록이고 다른 하나는 다른 세포의 유전자에 대한 목록이라고 Frank는 설명했습니다.
훈련 후에 알고리즘은 건강한 세포와 간암이나 신경모세포종 환자의 조직 샘플과 같은 다른 유형의 암의 종양 세포를 구별할 수 있습니다.
다른 샘플의 결과도 흥미롭고, 성공률도 최대 99%로 놀라울 정도로 높습니다.
"우리는 다양한 유형의 암에서 종양 세포를 이렇게 정확하게 정의할 수 있는 공통 서명이 있을 것이라고는 예상하지 못했습니다."라고 Akalin은 말했습니다.
"그러나 이 접근법이 모든 유형의 암에 효과가 있는지 여부는 여전히 말할 수 없습니다"라고 Dohmen은 덧붙였습니다.
Ikarus를 신뢰할 수 있는 암 진단 도구로 만들기 위해 연구자들은 이제 다른 유형의 종양에서도 이를 테스트할 수 있기를 희망합니다.
초기 테스트에서 Ikarus는 이 방법이 종양 세포 검출에만 국한되지 않고 종양 세포에서 다른 유형의 세포(및 특정 하위 유형)도 구별할 수 있음을 입증했습니다.
세포 유형과 같은 모든 세포 상태를 감지하는 데 사용할 수 있으며 유일한 요구 사항은 세포 상태가 최소한 두 번의 독립적인 실험에 존재한다는 것입니다.
Akalin은 다음과 같이 말했습니다:
우리는 이 방법을 더욱 포괄적으로 만들고, 생검에서 가능한 모든 세포 유형을 구별할 수 있도록 더욱 발전시키고 싶습니다.
공간 시퀀싱 데이터 세트에 자동화된 종양 분류를 적용하면 조직학적 샘플에 직접 주석을 달 수 있으므로 자동화된 디지털 병리학이 촉진됩니다.
병원에서 병리학자는 다양한 세포 유형을 식별하기 위해 종양의 조직 샘플을 현미경으로 검사하는 경우가 많습니다. 이는 시간이 많이 걸리고 힘든 작업입니다.
Ikarus를 사용하면 언젠가 이 단계가 완전히 자동화된 프로세스가 될 수 있습니다.
또한 Akalin은 이러한 데이터를 사용하여 종양의 즉각적인 환경에 대한 결론을 도출할 수 있다고 언급했습니다. 이는 의사가 최선의 치료법을 선택하는 데 도움이 될 수 있습니다. 암 조직과 미세환경의 구성은 종종 치료나 약물이 효과적인지 여부를 나타냅니다.
또한 인공지능은 신약 개발에도 도움이 될 수 있습니다.
"Ikarus를 사용하면 암을 유발할 수 있는 유전자를 식별한 다음 새로운 치료제로 이러한 분자 구조를 표적으로 삼을 수 있습니다"라고 Akalin은 말했습니다.
위 내용은 네이처 서브저널: AI 알고리즘이 암세포의 유전적 특성을 99% 정확도로 해독합니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!