UW-중국 팀의 새로운 다중 모드 데이터 분석 및 생성 방법 JAMIE는 세포 유형 및 기능 예측 능력을 크게 향상시킵니다.
최근에는 단세포 기술의 급속한 발전으로 단세포의 다양한 특성을 측정하여 단세포 다중 모드 데이터(예: scRNA-seq, scATAC-seq, Patch-seq)를 얻을 수 있게 되었습니다. ).
이 데이터는 세포 기능과 분자 메커니즘을 더 깊이 이해하는 데 도움이 됩니다. 예를 들어, 연구자들은 최근 기계 학습 방법을 사용하여 단일 세포 다중 모드 데이터 간의 관계를 분석하여 세포 유형 및 질병과 관련된 생물학적 메커니즘을 이해했습니다.
그러나 단일 셀 다중 모드 데이터를 획득하는 데는 비용이 많이 들고 모드 손실이 자주 발생합니다. 기존 기계 학습 방법은 일반적으로 데이터 채우기 및 삽입을 위해 완전히 일치하는 다중 모드 데이터가 필요하며 양식이 누락된 상황에는 적합하지 않습니다.
이 문제를 해결하기 위해 University of Wisconsin-Madison의 Wang Daifeng 연구실에서는 JAMIE(Joint Variational Autoencoders for Multimodal Imputation and Embedding)라는 공동 변형 자동 인코더를 기반으로 한 오픈 소스 기계 학습 방법을 개발했습니다.
JAMIE는 세포 유형과 기능을 더 잘 예측하기 위해 데이터 정렬, 임베딩, 누락 데이터 보완 등 단일 세포 다중 모드 데이터의 통합 분석에 사용할 수 있습니다.
이 연구는 최근 Nature Machine Intelligence에 게재되었습니다.
논문 주소: https://www.nature.com/articles/s42256-023-00663-z
프로젝트 주소: https://github.com/daifengwanglab /JAMIE
JAMIE 방법 소개
JAMIE는 재사용 가능한 관절 변형 자동 인코더 모델을 훈련하여 사용 가능한 다중 모드 데이터를 유사한 잠재 공간에 별도로 투영함으로써 단일 모드를 향상시킵니다. 상태 패턴을 추론하는 능력입니다.
그림 1에 표시된 것처럼 교차 모달 대체를 수행하기 위해 JAMIE는 데이터를 인코더에 공급한 다음 반대 디코더를 통해 잠재 공간 결과를 처리합니다.
JAMIE는 자동 인코더의 재사용 가능하고 유연한 잠재 공간 생성과 정렬 방법의 자동 대응 추정을 결합하여 불완전한 대응이 있는 다중 모드 데이터 처리를 가능하게 합니다.
그림 1. JAMIE 방법 개요
구체적으로 JAMIE는 다음 두 단계로 나눌 수 있습니다.
- 입력 데이터 전처리. 바이모달 모드를 예로 들어, 모드에 해당하는 데이터 행렬은 각각 과 이라고 가정합니다. 여기서는 특징 차원과 합계가 다를 수 있으며 샘플 수도 다를 수 있습니다. 전처리는 각 행렬의 각 행을 정규화하여 평균이 0이고 분산이 1이 되도록 합니다. 해당 데이터가 있는 경우 사용자는 모달 상관 행렬을 제공하여 성능을 향상시킬 수 있습니다. 여기서는 모달의 6번째 샘플이 모달의 7번째 샘플과 완전히 일치함을 의미하고 알려진 일치성이 없음을 의미하며 부분적인 부분이 있음을 의미합니다. 서신.
- 관절 변형 자동 인코더를 사용하여 각 양식의 유사성 잠재 공간을 학습합니다. 여기서 (기본값, 사용자 조정 가능)는 잠재 공간 차원입니다. 훈련 과정에서 JAMIE는 다음 손실 함수를 최소화합니다.
총 손실 함수에는 4개의 항목이 포함됩니다.
첫 번째 항목은 변이 자동 인코더에서 추론한 분포와 다변량 표준 정규 분포 간의 Kullback-Leibler(KL) 발산을 계산합니다. 이는 잠재 공간의 연속성을 유지하는 데 도움이 됩니다. 해당 샘플은 재구성된 데이터 행렬과 원본 데이터 행렬 사이의 평균 제곱 오차의 합입니다. 네 번째 항은 생성된 잠재 공간을 조정하기 위해 추론된 교차 모드 대응을 사용합니다.
각 항목의 구체적인 표현은 논문 원문을 참고해주세요. 첫 번째 항목에 대한 두 번째, 세 번째, 네 번째 항목의 가중치는 사용자가 조정할 수 있으며, JAMIE는 일반적인 상황에 적합한 기본 가중치도 제공합니다.
다음 표는 JAMIE의 모델과 적용 범위를 현재의 최신 방법과 비교한 것입니다. JAMIE는 여러 가지 통합 및 보간 방법의 기능을 단일 아키텍처로 통합함으로써 누락된 양식 보간이 가능하고 비오믹스 데이터 호환성이 가능하며 부분적인 대응만으로 다중 모드 데이터를 처리할 수 있는 기능이 장점입니다.
표 1. 다양한 다중 모달 통합 및 누락된 모달 채우기 방법 비교. 단일 아키텍처를 통해 JAMIE는 다양한 통합 및 보간 방법의 기능을 통합합니다. NLMA: 비선형 다양체 정렬 [15], UnionCom [7], CCA: 정규 상관 분석 [15, 16], BABEL [5].
JAMIE의 주요 애플리케이션
다중 모드 데이터의 통합 및 표현형 예측
다중 모드 데이터의 통합은 분류 성능을 향상시키고 표현형 지식을 향상시키며 복잡한 생물학적 메커니즘에 대한 이해를 향상시킬 수 있습니다.
두 개의 데이터 세트와 해당 관계가 주어지면 JAMIE는 훈련된 인코더와 을 기반으로 잠재 공간 데이터를 생성하고 을 기반으로 클러스터링 또는 분류를 수행할 수 있습니다.
잠재 공간 데이터를 기반으로 한 클러스터링에는 두 가지 방식을 기능 생성에 통합하는 등 여러 가지 장점이 있습니다. 그런 다음 JAMIE는 세포 유형 예측과 같은 샘플 대응을 예측할 수 있습니다.
부분적으로 레이블이 지정된 데이터 세트의 경우 동일한 클러스터의 셀은 유사한 유형을 가져야 합니다.
JAMIE는 잠재 공간 데이터를 생성하는 과정에서 다양한 유형의 데이터 특성을 분리하므로 일반적으로 더 나은 결과를 얻기 위해 복잡한 클러스터링이나 분류 알고리즘이 필요하지 않습니다.
고차원 데이터의 경우 JAMIE는 세포 유형 클러스터링 시각화를 위해 UMAP [32]를 사용합니다.
교차 모드 데이터 대체
현재의 많은 교차 모드 대체 방법은 대체 목적을 위한 기본 생물학적 메커니즘을 학습했음을 입증할 수 없습니다.
피드포워드 네트워크나 선형 회귀 방법과 비교할 때 JAMIE는 기본 생물학적 메커니즘을 더 잘 학습하여 보다 엄격한 수학적 기초를 기반으로 누락된 데이터를 예측할 수 있습니다.
그림 2는 교차 모달 데이터 채우기를 위한 JAMIE의 프로세스를 보여줍니다. JAMIE는 먼저 훈련 데이터에 대한 인코딩 및 디코딩 모델을 훈련합니다.
새로운 데이터에 대해 JAMIE는 먼저 데이터에서 학습한 인코더를 사용하여 이를 잠재 공간에 투영하여 얻은 다음 잠재 공간 특징을 집계하여 얻은 다음 마지막으로 해당 디코더를 통해 누락된 패턴 데이터로 디코딩합니다.
JAMIE는 잠재 공간을 사용하여 세포 간의 일치성을 예측하며, 이는 데이터 특징과 표현형 간의 관계를 이해하는 데 도움이 될 수 있습니다.
그림 2. JAMIE 교차 모달 보간
잠재 공간 기능 및 채우기 기능 설명
훈련된 모델인 JAMIE는 SHAP(SHapley)를 채택했습니다. 부가적인 설명)[18].
SHAP은 모델에서 생성된 개별 예측을 샘플 변조하여 개별 입력 기능의 중요성을 평가합니다. 이는 다양하고 흥미로운 응용 분야에 사용될 수 있습니다.
대상 변수를 표현형별로 쉽게 분리할 수 있다면 SHAP는 추가 연구를 위해 관련 특성을 식별할 수 있습니다. 또한, 대치(imputation)를 수행하면 SHAP는 모델이 학습한 모달 간 연결을 드러낼 수 있습니다.
모델과 샘플이 주어지면 배경 특징 벡터가 어디에 있는지와 같은 SHAP 값을 학습합니다.
이면 SHAP 값과 배경 출력의 합은 와 같으며, 여기서 각각은 모델 출력에 미치는 영향에 비례합니다.
또 다른 유용한 기술은 분류(예: LTA [7, 19]) 또는 대치(예: 대치된 특징과 측정된 특징 간의 대응)를 위한 핵심 메트릭을 선택하고 이를 모델에서 하나씩 사용하는 것입니다. 메트릭은 다음과 같습니다. 각 기능을 배경 값으로 제거(교체)하여 평가합니다.
그런 다음 주요 측정항목이 악화되면 제거된 기능이 모델 결과에 더 중요하다는 것을 나타냅니다.
실험 결과
JAMIE는 검증을 위해 일반적으로 사용되는 4개의 단일 셀 다중 모드 데이터 세트를 사용했습니다.
(1) MMD-MA에서 분기된 다양체의 가우스 분포 샘플링으로 생성된 시뮬레이션된 다중 모달 데이터(300개 샘플, 3개 세포 유형)
(2) 마우스 시각 피질(패치-seq 유전자 발현 및 전기생리학적) 10x 단일 세포 다중 오믹스 유전자 발현 및 염색질에서 얻은 마우스 운동 피질(1,208개 샘플, 9개 세포 유형) 및 마우스 운동 피질(1,208개 샘플, 9개 세포 유형)의 단일 뉴런 세포 특성화 데이터 인간 발달 중인 뇌의 8,981개 샘플에 대한 접근성 데이터(임신 21주, 인간 대뇌 피질의 7개 주요 세포 유형 포함)
(4) COLO-320DM 결장 선암종 세포주.
평가 결과 JAMIE가 다른 방법보다 훨씬 우수하고(그림 3의 MMD-MA 가지 다양체 시뮬레이션 데이터 결과 비교, 그림 4의 마우스 시각 피질 데이터 결과 비교) 다중 모드를 우선시하는 것으로 나타났습니다. 셀룰러 해상도에서 잠재적으로 새로운 기계적 통찰력을 제공하는 동시에 중요한 기능을 채웁니다.
요약
요약하자면 JAMIE는 단일 세포 다중 모드 데이터의 통합 예측을 위한 새로운 심층 신경망 모델입니다.관절 변형 자동 인코더(VAE) 구조에 의존하는 새로운 잠재 임베딩 집계 방법을 통해 구현된 복잡하거나 혼합되거나 부분적으로 대응하는 다중 모드 데이터에 적합합니다. 위에서 언급한 뛰어난 성능 외에도 JAMIE는 효율적인 컴퓨팅 기능과 낮은 메모리 사용량 요구 사항도 갖추고 있습니다. 또한 사전 훈련된 모델과 학습된 교차 모달 잠재 임베딩을 다운스트림 분석에 재사용할 수 있습니다.
물론 더 큰 데이터 세트의 경우 VAE(변형 자동 인코더)를 훈련하는 데 많은 시간이 걸립니다. 따라서 JAMIE의 자동 PCA와 같은 이전 기능 선택 방법은 시간 요구 사항을 완화하는 데 도움이 됩니다. VAE는 재구성 손실을 사용하므로 크거나 반복되는 특징이 저차원 임베디드 특징에 불균형적으로 영향을 미치는 것을 방지하기 위해 데이터 전처리도 중요합니다. 특정 교차 모달 대체의 경우 최종 모델의 편향과 일반화 능력에 부정적인 영향을 미치지 않도록 훈련 데이터 세트의 다양성을 신중하게 고려해야 합니다. JAMIE는 잠재적으로 확장되어 다양한 조건의 유전자 발현 데이터와 같은 다양한 양식이 아닌 다양한 소스의 데이터 세트를 정렬할 수도 있습니다.
저자 소개
논문의 저자는 Noah Cohen Kalafut(컴퓨터과학과 박사과정 학생), Huang Xiang(선임연구원), Wang Daifeng(PI)입니다. 위스콘신대학교 매디슨 캠퍼스 생물통계학과, 의료정보학과, 컴퓨터공학과, 와이즈만 연구센터. 교신저자는 Wang Daifeng 교수이다.
1973년에 설립된 와이즈만 센터는 반세기 동안 인간 발달, 신경 발달 장애 및 신경 퇴행성 질환에 대한 연구를 발전시켜 왔습니다.
위 내용은 UW-중국 팀의 새로운 다중 모드 데이터 분석 및 생성 방법 JAMIE는 세포 유형 및 기능 예측 능력을 크게 향상시킵니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











최고 거래소에는 다음이 포함됩니다. 1. 세계 최대의 거래량 인 Binance는 600 개의 통화를 지원하며 스팟 취급 수수료는 0.1%입니다. 2. 균형 잡힌 플랫폼 인 OKX는 708 개의 거래 쌍을 지원하며 영구 계약 처리 수수료는 0.05%입니다. 3. Gate.io, 2700 개의 소규모 통화를 포괄하며 스팟 취급 수수료는 0.1%-0.3%입니다. 4. Coinbase, 미국 규정 준수 벤치 마크, 스팟 취급 수수료는 0.5%입니다. 5. Kraken, 최고 보안 및 정기 예약 감사.

cryptocurrency 시장의 급락으로 인해 투자자들 사이에 공황이 발생했으며 Dogecoin (Doge)은 가장 어려운 지역 중 하나가되었습니다. 가격은 급격히 하락했으며 분산 금융 (DEFI) (TVL)의 총 가치 잠금 장치도 크게 감소했습니다. "Black Monday"의 판매 물결은 cryptocurrency 시장을 휩쓸었고 Dogecoin은 처음으로 타격을 받았습니다. DefitVl은 2023 년 수준으로 떨어졌고 지난 달 통화 가격은 23.78% 하락했습니다. Dogecoin의 Defitvl은 주로 SOSO 가치 지수의 26.37% 감소로 인해 272 만 달러로 떨어졌습니다. 지루한 Dao 및 Thorchain과 같은 다른 주요 Defi 플랫폼도 TVL도 각각 24.04% 및 20으로 떨어졌습니다.

거래소는 오늘날의 cryptocurrency 시장에서 중요한 역할을합니다. 그들은 투자자들이 거래 할 수있는 플랫폼 일뿐 만 아니라 시장 유동성 및 가격 발견의 중요한 원천이기도합니다. 세계 최대의 가상 환전 거래소는 상위 10 위이며, 이러한 거래소는 거래량이 훨씬 앞서있을뿐만 아니라 사용자 경험, 보안 및 혁신적인 서비스에서 고유 한 장점이 있습니다. 목록 위에있는 교환은 일반적으로 대규모 사용자 기반과 광범위한 시장 영향을 미치며 거래량 및 자산 유형은 종종 다른 거래소에서 도달하기가 어렵습니다.

휘발성 cryptocurrency 시장에서 투자자들은 대중적인 통화를 넘어서는 대안을 찾고 있습니다. Solana (Sol), Cardano (ADA), XRP 및 Dogecoin (DOGE)과 같은 잘 알려진 암호 화폐도 시장 감정, 규제 불확실성 및 확장 성과 같은 도전에 직면 해 있습니다. 그러나 새로운 신흥 프로젝트 인 Rexasfinance (RXS)가 떠오르고 있습니다. 유명 인사 효과 나 과대 광고에 의존하지는 않지만 RWA (Ralld Assets)와 블록 체인 기술을 결합하여 투자자에게 혁신적인 투자 방법을 제공하는 데 중점을 둡니다. 이 전략은 2025 년의 가장 성공적인 프로젝트 중 하나가되기를 희망합니다. Rexasfi

탈 중앙화 된 소셜 미디어 플랫폼 Tox는 인공 지능 인프라 솔루션의 리더 인 Omnilabs와 전략적 파트너십을 맺어 인공 지능 기능을 Web3 생태계에 통합했습니다. 이 파트너십은 Tox의 공식 X 계정에 의해 게시되며 공정한 온라인 환경을 구축하는 것을 목표로합니다. Omnilabs는 AIAAS (A-as-A-Service) 기능을 갖춘 지능형 자율 시스템으로 유명합니다. 이 인프라는 실시간 의사 결정, 자동화 된 프로세스 및 심층 데이터 분석을 위해 AI 에이전트를 사용하여 블록 체인 플랫폼을 강화하기 위해 분산 된 생태계에 원활하게 통합하기 위해 AI 에이전트를 사용합니다. Tox와의 협력은 Omnilabs의 AI 도구를 분산 된 소셜 네트워크에 통합하여 더 광범위하게 만들 것입니다.

2025 년에 레버리지 거래, 보안 및 사용자 경험에서 뛰어난 성능을 보이는 플랫폼은 다음과 같습니다. 1. OKX, 고주파 거래자에게 적합하여 최대 100 배의 레버리지를 제공합니다. 2. Binance, 전 세계의 다중 통화 거래자에게 적합하며 125 배 높은 레버리지를 제공합니다. 3. Gate.io, 전문 파생 상품 플레이어에게 적합하며 100 배의 레버리지를 제공합니다. 4. 초보자 및 소셜 트레이더에게 적합한 Bitget, 최대 100 배의 레버리지를 제공합니다. 5. 크라켄은 꾸준한 투자자에게 적합하며 5 배의 레버리지를 제공합니다. 6. Bybit, Altcoin Explorers에 적합하며 20 배의 레버리지를 제공합니다. 7. 저비용 거래자에게 적합한 Kucoin, 10 배의 레버리지를 제공합니다. 8. 비트 피 넥스, 시니어 플레이에 적합합니다

Binance는 Global Digital Asset Trading Ecosystem의 대 군주이며, 그 특성에는 다음이 포함됩니다. 1. 평균 일일 거래량은 1,500 억 달러를 초과하여 주류 통화의 98%를 차지하며 500 개의 거래 쌍을 지원합니다. 2. 혁신 매트릭스는 파생 상품 시장, Web3 레이아웃 및 교육 시스템을 포함합니다. 3. 기술적 이점은 밀리 초에 일치하는 엔진이며, 최고 처리량은 초당 140 만 건의 트랜잭션입니다. 4. 규정 준수 진행 상황은 15 개국 라이센스를 보유하고 있으며 유럽과 미국에 준수 엔티티를 설립합니다.

Worldcoin (WLD)은 Cryptocurrency 시장에서 고유 한 생체 인정 및 개인 정보 보호 메커니즘으로 눈에 띄고 많은 투자자의 관심을 끌고 있습니다. WLD는 혁신적인 기술, 특히 OpenAi 인공 지능 기술과 함께 Altcoins에서 뛰어난 성과를 거두었습니다. 그러나 향후 몇 년 안에 디지털 자산은 어떻게 행동 할 것인가? WLD의 미래 가격을 함께 예측합시다. 2025 WLD 가격 예측은 2025 년 WLD에서 상당한 성장을 달성 할 것으로 예상됩니다. 시장 분석에 따르면 평균 WLD 가격은 최대 $ 1.36로 $ 1.31에 도달 할 수 있습니다. 그러나 곰 시장에서 가격은 약 $ 0.55로 떨어질 수 있습니다. 이러한 성장 기대는 주로 WorldCoin2에 기인합니다.
