通常而言,幾乎每個人都會攜帶有幾十個潛在有害的罕見變異。無法有效識別可能患有疾病的高風險個體,是透過常見變異進行臨床評估所遇到的最大困難之一。在靈長類基因組計畫的研究中,科學家利用人工智慧神經網路PrimateAI-3D,以「用最罕見的變異找到最容易生病的個體」的思路,透過演化分析定位高致病性的罕見突變,並將其用於預測個體患病風險。
西班牙托馬斯·馬奎斯-博內特教授團隊、I l l umina人工智慧實驗室聯合多個課題組,透過對233種靈長類物種的共809個樣本進行全基因組測序數據比較,鑑定出人類直系同源蛋白上430萬個可能導致蛋白質結構變化的基因變異位點。
研究人員以上述基因變異位點為資料集基礎,將其加入人類疾病基因資料中,以包含450萬種可能造成良性變異的基因資料集訓練PrimateAI-3D人工智慧神經網絡,使其能夠更準確預測基因變異的致病性。
基因變異是導致疾病的最主要原因之一。基於非人靈長類與人類的親緣關係,相同的基因突變可能帶來相似的結果,在靈長類中常見的突變可能意味著這些變異更可能是無害或危害極其有限的。
那麼,如何預測一個人的遺傳因素對諸如糖尿病、心血管疾病等常見疾病帶來的患病風險呢?是用數千種影響較小的常見遺傳變異的總和來進行評估,還是用少數影響顯著的罕見突變的總和進行評估更好?
綜合研究表明,常見變異和罕見變異在預測人類疾病風險方面具有互補作用。常見的突變可以識別出更多可能患病的個體,而罕見的突變更容易發現最高風險的異常個體。因此,在臨床評估上納入罕見變異可能比僅使用常見變異更能識別出極端個體,而這些極端個體才是大部分疾病的最終患者群體,也是最需要治療或遭受嚴重早期病變的群體,這對預防性篩檢具有重要意義。
這項研究成功展示了將靈長類群體定序資料與深度學習模式結合的應用,有助於我們了解人類基因變異的致病性,可幫助個人化基因組醫學在臨床上提供更佳診斷指導。
作者:浙江大學張國捷教授主題組集體創作、整理
編輯:許琦敏
*文匯獨家稿件,轉載請註明出處。
以上是從'最罕見變異”中找到'最容易患病個體”,AI精準預測基因變異致病性的詳細內容。更多資訊請關注PHP中文網其他相關文章!