早期發現疾病及其相關的住院時間 (LoS) 對於更好的治療選擇、更有效的追蹤安排、更長的生存率、改善長期結果和降低醫院使用成本至關重要。
早期識別疾病及其相關的住院時間(LoS)對於更好的治療選擇、更有效的隨訪安排、更長的生存率、改善的長期結果和降低醫院使用成本至關重要。
近年來,透過利用電子健康記錄(EHR)和先進的深度學習(DL)架構,例如卷積神經網路(CNN,例如Nguyen 等人(Deepr)1)、循環神經網路(RNN、例如,Choi等人(Doctor AI)2)、長短期記憶網路(LSTM,例如Pham 等人(DeepCare)3),以及一種更強大的架構,稱為Transformers 雙向編碼器表示(BERT)。例如,Li 等人4 介紹了BEHRT,這是一種應用於EHR 的受BERT 啟發的模型,能夠預測一個人未來就診時出現300 多種情況的可能性; Shang等人5提出了G-BERT,一種結合了圖神經網路(GNN)和BERT的力量的模型,用於診斷預測和藥物推薦; Rasmy 等人6 介紹了Med-BERT(也是一種BERT 模型),以提供在大規模結構化EHR上運行的預先訓練的情境化嵌入。然而,很少有研究重點關注利用 EHR 和最先進的 DL 架構來預測醫院 LoS7,8 的任務。例如,Song 等人7 開發了 SAnD(簡單參與和診斷),這是一種受 DL 啟發的模型,使用多類分類方法來預測診斷代碼和 LoS 等任務。他們的視距估計是基於分析從入場時間起每小時發生的事件。此外,Hansen 等人8 介紹了 M-BERT,這是一種受 BERT 啟發的模型,應用於入院前 24 小時內收集的患者事件序列,以進行二元、多類別和連續 LoS 預測。
盡我們所能知識,該文獻中的大多數進展(a) 依賴於代表成年人口的EHR4,7,9; (b) 需要指定患者年齡分佈1,2,5,6,8,10, 11,12,13; (c) 估計患者入院後可能住院多長時間,但入院前預測LoS 對於預防性醫療保健和優化醫院資源分配同樣重要7,8;(d) 使用側重於預測一組有限的健康結果的診斷或LoS 的模型3,10,14; (e) 僅考慮臨床事件之間的時間不規則性(例如就診時的年齡)1、2、4、8,重點關注改善健康風險評估績效; (f) 不報告罕見疾病的預測表現15,或(g) 不使用子宮內健康資訊進行診斷預測。
然而,電腦輔助的疾病早期檢測及其相關的 LoS 在以下領域具有特別重要的意義:兒科。正如各種研究所強調的那樣,及時診斷和介入對於增強兒童的長期福祉至關重要14,15,16,17,18。因此,我們開發了 Ped-BERT,這是一種受 BERT19 啟發的架構。我們的模型依靠預先訓練的診斷嵌入,準確預測了 100 多種潛在的初級診斷以及孩子在即將到來的就診期間可能面臨的住院時間。我們針對兩個當代分類器(一個邏輯回歸和一個隨機森林)和兩個最先進的深度學習分類器(一個預先訓練的 Transformer 解碼器和一個具有隨機初始化嵌入的神經網路)來評估我們的方法。因此,我們的分析可以作為一個有價值的工具,幫助研究人員利用機器學習進行兒科醫療保健指導,從而幫助兒科醫生進行臨床決策過程。
Ped-BERT 利用豐富的數據集,包括兒科的出院記錄和急診室信息,包括患者的年齡和就診時的居住郵政編碼或縣。此外,它還可以選擇整合產前和產後的孕產婦健康數據。據我們所知,我們的預測框架利用縱向匹配母親和嬰兒對的數據,這是同類中的第一個。此外,此資料集使我們能夠探索模型在下次就診時同時預測初步診斷和 LoS 的能力,並評估其整體公平性,包括檢查預測誤差是否均勻分佈在母嬰對的不同人口統計中。
總而言之,我們對文獻的貢獻如下:首先,我們使用一個新穎的資料集,將1991 年至2017 年加州母嬰對的醫療記錄聯繫起來;其次,我們開發了Ped-BERT,這是一種DL 架構,用於早期檢測預測住院或急診環境中尋求護理的兒科患者的健康風險,並將其性能與其他當代或最新水平進行比較
以上是Ped-BERT:兒科病患疾病的早期檢測和住院時間預測的詳細內容。更多資訊請關注PHP中文網其他相關文章!