專為決策樹打造,新加坡國立大學&清華大學聯合提出快速安全的聯邦學習新系統
聯邦學習是機器學習中一個非常火熱的領域,指多方在不傳遞資料的情況下共同訓練模型。隨著聯邦學習的發展,聯邦學習系統也層出不窮,例如 FATE, FedML, PaddleFL, TensorFlow-Federated 等等。然而,大部分聯邦學習系統不支持樹模型的聯邦學習訓練。相較於神經網絡,樹模型具有訓練快,可解釋性強,適合表格型資料的特性。樹模型在金融,醫療,網路等領域有廣泛的應用場景,例如用來做廣告推薦、股票預測等等。
決策樹的代表性模型為 Gradient Boosting Decision Tree (GBDT)。由於一棵樹的預測能力有限,GBDT 透過 boosting 的方法串列訓練多棵樹,透過每棵樹用來擬合當前預測值和標籤值的殘差的方式,最終達到一個好的預測效果。代表性的 GBDT 系統有 XGBoost, LightGBM, CatBoost, ThunderGBM,其中 XGBoost 多次被 KDD cup 的冠軍隊伍所使用。然而,這些系統都不支援聯邦學習場景下的 GBDT 訓練。近日,來自新加坡國立大學和清華大學的研究者提出了一種專注於訓練樹模式的聯邦學習新系統 FedTree。
- 論文網址:https://github.com/Xtra-Computing/FedTree/blob/main/FedTree_draft_paper. pdf
- 專案網址:https://github.com/Xtra-Computing/FedTree
##FedTree 系統介紹FedTree 架構圖如圖1 所示,共有5 個模組: 接口,環境,框架,隱私保護以及模型。
圖1: FedTree 系統架構圖
##介面:FedTree 支援兩種介面:命令列介面和Python 介面。使用者只需給定參數(參與者數量,聯邦場景等),就可以用一行命令來執行 FedTree 進行訓練。 FedTree 的 Python 介面和 scikit-learn 相容,可以呼叫 fit() 和 predict() 來進行訓練和預測。
環境:FedTree 支援在單機上模擬部署聯邦學習,和在多機上部署分散式聯邦學習。在單機環境上,FedTree 支援將資料進行劃分成多個子資料集,每個子資料集作為一個參與者進行訓練。在多機環境上,FedTree 支援將每個機器作為一個參與者,機器之間 透過 gRPC 進行通訊。同時,除了 CPU 以外,FedTree 支援使用 GPU 來加速訓練。
框架:FedTree 支援橫向和縱向聯邦學習場景下 GBDT 的訓練。在橫向場景下,不同參與者有著不同的訓練樣本和相同的特徵空間。在縱向場景下,不同參與者有著不同的特徵空間和相同的訓練樣本。為了確保效能,在這兩種情境下,多有參與方都共同參與每個節點的訓練。除此之外,FedTree 也支援整合學習,參與者並行地訓練樹之後再進行聚合,以此減少參與者之間的通訊開銷。
######隱私############:由於訓練過程中傳遞的梯度可能會洩露訓練資料的信息,FedTree 提供不同的隱私保護方法來進一步保護梯度訊息,包括同態加密(HE) 和安全聚合(SA)。同時,FedTree 提供了差分隱私來保護最終訓練得到的模型。 ##################模型############:以訓練一棵樹為基礎,FedTree 透過boosting/bagging 的方法支援訓練GBDT /random forest。透過設定不同的損失函數,FedTree 訓練得到的模型支援多種任務,包括分類和迴歸。 ######實驗表1 總結了不同系統在a9a, breast 和credit 上的AUC 和abalone 上的RMSE,FedTree 的模型效果和用所有資料訓練GBDT(XGBoost, ThunderGBM)以及FATE 中的SecureBoost (SBT) 幾乎一致。而且,隱私保護策略 SA 和 HE 並不會影響模型效能。
表1: 不同系統的模型效果比較
表2 總結了不同系統每棵樹的訓練時間(單位:秒),可以看到FedTree 相比於FATE 快了很多,在橫向聯邦學習場景下能達到100 倍以上的加速比。
表2: 不同系統每棵樹的訓練時間比較
更多研究細節請參考FedTree 論文原文。
#以上是專為決策樹打造,新加坡國立大學&清華大學聯合提出快速安全的聯邦學習新系統的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

寫在前面&筆者的個人理解目前,在整個自動駕駛系統當中,感知模組扮演了其中至關重要的角色,行駛在道路上的自動駕駛車輛只有通過感知模組獲得到準確的感知結果後,才能讓自動駕駛系統中的下游規控模組做出及時、正確的判斷和行為決策。目前,具備自動駕駛功能的汽車中通常會配備包括環視相機感測器、光達感測器以及毫米波雷達感測器在內的多種數據資訊感測器來收集不同模態的信息,用於實現準確的感知任務。基於純視覺的BEV感知演算法因其較低的硬體成本和易於部署的特點,以及其輸出結果能便捷地應用於各種下游任務,因此受到工業

C++中機器學習演算法面臨的常見挑戰包括記憶體管理、多執行緒、效能最佳化和可維護性。解決方案包括使用智慧指標、現代線程庫、SIMD指令和第三方庫,並遵循程式碼風格指南和使用自動化工具。實作案例展示如何利用Eigen函式庫實現線性迴歸演算法,有效地管理記憶體和使用高效能矩陣操作。

C++sort函數底層採用歸併排序,其複雜度為O(nlogn),並提供不同的排序演算法選擇,包括快速排序、堆排序和穩定排序。

人工智慧(AI)與執法領域的融合為犯罪預防和偵查開啟了新的可能性。人工智慧的預測能力被廣泛應用於CrimeGPT(犯罪預測技術)等系統,用於預測犯罪活動。本文探討了人工智慧在犯罪預測領域的潛力、目前的應用情況、所面臨的挑戰以及相關技術可能帶來的道德影響。人工智慧和犯罪預測:基礎知識CrimeGPT利用機器學習演算法來分析大量資料集,識別可以預測犯罪可能發生的地點和時間的模式。這些資料集包括歷史犯罪統計資料、人口統計資料、經濟指標、天氣模式等。透過識別人類分析師可能忽視的趨勢,人工智慧可以為執法機構

01前景概要目前,難以在檢測效率和檢測結果之間取得適當的平衡。我們研究了一種用於高解析度光學遙感影像中目標偵測的增強YOLOv5演算法,利用多層特徵金字塔、多重偵測頭策略和混合注意力模組來提高光學遙感影像的目標偵測網路的效果。根據SIMD資料集,新演算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在偵測結果和速度之間達到了更好的平衡。 02背景&動機隨著遠感技術的快速發展,高解析度光學遠感影像已被用於描述地球表面的許多物體,包括飛機、汽車、建築物等。目標檢測在遠感影像的解釋中

一、多模態大模型的歷史發展上圖這張照片是1956年在美國達特茅斯學院舉行的第一屆人工智慧workshop,這次會議也被認為拉開了人工智慧的序幕,與會者主要是符號邏輯學屆的前驅(除了前排中間的神經生物學家PeterMilner)。然而這套符號邏輯學理論在隨後的很長一段時間內都無法實現,甚至到80年代90年代還迎來了第一次AI寒冬期。直到最近大語言模型的落地,我們才發現真正承載這個邏輯思維的是神經網絡,神經生物學家PeterMilner的工作激發了後來人工神經網絡的發展,也正因為此他被邀請參加了這個

一、58畫像平台建置背景首先和大家分享下58畫像平台的建造背景。 1.傳統的畫像平台傳統的想法已經不夠,建立用戶畫像平台依賴數據倉儲建模能力,整合多業務線數據,建構準確的用戶畫像;還需要數據挖掘,理解用戶行為、興趣和需求,提供演算法側的能力;最後,還需要具備數據平台能力,有效率地儲存、查詢和共享用戶畫像數據,提供畫像服務。業務自建畫像平台和中台類型畫像平台主要區別在於,業務自建畫像平台服務單條業務線,按需定制;中台平台服務多條業務線,建模複雜,提供更為通用的能力。 2.58中台畫像建構的背景58的使用者畫像

寫在前面&筆者的個人理解在自動駕駛系統當中,感知任務是整個自駕系統中至關重要的組成部分。感知任務的主要目標是使自動駕駛車輛能夠理解和感知周圍的環境元素,如行駛在路上的車輛、路旁的行人、行駛過程中遇到的障礙物、路上的交通標誌等,從而幫助下游模組做出正確合理的決策和行為。在一輛具備自動駕駛功能的車輛中,通常會配備不同類型的信息採集感測器,如環視相機感測器、雷射雷達感測器以及毫米波雷達感測器等等,從而確保自動駕駛車輛能夠準確感知和理解周圍環境要素,使自動駕駛車輛在自主行駛的過程中能夠做出正確的決斷。目
