Maison

Spécialement conçu pour les arbres de décision, l'Université nationale de Singapour et l'Université Tsinghua proposent conjointement un nouveau système d'apprentissage fédéré rapide et sécurisé.

Spécialement conçu pour les arbres de décision, l'Université nationale de Singapour et l'Université Tsinghua proposent conjointement un nouveau système d'apprentissage fédéré rapide et sécurisé.

王林

Apr 09, 2023 pm 07:21 PM

算法决策树

L'apprentissage fédéré est un domaine très brûlant de l'apprentissage automatique, qui fait référence à la formation conjointe de modèles par plusieurs parties sans transfert de données. Avec le développement de l'apprentissage fédéré, des systèmes d'apprentissage fédéré émergent les uns après les autres, comme FATE, FedML, PaddleFL, TensorFlow-Federated, etc. Cependant, la plupart des systèmes d'apprentissage fédéré ne prennent pas en charge l'apprentissage fédéré des modèles d'arbres. Par rapport aux réseaux de neurones, les modèles arborescents ont les caractéristiques d'un apprentissage rapide, d'une forte interprétabilité et sont adaptés aux données tabulaires. Les modèles d'arbres ont un large éventail de scénarios d'application dans la finance, les soins médicaux, Internet et d'autres domaines, tels que les recommandations publicitaires, les prévisions boursières, etc.

Le modèle représentatif d'arbre de décision est l'arbre de décision à boosting de gradient (GBDT). Étant donné que la capacité de prédiction d'un arbre est limitée, GBDT entraîne plusieurs arbres en série via la méthode de boosting et obtient finalement un bon effet de prédiction en ajustant chaque arbre au résidu de la valeur de prédiction actuelle et de la valeur de l'étiquette. Les systèmes GBDT représentatifs incluent XGBoost, LightGBM, CatBoost et ThunderGBM. Parmi eux, XGBoost a été utilisé à plusieurs reprises par l'équipe de championnat de la coupe KDD. Cependant, aucun de ces systèmes ne prend en charge la formation GBDT dans les scénarios d'apprentissage fédéré. Récemment, des chercheurs de l'Université nationale de Singapour et de l'Université Tsinghua ont proposé un nouveau système d'apprentissage fédéré FedTree axé sur la formation de modèles d'arbres.

Spécialement conçu pour les arbres de décision, lUniversité nationale de Singapour et lUniversité Tsinghua proposent conjointement un nouveau système dapprentissage fédéré rapide et sécurisé.

Adresse papier : https://github.com/Xtra-Computing/FedTree/blob/main/FedTree_draft_paper.pdf
Adresse du projet : https://github.com/ Xtra-Computing/FedTree

Présentation du système FedTreeLe diagramme d'architecture FedTree est présenté dans la figure 1, avec un total de 5 modules : interface, environnement, cadre, protection de la vie privée et modèle.

Figure 1 : Schéma de l'architecture du système FedTree

Interface : FedTree prend en charge deux interfaces : l'interface de ligne de commande et l'interface Python. Les utilisateurs n'ont qu'à fournir des paramètres (nombre de participants, scénario de fédération, etc.) et peuvent exécuter FedTree pour s'entraîner avec une commande sur une seule ligne. L'interface Python de FedTree est compatible avec scikit-learn et vous pouvez appeler fit() et Predict() pour l'entraînement et la prédiction.

Environnement : FedTree prend en charge le déploiement simulé de l'apprentissage fédéré sur une seule machine et le déploiement de l'apprentissage fédéré distribué sur plusieurs machines. Dans un environnement autonome, FedTree prend en charge la division des données en plusieurs sous-ensembles de données, et chaque sous-ensemble de données est formé en tant que participant. Dans un environnement multi-machines, FedTree prend en charge chaque machine en tant que participant, et les machines communiquent via gRPC. Dans le même temps, en plus du CPU, FedTree prend en charge l'utilisation du GPU pour accélérer la formation.

Framework : FedTree prend en charge la formation des GBDT dans des scénarios d'apprentissage fédéré horizontaux et verticaux. Dans le scénario horizontal, différents participants disposent de différents échantillons de formation et du même espace de fonctionnalités. Dans le scénario vertical, différents participants disposent de différents espaces de fonctionnalités et des mêmes échantillons de formation. Afin de garantir les performances, dans les deux scénarios, plusieurs parties participent à la formation de chaque nœud. En outre, FedTree prend également en charge l'apprentissage d'ensemble, dans lequel les participants forment des arbres en parallèle, puis les regroupent pour réduire les frais de communication entre les participants.

Confidentialité : Étant donné que le gradient transmis pendant le processus de formation peut divulguer des informations sur les données de formation, FedTree propose différentes méthodes de protection de la confidentialité pour protéger davantage les informations du gradient, notamment le cryptage homomorphe (HE) et l'agrégation sécurisée. (SA). Dans le même temps, FedTree offre une confidentialité différentielle pour protéger le modèle final formé.

Modèle : Basé sur la formation d'un arbre, FedTree prend en charge la formation GBDT/forêt aléatoire via des méthodes de boosting/bagging. En définissant différentes fonctions de perte, le modèle formé par FedTree prend en charge diverses tâches, notamment la classification et la régression.

ExpériencesLe tableau 1 résume l'AUC de différents systèmes sur a9a, breast et credit et RMSE sur abalone, l'effet de modèle de FedTree et de formation GBDT (XGBoost, ThunderGBM) avec toutes les données et SecureBoost (SBT) dans FATE Presque cohérent. . De plus, les politiques de protection de la vie privée SA et HE n’affectent pas les performances du modèle.

Tableau 1 : Comparaison des effets de modèle de différents systèmes

Le tableau 2 résume le temps de formation (unité : secondes) de chaque arbre dans différents systèmes. Vous pouvez voir que FedTree se compare à. FATE Il est beaucoup plus rapide et peut atteindre un taux d'accélération de plus de 100 fois dans les scénarios d'apprentissage fédéré horizontal.

Tableau 2 : Comparaison du temps de formation pour chaque arbre dans différents systèmes

Pour plus de détails sur la recherche, veuillez vous référer à l'article original de FedTree.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7480

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

CLIP-BEVFormer : superviser explicitement la structure BEVFormer pour améliorer les performances de détection à longue traîne Mar 26, 2024 pm 12:41 PM

Écrit ci-dessus et compréhension personnelle de l'auteur : À l'heure actuelle, dans l'ensemble du système de conduite autonome, le module de perception joue un rôle essentiel. Le véhicule autonome roulant sur la route ne peut obtenir des résultats de perception précis que via le module de perception en aval. dans le système de conduite autonome, prend des jugements et des décisions comportementales opportuns et corrects. Actuellement, les voitures dotées de fonctions de conduite autonome sont généralement équipées d'une variété de capteurs d'informations de données, notamment des capteurs de caméra à vision panoramique, des capteurs lidar et des capteurs radar à ondes millimétriques pour collecter des informations selon différentes modalités afin d'accomplir des tâches de perception précises. L'algorithme de perception BEV basé sur la vision pure est privilégié par l'industrie en raison de son faible coût matériel et de sa facilité de déploiement, et ses résultats peuvent être facilement appliqués à diverses tâches en aval.

Implémentation d'algorithmes d'apprentissage automatique en C++ : défis et solutions courants Jun 03, 2024 pm 01:25 PM

Les défis courants rencontrés par les algorithmes d'apprentissage automatique en C++ incluent la gestion de la mémoire, le multithread, l'optimisation des performances et la maintenabilité. Les solutions incluent l'utilisation de pointeurs intelligents, de bibliothèques de threads modernes, d'instructions SIMD et de bibliothèques tierces, ainsi que le respect des directives de style de codage et l'utilisation d'outils d'automatisation. Des cas pratiques montrent comment utiliser la bibliothèque Eigen pour implémenter des algorithmes de régression linéaire, gérer efficacement la mémoire et utiliser des opérations matricielles hautes performances.

Explorez les principes sous-jacents et la sélection d'algorithmes de la fonction de tri C++ Apr 02, 2024 pm 05:36 PM

La couche inférieure de la fonction de tri C++ utilise le tri par fusion, sa complexité est O(nlogn) et propose différents choix d'algorithmes de tri, notamment le tri rapide, le tri par tas et le tri stable.

L'intelligence artificielle peut-elle prédire la criminalité ? Explorez les capacités de CrimeGPT Mar 22, 2024 pm 10:10 PM

La convergence de l’intelligence artificielle (IA) et des forces de l’ordre ouvre de nouvelles possibilités en matière de prévention et de détection de la criminalité. Les capacités prédictives de l’intelligence artificielle sont largement utilisées dans des systèmes tels que CrimeGPT (Crime Prediction Technology) pour prédire les activités criminelles. Cet article explore le potentiel de l’intelligence artificielle dans la prédiction de la criminalité, ses applications actuelles, les défis auxquels elle est confrontée et les éventuelles implications éthiques de cette technologie. Intelligence artificielle et prédiction de la criminalité : les bases CrimeGPT utilise des algorithmes d'apprentissage automatique pour analyser de grands ensembles de données, identifiant des modèles qui peuvent prédire où et quand les crimes sont susceptibles de se produire. Ces ensembles de données comprennent des statistiques historiques sur la criminalité, des informations démographiques, des indicateurs économiques, des tendances météorologiques, etc. En identifiant les tendances qui pourraient échapper aux analystes humains, l'intelligence artificielle peut donner du pouvoir aux forces de l'ordre.

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution Jun 06, 2024 pm 12:33 PM

01Aperçu des perspectives Actuellement, il est difficile d'atteindre un équilibre approprié entre efficacité de détection et résultats de détection. Nous avons développé un algorithme YOLOv5 amélioré pour la détection de cibles dans des images de télédétection optique haute résolution, en utilisant des pyramides de caractéristiques multicouches, des stratégies de têtes de détection multiples et des modules d'attention hybrides pour améliorer l'effet du réseau de détection de cibles dans les images de télédétection optique. Selon l'ensemble de données SIMD, le mAP du nouvel algorithme est 2,2 % meilleur que YOLOv5 et 8,48 % meilleur que YOLOX, permettant ainsi d'obtenir un meilleur équilibre entre les résultats de détection et la vitesse. 02 Contexte et motivation Avec le développement rapide de la technologie de télédétection, les images de télédétection optique à haute résolution ont été utilisées pour décrire de nombreux objets à la surface de la Terre, notamment des avions, des voitures, des bâtiments, etc. Détection d'objets dans l'interprétation d'images de télédétection

Pratique et réflexion sur la plateforme multimodale de grands modèles Jiuzhang Yunji DataCanvas Oct 20, 2023 am 08:45 AM

1. Le développement historique des grands modèles multimodaux. La photo ci-dessus est le premier atelier sur l'intelligence artificielle organisé au Dartmouth College aux États-Unis en 1956. Cette conférence est également considérée comme le coup d'envoi du développement de l'intelligence artificielle. pionniers de la logique symbolique (à l'exception du neurobiologiste Peter Milner au milieu du premier rang). Cependant, cette théorie de la logique symbolique n’a pas pu être réalisée avant longtemps et a même marqué le début du premier hiver de l’IA dans les années 1980 et 1990. Il a fallu attendre la récente mise en œuvre de grands modèles de langage pour découvrir que les réseaux de neurones portent réellement cette pensée logique. Les travaux du neurobiologiste Peter Milner ont inspiré le développement ultérieur des réseaux de neurones artificiels, et c'est pour cette raison qu'il a été invité à y participer. dans ce projet.

Application d'algorithmes dans la construction de 58 plateformes de portraits May 09, 2024 am 09:01 AM

1. Contexte de la construction de la plateforme 58 Portraits Tout d'abord, je voudrais partager avec vous le contexte de la construction de la plateforme 58 Portraits. 1. La pensée traditionnelle de la plate-forme de profilage traditionnelle ne suffit plus. La création d'une plate-forme de profilage des utilisateurs s'appuie sur des capacités de modélisation d'entrepôt de données pour intégrer les données de plusieurs secteurs d'activité afin de créer des portraits d'utilisateurs précis. Elle nécessite également l'exploration de données pour comprendre le comportement et les intérêts des utilisateurs. et besoins, et fournir des capacités côté algorithmes ; enfin, il doit également disposer de capacités de plate-forme de données pour stocker, interroger et partager efficacement les données de profil utilisateur et fournir des services de profil. La principale différence entre une plate-forme de profilage d'entreprise auto-construite et une plate-forme de profilage de middle-office est que la plate-forme de profilage auto-construite dessert un seul secteur d'activité et peut être personnalisée à la demande. La plate-forme de mid-office dessert plusieurs secteurs d'activité et est complexe ; modélisation et offre des fonctionnalités plus générales. 2.58 Portraits d'utilisateurs de l'arrière-plan de la construction du portrait sur la plate-forme médiane 58

Ajoutez SOTA en temps réel et montez en flèche ! FastOcc : un algorithme Occ plus rapide et convivial pour le déploiement est là ! Mar 14, 2024 pm 11:50 PM

Écrit ci-dessus & La compréhension personnelle de l'auteur est que dans le système de conduite autonome, la tâche de perception est un élément crucial de l'ensemble du système de conduite autonome. L'objectif principal de la tâche de perception est de permettre aux véhicules autonomes de comprendre et de percevoir les éléments environnementaux environnants, tels que les véhicules circulant sur la route, les piétons au bord de la route, les obstacles rencontrés lors de la conduite, les panneaux de signalisation sur la route, etc., aidant ainsi en aval modules Prendre des décisions et des actions correctes et raisonnables. Un véhicule doté de capacités de conduite autonome est généralement équipé de différents types de capteurs de collecte d'informations, tels que des capteurs de caméra à vision panoramique, des capteurs lidar, des capteurs radar à ondes millimétriques, etc., pour garantir que le véhicule autonome peut percevoir et comprendre avec précision l'environnement environnant. éléments , permettant aux véhicules autonomes de prendre les bonnes décisions pendant la conduite autonome. Tête

See all articles