デシジョンツリー専用に設計されたシンガポール国立大学と清華大学が共同で高速かつ安全な新しい連合学習システムを提案
フェデレーテッド ラーニングは機械学習の非常に人気のある分野であり、データを転送せずに複数の当事者によるモデルの共同トレーニングを指します。フェデレーテッド ラーニングの発展に伴い、FATE、FedML、PaddleFL、TensorFlow-Federated などのフェデレーテッド ラーニング システムが際限なく登場しています。ただし、ほとんどのフェデレーテッド ラーニング システムは、ツリー モデルのフェデレーテッド ラーニング トレーニングをサポートしていません。ニューラル ネットワークと比較して、ツリー モデルは、トレーニングが高速で、解釈可能性が高く、表形式のデータに適しているという特徴があります。ツリー モデルには、金融、医療、インターネット、その他の分野 (広告の推奨、株価予測など) における幅広い応用シナリオがあります。
意思決定木の代表的なモデルは、Gradient Boosting Decision Tree (GBDT) です。 1 つのツリーの予測能力には限界があるため、GBDT はブースティング法を通じて複数のツリーを直列にトレーニングし、最終的に各ツリーを現在の予測値とラベル値の残差に適合させることで良好な予測効果を実現します。代表的なGBDTシステムにはXGBoost、LightGBM、CatBoost、ThunderGBMなどがありますが、その中でもXGBoostはKDDカップ優勝チームに何度も採用されています。ただし、これらのシステムはどれも、フェデレーテッド ラーニング シナリオでの GBDT トレーニングをサポートしていません。最近、シンガポール国立大学と清華大学の研究者は、ツリー モデルのトレーニングに焦点を当てた新しい連合学習システム FedTree を提案しました。
- 論文のアドレス: https://github.com/Xtra-Computing/FedTree/blob/main/FedTree_draft_paper。 pdf
- プロジェクト アドレス: https://github.com/Xtra-Computing/FedTree
FedTree システムの紹介FedTree のアーキテクチャ図を図 1 に示します。インターフェース、環境、フレームワーク、プライバシー保護、モデルの合計 5 つのモジュールがあります。
#図 1: FedTree システム アーキテクチャ図
インターフェース: FedTree は、コマンド ライン インターフェースと Python インターフェースの 2 つのインターフェースをサポートします。ユーザーはパラメーター (参加者数、フェデレーション シナリオなど) を指定するだけで、1 行のコマンドでトレーニングのために FedTree を実行できます。 FedTree の Python インターフェイスは scikit-learn と互換性があり、トレーニングと予測のために fit() および detect() を呼び出すことができます。
環境: FedTree は、単一マシン上でのフェデレーテッド ラーニングのシミュレートされたデプロイメントと、複数のマシン上での分散フェデレーションのデプロイメントをサポートしています。機械の勉強。スタンドアロン環境では、FedTree はデータを複数のサブデータ セットに分割することをサポートしており、各サブデータ セットは参加者としてトレーニングされます。マルチマシン環境では、FedTree は各マシンを参加者としてサポートし、マシンは gRPC を介して通信します。同時に、FedTree は CPU に加えて、トレーニングを高速化するための GPU の使用をサポートします。
フレームワーク: FedTree は、水平および垂直フェデレーテッド ラーニング シナリオで GBDT のトレーニングをサポートします。水平シナリオでは、異なる参加者が異なるトレーニング サンプルと同じ特徴空間を持ちます。垂直シナリオでは、異なる参加者が異なる特徴空間と同じトレーニング サンプルを持ちます。パフォーマンスを確保するために、どちらのシナリオでも、複数の関係者が各ノードのトレーニングに参加します。さらに、FedTree はアンサンブル学習もサポートしています。アンサンブル学習では、参加者がツリーを並行してトレーニングし、それらを集約して参加者間の通信オーバーヘッドを削減します。
プライバシー: トレーニング中に渡された勾配によってトレーニング データに関する情報が漏洩する可能性があるため、FedTree は別のプライバシーを提供します。 - 勾配情報をさらに保護するための保存方法には、準同型暗号化 (HE) と安全な集約 (SA) が含まれます。同時に、FedTree は、最終的なトレーニング済みモデルを保護するための差分プライバシーを提供します。
モデル: ツリーのトレーニングに基づいて、FedTree はブースティング/バギング手法/ランダム フォレストによる GBDT のトレーニングをサポートします。 。さまざまな損失関数を設定することにより、FedTree によってトレーニングされたモデルは、分類や回帰などのさまざまなタスクをサポートします。 実験表 1 は、a9a、ブレスト、クレジットに関するさまざまなシステムの AUC とアワビの RMSE、FedTree のモデル効果、およびすべてのデータを使用したトレーニング GBDT (XGBoost、ThunderGBM) をまとめたものです。 FATE の SecureBoost (SBT) はほぼ同じです。さらに、プライバシー保護ポリシー SA および HE はモデルのパフォーマンスに影響を与えません。 #表 1: さまざまなシステムのモデル効果の比較 表 2 は、さまざまなシステムでの各ツリーのトレーニング時間 (単位: 秒) をまとめたもので、FedTree が FATE よりもはるかに高速であり、水平フェデレーションで 100 倍を超える加速率を達成できることがわかります。学習シナリオ。 #表 2: さまざまなシステムでの各ツリーのトレーニング時間の比較 研究の詳細については、FedTree の元の論文を参照してください。
以上がデシジョンツリー専用に設計されたシンガポール国立大学と清華大学が共同で高速かつ安全な新しい連合学習システムを提案の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

C++sort 関数の最下層はマージ ソートを使用し、その複雑さは O(nlogn) で、クイック ソート、ヒープ ソート、安定したソートなど、さまざまなソート アルゴリズムの選択肢を提供します。

人工知能 (AI) と法執行機関の融合により、犯罪の予防と検出の新たな可能性が開かれます。人工知能の予測機能は、犯罪行為を予測するためにCrimeGPT (犯罪予測技術) などのシステムで広く使用されています。この記事では、犯罪予測における人工知能の可能性、その現在の応用、人工知能が直面する課題、およびこの技術の倫理的影響について考察します。人工知能と犯罪予測: 基本 CrimeGPT は、機械学習アルゴリズムを使用して大規模なデータセットを分析し、犯罪がいつどこで発生する可能性があるかを予測できるパターンを特定します。これらのデータセットには、過去の犯罪統計、人口統計情報、経済指標、気象パターンなどが含まれます。人間のアナリストが見逃す可能性のある傾向を特定することで、人工知能は法執行機関に力を与えることができます

01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出

1. マルチモーダル大型モデルの発展の歴史 上の写真は、1956 年に米国のダートマス大学で開催された最初の人工知能ワークショップです。このカンファレンスが人工知能開発の始まりとも考えられています。記号論理学の先駆者たち(前列中央の神経生物学者ピーター・ミルナーを除く)。しかし、この記号論理理論は長い間実現できず、1980 年代と 1990 年代に最初の AI の冬の到来さえもたらしました。最近の大規模な言語モデルが実装されて初めて、ニューラル ネットワークが実際にこの論理的思考を担っていることがわかりました。神経生物学者ピーター ミルナーの研究は、その後の人工ニューラル ネットワークの開発に影響を与えました。彼が参加に招待されたのはこのためです。このプロジェクトでは。

1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

上記と著者の個人的な理解は、自動運転システムにおいて、認識タスクは自動運転システム全体の重要な要素であるということです。認識タスクの主な目的は、自動運転車が道路を走行する車両、路側の歩行者、運転中に遭遇する障害物、道路上の交通標識などの周囲の環境要素を理解して認識できるようにすることで、それによって下流のシステムを支援できるようにすることです。モジュール 正しく合理的な決定と行動を行います。自動運転機能を備えた車両には、通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなど、さまざまな種類の情報収集センサーが装備されており、自動運転車が正確に認識し、認識できるようにします。周囲の環境要素を理解することで、自動運転車が自動運転中に正しい判断を下せるようになります。頭
