의사결정 트리를 위해 특별히 설계된 싱가포르 국립대학교와 칭화대학교는 빠르고 안전한 새로운 연합 학습 시스템을 공동으로 제안합니다.
연합 학습은 머신러닝에서 매우 뜨거운 분야로, 데이터를 전송하지 않고 여러 당사자가 모델을 공동으로 훈련하는 것을 말합니다. 연합 학습의 발전과 함께 FATE, FedML, PaddleFL, TensorFlow-Federated 등과 같은 연합 학습 시스템이 끝없이 등장하고 있습니다. 그러나 대부분의 연합 학습 시스템은 트리 모델의 연합 학습 훈련을 지원하지 않습니다. 신경망과 비교하여 트리 모델은 빠른 훈련, 강력한 해석 가능성 및 표 형식 데이터에 적합한 특성을 갖습니다. 트리 모델은 금융, 의료, 인터넷 및 광고 추천, 주식 예측 등과 같은 기타 분야에서 광범위한 응용 시나리오를 가지고 있습니다.
결정 트리의 대표적인 모델은 GBDT(Gradient Boosting Decision Tree)입니다. 하나의 트리의 예측 능력은 제한되어 있으므로 GBDT는 부스팅 방법을 통해 여러 트리를 직렬로 학습시키고, 최종적으로 각 트리를 현재 예측 값과 레이블 값의 잔차에 맞춰서 좋은 예측 효과를 얻습니다. 대표적인 GBDT 시스템으로는 XGBoost, LightGBM, CatBoost 및 ThunderGBM이 있습니다. 그중 XGBoost는 KDD 컵 챔피언십 팀에서 여러 번 사용되었습니다. 그러나 이러한 시스템 중 어느 것도 연합 학습 시나리오에서 GBDT 교육을 지원하지 않습니다. 최근 싱가포르 국립대학교와 칭화대학교 연구진은 트리 모델 훈련에 초점을 맞춘 새로운 연합 학습 시스템인 FedTree를 제안했습니다.
- 논문 주소: https://github.com/Xtra-Computing/FedTree/blob/main/FedTree_draft_paper.pdf
- 프로젝트 주소: https://github.com/ Xtra-Computing/FedTree
FedTree 시스템 소개FedTree 아키텍처 다이어그램은 그림 1에 표시되어 있으며 인터페이스, 환경, 프레임워크, 개인 정보 보호 및 모델의 총 5개 모듈이 있습니다.
그림 1: FedTree 시스템 아키텍처 다이어그램
인터페이스 : FedTree는 명령줄 인터페이스와 Python 인터페이스라는 두 가지 인터페이스를 지원합니다. 사용자는 매개변수(참가자 수, 연합 시나리오 등)만 제공하면 되며 한 줄 명령으로 훈련을 위해 FedTree를 실행할 수 있습니다. FedTree의 Python 인터페이스는 scikit-learn과 호환되며 훈련 및 예측을 위해 fit() 및 예측()을 호출할 수 있습니다.
Environment: FedTree는 단일 컴퓨터에서 연합 학습의 시뮬레이션 배포와 여러 컴퓨터에서 분산 연합 학습 배포를 지원합니다. 독립형 환경에서 FedTree는 데이터를 여러 하위 데이터 세트로 분할하는 것을 지원하며 각 하위 데이터 세트는 참가자로 훈련됩니다. 다중 시스템 환경에서 FedTree는 각 시스템을 참가자로 지원하고 시스템은 gRPC를 통해 통신합니다. 동시에 FedTree는 CPU 외에도 GPU 사용을 지원하여 훈련을 가속화합니다.
Framework: FedTree는 수평 및 수직 연합 학습 시나리오에서 GBDT 교육을 지원합니다. 수평 시나리오에서는 참가자마다 훈련 샘플이 다르고 기능 공간이 동일합니다. 수직적 시나리오에서는 참가자마다 특성 공간이 다르고 훈련 샘플이 동일합니다. 성능을 보장하기 위해 두 시나리오 모두에서 여러 당사자가 각 노드의 교육에 참여합니다. 또한 FedTree는 참가자가 트리를 병렬로 훈련한 다음 이를 집계하여 참가자 간의 통신 오버헤드를 줄이는 앙상블 학습도 지원합니다.
Privacy: 훈련 프로세스 중에 전달된 기울기가 훈련 데이터에 대한 정보를 유출할 수 있으므로 FedTree는 HE(동형 암호화) 및 보안 집계를 포함하여 기울기 정보를 더욱 보호하기 위한 다양한 개인 정보 보호 방법을 제공합니다. (SA). 동시에 FedTree는 최종 훈련 모델을 보호하기 위해 차등 개인 정보 보호를 제공합니다.
Model: FedTree는 트리 훈련을 기반으로 부스팅/배깅 방법을 통해 GBDT/랜덤 포레스트 훈련을 지원합니다. 다양한 손실 함수를 설정함으로써 FedTree에서 훈련한 모델은 분류 및 회귀를 포함한 다양한 작업을 지원합니다.
실험표 1은 전복에 대한 a9a, 유방 및 신용 및 RMSE에 대한 다양한 시스템의 AUC, FedTree의 모델 효과 및 FATE의 모든 데이터 및 SecureBoost(SBT)를 사용한 GBDT(XGBoost, ThunderGBM) 훈련을 요약합니다. . 또한 개인 정보 보호 정책 SA 및 HE는 모델 성능에 영향을 미치지 않습니다.
표 1: 서로 다른 시스템의 모델 효과 비교
표 2는 서로 다른 시스템의 각 트리의 훈련 시간(단위: 초)을 요약한 것입니다. FATE 수평 연합 학습 시나리오에서 훨씬 더 빠르며 100배 이상의 가속 비율을 달성할 수 있습니다.
표 2: 다양한 시스템의 각 나무에 대한 훈련 시간 비교
자세한 연구 내용은 FedTree 원본 논문을 참조하세요.
위 내용은 의사결정 트리를 위해 특별히 설계된 싱가포르 국립대학교와 칭화대학교는 빠르고 안전한 새로운 연합 학습 시스템을 공동으로 제안합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











위에 작성 및 저자의 개인적인 이해: 현재 전체 자율주행 시스템에서 인식 모듈은 중요한 역할을 합니다. 자율주행 시스템의 제어 모듈은 적시에 올바른 판단과 행동 결정을 내립니다. 현재 자율주행 기능을 갖춘 자동차에는 일반적으로 서라운드 뷰 카메라 센서, 라이더 센서, 밀리미터파 레이더 센서 등 다양한 데이터 정보 센서가 장착되어 다양한 방식으로 정보를 수집하여 정확한 인식 작업을 수행합니다. 순수 비전을 기반으로 한 BEV 인식 알고리즘은 하드웨어 비용이 저렴하고 배포가 용이하며, 출력 결과를 다양한 다운스트림 작업에 쉽게 적용할 수 있어 업계에서 선호됩니다.

C++의 기계 학습 알고리즘이 직면하는 일반적인 과제에는 메모리 관리, 멀티스레딩, 성능 최적화 및 유지 관리 가능성이 포함됩니다. 솔루션에는 스마트 포인터, 최신 스레딩 라이브러리, SIMD 지침 및 타사 라이브러리 사용은 물론 코딩 스타일 지침 준수 및 자동화 도구 사용이 포함됩니다. 실제 사례에서는 Eigen 라이브러리를 사용하여 선형 회귀 알고리즘을 구현하고 메모리를 효과적으로 관리하며 고성능 행렬 연산을 사용하는 방법을 보여줍니다.

C++정렬 함수의 맨 아래 계층은 병합 정렬을 사용하고 복잡도는 O(nlogn)이며 빠른 정렬, 힙 정렬 및 안정 정렬을 포함한 다양한 정렬 알고리즘 선택을 제공합니다.

1. 멀티모달 대형 모델의 역사적 발전 위 사진은 1956년 미국 다트머스 대학에서 열린 최초의 인공지능 워크숍이다. 이 컨퍼런스도 인공지능 개발의 시발점이 된 것으로 평가된다. 상징 논리학의 선구자들(앞줄 중앙에 있는 신경생물학자 피터 밀너를 제외하고). 그러나 이 기호논리 이론은 오랫동안 실현되지 못했고, 1980년대와 1990년대에는 최초의 AI 겨울 시기를 맞이하기도 했습니다. 신경망이 실제로 이러한 논리적 사고를 담고 있다는 사실을 발견한 것은 최근 대규모 언어 모델이 구현된 이후였습니다. 신경생물학자인 Peter Milner의 연구는 인공 신경망의 후속 개발에 영감을 주었으며, 이러한 이유로 그가 참여하도록 초대되었습니다. 이 프로젝트에서.

01 전망 요약 현재로서는 탐지 효율성과 탐지 결과 간의 적절한 균형을 이루기가 어렵습니다. 우리는 광학 원격 탐사 이미지에서 표적 감지 네트워크의 효과를 향상시키기 위해 다층 특징 피라미드, 다중 감지 헤드 전략 및 하이브리드 주의 모듈을 사용하여 고해상도 광학 원격 감지 이미지에서 표적 감지를 위한 향상된 YOLOv5 알고리즘을 개발했습니다. SIMD 데이터 세트에 따르면 새로운 알고리즘의 mAP는 YOLOv5보다 2.2%, YOLOX보다 8.48% 우수하여 탐지 결과와 속도 간의 균형이 더 잘 이루어졌습니다. 02 배경 및 동기 원격탐사 기술의 급속한 발전으로 항공기, 자동차, 건물 등 지구 표면의 많은 물체를 묘사하기 위해 고해상도 광학 원격탐사 영상이 활용되고 있다. 원격탐사 이미지 해석에서 물체 감지

인공지능(AI)과 법 집행의 융합은 범죄 예방 및 탐지의 새로운 가능성을 열어줍니다. 인공지능의 예측 기능은 범죄 행위를 예측하기 위해 CrimeGPT(범죄 예측 기술)와 같은 시스템에서 널리 사용됩니다. 이 기사에서는 범죄 예측에서 인공 지능의 잠재력, 현재 응용 프로그램, 직면한 과제 및 기술의 가능한 윤리적 영향을 탐구합니다. 인공 지능 및 범죄 예측: 기본 CrimeGPT는 기계 학습 알고리즘을 사용하여 대규모 데이터 세트를 분석하고 범죄가 발생할 가능성이 있는 장소와 시기를 예측할 수 있는 패턴을 식별합니다. 이러한 데이터 세트에는 과거 범죄 통계, 인구 통계 정보, 경제 지표, 날씨 패턴 등이 포함됩니다. 인간 분석가가 놓칠 수 있는 추세를 식별함으로써 인공 지능은 법 집행 기관에 권한을 부여할 수 있습니다.

1. 58초상화 플랫폼 구축 배경 먼저, 58초상화 플랫폼 구축 배경에 대해 말씀드리겠습니다. 1. 기존 프로파일링 플랫폼의 전통적인 사고로는 더 이상 충분하지 않습니다. 사용자 프로파일링 플랫폼을 구축하려면 여러 비즈니스 라인의 데이터를 통합하여 정확한 사용자 초상화를 구축하는 데이터 웨어하우스 모델링 기능이 필요합니다. 그리고 알고리즘 측면의 기능을 제공해야 하며, 마지막으로 사용자 프로필 데이터를 효율적으로 저장, 쿼리 및 공유하고 프로필 서비스를 제공할 수 있는 데이터 플랫폼 기능도 있어야 합니다. 자체 구축한 비즈니스 프로파일링 플랫폼과 중간 사무실 프로파일링 플랫폼의 주요 차이점은 자체 구축한 프로파일링 플랫폼이 단일 비즈니스 라인에 서비스를 제공하고 필요에 따라 사용자 정의할 수 있다는 것입니다. 모델링하고 보다 일반적인 기능을 제공합니다. 2.58 Zhongtai 초상화 구성 배경의 사용자 초상화

PHP 알고리즘 분석: 배열에서 누락된 숫자를 찾는 효율적인 방법 PHP 애플리케이션을 개발하는 과정에서 배열에서 누락된 숫자를 찾아야 하는 상황에 자주 직면합니다. 이러한 상황은 데이터 처리 및 알고리즘 설계에서 매우 흔히 발생하므로 이 문제를 해결하려면 효율적인 검색 알고리즘을 마스터해야 합니다. 이 기사에서는 배열에서 누락된 숫자를 찾는 효율적인 방법을 소개하고 특정 PHP 코드 예제를 첨부합니다. 문제 설명 1에서 100 사이의 정수를 포함하는 배열이 있지만 숫자 하나가 누락되었다고 가정합니다. 우리는 다음을 디자인해야 합니다.
