종합적인 기계 학습 용어 가이드-파이썬 튜토리얼-php.cn

Comprehensive Machine Learning Terminology Guide

소개

종합적인 머신러닝 용어 가이드에 오신 것을 환영합니다! 기계 학습 분야를 처음 접하는 사람이든 어휘력을 향상하려는 숙련된 실무자이든 이 가이드는 ML의 기초를 형성하는 핵심 용어와 개념을 이해하는 데 도움이 되는 리소스로 설계되었습니다.

기본 개념

머신러닝(ML): 데이터에서 학습하고 이를 기반으로 의사결정을 내릴 수 있는 시스템을 구축하는 데 중점을 두는 인공지능의 하위 집합입니다.

인공지능(AI): 인간의 사고 능력과 행동을 시뮬레이션할 수 있는 지능형 기계를 만드는 더 넓은 분야입니다.

딥 러닝: 다층 인공 신경망을 기반으로 한 머신 러닝의 하위 집합

데이터 세트: 기계 학습 모델을 훈련하고 테스트하는 데 사용되는 데이터 모음

특성: 관찰되는 현상의 개별 측정 가능한 속성 또는 특성.

레이블: 지도 학습에서 예측하려는 목표 변수

모델: 데이터를 통해 학습된 실제 프로세스를 수학적으로 표현한 것

알고리즘: 문제 해결을 위한 단계별 절차 또는 공식

훈련: 데이터를 기반으로 예측이나 결정을 내릴 수 있도록 모델을 가르치는 과정

추론: 훈련된 모델을 사용하여 보이지 않는 새로운 데이터를 예측합니다.

기계 학습의 유형

지도 학습: 레이블이 지정된 데이터로부터 학습하여 예상치 못한 데이터의 결과를 예측합니다.

비지도 학습: 레이블이 지정된 응답 없이 입력 데이터에서 숨겨진 패턴이나 고유 구조를 찾습니다.

반지도 학습: 레이블이 있는 데이터와 레이블이 없는 데이터의 조합에서 학습합니다.

강화 학습: 환경과 상호작용하여 결정을 내리는 방법을 학습합니다.

전이 학습: 하나의 작업에서 얻은 지식을 관련 작업에 적용합니다.

모델 평가 및 측정항목

정확도: 조사된 전체 사례 수 중 올바른 예측이 이루어진 비율

정밀도: 모든 긍정적 예측 중 참긍정 예측의 비율

재현율: 실제 양성 사례 중 참양성 예측 비율입니다.

F1 점수: 정밀도와 재현율의 조화평균

ROC 곡선: 이진 분류 시스템의 진단 능력을 보여주는 그래픽 플롯

AUC(Area Under the Curve): 클래스를 구분하는 분류자의 능력을 나타내는 척도입니다.

혼란 행렬: 분류 모델의 성능을 설명하는 데 사용되는 표

교차 검증: 제한된 데이터 샘플에서 기계 학습 모델을 평가하는 데 사용되는 리샘플링 절차입니다.

과적합: 모델이 노이즈와 변동을 포함하여 훈련 데이터를 너무 잘 학습하는 경우.

과소적합: 모델이 너무 단순하여 데이터의 기본 구조를 포착할 수 없는 경우

신경망과 딥러닝

뉴런: 신경망의 기본 단위로, 생물학적 뉴런을 대략적으로 모델링한 것입니다.

활성화 함수: 입력 또는 입력 집합이 주어지면 뉴런의 출력을 결정하는 함수.

가중치: 뉴런 간 연결 강도를 결정하는 신경망 내의 매개변수

바이어스: 뉴런에 대한 입력의 가중 합계와 함께 출력을 조정하는 데 사용되는 신경망의 추가 매개변수입니다.

역전파: 예측의 오류를 기반으로 네트워크의 가중치를 반복적으로 조정하여 신경망을 훈련하는 알고리즘입니다.

Gradient Descent: 가장 가파른 하강 방향으로 반복적으로 이동하여 손실 함수를 최소화하는 데 사용되는 최적화 알고리즘입니다.

에포크: 전체 교육 데이터세트를 한 번에 완전히 통과합니다.

배치: 모델 학습의 한 반복에 사용되는 학습 데이터의 하위 집합

학습률: 모델 가중치가 업데이트될 때마다 예상 오류에 대응하여 모델을 얼마나 변경할지 제어하는 하이퍼파라미터입니다.

CNN(Convolutional Neural Network): 이미지 인식 및 처리에 일반적으로 사용되는 신경망 유형입니다.

RNN(Recurrent Neural Network): 일련의 데이터에서 패턴을 인식하도록 설계된 신경망 유형입니다.

장단기 기억(LSTM): 장기 의존성을 학습할 수 있는 RNN의 일종입니다.

Transformer: 주의 메커니즘에 전적으로 의존하여 입력과 출력 간의 전역 종속성을 도출하는 모델 아키텍처입니다.

기능 엔지니어링 및 선택

특성 공학: 도메인 지식을 사용하여 원시 데이터에서 특성을 추출하는 프로세스

특성 선택: 모델 구성에 사용할 관련 특성의 하위 집합을 선택하는 프로세스

차원성 감소: 데이터세트의 입력 변수 수를 줄이는 기술

주성분 분석(PCA): 직교 변환을 사용하여 상관관계가 있을 수 있는 변수의 관측값 집합을 선형적으로 상관관계가 없는 변수의 값 집합으로 변환하는 통계 절차입니다.

앙상블 방법

앙상블 학습: 여러 모델을 결합하여 계산 지능 문제를 해결하는 과정

배깅: 교육 데이터의 여러 하위 집합을 사용하여 다양한 모델을 교육하는 앙상블 방법입니다.

부스팅: 약한 학습자를 결합하여 강한 학습자를 만드는 앙상블 방식입니다.

Random Forest: 다수의 의사결정 트리를 구성하는 앙상블 학습 방법

자연어 처리(NLP)

토큰화: 텍스트를 개별 단어나 하위 단어로 분해하는 프로세스입니다.

형태소 분석: 굴절된 단어를 어간이나 어간 형태로 줄이는 과정

정형화: 단어의 다양한 굴절 형태를 그룹화하는 과정

워드 임베딩: 유사한 의미를 가진 단어가 유사한 표현을 갖는 텍스트에 대한 학습된 표현입니다.

NER(명명된 개체 인식): 텍스트에서 개체명을 식별하고 분류하는 작업

감정 분석: 자연어 처리를 사용하여 텍스트에서 주관적인 정보를 식별하고 추출합니다.

강화 학습

에이전트: 강화 학습 시나리오의 학습자 또는 의사결정자

환경: 에이전트가 작동하고 학습하는 세계

상태: 환경 내 에이전트의 현재 상황이나 조건

Action: 에이전트가 내리는 움직임이나 결정

보상: 에이전트가 취한 조치를 평가하기 위한 환경의 피드백

정책: 에이전트가 현재 상태를 기반으로 다음 작업을 결정하는 데 사용하는 전략

고급 개념

GAN(Generative Adversarial Network): 두 개의 신경망이 서로 경쟁하는 머신러닝 프레임워크 클래스입니다.

주의 메커니즘: 인지적 주의를 모방하여 입력 데이터의 중요한 부분을 강화하고 관련 없는 부분을 줄이는 기술입니다.

전이 학습: 하나의 문제를 해결하면서 얻은 지식을 저장하고 이를 다른 관련 문제에 적용하는 데 초점을 맞춘 기계 학습의 연구 문제입니다.

Few-Shot Learning: 단 몇 가지 예를 통해 새로운 클래스를 인식하도록 모델을 훈련시키는 기계 학습 유형입니다.

설명 가능한 AI(XAI): 인간이 결과를 이해할 수 있는 인공지능 시스템

연합 학습: 로컬 데이터 샘플을 보유하는 여러 분산 장치 또는 서버에서 알고리즘을 훈련하는 기계 학습 기술입니다.

AutoML: 기계 학습을 실제 문제에 적용하는 엔드투엔드 프로세스를 자동화하는 프로세스입니다.

결론

이 글을 읽고 계시다면 정말 감사드립니다! 정말 감사드립니다 ❤️.

Twitter appyzdl5에서 저를 팔로우하여 ML에 대한 정기적인 업데이트, 통찰력 및 흥미로운 대화를 받아보세요.

miniGit 및 ML 알고리즘과 같은 프로젝트가 처음부터 포함된 내 Github: @appyzdl

위 내용은 종합적인 기계 학습 용어 가이드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!