Mahout은 개발자가 지능형 애플리케이션을 보다 편리하고 빠르게 만들 수 있도록 돕는 것을 목표로 기계 학습 분야에서 기존 알고리즘의 확장 가능한 구현을 제공합니다. Mahout에는 클러스터링, 분류, 추천 필터링, 빈번한 하위 항목 마이닝을 포함한 많은 구현이 포함되어 있습니다. 또한 Mahout은 Apache Hadoop 라이브러리를 사용하여 효율적으로 클라우드로 확장할 수 있습니다.
선생님의 강의 스타일:
선생님의 강의는 간단하고 심층적이며 명확하고 계층별 분석, 연동, 엄격한 논쟁, 엄격한 구조, 논리적 사고력을 사용하여 학생들을 끌어들입니다. '주의를 기울이고 합리적인 통제를 사용하여 교실 교육 과정을 진행합니다. 선생님의 강의를 들으면서 학생들은 지식을 배울 뿐만 아니라 사고 훈련도 받으며 선생님의 엄격한 학문적 태도에 영향을 받고 감염됩니다
이 영상에서 더 어려운 점은 로지스틱 회귀 분류기_베이지안 분류기_1
1. 배경
우선, 글의 시작 부분에서 몇 가지 질문을 해보자. 이 질문에 답할 수 있다면 이 글을 읽을 필요가 없거나, 글을 읽게 된 동기는 다음과 같다. 순전히 이 글의 결점을 찾아내는 것입니다. 물론, 297314262@qq.com으로 "Naive Bayesian of Faults"라는 이메일을 보내주시면 감사하겠습니다.
그나저나, 이 글을 읽은 후에도 다음 질문에 답할 수 없다면, 이메일로 알려주시면 최선을 다해 답변해 드리겠습니다.
나이브 베이즈 분류기의 "나이브"는 구체적으로 이 분류기의 어떤 특성을 나타냅니다.
나이브 베이즈 분류기와 최대 우도 추정(MLE) 및 최대 사후 확률(MAP) 간의 관계
나이브 베이즈 분류, 로지스틱 회귀 분류, 생성 모델과 의사 결정 모델의 관계
지도 학습과 베이지안 추정의 관계
2. 일치
그래서 이 글은 시작됩니다. 우선, 이 글에 등장할 수 있는 다양한 표현 형태에 대해 여기서 합의하겠습니다.
X와 같은 대문자는 확률 변수를 나타내고, Xij와 같은 소문자는 변수의 하나의 값을 나타냅니다( 지도 학습 문제 해결에 대한 Yes의 추정치의 j번째 값은 무엇입니까?
지도 학습의 경우 실제로 목표 함수 f: 샘플의 실제 분류 결과를 추정하는 것이 목표입니다. 표본의 값이 P(X=xk|Y=yi)의 모든 추정값과 P(Y=yi)의 모든 추정값을 구한다고 가정합니다. 후속 분류 과정은 P(Y=yi|X=xk)의 가장 큰 yi를 찾는 것입니다. 베이지안 추정을 사용하면 지도 학습의 문제를 해결할 수 있음을 알 수 있습니다.
4. 분류기의 '순진함' 특성
다음으로, 첫 번째 질문인 '순진함'이 무엇인가요?
섹션 3의 분석을 통해 우리는 P(Y=yi|X=xk)를 얻으려면 P(X=xk|Y=yi)뿐만 아니라 P(Y)의 모든 추정치를 알아야 함을 알고 있습니다. =yi) 의 모든 추정값을 가정한 다음 2*(2^N - 1)개의 추정값을 찾아야 합니다. (Y는 특정 범주로 제공되므로 X의 각 값에 대한 확률의 합은 1입니다. 이므로 실제 추정값은 2^N - 1)입니다. 상상할 수 있듯이 N이 매우 큰 상황(텍스트 분류 시 용어의 가능한 값이 매우 큰 경우)의 경우 이 추정의 계산량이 엄청납니다. 그렇다면 필요한 추정량을 줄이고 베이지안 추정 방법을 실현하려면 어떻게 해야 할까요? 여기서 가정이 도입됩니다.
가정: 주어진 조건 Y=yi에서 X의 각 차원의 변수는 서로 독립적입니다.
그러면 이 가정 하에서 P(X=xk|Y=yi)=P(X1=x1j1|Y=yi)P(X2=x2j2|Y=yi)...P(Xn= xnjn|Y= yi) 즉, 이때는 N개의 추정값만 필요하다. 따라서 이 가정은 베이지안 추정의 계산 복잡성을 2*(2^N - 1)에서 N으로 줄여 이 분류기를 실용적으로 만듭니다. 그러면 이 가정은 순진한 속성이 됩니다. 5. 최대 우도 추정 및 최대 사후 확률 해다음으로, 두 번째 질문에 대답하기 위해 첫 번째 선택은 최대 우도 추정 방법을 나이브 베이즈 분류기의 해결 과정에 적용하는 것입니다.위에서 언급했듯이 P(X=xk|Y=yi)의 해는 P(X1=x1j1|Y=yi), P(X2=x2j2|Y=yi)의 해로 변환될 수 있습니다. P(Xn =xnjn|Y=yi), 그러면 최대 우도 추정 방법을 사용하여 이러한 값을 찾는 방법은 무엇입니까?
우선 최대 우도 추정이 무엇인지 이해해야 합니다. 실제로 확률 이론 교과서에서 최대 우도 추정에 대한 설명은 모두 비지도 학습 문제를 해결하는 것에 관한 것입니다. 순진한 특성 하에서 지도 학습 문제를 해결하기 위한 우도 추정은 실제로 다양한 조건 범주에서 비지도 학습 문제를 해결하기 위해 최대 우도 추정을 사용하는 것입니다.
위 내용은 Mahout 비디오 튜토리얼에 대한 권장 리소스의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!