파이썬의 기계 학습 소개-파이썬 튜토리얼-php.cn

머신 러닝은 컴퓨터에게 명시 적으로 프로그래밍하지 않고 배울 수있는 능력을 제공하는 행위입니다. 이는 컴퓨터에 데이터를 제공하고 데이터를 의사 결정 모델로 변환 한 다음 향후 예측에 사용되도록함으로써 수행됩니다.

이 튜토리얼에서는 기계 학습과 기계 학습을 시작하는 데 필요한 기본 개념에 대해 이야기 할 것입니다. 우리는 또한 특정 요소 또는 이벤트를 예측하기 위해 몇 가지 파이썬 예제를 고안 할 것입니다.

머신 러닝 소개

머신 러닝은 경험에서 배우는 것을 목표로하는 기술 유형입니다. 예를 들어, 인간으로서 다른 사람들이 체스를하는 것을 관찰하여 체스를하는 방법을 배울 수 있습니다. 마찬가지로, 컴퓨터는 배우는 데이터를 제공하고 미래의 요소 또는 조건을 예측할 수있게함으로써 프로그래밍됩니다. 예를 들어, 특정 유형의 과일이 오렌지인지 레몬인지 여부를 알 수있는 프로그램을 작성하려고합니다. 그러한 프로그램을 작성하기가 쉽고 필요한 결과를 제공하지만 프로그램이 대규모 데이터 세트에 효과적으로 작동하지 않는다는 것을 알 수 있습니다. 이것은 기계 학습이 진행되는 곳입니다.

머신 러닝과 관련된 다양한 단계가 있습니다.

데이터 수집

데이터 필터링

알고리즘 훈련 . 예측 머신 러닝은 패턴을 찾기 위해 다른 종류의 알고리즘을 사용하며, 이러한 알고리즘은 두 그룹으로 분류됩니다. 감독 는 감독되지 않은 학습

수퍼베이션 학습

예를 들어, 과거 정보를 기반으로 스팸 메시지를 걸러 내기 위해 컴퓨터를 훈련시킬 수 있습니다.

감독 된 학습은 많은 응용 프로그램에서 사용되었습니다 (예 : Facebook, 특정 설명을 기반으로 이미지를 검색합니다. 이제 사진의 내용을 설명하는 단어로 Facebook에서 이미지를 검색 할 수 있습니다. 소셜 네트워킹 사이트에는 이미 캡션 된 이미지 데이터베이스가 있으므로 어느 정도의 정확도로 사진의 기능과의 설명을 검색하고 일치시킬 수 있습니다.

감독 학습과 관련된 두 단계 만 있습니다. 의사 결정 트리

지원 벡터 머신
k-nearest 이웃
선형 회귀
sklear 스키 린 (Sklen)은 Python Progrante를위한 기계 학습 라이브러리를위한 기계 학습 라이브러리입니다. 클러스터링 알고리즘. 우리는 Sklearn Library와 Python Language를 사용하여 감독 학습이 어떻게 작동하는지 보여주는 간단한 프로그램을 작성할 것입니다. Sklearn은 Numpy 및 Scipy 라이브러리와 잘 어울립니다.
Sklearn 설치

Python (& gt; = 3.6),

numpy (최소 버전 1.17.3) scipy (Min 버전 1.3.2)

이미이 의존성을 가지고 있다면 Sklen을 설치할 수 있습니다. Anaconda를 설치하기 만하면됩니다. 이것은 모든 종속성을 처리하기 때문에 하나씩 설치하는 것에 대해 걱정할 필요가 없습니다.

Sklearn이 제대로 실행되는지 테스트하려면 다음과 같이 Python 통역사에서 가져 오기 위해 간단히 가져 오기 위해 다음과 같이 간단히 가져옵니다.

오류가 발생하지 않으면 이제 우리가 설치를 마치게됩니다. 우리는 다른 동물을 구별 할 수 있기를 원합니다. 따라서 우리는 주어진 동물이 말인지 닭인지 구체적으로 알 수있는 알고리즘을 설계 할 것입니다.

각 분류기가 제공하는 출력을 정의하십시오. 닭은 0으로 표현되며 말은 1로 표시됩니다.

Algorithm에 대한 완전한 코드가 표시됩니다. 데이터. 높이가 7 인치, 체중이 0.6kg, 온도 41의 동물을 예측하는 방법은 다음과 같습니다. 이 데이터에 대한 지식은 새로운 동물을 테스트하는 데 사용됩니다.

pip install -U scikit-learn<br>

로그인 후 복사

두 번째 예에서는 훨씬 더 큰 데이터 세트를 사용하여 선형 회귀를 수행합니다. Wikipedia에 따르면 통계에서

> 선형 회귀

는 스칼라 응답과 하나 이상의 설명 변수 (종속 및 독립 변수라고도 함) 사이의 관계를 모델링하기위한 선형 접근법입니다. 데이터 세트는 여기에서 찾을 수 있습니다. CSV 파일을 작업 디렉토리로 다운로드하는 데 필요한 종속성을 가져 오면서 시작하겠습니다.

다음으로 CSV 데이터를 Pandas Dataframe에로드합니다.

는 데이터의 모양을 볼 수 있으려면 () 출력 :

pip install -U scikit-learn<br>

로그인 후 복사

위에서 볼 수 있듯이, 데이터에는 1960 년부터 2016 년까지의 다른 국가의 GDP가 포함되어 있습니다. 다음 단계는 X와 y 차원 배열을 생성하는 것입니다. 다음 단계는 X (연도)를 사용하여 X (연도)를 사용하여 X (연도)를 사용하여 예측을 작성하는 것입니다. Model.

여기에 줄거리가 있습니다 :

 Python 3.9.12 (main, Apr  5 2022, 06:56:58) <br>[GCC 7.5.0] :: Anaconda, Inc. on linux<br>Type "help", "copyright", "credits" or "license" for more information.<br>>>> import sklearn<br>>>> <br>

로그인 후 복사

감독되지 않은 학습

감독되지 않은 학습은 일련의 입력만으로 기계를 훈련시킬 때입니다. 그런 다음 기계는 입력 데이터와 예측하려는 다른 사람 간의 관계를 찾을 수 있습니다. 감독 된 학습과 달리, 훈련 할 수있는 일부 데이터가있는 기계를 제시하는 것과는 달리, 감독되지 않은 학습은 컴퓨터가 다른 데이터 세트간에 패턴이나 관계를 찾도록하기위한 것입니다.

from sklearn import tree<br>

로그인 후 복사

features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]

. 본질적으로 데이터를 그룹화합니다. 예를 들어, 소비자의 쇼핑 습관을 분류하고 구매 및 쇼핑 습관을 기반으로 소비자를 대상으로하여 광고 데이터를 사용할 수 있습니다.

#labels = [chicken, chicken, horse, horse]<br><br># we use 0 to represent a chicken and 1 to represent a horse<br><br>labels = [0, 0, 1, 1]<br>

로그인 후 복사

협회

협회는 큰 데이터 세트를 설명하는 규칙을 식별하는 곳입니다. 이러한 유형의 학습은 동기 부여, 허구 또는 교육 책에 관계없이 저자 또는 카테고리를 기반으로하는 책을 연결하는 데 적용 할 수 있습니다.

classifier = tree.DecisionTreeClassifier()<br>

로그인 후 복사

인기있는 비 감장되지 않은 학습 알고리즘 중 일부는 다음을 포함합니다. 튜토리얼은 기계 학습을 시작하는 데 도움이되었습니다. 이것은 단지 소개 일뿐입니다. 마치 학습은 다루어야 할 것이 많으며, 이는 기계 학습이 할 수있는 일의 일부일뿐입니다. Sklearn은 기계 학습에 사용되는 라이브러리 중 하나 일뿐입니다. 다른 라이브러리로는 Tensorflow 및 Keras가 있습니다. 또한

또한, 우리가 판매 할 수있는 것을 주저하지 말고 Envato 시장에 대한 연구를 주저하지 마십시오.

감독되지 않은 기계 학습 알고리즘을 사용하기로 한 결정은 데이터의 구조와 크기와 같은 다양한 요인에 따라 달라집니다. 사기 예방에서, 소셜 미디어 사이트에서 개인화는 사용자의 선호도, 이메일 및 맬웨어 필터링, 날씨 예측, 심지어 전자 상거래 부문에서도 소비자 쇼핑 습관을 예측하기 위해 소셜 미디어 사이트를 제공합니다.

위 내용은 파이썬의 기계 학습 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!