연관 규칙 선험적 알고리즘에 대한 자세한 설명
연관 규칙은 데이터 마이닝에서 중요한 기술로, 데이터 세트의 항목 간 연관성을 발견하는 데 사용됩니다. 알고리즘 단계: 1. 알고리즘은 모든 단일 항목을 포함하는 후보 항목 세트를 초기화해야 합니다. 2. 알고리즘은 빈번한 항목 세트를 기반으로 후보 항목 세트를 생성합니다. 3. 알고리즘은 후보 항목 세트를 정리합니다. 5. 반복이 끝나면 알고리즘은 설정된 임계값을 충족하는 모든 빈발 항목 세트를 얻습니다. 그런 다음 빈발 항목 집합을 기반으로 연관 규칙이 생성됩니다.
연관 규칙은 데이터 마이닝에서 중요한 기술로, 데이터 세트의 항목 간 연관성을 발견하는 데 사용됩니다. 연관 규칙 선험적 알고리즘은 마이닝 연관 규칙에 일반적으로 사용되는 알고리즘입니다. 연관 규칙 선험적 알고리즘의 원리와 단계는 아래에서 자세히 소개하겠습니다.
알고리즘 원리
연관 규칙 선험적 알고리즘은 지지와 신뢰라는 두 가지 핵심 개념을 기반으로 합니다. 지지도는 데이터에 나타나는 항목 집합의 빈도를 나타내고, 신뢰도는 규칙의 신뢰성을 나타냅니다. 알고리즘의 핵심 아이디어는 반복을 통해 빈발 항목 집합에서 후보 항목 집합을 생성하고 지지도와 신뢰도를 계산하고 최종적으로 설정된 임계값을 충족하는 연관 규칙을 찾는 것입니다.
알고리즘 단계
연관 규칙 apriori 알고리즘의 단계는 다음과 같습니다.
초기화
먼저, 알고리즘은 모든 단일 항목을 포함하는 후보 항목 집합을 초기화해야 합니다. 이러한 항목 집합을 1-항목 집합이라고 합니다. 그런 다음 알고리즘은 데이터 세트를 스캔하고 각 1개 항목 세트의 지지도를 계산합니다.
후보 항목 세트 생성
반복을 통해 알고리즘은 빈번한 항목 세트를 기반으로 후보 항목 세트를 생성합니다. 빈발항목집합은 지지도가 설정된 임계값 이상인 항목집합을 말합니다. 현재 iteration의 빈발항목 집합을 k항목 집합이라고 가정하고, k항목 집합을 합치고 중복항목을 제거하면 k+1항목 집합을 생성할 수 있다. 그런 다음 알고리즘은 데이터 세트를 스캔하고 각 k+1 항목 세트의 지지도를 계산합니다.
Pruning
후보 항목 집합을 생성한 후 알고리즘은 후보 항목 집합을 제거합니다. 후보 항목 집합의 하위 집합이 빈발 항목 집합이 아닌 경우 후보 항목 집합은 빈발 항목 집합이 될 수 없습니다. 따라서 알고리즘은 요구 사항을 충족하지 않는 이러한 후보 항목 세트를 삭제합니다.
빈번 항목 집합 업데이트
알고리즘은 가지치기 작업을 통해 요구 사항을 충족하는 후보 항목 집합을 얻습니다. 그런 다음 알고리즘은 이러한 후보 항목 집합을 새로운 빈발 항목 집합으로 사용하고 다음 반복 라운드에 들어갑니다.
연관 규칙 생성
반복이 끝나면 알고리즘은 설정된 임계값을 충족하는 모든 빈발 항목 집합을 가져옵니다. 그런 다음 알고리즘은 빈발 항목 집합을 기반으로 연관 규칙을 생성합니다. 연관 규칙은 신뢰도를 계산하여 생성됩니다. 빈발 항목 집합의 경우 여러 연관 규칙이 생성될 수 있습니다. 연관 규칙은 A->B 형식이며, 여기서 A와 B는 각각 빈발 항목 집합의 하위 집합입니다.
알고리즘 최적화
연관 규칙 선험적 알고리즘은 대규모 데이터 세트를 처리할 때 높은 계산 복잡성 문제에 직면할 수 있습니다. 계산 복잡도를 줄이기 위해 다음과 같은 최적화 조치를 채택할 수 있습니다.
데이터 세트 압축
데이터 세트를 압축하여 데이터 세트에서 자주 사용되지 않는 항목 세트를 삭제하여 계산량을 줄일 수 있습니다.
해시 테이블 사용
해시 테이블을 사용하면 자주 사용하는 항목 세트를 저장하여 검색 효율성을 높일 수 있습니다.
트랜잭션 데이터베이스
는 데이터 세트를 트랜잭션 데이터베이스 형식으로 변환할 수 있으며, 각 트랜잭션은 항목 세트를 나타냅니다. 이를 통해 데이터 세트를 스캔하는 횟수를 줄이고 알고리즘의 효율성을 향상시킬 수 있습니다.
요약하자면 연관 규칙 선험적 알고리즘은 마이닝 연관 규칙에 일반적으로 사용되는 알고리즘입니다. 반복적 접근을 통해 빈발항목 집합으로부터 후보항목 집합을 생성하고 지지도와 신뢰도를 계산하여 최종적으로 설정된 임계값을 만족하는 연관규칙을 찾는다. 계산 복잡성을 줄이기 위해 해시 테이블 및 트랜잭션 데이터베이스를 사용하여 데이터 세트 압축과 같은 최적화 조치를 사용할 수 있습니다.
위 내용은 연관 규칙 선험적 알고리즘에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Linux 터미널에서 Python 버전을 보려고 할 때 Linux 터미널에서 Python 버전을 볼 때 권한 문제에 대한 솔루션 ... Python을 입력하십시오 ...

Python의 Pandas 라이브러리를 사용할 때는 구조가 다른 두 데이터 프레임 사이에서 전체 열을 복사하는 방법이 일반적인 문제입니다. 두 개의 dats가 있다고 가정 해

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

Uvicorn은 HTTP 요청을 어떻게 지속적으로 듣습니까? Uvicorn은 ASGI를 기반으로 한 가벼운 웹 서버입니다. 핵심 기능 중 하나는 HTTP 요청을 듣고 진행하는 것입니다 ...

파이썬에서 문자열을 통해 객체를 동적으로 생성하고 메소드를 호출하는 방법은 무엇입니까? 특히 구성 또는 실행 해야하는 경우 일반적인 프로그래밍 요구 사항입니다.

이 기사는 Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask 및 요청과 같은 인기있는 Python 라이브러리에 대해 설명하고 과학 컴퓨팅, 데이터 분석, 시각화, 기계 학습, 웹 개발 및 H에서의 사용에 대해 자세히 설명합니다.

Linux 터미널에서 Python 사용 ...
