연관 규칙 선험적 알고리즘에 대한 자세한 설명_연관 규칙 선험적 알고리즘이란 무엇입니까?-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

연관 규칙 선험적 알고리즘에 대한 자세한 설명

DDD

Aug 10, 2023 am 10:38 AM

연관 규칙 선험적 알고리즘

연관 규칙은 데이터 마이닝에서 중요한 기술로, 데이터 세트의 항목 간 연관성을 발견하는 데 사용됩니다. 알고리즘 단계: 1. 알고리즘은 모든 단일 항목을 포함하는 후보 항목 세트를 초기화해야 합니다. 2. 알고리즘은 빈번한 항목 세트를 기반으로 후보 항목 세트를 생성합니다. 3. 알고리즘은 후보 항목 세트를 정리합니다. 5. 반복이 끝나면 알고리즘은 설정된 임계값을 충족하는 모든 빈발 항목 세트를 얻습니다. 그런 다음 빈발 항목 집합을 기반으로 연관 규칙이 생성됩니다.

연관 규칙 선험적 알고리즘에 대한 자세한 설명

연관 규칙은 데이터 마이닝에서 중요한 기술로, 데이터 세트의 항목 간 연관성을 발견하는 데 사용됩니다. 연관 규칙 선험적 알고리즘은 마이닝 연관 규칙에 일반적으로 사용되는 알고리즘입니다. 연관 규칙 선험적 알고리즘의 원리와 단계는 아래에서 자세히 소개하겠습니다.

알고리즘 원리

연관 규칙 선험적 알고리즘은 지지와 신뢰라는 두 가지 핵심 개념을 기반으로 합니다. 지지도는 데이터에 나타나는 항목 집합의 빈도를 나타내고, 신뢰도는 규칙의 신뢰성을 나타냅니다. 알고리즘의 핵심 아이디어는 반복을 통해 빈발 항목 집합에서 후보 항목 집합을 생성하고 지지도와 신뢰도를 계산하고 최종적으로 설정된 임계값을 충족하는 연관 규칙을 찾는 것입니다.

알고리즘 단계

연관 규칙 apriori 알고리즘의 단계는 다음과 같습니다.

초기화

먼저, 알고리즘은 모든 단일 항목을 포함하는 후보 항목 집합을 초기화해야 합니다. 이러한 항목 집합을 1-항목 집합이라고 합니다. 그런 다음 알고리즘은 데이터 세트를 스캔하고 각 1개 항목 세트의 지지도를 계산합니다.

후보 항목 세트 생성

반복을 통해 알고리즘은 빈번한 항목 세트를 기반으로 후보 항목 세트를 생성합니다. 빈발항목집합은 지지도가 설정된 임계값 이상인 항목집합을 말합니다. 현재 iteration의 빈발항목 집합을 k항목 집합이라고 가정하고, k항목 집합을 합치고 중복항목을 제거하면 k+1항목 집합을 생성할 수 있다. 그런 다음 알고리즘은 데이터 세트를 스캔하고 각 k+1 항목 세트의 지지도를 계산합니다.

Pruning

후보 항목 집합을 생성한 후 알고리즘은 후보 항목 집합을 제거합니다. 후보 항목 집합의 하위 집합이 빈발 항목 집합이 아닌 경우 후보 항목 집합은 빈발 항목 집합이 될 수 없습니다. 따라서 알고리즘은 요구 사항을 충족하지 않는 이러한 후보 항목 세트를 삭제합니다.

빈번 항목 집합 업데이트

알고리즘은 가지치기 작업을 통해 요구 사항을 충족하는 후보 항목 집합을 얻습니다. 그런 다음 알고리즘은 이러한 후보 항목 집합을 새로운 빈발 항목 집합으로 사용하고 다음 반복 라운드에 들어갑니다.

연관 규칙 생성

반복이 끝나면 알고리즘은 설정된 임계값을 충족하는 모든 빈발 항목 집합을 가져옵니다. 그런 다음 알고리즘은 빈발 항목 집합을 기반으로 연관 규칙을 생성합니다. 연관 규칙은 신뢰도를 계산하여 생성됩니다. 빈발 항목 집합의 경우 여러 연관 규칙이 생성될 수 있습니다. 연관 규칙은 A->B 형식이며, 여기서 A와 B는 각각 빈발 항목 집합의 하위 집합입니다.

알고리즘 최적화

연관 규칙 선험적 알고리즘은 대규모 데이터 세트를 처리할 때 높은 계산 복잡성 문제에 직면할 수 있습니다. 계산 복잡도를 줄이기 위해 다음과 같은 최적화 조치를 채택할 수 있습니다.

데이터 세트 압축

데이터 세트를 압축하여 데이터 세트에서 자주 사용되지 않는 항목 세트를 삭제하여 계산량을 줄일 수 있습니다.

해시 테이블 사용

해시 테이블을 사용하면 자주 사용하는 항목 세트를 저장하여 검색 효율성을 높일 수 있습니다.

트랜잭션 데이터베이스

는 데이터 세트를 트랜잭션 데이터베이스 형식으로 변환할 수 있으며, 각 트랜잭션은 항목 세트를 나타냅니다. 이를 통해 데이터 세트를 스캔하는 횟수를 줄이고 알고리즘의 효율성을 향상시킬 수 있습니다.

요약하자면 연관 규칙 선험적 알고리즘은 마이닝 연관 규칙에 일반적으로 사용되는 알고리즘입니다. 반복적 접근을 통해 빈발항목 집합으로부터 후보항목 집합을 생성하고 지지도와 신뢰도를 계산하여 최종적으로 설정된 임계값을 만족하는 연관규칙을 찾는다. 계산 복잡성을 줄이기 위해 해시 테이블 및 트랜잭션 데이터베이스를 사용하여 데이터 세트 압축과 같은 최적화 조치를 사용할 수 있습니다.

위 내용은 연관 규칙 선험적 알고리즘에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7486

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

Linux 터미널에서 Python 버전을 볼 때 발생하는 권한 문제를 해결하는 방법은 무엇입니까? Apr 01, 2025 pm 05:09 PM

Linux 터미널에서 Python 버전을 보려고 할 때 Linux 터미널에서 Python 버전을 볼 때 권한 문제에 대한 솔루션 ... Python을 입력하십시오 ...

한 데이터 프레임의 전체 열을 Python의 다른 구조를 가진 다른 데이터 프레임에 효율적으로 복사하는 방법은 무엇입니까? Apr 01, 2025 pm 11:15 PM

Python의 Pandas 라이브러리를 사용할 때는 구조가 다른 두 데이터 프레임 사이에서 전체 열을 복사하는 방법이 일반적인 문제입니다. 두 개의 dats가 있다고 가정 해

10 시간 이내에 프로젝트 및 문제 중심 방법에서 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법? Apr 02, 2025 am 07:18 AM

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

Uvicorn은 Serving_forever ()없이 HTTP 요청을 어떻게 지속적으로 듣습니까? Apr 01, 2025 pm 10:51 PM

Uvicorn은 HTTP 요청을 어떻게 지속적으로 듣습니까? Uvicorn은 ASGI를 기반으로 한 가벼운 웹 서버입니다. 핵심 기능 중 하나는 HTTP 요청을 듣고 진행하는 것입니다 ...

문자열을 통해 객체를 동적으로 생성하고 방법을 파이썬으로 호출하는 방법은 무엇입니까? Apr 01, 2025 pm 11:18 PM

파이썬에서 문자열을 통해 객체를 동적으로 생성하고 메소드를 호출하는 방법은 무엇입니까? 특히 구성 또는 실행 해야하는 경우 일반적인 프로그래밍 요구 사항입니다.

인기있는 파이썬 라이브러리와 그 용도는 무엇입니까? Mar 21, 2025 pm 06:46 PM

이 기사는 Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask 및 요청과 같은 인기있는 Python 라이브러리에 대해 설명하고 과학 컴퓨팅, 데이터 분석, 시각화, 기계 학습, 웹 개발 및 H에서의 사용에 대해 자세히 설명합니다.