지역 사회

배우다

도구 라이브러리

AI 도구

여가

한국어

집 > 데이터 베이스 > MySQL 튜토리얼 > 《数据挖掘概念与技术》学习笔记第6章(6/10)挖掘大型数据库中的

《数据挖掘概念与技术》学习笔记第6章(6/10)挖掘大型数据库中的

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

풀어 주다： 2016-06-07 15:12:08

원래의

1664명이 탐색했습니다.

项目集：项的集合，记为 I 。牛奶，面包，苹果， etc 事务：事务 T 是 I 中的一组项目的集合，每个事务都有个一个 TID 作为标识符号。项目集 X 的支持度 Sup(X)=Count(X)/|D| 关联规则 X-Y 的支持度 Sup(X-Y)=Count(X-Y)/|D| 关联规则 X-Y 的置信度 Conf

项目集：项的集合，记为I。牛奶，面包，苹果，etc

事务：事务T是I中的一组项目的集合，每个事务都有个一个TID作为标识符号。

项目集X的支持度

Sup(X)=Count(X)/|D|

关联规则X->Y的支持度

Sup(X->Y)=Count(X->Y)/|D|

关联规则X->Y的置信度

Conf(X->Y)=Count( X->Y)/Count(X)

步骤：

1 找出所有频繁项集

2 有频繁项集产生强关联规则

算法之Apriori算法

核心思想

频繁1-项集then关联规则then剪枝
then频繁2-项集then关联规则then剪枝
then频繁3-项集then关联规则then剪枝
……

重复此过程直到做不下去为止

算法实现 以后单独写出

改进措施 FP(Frequent Pattern Growth) 频繁模式增长

多层关联规则

基本思想：

自顶向下，在每个概念层找寻频繁项集。然后①在该层发掘关联规则②适当剪枝，向下进入更具体的一层。

可选方案：

1 使用一致的最小支持度

2使用递减的最小支持度

3 逐层独立

4 层交叉单项过滤

5 曾交叉k-项集过滤

多维关联规则

涉及两个或者多个维的关联规则

e.g． age(X, “IBM desktop computer”)^occupation(“drive”r)=>buys(X, ”laptop”)

多维关联规则注意

强关联规则不一定是有趣的。比如，

buys(X, “computer games”)=>buys(X, “videos”) [Support=40%, confidence= 66%]

推导出来的结果可能是满足支持度和置信度的，但是却不是有趣的。

因为可能实际上不购买computer games而去购买video的人有75%，而同时购买了computer games和videos的人只有66%，说明其实computer games和videos是负相关。

관련 라벨：

크기가 큰 공부하다 파기 데이터 베이스 메모

이전 기사：在Access数据库中实现admin888管理的另一种方式 다음 기사：mongodb 学习笔记之二 mongodb入门（数据库、文档和集合）

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

LLMS 작동 방식 : 사후 훈련, 신경망, 환각 및 추론에 대한 사전 훈련

2025-02-26 03:58:14
나는 블록 체인과 AI를 결합하여 예술을 생성했습니다. 다음은 다음에 일어난 일입니다.

2025-02-26 03:38:10
고급 프롬프트 엔지니어링 : 사고 체인 (COT)

2025-02-26 03:17:10
sqlite에서 증강 증강 생성

2025-02-26 02:49:09
자신의 node.js api를 구축하기 위해 LLM 구동 보일러 플레이트를 사용하는 방법

2025-02-26 01:08:13
2024 년 코딩을위한 LLMS : 가격, 성과 및 최고를위한 전투

2025-02-26 00:46:10
비전 언어 모델을 제기합니다

2025-02-25 23:42:08
큰 언어 모델의 응답의 신뢰성을 측정하는 방법

2025-02-25 22:50:13
삶의 환상

2025-02-25 21:54:11
과학자들은 인간의 사고를 반영하는 큰 언어 모델에 대해 진지하게 생각합니다.

2025-02-25 20:45:11

최신 이슈

url-rewrite - nginx 디렉토리 이후의 슬래시 문제

에서 1970-01-01 08:00:00

0

0

0

개발 환경 서버인 Nginx는 정적 파일 캐시를 지울 수 없습니다.

에서 1970-01-01 08:00:00

0

0

0

Nginx에서 502 문제를 빠르게 찾는 방법

에서 1970-01-01 08:00:00

0

0

0

이러한 요구 사항을 달성하기 위해 nginx를 사용하는 방법은 무엇입니까?

에서 1970-01-01 08:00:00

0

0

0

504 - nginx + fastcgi + Django 자주 504

에서 1970-01-01 08:00:00

0

0

0

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿