빈번한 패턴 검출
Frequent pattern discovery빈번한 패턴 검출(또는 FP 디스커버리, FP 마이닝 또는 빈번한 아이템셋 마이닝)은 데이터베이스에서의 지식 검출, 매시브 온라인 분석 및 데이터 마이닝의 일부이며 대규모 [1][2]데이터셋에서 가장 빈번하고 관련성이 높은 패턴을 찾는 작업에 대해 설명합니다.이 개념은 트랜잭션 데이터베이스를 [3]채굴하기 위해 처음 도입되었습니다.빈번한 패턴은 서브셋(항목 세트, 서브시스템 또는 서브구조)으로 정의됩니다.이 서브셋은 사용자 지정 또는 자동 설정된 [2][4]임계값 이상의 빈도로 데이터 세트에 표시됩니다.
기술
FP 마이닝에는 다음과 같은 기술이 있습니다.
대부분의 경우 FP 디스커버리는 특정 알고리즘 Eclat, FP 성장 및 Apriori 알고리즘과의 관련 규칙 학습을 사용하여 수행할 수 있습니다.
기타 전략은 다음과 같습니다.
및 각각의 특정 기술.
다양한 머신 [5]러닝 시스템 또는 Apache Spark용 MLlib과 같은 모듈에 구현되어 있습니다.
레퍼런스
- ^ a b Jiawei Han; Hong Cheng; Dong Xin; Xifeng Yan (2007). "Frequent pattern mining: current status and future directions" (PDF). Data Mining and Knowledge Discovery. 15: 55–86. doi:10.1007/s10618-006-0059-1. S2CID 8085527. Retrieved 2019-01-31.
- ^ a b "Frequent Pattern Mining". SIGKDD. 1980-01-01. Retrieved 2019-01-31.
- ^ a b Agrawal, Rakesh; Imieliński, Tomasz; Swami, Arun (1993-06-01). "Mining association rules between sets of items in large databases". ACM SIGMOD Record. 22 (2): 207–216. CiteSeerX 10.1.1.217.4132. doi:10.1145/170036.170072. ISSN 0163-5808.
- ^ "Frequent pattern Mining, Closed frequent itemset, max frequent itemset in data mining". T4Tutorials. 2018-12-09. Retrieved 2019-01-31.
- ^ "Frequent Pattern Mining". Spark 2.4.0 Documentation. Retrieved 2019-01-31.