제한된 클러스터링
Constrained clustering컴퓨터 과학에서 제약이 있는 클러스터링은 준감독 학습 알고리즘의 한 종류다.일반적으로 제한된 클러스터링은 데이터 클러스터링 알고리즘을 사용하여 반드시 연결해야 하는 제약조건 집합, 링크할 수 없는 제약조건 또는 둘 모두를 통합한다.반드시 연결해야 하는 제약조건과 연결할 수 없는 제약조건 모두 두 데이터 인스턴스 사이의 관계를 정의한다.필수 링크 제약조건은 필수 링크 관계의 두 인스턴스가 동일한 클러스터와 연결되어야 함을 지정하는 데 사용된다.링크할 수 없는 관계에서 두 인스턴스가 동일한 클러스터와 연결되지 않아야 함을 지정하기 위해 링크할 수 없는 제약조건이 사용된다.이러한 제약조건 집합은 제약조건이 있는 클러스터링 알고리즘이 지정된 필수 링크 및 링크할 수 없는 제약조건을 충족하는 데이터 집합에서 클러스터를 찾으려고 시도하는 지침 역할을 한다.특정 제약조건을 만족하는 클러스터링이 존재하지 않으면 일부 제약조건 클러스터링 알고리즘은 중단된다.제약조건을 충족하는 클러스터링을 찾는 것이 불가능할 경우 제약조건 위반의 양을 최소화하기 위해 노력하는 다른 기업도 있을 것이다.제약조건은 또한 몇 가지 가능한 해결책 중에서 클러스터링 모델의 선택을 안내하는 데 사용될 수 있다.[1]
구성원이 모든 필수 링크를 준수하고 연결할 수 없는 제약 조건을 충족하는 클러스터를 청클릿이라고 한다.
예
제한된 클러스터링 알고리즘의 예는 다음과 같다.
- COP K-평균
- PCKmeans(공중 구속 K-평균)
- CMWK-평균(Constressed Minkowski Weighted K-Means)
참조
- ^ Pourrajabi, M.; Moulavi, D.; Campello, R. J. G. B.; Zimek, A.; Sander, J.; Goebel, R. (2014). "Model Selection for Semi-Supervised Clustering". Proceedings of the 17th International Conference on Extending Database Technology (EDBT). pp. 331–342. doi:10.5441/002/edbt.2014.31.
- ^ Wagstaff, K.; Cardie, C.; Rogers, S.; Schrödl, S. (2001). "Constrained K-means Clustering with Background Knowledge". Proceedings of the Eighteenth International Conference on Machine Learning. pp. 577–584.
- ^ http://www.cs.utexas.edu/~ml/limit/ssm-sdm-04.pdf[bare URL PDF]
- ^ de Amorim, R. C. (2012). "Constrained Clustering with Minkowski Weighted K-Means". Proceedings of the 13th IEEE International Symposium on Computational Intelligence and Informatics. pp. 13–17. doi:10.1109/CINTI.2012.6496753.