종속 네트워크(그래픽 모델)

Dependency network (graphical model)

종속성 네트워크(DN)마코프 네트워크와 유사한 그래픽 모델로서, 각 정점(노드)에서 각 정점(노드)은 랜덤 변수에 대응하고 각 에지는 변수들 사이의 종속성을 포착한다.베이시안 네트워크와 달리 DN은 사이클을 포함할 수 있다.각 노드는 부모에게 주어진 랜덤 변수의 실현을 결정하는 조건부 확률표와 연관된다.[1]

마르코프 담요

베이지안 네트워크에서, 한 노드의 마르코프 담요는 그 노드의 부모와 자식들의 집합이다.노드의 부모와 자식 값이 노드에 대한 정보를 제공하는 것이 분명하다.그러나 아이들의 부모도 마코프 담요에 포함되어야 하는데, 그 이유는 그들이 문제의 노드를 설명하는데 사용될 수 있기 때문이다.마르코프 무작위 필드에서 한 노드의 마르코프 담요는 단순히 인접 노드(또는 인접 노드)일 뿐이다.종속 네트워크에서, 한 노드를 위한 마르코프 담요는 단순히 그것의 부모들의 집합이다.

종속 네트워크 대 베이지안 네트워크

종속 네트워크는 베이지안 네트워크와 관련하여 장단점이 있다.특히, 데이터로부터 종속 네트워크의 구조와 가능성을 모두 학습하는 효율적인 알고리즘이 있기 때문에 데이터로부터 매개변수를 지정하기가 더 쉽다.최적의 구조를 결정하는 문제가 NP-hard인 베이시안 네트워크에는 그러한 알고리즘을 사용할 수 없다.[2]그럼에도 불구하고, 종속 네트워크는 전문가-지식에 의해 주도되는 지식 기반 접근방식을 사용하여 구축하기가 더 어려울 수 있다.

종속 네트워크 대 Markov 네트워크

일관된 종속 네트워크와 마르코프 네트워크는 동일한 대표적 힘을 가지고 있다.그럼에도 불구하고, 비일관적인 종속성 네트워크, 즉 호환 가능한 유효한 공동 확률 분포가 없는 종속성 네트워크를 구축할 수 있다.이와는 대조적으로 마르코프 네트워크는 항상 일관성이 있다.

정의

A consistent dependency network for a set of random variables with joint distribution is a pair where is a cyclic directed graph, where each of는 X 의 변수에 해당하며 {\ 조건부 확률 분포의 집합이다.The parents of node , denoted , correspond to those variables that satisfy the following i종속 관계

종속 네트워크는 각 배포를 공동 p( x) 에서 얻을 수 있다는 점에서 일관성이 있다 표본 크기가 큰 대형 데이터 세트를 사용하여 학습되는 종속 네트워크는 거의 항상 일관성이 있을 것이다.비정합성 네트워크는 쌍, P) 스타일과(와) 호환되는 공동 확률 분포가 없는 네트워크로 그 경우 쌍이 소분하는 독립 관계를 만족하는 공동 확률 분포는 없다.

구조 및 매개변수 학습

종속 네트워크에서 두 가지 중요한 작업은 데이터로부터 그것의 구조와 가능성을 배우는 것이다.본질적으로 학습 알고리즘은 도메인의 각 변수에 대해 확률론적 회귀나 분류를 독립적으로 수행하는 것으로 구성된다.종속성 네트워크에서 X 에 대한 로컬 분포가 조건부 p( - i -이며 이는 방법 등 어떤 분류 또는 회귀 기법으로도 추정할 수 있다는 관측에서 비롯된다.확률론적 의사결정 트리, 신경망 또는 확률론적 지지-확률론적 지지-확률기계의 구성.따라서 도메인 i 에 대해, 각 변수에 대한 구별되는 방법임에도 불구하고 분류 알고리즘을 사용하여 데이터로부터 로컬 분포를 독립적으로 추정한다여기서는 확률론적 의사결정 트리가 지역 분포를 추정하는 데 어떻게 사용되는지를 간략히 보여 준다. {\에 대해 가 대상 변수, - 입력 변수인 확률론적 의사결정 트리를 학습한다. 에 대한 의사결정 트리 구조를 학습하기 위해 검색 알고리즘은 자식이 없는 싱글톤 루트 노드로 시작한다.그런 다음 트리의 각 리프 노드를 X- 일부 변수 X 에 대한 바이너리 분할로 대체하여 트리 점수를 증가시키지 않는다

확률론적 추론

A probabilistic inference is the task in which we wish to answer probabilistic queries of the form , given a graphical model for , where (the 'target' variables) (the 'input' 변수)는 의 분리 하위 집합이다 확률론적 추론을 수행하는 대안 중 하나는 Gibbs 샘플링을 사용하는 것이다.이에 대한 순진한 접근방식은 Gibbs 를 사용하며, 중요한 어려움은 (y∣ z) z 또는 p ( ) 중 하나가작을 경우 정확한 확률 추정을 위해 많은 반복이 요구된다.( z) z) 수정된 순서 Gibbs sampler를 사용할, 샘플링 중에 Z= 을(으)로 추정하는 또 다른 접근법.

가) 드문 경우(예: 에도 변수가 많을 수 있다.그러므로, 총 확률의 법칙과 의존성 네트워크에 부호화된 독립성들은 추론 작업을 단일 변수에 대한 일련의 추론 작업으로 분해하는 데 사용될 수 있다.이 접근방식은 어떤 용어는 직접 조회하여 얻을 수 있다는 이점과 함께 제공되어 일부 Gibbs 샘플링을 피할 수 있다.

You can see below an algorithm that can be used for obtain for a particular instance of and , where and {Z}은(는) 분리 하위 집합이다.

  • 알고리즘 1:
  1. }(* 처리되지 않은 변수 *)
  2. 처리 및 조건화 변수 *)
  3. 대한 값 {\ \ {P *)
  4. 동안:
    1. (를) 선택하여 Xi {\ 의 다른 변수보다 더 많은 상위 항목이 없도록 하십시오.
    2. 의 모든 부모가 에 있는 경우
    3. 기타
      1. 된 순서 Gibbs sampler를 사용하여 p( ) 을(를) 결정하십시오.
  5. 조건 ) 의 제품을 반환함

적용들

확률론적 추론에 대한 애플리케이션 외에도, 다음 애플리케이션들은 선호도를 예측하는 작업인 협업 필터링(CF)의 범주에 있다.종속 네트워크는 CF 예측을 기반으로 하는 자연 모델 클래스인데, 일단 이 작업에 대한 알고리즘은 권장 사항을 생성하기 위해 = - - i= -의 추정만 하면 된다.특히, 이러한 추정치는 의존성 네트워크에서 직접 조회를 통해 얻을 수 있다.

  • 본 영화 평점을 기준으로 사람이 어떤 영화를 좋아할 것인지 예측
  • 사이트의 내력을 바탕으로 개인이 어떤 웹 페이지에 접속할 것인지 예측
  • 사람이 읽은 다른 이야기를 바탕으로 어떤 뉴스에 관심이 있는지 예측
  • 이미 구매했거나 쇼핑 바구니에 빠뜨린 제품을 기준으로 어떤 제품을 구입할 것인지 예측.

종속 네트워크에 대한 또 다른 유용한 응용 프로그램의 클래스는 데이터 시각화, 즉 예측 관계의 시각화와 관련이 있다.

참고 항목

참조

  1. ^ HECKERMAN, David; MAXWELL C., David; MEEK, Christopher; ROUNTHWAITE, Robert; KADIE, Carl (October 2000). "Dependency Networks for Inference, Collaborative Filtering, and Data Visualization" (PDF). Journal of Machine Learning Research.
  2. ^ HECKERMAN, David (2012). "Large-Sample Learning of Bayesian Networks is NP-Hard" (PDF). arXiv:1212.2468. {{cite journal}}:Cite 저널은 필요로 한다. journal=(도움말)