피트먼-요르프로세스

Pitman–

확률론에서 핏맨은-PY(d, θ, G)로 표시되는 Yor 공정은 표본 경로가 확률 분포인 확률적 공정입니다. 이 과정에서 추출된 임의0 표본은 G에서 추출된 원자의 무한 집합으로 구성된 무한 이산 확률 분포이며, 2-모수 포아송-디리클렛 분포에서 추출된 가중치가 있습니다. 이 과정의 이름은 짐 피트먼과 마크 요르의 이름을 따서 지어졌습니다.

피트먼을 지배하는 매개변수들은Yor 공정은 0 ≤ d < 1 할인 파라미터, 강도 파라미터 θ > - d 및 확률 공간 X에 대한 기저 분포 G입니다. d = 0일 때는 디리클레 과정이 됩니다. 할인 파라미터는 피트먼에게--Yor는 지수 꼬리가 있는 Dirichlet 공정보다 꼬리 동작에 대한 유연성을 더 많이 처리합니다. 피트만을 만드는군요Yor 프로세스는 멱함수 꼬리(예: 자연어의 단어 빈도)를 사용하여 데이터를 모델링하는 데 유용합니다.

피트먼에 의해 유도된 교환 가능한 랜덤 분할은-Yor process는 포아송-킹만 분할깁스형 랜덤 분할의 예입니다.

명명 규칙

"피트맨"이라는 이름은"요르 과정"은 피트먼과 요르가 이 주제에 대해 검토한 후 Ishwaran과 James에[5] 의해 만들어졌습니다.[2] 그러나 이 과정은 원래 Perman et al. 에서 연구되었습니다.[6][7]

또한 임의 측정에서 원자 크기의 합동 분포를 설명하는 포아송-디리클레 분포의 2-모수 일반화 후 엄격하게 감소하는 순서로 정렬되는 2-모수 포아송-디리클레 프로세스라고도 합니다.

참고 항목

참고문헌

  1. ^ Ishwaran, H; James, L F (2003). "Generalized weighted Chinese restaurant processes for species sampling mixture models". Statistica Sinica. 13: 1211–1235.
  2. ^ a b Pitman, Jim; Yor, Marc (1997). "The two-parameter Poisson–Dirichlet distribution derived from a stable subordinator". Annals of Probability. 25 (2): 855–900. CiteSeerX 10.1.1.69.1273. doi:10.1214/aop/1024404422. MR 1434129. Zbl 0880.60076.
  3. ^ Pitman, Jim (2006). Combinatorial Stochastic Processes. Vol. 1875. Berlin: Springer-Verlag. ISBN 9783540309901.
  4. ^ Teh, Yee Whye (2006). "A hierarchical Bayesian language model based on Pitman–Yor processes". Proceedings of the 21st International Conference on Computational Linguistics and the 44th Annual Meeting of the Association for Computational Linguistics.
  5. ^ Ishwaran, H.; James, L. (2001). "Gibbs Sampling Methods for Stick-Breaking Priors". Journal of the American Statistical Association. 96 (453): 161–173. CiteSeerX 10.1.1.36.2559. doi:10.1198/016214501750332758.
  6. ^ Perman, M.; Pitman, J.; Yor, M. (1992). "Size-biased sampling of Poisson point processes and excursions". Probability Theory and Related Fields. 92: 21–39. doi:10.1007/BF01205234.
  7. ^ Perman, M. (1990). Random Discrete Distributions Derived from Subordinators (Thesis). Department of Statistics, University of California at Berkeley.