방향 통계
Directional statistics방향 통계학(원형 통계학 또는 구면 통계학)은 방향(유클리드 공간의 단위 벡터, Rn), 축(R의n 원점을 통과하는 선) 또는 R의n 회전을 다루는 통계학의 하위 분야이다.보다 일반적으로 방향 통계는 스티펠 다양체를 포함한 콤팩트 리만 다양체에 대한 관측을 다룬다.
0도와 360도가 동일한 각도이므로, 예를 들어 180도가 2도와 358도의 합리적인 평균이 아니라는 사실은 일부 데이터 유형(이 경우 각도 데이터)의 분석에 특별한 통계 방법이 필요하다는 것을 보여줍니다.방향성이 있다고 간주될 수 있는 데이터의 다른 예로는 시간 주기(예: 하루의 시간, 주, 월, 연도 등), 나침반 방향, 분자의 이면각, 방향, 회전 등이 포함된다.
순환 분포
라인의 확률 밀도 함수(pdf) () \ 는 단위 [2]반지름 원의 둘레에 "감쌀 수 있습니다".즉, 랩된 변수의 pdf입니다.
이 개념은 단순 합계를 피쳐 공간의 모든 차원을 포함하는 의 F F 합계로 확장함으로써 다변량 컨텍스트로 확장할 수 있다.
다음 섹션에서는 관련된 순환 분포를 몇 가지 보여 줍니다.
폰 미제스 순환 분포
폰 미제스 분포는 다른 원형 분포와 마찬가지로 원을 둘러싼 특정 선형 확률 분포로 간주될 수 있는 원형 분포입니다.폰 미제 분포의 기본 선형 확률 분포는 수학적으로 다루기 어렵지만, 통계적 목적을 위해 기본 선형 분포를 다룰 필요는 없다.폰 미제 분포의 유용성은 두 가지입니다: 그것은 모든 원형 분포 중에서 가장 수학적으로 다루기 쉽고, 단순한 통계 분석을 가능하게 하며, 그리고 그것은 선형 정규 분포와 유사하게, 그것이 합계에 대한 제한적인 경우이기 때문에 중요합니다.작은 각도 편차를[citation needed] 많이 볼 수 있습니다.실제로 von Mises 분포는 사용이 편리하고 랩 정규 분포와 밀접한 관계가 있기 때문에 종종 "순환 정규" 분포로 알려져 있습니다(Fisher, 1993).
von Mises 분포의 PDF는 다음과 같습니다.
원형 균등 분포
원형 균일 분포의 확률 밀도 함수(pdf)는 다음과 같습니다.
또한 위의 von Mises의 0(\0)이라고 생각할 수도 있습니다.
포장 정규 분포
랩 정규 분포(WN)의 PDF는 다음과 같습니다.
포장된 코시 배포
포장된 Cauchy 배포(WC)의 PDF는 다음과 같습니다.
포장된 Levy 유통
포장된 Lévy 유통(WL)의 PDF는 다음과 같습니다.
고차원 다지관에 대한 분포
또한 2차원 구(Kent 분포[3] 등), N차원 구(von Mises-Fisher 분포[4]) 또는 토러스(torus 이변량 von Mises 분포[5])에도 분포가 존재한다.
행렬 폰 미제-피셔 분포는[6] 스티펠 다양체에 대한 분포이며, 회전 [7]행렬에 대한 확률 분포를 구성하는 데 사용할 수 있다.
빙엄 분포는 N차원의 축에 걸친 분포 또는 (N - 1)차원 구상의 점에 걸친 등가 분포이며,[8] 대척점이 식별됩니다.예를 들어, N = 2이면 축은 평면에서 원점을 통과하는 무방향 선입니다.이 경우 각 축은 평면 내의 단위원(1차원 구)을 서로의 대척점인 두 지점에서 절단합니다.N = 4의 경우, 빙엄 분포는 단위 사분위수(대역수) 공간에 걸친 분포입니다.베르소르는 회전 행렬에 해당하므로 N = 4에 대한 빙엄 분포를 행렬-본 미제-피셔 분포와 마찬가지로 회전 공간에 대한 확률 분포를 구성하는 데 사용할 수 있습니다.
이러한 분포는 예를 들어 [9]지질학,[1] 결정학[10] 및 생물정보학에서 사용된다.[11] [12]
순간
원형 분포의 원시 벡터(또는 삼각) 모멘트는 다음과 같이 정의됩니다.
여기서 { 는 2 { 2의 간격, P는 원형 분포의 PDF 형식, { z^{ P 이후입니다즉, 순환 분포의 모멘트는 항상 유한하고 잘 정의된다.
샘플 모멘트는 다음과 같이 유사하게 정의됩니다.
모집단 결과 벡터, 길이 및 평균 각도는 해당 샘플 매개변수와 유사하게 정의됩니다.
또한 높은 모멘트의 길이는 다음과 같이 정의됩니다.
높은 모멘트의 각도 부분은 22n (theta _{2}}\pi입니다.모든 모멘트의 길이는 0과 1 사이입니다.
위치 및 확산 측정
모집단과 해당 [13]모집단에서 추출한 표본 모두에 대해 중심 경향과 통계적 분산의 다양한 척도를 정의할 수 있다.
중심 경향
위치의 가장 일반적인 측도는 원형 평균입니다.모집단 원형 평균은 분포의 첫 번째 모멘트이고 표본 평균은 표본의 첫 번째 모멘트입니다.표본 평균은 모집단 평균의 치우침 없는 추정기 역할을 합니다.
데이터가 집중되면 중앙값과 모드는 선형 케이스와 유사하게 정의될 수 있지만, 분산 또는 다중 모달 데이터의 경우 이러한 개념은 유용하지 않습니다.
분산
순환 확산의 가장 일반적인 척도는 다음과 같습니다.
- 순환 분산입니다.표본의 원형 분산은 다음과 같이 정의됩니다.그리고 사람들을 위해둘 다 0과 1 사이의 값을 가집니다.
- 원형 표준 편차 값이 0 ~ 무한대입니다.분산의 제곱근 대신 이 표준 편차의 정의는 랩된 정규 분포의 경우 기본 정규 분포의 표준 편차를 추정하는 것이므로 유용합니다.따라서 선형 사례와 같이 표준 편차의 작은 값에 대해 원형 분포를 표준화할 수 있습니다.이는 랩 정규 분포에 근접한 von Mises 분포에도 적용됩니다. S) { S의 경우 S 2 () { S}= 이 .
- 원형 분산 값이 0 ~ 무한대입니다.이 산포의 측정치는 분산의 통계적 분석에 유용합니다.
평균 분포
n개의 z n n{ }= _이 주어진 경우 z의 평균값은 다음과 같이 정의됩니다.
라고 표현될 수 있다
어디에
또는 다음과 같이 합니다.
어디에
원형 pdf P())에 대한 평균 각도 분포( {\ display ( \ displaystyle \ \ theta )는 다음과 같이 구한다.
여기서({는 길이 2의 임의의 간격에 걸쳐 있으며, 적분은 S{\({ { C{\({ {가 일정하거나 R¯( R {displaystyle {C})과 {Displaystyle}) {\displaystyle {\pile이 (으이라는 제약에 따라 달라집니다은 일정합니다
대부분의 원형 분포에 대한 평균 분포의 계산은 분석적으로 가능하지 않으며 분산 분석을 수행하려면 숫자 또는 수학적 근사치가 필요합니다.[14]
중심 한계 정리는 표본 평균의 분포에 적용될 수 있다.(메인 기사:방향 통계의 중심 한계 정리).[ 、 { [ { \ } , { \ } 의 분포가 큰 표본 크기의 한계에서 이변량 정규 분포에 근접함을 알 수[14] 있다.
적합도 및 유의성 검정
순환 데이터의 경우 – (예: 균등하게 분포되어 있는가)
「 」를 참조해 주세요.
레퍼런스
- ^ a b Hamelryck, Thomas; Kent, John T.; Krogh, Anders (2006). "Hamelryck, T., Kent, J., Krogh, A. (2006) Sampling realistic protein conformations using local structural bias. PLoS Comput. Biol., 2(9): e131". PLOS Computational Biology. 2 (9): e131. Bibcode:2006PLSCB...2..131H. doi:10.1371/journal.pcbi.0020131. PMC 1570370. PMID 17002495.
- ^ Bahlmann, C., (2006), 온라인 필기 인식 방향 기능, 패턴 인식, 39
- ^ 켄트, J(1982) 피셔-빙엄 구 분포.J Royal Stat Soc, 44세, 71~80세
- ^ Fisher, RA(1953) 구체상의 분산.검사 로이, 사회, 런던 경A., 217, 295 – 305
- ^ Mardia, KM. Taylor; CC; Subramaniam, GK. (2007). "Protein Bioinformatics and Mixtures of Bivariate von Mises Distributions for Angular Data". Biometrics. 63 (2): 505–512. doi:10.1111/j.1541-0420.2006.00682.x. PMID 17688502. S2CID 14293602.
- ^ Pal, Subhadip; Sengupta, Subhajit; Mitra, Riten; Banerjee, Arunava (September 2020). "Conjugate Priors and Posterior Inference for the Matrix Langevin Distribution on the Stiefel Manifold". Bayesian Analysis. 15 (3): 871–908. doi:10.1214/19-BA1176. ISSN 1936-0975. S2CID 209974627.
- ^ Downs (1972). "Orientational statistics". Biometrika. 59 (3): 665–676. doi:10.1093/biomet/59.3.665.
- ^ Bingham, C. (1974). "An Antipodally Symmetric Distribution on the Sphere". Ann. Stat. 2 (6): 1201–1225. doi:10.1214/aos/1176342874.
- ^ Peel, D.; Whiten, WJ.; McLachlan, GJ. (2001). "Fitting mixtures of Kent distributions to aid in joint set identification" (PDF). J. Am. Stat. Assoc. 96 (453): 56–63. doi:10.1198/016214501750332974. S2CID 11667311.
- ^ Krieger Lassen, N. C.; Juul Jensen, D.; Conradsen, K. (1994). "On the statistical analysis of orientation data". Acta Crystallogr. A50 (6): 741–748. doi:10.1107/S010876739400437X.
- ^ 켄트, J.T., 하멜릭, T. (2005)단백질 구조에 대한 확률적 모델에서 피셔-빙햄 분포를 사용한다.S. Barber, P.D. Baxter, K.V.Mardia, & R.E. Walls(에드), 정량생물학, 형태분석, 웨이브렛, 57-60페이지.리즈, 리즈 대학 출판부
- ^ Boomsma, Wouter; Mardia, Kanti V.; Taylor, Charles C.; Ferkinghoff-Borg, Jesper; Krogh, Anders; Hamelryck, Thomas (2008). "A generative, probabilistic model of local protein structure". Proceedings of the National Academy of Sciences. 105 (26): 8932–8937. Bibcode:2008PNAS..105.8932B. doi:10.1073/pnas.0801715105. PMC 2440424. PMID 18579771.
- ^ 피셔, NI., Cambridge University Press, 1993년, 순환 데이터의 통계 분석.ISBN 0-521-35018-2
- ^ a b Jammalamadaka, S. Rao; Sengupta, A. (2001). Topics in circular statistics. New Jersey: World Scientific. ISBN 978-981-02-3778-3. Retrieved 2011-05-15.
방향 통계 서적
- Batschelet, E. 생물학의 순환 통계, Academic Press, London, 1981.ISBN 0-12-081050-6.
- 피셔, NI., Cambridge University Press, 1993년, 순환 데이터의 통계 분석.ISBN 0-521-35018-2
- 피셔, NI., 루이스, T., 엠블튼, BJJ. 구면 데이터의 통계 분석, 케임브리지 대학 출판부, 1993.ISBN 0-521-45699-1
- 잠말라마다카 S.Rao와 SenGupta A.순환통계 토픽, 세계과학, 2001.ISBN 981-02-3778-2
- Mardia, KV. 및 Jupp P., 방향통계(2판), John Wiley and Sons Ltd, 2000.ISBN 0-471-95333-4
- Ley, C. and Verdebout, T., Modern Directional Statistics, CRC Press Taylor & Francis Group, 2017.ISBN 978-1-4987-0664-3