비율분포

Ratio distribution

비율 분포(quotient distribution)는 알려진 두 개의 다른 분포를 가진 확률 변수비율의 분포로 구성되는 확률 분포입니다.두 개의 (보통 독립적인) 랜덤 변수 X와 Y가 주어졌을 때, 비율 Z = X/Y로 형성되는 랜덤 변수 Z의 분포는 비율 분포입니다.

를 들어, 코시 분포(정규 비율 [citation needed]분포라고도 함)는 평균이 0인 두 정규 분포 변수의 비율로 나타납니다.검정 통계학에서 자주 사용되는 다른 두 가지 분포도 비율 분포입니다. t-분포는 독립 카이 분포 랜덤 변수로 나눈 가우스 랜덤 변수에서 발생하는 반면, F-분포는 독립 카이 제곱 분포 랜덤 변수 두 개의 비율에서 발생합니다.보다 일반적인 비율 분포가 [1][2][3][4][5][6][7][8][9]문헌에서 고려되었습니다.

종종 비율 분포는 꼬리가 무겁기 때문에 이러한 분포를 사용하고 관련 통계 검정을 개발하는 것이 어려울 수 있습니다.중앙값을 기반으로 하는 방법이 "해결 방법"[10]으로 제안되었습니다.

확률변수대수

비율은 랜덤 변수에 대한 대수의 한 가지 유형입니다.비율분포와 관련된 것은 상품분포, 합분포, 차분분포 등입니다.일반적으로, 합, 차이, 곱 및 비율의 조합에 대해 이야기할 수 있습니다.이러한 분포의 대부분은 멜빈 D에 설명되어 있습니다. 1979년 스프링어의 책 무작위 [8]변수의 대수학

일반적인 숫자로 알려진 대수적 규칙은 무작위 변수의 대수에는 적용되지 않습니다.예를 들어, 어떤 제품이 C = AB이고 비율이 D = C/A이면 반드시 D와 B의 분포가 동일한 것은 아닙니다.실제로 코시 분포에 대한 독특한 효과가 나타납니다.두 개의 독립적인 코시 분포(같은 척도 모수와 위치 모수가 0으로 설정됨)의 곱과 비율은 동일한 [8]분포를 제공합니다.이는 코시 분포 자체를 0의 두 가우시안 분포의 비율 분포로 간주할 때 명확해집니다. 개의 가우시안 C 1 1}}과 2 displaystyle C_를 각각 두 개의 가우시안 분포 1 = 1 / G 2{\} =1}/2}, C = / 4 {\2} ={4를 고려한 다음

서 C = 4/ 3{\ C_} = / 첫 번째 항은 두 코시 분포의 비율이고, 마지막 항은 두 분포의 곱입니다.

파생

pdf (){\ p_{X, Yx, y {\displaystyle Y}(y)}인 다른 두 랜덤 변수 X, Y의 합동 분포로부터 Z = / {\=}의 비율 분포를 도출하는 방법은 다음 형태의 적분에 의한 방법

두 변수가 독립적이면 () = ( {\)= 가 됩니다.

이것은 간단하지 않을 수 있습니다.예를 들어, 두 표준 가우스 샘플의 비율에 대한 고전적인 문제를 살펴봅니다.공동 pdf는

Z = / Z = 을(를) 정의합니다.

알려진 정적분 ∫ exp ⁡ (- ) = c{\ _ \ (-={\를 사용하면 다음을 얻을 수 있습니다.

이 분포는 코시 분포 또는 n = 1인 학생의 t 분포입니다.

멜린 변환은 또한 비율 [8]분포의 유도를 위해 제안되었습니다.

양의 독립 변수의 경우 다음과 같이 진행합니다.이 다이어그램은 분리 가능한 이변량 f ( ) = f x ( ) ( {\) = 를 보여줍니다. 양의 x,y > {\ x에 지원되며 R = / {\ R =의 pdf를 구하고자 합니다. 선 y = / R}은 f y(, ) {\ ,y)}에 논리 X/R {\ R을 곱한 누적 분포를 나타냅니다. 밀도는 먼저 수평 스트립에 통합됩니다. 높이 y의 수평 스트립은 x 0에서 x Ry까지 확장되고 ( 의 증분 확률을 갖습니다. x ( ) {\ _
둘째, 수평 스트립을 전체적으로 위로 통합하면 선 위의 확률 볼륨을 얻을 수 있습니다.

마지막으로 R R {\(를) 하여 R ({\을(를) 얻습니다.

차분화를 적분 내부로 이동합니다.

그 이후로

그리고나서

예를 들어 다음과 같은 경우 ratio R의 pdf를 구합니다.

비율의 누적분포 평가

우리는 가지고 있다.

따라서

차별화 쓰기.R은 R의 pdf를 산출합니다.

랜덤 비율의 모멘트

멜린 변환 이론에서 양의 x ≥ {\ x 0에만 존재하는 분포의 경우, 는 제품 E[ ( p ]= Up ] [ V p ] [ ()^{p= {E} [UU {\ U(가) 독립적인 name { [E ⁡[ ( / ) ]{\[ ( 표본 비율의 경우 이 항등식을 사용하려면 역분포의 모멘트를 사용해야 합니다.E ⁡ [(p ] = ⁡ [ ] E⁡ [ -p ]{\ [ ( 1/ = [ [따라서 X {\ X - p{\ Y 모멘트를 따로 정할 수 있다면X / X 모멘트를 찾을 수 있습니다.Y- {\ Y 모멘트는 Y{\ Y의 역 pdf로부터 결정되며, 종종 다루기 쉬운 연습입니다.기껏해야 E ⁡ [ - ] = ∫ - p (y ) {\ [}] =\ _입니다.

예를 들어,표준 에서 X {\displaystyle X을(를) 표본으로 합니다.

α - - / ( {\ x -1)}, p{\p} -번째 모멘트는 ( ) / (){\+ ) /\입니다.

변수 {\ 사용하는 역 Gamma 분포에서 샘플링되었으며, pdf- ( 1 + - /z {\\;\^{-1+\z를 갖습니다. 이 pdf의 모멘트는

해당 순간을 곱하면 다음을 얻을 수 있습니다.

독립적으로 두 감마 R = / R = 의 비율이 베타 프라임 분포를 따르는 것으로 알려져 있습니다.

β (β) (β - α - (+)- (+β){\)= -1+ + \ 는 E [p ] ( ,- ) [}]={\{\+ - p β - p)}

(β) = ( ( (+){\ ))\(\ alpha +\ Gamma (p )} Δ (α + p )( ) (+ )(+ ) (-p ) ) ( ) E} [R^{{\ (\alpha camma /Gamma (\alpha + p )}{\ {\alpha ))}}{\{\)\alpha )}이며, 과 일치합니다

랜덤 비율의 평균 및 분산

Mellin 변환 이론에서 파생된 제품 분포 섹션(위의 섹션 참조)에서 독립 변수의 제품 평균이 해당 평균의 제품과 동일하다는 것이 확인되었습니다.비율의 경우에는.

확률 분포의 관점에서 다음과 같은 값을 갖습니다.

⁡ (/ ) ≠ ⁡ ( ){\ ({\ ( 즉 ∫ - ∞ - ∞ - ∞ { _{\ _}^{\}yf_{

독립 변수 비율의 분산은

정규비율분포

비상관 중심정규비

X와 Y가 독립적이고 평균이 0인 가우스 분포를 가질 비율 분포의 형태는 코시 분포입니다.이는 Z = / = Z = =\한 다음 θ{\이(가) 원형 대칭임을 보여줌으로써 도출할 수 있습니다.이변량 상관 관계가 없는 가우스 분포의 경우 다음과 같습니다.

){\ pr의 함수일 경우 θ 1π ]}의 ,2\에서 균일하게 분포되므로 문제는 매핑 아래에서 Z의 확률 분포를 찾는 것으로 줄어듭니다.

우리는, 가능성을 보존함으로써,

/ / 2 dz / = /

2 ⁡ θ ⁡ = 1+ ( θ ) θ ) = + 2 \}\theta = \)^{2}} = 2}}}을(를)

여기에는 2라는 가짜 계수가 있습니다.실제로 θ{\의 두 개의 값이π {\ \pi 간격으로 동일한 z 값에 매핑되어 밀도가 두 배로 증가하고 최종 결과는

두 정규 분포 중 하나가 중심이 아닌 경우 비율 분포에 대한 결과는 훨씬 더 복잡하며 David Hinkley[6]제시한 간결한 형태로 아래에 제시됩니다.그러나 비율에 대한 삼각법 방법은 밀도가 r= + 2{\ r = ^{2} + y^{}와 같은 반경 분포로 확장됩니다.1 자유도에 대해 아래 절에 제시된 코시 비율을 제공하는 두 개의 독립적인 학생 t 분포의 비율로 확장되지 않습니다

비상관 비중심정규비

없는 경우(상관관계 ⁡ ( ) = ){\(\ (Y) = 두 정규 변수 X = N(μ, σ) 및 Y = N(μ, σ) 비율 Z = X/Y확률 밀도 함수는 여러 출처에서 도출된 정확한 다음 식으로 제공됩니다.

어디에

그리고 정규 누적 분포 함수입니다.

  • 몇 가지 가정(일반적으로 실제 적용에서 충족됨) 하에서 PDF에 대한 매우 정확한 솔리드 근사치를 도출할 수 있습니다.주요 이점은 공식 복잡성 감소, 폐쇄형 CDF, 단순 정의된 중위수, 잘 정의된 오류 관리 등입니다.심플함을 위해 = 2 σ x p = {\ _ = μ σ y{\ q = {\ _ = y {\r = {\{\ _그러면 상관 관계가 없는 비 중심 정규 비율 PDF에 대한 소위 근사 Z† ( {\}(라고 하는 수식으로 표현됩니다.
  • 특정 조건에서는 [12]분산을 사용하여 정규 근사치를 얻을 수 있습니다.

상관 중앙정규비

식은 변수 X와 Y가 상관 관계에 있을 때 더 복잡해집니다. x = y = {\ _}=\ _}=이지만 σ X σ Y{\ _Y}}이고≠ 0 {\ \ 0 보다 일반적인 코시 분포를 얻을 수 있습니다.

여기서 ρX와 Y 사이상관계수이고

복잡한 분포는 또한 쿰머의 합류 초기하학 함수 또는 헤르마이트 [9]함수로 표현되었습니다.

상관 비중심정규비

상관 관계가 있는 비중심 정규 비율에 대한 근사치

Katz(1978)는 로그 도메인으로의 변환을 제안했습니다(아래 이항 섹션 참조).비율을 다음과 같이 하라.

{\_{ _}}}}{ {Y

로그를 사용

⁡ ( 1+δ ) =δ - δ 2+ δ 3+ ⋯ _displaystyle \log _{e})=\delta{\delta^{delta 부터 점근적으로

또는 Geary(1930)는 다음과 같이 제안했습니다.

대략적으로 표준 [1]가우스 분포를 갖습니다. 변환을 Geary-Hinkley 변환이라고 합니다. Y가 으로 σ y{\ _y와 같이 음의 값을 가정하지 않을 경우 근사치가 좋습니다.

정확한 상관 관계가 있는 비중심 정규 비율

기어리는 상관 z{\ z 가우스에 가까운 형태로 변환되는 방법을 보여주고 음의 분모 x + < {\ x _의 확률에 따라 t{\ t에 대한 를 개발했습니다.필러의 나중 상관 비율 분석은 정확하지만 현대 수학 패키지와 함께 사용될 때 주의가 필요하며 마르살리아 방정식의 일부에서 비슷한 문제가 발생할 수 있습니다.팜-지아는 이 방법들에 대해 철저하게 논의했습니다.힝클리의 상관 결과는 정확하지만 아래에 나타나 있듯이 상관 비율 조건은 단순히 상관이 없는 조건으로 변환될 수 있으므로 전체 상관 비율 버전이 아닌 위의 단순화된 힝클리 방정식만 필요합니다.

비율은 다음과 같습니다.

{\ x는 분산 σ σ y {\ _ _ X X x μ 갖습니다 {\ _ _x {\x', y {\ x', y {\displaystyle x}가 상관 관계가 x{\displaystyle x'}가 표준 를 가지도록 x ' x - x /{\ x를 쓰십시오.

비율:

는 이 변환 하에서 불변하며 동일한 pdf를 유지합니다.의 y y 항은 다음을 확장하여 분리할 수 있습니다.

갖기 위해

x'= x - y σ x σy {x}=\ \y}{\ _ _ z는 이제 불변의 z-벡터를 가진 상관없는 중심 정규 샘플의 비율이 되었습니다.

마지막으로, 명확하게 말하면, 상관 변수에 대한 z{\ z의 pdf는 수정된 매개 변수 σ x σ y{\\ _ ρ= 0 {\ \=}을 위의 힌클리 방정식에 입력하면 찾을 수 있습니다.z{\ z에서 오프셋 - ρ x σ y {\

Gaussian ratio contours
비율 x/y를 제공하는 상관 이변량 가우스 분포(척도로 표시하지 않음)의 등고선
pdf of probability distribution ratio z
가우시안 z의 pdf 및 에 대한 시뮬레이션(점)

위의 그림은 음영 처리된 쐐기가 주어진 x/ ∈로 선택된 면적의 증분을 나타내는 σ x = σ y = 1 =, = ρ = 0{\ \n\x= _= _}= _}= = 와 양의 상관 관계에 있는 비율의 예를 보여줍니다. 여기서 음영 처리된 쐐기는 주어진 비율 x/y δ [ r+sigma ]{\ x와 중첩되는 위치에서 확률을 누적하는 continues 논의 중인 방정식과 힝클리 방정식을 결합한 이론적 분포는 5,000개의 샘플을 사용한 시뮬레이션 결과와 매우 일치합니다. 그림을 보면 비율= / y =1 {\= x / y= 1}의 경우 쐐기가 분포 질량을 거의 모두 우회하고 이론적 pdf에서 거의 0에 가까운 영역과 일치한다는 것을 쉽게 알 수 있습니다.반대로 x x(가) 0으로 갈수록 선은 더 높은 확률을 수집합니다.

이 변형은 Geary(1932)가 그의 eqn 8에서 부분적인 결과로 사용한 것과 동일하지만 그의 파생과 한계는 거의 설명되지 않았습니다.따라서 이전 섹션에서 가우스성을 근사화하기 위한 기어리 변환의 첫 번째 부분은 실제로 정확하며 Y의 양에 의존하지 않습니다.오프셋 결과는 첫 번째 섹션에서 "코시" 상관 0-평균 가우스 비율 분포와 일치합니다.Marsaglia는 동일한 결과를 적용했지만 이를 달성하기 위해 비선형 방법을 사용했습니다.

복소정규비

Baxley et al.[13]은 상관된 0-평균 원대칭 복소 정규분포변수의 비율을 구하였으며, 이후 0-평균이 아닌 경우와 비대칭인 [14]경우로 확장하였습니다.상관된 0-평균인 경우 x, y합동 분포는

어디에

에르미트의 전치이고

Z = / Z = 의 PDF가 발견되었습니다.

σ =σ y}=\인 일상적인 경우 우리는

CDF에 대한 추가 폐쇄형 결과도 제공됩니다.

상관된 복소 변수의 비율 분포, rho = 0.7 exp(ipi/4).

그래프는 상관 계수가 θ = expθ (π /4 ) = / 인 두 복잡한 정규 변수의 비율 pdf를 보여줍니다.pdf 피크는 축척된 의 복잡한 컨쥬게이트에서 발생합니다.

로그 정규 분포 비율

독립적이거나 상관된 로그 정규식의 비율은 로그 정규식입니다.이는 1{\ X_과 X {\ X_2}}이() 로그 정규 라면 ⁡ ( {\})}과 ⁡ (X {\2})}이(가) 정규 분포이기 때문입니다.독립적이거나 로그가 이변량 정규 분포를 따르는 경우 비율의 로그는 정규 분포를 따르는 독립적이거나 [note 1]상관된 정규 분포 확률 변수의 차이입니다.

이는 {\X_}과X 2 {\2}}의 공동 분포가 로그 정규 분포로 적절하게 근사화되는 양의 변수 비율을 필요로 하는 많은 응용 프로그램에서 중요합니다. {\{i가 많은 작은 백분율 변화의 누적의 결과이고 이면서 대략 로그 정규 [15]분포여야 할 때, 지브라트의 법칙이라고도 불리는 곱셈 중심 극한 정리의 일반적인 결과입니다.

균일비율분포

개의 독립적인 랜덤 변수가 균일한 분포를 따르는 경우, 예를 들어,

비율분포는

코시비분포

두 개의 독립 랜덤 변수가 각각 중위수가 0이고 인자가 {\ a코시 분포를 따르는 경우

그러면 랜덤 Z = / Z = / 의 비율 분포는

이 분포는 a 하지 않으며 스프링어(p158 질문 4.6)에 의해[8] 진술된 결과가 올바르지 않습니다.비율 분포는 랜덤 W = Y W =의 곱 분포와 비슷하지만 같지는 않습니다.

[8]

일반적으로 두 독립 랜덤 변수 X와 Y가 각각 중위수가 0이고 형상 인자가 {\ a b 코시 분포를 따르는 경우:

  1. 랜덤 Z = / Z = / 의 비율 분포는
  2. 랜덤 W = W = 제품 분포는

비율 분포에 대한 결과는b {\ b를) 하여 제품 분포에서 얻을 수 있습니다 {\{\

표준정규 대 표준균일의 비율

X가 표준 정규 분포를 가지고 Y가 표준 균일 분포를 가지면 Z = X / Y는 확률 밀도 함수와 함께 슬래시 분포로 알려져 있습니다.

여기서 ρ(z)는 표준 정규 [17]분포의 확률 밀도 함수입니다.

카이제곱, 감마, 베타 분포

G를 정규(0,1) 분포라고 하고, Y와 Z를 각각 m과 n 자유도갖는 치안정 분포라고 하고, 모두 독립적이며, fχ () = 2 - e - / / Ω (/ {\) = {\ 그렇다면,

/ ~ {\ 학생 t 분포
/ Z / {\{\} = 즉.Fisher's F-검정 분포
+ ~ ( 2 2 ){\{\ {\ 베타 분포
~ β ( {\ 표준 베타 소수 분포

1~ χλ χ k 1 (\ ) {\ V_ 비중심제곱 분포, 2 ~ χ′ 2 2 (0 ) {\}( V 1 {\V_{V 2 {\2}}에 독립적이면,

1 / 1 2 / 2 ~ ′(){\{\ F 비중심 F 분포입니다.

= ′( {\{\ F}=\}=\{\}, 1, { F' 피셔 F 밀도 분포, 두 카이-제곱 비율의 PDFm, n 자유도와 함께 합니다.

F-표에서 발견되는 피셔 밀도의 CDF는 베타 프라임 분포 기사에서 정의됩니다.오른쪽 꼬리에 m = 3, n = 4 및 5% 확률로 F-검정표를 입력하면 임계 값은 6.59입니다.이것은 적분과 일치합니다.

임의의 모양 매개 변수 α와 α를 갖는 감마 분포 U와 V 및 그 척도 매개 변수가 둘 다 단일성으로 설정된 즉 U ~ (1 V ~ ( 1) {\ \Gamma (\1 \Gamma )=x - - x() \alpha, = {\{ 다음

U~γ ( ;, ){\ U이면 θ U~γ ( ;,θ ) = - - x θ kγ (α ){\ ) = {\^{(\ 여기서 θ는 비율 매개 변수가 아니라 척도 매개 변수입니다.

U~Ω ( 1 θ1), ~Ω ( 2 θ2 ){\ U_{ __{ _인 경우, θ 매개 변수를 우리가 가진 통일성으로 재스케일링함으로써

따라서

서 β (, ,q {\ \lamba '(\ 일반화된 베타 프라임 분포를 나타냅니다.

위에서 X~ ′( 1 1 {\X\_{_{ 1_{ _, θX ~ ′(, 1 θ) sim \'(\1},\ 1,\ 인 것은 명백합니다. 좀 더 명확하게 말하자면, 그 이후로

~Ω ( 1 θ 1), ~Ω ( 2 θ2 ){\ U_{ __{ _인 경우

어디에

레일리 분포

X, Y레일리 ( r ) = ( σ ) - 2 / σ 2 {\)=(displaydisplay 0인 경우 비율 Z = X/Y는 분포를 따릅니다.

그리고 cdf를 가지고 있습니다.

Rayleigh 분포는 스케일링을 유일한 매개변수로 사용합니다.Z = X / Z =\ X의 분포는 다음과 같습니다.

그리고 cdf를 가지고 있습니다.

분수 감마 분포(chi, 카이제곱, 지수, Rayleigh 및 Weibull 포함)

일반화된 감마 분포는

여기에는 분수 파워를 포함하는 정규 감마, 카이, 카이 제곱, 지수, 레일리, 나카가미 및 웨이불 분포가 포함됩니다.여기서 a는 속도 매개변수가 아니라 척도 매개변수이고 d는 형상 매개변수입니다.

~ ( ; V ~ ( ; 2 ) 이고 = / {\ Uf( f =
( ) = ( a ) B ( 1 r ) - 2 - (+ ( a a) - - ) + r , > {\ g) = {\
서 B( ) =γ ( )γ ( )γ ( + ){\B () = {\{\+

다양한 스케일링 인자의 혼합물 모델링

위의 비율에서 Gamma 표본, U, V의 는 α, 2 \1},\2}}일 수 있지만 x -1 - x θ k {\{x^{\{x}{\}}}}{\}\(\)}}}, 동일한 스케일링θ \}}.

U와 V의 스케일이 다른 상황에서는 변수 변환을 통해 수정된 랜덤 비율 pdf를 결정할 수 있습니다. = + = + {\ X = {\}} = {\ U γ ( 1θ ), ~γ ( 2θ),θ {\ U _ _ 임의로, 에서 X ~ t ( 1 ), = / ~ e ( 2 ){\ X Beta _{ 베타

로, Y~ U + φ V = + φ B ≤ ∞ {\ Y{\ V}} = {11+\ B\varphi \infty

= - B = {\ Y로 대체하면 Y = φ+ ( φ ) X Y / X =φ (φ+ ( -φ )X ) {\ Y = {\+ (= {\{\ + .

X를 Y변환하면 (Y ) = ( ) Y / = (, 2 )φ/ [φ+ ( -φ )X ] {\) = {\ { }} = {\_{ {\

X = φ 1- ( φ ) Y{\ X = {\{\ Y- (1 - 드디어 도착했습니다.

따라서 U ~ ( 1 ≥ 1{\ U_{ _V ~ ( 2{\ V_{ _
= + Y = {\를 f ,φ) )}로 분배하고 φ = θ 2θ 1θ \ \varphi = {\ {\2}}{\ _로 분배합니다.

Y의 분포는 구간 [0,1]로 제한됩니다.Y~ Y ( φ ){\ Y ()}인 일반화할 수 있습니다.

Y( φ,θ ) =φ /θ [- (-φ )Y /θ ] β ( φY / θ1 -(-φ )Y /θ, 1 ≤ Yθ {\ ) = {\} {[

\ + V {\frac{\

베타분포 표본의 역수

두 변수의 비율 분포는 아니지만 한 변수에 대해 다음과 같은 항등식이 유용합니다.

~(,β {\ \displaystyle X\sim \display )}이면 = 1 - X ~ (α, ){\ \= {\\displaystyle
~ β′ (β){\ \이면 y = ~ β (){\ y = {\)}

뒤의 두 방정식의 산출량을 합하면

~(,β {\ \displaystyle X\sim \display이면 x = - ~ β ( ){\ = {\
~ (,β {Y \lament '(\lament )}이면 = 1 + ~ (){\ y = {\{\

+ = - - + ~ (){\{\={\ \sim \sim )}

그리고나서

+ ~{ ( - 1{\ 1 \β () )} 역수 분포.

~ (),V ~ ( ){\U\), 경우 ~ β (){\{\ ' (\)} 및

추가 결과는 역분포 기사에서 확인할 수 있습니다.

  • X X 평균 μ를 갖는 독립 지수 랜덤 변수라면 X - Y는 평균이 0이고 척도 μ를 갖는 이중 지수 랜덤 변수입니다.

이항 분포

이 결과는 1978년 [20]Katz et al.에 의해 처음 도출되었습니다.

X {\ X{\Y ~( {\ Y{\ 및 X X Y Y 독립적이라고 합니다.T = / / T = {\이라고 .

⁡ ( ){\는 평균 ⁡ ( / ) 분산(/ )- +( 1 / p 2 ) - 1 m {\displaystyle {\{(1/ { + {\{(1 / {\frac {(1 / p_{2})}, {m}}, {\displaystyle \log(T)}입니다.

이항 비율 분포는 임상 시험에서 중요한 의미를 갖습니다. 만약 T의 분포가 위와 같이 알려진다면, 주어진 비율이 순전히 우연에 의해 발생할 확률, 즉 거짓 양성 시험을 추정할 수 있습니다.여러 논문에서 이항 [citation needed]비율에 대한 여러 근사치의 강건성을 비교합니다.

포아송 분포 및 절단된 포아송 분포

포아송 변수 R = X/Y의 비율에서는 Y가 유한 확률로 0이므로 R이 정의되지 않는 문제가 있습니다.이에 대응하기 위해 Y의 0개 표본이 할인되는 절단되거나 검열된 비율 R' = X/Y'를 고려합니다.또한 많은 의료 유형의 조사에서 X와 Y 모두의 0 표본의 신뢰성에 체계적인 문제가 있으며 어쨌든 0 표본을 무시하는 것이 좋은 방법일 수 있습니다.

귀무 포아송 표본이 eλ e 확률, 왼쪽 잘린 포아송 분포의 일반적인 pdf는

하나가 되는 거죠Cohen에 [21]이어 n개의 독립 시행의 경우 다차원 절단 pdf는

그리고 로그 가능성은

차별화를 통해 우리는

그리고 0으로 설정하면 최대 우도 추정치 λ {\{\{\를 얻을 수 있습니다.

λ^ 0인 경우 x ¯ → {\{\1이므로 절단된 최대 우도 λ 추정치는 절단된 분포와 절단되지 않은 분포 모두에 대해 정확하지만,는 잘린 평균 x¯ {\ 값을 제공합니다. 이 은 잘린 평균 x { {\bar {x}} 값과 비교하여 매우 바이어스가 높습니다.그러나 λλlambda¯¯lambda ∑ { }}}{ depends }} \ }} display \ m { _ } \ style 1 = { never through the = 1 only data on = ¯ theless for 1{}_x in }} sum { i \ { \ it { \ which 1 }} λ x lambda { { ^ i λ n { { \ style \ \ { ∑ ¯ }} x ^ n { the mean x is display l since sample style bar the \ { display is that { style x x a ml en appears bar hat lambda { equation consist n su previous statistic display \ _ ac fr n fficient i일반적인 포아송 분포의 방법론을 사용하여 t.

닫힌 형식 솔루션이 없는 경우 λ \에 대한 다음 근사적인 반전은 범위 0≤ ≤ ≤ ≤ {\ 0{\ 에서 유효합니다.

단순히 λ = ¯ {\{\{\display}} = R =λ^ X / Y {\ R = hat {\hat {\{{\displaystyle {}}^ X {\_{X}}는 잘리지 않은 모델을 사용할 수 있지만 {\{\에는 왼쪽으로 꺾인 것이 있습니다.

λ of 크라메르-라오 경계)의 점근적 큰 n λ

L로 대체하면 다음과 같이 주어집니다.

위의 식에서 x{\ 하면 코헨의 분산 추정치를 얻을 수 있습니다.

n번의 시행을 기준으로 평균 λ 의 점 추정치의 분산은 n이 무한대로 증가함에 따라 0으로 점증적으로 감소합니다.작은λ {\의 경우 Springael의 잘린 pdf 분산에서 분기됩니다. 예를 들어, 다음의 분산을 인용하는 사람은

이 섹션의 맨 위에 표시된 왼쪽 상단 pdf의 n 샘플에 대해.Cohen은 pdf, ( λ ^) / λ ) 의 분산이 큰 {\100% 효율적)의 경우 1부터λ \가 0(50% 효율적)에 가까워짐에 따라 2까지 다양함을 보여주었습니다.

이러한 평균 및 분산 모수 추정치는 X에 대한 병렬 추정치와 함께 포아송 비율에 대한 정규 또는 이항 근사치에 적용할 수 있습니다.시험 표본은 포아송 과정에 적합하지 않을 수 있습니다. 포아송 절단에 대한 추가적인 논의는 Dietz and Bohning에[23] 의해 있으며 0개의 포아송 분포 위키백과 항목이 있습니다.

이중 로맥스 분포

이 분포는 두 [24]라플라스 분포의 비율입니다.X와 Y를 표준 라플라스에 동일한 분포된 랜덤 변수라고 하고 z = X / Y라고 합니다.그러면 z의 확률분포는

X Ya의 평균을 그대로 두십시오.그런 다음 표준 이중 로맥스 분포는 a를 중심으로 대칭됩니다.

이 분포에는 무한 평균과 분산이 있습니다.

Z에 표준 이중 로맥스 분포가 있으면 1/Z에도 표준 이중 로맥스 분포가 있습니다.

표준 Lomax 분포는 단일 분포이며 Laplace 분포보다 꼬리가 더 무겁습니다.

0 < a < 1의 경우 a번째 모멘트가 존재합니다.

여기서 Δ는 감마 함수입니다.

다변량 분석에서의 비율 분포

비율 분포는 다변량 [25]분석에서도 나타납니다.랜덤 행렬 X와 Y가 Wishart 분포를 따르는 경우, 행렬식의 비율

독립적인 F 랜덤 변수의 곱에 비례합니다.X와 Y가 독립적으로 표준화된 Wishart 분포에서 나온 경우, 비율

윌크스의 람다 분포를 가지고 있습니다

Wishart 행렬이 포함된 2차 형태의 비율

확률 분포는 무작위 이차 형식에서 유도될 수 있습니다.

서 V V/ A{\ A([26]는) 랜덤합니다.A가 다른 행렬 B의 역이면 = TB - {\ r = 는 어떤 의미에서 무작위 비율이며 최소 제곱 추정 문제에서 자주 발생합니다.

가우시안 경우, A가 복소수 Wishart A ~ ( 0,) A W_, 차원성 p x p k 자유도 kp}인 , V{\ V 에르미트(conjugate) 전치 ) {\displaystyle 비율

Gamma 분포를 따릅니다.

결과는 최소 제곱 적응형 위너 필터링에서 발생합니다. 의 [25]eqn(A13) 참조.원래 기사에서는 1(r ) = - - 1 - / ( - ){\) = 라고 주장합니다.

마찬가지로, 전체 순위 ( ){\ kp )} 영-평균 실-값 Wishart 행렬 W ~ (,, ){\W\ W W와 무관한 V 랜덤 벡터에 대하여, 비율

이 결과는 보통 Muirhead(1982)[27]에 기인합니다.

주어진 복잡한 Wishart A ~ {\ A W_ 비율

베타 분포를 따릅니다(의 eqn(47[28])).

제한 최소 제곱 필터링의 성능 분석에서 결과가 발생하며, A~ ( 0 {\ A W_ ( 경우 복잡하지만 궁극적으로 동등한 비율에서 도출됩니다.

가장 간단한 형태로, ~ C( p) {\j}\ p)}이고 = (- ), {\i,j}=\인 경우, (1,1) 역요소 제곱의 전체 행 요소의 모듈러스 제곱의 합에 대한 비율은 분포를 갖습니다.

참고 항목

메모들

  1. ^ 그러나 X {\ X_ 2{\(는) 이변량 로그 정규 분포를 갖지 않고 개별적으로 로그 정규 분포를 나타낼 수 .2022-06-08년 현재 "코풀라(확률 이론)"에 대한 위키피디아 기사에는 Gumbel 코풀라와 두 개의 정규 한계 관절의 밀도와 윤곽도가 포함되어 있으며, 여기서 관절 분포는 이변량 정규 분포가 아닙니다.

참고문헌

  1. ^ a b Geary, R. C. (1930). "The Frequency Distribution of the Quotient of Two Normal Variates". Journal of the Royal Statistical Society. 93 (3): 442–446. doi:10.2307/2342070. JSTOR 2342070.
  2. ^ Fieller, E. C. (November 1932). "The Distribution of the Index in a Normal Bivariate Population". Biometrika. 24 (3/4): 428–440. doi:10.2307/2331976. JSTOR 2331976.
  3. ^ a b Curtiss, J. H. (December 1941). "On the Distribution of the Quotient of Two Chance Variables". The Annals of Mathematical Statistics. 12 (4): 409–421. doi:10.1214/aoms/1177731679. JSTOR 2235953.
  4. ^ 조지 마르살리아 (1964년 4월).정규 변수의 비율균일 변수의 합계의 비율입니다.국방기술정보센터입니다
  5. ^ Marsaglia, George (March 1965). "Ratios of Normal Variables and Ratios of Sums of Uniform Variables". Journal of the American Statistical Association. 60 (309): 193–204. doi:10.2307/2283145. JSTOR 2283145. Archived from the original on September 23, 2017.
  6. ^ a b c Hinkley, D. V. (December 1969). "On the Ratio of Two Correlated Normal Random Variables". Biometrika. 56 (3): 635–639. doi:10.2307/2334671. JSTOR 2334671.
  7. ^ a b Hayya, Jack; Armstrong, Donald; Gressis, Nicolas (July 1975). "A Note on the Ratio of Two Normally Distributed Variables". Management Science. 21 (11): 1338–1341. doi:10.1287/mnsc.21.11.1338. JSTOR 2629897.
  8. ^ a b c d e f Springer, Melvin Dale (1979). The Algebra of Random Variables. Wiley. ISBN 0-471-01406-0.
  9. ^ a b Pham-Gia, T.; Turkkan, N.; Marchand, E. (2006). "Density of the Ratio of Two Normal Random Variables and Applications". Communications in Statistics – Theory and Methods. Taylor & Francis. 35 (9): 1569–1591. doi:10.1080/03610920600683689. S2CID 120891296.
  10. ^ Brody, James P.; Williams, Brian A.; Wold, Barbara J.; Quake, Stephen R. (October 2002). "Significance and statistical errors in the analysis of DNA microarray data" (PDF). Proc Natl Acad Sci U S A. 99 (20): 12975–12978. Bibcode:2002PNAS...9912975B. doi:10.1073/pnas.162468199. PMC 130571. PMID 12235357.
  11. ^ Šimon, Ján; Ftorek, Branislav (2022-09-15). "Basic Statistical Properties of the Knot Efficiency". Symmetry. MDPI. 14 (9): 1926. doi:10.3390/sym14091926. ISSN 2073-8994.
  12. ^ Díaz-Francés, Eloísa; Rubio, Francisco J. (2012-01-24). "On the existence of a normal approximation to the distribution of the ratio of two independent normal random variables". Statistical Papers. Springer Science and Business Media LLC. 54 (2): 309–323. doi:10.1007/s00362-012-0429-2. ISSN 0932-5026. S2CID 122038290.
  13. ^ Baxley, R T; Waldenhorst, B T; Acosta-Marum, G (2010). "Complex Gaussian Ratio Distribution with Applications for Error Rate Calculation in Fading Channels with Imperfect CSI". 2010 IEEE Global Telecommunications Conference GLOBECOM 2010. pp. 1–5. doi:10.1109/GLOCOM.2010.5683407. ISBN 978-1-4244-5636-9. S2CID 14100052.
  14. ^ Sourisseau, M.; Wu, H.-T.; Zhou, Z. (October 2022). "Asymptotic analysis of synchrosqueezing transform—toward statistical inference with nonlinear-type time-frequency analysis". Annals of Statistics. 50 (5): 2694–2712. doi:10.1214/22-AOS2203.
  15. ^ 물론 중심 극한 정리의 모든 호출은 유한 분산과 같은 적합하고 일반적으로 충족되는 규칙성 조건을 가정합니다.
  16. ^ a b c Kermond, John (2010). "An Introduction to the Algebra of Random Variables". Mathematical Association of Victoria 47th Annual Conference Proceedings – New Curriculum. New Opportunities. The Mathematical Association of Victoria: 1–16. ISBN 978-1-876949-50-1.
  17. ^ "SLAPPF". Statistical Engineering Division, National Institute of Science and Technology. Retrieved 2009-07-02.
  18. ^ Hamedani, G. G. (Oct 2013). "Characterizations of Distribution of Ratio of Rayleigh Random Variables". Pakistan Journal of Statistics. 29 (4): 369–376.
  19. ^ Raja Rao, B.; Garg., M. L. (1969). "A note on the generalized (positive) Cauchy distribution". Canadian Mathematical Bulletin. 12 (6): 865–868. doi:10.4153/CMB-1969-114-2.
  20. ^ Katz D. et al.(1978) 코호트 연구에서 위험 비율에 대한 신뢰 구간 획득생체 인식 34:469-474
  21. ^ Cohen, A Clifford (June 1960). "Estimating the Parameter in a Conditional Poisson Distribution". Biometrics. 60 (2): 203–211. doi:10.2307/2527552. JSTOR 2527552.
  22. ^ Springael, Johan (2006). "On the sum of independent zero-truncated Poisson random variables" (PDF). University of Antwerp, Faculty of Business and Economics.
  23. ^ Dietz, Ekkehart; Bohning, Dankmar (2000). "On Estimation of the Poisson Parameter in Zero-Modified Poisson Models". Computational Statistics & Data Analysis. 34 (4): 441–459. doi:10.1016/S0167-9473(99)00111-5.
  24. ^ Bindu P and Sangita K (2015) Double Lomax 분포 및 그 응용통계 LXXV (3) 331–342
  25. ^ a b Brennan, L E; Reed, I S (January 1982). "An Adaptive Array Signal Processing Algorithm for Communications". IEEE Transactions on Aerospace and Electronic Systems. AES-18 No 1: 124–130. Bibcode:1982ITAES..18..124B. doi:10.1109/TAES.1982.309212. S2CID 45721922.
  26. ^ Mathai, A M; Provost, L (1992). Quadratic Forms in Random Variables. New York: Mercel Decker Inc. ISBN 0-8247-8691-2.
  27. ^ Muirhead, Robb (1982). Aspects of Multivariate Statistical Theory. USA: Wiley. pp. 96, Theorem 3.2.12.
  28. ^ Reed, I S; Mallett, J D; Brennan, L E (November 1974). "Rapid Convergence Rate in Adaptive Arrays". IEEE Transactions on Aerospace and Electronic Systems. AES-10 No.6 (6): 853–863. Bibcode:1974ITAES..10..853R. doi:10.1109/TAES.1974.307893. S2CID 51664535.

외부 링크