파레토 분포

Pareto distribution
파레토 1종
확률밀도함수
Pareto Type I probability density functions for various α
Pareto Type I probability density functions for various with As the distribution approaches where (는) 디락 델타 함수다.
누적분포함수
Pareto Type I cumulative distribution functions for various α
파레토 Type I는 m= 1x_{\m1의 다양한 {\displaystyle \에 대한 누적 분포
매개변수 > 척도(실제)
> 모양(실제)
지원
PDF
CDF
퀀틸레
평균
중앙값
모드
분산
왜도
엑스트라 쿠르토시스
엔트로피
MGF 존재하지 않음
CF
피셔 정보

Right:

The Pareto distribution, named after the Italian civil engineer, economist, and sociologist Vilfredo Pareto,[1] (Italian: [paˈreːto] US: /pəˈrt/ pə-RAY-toh),[2] is a power-law probability distribution that is used in description of social, quality control, scientific, geophysical, actuarial, and many other types of observable phenomena. 원래 한 사회의 부의 분배를 설명하는 데 적용되었는데, 인구의 소수에 의해 부의 상당 부분이 점유되고 있는 추세에 적합하다.[3][4] 결과의 80%가 파레토에 기인한다는 파레토 원칙이나 「80-20 규칙」은 파레토에 경의를 표하여 명명되었으나, 개념은 구별되며, 로그4 5 ≈ 1.16의 형상값(α)을 가진 파레토 분포만이 이를 정확하게 반영한다. 경험적 관찰 결과 이 80-20 분포는 자연현상이나[5] 인간활동 등 광범위한 사례에 적합하다는 것을 알 수 있었다.[6]

[7]

정의들

X가 Pareto(타입 I) 분포를 갖는 랜덤 변수인 경우 X가 일부 숫자 x보다 클 확률, 즉 생존 함수(꼬리 함수라고도 함)가 다음과 같이 주어진다.[8]

여기서 xm (필요하게 양)의 최소 가능한 X 값이고, α는 양의 매개변수다. 파레토 1형 분포는 척도 모수 xm 형상 모수 α가 특징인데, 이를 꼬리 지수라고 한다. 이 분포가 부의 분포를 모형화하는 데 사용될 때, 매개변수 α파레토 지수라고 한다.

누적분포함수

정의에서 모수 αxm 갖는 파레토 랜덤 변수의 누적 분포 함수는

확률밀도함수

확률밀도함수가 (분화에 의해) 다음과 같이 된다.

선형 축에 표시되면 분포는 직교 축 각각에 점증적으로 접근하는 익숙한 J자형 곡선을 가정한다. 곡선의 모든 세그먼트는 자체 유사하다(적절한 스케일링 요인에 따라 달라짐). 로그 그림에 표시된 경우 분포는 직선으로 표시된다.

특성.

모멘트 및 특성 함수

(α α α 1이면 분산이 존재하지 않는다.)

t= 0 을(를) 포함하는 열린 간격에 기대치가 수렴되지 않기 때문에 모멘트 생성 기능이 존재하지 않는다고 본다.

여기서 γ(a, x)은 불완전한 감마함수다.

매개변수는 모멘트 방법을 사용하여 해결할 수 있다.[9]

조건부 분포

m {\displaystyle을 초과하는 특정 숫자 {\ text{보다 크거나 같은 사건을 고려할 때 Pareto 분포의 조건부 확률 분포는 동일한 분포이지만이다. 대신x 1 1}. 이것은 conditional 예상 값(만약 유한, 즉 α 1{\displaystyle \alpha 1})x1{\displaystyle x_{1}에}비례합니다. 개체의 수명을 묘사하고 확률 변수의 경우, 이것은 그러한 기대 수명 시대로, 그리고 린디 효과 또는 린디의 법안은 정비례한다 의미를 암시한다.[10]

특성화 정리

, , ,은(는) 일부 m>에 대해[ 간격으로 확률 분포를 지원하는 동일한 독립랜덤 변수라고 가정합시다. Suppose that for all , the two random variables and are independent. 그렇다면 공통분포는 파레토분포다.[citation needed]

기하 평균

기하 평균(G)은[11]

조화 평균

고조파 평균(H)은[11]

그래픽 표현

선형 척도에 표시할 때 특성 곡선 '긴 꼬리' 분포는 로그 로그 그래프에 표시될 때 함수의 기본 단순성을 가린 다음 음의 구배를 갖는 직선의 형태를 취한다. 확률밀도함수에 대한 공식에서 x xm x에 대해,

α는 양성이므로 구배 -(α + 1)는 음이다.

관련 분포

일반화 파레토 분포

파레토 분포에는 파레토 유형 I, II, III, IV, 그리고 펠러-파레토 분포로 알려진 파레토 분포의 계층이 있다.[8][12][13] 파레토 타입 4는 파레토 타입 I-를 포함한다.특별한 경우로서 III. 펠러-파레토[12][14] 분포는 파레토 타입 4를 일반화한다.

파레토형 I-IV

파레토 분포 계층은 생존 함수(완전 CDF)를 비교하는 다음 표에 요약되어 있다.

μ = 0일 때 파레토 분포 타입 II는 로맥스 분포라고도 한다.[15]

이 절에서는 x의 최소값을 나타내기 위해 이전에 사용된 기호 xm σ으로 대체한다.

파레토 분포
지원 매개변수
제1종
타입 II
로맥스
타입 III
IV형

형상 모수 α꼬리 지수, μ는 위치, μ는 척도, γ은 불평등 모수다. 파레토형(IV)의 특수한 경우는 다음과 같다.

평균의 미세성, 분산의 존재와 미세성은 꼬리 지수 α(부질 지수 α)에 따라 달라진다. 특히 부분 Δ-모멘트는 아래 표와 같이 일부 Δ > 0에 대해 유한하며, 여기서 Δ는 반드시 정수일 필요는 없다.

파레토 1세의 순간들
조건 조건
제1종
타입 II
타입 III
IV형

펠러-파레토 분포

Feller는[12][14] 확률밀도함수가 다음과 같은 베타 랜덤 변수 Y변환−1 U = Y - 1에 의해 파레토 변수를 정의한다.

여기서 B( )는 베타 함수다. 만약

W는 Feller-Pareto 분포 FP(μ, σ, σ, γ1, γ2)를 갖는다.[8]

If and are independent Gamma variables, another construction of a Feller–Pareto (FP) variable is[16]

W ~ FP(μ, σ, Δ1, Δ2)라고 쓴다. 펠러-파레토 분포의 특별한 경우는 다음과 같다.

지수 분포와의 관계

파레토 분포는 다음과 같은 지수 분포와 관련이 있다. X가 최소 xm 지수 α로 파레토분산된 경우

속도 매개변수 α기하급수적으로 분포한다. 동등하게 Y가 비율 α로 기하급수적으로 분포하는 경우

파레토는 최소 xm 지수 α로 분배된다.

이는 표준 가변 변경 기법을 사용하여 확인할 수 있다.

마지막 식은 비율 α를 갖는 지수 분포의 누적 분포 함수다.

파레토 분포는 계층적 지수 분포로 구성할 수 있다.[17] ~ () ~ ( ) 그러면 ( )= (+ ) 2 p a}}, 결과 + ~ a가 있다

일반적으로 ~ ,) shape-rate parametrization) 및 ~ ( 그 다음 + ~ ,)

동등하게 ~ , 1) Y1 ~ ) X{\text 그 다음 + ) ~ ,

로그 정규 분포와의 관계

파레토 분포와 로그 정규 분포는 동일한 유형의 수량을 설명하기 위한 대체 분포다. 둘 사이의 연결점 중 하나는 둘 다 지수 분포정규 분포 각각 다른 공통 분포에 따라 분포된 랜덤 변수의 지수 분포라는 점이다. (이전 섹션 참조)

일반화된 파레토 분포와의 관계

파레토 분포는 일반화된 파레토 분포의 특수한 경우로서, 유사한 형태의 분포의 계열이지만, 분포의 지지도가 로맥스 분포와 함께 (변수 지점에서) 아래쪽으로 경계를 이루거나 (둘 다 가변 지점에서) 위아래로 경계를 이루거나 둘 다(둘 다 가변적인 경우)로 경계를 이루도록 추가 매개변수를 포함하고 있다.특례로 또한 이 패밀리는 부동 지수 분포와 시프트 지수 분포를 모두 포함한다.

The Pareto distribution with scale and shape is equivalent to the generalized Pareto distribution with location , scale and shape 반대로, 파레토 분포를 GPD에서 x = / / ξξ { { { { { { { { { { { \ α = 1 / \ \

바운드 파레토 분포

바운드 파레토
매개변수

> 위치(실제)
> 위치(실제)

> 모양(실제)
지원
PDF
CDF
평균


중앙값
분산

(이것은 분산이 아닌 두 번째 생모멘트)
왜도

(이것은 k번째 날 순간이지, 왜도가 아니다)

경계(또는 잘린) 파레토 분포에는 세 가지 모수가 있다: α, L, H. 표준 파레토 분포 α와 같이 형상을 결정한다. L은 최소값을 나타내며, H는 최대값을 나타낸다.

확률밀도함수는

x -- - ((H ) {\frac L{{H}}}}}}}}}}:{\alpha

여기서 LxHα > 0.

경계 Pareto 랜덤 변수 생성

U가 (0, 1)에 균일하게 분포되어 있으면 역변환법을 적용한다.

파레토에 분산된 경계선이야

대칭 파레토 분포

Symmetric Pareto 분포와 Zero Symmetric Pareto 분포의 목적은 날카로운 확률 피크와 대칭 긴 확률 꼬리로 이루어진 일부 특수 통계 분포를 포착하는 것이다. 이 두 분포는 파레토 분포에서 파생된 것이다. 일반적으로 긴 확률 꼬리는 확률이 천천히 감소한다는 것을 의미한다. 파레토 분포는 많은 경우에 피팅 작업을 수행한다. 그러나 분포가 대칭 구조로 되어 있고 두 개의 천천히 썩어가는 꼬리가 있다면 파레토는 그것을 할 수 없었다. 대신 Symmetric Pareto 또는 Zero Symmetric Pareto 분포를 적용한다.[19]

대칭 파레토 분포의 누적분포함수(CDF)는 다음과 같이 정의된다.[19]

해당 확률밀도함수(PDF)는 다음과 같다.[19]

이 분포에는 a와 b라는 두 개의 모수가 있다. 그것은 b에 의해 대칭이다. 그러면 수학적인 기대는 b이다. 다음과 같은 분산을 갖는 경우:

ZSP(Zero Symmetric Pareto) 분포의 CDF는 다음과 같이 정의된다.

해당 PDF:

이 분포는 0으로 대칭이다. 매개변수 a는 확률의 붕괴율과 관련되며 (a/2b)는 확률의 피크 크기를 나타낸다.[19]

다변량 파레토 분포

일변량 파레토 분포는 다변량 파레토 분포로 확장되었다.[20]

통계적 추론

모수 추정

독립 표본 x = (x1, x2, x, ..., xn)가 주어진 파레토 분포 모수 αxm 대한 우도 함수는

따라서 로그우도함수는

(, ) m x, 즉 x m 클수록 우도함수의 값이 단조롭게 증가하고 있음을 알 수 있다. 따라서 x ≥ x 이후로는m 다음과 같이 결론짓는다.

α에 대한 추정기를 찾기 위해 해당 부분파생물을 계산하여 0인 위치를 결정한다.

따라서 α에 대한 최대우도 추정기는 다음과 같다.

예상되는 통계 오류:[21]

말릭(1970년)[22]. 특히, x^ m{\displaystyle{\hat{)}}_{\mathrm{m}}}과α ^{\displaystyle{\hat{\alpha}}}과 x의 독립 ^ m{()^ m,α ^){\displaystyle({\hat{x}}_{\mathrm{m}},{\hat{\alpha}})}의 정확한 결합 분포 \display을 준다.styl은(는) 스케일 파라미터 xm 형상 파라미터 를 가진 파레토(Pareto)인 반면, (는) 형상 및 스케일 파라미터 n - 1과 함께 역감마 분포를 가진다.

신뢰구간

Treating as known (i.e. ) and using the result above by Malik (1970), the CDF of a Pareto(, ) distribution can be inverted to form a confidence interval for , i.e. CDF() = . Additionally, could be profiled. 즉, 각 가설 : x 0 을(를) 생성하는 제한된 귀무 공간 아래에서 d}을 다시 알려진 것으로간주한다. 단측 97.5% 신뢰 하한은 또는 그보다 극단적인 것의 위쪽 꼬리 확률이 2.5%인 x 대한 가설이다. A similar approach can be used to obtain a confidence interval for by inverting the CDF of an inverse-gamma distribution with shape and scale parameters and , respectively, i.e. CDF() = . The two-sided 95% confidence limits are the hypotheses for such that the one-sided probability of or 좀 더 극단적인 것은 2.5%이다.



발생 및 적용

일반

Vilfredo Pareto는 원래 이 분포를 개인들 간의 부의 배분을 묘사하기 위해 사용했다. 왜냐하면 그것은 사회의 부의 많은 부분이 그 사회의 더 작은 비율의 사람들에 의해 소유된다는 것을 오히려 잘 보여주는 것처럼 보였기 때문이다. 그는 또한 소득의 분배를 묘사하는 데 그것을 이용했다.[4] 이런 생각은 파레토 원칙이나 인구의 20%가 부의 80%를 지배한다는 '80-20 규칙'으로 더 단순하게 표현되기도 한다.[23] 그러나 80-20규칙은 α의 특정 값에 해당하며, 사실 파레토가 쿠르스 데코노미 정치에서 영국 소득세에 관한 자료를 보면 인구의 약 30%가 약 70%의 소득을 가지고 있음을 알 수 있다.[citation needed] 이 글의 앞부분의 확률밀도함수(PDF) 그래프를 보면 1인당 소량의 부를 소유한 인구의 "확률"이나 분수가 다소 높다가 재산이 증가함에 따라 꾸준히 감소한다는 것을 알 수 있다. (그러나 파레토 분포는 하층부의 재물에 대해서는 현실적이지 않다. 사실 순자산은 마이너스일 수도 있다.) 이러한 분포는 부나 소득을 기술하는 데 국한되지 않고, '소형'에서 '대형'으로의 분포에서 평형이 발견되는 많은 상황에 한정된다. 다음과 같은 예들이 때때로 대략적으로 파레토 유통으로 보여진다.

CumFreq를 사용하여 최대 1일 강우량에 적합된 누적 파레토(Lomax) 분포, 분포 피팅 참조
  • 유전에서의 석유 매장량 값(큰 몇 개, 작은 밭 여러 개)[24]
  • 슈퍼컴퓨터에 할당된 작업의 길이 분포(대형 몇 개, 소형 여러 개)[28]
  • 개별 주식의 표준화된 주가수익률
  • 모래 입자의 크기
  • 운석의 크기
  • 일반 책임, 상용 자동차 및 근로자 보상과 같은 특정 사업군에 대한 대규모 사상자 손실의 심각성.[29][30]
  • 스팀에서 사용자가 다른 게임을 하는 데 소비하는 시간. (일부 게임은 많이 하지만 대부분은 거의 하지 않는다.) [2][original research?]
  • 수문학에서 파레토 분포는 연간 최대 1일 강우량 및 하천 방류와 같은 극단적인 사건에 적용된다.[31] 파란색 그림은 파레토 분포를 연간 최대 1일 강우량에 맞추는 예를 보여 주며, 이항 분포를 기준으로 90% 신뢰 벨트를 보여준다. 강우 데이터는 누적 빈도 분석의 일부로 위치를 표시하여 나타낸다.
  • 전기 유틸리티 분배 신뢰성(고객 회의록의 80%가 해당 연도의 약 20%에 해당)

Zipf의 법칙과의 관계

파레토 분포는 연속 확률 분포다. 때때로 제타 분포라고도 불리는 Zipf의 법칙은 이산형 분포로, 값을 단순한 순위로 구분한다. 둘 다 음의 지수를 갖는 단순한 전력법칙으로, 누적 분포가 1. 값(수치)을 등급으로 고정하여 각 빈에 있는 사람 수가 1/순위 패턴을 따르도록 한다면 Zipf는 파레토 분포에서 파생될 수 있다. The distribution is normalized by defining so that where is the generalized harmonic number. 이것은 Zipf의 확률밀도함수를 파레토에서 도출할 수 있게 한다.

여기서 s= - 은 1부터 N까지의 순위를 나타내는 정수이며, N은 가장 높은 소득 계층이다. 따라서 모집단(또는 언어, 인터넷 또는 국가)에서 무작위로 선택한 사람( 단어, 웹사이트 링크 또는 도시)은 ( x) 의 순위 확률을 가진다

"파레토 원칙"과의 관계

The "80–20 law", according to which 20% of all people receive 80% of all income, and 20% of the most affluent 20% receive 80% of that 80%, and so on, holds precisely when the Pareto index is 1}. 이 결과는 아래에 주어진 로렌츠 곡선 공식에서 도출할 수 있다. 더욱이 다음은 수학적으로 동등한 것으로 나타났다[32].

  • 소득은 파레토 분포에 따라 지수 α > 1로 분배된다.
  • 전체 인구의 100p %가 전체 소득의 100(1 - p)%를 받고, 마찬가지로 모든 실질(정수 아님) n > 0에서 100pn %가 전체 소득의 100(1 - p)n 퍼센트를 받는 숫자 0이 있다. αp는 다음과 같다.

이는 소득에만 적용되는 것이 아니라 재산에도, 또는 이 분배에 의해 모델링될 수 있는 그 밖의 어떤 것에도 적용된다.

여기에는 위에서 언급한 바와 같이 0 < α α α 1이 무한 기대치를 가지므로 소득분배를 합리적으로 모형화할 수 없는 파레토 분배가 제외된다.

프라이스의 법칙과의 관계

프라이스의 제곱근법은 파레토 분포의 재산 또는 이와 유사한 재산으로 제공되기도 한다. 그러나 법은 = 인 경우에만 적용된다 이 경우 총 재산과 기대 재산액이 정의되지 않으며 규칙은 무작위 표본에만 점증적으로 적용된다는 점에 유의한다. 위에서 언급한 파레토 확대 원칙은 훨씬 더 일반적인 규칙이다.

로렌츠 곡선 및 지니 계수

로렌츠 곡선은 여러 파레토 분포에 대한 곡선이다. 사례 α = α는 완벽하게 동일한 분포(G = 0)에 해당하고, α = 1선은 완전한 불평등(G = 1)에 해당한다.

로렌츠 곡선은 종종 소득과 부의 분배를 특징짓는 데 사용된다. 모든 분포의 경우 로렌츠 곡선 L(F)은 PDF f 또는 CDF F의 관점에서 다음과 같이 기록된다.

여기서 x(F)는 CDF의 역이다. 파레토 분포를 위해서

로렌츠 곡선은

< α 의 경우 분모는 무한하며 L=0을 산출한다. 다수의 파레토 분포에 대한 로렌츠 곡선의 예는 오른쪽 그래프에 나와 있다.

옥스팜(2016년)에 따르면 세계에서 가장 부유한 62명은 세계 인구의 가장 가난한 절반에 버금가는 부를 갖고 있다.[33] 우리는 이 상황에 적용될 파레토 지수를 추정할 수 있다. ▼를 /( ) 지정:

또는

해결책은 α가 약 1.15와 같으며, 재산의 약 9%는 두 집단이 각각 소유하고 있다는 것이다. 그러나 실제로 세계 성인 인구의 69%가 재산의 약 3%만을 소유하고 있다.[34]

지니계수는 [0, 0]과 [1, 1]을 연결하는 선인 등분포선에서 로렌츠 곡선의 편차를 측정한 것으로, 오른쪽 로렌츠 플롯에서 검은색(α = α)으로 표시된다. 구체적으로 지니계수는 로렌츠 곡선과 등분포선 사이의 면적의 두 배다. 그런 다음 파레토 분포에 대한 지니계수를 계산한다( 1

(Aabberge 2005 참조).

계산 방법

랜덤 표본 생성

랜덤 표본은 역변환 샘플링을 사용하여 생성할 수 있다. 단위 간격(0, 1)의 균등 분포에서 무작위 변수 U를 구하면 다음과 같이 T를 구한다.

파레토 [35]배급이야 [0, 1]에 U를 균일하게 배분하면 (1 - U)와 교환할 수 있다.

참고 항목

참조

  1. ^ Amoroso, Luigi (1938). "VILFREDO PARETO". Econometrica (Pre-1986); Jan 1938; 6, 1; ProQuest. 6.
  2. ^ "Pareto". Merriam-Webster Dictionary. Retrieved 28 July 2019.
  3. ^ Pareto, Vilfredo (1898). "Cours d'economie politique". Journal of Political Economy. 6. doi:10.1086/250536.
  4. ^ Jump up to: a b 파레토, 빌프레도, 쿠르스 데코노미 폴리티크: 누벨 에듀케이션 파 G.-H. 부스케 외 G. 부시노, 리브라리 드로즈, 제네바, 1964, 페이지 299–345. 보관된 원본 책
  5. ^ VAN MONTFORT, M.A.J. (1986). "The Generalized Pareto distribution applied to rainfall depths". Hydrological Sciences Journal. 31 (2): 151–162. doi:10.1080/02626668609491037.
  6. ^ Oancea, Bogdan (2017). "Income inequality in Romania: The exponential-Pareto distribution". Physica A: Statistical Mechanics and Its Applications. 469: 486–498. Bibcode:2017PhyA..469..486O. doi:10.1016/j.physa.2016.11.094.
  7. ^ Morella, Matteo. "Pareto Distribution". academia.edu.
  8. ^ Jump up to: a b c d Barry C. Arnold (1983). Pareto Distributions. International Co-operative Publishing House. ISBN 978-0-89974-012-6.
  9. ^ S. Hussain, S.H. Batti(2018). Pareto 분포의 모수 추정: 일부 수정된 모멘트 추정기. 매조 국제 과학기술 저널 12:11-27
  10. ^ Eliazar, Iddo (November 2017). "Lindy's Law". Physica A: Statistical Mechanics and Its Applications. 486: 797–805. Bibcode:2017PhyA..486..797E. doi:10.1016/j.physa.2017.05.077.
  11. ^ Jump up to: a b Johnson NL, Kotz S, Balakrishnan N(1994) 연속 단변량 분포 Vol 1. Wiley 시리즈 확률 및 통계.
  12. ^ Jump up to: a b c d 존슨, 코츠, 발라크리쉬난(1994년), (20.4년).
  13. ^ Christian Kleiber & Samuel Kotz (2003). Statistical Size Distributions in Economics and Actuarial Sciences. Wiley. ISBN 978-0-471-15064-0.
  14. ^ Jump up to: a b Feller, W. (1971). An Introduction to Probability Theory and its Applications. II (2nd ed.). New York: Wiley. p. 50. "밀도(4.3)는 경제학자 파레토의 이름을 따서 부르기도 한다. 소득분배는 밀도가 있는 꼬리를 가져야 한다고 생각되었다. xAxα → ∞."
  15. ^ Lomax, K. S. (1954). "Business failures. Another example of the analysis of failure data". Journal of the American Statistical Association. 49 (268): 847–52. doi:10.1080/01621459.1954.10501239.
  16. ^ Chotikapanich, Duangkamon (16 September 2008). "Chapter 7: Pareto and Generalized Pareto Distributions". Modeling Income Distributions and Lorenz Curves. pp. 121–22. ISBN 9780387727967.
  17. ^ White, Gentry (2006). Bayesian semiparametric spatial and joint spatio-temporal modeling (Thesis thesis). University of Missouri--Columbia. 제5.3.1절
  18. ^ http://www.cs.bgu.ac.il/~mps042/httransnote.htm
  19. ^ Jump up to: a b c d Huang, Xiao-dong (2004). "A Multiscale Model for MPEG-4 Varied Bit Rate Video Traffic". IEEE Transactions on Broadcasting. 50 (3): 323–334. doi:10.1109/TBC.2004.834013.
  20. ^ Rootzén, Holger; Tajvidi, Nader (2006). "Multivariate generalized Pareto distributions". Bernoulli. 12 (5): 917–30. CiteSeerX 10.1.1.145.2991. doi:10.3150/bj/1161614952.
  21. ^ M. E. J. Newman (2005). "Power laws, Pareto distributions and Zipf's law". Contemporary Physics. 46 (5): 323–51. arXiv:cond-mat/0412004. Bibcode:2005ConPh..46..323N. doi:10.1080/00107510500052444. S2CID 202719165.
  22. ^ H. J. Malik (1970). "Estimation of the Parameters of the Pareto Distribution". Metrika. 15: 126–132. doi:10.1007/BF02613565. S2CID 124007966.
  23. ^ 인구의 약 18%가 재산의 82%를 소유하고 있는 2분위 모집단의 경우 테일 지수는 1을 취한다.
  24. ^ Jump up to: a b c d e Reed, William J.; et al. (2004). "The Double Pareto-Lognormal Distribution – A New Parametric Model for Size Distributions". Communications in Statistics – Theory and Methods. 33 (8): 1733–53. CiteSeerX 10.1.1.70.4555. doi:10.1081/sta-120037438. S2CID 13906086.
  25. ^ Reed, William J. (2002). "On the rank‐size distribution for human settlements". Journal of Regional Science. 42 (1): 1–17. doi:10.1111/1467-9787.00247. S2CID 154285730.
  26. ^ Schroeder, Bianca; Damouras, Sotirios; Gill, Phillipa (2010-02-24). "Understanding latent sector error and how to protect against them" (PDF). 8th Usenix Conference on File and Storage Technologies (FAST 2010). Retrieved 2010-09-10. We experimented with 5 different distributions (Geometric,Weibull, Rayleigh, Pareto, and Lognormal), that are commonly used in the context of system reliability, and evaluated their fit through the total squared differences between the actual and hypothesized frequencies (χ2 statistic). We found consistently across all models that the geometric distribution is a poor fit, while the Pareto distribution provides the best fit.
  27. ^ Yuji Ijiri; Simon, Herbert A. (May 1975). "Some Distributions Associated with Bose–Einstein Statistics". Proc. Natl. Acad. Sci. USA. 72 (5): 1654–57. Bibcode:1975PNAS...72.1654I. doi:10.1073/pnas.72.5.1654. PMC 432601. PMID 16578724.
  28. ^ Harchol-Balter, Mor; Downey, Allen (August 1997). "Exploiting Process Lifetime Distributions for Dynamic Load Balancing" (PDF). ACM Transactions on Computer Systems. 15 (3): 253–258. doi:10.1145/263326.263344. S2CID 52861447.
  29. ^ 클라이버와 코츠(2003): 페이지 94.
  30. ^ Seal, H. (1980). "Survival probabilities based on Pareto claim distributions". ASTIN Bulletin. 11: 61–71. doi:10.1017/S0515036100006620.
  31. ^ CumFreq, 누적 주파수 분석 및 확률 분포 피팅 소프트웨어 [1]
  32. ^ Hardy, Michael (2010). "Pareto's Law". Mathematical Intelligencer. 32 (3): 38–43. doi:10.1007/s00283-010-9159-2. S2CID 121797873.
  33. ^ "62 people own the same as half the world, reveals Oxfam Davos report". Oxfam. Jan 2016.
  34. ^ "Global Wealth Report 2013". Credit Suisse. Oct 2013. p. 22. Archived from the original on 2015-02-14. Retrieved 2016-01-24.
  35. ^ Tanizaki, Hisashi (2004). Computational Methods in Statistics and Econometrics. CRC Press. p. 133. ISBN 9780824750886.

메모들

외부 링크

  • syntraf1.c는 경계 Pareto 버스트 크기와 지수 인터버스트 시간으로 합성 패킷 트래픽을 생성하기 위한 C 프로그램이다.