포물선 프랙탈 분포
Parabolic fractal distribution확률과 통계에서 포물선 프랙탈 분포는 모집단 내 개체 빈도나 크기의 로그가 순위 1의 로그의 2차 다항식인 이산 확률 분포의 한 유형이다.이는 단순한 권한-법률 관계에 대한 적합성을 현저하게 개선할 수 있다(아래 참조).null
아래의 Laherere/Deheuvels 논문에서는 은하 크기(명암으로 정렬됨), 마을(미국, 프랑스, 세계), 세계의 구어(연사자 수 기준), 세계의 유전(크기 기준) 등이 예시된다.그들은 또한 적합 지진 사건(예는 없음)에서 이 분포의 효용을 언급한다.저자들은 이 분포의 이점은 모델링되는 모집단의 가장 큰 알려진 예를 사용하여 적합할 수 있다는 것이며, 이는 흔히 쉽게 구할 수 있고 완전하다는 것이다. 그러면 발견된 적합 매개변수를 전체 모집단의 크기를 계산하는 데 사용할 수 있다.그래서 예를 들어, 지구상에서 가장 큰 도시 100개의 개체수를 분류하고 맞출 수 있으며, 가장 작은 마을로 추정하는 데 사용되는 변수들이 행성의 개체수를 추정하기 위해 사용된다.또 다른 예는 가장 큰 밭을 이용하여 세계 석유 매장량을 추정하는 것이다.null
다수의 응용에서 상위 항목이 다른 항목을 기준으로 예측하는 것보다 훨씬 큰 빈도나 크기를 갖는 이른바 킹 효과가 있다.Laherere/Deheuvels 논문은 프랑스의 도시 크기를 분류할 때 파리의 예를 보여준다.논문이 작성되었을 때 파리는 약 천만 명의 주민이 사는 가장 큰 도시였지만, 다음으로 큰 도시는 약 150만 명에 불과했다.파리를 제외한 프랑스의 도시들은 포물선 분포에 가깝고, 56개의 큰 도시들이 파리의 인구를 매우 잘 추정할 만큼 잘 따르고 있다.그러나 그 분포는 가장 큰 도시가 천만 명이 아니라 200만 명 정도 거주할 것으로 예측될 것이다.킹 효과(King Effect)는 왕이 왕위를 위해 모든 경쟁자를 물리치고 그들의 재산, 재산, 권력을 빼앗아야 한다는 생각에서 이름을 따온 것으로, 자신과 신하들 사이에 완충제를 만들어낸다.그러한 특정 효과(의도적으로 창출된)는 대기업들이 그들의 부를 사용하여 소규모 경쟁상대를 매수하는 기업 규모에 적용될 수 있다.의도하지 않은 경우, 킹 효과는 규모 또는 고유한 이점 때문에 지속적인 성장 우위의 결과로 발생할 수 있다.대도시들은 사람들, 재능 그리고 다른 자원들의 더 효율적인 연결고리들이다.독특한 장점으로는 항구 도시, 법이 만들어지는 수도 또는 물리적 근접성이 기회를 증가시키고 피드백 루프를 만드는 활동의 중심지가 될 수 있다.영화산업이 그 한 예다. 배우, 작가, 그리고 다른 노동자들이 가장 많은 스튜디오가 있는 곳으로 옮겨가고, 가장 많은 재능이 있는 곳이기 때문에 새로운 스튜디오가 같은 장소에 설립되는 것이다.null
킹 효과에 대해 테스트하려면 최상위 항목인 'k'를 제외하고 나머지 모집단 구성원에게 새 순위 번호를 할당하지 않고 분포를 적합시켜야 한다.예를 들어, 프랑스의 등급은 (2010년 기준)이다.null
- 파리, 12.09M
- 리용, 2.12M
- 마르세유, 1.72M
- 툴루즈, 1.20M
- 릴, 1.15M
적합 알고리즘은 쌍 {(1,12.09), (2,2.12), (3,1.72), (4,1.20), (5,1.15)}을 처리하고 이러한 점을 통해 최적의 포물선 적합에 대한 파라미터를 찾는다.킹 효과를 테스트하기 위해 첫 번째 쌍(또는 첫 번째 'k' 쌍)을 제외하고 나머지 점들에 맞는 포물선 매개변수를 찾는다.그래서 프랑스를 위해 우리는 4개의 포인트 {(2,2.12, 3,1.72, (4,1.20), (5,1.15)}을 맞출 것이다.그러면 우리는 그 매개변수를 사용하여 [1,k] 등급의 도시의 크기를 추정하고 그들이 킹 이펙트 회원인지 아니면 정상 회원인지를 결정할 수 있다.null
이에 비해 Zipf의 법칙은 점들을 통과하는 선(또한 순위 로그와 값의 로그 사용)에 적합하다.파라볼라(매개변수가 하나 더 있음)는 더 잘 맞겠지만, 파라볼라 역시 정점에서 멀리 떨어져서 거의 선형이다.따라서 통계학자에 대한 판단 요구 사항이기는 하지만 적합된 매개변수가 정점을 적합점으로부터 멀리 떨어지게 하거나 포물선 곡선이 선보다 유의하게 더 잘 적합되지 않으면 과충치(과다변수)의 증상일 수 있다.(3개 대신 2개의 매개변수를 갖는) 선은 아마도 더 나은 일반화일 것이다.더 많은 모수가 항상 더 잘 적합하지만 설명되지 않은 모수나 근거 없는 가정을 추가하는 비용(예: 약간의 포물선 곡선이 선보다 더 적절한 모형이라는 가정)에서 더 잘 적합하다.null
또는 장착된 포물선을 1위 위치에 오도록 강제할 수 있다.이 경우 포물선이 직선보다 더 잘 맞을지 확실하지 않으며(오차가 적을지), 오차가 가장 적은 두 가지 중에서 선택할 수 있다.null
정의
확률 질량 함수는 n등급의 함수로 다음과 같이 주어진다.
여기서 b와 c는 분포의 모수다.null
참고 항목
참조
- Laherrère J, Deheuvels P (1996) "Distributions de type 'fractal parabolique' dans la nature" (French, with English summary: "Parabolic fractal" distributions in nature), (http://www.hubbertpeak.com/laherrere/fractal.htm) Comptes rendus de l'Académie des sciences, Série II a: Sciences de la Terre et des Planétes, 322, (7), 535–541
- Xie, S.; Yang, Y. G.; Bao, Z. Y.; Ke, X. Z.; Liu, X. L. (2009). "Mineral resource analysis by parabolic fractals". Mining Science and Technology (China). 19: 91–96. doi:10.1016/S1674-5264(09)60017-X.