최소 제곱 스펙트럼 분석

Least-squares spectral analysis
데이터 점 집합을 2차 함수로 적합시킨 결과

최소 제곱 스펙트럼 분석(LSSA)은 푸리에 [1][2]분석과 유사하게 데이터 샘플에 대한 사인파최소 제곱 적합도를 기반으로 주파수 스펙트럼을 추정하는 방법입니다.과학에서 가장 많이 사용되는 스펙트럼 방법인 푸리에 분석은 일반적으로 긴 갭 기록에서 장기 노이즈를 증가시킨다. LSSA는 이러한 [3]문제를 완화한다.푸리에 분석과 달리 LSSA를 사용하기 위해 데이터를 균등하게 배치할 필요는 없습니다.

LSSA는 페트르 바니체크 이후 바니체크[4] 방법 또는 가우스-바니체크[5] 방법으로도 알려져 있으며, 니콜라스 R.의 공헌에 기초[3] 롬브 방법 또는 롬브-스카르글 [2][6]주기문자로도 알려져 있다.롬브와 제프리 D.입니다[7]스카글.[8]

이력

사인파의 푸리에 분석, 주기율 및 최소 제곱 피팅 사이의 밀접한 연관성은 오랫동안 [9]알려져 왔다.그러나 대부분의 개발은 동일한 간격의 샘플의 데이터 세트를 완성하도록 제한됩니다.1963년, Freek J.M.Barning Mathematisch 센터, 암스테르담과 비슷한 techniques,[10]에 의해 현재는도록 법 언급되는 위한 periodogram 분석, 그리고 sinusoids 그런 periodograms에서 결정되는 선택된 주파수, 지금은 절차에 의해 연결되어의 피팅 least-squares 등 불평등하게 간격을 둔 데이터를 처리했다. kn포스트[11] 백핏 또는 직교 매칭 [12]추구와 일치하는 추구로 소유합니다.

뉴브런즈윅 대학의 캐나다 측지학자페트르 바니체크도 [13]1969년에 "연속 스펙트럼 분석"이라고 불렀고, 그 결과를 동일하고 균일한 간격으로 데이터를 갖는 "최소 제곱 주기율"이라고 제안했다.그는 이 방법을 "예측된 선형(2차, 지수, ...) 크기를 알 수 없는 장기 추세"와 같은 단순한 평균을 초과하는 체계적 구성요소를 설명하기 위해 일반화했고 [14]1971년에 이를 다양한 표본에 적용했다.

그 후 1976년 니콜라스 R.에 의해 바니체크 방법이 단순화되었다.시드니 대학의 롬브 교수는 주기도 [7]분석과 밀접한 관련이 있다고 지적했다.불규칙한 간격의 데이터의 주기그램의 정의는 이후 Jeffrey D에 의해 추가로 수정되고 분석되었다.NASA 에임스 연구 [8]센터의 스카글은 작은 변화만으로도 개별 정현파 주파수를 맞추기 위한 롬의 최소 제곱 공식과 동일하게 만들 수 있다는 것을 보여주었다.

스카글은 그의 논문이 "새로운 검출 기술을 도입하는 것이 아니라 관측 시간이 불균일할 경우 가장 일반적으로 사용되는 기술인 주기율표를 사용하여 검출의 신뢰성과 효율성을 연구한다"고 밝히고, 더 나아가 주기에 비해 사인파의 최소 제곱 적합성을 지적한다.그의 논문이 "이 두 가지 방법이 (제안된 수정사항으로) 정확히 [8]동일하다는 것을 분명히 처음으로 확립한다"는 dogram 분석.

Press는[3] 다음과 같이 개발을 요약합니다.

불규칙하게 추출된 데이터에 대한 완전히 다른 스펙트럼 분석 방법, 즉 이러한 어려움을 완화시키고 다른 매우 바람직한 특성을 가진 방법은 부분적으로 Barning과 Vanicek의 초기 연구를 기반으로 롬바르에 의해 개발되었으며 Scargle에 의해 추가로 상세하게 설명되었다.

1989년 온타리오 킹스턴에 있는 퀸즈 대학의 마이클 J. 코렌버그는 나중에 직교 일치 추구로 알려지게 된 기술과 유사하게 스펙트럼이나 다른 [15]문제의 거의 최적의 분해를 더 빨리 찾는 "빠른 직교 검색" 방법을 개발했다.

메서드 바리안트

바니체크법

바니체크 방법에서 이산 데이터 세트는 표준 선형 회귀 또는 최소 제곱 [16]적합을 사용하여 순차적으로 결정된 주파수의 사인파 가중치 합계에 의해 근사된다.주파수는 Barning과 유사한 방법을 사용하여 선택되지만 최소 제곱 피팅 후 잔류 주파수를 최소화하는 주파수(현재는 프리백[11] 피팅으로 알려진 피팅 기법과 동일)를 선택하여 새로운 각 연속 주파수 선택을 더욱 최적화합니다.사인파 수는 데이터 샘플 수보다 작거나 같아야 합니다(별도의 사인파와 주파수가 같은 사인파 및 코사인 계수).

데이터 벡터 δ는 정현파 기저함수의 가중치 합계로 나타나며, 각 함수는 표본시 평가하여 매트릭스 A에 표로 가중치 벡터 x:

여기서 무게 벡터 x는 근사 δ에서 오차 제곱의 합을 최소화하기 위해 선택됩니다.x에 대한 해는 표준 [17]선형 회귀 분석을 사용하는 닫힌 형식입니다.

여기서 행렬 A는 표본 시간에 평가할 때 상호 독립적인 함수 집합(반드시 직교할 필요는 없음)에 기초할 수 있습니다. 스펙트럼 분석의 경우 일반적으로 관심 주파수 범위에 고르게 분포된 사인 및 코사인입니다.너무 좁은 주파수 범위에서 너무 많은 주파수를 선택하면 기능이 충분히 독립적이지 않고 매트릭스의 상태가 나빠지며 결과적으로 발생하는 스펙트럼은 [17]의미가 없습니다.

A의 기저 함수가 직교하는 경우(즉, 열의 쌍별 점곱이 0임을 의미함), 행렬T AA는 대각 행렬입니다. 모든 열의 검정력(원소의 제곱합)이 같으면 행렬은 항등 행렬에 상수를 곱한 것이므로 반전이 작습니다.후자는 샘플 시간이 균등하게 간격을 두고 사인파 및 코사인파(sinsoids)를 샘플당 주파수 간격 0에서 반주기까지 쌍으로 균등하게 간격을 두는 경우입니다(샘플당 1/N 사이클 간격, 사인파 위상은 0에서 제외되고 최대 주파수는 0에서 제외됨). 특별한 경우를 이산 푸리에 변환이라고 하며, 실제 데이터와 [17]계수의 관점에서 약간 다시 씁니다.

{ x = (스칼라 계수 내 N개의 균일한 간격의 샘플과 빈도에 대한 DFT 케이스)

롬브법

이후 sinusoids의 쌍 사이의 상관 관계 종종, 적어도 사람들이 너무 밀접하게 스파지 않다 작다 1976년[7](더 이상 문제가)의 Vaníček 법의 계산적 부담을 낮추려다가,도록 일반적으로 위의 간소화를 사용하면 같은 주파수의 정현 및 여현 기지 사이에 pair-wise 상관 관계를 제외하고 제안했다.ced이것은 기본적으로 전통적인 주기율표 형식이지만, 현재는 간격이 고르지 않은 샘플에 사용하기 위해 채택되었습니다.벡터 x는 기본 스펙트럼의 좋은 추정치이지만 상관관계가 무시되기 때문에 Ax는 더 이상 신호에 대한 좋은 근사치가 아니며 방법은 더 이상 최소 제곱 방법이 아니지만 계속 그렇게 언급되고 있습니다.

Skargle은 사인 파형과 코사인 파형으로 데이터의 도트곱을 직접 취하는 대신 표준 주기율 공식을 수정하여 먼저 시간 지연(\ 찾아 이 사인파가 샘플 j에서 상호 직교하고 전위치에 맞게 조정했습니다.이 두 기본 함수의 거듭제곱은 주파수에 대한 더 나은 검정력을 얻기 위해 Lly 불평등하며,[3][8] 이는 그의 수정된 주기율법을 롬브롬의 방법과 정확히 동등하게 만들었다. 지연{\(\ 다음 공식으로 정의됩니다.

주파수(\에서의 주기도는 다음과 같이 추정됩니다.

Scargle이 보고하는 통계 분포는 균등하게 샘플링된 [8]사례의 주기도와 동일합니다.

이 방법은 개별 주파수(\에서 해당 주파수의 사인파, 형식의 사인파(synosoid)에 적합한 최소 제곱과 동일한 전력을 제공합니다.

[18]

일반화 롬브-스카글 주기그램

표준 롬브-스카글 주기도는 평균이 0인 모델에 유효하다.일반적으로 이 값은 주기율표를 계산하기 전에 데이터의 평균을 빼서 근사치를 구합니다.그러나 모형(적합된 사인파)의 평균이 0이 아닌 경우에는 부정확한 가정입니다.일반화 롬브-스카르글 주기율표는 이러한 가정을 제거하고 평균에 대해 명시적으로 해결한다.이 경우 장착된 기능은 다음과 같습니다.

[19]

일반화 롬브-스카글 주기도는 부동평균 주기그램이라고[20]한다.

Korenberg의 "고속 직교 검색" 방법

온타리오주 킹스턴에 있는 퀸즈 대학의 마이클 코렌버그는 스펙트럼 분석을 위한 사인파 성분과 같은 지나치게 완전한 집합에서 고속 직교 검색(FOS)이라고 불리는 성분의 희박한 집합을 선택하는 방법을 개발했다.수학적으로 FOS는 약간 수정된 콜레스키 분해를 평균 제곱 오차 감소(MSER) 프로세스에서 사용하며, 이는 스파스 매트릭스 [15][21]반전으로 구현됩니다.다른 LSSA 방법과 마찬가지로 FOS는 이산 푸리에 분석의 주요 단점을 회피하고 내장된 주기성의 고정밀 식별을 달성할 수 있으며 불규칙한 간격의 데이터로 탁월하다. 고속 직교 검색 방법은 비선형 시스템 식별과 같은 다른 문제에도 적용되어 왔다.

팔머의 카이 제곱법

Palmer는 선택된 수의 고조파에 가장 적합한 함수를 찾는 방법을 개발하여 사인파 이외의 [22]고조파 함수를 더 자유롭게 찾을 수 있게 했습니다.이 방법은 균일하지 않은 표준 오류가 있는 임의 간격 데이터에 대해 가중 최소 제곱 분석을 수행하기 위한 빠른 기술(FFT 기반)입니다.이 기술을 구현하는 소스 코드를 사용할 [23]수 있습니다.데이터는 종종 균일한 간격으로 개별 시간에 표본 추출되지 않으므로 이 방법은 표본 시간에 시계열 배열을 희박하게 채워 데이터를 "눈금"합니다.간섭하는 모든 그리드 포인트는 0의 통계적 가중치를 받는데, 이는 표본 사이에 무한 오차 막대가 있는 것과 같습니다.

적용들

LSSA 방법의 가장 유용한 기능은 레코드를 조작하거나 존재하지 않는 데이터를 발명할 필요 없이 불완전한 레코드를 스펙트럼으로 분석할 수 있도록 하는 것입니다.

LSSA 스펙트럼의 크기는 시계열[13]분산에 대한 주파수 또는 주기의 기여도를 나타낸다.일반적으로 위와 같이 정의된 스펙트럼 크기는 출력의 간단한 유의 수준 [24]상태를 가능하게 한다.또는 바니체크 스펙트럼의 크기는 [25]dB로도 표시할 수 있다.바니체크 스펙트럼의 크기는 [26]β 분포를 따른다.

정방향 변환을 행렬로 쓰면 가장 쉽게 알 수 있듯이, 바니체크의 LSSA 역변환이 가능하다. 행렬 역변환(행렬이 단수가 아닐 때) 또는 유사 역변환이 된다. 만약 선택된 정현동체가 샘플 포인에서 서로 독립적이라면, 역변환은 원래의 데이터와 정확히 일치할 이다.ts 및 그 수는 데이터 [17]포인트 수와 동일합니다.주기율법에는 이러한 역순서가 알려져 있지 않다.

실행

LSSA는 MATLAB [27]코드 페이지 미만으로 구현할 수 있습니다.요점은 [16]다음과 같습니다.

"최소한의 스펙트럼을 계산하려면 m개의 스펙트럼 을 계산해야 합니다...다른 주파수에 대한 [스펙트럼 파워]를 얻기 위해 매번 m회 최소값의 근사치를 수행해야 한다."

즉, 원하는 주파수 세트의 각 주파수에 대해 사인 및 코사인 함수는 데이터 샘플에 대응하는 시간에 평가되며, 사인 벡터를 가진 데이터 벡터의 닷 을 취하여 적절히 정규화한다.롬/스카글로그래픽으로 알려진 방법에 따라 각 주파수에 대해 시간 이동이 계산된다.Craymer에서 [17]설명한 대로 사인 성분과 코사인 성분을 도트 곱 앞에 직교시킵니다. 마지막으로 두 진폭 성분에서 전력이 계산됩니다.이 프로세스는 데이터가 시간 간격이 균일하고 선택된 주파수가 유한 데이터 레코드의 주기 정수 수에 해당하는 경우 이산 푸리에 변환을 구현합니다.

이 방법은 각 사인파 성분이 데이터 포인트에서 직교하지 않더라도 독립적으로 또는 문맥을 벗어나서 처리됩니다. Vanichek의 원래 방법입니다.이와는 대조적으로, Craymer가 설명하듯이, 매트릭스 방정식을 풀고 지정된 사인 주파수 [17]간에 총 데이터 분산을 분할함으로써 완전한 동시 또는 컨텍스트 최소 제곱 적합을 수행하는 것도 가능하다.이러한 행렬 최소 제곱 솔루션은 기본적으로 MATLAB에서 백슬래시 [28]연산자로 사용할 수 있습니다.

Craymer는 Romb로 인한 주기율 버전뿐만 아니라 독립적인 버전이나 컨텍스트 외 버전과는 달리 동시 또는 컨텍스트 내 방법은 데이터 샘플보다 더 많은 구성 요소(사인 및 코사인)를 포함할 수 없으며,[17] 더 나아가 다음과 같이 설명합니다.

"...선택한 주파수로 인해 일부 푸리에 성분(트리거 함수)이 서로 거의 선형적으로 종속되어 조건이 맞지 않거나 단수 N에 가까운 경우 심각한 영향이 발생할 수도 있습니다.이러한 잘못된 조건을 피하려면 추정할 다른 주파수 세트를 선택하거나(예: 균일한 간격의 주파수) N의 상관관계를 무시하고(즉, 오프 대각 블록) 개별 주파수에 대해 역 최소 제곱 변환을 별도로 추정해야 한다.."

한편 롬브롬의 주기율법은 표준 주기율도와 같이 임의로 많은 주파수 성분 또는 밀도를 사용할 수 있다.즉, 주파수 영역을 임의의 인자에 의해 [3]오버샘플링할 수 있다.

푸리에 변환 또는 이산 푸리에 변환과 같은 푸리에 분석에서, 데이터에 적합되는 사인파들은 모두 상호 직교하기 때문에, 기본 함수에 대한 단순한 문맥 외 도트곱 기반 투영과 문맥 내 동시 최소 제곱 적합 사이에 차이가 없다; 즉, 행렬 반전은 없다.다른 주파수의 [29]직교 사인파 사이의 분산을 최소 분할하는 데 필요합니다.이 방법은 일반적으로 간격이 동일한 완전한 데이터 레코드를 사용할 수 있는 경우 효율적인 고속 푸리에 변환 구현을 위해 선호됩니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Cafer Ibanoglu (2000). Variable Stars As Essential Astrophysical Tools. Springer. ISBN 0-7923-6084-2.
  2. ^ a b D. Scott Birney; David Oesper; Guillermo Gonzalez (2006). Observational Astronomy. Cambridge University Press. ISBN 0-521-85370-2.
  3. ^ a b c d e Press (2007). Numerical Recipes (3rd ed.). Cambridge University Press. ISBN 978-0-521-88068-8.
  4. ^ J. Taylor; S. Hamilton (20 March 1972). "Some tests of the Vaníček Method of spectral analysis". Astrophysics and Space Science. 17 (2): 357–367. Bibcode:1972Ap&SS..17..357T. doi:10.1007/BF00642907. S2CID 123569059.
  5. ^ M. Omerbashich (26 June 2006). "Gauss-Vanicek spectral analysis of the Sepkoski compendium: no new life cycles". Computing in Science & Engineering. 8 (4): 26–30. arXiv:math-ph/0608014. Bibcode:2006CSE.....8d..26O. doi:10.1109/MCSE.2006.68.
  6. ^ Hans P. A. Van Dongen (1999). "Searching for Biological Rhythms: Peak Detection in the Periodogram of Unequally Spaced Data". Journal of Biological Rhythms. 14 (6): 617–620. doi:10.1177/074873099129000984. PMID 10643760. S2CID 14886901.
  7. ^ a b c Lomb, N. R. (1976). "Least-squares frequency analysis of unequally spaced data". Astrophysics and Space Science. 39 (2): 447–462. Bibcode:1976Ap&SS..39..447L. doi:10.1007/BF00648343. S2CID 2671466.
  8. ^ a b c d e Scargle, J. D. (1982). "Studies in astronomical time series analysis. II - Statistical aspects of spectral analysis of unevenly spaced data". Astrophysical Journal. 263: 835. Bibcode:1982ApJ...263..835S. doi:10.1086/160554.
  9. ^ David Brunt (1931). The Combination of Observations (2nd ed.). Cambridge University Press.
  10. ^ Barning, F. J. M. (1963). "The numerical analysis of the light-curve of 12 Lacertae". Bulletin of the Astronomical Institutes of the Netherlands. 17: 22. Bibcode:1963BAN....17...22B.
  11. ^ a b Pascal Vincent; Yoshua Bengio (2002). "Kernel Matching Pursuit" (PDF). Machine Learning. 48: 165–187. doi:10.1023/A:1013955821559.
  12. ^ Y. C. Pati, R. Rezaiifar 및 P. S. Krishnaprasad, "직교 일치 추구:웨이브릿 분해 애플리케이션을 사용한 재귀 함수 근사치." 제27회 신호, 시스템컴퓨터에 관한 Asilomar Conference, A.Singh, ed., Los Alamitos, CA, 미국, IEEE Computer Society Press, 1993년
  13. ^ a b Vaníček, P. (1969). "Approximate spectral analysis by least-squares fit". Astrophysics and Space Science. 4 (4): 387–391. Bibcode:1969Ap&SS...4..387V. doi:10.1007/BF00651344. S2CID 124921449.
  14. ^ Vaníček, P. (1971). "Further development and properties of the spectral analysis by least-squares". Astrophysics and Space Science. 12 (1): 10–33. Bibcode:1971Ap&SS..12...10V. doi:10.1007/BF00656134. S2CID 109404359.
  15. ^ a b Korenberg, M. J. (1989). "A robust orthogonal algorithm for system identification and time-series analysis". Biological Cybernetics. 60 (4): 267–276. doi:10.1007/BF00204124. PMID 2706281. S2CID 11712196.
  16. ^ a b 웰스, D.E., P. 바니체크, S. 파지아타키스, 1985.최소 제곱 스펙트럼 분석을 다시 검토했다.측량 공학부 기술 보고서 84, Fredericton 뉴브런즈윅 대학, 68페이지, [1]에서 구할 수 있습니다.
  17. ^ a b c d e f g Craymer, M.R., 최소 제곱 스펙트럼, 역변환 및 자기 상관 함수: 지리학 박사 과정에서의 이론과 응용논문, 캐나다 토론토 대학교(1998).
  18. ^ William J. Emery; Richard E. Thomson (2001). Data Analysis Methods in Physical Oceanography. Elsevier. ISBN 0-444-50756-6.
  19. ^ M. Zechmeister; M. Kürster (March 2009). "The generalised Lomb–Scargle periodogram. A new formalism for the floating-mean and Keplerian periodograms". Astronomy & Astrophysics. 496 (2): 577–584. arXiv:0901.2573. Bibcode:2009A&A...496..577Z. doi:10.1051/0004-6361:200811296. S2CID 10408194.
  20. ^ Andrew Cumming; Geoffrey W. Marcy; R. Paul Butler (December 1999). "The Lick Planet Search: Detectability and Mass Thresholds". The Astrophysical Journal. 526 (2): 890–915. arXiv:astro-ph/9906466. Bibcode:1999ApJ...526..890C. doi:10.1086/308020. S2CID 12560512.
  21. ^ Korenberg, Michael J.; Brenan, Colin J. H.; Hunter, Ian W. (1997). "Raman Spectral Estimation via Fast Orthogonal Search". The Analyst. 122 (9): 879–882. Bibcode:1997Ana...122..879K. doi:10.1039/a700902j.
  22. ^ Palmer, David M. (2009). "A Fast Chi-squared Technique For Period Search of Irregularly Sampled Data". The Astrophysical Journal. 695 (1): 496–502. arXiv:0901.1913. Bibcode:2009ApJ...695..496P. doi:10.1088/0004-637X/695/1/496. S2CID 5991300.
  23. ^ "David Palmer: The Fast Chi-squared Period Search".
  24. ^ Beard, A.G., Williams, P.J.S., Mitchell, N.J. & Muller, H.G. 행성 파도와 조수의 변동성에 대한 특별한 기후학, J Atm.솔라-터물리 63 (09), 페이지 801 ~811 (2001)
  25. ^ Pagiatakis, S. 최소 제곱 스펙트럼에서 피크의 확률적 유의성, Geodesy 73, 페이지 67-78(1999)
  26. ^ Steeves, R.R. 최소 제곱 스펙트럼의 피크 유의성에 대한 통계 테스트, 에너지, 광산 및 자원부, 측량 및 매핑, 캐나다 오타와, 페이지 149-166(1981)
  27. ^ Richard A. Muller; Gordon J. MacDonald (2000). Ice Ages and Astronomical Causes: Data, spectral analysis and mechanisms (1st ed.). Springer Berlin Heidelberg. Bibcode:2000iaac.book.....M. ISBN 978-3-540-43779-6. OL 20645181M. Wikidata Q111312009.
  28. ^ Timothy A. Davis; Kermit Sigmon (2005). MATLAB Primer. CRC Press. ISBN 1-58488-523-8.
  29. ^ Darrell Williamson (1999). Discrete-Time Signal Processing: An Algebraic Approach. Springer. ISBN 1-85233-161-5.

외부 링크