자기회귀이동평균모형

Autoregressive moving-average model

시계열통계적 분석에서 자기회귀-이동평균(ARMA) 모델 (약하게) 고정 확률 과정을 두 다항식, 즉 자기회귀(AR)와 이동평균(MA)에 대한 두 번째 다항식으로 간결하게 설명합니다. 일반적인 ARMA 모델은 Peter Whittle의 1951년 논문, 시계열 분석에서의 가설 검정에서 기술되었으며, 1970년 George E. P. BoxGwilym Jenkins에 의해 대중화되었습니다.

데이터 의 시계열을 고려할때, ARMA 모델은 이 시리즈의 미래 가치를 이해하고 예측하기 위한 도구입니다. AR 부분은 변수를 시차(즉, 과거) 값으로 회귀시키는 것을 포함합니다. MA 부분은 오류항을 과거의 여러 시간에 동시에 발생한 오류항의 선형 조합으로 모델링하는 것을 포함합니다. 이 모델은 일반적으로 ARMA(p,q) 모델이라고 합니다. 여기서 p는 AR 부품의 순서이고 q는 MA 부품의 순서입니다(아래 정의된 대로).

ARMA 모형은 Box-Jenkins 방법을 사용하여 추정할 수 있습니다.

자기회귀모형

표기법 AR(p)은 순서 p의 자기 회귀 모델을 나타냅니다. AR(p) 모델은 다음과 같이 기록됩니다.

여기서φ 1, φ p ,\varphi_{p}는 매개 변수이고 변수 ε t displaystyle \varepsilon_{t}}는 일반적으로 독립적이고 동일하게 분포(, 동일하게)되는 정규 랜덤 변수입니다.

모형정지 상태를 유지하려면 특성 다항식의 뿌리가 단위 원의 바깥에 있어야 합니다. 예를 들어 φ 1 ≥ {\1} \geq 1}이(가) 있는 AR(1) 모델의 공정은 1 - φ 1 B = 0 varphi_{1}B=0}의 루트가 단위 원 내에 있기에 정지 상태가 아닙니다.

ADF는 IMF의 안정성과 추세 요소를 평가합니다. 정지 시계열의 경우 자기 회귀 이동 평균(ARMA) 모델이 사용되는 반면, 비정지 시계열의 경우 LSTM 모델을 사용하여 추상적인 특징을 도출합니다. 각 시계열의 예측 결과를 재구성하여 최종 값을 얻습니다.

이동평균모형

MA(q) 표기법은 q차의 이동 평균 모델을 나타냅니다.

θ 1, θ qdisplaystyle \}, ...,\theta _{q}는 변수이고,displaystyle \mu }는 X t X_{t}(종종과 같게 가정)의이며, ε t {\displaystyle varepsilon _{t}, t - 1 {\displaystyle \varepsilon _{t-1}}, ...은 일반적으로 정규 랜덤 변수인 백색 잡음 오류 항입니다.

ARMA모델

ARMA(p, q) 표기법은 자기회귀항q 이동평균항이 있는 모형을 의미합니다. 이 모델에는 AR(p) 및 MA(q) 모델이 포함됩니다.[5]

일반적인 ARMA 모델은 1951년 피터 휘틀(Peter Whittle)의 논문에서 설명되었는데, 그는 수학적 분석(Laurent series and Fourier analysis)과 통계적 추론을 사용했습니다.[6][7] ARMA 모델은 George E. P. Box와 Jenkins가 1970년에 발표한 책에 의해 대중화되었는데, 그는 그 모델들을 선택하고 추정하는 반복적인 (Box–Jenkins) 방법을 설명했습니다. 이 방법은 3차 이하의 저차 다항식에 유용했습니다.[8]

ARMA 모델은 기본적으로 백색 잡음에 적용되는 무한 임펄스 응답 필터이며, 몇 가지 해석이 추가로 적용됩니다.

lag 연산자 규격

일부 텍스트에서는 시차 연산자 L을 기준으로 모델이 지정됩니다. 이러한 항에서 AR(p) 모델은 다음과 같습니다.

여기서φ \varphi}는 다항식을 나타냅니다.

MA(q) 모델은 다음과 같습니다.

여기서θ \theta}는 다항식을 나타냅니다.

마지막으로, 결합된 ARMA(p, q) 모델은 다음과 같이 주어집니다.

또는 좀 더 간결하게,

아니면

대체 표기법

Box, Jenkins & Reinsel을 포함한 일부 저자는 자기 회귀 계수에 대해 다른 규칙을 사용합니다.[9] 이를 통해 시차 연산자를 포함하는 모든 다항식이 전체적으로 유사한 형태로 나타날 수 있습니다. 따라서 ARMA 모델은 다음과 같이 기록됩니다.

Moreover, starting summations from and setting and , then we get an even more elegant formulation:

대체해석

디지털 신호 처리에서 ARMA 모델은 입력에서 백색 잡음을, 출력에서 ARMA 프로세스를 갖는 디지털 필터로 표현됩니다.

피팅 모델

p와 q 선택

ARMA(p,q) 모형에서 pq의 적절한 값을 찾는 것은 p의 추정치에 대한 부분 자기 상관 함수를 표시하고 마찬가지로 q의 추정치에 대한 자기 상관 함수를 사용하여 용이하게 할 수 있습니다. 확장 자기 상관 함수(EACF)를 사용하여 p와 q를 동시에 결정할 수 있습니다.[10] pq의 초기 선택에 적합된 모형의 잔차에 대해 동일한 함수를 고려하여 추가 정보를 얻을 수 있습니다.

Brockwell & Davis는 pq를 찾기 위해 Aikke 정보 기준(AIC)을 사용할 것을 권장합니다.[11] 순서 결정의 또 다른 가능한 선택은 BIC 기준입니다.

계수 추정

일반적으로 ARMA 모형은 pq를 선택한 후 오차항을 최소화하는 모수 값을 찾기 위해 최소 제곱 회귀 분석으로 적합할 수 있습니다. 일반적으로 데이터에 허용 가능한 적합도를 제공하는 가장 작은 p 및 q 값을 찾는 것이 좋은 방법으로 간주됩니다. 순수 AR 모델의 경우 Yule-Walker 방정식을 사용하여 적합도를 제공할 수 있습니다.

계량경제학적 분석에서 자주 사용되는 다른 회귀 방법(즉, OLS, 2SLS 등)과 달리 ARMA 모델 출력은 주로 시계열 데이터를 예측하는 경우에 사용됩니다. 따라서 그들의 계수는 예측에만 사용됩니다. 계량경제학의 다른 분야들은 인과적 추론을 살펴보지만, ARMA를 이용한 시계열 예측은 그렇지 않습니다. 그런 다음 계수는 예측 모델링에만 유용하다고 봐야 합니다.

통계 패키지의 구현

  • R에서 (표준 패키지 통계의) 아리마 함수는 시계열의 ARIMA 모델링에 기록되어 있습니다. 패키지 astsa에는 ARMA 모델(계절 및 비계절)과 이러한 모델의 데이터를 시뮬레이션하기 위한 sarima.sim을 맞추기 위한 sarima라는 개선된 스크립트가 있습니다. 확장 패키지에는 관련 기능 및 확장 기능이 포함되어 있습니다. 예를 들어, t시리즈 패키지에는 "ARMA 모델에서 시계열에 맞추기"에 문서화된 arma 함수가 포함되어 있고, fracdiff 패키지에는 부분적으로 통합된 ARMA 프로세스를 위한 fracdiff()가 포함되어 있으며, 예측 패키지에는 p,q의 간결한 집합을 선택하기 위한 auto.arima가 포함되어 있습니다. 시계열의 CRAN 태스크 뷰에는 이러한 대부분에 대한 링크가 포함되어 있습니다.
  • Mathematica는 ARMA를 포함한 시계열 함수의 완전한 라이브러리를 가지고 있습니다.[12]
  • MATLAB에는 AR, ARX(자기회귀 외생적) 및 ARMAX 모델을 추정하기 위한 armaar 등의 함수가 포함됩니다. 자세한 내용은 시스템 식별 도구상자계량경제학 도구상자를 참조하십시오.
  • Juliaarma.jl과 같은 ARMA 모델과 피팅을 구현하는 커뮤니티 기반 패키지를 가지고 있습니다.
  • Statsmodels Python module에는 ARMA를 포함한 시계열 분석을 위한 많은 모델과 기능이 포함되어 있습니다. 이전에는 스크킷 학습 라이브러리의 일부였지만, 현재는 독립형이며 Panders와 잘 통합됩니다. 자세한 내용은 여기를 참조하십시오.
  • PyFlux는 Bayesian ARIMAX 모델을 포함한 Python 기반의 ARIMAX 모델을 구현합니다.
  • IMSL 수치 라이브러리는 C, Java, C#와 같은 표준 프로그래밍 언어로 구현된 ARMA 및 ARIMA 절차를 포함하는 수치 분석 기능 라이브러리입니다.NET, 그리고 포트란.
  • gretl은 또한 ARMA 모델을 추정할 수 있습니다. 여기에 언급된 내용을 참조하십시오.
  • GNU Octave는 추가 패키지 Octave-forge의 함수를 사용하여 AR 모델을 추정할 수 있습니다.
  • Stata에는 ARMA 및 ARIMA 모델을 추정할 수 있는 기능 아리마가 포함되어 있습니다. 자세한 내용은 여기를 참조하십시오.
  • SuanShu는 일변량/다변량 ARMA, ARIMA, ARMAX 등의 모델이 객체 지향 접근 방식으로 구현된 종합 통계 패키지를 포함한 수치 방법의 자바 라이브러리입니다. 이러한 구현은 "SuanShu, Java 수치 통계 라이브러리"에 문서화되어 있습니다.
  • SAS에는 ARIMA 모델을 추정하는 계량경제학 패키지인 ETS가 있습니다. 자세한 내용은 여기를 참조하십시오.

스펙트럼

ARMA 공정의 스펙트럼 밀도는

여기서σ 2 2}}는 백색분산이고,θ displaystyle \theta}는 의 이동 평균 부분의 특성 다항식이며,ϕ {\displaystyle \phi}는 ARMA 모델의 자기회귀 부분의 특성 다항식입니다.

적용들

ARMA는 시스템이 자체 동작뿐만 아니라 관찰되지 않은 일련의 충격(MA 또는 이동 평균 부분)의 함수일 때 적합합니다. 예를 들어, 주가는 시장 참가자들로 인해 기술적 추세와 평균 반전 효과를 나타낼 뿐만 아니라 기초 정보에 충격을 받을 수 있습니다.[citation needed]

일반화

의 과거 값 및 ε 오류 항에 대한 의존성은 달리 명시되지 않는 한 선형으로 가정됩니다. 의존성이 비선형인 경우 이 모델을 구체적으로 비선형 이동 평균(NMA), 비선형 자기회귀(NAR) 또는 비선형 자기회귀-이동 평균(NARMA) 모델이라고 합니다.

자기 회귀-이동-평균 모형은 다른 방법으로 일반화될 수 있습니다. 자기 회귀 조건부 이분산성(ARCH) 모형과 자기 회귀 통합 이동 평균(ARIMA) 모형도 참조하십시오. 여러 시계열을 적합해야 하는 경우 벡터 ARIMA(또는 VARIMA) 모델을 적합시킬 수 있습니다. 문제의 시계열이 긴 메모리를 나타내는 경우 분수 ARIMA(FARIMA, 때로는 ARFIMA라고도 함) 모델링이 적합할 수 있습니다. 자기 회귀 분석 부분 통합 이동 평균을 참조하십시오. 데이터에 계절적 영향이 포함되어 있다고 생각되는 경우 SARIMA(계절 ARIMA) 또는 주기적 ARMA 모델에 의해 모델링될 수 있습니다.

또 다른 일반화는 다중 규모 자기 회귀(MAR) 모델입니다. MAR 모델은 트리의 노드에 의해 인덱싱되는 반면, 표준(이산 시간) 자기 회귀 모델은 정수에 의해 인덱싱됩니다.

ARMA 모형은 일변량 모형입니다. 다변량 사례에 대한 확장은 벡터 자기 회귀(VAR) 및 벡터 자기 회귀 이동 평균(VARMA)입니다.

외생적 입력 모형을 이용한 자기회귀-이동-평균 모형(ARMAX 모형)

ARMAX(p, q, b) 표기법은 자기회귀항, q이동평균항외생성 입력항을 갖는 모형을 의미합니다. 이 모델은 AR(p) 및 MA(q) 모델과 알려진 및 시계열 dt{\t}의 마지막 b 항의 선형 조합을 포함합니다 이 항은 다음과 같습니다.

여기서η 1, η b ldots,\eta_{b}}는 d d_{t}}의 파라미터입니다.

외생 변수가 있는 모델의 일부 비선형 변형이 정의되었습니다. 예를 들어 비선형 자기 회귀 외생 모델을 참조하십시오.

통계 패키지는 "외생적"(즉, 독립적) 변수의 사용을 통해 ARMAX 모델을 구현합니다. 이러한[15] 패키지의 출력을 해석할 때는 추정된 파라미터(예: R 및 gretl)가 일반적으로 회귀 분석을 참조하기 때문에 주의해야 합니다.

는 모든 외인성(또는 독립적) 변수를 포함합니다.

참고 항목

참고문헌

  1. ^ Box, George E. P. (1994). Time series analysis : forecasting and control. Gwilym M. Jenkins, Gregory C. Reinsel (3rd ed.). Englewood Cliffs, N.J.: Prentice Hall. p. 54. ISBN 0-13-060774-6. OCLC 28888762.
  2. ^ Shumway, Robert H. (2000). Time series analysis and its applications. David S. Stoffer. New York: Springer. pp. 90–91. ISBN 0-387-98950-1. OCLC 42392178.
  3. ^ Box, George E. P.; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Time series analysis : forecasting and control (3rd ed.). Englewood Cliffs, N.J.: Prentice Hall. pp. 54–55. ISBN 0-13-060774-6. OCLC 28888762.
  4. ^ Box, George E. P.; Jenkins, Gwilym M.; Reinsel, Gregory C.; Ljung, Greta M. (2016). Time series analysis : forecasting and control (5th ed.). Hoboken, New Jersey: John Wiley & Sons, Incorporated. p. 53. ISBN 978-1-118-67492-5. OCLC 908107438.
  5. ^ Shumway, Robert H. (2000). Time series analysis and its applications. David S. Stoffer. New York: Springer. p. 98. ISBN 0-387-98950-1. OCLC 42392178.
  6. ^ Hannan, Edward James (1970). Multiple time series. Wiley series in probability and mathematical statistics. New York: John Wiley and Sons.
  7. ^ Whittle, P. (1951). Hypothesis Testing in Time Series Analysis. Almquist and Wicksell. Whittle, P. (1963). Prediction and Regulation. English Universities Press. ISBN 0-8166-1147-5.
    다음 이름으로 다시 게시됨:
  8. ^ Hannan & Deistler (1988, 페이지 227):
  9. ^ Box, George; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Time Series Analysis: Forecasting and Control (Third ed.). Prentice-Hall. ISBN 0130607746.
  10. ^ Missouri State University. "Model Specification, Time Series Analysis" (PDF).
  11. ^ Brockwell, P. J.; Davis, R. A. (2009). Time Series: Theory and Methods (2nd ed.). New York: Springer. p. 273. ISBN 9781441903198.
  12. ^ Mathematica Archived 2011년 11월 24일 Wayback Machine시계열 기능
  13. ^ Rosenblatt, Murray (2000). Gaussian and non-Gaussian linear time series and random fields. New York: Springer. p. 10. ISBN 0-387-98917-X. OCLC 42061096.
  14. ^ Wei, William W. S. (1990). Time series analysis : univariate and multivariate methods. Redwood City, Calif.: Addison-Wesley Pub. pp. 242–243. ISBN 0-201-15911-2. OCLC 18166355.
  15. ^ 시계열의 ARIMA 모델링, R 문서화


더보기