자기회귀이동평균모형

시계열의 통계적 분석에서 자기회귀-이동평균(ARMA) 모델은 (약하게) 고정 확률 과정을 두 다항식, 즉 자기회귀(AR)와 이동평균(MA)에 대한 두 번째 다항식으로 간결하게 설명합니다. 일반적인 ARMA 모델은 Peter Whittle의 1951년 논문, 시계열 분석에서의 가설 검정에서 기술되었으며, 1970년 George E. P. Box와 Gwilym Jenkins에 의해 대중화되었습니다.

데이터 $X_{t}$ ${\$ 의 시계열을 고려할 $X_{t}$ 때, ARMA 모델은 이 시리즈의 미래 가치를 이해하고 예측하기 위한 도구입니다. AR 부분은 변수를 시차(즉, 과거) 값으로 회귀시키는 것을 포함합니다. MA 부분은 오류항을 과거의 여러 시간에 동시에 발생한 오류항의 선형 조합으로 모델링하는 것을 포함합니다. 이 모델은 일반적으로 ARMA(p,q) 모델이라고 합니다. 여기서 p는 AR 부품의 순서이고 q는 MA 부품의 순서입니다(아래 정의된 대로).

ARMA 모형은 Box-Jenkins 방법을 사용하여 추정할 수 있습니다.

자기회귀모형

표기법 AR(p)은 순서 p의 자기 회귀 모델을 나타냅니다. AR(p) 모델은 다음과 같이 기록됩니다.

X_{t}=\sum _{i=1}^{p}\varphi _{i}X_{t-i}+\varepsilon _{t}

여기서 $\varepsilon _{t}$ φ 1, $\varphi _{1},\ldots ,\varphi _{p}$ φ p ${\displaystyle \varphi_{1},\ldots$ ,\varphi_{p}는 매개 변수이고 $랜덤$ 변수 ε t ${\$ displaystyle \varepsilon_{t}}는 일반적으로 독립적이고 동일하게 분포(즉, 동일하게)되는 정규 랜덤 변수입니다.

모형이 정지 상태를 유지하려면 특성 다항식의 뿌리가 단위 원의 바깥에 있어야 합니다. 예를 들어 $,$ φ 1 ≥ $1$ {\ $displaystyle \varphi_{$ 1} \geq 1}이(가) 있는 AR(1) 모델의 공정은 1 - φ 1 B = 0 ${\displaystyle 1-\$ varphi_{1}B=0}의 루트가 단위 원 내에 있기 $1-\varphi _{1}B=0$ 에 정지 상태가 아닙니다.

ADF는 IMF의 안정성과 추세 요소를 평가합니다. 정지 시계열의 경우 자기 회귀 이동 평균(ARMA) 모델이 사용되는 반면, 비정지 시계열의 경우 LSTM 모델을 사용하여 추상적인 특징을 도출합니다. 각 시계열의 예측 결과를 재구성하여 최종 값을 얻습니다.

이동평균모형

MA(q) 표기법은 q차의 이동 평균 모델을 나타냅니다.

X_{t}=\mu +\varepsilon _{t}+\sum _{i=1}^{q}\theta _{i}\varepsilon _{t-i}\,

$\theta _{1},...,\theta _{q}$ 서 $\theta _{1},...,\theta _{q}$ θ 1, $...,$ θ q ${\$ displaystyle \ $theta _{1$ }, ...,\theta _{q}는 $모델$ 의 $\mu$ 변수이고, $μ {\$ displaystyle \mu }는 X t ${\displaystyle$ X_{t}(종종 $\varepsilon _{t}$ 과 같게 가정)의 $X_{t}$ 이며, ε t {\displaystyle $\$ varepsilon _{t}, $ε$ t - 1 {\displaystyle \varepsilon _{t-1}}, ...은 일반적으로 정규 랜덤 변수인 백색 잡음 오류 항입니다.

ARMA모델

ARMA(p, q) 표기법은 자기회귀항과 q 이동평균항이 있는 모형을 의미합니다. 이 모델에는 AR(p) 및 MA(q) 모델이 포함됩니다.^[5]

X_{t}=\varepsilon _{t}+\sum _{i=1}^{p}\varphi _{i}X_{t-i}+\sum _{i=1}^{q}\theta _{i}\varepsilon _{t-i}.\,

일반적인 ARMA 모델은 1951년 피터 휘틀(Peter Whittle)의 논문에서 설명되었는데, 그는 수학적 분석(Laurent series and Fourier analysis)과 통계적 추론을 사용했습니다.^[6]^[7] ARMA 모델은 George E. P. Box와 Jenkins가 1970년에 발표한 책에 의해 대중화되었는데, 그는 그 모델들을 선택하고 추정하는 반복적인 (Box–Jenkins) 방법을 설명했습니다. 이 방법은 3차 이하의 저차 다항식에 유용했습니다.^[8]

ARMA 모델은 기본적으로 백색 잡음에 적용되는 무한 임펄스 응답 필터이며, 몇 가지 해석이 추가로 적용됩니다.

lag 연산자 규격

일부 텍스트에서는 시차 연산자 L을 기준으로 모델이 지정됩니다. 이러한 항에서 AR(p) 모델은 다음과 같습니다.

\varepsilon_{t}=\left(1-\sum_{i=1}^{p}\varphi_{i}L^{i}\right)X_{t}=\varphi (L)X_{t}\,

여기서 $\varphi$ φ ${\displaystyle$ \varphi}는 다항식을 나타냅니다.

\varphi(L)=1-\sum _{i=1}^{p}\varphi _{i}L^{i}\,

MA(q) 모델은 다음과 같습니다.

X_{t}=\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}=\theta (L)\varepsilon _{t},\,

여기서 $\theta$ θ ${\displaystyle$ \theta}는 다항식을 나타냅니다.

\theta (L)=1+\sum _{i=1}^{q}\theta _{i}L^{i}.\,

마지막으로, 결합된 ARMA(p, q) 모델은 다음과 같이 주어집니다.

\left(1-\sum_{i=1}^{p}\varphi_{i}L^{i}\right)X_{t}=\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}\,,

또는 좀 더 간결하게,

\varphi(L)X_{t}=\theta(L)\varepsilon_{t}\,

아니면

{\frac {\varphi(L)}{\theta(L)}}X_{t}=\varepsilon_{t}\,

대체 표기법

Box, Jenkins & Reinsel을 포함한 일부 저자는 자기 회귀 계수에 대해 다른 규칙을 사용합니다.^[9] 이를 통해 시차 연산자를 포함하는 모든 다항식이 전체적으로 유사한 형태로 나타날 수 있습니다. 따라서 ARMA 모델은 다음과 같이 기록됩니다.

\left(1-\sum_{i=1}^{p}\phi_{i}L^{i}\right)X_{t}=\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}\,.

Moreover, starting summations from $i=0$ and setting $\phi _{0}=-1$ and $\theta _{0}=1$ , then we get an even more elegant formulation: $-\sum _{i=0}^{p}\phi _{i}L^{i}\;X_{t}=\sum _{i=0}^{q}\theta _{i}L^{i}\;\varepsilon _{t}\,.$ $-\sum _{i=0}^{p}\phi _{i}L^{i}\;X_{t}=\sum _{i=0}^{q}\theta _{i}L^{i}\;\varepsilon _{t}\,.$

대체해석

디지털 신호 처리에서 ARMA 모델은 입력에서 백색 잡음을, 출력에서 ARMA 프로세스를 갖는 디지털 필터로 표현됩니다.

피팅 모델

p와 q 선택

ARMA(p,q) 모형에서 p와 q의 적절한 값을 찾는 것은 p의 추정치에 대한 부분 자기 상관 함수를 표시하고 마찬가지로 q의 추정치에 대한 자기 상관 함수를 사용하여 용이하게 할 수 있습니다. 확장 자기 상관 함수(EACF)를 사용하여 p와 q를 동시에 결정할 수 있습니다.^[10] p와 q의 초기 선택에 적합된 모형의 잔차에 대해 동일한 함수를 고려하여 추가 정보를 얻을 수 있습니다.

Brockwell & Davis는 p와 q를 찾기 위해 Aikke 정보 기준(AIC)을 사용할 것을 권장합니다.^[11] 순서 결정의 또 다른 가능한 선택은 BIC 기준입니다.

계수 추정

일반적으로 ARMA 모형은 p와 q를 선택한 후 오차항을 최소화하는 모수 값을 찾기 위해 최소 제곱 회귀 분석으로 적합할 수 있습니다. 일반적으로 데이터에 허용 가능한 적합도를 제공하는 가장 작은 p 및 q 값을 찾는 것이 좋은 방법으로 간주됩니다. 순수 AR 모델의 경우 Yule-Walker 방정식을 사용하여 적합도를 제공할 수 있습니다.

계량경제학적 분석에서 자주 사용되는 다른 회귀 방법(즉, OLS, 2SLS 등)과 달리 ARMA 모델 출력은 주로 시계열 데이터를 예측하는 경우에 사용됩니다. 따라서 그들의 계수는 예측에만 사용됩니다. 계량경제학의 다른 분야들은 인과적 추론을 살펴보지만, ARMA를 이용한 시계열 예측은 그렇지 않습니다. 그런 다음 계수는 예측 모델링에만 유용하다고 봐야 합니다.

통계 패키지의 구현

R에서 (표준 패키지 통계의) 아리마 함수는 시계열의 ARIMA 모델링에 기록되어 있습니다. 패키지 astsa에는 ARMA 모델(계절 및 비계절)과 이러한 모델의 데이터를 시뮬레이션하기 위한 sarima.sim을 맞추기 위한 sarima라는 개선된 스크립트가 있습니다. 확장 패키지에는 관련 기능 및 확장 기능이 포함되어 있습니다. 예를 들어, t시리즈 패키지에는 "ARMA 모델에서 시계열에 맞추기"에 문서화된 arma 함수가 포함되어 있고, fracdiff 패키지에는 부분적으로 통합된 ARMA 프로세스를 위한 fracdiff()가 포함되어 있으며, 예측 패키지에는 p,q의 간결한 집합을 선택하기 위한 auto.arima가 포함되어 있습니다. 시계열의 CRAN 태스크 뷰에는 이러한 대부분에 대한 링크가 포함되어 있습니다.
Mathematica는 ARMA를 포함한 시계열 함수의 완전한 라이브러리를 가지고 있습니다.^[12]
MATLAB에는 AR, ARX(자기회귀 외생적) 및 ARMAX 모델을 추정하기 위한 arma 및 ar 등의 함수가 포함됩니다. 자세한 내용은 시스템 식별 도구상자 및 계량경제학 도구상자를 참조하십시오.
Julia는 arma.jl과 같은 ARMA 모델과 피팅을 구현하는 커뮤니티 기반 패키지를 가지고 있습니다.
Statsmodels Python module에는 ARMA를 포함한 시계열 분석을 위한 많은 모델과 기능이 포함되어 있습니다. 이전에는 스크킷 학습 라이브러리의 일부였지만, 현재는 독립형이며 Panders와 잘 통합됩니다. 자세한 내용은 여기를 참조하십시오.
PyFlux는 Bayesian ARIMAX 모델을 포함한 Python 기반의 ARIMAX 모델을 구현합니다.
IMSL 수치 라이브러리는 C, Java, C#와 같은 표준 프로그래밍 언어로 구현된 ARMA 및 ARIMA 절차를 포함하는 수치 분석 기능 라이브러리입니다.NET, 그리고 포트란.
gretl은 또한 ARMA 모델을 추정할 수 있습니다. 여기에 언급된 내용을 참조하십시오.
GNU Octave는 추가 패키지 Octave-forge의 함수를 사용하여 AR 모델을 추정할 수 있습니다.
Stata에는 ARMA 및 ARIMA 모델을 추정할 수 있는 기능 아리마가 포함되어 있습니다. 자세한 내용은 여기를 참조하십시오.
SuanShu는 일변량/다변량 ARMA, ARIMA, ARMAX 등의 모델이 객체 지향 접근 방식으로 구현된 종합 통계 패키지를 포함한 수치 방법의 자바 라이브러리입니다. 이러한 구현은 "SuanShu, Java 수치 및 통계 라이브러리"에 문서화되어 있습니다.
SAS에는 ARIMA 모델을 추정하는 계량경제학 패키지인 ETS가 있습니다. 자세한 내용은 여기를 참조하십시오.

스펙트럼

ARMA 공정의 스펙트럼 밀도는

S(f)={\frac {\sigma ^{2}}{\pi }}\left\vert {\frac {\theta(e^{-if})}{\phi(e^{-if})}\right\vert ^{2}

여기서

\sigma ^{2}

σ 2

{\displaystyle \sigma^{

2}}는 백색

\theta

의 분산이고,

\theta

θ

{\

displaystyle \theta}는

\phi

모델

의 이동 평균 부분의 특성 다항식이며,

\phi

ϕ {\displaystyle \phi}는 ARMA 모델의 자기회귀 부분의 특성 다항식입니다.

적용들

ARMA는 시스템이 자체 동작뿐만 아니라 관찰되지 않은 일련의 충격(MA 또는 이동 평균 부분)의 함수일 때 적합합니다. 예를 들어, 주가는 시장 참가자들로 인해 기술적 추세와 평균 반전 효과를 나타낼 뿐만 아니라 기초 정보에 충격을 받을 수 있습니다.^{[citation needed]}

일반화

$X_{t}$ $X_{t}$ 의 과거 값 및 ε 오류 항에 대한 의존성은 달리 명시되지 않는 한 선형으로 가정됩니다. 의존성이 비선형인 경우 이 모델을 구체적으로 비선형 이동 평균(NMA), 비선형 자기회귀(NAR) 또는 비선형 자기회귀-이동 평균(NARMA) 모델이라고 합니다.

자기 회귀-이동-평균 모형은 다른 방법으로 일반화될 수 있습니다. 자기 회귀 조건부 이분산성(ARCH) 모형과 자기 회귀 통합 이동 평균(ARIMA) 모형도 참조하십시오. 여러 시계열을 적합해야 하는 경우 벡터 ARIMA(또는 VARIMA) 모델을 적합시킬 수 있습니다. 문제의 시계열이 긴 메모리를 나타내는 경우 분수 ARIMA(FARIMA, 때로는 ARFIMA라고도 함) 모델링이 적합할 수 있습니다. 자기 회귀 분석 부분 통합 이동 평균을 참조하십시오. 데이터에 계절적 영향이 포함되어 있다고 생각되는 경우 SARIMA(계절 ARIMA) 또는 주기적 ARMA 모델에 의해 모델링될 수 있습니다.

또 다른 일반화는 다중 규모 자기 회귀(MAR) 모델입니다. MAR 모델은 트리의 노드에 의해 인덱싱되는 반면, 표준(이산 시간) 자기 회귀 모델은 정수에 의해 인덱싱됩니다.

ARMA 모형은 일변량 모형입니다. 다변량 사례에 대한 확장은 벡터 자기 회귀(VAR) 및 벡터 자기 회귀 이동 평균(VARMA)입니다.

외생적 입력 모형을 이용한 자기회귀-이동-평균 모형(ARMAX 모형)

ARMAX(p, q, b) 표기법은 자기회귀항, q이동평균항 및 외생성 입력항을 갖는 모형을 의미합니다. 이 모델은 AR(p) 및 MA(q) 모델과 알려진 및 $d_{t}$ 시계열 dt $d_{t}$ {\ $display d_{$ t}의 마지막 b 항의 선형 조합을 포함합니다 $d_{t}$ 이 항은 다음과 같습니다.

X_{t}=\varepsilon _{t}+\sum _{i=1}^{p}\varphi _{i}X_{t-i}+\sum _{i=1}^{q}\theta _{i}\varepsilon _{t-i}+\sum _{i=1}^{b}\eta _{i}d_{t-i}.\,

여기서 $d_{t}$ η 1, $\eta _{1},\ldots ,\eta _{b}$ η b ${\displaystyle \eta_{1},\$ ldots,\eta_{b}}는 $d_{t}$ $입력$ d ${\displaystyle$ d_{t}}의 파라미터입니다.

외생 변수가 있는 모델의 일부 비선형 변형이 정의되었습니다. 예를 들어 비선형 자기 회귀 외생 모델을 참조하십시오.

통계 패키지는 "외생적"(즉, 독립적) 변수의 사용을 통해 ARMAX 모델을 구현합니다. 이러한^[15] 패키지의 출력을 해석할 때는 추정된 파라미터(예: R 및 gretl)가 일반적으로 회귀 분석을 참조하기 때문에 주의해야 합니다.

X_{t}-m_{t}=\varepsilon _{t}+\sum _{i=1}^{p}\varphi _{i}(X_{t-i}-m_{t-i})+\sum _{i=1}^{q}\theta _{i}\varepsilon _{t-i}.\,

$m_{t}$ 서 $m_{t}$ ${\$ 는 모든 외인성(또는 독립적) 변수를 포함합니다 $m_{t}$ .

m_{t}=c+\sum _{i=0}^{b}\eta _{i}d_{t-i}.\,

참고 항목

참고문헌

^ Box, George E. P. (1994). Time series analysis : forecasting and control. Gwilym M. Jenkins, Gregory C. Reinsel (3rd ed.). Englewood Cliffs, N.J.: Prentice Hall. p. 54. ISBN 0-13-060774-6. OCLC 28888762.
^ Shumway, Robert H. (2000). Time series analysis and its applications. David S. Stoffer. New York: Springer. pp. 90–91. ISBN 0-387-98950-1. OCLC 42392178.
^ Box, George E. P.; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Time series analysis : forecasting and control (3rd ed.). Englewood Cliffs, N.J.: Prentice Hall. pp. 54–55. ISBN 0-13-060774-6. OCLC 28888762.
^ Box, George E. P.; Jenkins, Gwilym M.; Reinsel, Gregory C.; Ljung, Greta M. (2016). Time series analysis : forecasting and control (5th ed.). Hoboken, New Jersey: John Wiley & Sons, Incorporated. p. 53. ISBN 978-1-118-67492-5. OCLC 908107438.
^ Shumway, Robert H. (2000). Time series analysis and its applications. David S. Stoffer. New York: Springer. p. 98. ISBN 0-387-98950-1. OCLC 42392178.
^ Hannan, Edward James (1970). Multiple time series. Wiley series in probability and mathematical statistics. New York: John Wiley and Sons.
^ Whittle, P. (1951). Hypothesis Testing in Time Series Analysis. Almquist and Wicksell. Whittle, P. (1963). Prediction and Regulation. English Universities Press. ISBN 0-8166-1147-5.
다음 이름으로 다시 게시됨:
^ Hannan & Deistler (1988, 페이지 227):
^ Box, George; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Time Series Analysis: Forecasting and Control (Third ed.). Prentice-Hall. ISBN 0130607746.
^ Missouri State University. "Model Specification, Time Series Analysis" (PDF).
^ Brockwell, P. J.; Davis, R. A. (2009). Time Series: Theory and Methods (2nd ed.). New York: Springer. p. 273. ISBN 9781441903198.
^ Mathematica Archived 2011년 11월 24일 Wayback Machine의 시계열 기능
^ Rosenblatt, Murray (2000). Gaussian and non-Gaussian linear time series and random fields. New York: Springer. p. 10. ISBN 0-387-98917-X. OCLC 42061096.
^ Wei, William W. S. (1990). Time series analysis : univariate and multivariate methods. Redwood City, Calif.: Addison-Wesley Pub. pp. 242–243. ISBN 0-201-15911-2. OCLC 18166355.
^ 시계열의 ARIMA 모델링, R 문서화

v t 확률적 과정
이산시간	베르누이 과정 분기공정 중식당과정 갈턴-왓슨 과정 독립적이고 동일한 분산 랜덤 변수 마르코프 체인 모란과정 임의 보행 루프가 지워진 자기기피 편향된 최대 엔트로피
연속시간	덧셈공정 베셀과정 출생-사망과정 순산 브라운 운동 다리 익스포크 분수 기하학적 미앤더 코시공정 연락과정 연속 시간 랜덤 워크 콕스 과정 확산과정 다이슨 브라운 운동 경험적 과정 펠러공정 플레밍-비오트 과정 감마 과정 기하학적 과정 호크 공정 헌트과정 상호작용하는 입자계 Itô 확산 Itô process 점프 확산 점프 과정 레비 과정 현지시간 마르코프 덧셈 과정 맥킨-블라소프 과정 오른슈타인-울렌벡 과정 포아송 과정 컴파운드 비균질적 슈람-로너 진화 세미마팅게일 시그마마팅게일 안정공정 수퍼프로세스 전신과정 분산 감마 과정 위너공정 위너 소시지
둘다요.	분기공정 갤브스–뢰처바흐 모형 가우스 과정 은닉 마르코프 모형(HMM) 마르코프 과정 마르팅게일 차이점. 현지의 서브- 슈퍼- 임의동역학계 재생과정 갱신과정 가변 길이의 메모리를 갖는 확률적 사슬 백색소음
필드 및 기타	디리클레 과정 가우스 랜덤 필드 깁스 측도 홉필드 모형 아이싱모델 포츠 모형 부울 네트워크 마르코프 랜덤 필드 퍼콜레이션 피트먼-요르프로세스 점공정 콕스 포아송 랜덤 필드 랜덤그래프
시계열 모형	자기회귀 조건부 이분산성(ARCH) 모형 자기회귀식 통합이동평균(ARIMA) 모형 자기회귀모형 자기회귀-이동평균(ARMA) 모형 일반화 자기회귀 조건부 이분산성(GARCH) 모형 이동평균(MA)모델
재무모형	이항옵션가격결정모형 블랙-더만–토이 블랙-카라신스키 블랙-스쿨즈 찬-카롤리-롱스태프-샌더스(CKLS) 첸 등분산탄력성(CEV) 콕스-잉거솔-로스(CIR) Garman–Kohlhagen 히스-재로우-모턴(HJM) 헤스턴 호이-리 헐-화이트 리보 시장 렌들맨 – 바터 SABR 변동성 바시체크 윌키
보험수리모형	ü만 크라머-룬드베르크 리스크프로세스 스페어-앤더슨
대기열 모델	벌크 유동적 일반화 대기열망 M/G/1 M/M/1 M/M/c
특성.	까들랑길 계속되는 연속경로 에르고딕 교환가능 펠러 연속 가우스마르코프 마르코프 믹싱 조각적 결정론적 예측가능 점진적으로 측정 가능 셀프시밀러 정지된 시간 가역
리미트 정리	중심 극한 정리 돈스커 정리 두브의 마팅게일 수렴 정리 에르고딕 정리 피셔-티펫-그네덴코 정리 대편차원리 대수의 법칙(약함/강함) 반복 로그의 법칙 최대 에르고딕 정리 사노프 정리 0-1 법칙 (블루멘탈 , 보렐-칸텔리, 엥겔베르트-슈미트, 휴이트-새비지, 콜모고로프, 레비)
부등식	부르크홀더-다비스-건디 두브마팅게일 두브 업크로스 구니타와타나베 마르킨키에비치-지그문트
도구들	캐머런-마틴 공식 랜덤 변수의 수렴 돌레앙-데이드 지수 두브분해정리 두브마이어 분해 정리 두브의 선택적 정지 정리 딘킨 공식 파인만-카크 공식 여과 기르사노프 정리 무한소 생성기 Itô 적분 Itmma's 보조개 카르후넨-뢰브 정리 콜모고로프 연속성 정리 콜모고로프 확장 정리 레비-프로코로프 계량 맬리아빈 미적분학 마르팅게일 표현정리 선택적 정지 정리 프로호로프 정리 이차 변동 반사원리 스코로호드 적분 스코로호드의 표현 정리 스코로호드 공간 스넬 봉투 확률미분방정식 다나카 정지시간 스트라토노비치 적분 균일한 통합성 일반적인 가설 위너 공간 고전적인 추상적인
규율	보험수리수학 제어이론 계량경제학 에르고딕 이론 극값 이론(EVT) 대이동설 수리금융 수학통계학 확률론 대기열 이론 갱신설 파멸론 신호처리 통계학 확률적 분석 시계열 분석 기계학습
토픽 목록 카테고리

Search