이동평균

Moving average
이동 평균(빨간색 곡선)을 사용하여 노이즈가 많은 사인(파란색 곡선)을 평활합니다.

통계학에서 이동 평균(롤링 평균 또는 실행 평균)은 전체 데이터 세트의 서로 다른 하위 집합에 대한 일련의 평균을 생성하여 데이터 점을 분석하기 위한 계산입니다.이동평균(MM)[1] 또는 롤링평균이라고도 하며 유한 임펄스 응답 필터의 일종입니다.다음과 같은 종류가 있습니다.단순 형식, 누적 형식 또는 가중 형식(아래 설명).

일련의 숫자와 고정 서브셋 사이즈가 주어졌을 때, 이동 평균의 제1 요소는, 그 수열의 초기 고정 서브셋의 평균을 취함으로써 구해진다.그런 다음 하위 집합이 "전진 이동" 즉, 시리즈의 첫 번째 숫자를 제외하고 하위 집합의 다음 값을 포함하여 수정됩니다.

이동 평균은 일반적으로 시계열 데이터와 함께 단기 변동을 완화하고 장기 추세 또는 주기를 강조하기 위해 사용됩니다.단기 및 장기 사이의 임계값은 애플리케이션에 따라 다르며, 그에 따라 이동 평균의 매개변수가 설정됩니다.를 들어, 주가, 수익률 또는 거래량과 같은 재무 데이터의 기술적 분석에 자주 사용됩니다.또한 경제학에서는 국내총생산, 고용 또는 기타 거시경제 시계열을 조사하기 위해 사용된다.수학적으로 이동평균은 컨볼루션의 한 종류이므로 신호 처리에 사용되는 로우패스 필터의 예로 볼 수 있습니다.비 시계열 데이터와 함께 사용할 경우 이동 평균은 시간과의 특별한 연관성 없이 고주파 성분을 필터링하지만, 일반적으로 어떤 종류의 순서가 암시됩니다.단순하게 보면 데이터를 부드럽게 하는 것으로 볼 수 있습니다.

단순 이동 평균

Moving Average Types comparison - Simple and Exponential.png

금융 애플리케이션에서 단순 이동 평균(SMA)은 k개(\ k 데이터 포인트의 가중치 없는 평균입니다.그러나 과학 및 공학에서 평균은 일반적으로 중앙 값의 양쪽에 있는 동일한 수의 데이터에서 가져옵니다.이렇게 하면 평균의 변동이 시간 이동보다는 데이터의 변동에 맞춰 조정됩니다.단순 등가중치 실행평균의 예로는 엔트리를 하는 데이터 세트의 k개의 \k 엔트리의 평균이 있습니다.이러한 데이터 포인트는 1, , { style 입니다.이것은 주식의 종가일 수 있다. 예에서는 일수)의 데이터 포인트에서의 로 나타나며 다음과 같이 계산됩니다 나타나며 다음과 같이 계산됩니다.

다음 평균 k ({displaystyle 샘플링 k ({ k - +2 ({displaystyle ~ + ({n 범위가 고려됩니다.새로운 + 합계에 들어가 가장 오래된 값 -k +({ 드롭됩니다.이를 통해 이전 k pre {\ {\를 재사용하여 계산이 단순해집니다.

즉, 이동 평균 필터는 FIFO/순환 버퍼와 3개의 산술 단계만 있는 실시간 데이터에서 상당히 저렴하게 계산할 수 있습니다.

FIFO/원형 버퍼를 처음 채우는 동안 샘플링 창은 데이터 세트 크기와 k (\ k이며, 평균 계산은 누적 이동 평균으로 수행됩니다.

선택한 기간( \ k)은 단기, 중간 또는 장기 등 관심 이동 유형에 따라 달라집니다.금융용어로 평균 이동 수준은 하락하는 시장의 지지 또는 상승하는 시장의 저항으로 해석될 수 있다.

사용된 데이터가 평균을 중심으로 배치되지 않으면 단순 이동 평균이 표본 폭의 절반만큼 최신 기준보다 뒤처집니다.SMA는 오래된 데이터가 삭제되거나 새로운 데이터가 들어오는 경우에도 영향을 받을 수 있습니다.SMA의 특징 중 하나는 데이터가 주기적으로 변동하는 경우 해당 기간의 SMA를 적용하면 해당 변동(항상 하나의 완전한 사이클을 포함하는 평균)이 제거된다는 것이다.그러나 완벽한 규칙적인 주기는 거의 [2]없다.

많은 응용 프로그램에서는 "과거" 데이터만 사용함으로써 유발되는 이동을 피하는 것이 유리합니다.따라서 평균이 [3]계산되는 시계열에서 점의 양쪽에 균등하게 간격을 둔 데이터를 사용하여 중심 이동 평균을 계산할 수 있습니다.이렇게 하려면 샘플 창에서 홀수 개수의 점을 사용해야 합니다.

SMA의 큰 단점은 윈도 길이보다 짧은 신호의 상당량을 통과시킨다는 것입니다.더 나쁜 것은, 실제로 뒤집힌다는 것이다.이로 인해 평활된 결과의 피크가 데이터에 있는 곳에 나타나는 등 예상치 못한 아티팩트가 발생할 수 있습니다.또, 고주파수의 일부가 적절히 제거되지 않기 때문에, 결과가 예상보다 매끄럽지 않게 됩니다.

누적평균

누적평균(CA)에서 데이터는 순서가 매겨진 데이터 스트림에 도착하며 사용자는 현재 데이터까지 모든 데이터의 평균을 얻기를 원합니다.예를 들어, 투자자는 특정 주식에 대한 모든 주식거래의 현재 시점까지 평균 가격을 원할 수 있다.새로운 트랜잭션이 발생할 때마다 해당 시점까지의 모든 트랜잭션에 대해 평균 가격을 계산할 수 있습니다. 누적 평균은 으로 의 값 1 n 스타일 }의 등가중평균)입니다.\ 현재 시각까지

이를 계산하기 위한 brute-force 방법은 모든 데이터를 저장하고 합계를 계산하여 새로운 데이터가 도착할 때마다 포인트 수로 나눕니다.단, 다음 공식을 사용하여 누적 평균을 새 값으로 간단히 업데이트할 수 n+ 사용할 수 있습니다.

따라서 새 기준점의 현재 누적 평균은 이전 누적 평균인 곱하기 n과 최신 기준점을 모두 지금까지 수신한 포인트 수(n+1)로 나눈 값입니다.모든 데이터가 도착하면(n = N), 누적 평균은 최종 평균과 같습니다.또한 실행 중인 데이터의 총합과 포인트 수를 저장하고 새 데이터가 도착할 때마다 CA를 얻기 위해 합계를 포인트 수로 나눌 수도 있습니다.

누적 평균 공식의 도출은 간단하다.사용.

마찬가지로 n+1경우 다음과 같이 나타납니다.

n + style 이 방정식을 풀면 다음과 같이 됩니다.

가중이동평균

가중 평균은 표본 창의 서로 다른 위치에 있는 데이터에 서로 다른 가중치를 부여하는 곱셈 요인이 있는 평균입니다.수학적으로 가중 이동 평균은 고정 가중 함수를 사용하여 데이터를 합한 값이다.한 응용 [citation needed]프로그램이 디지털 그래픽 이미지에서 픽셀화를 제거하고 있습니다.

재무 데이터의 기술적 분석에서 가중 이동 평균(WMA)은 산술적 [4]수열에서 감소하는 가중치의 특정한 의미를 갖는다.n-day WMA에서 가장 최근의 날의 가중치는 n이고, 두 번째 등은 1로 낮아집니다.

WMA 무게 n = 15

분모는 n( +). { \ + 1 }{과 같은 삼각형 숫자입니다.} 보다 일반적인 경우 분모는 항상 개별 가중치의 합이 됩니다

연속된 값에 걸쳐 WMA를 계산할 때 M +의 분자 차이(\ p M+ - - - M - + ( { _ { + - \ - { M - n + } ) 。 p M+ + M - + { p { M } + \ + p _ { - n +1 }을 M { \Total

오른쪽 그래프는 가장 최근의 데이터에 대한 가장 높은 가중치에서 0으로 가중치가 감소하는 방법을 보여 줍니다.이는 이어지는 지수 이동 평균의 가중치와 비교할 수 있습니다.

지수 이동 평균

EMA 중량α = 0.125

지수 이동 평균(EMA)지수 가중 이동 평균(EWMA)[5]이라고도 하며 지수적으로 감소하는 가중 계수를 적용하는 1차 무한 임펄스 응답 필터입니다.오래된 각 기준의 가중치는 기하급수적으로 감소하여 0에 도달하지 않습니다.오른쪽 그래프는 체중 감소의 예를 보여 줍니다.

Y의 EMA( 스타일 Y 다음과 같이 재귀적으로 계산할 수 있습니다.

장소:

  • 는 가중치 감소 정도를 나타냅니다. 가중치는 0과 1 사이의 일정한 평활 계수입니다.α 높을수록 오래된 관측치를 더 빨리 할인합니다.
  • t{ style _ { } 、 t \ t} 。
  • t{ S _ { } 、 displaydisplay displaydisplay displaydisplay displaydisplay s sdisplay t { \ t

S1 위와 같이 S를 Y로 설정하여11 여러 가지 방법으로 초기화할 수 있지만, S를 처음 4 또는 5 관측치의 평균으로 설정하는1 등 다른 기법이 존재한다.이로 인한 이동 평균에 S1초기화의 효과의 중요성α{\displaystyle \alpha}에;그 높은 α 할인 이전 observa{\displaystyle \alpha} 작은α{\displaystyle \alpha}가치, S1의 선택 상대적으로 더 큰 α{\displaystyle \alpha}값보다 중요한 모임으로 만든 달려 있다.t이온화 속도가 빨라집니다.

S에 대해1 어떤 조치를 취하든 사용 가능한 데이터 이전의 값에 대해 가정하고 반드시 오류가 발생합니다.이러한 관점에서, 초기 결과는 반복이 수렴될 까지 신뢰할 수 없는 것으로 간주해야 한다.이를 '회전' 간격이라고 부르기도 합니다.신뢰할 수 있는 것으로 간주되는 시점을 평가하는 한 가지 방법은 결과의 필요한 정확성을 고려하는 것입니다.예를 들어 3%의 정확도가 필요한 경우 Y1 초기화하고 5개의 시간 상수(위 정의) 후에 데이터를 취하면 계산이 3% 이내로 수렴됩니다(Y1 3% 미만만 결과에 남음).알파값이 매우 작으면 결과가 거의 유용하지 않을 수 있습니다.이는 매우 긴 윈도우에서 컨볼루션필터(가중평균 등)를 사용하는 문제와 유사합니다.

이 공식은 Hunter(1986)[6]에 따른다.이 공식을 다른 시간 동안 반복 적용함으로써 최종적으로 S를 다음t 같이 가중치 합계로 쓸 수 있습니다

임의의 적절한 k ≤ {0, 1, 2, ...} 일반 기준 -i(\ 무게는α( - 이다.

이 공식은 다음과 같이 기술 분석 용어로 표현될 수 있으며, EMA가 어떻게 최신 데이터를 향해 나아가는지를 보여주지만, 차이의 비율(매회)만 나타낸다.

를 확장했습니다기준1 p, p2 등의 가중 계수가 기하급수적으로 감소하는 방법을 보여 주는 다음과 같은 멱급수를 산출합니다.

어디에

  • 1 오늘입니다({
  • 어제입니다.{ { _ { \ { }
  • 등등

/ α + (1 -)+ ( - )2 + { { 1=+ ( - \ ) + ( 1 - \)^2 + \ }입니다.

첫 번째 추정치를 초기화할 때 오류를 발생시키지 않고 재귀적으로 계산할 수도 있습니다(n은 1부터 시작).

0 0 { {}이라고 합니다.

이것은 항이 감소하는 무한 합계입니다.

제한된 수의 용어로 EMA의 근사치

초기값을 얼마나 거슬러 올라가야 하는지에 대한 문제는 최악의 경우 데이터에 따라 달라집니다.오래된 데이터의 큰 가격 값은 가중치가 매우 작더라도 총계에 영향을 미칠 것이다.가격 변동이 작으면 가중치만 고려할 수 있다.위의 검정력 공식은 특정 날짜에 대한 시작 값을 나타내며, 그 이후에는 먼저 표시된 연속 일 수식을 적용할 수 있습니다.k항 뒤에 정지할 때 생략되는 가중치는

어느 것이
즉, 소수
[주 1]

총중량에서 벗어나다

예를 들어, 무게의 99.9%를 가지려면 비율을 0.1%로 설정하고 k에 대해 해결합니다.

사용할 항 수를 결정합니다. 0 0 N N \ {\ \ N \ to \이므로 로그 (1-){\ , ( 1 - \ alpha)는 N이 [note 2]증가할수록.그 결과, 다음과 같이 됩니다.

α α + = { N+1로서 과 관련되는 , 이것은 약으로[note 3] 단순화됩니다.

이 예에서는 (99.9 %의 중량)을 사용합니다.

SMA와 EMA의 관계

어플리케이션에 따라 권장되는 값이 몇 가지 있지만α(\에 대해 선택해야 하는 "accepted" 값은 없습니다.α에 대해 일반적으로 사용되는 값은 α / ( + ){=입니다.이는 E / ( S +) { \ _ { \ EMA } =2 / \ ( N _ { \ SMA } } + 일 때 SMA와 EMA의 가중치는 동일한 "질량의 중심"을 가지기 때문입니다.

[증명]

N일 SMA의 중량은R일({R}일)에 "질량의 중심"을 가진다.

( R ( - / {\ R=\ 기반 인덱싱을 사용하는 경우)

이 증빙의 나머지 부분에서는 단일 기반 인덱싱을 사용합니다.

한편, EMA의 무게는 질량 중심을 가지고 있다.

그것은,

맥로린 시리즈도 알고 있습니다.

x에 대한 양측의 도함수를 구하면 다음과 같은 결과를 얻을 수 있다.
또는

x -(\style x를 대입하면 다음과 같습니다.

또는

R S A A{\ } = 하는 α의 값은 실제로 다음과 같습니다.

또는

2/ ( + 2/\ 동등한 N-day SMA와 같은 무게 중심을 갖는 EMA를 생성하는 α 입니다.

또한 이러한 이유로 EMA를 N-day EMA라고 부르기도 한다. N개의 기간이 있음을 시사하는 이름에도 불구하고, 이 용어는 α 인자만을 지정한다.NSMA 또는 WMA에서와 같이 계산을 위한 정지점이 아닙니다. 충분히 큰 N의 경우, α / ( + ) style =일 때 의 첫 번째 N 기준점은 계산에서 총 무게의 약 86%를 나타냅니다.

[증명]

지수 이동 평균에서 모든 항의 가중치(즉, 무한한 수의 항)의 합계는 1입니다.N 항의 가중치의 합계는 1- ( - ) + {{- \)^{} 입니다이 두 합계는 모두 기하 급수의 합계에 대한 공식을 사용하여 도출할 수 있습니다.N항 에 생략된 가중치는 1에서 이것을 빼면 1- [ -( - )N + ] ( - )N + ( \ [ 1 - ( - \ alpha )^N+1} \ right = ( - \ alpha )^{ = (이러한 가중치는 으로 생략된 값입니다.)

이제 N항의 무게 공식에서 일반적으로 사용되는 값을 α / ( +) {= 대체한다.이 치환을 실시하여 n ( 1+ ) \ _ \}\ n합니다[7]. 그러면 얻을 수 있습니다.

[주 4]

, N [- (N +)N + style \_ { \infty - N} \}^{1} \right [note 5]1- 2 086 - 047입니다.

0.8647 근사치.직관적으로 이것은 "N-주기" 지수 이동 평균의 N항 이후의 가중치가 0.8647로 수렴된다는 것을 의미한다.

α / (N + =)})의 지정은 필수가 (예를 들어 N-days의 반감기 1 - 0.5 ({0-alpha style\leftN+1\right)}).-일 는 α -.5 0{\=1 -.5{1} }사실, 2/(N+1)는 EMA와 SMA 사이의 관계를 직관적으로 이해하기 위한 일반적인 규약일 뿐이며, 두 가지가 동일한 데이터 세트에서 함께 사용된다.실제로는 α의 임의의 값을 갖는 EMA를 사용할 수 있으며, α의 값을 명시하거나 N( / )- {\ N=\1하는 보다 친숙한 N-day EMA 용어를 사용하여 명명할 수 있다.

지수 가중 이동 분산 및 표준 편차

평균 외에도 분산 표준 편차에 관심이 있어 평균으로부터의 편차의 통계적 유의성을 평가할 수 있습니다.

EWMVar는 이동 평균과 함께 쉽게 계산할 수 있습니다.시작값은 1 (\ 1을(를)[8] 사용하여 다음 값을 계산합니다.

이로부터 지수 가중 이동 표준 편차는 {\으)로 할 수 있다.i 다음으로 표준점수를 사용하여 이동평균과 분산에 대한 데이터를 정규화할 수 있습니다. 알고리즘은 분산 계산에 대한 Welford의 알고리즘을 기반으로 합니다.

수정이동평균

수정 이동 평균(MMA), 실행 이동 평균(RMA) 또는 평활 이동 평균(SMMA)은 다음과 같이 정의됩니다.

즉, 이는 1 \ 1인 지수 이동 평균입니다. EMA와 SMMA/RMA/RMA의 유일한 차이점은α(\ \alpha N(\ N에서 되는 방법입니다. EMA의 경우 인 선택은 1 +입니다

컴퓨터 성능 측정에 적용

평균 프로세스 큐 길이 또는 평균 CPU 사용률 등 일부 컴퓨터 성능 메트릭은 지수 이동 평균 형식을 사용합니다.

여기서 α는 두 판독치 사이의 시간 함수로 정의됩니다.계수가 현재 판독치에 더 큰 가중치를 부여하고 이전 판독치에 더 작은 가중치를 부여하는 예는 다음과 같습니다.

여기서 exp는 지수 함수이고, 판독치n t의 시간은 초 단위로 표현되며, W는 판독치가 평균화된 것으로 간주되는 시간 간격(평균에서 각 판독치의 평균 수명)입니다.위의 α의 정의가 주어졌을 때, 이동 평균은 다음과 같이 표현될 수 있다.

예를 들어 프로세스큐 길이Q의 15분 평균 L은 5초마다 측정되며(시간차는 5초) 다음과 같이 계산됩니다.

기타 중량

주식거래에서는 거래량에 비례하여 거래량 가중치가 매 시간마다 가중치가 부여되는 등 다른 가중치 시스템은 때때로 사용된다.

보험계리사가 사용하는 또 다른 가중치는 스펜서의 15포인트 이동[9] 평균(중앙 이동 평균)입니다.대칭 가중치 계수는 [-3, -6, -5, 3, 21, 46, 67, 67, 46, 21, 3, -5, -6, -3]이며, 다음과 같은 인자가 있습니다.[1, 1, 1, 1]×[1, 1, 1, 1]×[1, 1, 1, 1, 1]×[-3, 3, 4, 3, -3]/320이며 입방 다항식의 표본은 변경되지 않습니다.[10]

금융계 외에 가중 실행 수단은 다양한 형태와 응용 분야를 가지고 있습니다.각 가중치 함수 또는 "커널"에는 고유한 특성이 있습니다.엔지니어링 및 과학에서 필터의 주파수와 위상 응답은 데이터에 적용되는 특정 필터의 바람직한 왜곡과 바람직하지 않은 왜곡을 이해하는 데 가장 중요한 역할을 합니다.

평균은 단순히 데이터를 "평활하게" 하는 것이 아닙니다.평균은 저역 통과 필터의 한 형태입니다.적절한 선택을 위해 사용되는 특정 필터의 효과를 이해해야 합니다.이 점에서, 이 기사의 프랑스어 버전은 세 가지 종류의 평균(누적, 지수, 가우스)의 스펙트럼 효과를 논한다.

이동 중위수

통계적 관점에서 이동 평균은 시계열의 기본 추세를 추정하는 데 사용될 때 급격한 충격이나 기타 이상 징후와 같은 드문 사건에 민감하다.추세에 대한 보다 강력한 추정치는 n개 시점의 단순 이동 중위수입니다.

예를 들어, 대괄호 안의 값을 정렬하고 중간 값을 찾는 방법으로 중위수를 찾을 수 있습니다.이 큰 n의 경우, 중위수는 지수화 가능한 스키플리스트를 [11]갱신하여 효율적으로 계산할 수 있다.

통계적으로 이동 평균은 추세에 대한 변동이 정규 분포를 따를 때 시계열의 기본 추세를 복구하는 데 최적입니다.그러나 정규 분포는 추세에서 매우 큰 편차에 높은 확률을 두지 않으므로 이러한 편차가 추세 추정치에 불균형적으로 큰 영향을 미치는 이유를 설명합니다.변동이 라플라스 분포로 가정되면 이동 중위수가 통계적으로 최적임을 [12]알 수 있다.주어진 분산에 대해 Laplace 분포는 정규 분포보다 희귀 사건에 대한 확률을 높게 설정하므로 이동 중위수가 이동 평균보다 충격에 더 잘 견디는 이유를 알 수 있습니다.

위의 단순 이동 중위수가 중심인 경우 평활은 영상 신호 처리와 같은 응용 프로그램이 있는 중앙 필터와 동일합니다.

이동 평균 회귀 모형

이동 평균 회귀 모델에서 관심 변수는 관측되지 않은 독립 오차항의 가중 이동 평균으로 가정하고 이동 평균의 가중치는 추정해야 할 매개변수이다.

이 두 개념은 이름 때문에 종종 혼동되지만, 많은 유사점을 공유하지만 서로 다른 방법을 나타내며 매우 다른 맥락에서 사용됩니다.

「 」를 참조해 주세요.

메모들

  1. ^ Maclaurin for1/ ( - { 1/ ( 1 -x ) } {\1+ +2 + { \ 1 + + ^ {2} + \
  2. ^ 0\ 0Taylor 시리즈- ) - -- 2 / 2 - { ( 1 - \ alpha )= - ^{ / - \ 접근함을
  3. ^ in(0.001)/2 = -3.45
  4. ^ 왼쪽 분모는 유니티여야 하며 분자는 오른쪽(기하계열 - ( - ) N - (1 - )]{ \[ {1 - - \ ) \- \ \
  5. ^ 왜냐하면 (1 + x/n)n은 큰 n에 대한 한계x e에 가깝기 때문입니다.

레퍼런스

  1. ^ 코숨네스강 범람원의 수문학적 변동성(Booth et al., San Francisco Houter and Waterin Science, 제4권, 제2호, 2006년)
  2. ^ 통계분석, Ya-lun Chou, Holt International, 1975, ISBN0-03-089422-0, 섹션 17.9.
  3. ^ 단순 중심 이동 평균의 도출 및 특성은 Savitzky-Golay 필터에서 모두 제공됩니다.
  4. ^ "Weighted Moving Averages: The Basics". Investopedia.
  5. ^ "Archived copy". Archived from the original on 2010-03-29. Retrieved 2010-10-26.{{cite web}}: CS1 maint: 제목으로 아카이브된 복사(링크)
  6. ^ NIST/SEMATECH 통계 방법 전자 핸드북: 미국 국립표준기술원의 단일 지수 평활
  7. ^ 증거는 다음 링크를 참조하십시오.
  8. ^ Finch, Tony. "Incremental calculation of weighted mean and variance" (PDF). University of Cambridge. Retrieved 19 December 2019.
  9. ^ 스펜서의 15포인트 이동평균 - Wolfram Math World의
  10. ^ 롭 J 하인드만"이동 평균"2009-11-08.2020-08-20에 접속.
  11. ^ "Efficient Running Median using an Indexable Skiplist « Python recipes « ActiveState Code".
  12. ^ G.R. Arce, "비선형 신호 처리: 통계적 접근", Wiley:뉴저지, 미국, 2005년

외부 링크