사비츠키-골레이 필터

Savitzky–Golay filter
왼쪽에서 오른쪽으로 데이터를 통과하는 스무딩 작업을 보여주는 애니메이션.빨간색 선은 데이터의 하위 집합을 적합시키는 데 사용되는 로컬 다항식을 나타낸다.평활값은 원으로 표시된다.

사비츠키-골레이 필터는 디지털 데이터 포인트 집합에 적용할 수 있는 디지털 필터로 신호 경향을 왜곡하지 않고 데이터의 정밀도를 높일 수 있다.이것은 콘볼루션이라고 알려진 프로세스에서 선형 최소 제곱법에 의해 저도 다항식으로 인접 데이터 점의 연속 하위 집합을 적합시킴으로써 달성된다.데이터 포인트의 간격이 같을 경우, 모든 데이터 서브셋에 적용할 수 있는 단일 집합의 "콘볼루션 계수"의 형태로 최소 제곱 방정식에 대한 분석 솔루션을 찾아 각 서브셋의 중앙점에 평활 신호 또는 평활 신호의 파생 모델의 추정치를 제공할 수 있다.이 방법은 확립된 수학적 절차를 바탕으로 1964년 아브라함 사비츠키(Abraham Savitzky)와 마르셀 J. E. Golay(Marcel J. Golay)[3][4]에 의해 대중화되었다.[1][2]표의 몇 가지 오류가 수정되었다.[5]2차원 및 3차원 데이터 처리를 위한 방법이 확장되었다.

사비츠키와 골레이의 논문은 분석 화학[6] 저널에서 가장 널리 인용된 논문 중 하나이며, 이 저널에 의해 "컴퓨터가 제어하는 분석 기구의 새벽을 이 기사로 추적할 수 있다고 주장할 수 있다"는 10개의 논문의 하나로 분류된다.[7]

적용들

데이터는 점 집합 {xj, yj}, j = 1, ..., n으로 구성되며 여기서 xj 독립 변수, yj 관측값이다.그것들은 표현에 따라 일련의 m 콘볼루션 계수 Ci 처리된다.

선택된 콘볼루션 계수는 아래 표에 표시된다.예를 들어 5점 2차 다항식으로 평활하는 경우 m = 5, i = -2, -1, 0, 1, 2 및 j번째 평활 데이터 점 Y는j

,

여기서, C−2 = -3/35, C−1 = 12/35 등평활화에는 수많은 응용이 있는데, 주로 데이터가 실제보다 덜 시끄러운 것처럼 보이도록 하기 위해 수행된다.다음은 데이터의 수치적 분화 적용이다.[8]참고 n번째 파생상품을 계산할 때 은(에서 dx n {\{\을(를) 얻기 위해 계산된 모든 데이터 포인트에 적용할 수 있다.

(1) 합성 로렌츠 + 노이즈(파란색) 및 1차 파생 모델(녹색)
(2) 말론산과 2차 파생상품(녹색)의 적정곡선(파란색)연한 청색 상자 안에 있는 부분은 10배 확대된다.
(3) 지수 기준(파란색) 및 2차 파생 모델(녹색)의 로렌츠어
(4) 로렌츠인(파란색)과 두 번째 파생상품(녹색)의 합
(5) 두 로렌츠인의 합계의 네 번째 파생상품
  1. 실험 데이터 곡선에서 최대값과 최소값의 위치.이것이 사비츠키에게 처음으로 동기를 부여한 애플리케이션이었다.[4]함수의 첫 번째 파생상품은 최대 또는 최소로 0이다.다이어그램은 노이즈(블루 다이아몬드)가 추가된 합성 로렌츠 곡선에 속하는 데이터 포인트를 보여준다.데이터는 0에서 최대값을 기준으로 반 폭의 척도로 표시된다.평활 곡선(빨간색 선)과 1차 파생 모델(녹색)은 7포인트 큐빅 사비츠키-골레이 필터로 계산했다.제로 크로싱의 어느 한쪽 위치에서 첫 번째 파생상품 값의 선형 보간법은 최대 피크 위치를 제공한다.제3차 파생상품도 이러한 목적으로 사용할 수 있다.
  2. 적정 곡선의 끝점 위치.끝점은 함수의 두 번째 파생상품이 0인 변곡점이다.[9]말론산에 대한 적정곡선은 방법의 힘을 보여준다.첫 번째 끝점은 4ml로 거의 보이지 않지만, 두 번째 파생상품은 제로 크로스를 찾기 위해 선형 보간법으로 쉽게 그 가치를 결정할 수 있다.
  3. 기준 평탄화.해석 화학에서는 때때로 곡선 기준선에 대한 흡수 밴드의 높이를 측정해야 한다.[10]기준선의 곡률이 흡수대 곡률보다 훨씬 작기 때문에 두 번째 파생상품은 효과적으로 기준선을 평평하게 만든다.흡수대 높이와 비례하는 파생상품 높이의 세 가지 척도는 "피크 대 밸리" 거리 h1과 h2와 기준선으로부터의 높이 h3이다.[11]
  4. 분해능 향상 분광기.스펙트럼 분석 곡선의 두 번째 파생상품의 대역은 스펙트럼의 대역보다 좁다. 즉, 반폭을 줄였다.이를 통해 부분적으로 겹치는 밴드를 별도의 (음극) 피크로 "해결"할 수 있다.[12]다이어그램은 "피크 대 밸리" 거리 측정을 사용하여 화학적 분석에 어떻게 사용될 수 있는지를 보여준다.이 경우, 계곡은 로렌츠인의 두 번째 파생상품의 특성이다. (x축 위치는 절반 높이에서 절반 너비의 눈금에서 피크 최대값의 위치에 상대적이다.)
  5. 4번째 파생 모델로 분해능 향상(양극 피크)미니마는 로렌츠인의 4번째 파생상품의 특성이다.

이동평균

이동 평균 필터는 단기 변동을 완화하고 장기 추세 또는 주기를 강조하기 위해 시계열 데이터와 함께 일반적으로 사용된다.그것은 종종 주가, 수익률 또는 거래량과 같은 재무 데이터의 기술적 분석에 사용된다.또한 국내 총생산, 고용 또는 기타 거시경제 시계열을 조사하는 데 경제 분야에서도 사용된다.

가중치가 없는 이동 평균 필터는 가장 간단한 콘볼루션 필터다.데이터 세트의 각 부분 집합은 직선 수평선에 의해 적합된다.모든 계수 값이 단순히 다음 값과 같기 때문에 콘볼루션 계수의 사비츠스키-골레이 표에는 포함되지 않았다.1/m.

콘볼루션 계수 도출

데이터 점의 간격이 같을 경우 최소 제곱 방정식에 대한 분석 솔루션을 찾을 수 있다.[2]이 용액은 수치 평활과 분화의 콘볼루션 방법의 기초를 형성한다.데이터가 n개의 점 집합(xjj, y)으로 구성되어 있다고 가정하자(j = 1, ..., n), 여기서 xj 독립 변수, yj 기준값이다.다항식은 각각 구간 h로 구분된 m(홀수) 인접 데이터 점 집합에 선형 최소 제곱으로 적합된다.첫째, 변수의 변화가 일어난다.

where is the value of the central point. z takes the values (e.g. m = 5 → z = −2, −1, 0, 1, 2).[note 1]k의 다항식은 다음과 같이 정의된다.

[주2]

계수 a0, a1 등은 정규 방정식을 풀어서 구한다(bold a벡터를, 굵은 J행렬을 나타낸다).

여기서 (는) Vandermonde 행렬로, J 세 번째 행에는 값 , ,{\1}z_{i가 있다

예를 들어, 5점에 맞는 입방 다항식의 경우, z= -2, -1, 0, 1, 2의 정규 방정식은 다음과 같이 해결된다.

이제, 정규 방정식은 행과 열을 재배열하여 다음과 같은 두 개의 개별적인 방정식으로 나눌 수 있다.

이러한 행렬의 각 행렬의 역행 표현식은 Cramer의 규칙을 사용하여 얻을 수 있다.

정규 방정식이 된다.

그리고

다중화 및 공통 요인 제거,

이러한 표현에서 y의 계수는 콘볼루션 계수로 알려져 있다.그것들은 행렬의 요소들이다.

대체적으로.

행렬 표기법에서 이 예는 다음과 같이 기록된다.

m ~ 25에 대해 동일한 방법으로 계산된 콘볼루션 계수 표는 1964년에 사비츠키-골레이 스무딩 필터에 대해 발행되었다.[3][5] 중심점 값 z = 0은 단일 계수 집합, 평활용 a0, 첫 번째 파생상품 1 대해 구한다.수치적 파생상품은 Y를 구별하여 얻는다.이는 파생상품이 평활 데이터 곡선에 대해 계산된다는 것을 의미한다.입방 다항식의 경우

일반적으로 도(0과 1),[note 3] (2와 3), (4와 5) 등의 다항식은 평활화 및 짝수파생물에 대해 동일한 계수를 제공한다.도(1과 2), (3과 4) 등의 다항식은 홀수 유도체에 대해 동일한 계수를 제공한다.

대수적 표현식

사비츠키-골레이 테이블을 항상 사용할 필요는 없다.매트릭스 JJT 합계는 폐쇄된 형태로 평가될 수 있다.

대수적 공식은 경련 계수에 대해 도출될 수 있다.[13][note 4]변곡점이 있는 곡선과 함께 사용하기에 적합한 함수는 다음과 같다.

Smoothing, polynomial degree 2,3 : (the range of values for i also applies 아래 표현에 대해)
1st derivative: polynomial degree 3,4
2차 파생상품: 다항식도 C = 2- m( - ) 2( - )/
3차 파생상품: 다항식도 3 =-( 2 - ) + i ( - )/ 4 - 2+ )/

변곡점이 없는 곡선과 함께 사용할 수 있는 간단한 표현식은 다음과 같다.

평활, 다항식 도 0.1(이동 평균):
1차 파생 모델, 다항식 도 1,2: C = i 2- )/

더 높은 파생상품을 얻을 수 있다.예를 들어, 네 번째 파생상품은 두 번째 파생상품 함수의 패스를 두 번 수행하여 얻을 수 있다.[14]

직교 다항식 사용

보조 변수 z에서 m 데이터 점을 단순 다항식으로 적합시키는 방법의 대안은 직교 다항식을 사용하는 것이다.

여기서 P0, ..., Pk 0, ..., k의 상호직교 다항식의 집합이다. 직교 다항식의 식을 얻는 방법과 계수 ba의 관계에 대한 자세한 내용은 게스트가 제공한다.[2]정규 방정식 행렬인 JJT 상호 직교성 때문에 두 직교 다항식의 곱이 0이기 때문에 대각 행렬이기 때문에 경련 계수에 대한 식을 쉽게 얻을 수 있다.따라서 역의 각 0이 아닌 원소는 단순히 정규 방정식 행렬에서 대응하는 원소의 역수일 뿐이다.직교 Gram 다항식을 만들기 위해 재귀법을 사용함으로써 계산이 더욱 단순화된다.전체 계산은 재귀와 관련된 계산에 잘 적응된 컴퓨터 언어인 PASCAL의 몇 줄에 코딩될 수 있다.[15]

첫 번째 및 마지막 점의 처리

사비츠키-골레이 필터는 단일 콘볼루션 계수 집합을 사용하여 중심점 z = 0의 평활값 또는 파생값을 얻기 위해 가장 일반적으로 사용된다.(m - 1)/시리즈의 시작점과 끝점은 이 과정을 이용하여 계산할 수 없다.이런 불편을 피하기 위해 다양한 전략을 활용할 수 있다.

  • 데이터는 첫 번째(m - 1)/2 지점의 복사본과 마지막(m - 1)/2 지점의 복사본을 차례로 추가하여 인위적으로 확장할 수 있다.예를 들어 m = 5를 사용하면 데이터 y1, ..., yn 시작과 끝에 두 점이 추가된다.
y3,y2,y1,y,...yn,yn−1,y,y,yn−2.
  • 적합한 다항식을 다시 살펴보면, 하나의 다항식, a0 .. a에k 대한 모든 합성 계수 집합을 사용하여 z의 모든 값에 대해 데이터를 계산할 수 있다는 것은 명백하다.
입방 다항식의 경우
  • 누락된 첫 번째 지점과 마지막 지점에 대한 콘볼루션 계수도 쉽게 얻을 수 있다.[15]이것은 또한 같은 다항식으로 첫 번째 (m + 1)/2 점을 적합시키는 것과 같으며, 마지막 점에도 유사하다.

데이터 가중치 부여

데이터 포인트에 모두 동일한 가중치를 부여한다는 것은 위의 치료법에서 함축되어 있다.기술적으로, 객관적 기능

최소 공정에서 최소화되는 단위 중량은 w = 1이다i.가중치가 모두 같지 않을 때 정규 방정식이 된다.

,

모든 데이터 하위 집합에 대해 동일한 대각선 가중치 집합을 사용하는 경우, = , ,.. w ){\}, 정상방정식에 대한 분석 솔루션을 기록할 수 있다.예를 들어, 2차 다항식에서는

이 행렬의 역행렬에 대한 명시적 표현은 크레이머의 규칙을 사용하여 얻을 수 있다.다음과 같이 일련의 콘볼루션 계수를 도출할 수 있다.

또는 계수 C를 스프레드시트에서 계산할 수 있으며, 기본 제공 행렬 반전 루틴을 사용하여 정규 방정식 행렬의 역행렬을 구할 수 있다.일단 계산되고 저장되면 이 계수 집합을 동일한 가중치가 적용되는 모든 계산에 사용할 수 있다.각각의 다른 가중치 체계에는 다른 계수 세트가 필요하다.

2차원 콘볼루션 계수

직사각형 픽셀 그리드로 구성된 사진 영상의 강도 값과 같은 데이터 값 표에도 2차원 평활과 분화를 적용할 수 있다.[16][17] 이러한 그리드를 커널이라고 하며 커널을 구성하는 데이터 포인트를 노드라고 한다.노드의 지수를 단순 순서에 따라 직사각형 커널을 하나의 행으로 변환하는 것이 요령이다.1차원 필터 계수는 m 데이터 지점 집합에 종속 변수 z의 다항식을 적합시켜 찾지만, 2차원 계수는 m × n 커널 노드의 값 집합에 종속 변수 vw의 다항식을 적합시켜 찾는다.다음 예제는 총 도 3, m = 7 및 n = 5의 이바리테 다항식의 경우 위의 1차원 사례에 대한 공정을 병렬하는 과정을 보여준다.[18]

35개1 데이터 값의 직사각형 커널, d35 - d

v
w
−3 −2 −1 0 1 2 3
−2 d1 d2 d3 d4 d5 d6 d7
−1 d8 d9 d10 d11 d12 d13 d14
0 d15 d16 d17 d18 d19 d20 d21
1 d22 d23 d24 d25 d26 d27 d28
2 d29 d30 d31 d32 d33 d34 d35

행이 차례로 배치될 때 벡터가 된다.

d = (d1 ... d35)T

Jacobian은 10개의 열을 가지고 있는데03, 각 변수00 a - a, 그리고 35개의 행을 각 vw 값 쌍에 하나씩 가지고 있다.각 행에는 형식이 있다.

콘볼루션 계수는 다음과 같이 계산된다.

C의 첫 번째 행에는 각각 35개의 데이터 값을 곱하여 커널의 중앙 노드에서평활값인 계수 00{\를 얻을 수 있는 35개의 콘볼루션 계수가 포함되어 있다(위 표의 18번째 노드에서).마찬가지로 C의 다른 행에 35개의 값을 곱하여 다른 다항식 계수를 얻을 수 있으며, 이 계수를 사용하여 다른 노드에서 평활값과 다른 평활 부분파생상품을 구할 수 있다.

니키타스와 파파 루이지는 사용된 다항식의 형식에 따라 스무딩의 품질이 크게 달라질 수 있다는 것을 보여주었다.[19]그들은 양식의 다항식 사용을 권장한다.

그러한 다항식은 커널의 중앙 및 근거리 영역 모두에서 양호한 평활화를 달성할 수 있으므로 샘플링된 도메인의 내부 및 근거리 데이터 지점 모두에서 평활에 자신 있게 사용할 수 있다.최소 제곱 문제를 해결할 때 불협화음을 방지하기 위해 p < mq < n. 2차원 계수를 계산하는 소프트웨어와 그러한 C의 데이터베이스에 대해서는 아래 다차원 콘볼루션 계수에 대한 섹션을 참조하십시오.

다차원 콘볼루션 계수

2차원 콘볼루션 계수의 아이디어는 커널 노드의 다차원 분포를 한 줄로 배열함으로써 보다 높은 공간 차원에서도 쉽게 확장할 수 있다.[16][20]니키타스와 파파 루이지가[19] 2차원 사례에서 앞서 발견한 것에 이어 다차원 사례에서는 다음과 같은 형태의 다항식 사용을 권장한다.

여기서 D는 공간의 치수, 는 다항 계수, u는 서로 다른 공간 방향의 좌표다.혼합이든 아니든 모든 순서의 부분파생물에 대한 대수적 표현은 위의 표현에서 쉽게 파생될 수 있다.[20]참고로 C는 커널 노드가 일렬로 배열되는 방식과 제이코비안을 준비할 때 위의 확장된 형태의 서로 다른 용어들이 배열되는 방식에 따라 달라진다.

컴퓨터 프로그래밍 언어로 사용할 수 있는 표준 부동 소수점 숫자의 정밀도가 더 이상 충분하지 않기 때문에 다차원 사례에서 C의 정확한 계산이 어려워진다.정밀도가 부족하면 부동소수점 절단 오차가 일부 C요소의 크기에 비견될 수 있으며, 이는 다시 그 정확도를 심각하게 떨어뜨려 무용지물로 만든다.Chandra Shekhar는 이러한 정확성 문제를 적절하게 처리하는 두 가지 오픈 소스 소프트인 ACCC(Advanced Convolution Coefficulator Calculator)PCCCC(정밀 콘볼루션 계수 계산기)를 내놓았다.ACCC는 부동 소수점 번호를 반복적으로 사용하여 계산을 수행한다.[21]부동 소수점 숫자의 정밀도는 GNU MPR을 사용하여 각 반복에서 점진적으로 증가한다.두 번 연속적으로 획득한 C가 사전 지정된 거리까지 동일한 유의 자릿수를 가지기 시작하면 수렴이 도달한 것으로 가정한다.거리가 충분히 큰 경우, 계산은 매우 정확한 C를 산출한다. PCCC는 GNU Multiple Precision Mathing Library를 사용하여 합리적인 계산을 채택하고, 합리적인 수 형식에서 완전히 정확한 C를 산출한다.[22]결국, 이러한 합리적인 숫자는 미리 지정된 숫자의 유의한 숫자가 될 때까지 부동 소수점 숫자로 변환된다.

대칭 커널과 대칭 및 비대칭 다항식, 유니티 스페이스 커널 노드, 1, 2, 3, 4차원 공간에서 ACCC를 사용하여 계산한 C의 데이터베이스를 사용할 수 있다.[23]Chandra Shekhar는 또한 앞서 언급한 데이터베이스에 제공된 C의 사용을 허용하면서 [20]균일하지 않은 간격의 커널 노드에 대해 필터링과 부분적인 차이(다양한 주문의)를 수행하기 위해 유니티 스페이스 커널 노드에 대해 계산된 C의 사용을 기술하는 수학적 프레임워크를 내놓았다.이 방법은 대략적인 결과만 산출하지만 커널 노드의 불균일성이 약하다는 전제하에 대부분의 엔지니어링 애플리케이션에서 허용된다.

콘볼루션의 일부 특성

  1. 평활화를 위한 콘볼루션 계수의 합은 1과 같다.홀수 유도체의 계수 합계는 0이다.[24]
  2. 평활화를 위한 제곱된 콘볼루션 계수의 합은 중심 계수의 값과 동일하다.[25]
  3. 함수의 평활은 함수의 아래 영역을 변경하지 않는다.[24]
  4. 균등파생 계수를 갖는 대칭함수의 경련은 대칭의 중심을 보존한다.[24]
  5. 파생 필터의 속성.[26]

신호 왜곡 및 소음 감소

콘볼루션 과정에서 신호가 왜곡될 수밖에 없다.위의 속성 3부터, 피크가 있는 데이터를 평활화하면 피크의 높이가 낮아지고 반폭은 커진다.왜곡과 신호 대 잡음 비(Signal-to-Noise ratio) 개선의 범위:

  • 다항식의 정도가 증가함에 따라 감소하다.
  • convolution 함수의 폭, m이 증가함에 따라 증가한다.
단위 표준 편차의 상관없는 노이즈가 있는 데이터 점에 평활이 미치는 영향

예를 들어 모든 데이터 포인트의 노이즈가 상관관계가 없고 일정한 표준 편차σ을 갖는 경우, 다음과 같은[25][note 5] m 포인트 스무딩 기능을 가진 콘볼루션에 의해 노이즈의 표준 편차가 감소한다.

다항식 도 0 또는 1: 1 m이동 평균)
다항식도 2 또는 3:( 2- 7) ( 2- ) {\

이러한 함수는 오른쪽 그림에서 볼 수 있다.예를 들어 9점 선형 함수(이동 평균)를 사용하면 노이즈의 3분의 2가 제거되고 9점 2차/큐빅 스무딩 함수를 사용하면 노이즈의 약 절반만 제거된다.나머지 소음의 대부분은 저주파 소음이다(아래 콘볼루션 필터의 주파수 특성 참조).

이동 평균 함수는 최상의 노이즈 감소를 제공하지만 m 지점에 대한 곡면성이 있는 데이터를 평활하기에 적합하지 않다.2차 필터 함수는 2차 다항식이 없기 때문에 변곡점이 있는 데이터 곡선의 파생 모델을 얻는 데 적합하지 않다.다항식 순서와 콘볼루션 계수의 최적 선택은 소음 감소와 왜곡 사이의 절충이 될 것이다.[27]

멀티패스 필터

왜곡을 완화하고 노이즈 제거를 개선하는 한 가지 방법은 폭이 더 작은 필터를 사용하여 두 개 이상의 콘볼루션을 수행하는 것이다.동일한 필터의 두 패스에 대해 이것은 원래 필터 자체와의 콘볼루션으로 얻은 필터의 한 패스에 해당한다.[28]예를 들어 계수가 있는 필터(1/3, 1/3, 1/3)의 패스는 계수(1/9, 2/9, 3/9, 2/9, 2/9, 1/9)가 있는 필터의 패스를 1회 패스하는 것과 같다.

다중 할당 시 단점은 – 포인트 함수의 n 통과에 해당하는 필터 너비가 n- )+ 이므로 다중 할당 시 엔드 효과가 더 크다는 것이다.그럼에도 불구하고, 멀티캐스팅은 큰 이점을 위해 사용되어 왔다.예를 들어, 신호 대 잡음 비율이 5에 불과한 일부 40 대 80의 데이터는 유용한 결과를 제공했다.[29]위에 제시된 소음 감소 공식은 각 통과에 따라 계산된 데이터 지점 간의 상관관계가 증가하기 때문에 적용되지 않는다.

콘볼루션 필터의 주파수 특성

9점 2차/큐빅 스무딩 함수의 푸리에 변환

콘볼루션은 푸리에 공동 도메인의 곱셈에 매핑된다.콘볼루션 필터의 이산 푸리에 변환실제함수로서 다음과 같이 나타낼 수 있다.

θ은 0도에서 180도까지 진행되며, 그 후에는 함수가 저절로 반복된다.9점 이차/큐빅 스무딩 함수에 대한 그래프가 대표적이다.매우 낮은 각도에서 그래프는 거의 평평하며, 이는 데이터의 저주파 성분이 평활 연산에 의해 사실상 변경되지 않는다는 것을 의미한다.각도가 증가하면 값이 감소하여 주파수 성분이 점점 더 감쇠된다.이는 콘볼루션 필터를 저역 통과 필터로 설명할 수 있음을 보여준다: 제거되는 노이즈는 주로 고주파 노이즈이며 저주파 노이즈는 필터를 통과한다.[30]일부 고주파 노이즈 구성 요소는 푸리에 변환에서 큰 각도로 분해된 것에서 알 수 있듯이 다른 구성 요소보다 더 감쇠된다.이것은 평활된 데이터에 작은 진동을 일으킬 수 있다.[31]

콘볼루션 및 상관 관계

콘볼루션은 데이터 오류 간의 상관관계에 영향을 미친다.콘볼루션의 효과는 선형 변환으로 표현될 수 있다.

오차 전파 법칙에 의해 데이터의 분산-공분산 행렬 A는 다음과 같이 B로 변환된다.

이 점이 실제로 어떻게 적용되는지 확인하려면 데이터 점이 분산이 같고 서로 상관 관계가 없다고 가정하여 처음 세 개의 계산된 점인 Y2 - Y4 대한 3점 이동 평균의 효과를 고려하십시오.A식별 행렬에 각 점에서의 상수, σ2, 분산을 곱한 이 된다.

이 경우 상관 계수는

계산된 포인트 사이에 ij가 될 것이다.

일반적으로 계산된 값은 관측된 값이 상관관계가 없는 경우에도 상관관계가 있다.상관관계는 번에 m - 1로 계산된다.[32]

멀티패스 필터

데이터 집합의 노이즈 및 상관 관계에 대한 다중 할당 효과를 설명하려면 3점 이동 평균 필터의 두 번째 통과 효과를 고려하십시오.두 번째 패스용[note 6]

두 번의 통과 후 중앙점의 표준 편차는 한 번의 통과에 대해 0.58σ에 비해 = 0.로 줄었다소음 감소는 동일한 조건에서 평활된 지점이 0.45㎛의 더 작은 표준 편차를 갖는 5점 이동 평균의 1회 통과보다 약간 낮다.

상관 계수가 있는 4개의 순차적 점 범위에 걸쳐 상관 관계가 확장됨

보다 좁은 평활 기능으로 두 번의 패스를 수행하여 얻은 이점은 계산된 데이터에 왜곡이 적다는 것이다.

참고 항목

부록

선택한 콘볼루션 계수 표

데이터 포인트 세트 , ) n을 고려하십시오사비츠키-골레이 표는 x - j- }-x_ step x - x는 h. 입방 다항식과 창 크기 m, m, 5점인 이른바 콘볼루션 계수의 사용 예는 다음과 같다.

스무딩
;
제1차 파생상품
;
제2차 파생상품
.

도 1, 2, 3, 4, 5의 다항식에 대한 콘볼루션 계수의 선택된 값은 다음 표에[note 7] 제시되어 있다. 이 값은 Gorry에서 제공된 PASCAL 코드를 사용하여 계산되었다.[15]

평활화 계수
다항식
정도
이차 또는 입방체
둘 또는 셋
4중주 또는 5중주
4시나
창 크기 5 7 9 7 9
−4 −21 15
−3 −2 14 5 −55
−2 −3 3 39 −30 30
−1 12 6 54 75 135
0 17 7 59 131 179
1 12 6 54 75 135
2 −3 3 39 −30 30
3 −2 14 5 −55
4 −21 15
정상화 35 21 231 231 429
첫 번째 파생상품 계수
다항식
정도
선형 또는 이차적
하나 또는 둘
입방 또는 사방형의
서너 개
창 크기 3 5 7 9 5 7 9
−4 −4 86
−3 −3 −3 22 −142
−2 −2 −2 −2 1 −67 −193
−1 -1 −1 −1 −1 −8 −58 −126
0 0 0 0 0 0 0 0
1 1 1 1 1 8 58 126
2 2 2 2 −1 67 193
3 3 3 −22 142
4 4 −86
정상화 2 10 28 60 12 252 1,188
2차 파생상품 계수
다항식
정도
이차 또는 입방체
둘 또는 셋
4중주 또는 5중주
4시나
창 크기 5 7 9 5 7 9
−4 28 −126
−3 5 7 −13 371
−2 2 0 −8 −1 67 151
−1 −1 −3 −17 16 −19 −211
0 −2 −4 −20 −30 −70 −370
1 −1 −3 −17 16 −19 −211
2 2 0 −8 −1 67 151
3 5 7 −13 371
4 28 −126
정상화 7 42 462 12 132 1716
제3차 파생상품 계수
다항식
정도
입방 또는 사방형의
서너 개
5진법 또는 6진법
대여섯
창 크기 5 7 9 7 9
−4 −14 100
−3 −1 7 1 −457
−2 −1 1 13 −8 256
−1 2 1 9 13 459
0 0 0 0 0 0
1 −2 −1 −9 −13 −459
2 1 −1 −13 8 −256
3 1 −7 −1 457
4 14 −100
정상화 2 6 198 8 1144
제4차 파생상품 계수
다항식
정도
4중주 또는 5중주
4시나
창 크기 7 9
−4 14
−3 3 −21
−2 −7 −11
−1 1 9
0 6 18
1 1 9
2 -7 −11
3 3 −21
4 14
정상화 11 143

메모들

  1. ^ 짝수 m 값을 가진 z는 1 - m에서 1 - 1까지 2단계에서 실행된다.
  2. ^ 단순 이동 평균k = 0, Y = a0 갖는 특별한 경우. 이 경우 모든 경련 계수는 1/m과 같다.
  3. ^ 이동 평균을 사용한 평활은 (경사) 직선이 있는 로컬 피팅과 동일한 간격의 점을 갖는 것과 동일하다.
  4. ^ 여기에 주어진 표현은 변수 m' = (m - 1)/2의 관점에서 주어지는 매든의 표현과는 다르다.
  5. ^ 제곱근 부호 아래의 표현은 z=0으로 된 콘볼루션 계수에 대한 표현과 같다.
  6. ^ 계수(1/9, 2/9, 3/9, 2/9, 1/9) 및 ID 분산-공분산 행렬이 있는 등가 필터를 한 번 통과해도 동일한 결과를 얻는다.
  7. ^ 좀 더 광범위한 표와 추가 계수를 계산하는 방법은 원래 사비츠키와 골레이에 의해 제공되었다.[3]

참조

  1. ^ Whittaker, E.T; Robinson, G (1924). The Calculus Of Observations. Blackie & Son. pp. 291–6. OCLC 1187948.. "다항식 적합으로 취득한 졸업식."
  2. ^ a b c Guest, P.G. (2012) [1961]. "Ch. 7: Estimation of Polynomial Coefficients". Numerical Methods of Curve Fitting. Cambridge University Press. pp. 147–. ISBN 978-1-107-64695-7.
  3. ^ a b c Savitzky, A.; Golay, M.J.E. (1964). "Smoothing and Differentiation of Data by Simplified Least Squares Procedures". Analytical Chemistry. 36 (8): 1627–39. Bibcode:1964AnaCh..36.1627S. doi:10.1021/ac60214a047.
  4. ^ a b Savitzky, Abraham (1989). "A Historic Collaboration". Analytical Chemistry. 61 (15): 921A–3A. doi:10.1021/ac00190a744.
  5. ^ a b Steinier, Jean; Termonia, Yves; Deltour, Jules (1972). "Smoothing and differentiation of data by simplified least square procedure". Analytical Chemistry. 44 (11): 1906–9. doi:10.1021/ac60319a045. PMID 22324618.
  6. ^ Larive, Cynthia K.; Sweedler, Jonathan V. (2013). "Celebrating the 75th Anniversary of the ACS Division of Analytical Chemistry: A Special Collection of the Most Highly Cited Analytical Chemistry Papers Published between 1938 and 2012". Analytical Chemistry. 85 (9): 4201–2. doi:10.1021/ac401048d. PMID 23647149.
  7. ^ Riordon, James; Zubritsky, Elizabeth; Newman, Alan (2000). "Top 10 Articles". Analytical Chemistry. 72 (9): 24 A–329 A. doi:10.1021/ac002801q.
  8. ^ Talsky, Gerhard (1994-10-04). Derivative Spectrophotometry. Wiley. ISBN 978-3527282944.
  9. ^ Abbaspour, Abdolkarim; Khajehzadeha, Abdolreza (2012). "End point detection of precipitation titration by scanometry method without using indicator". Anal. Methods. 4 (4): 923–932. doi:10.1039/C2AY05492B.
  10. ^ Li, N; Li, XY; Zou, XZ; Lin, LR; Li, YQ (2011). "A novel baseline-correction method for standard addition based derivative spectra and its application to quantitative analysis of benzo(a)pyrene in vegetable oil samples". Analyst. 136 (13): 2802–10. Bibcode:2011Ana...136.2802L. doi:10.1039/c0an00751j. PMID 21594244.
  11. ^ Dixit, L.; Ram, S. (1985). "Quantitative Analysis by Derivative Electronic Spectroscopy". Applied Spectroscopy Reviews. 21 (4): 311–418. Bibcode:1985ApSRv..21..311D. doi:10.1080/05704928508060434.
  12. ^ Giese, Arthur T.; French, C. Stacey (1955). "The Analysis of Overlapping Spectral Absorption Bands by Derivative Spectrophotometry". Appl. Spectrosc. 9 (2): 78–96. Bibcode:1955ApSpe...9...78G. doi:10.1366/000370255774634089. S2CID 97784067.
  13. ^ Madden, Hannibal H. (1978). "Comments on the Savitzky–Golay convolution method for least-squares-fit smoothing and differentiation of digital data" (PDF). Anal. Chem. 50 (9): 1383–6. doi:10.1021/ac50031a048.
  14. ^ 간스 1992, 페이지 153–7, "반복적인 스무딩 및 차별화"
  15. ^ a b c A., Gorry (1990). "General least-squares smoothing and differentiation by the convolution (Savitzky–Golay) method". Analytical Chemistry. 62 (6): 570–3. doi:10.1021/ac00205a007.
  16. ^ a b Thornley, David J. Anisotropic Multidimensional Savitzky Golay kernels for Smoothing, Differentiation and Reconstruction (PDF) (Technical report). Imperial College Department of Computing. 2066/8.
  17. ^ Ratzlaff, Kenneth L.; Johnson, Jean T. (1989). "Computation of two-dimensional polynomial least-squares convolution smoothing integers". Anal. Chem. 61 (11): 1303–5. doi:10.1021/ac00186a026.
  18. ^ Krumm, John. "Savitzky–Golay filters for 2D Images". Microsoft Research, Redmond.
  19. ^ a b Nikitas and Pappa-Louisi (2000). "Comments on the two-dimensional smoothing of data". Analytica Chimica Acta. 415 (1–2): 117–125. doi:10.1016/s0003-2670(00)00861-8.
  20. ^ a b c Shekhar, Chandra (2015). On Simplified Application of Multidimensional Savitzky-Golay Filters and Differentiators. Progress in Applied Mathematics in Science and Engineering. AIP Conference Proceedings. Vol. 1705. p. 020014. Bibcode:2016AIPC.1705b0014S. doi:10.1063/1.4940262.
  21. ^ Chandra, Shekhar (2017-08-02). "Advanced Convolution Coefficient Calculator". Zenodo. doi:10.5281/zenodo.835283.
  22. ^ Chandra, Shekhar (2018-06-02). "Precise Convolution Coefficient Calculator". Zenodo. doi:10.5281/zenodo.1257898.
  23. ^ Shekhar, Chandra. "Convolution Coefficient Database for Multidimensional Least-Squares Filters".
  24. ^ a b c 간스, 1992 & 부록 7
  25. ^ a b Ziegler, Horst (1981). "Properties of Digital Smoothing Polynomial (DISPO) Filters". Applied Spectroscopy. 35 (1): 88–92. Bibcode:1981ApSpe..35...88Z. doi:10.1366/0003702814731798. S2CID 97777604.
  26. ^ Luo, Jianwen; Ying, Kui; He, Ping; Bai, Jing (2005). "Properties of Savitzky–Golay digital differentiators" (PDF). Digital Signal Processing. 15 (2): 122–136. doi:10.1016/j.dsp.2004.09.008.
  27. ^ Gans, Peter; Gill, J. Bernard (1983). "Examination of the Convolution Method for Numerical Smoothing and Differentiation of Spectroscopic Data in Theory and in Practice". Applied Spectroscopy. 37 (6): 515–520. Bibcode:1983ApSpe..37..515G. doi:10.1366/0003702834634712. S2CID 97649068.
  28. ^ 간스 1992 페이지 153
  29. ^ Procter, Andrew; Sherwood, Peter M.A. (1980). "Smoothing of digital x-ray photoelectron spectra by an extended sliding least-squares approach". Anal. Chem. 52 (14): 2315–21. doi:10.1021/ac50064a018.
  30. ^ 간스 1992 페이지 207
  31. ^ Bromba, Manfred U.A; Ziegler, Horst (1981). "Application hints for Savitzky–Golay digital smoothing filters". Anal. Chem. 53 (11): 1583–6. doi:10.1021/ac00234a011.
  32. ^ 간스 1992 페이지 157

외부 링크