다항식 및 합리적인 기능 모델링
Polynomial and rational function modeling통계 모델링(특히 프로세스 모델링)에서는 다항식 함수와 합리적 함수가 곡선 적합을 위한 경험적 기법으로 사용되기도 한다.
다항 함수 모형
다항식 함수는 형식을 가진 함수를 말한다.
여기서 n은 다항식의 정도를 정의하는 음수가 아닌 정수다. 0도의 다항식은 단순히 일정한 함수일 뿐이고, 1의 도수는 선이며, 2의 도수는 2차이고, 3의 도수는 입방형이다.
역사적으로 다항식 모형은 곡선 적합에 가장 많이 사용되는 경험적 모형에 속한다.
이점
이 모델들은 다음과 같은 이유로 인기가 있다.
- 다항식 모델은 단순한 형태를 가지고 있다.
- 다항식 모델은 잘 알려져 있고 이해된 특성을 가지고 있다.
- 다항식 모델은 도형의 유연성이 보통이다.
- 다항식 모델은 폐쇄형 제품군이다. 원시 데이터의 위치 및 척도를 변경하면 다항식 모델이 다항식 모델로 매핑된다. 즉, 다항식 모델은 기초 메트릭에 의존하지 않는다.
- 다항식 모델은 계산적으로 사용하기 쉽다.
단점들
그러나 다항식 모델에도 다음과 같은 제한이 있다.
- 다항식 모형은 보간 특성이 좋지 않다. 고차 다항식은 정확한 적합치 사이의 진동으로 악명 높다.
- 다항식 모형은 외삽 특성이 좋지 않다. 다항식은 데이터 범위 내에서 양호한 적합치를 제공할 수 있지만 데이터 범위 밖에서 빠르게 악화되는 경우가 많다.
- 다항식 모형은 점근성이 좋지 않다. 그 성질상 다항식들은 유한 x 값에 대한 유한한 반응을 가지고 있으며 x 값이 무한할 경우에만 무한 반응을 가진다. 따라서 다항식들은 점근현상을 잘 모형화하지 못할 수 있다.
- 편향-분산 트레이드오프에 면역이 되는 절차는 없지만 다항식 모델은 모양과 정도 사이의 트레이드오프가 특히 좋지 않다. 복잡한 구조로 데이터를 모형화하기 위해서는 모형의 정도가 높아야 하며, 이는 추정할 모수의 관련 개수 또한 높을 것임을 나타낸다. 이것은 매우 불안정한 모델을 초래할 수 있다.
다항식 함수를 통한 모델링이 위의 제한사항들 중 하나 때문에 불충분한 경우, 모델링에 대한 합리적인 함수의 사용은 더 나은 적합성을 제공할 수 있다.
합리적 함수 모델
합리적인 함수는 단순히 두 다항식 함수의 비율이다.
n은 분자의 정도를 정의하는 비 음의 정수와 m은 분모의 정도를 정의하는 비 음의 정수를 나타낸다. 합리적인 함수 모델을 적합시키는 경우 분모의 상수 항은 대개 1로 설정된다. 합리적인 함수는 일반적으로 분자와 분모의 정도에 의해 식별된다. 예를 들어 분자의 경우 2차, 분모의 경우 3차적/입방적 합리함수로 식별된다. 합리적 함수 모델은 다항식 모델의 일반화인데, 합리적인 함수 모델은 다항식 모델을 하위 집합으로 포함한다(즉, 분모가 상수인 경우).
이점
합리적인 기능 모델에는 다음과 같은 장점이 있다.
- 합리적인 함수 모델은 적당히 단순한 형태를 가지고 있다.
- 합리적인 기능 모델은 폐쇄적인 가족이다. 다항식 모델과 마찬가지로, 이는 합리적인 함수 모델이 기본 메트릭에 종속되지 않음을 의미한다.
- 합리적인 함수 모델은 다항식 계열보다 훨씬 더 넓은 범위의 도형을 수용하면서 매우 광범위한 도형을 취할 수 있다.
- 합리적 함수 모델은 다항식 모델보다 보간 특성이 더 우수하다. 합리적인 함수는 다항식 모델보다 일반적으로 더 부드럽고 덜 진동적이다.
- 합리적인 기능은 뛰어난 외삽력을 가지고 있다. 합리적인 함수는 일반적으로 데이터의 영역 내에서뿐만 아니라 관심 영역 밖의 이론적/아편적 행동과 일치하도록 함수를 모형화하도록 맞춤화할 수 있다.
- 합리적 함수 모델은 뛰어난 점증적 특성을 가지고 있다. 합리적인 함수는 유한한 값의 경우 유한하거나 무한할 수 있으며, 무한 x 값의 경우 유한하거나 무한할 수 있다. 따라서 합리적인 기능은 합리적인 기능 모델에 쉽게 통합될 수 있다.
- 합리적인 함수 모델은 분자와 분모 모두에서 상당히 낮은 수준으로 복잡한 구조를 모델링하는 데 종종 사용될 수 있다. 이는 다시 다항식 모형에 비해 필요한 계수가 적다는 것을 의미한다.
- 합리적인 기능 모델은 계산적으로 다루기가 적당히 쉽다. 이들은 비선형 모델이지만 합리적인 기능 모델은 특히 쉽게 장착할 수 있는 비선형 모델이다.
- 비선형 모델을 장착하는 데 있어 일반적인 어려움은 적절한 시작 값을 찾는 것이다. 합리적인 함수 모델의 주요 장점은 선형 최소 제곱 적합치를 사용하여 시작 값을 계산하는 능력이다. 이를 위해 데이터 집합에서 p 점을 선택하고 p는 합리적 모델의 매개변수 수를 나타낸다. 예를 들어, 주어진 선형/이차 모형
- 4개의 대표적인 점을 선택하고 모형에 선형 적합을 수행해야 한다.
- 분모를 제거함으로써 이전 방정식에서 파생된 것이다. 여기서 x와 y는 전체 데이터 집합이 아닌 점의 부분 집합을 포함한다. 이 선형 적합에서 추정된 계수는 비선형 모형을 전체 데이터 집합에 적합시키기 위한 시작 값으로 사용된다.
- 함수의 양쪽에 반응 변수가 나타나는 이 유형의 적합치는 비선형 적합치의 시작 값을 얻는 데만 사용해야 한다. 이와 같은 적합치의 통계적 속성은 잘 이해되지 않는다.
- 점의 부분집합은 데이터 범위에서 선택해야 한다. 분명한 특이치는 피해야 하지만 어떤 점을 선택하느냐는 중요하지 않다.
단점들
합리적인 기능 모델에는 다음과 같은 단점이 있다.
- 합리적인 기능 계열의 속성은 다항식 계열의 속성만큼 엔지니어나 과학자에게 잘 알려져 있지 않다. 합리적인 기능 계열에 대한 문헌도 더욱 제한적이다. 가족의 성질이 잘 이해되지 않는 경우가 많기 때문에 다음과 같은 모델링 질문에 답하기 어려울 수 있다:데이터가 일정한 형태를 가지고 있다는 것을 감안할 때 분자의 정도와 분모의 정도에 대해 어떤 값을 선택해야 하는가?
- 구속되지 않은 합리적 기능 적합은 분모 다항식의 뿌리로 인해 원하지 않는 수직 점근의 원인이 될 수 있다. "blow up" 함수의 영향을 받는 x 값의 범위는 상당히 좁을 수 있지만, 그러한 점증상들이 발생할 때 점증상점 부근의 국소 보간에는 성가신 일이다. 이러한 점근법은 데이터 범위에 걸쳐 적합함수의 단순한 그림으로 탐지하기 쉽다. 이러한 성가신 점증법은 때때로 예측 불가능하게 발생하지만, 실무자들은 형상 유연성의 증가는 발생할 수 있는 기회를 충분히 누릴 가치가 있으며, 그러한 점증점들이 경험적 모델링을 위한 합리적인 기능 모델을 선택하는 것을 단념시켜서는 안 된다고 주장한다.
참고 항목
참고 문헌 목록
- Atkinson, A. C. and Donev, A. N. and Tobias, R. D. (2007). Optimum Experimental Designs, with SAS. Oxford University Press. pp. 511+xvi. ISBN 978-0-19-929660-6.
{{cite book}}: 일반 이름(도움말) 포함, (도움말)에 외부 링크 포함CS1 maint: 여러 이름: 작성자 목록(링크) - Box, G. E. P.와 Draper, Norman. 2007. 반응 표면, 혼합물 및 능선 분석, 제2판 [경험적 모델 구축 및 반응 표면, 1987], Wiley.
- Kiefer, Jack Carl (1985). L. D. Brown; et al. (eds.). Collected Papers III Design of Experiments. Springer-Verlag. ISBN 978-0-387-96004-3.
- R. H. 하딘과 N. J. A. 슬로운, "최적설계구축에 대한 새로운 접근법", 통계계획 및 추론 저널, 제37권, 1993권, 페이지 339-369
- R. H. 하딘과 N. J. A. 슬로운 "컴퓨터 생성 최소(및 더 큰) 반응 표면 설계: (I) 더 스피어"
- R. H. 하딘과 N. J. A. Sloane, "Computer-Generated Minimal (및 더 큰) 반응 표면 설계: (II) The Cube"
- Ghosh, S.; Rao, C. R., eds. (1996). Design and Analysis of Experiments. Handbook of Statistics. Vol. 13. North-Holland. ISBN 978-0-444-82061-7.
- Draper, Norman & Lin, Dennis K. J. "Response Surface Designs". pp. 343–375.
{{cite book}}: 누락 또는 비어 있음title=(도움말) - Gaffke, N. & Heiligers, B. "Approximate Designs for Polynomial Regression: Invariance, Admissibility, and Optimality". pp. 1149–1199.
{{cite book}}: 누락 또는 비어 있음title=(도움말)
- Draper, Norman & Lin, Dennis K. J. "Response Surface Designs". pp. 343–375.
- Melas, Viatcheslav B. (2006). Functional Approach to Optimal Experimental Design. Lecture Notes in Statistics. Vol. 184. Springer-Verlag. ISBN 978-0-387-98741-5. (합리적 기능으로 모델링)
역사적
- Gergonne, J. D. (1815). "Application de la méthode des moindre quarrés a l'interpolation des suites". Annales de mathématiques pures et appliquées. 6: 242–252.
- Gergonne, J. D. (1974) [1815]. "The application of the method of least squares to the interpolation of sequences". Historia Mathematica (Translated by Ralph St. John and S. M. Stigler from the 1815 French ed.). 1 (4): 439–447. doi:10.1016/0315-0860(74)90034-2.
- Stigler, Stephen M. (1974). "Gergonne's 1815 paper on the design and analysis of polynomial regression experiments". Historia Mathematica. 1 (4): 431–439. doi:10.1016/0315-0860(74)90033-0.
- Smith, Kirstine (1918). "On the Standard Deviations of Adjusted and Interpolated Values of an Observed Polynomial Function and its Constants and the Guidance They Give Towards a Proper Choice of the Distribution of the Observations". Biometrika. 12 (1/2): 1–85. doi:10.1093/biomet/12.1-2.1. JSTOR 2331929.
외부 링크
이 글은 국립표준기술원 웹사이트 https://www.nist.gov의 공공 도메인 자료를 통합한 것이다.