그레이 박스 모델

Grey box model

수학, 통계, 계산 모델링에서 그레이 박스 모델[1][2][3][4] 부분 이론적 구조와 데이터를 결합하여 모델을 완성한다. 이론적 구조는 결과의 평활성에 관한 정보에서부터 데이터나 기존 문헌의 매개변수 값만 필요로 하는 모델에 이르기까지 다양할 수 있다.[5] 따라서 모델 형태가 가정되지 않는 블랙박스나 순수 이론적인 화이트박스 모델과는 달리 거의 모든 모델이 그레이박스 모델이다. 일부 모델은 선형 회귀[6][7] 신경망과 같은 특수한 형태를 가정한다.[8][9] 이것들은 특별한 분석 방법을 가지고 있다. 특히 선형 회귀 기법은[10] 대부분의 비선형 기법보다 훨씬 효율적이다.[11][12] 모델은 계획된 용도에 따라 결정론적이거나 확률적일 수 있다(즉, 무작위 구성요소를 포함한다).

모형형식

일반 사례는 부분 이론적 구조와 데이터에서 파생된 일부 미지의 부분을 가진 비선형 모델이다. 이론적 구조와 달리 모델을 개별적으로 평가해야 하며,[1][13][14] 시뮬레이션된 어닐링 또는 유전자 알고리즘을 사용할 수 있다.

특정 모델 구조 내에서 매개변수[14][15] 또는 가변 매개변수 관계를[5][16] 찾아야 할 수 있다. 특정 구조물의 경우 데이터가 피드 벡터 f, 제품 벡터 p 및 작동 조건 벡터 c의 집합으로 구성된다고 임의로 가정한다.[5] 일반적으로 c는 다른 값뿐만 아니라 f에서 추출한 값을 포함한다. 많은 경우에 모델은 형태 함수로 변환될 수 있다.[5][17][18]

m(f,p,q)

여기서 벡터 함수 m은 데이터 p와 모델 예측 사이의 오차를 제공한다. 벡터 q는 모델의 알 수 없는 부분인 몇 가지 변수 매개변수를 제공한다.

매개변수 q는 결정되는 방식으로 운전조건 c에 따라 달라진다.[5][17] 이 관계는 q = Ac로 지정할 수 있으며, 여기서 A는 알 수 없는 계수의 행렬이며, c는 선형 회귀에서와[6][7] 같이 원래 운영 조건의 상수 항과 변환된 값을 포함하여 원래 운영 조건과 q 사이의 비선형 관계를[19][20] 얻을 수 있다. 그렇다면 A에서 어떤 용어가 0이 아닌지를 선택하고 그 값을 할당하는 것이 문제다. 모델 완료는 데이터에 대한 오차항 m(f,p,Ac)을 최소화하는 A의 0이 아닌 값을 결정하는 최적화 문제가 된다.[1][16][21][22][23]

모델완료

일단 0이 아닌 값을 선택하면, 일반적으로 비선형 최소 제곱에 의해 A의 0이 아닌 값에 대한 데이터 위에 m(f,p,Ac)을 최소화함으로써 A의 나머지 계수를 결정할 수 있다. 0이 아닌 항은 시뮬레이션 어닐링진화 알고리즘과 같은 최적화 방법으로 선택할 수 있다. 또한 비선형 최소 제곱A 원소가 0과 유의하게 다른지 여부를 판단하는 데 사용할 수 있는 정확도 추정치를[11][15] 제공하여 항 선택 방법을 제공할 수 있다.[24][25]

직접 또는 비선형 최소 제곱으로 각 데이터 집합에 대한 q 값을 계산할 수도 있다. 그런 다음 c를 사용하여 q를 예측하여 A에서 0이 아닌 값을 선택하고 값을 추정하는 데 보다 효율적인 선형 회귀 분석을 사용할 수 있다. 0이 아닌 값이 위치하면 원래 모델 m(f,p,Ac)에서 비선형 최소 제곱을 사용하여 이러한 값을 세분화할 수 있다.[16][21][22]

세 번째 방법은 모델 반전이며,[5][17][18] 비선형 m(f,p,Ac)을 A의 요소에서 대략적인 선형 형태로 변환하여, 선형 회귀의 효율적인[24][25] 항 선택과 평가를 사용하여 조사할 수 있다.[10] q의 단일 q 값(q = acT)과 q의 추정 q*의 단순한 경우. dq = acT - q*는 다음과 같다.

m(f,p,acT) = m(f,p,q** + dq) m(f,p.q*) + dq m'(f,p,q*) = m(f,p.q*) + (acT -q*) m'(f,p,q*)

따라서 aT 이제 알려진 다른 모든 용어와 함께 선형 위치에 있으므로 선형 회귀 기법으로 분석할 수 있다. 둘 이상의 매개 변수에 대해 방법은 직접적인 방식으로 확장된다.[5][18][17] 모델이 개선되었는지 확인한 후 수렴할 때까지 이 과정을 반복할 수 있다. 이 접근방식은 개별 데이터 집합에서 결정할 수 있는 매개변수 q가 필요하지 않으며 선형 회귀가 원래 오차항에[5] 있다는 장점이 있다.

모델 유효성 검사

충분한 데이터가 있는 경우, 데이터를 별도의 모델 구축 세트와 한두 개의 평가 세트로 나누는 것이 좋다. 이는 시공 세트와 결과 모델의 평균을 여러 번 선택하거나 예측 차이를 평가하는 데 사용할 수 있다.

잔차의 카이-제곱과 같은 통계적 검정은 특별히 유용하지 않다.[26] 카이 제곱 테스트는 거의 사용할 수 없는 알려진 표준 편차를 요구하며, 실패한 테스트는 모델을 개선하는 방법을 표시하지 않는다.[11] 내포된 모형과 비내포된 모형을 모두 비교할 수 있는 다양한 방법이 있다. 여기에는 반복된 데이터와 모형 예측의 비교가 포함된다.

선형 회귀 분석을 사용하여 작동 조건 c로 잔차 m(, )을 예측하려고 하면 잔차를 예측할 수 있는지 여부를 알 수 있다.[21][22] 예측할 수 없는 잔차는 현재 작동 조건을 사용하여 모형을 개선할 가망성이 거의 없다.[5] 잔차를 예측하는 항은 성능을 개선하기 위해 모형에 통합해야 하는 전진 항입니다.[21]

위의 모델 반전 기법은 모델을 개선할 수 있는지 여부를 판단하는 방법으로 사용할 수 있다. 이 경우 0이 아닌 항을 선택하는 것은 그다지 중요하지 않으며 선형 예측은 회귀 행렬의 유의한 고유 벡터를 사용하여 수행할 수 있다. 이러한 방식으로 결정된 A의 값은 모델 오류의 개선을 평가하기 위해 비선형 모델로 대체될 필요가 있다. 유의한 개선이 없다는 것은 이용 가능한 데이터가 정의된 매개변수를 사용하여 현재 모델 형태를 개선할 수 없다는 것을 의미한다.[5] 이 테스트를 보다 포괄적으로 만들기 위해 모델에 추가 파라미터를 삽입할 수 있다.

참고 항목

참조

  1. ^ a b c Bohlin, Torsten P. (7 September 2006). Practical Grey-box Process Identification: Theory and Applications. Springer Science & Business Media. ISBN 978-1-84628-403-8.
  2. ^ "Grey-box model estimation". Mathworks 2. 2012.
  3. ^ 크롤, 안드레아스(2000년) 회색 상자 모델: 개념 및 응용 프로그램. In: New Frontiers in Computing Intelligence and it Applications, vol.57 of Frontiers in 인공지능 및 애플리케이션, 42-51페이지. 암스테르담의 IOS 프레스.
  4. ^ 2008년 소흘버그, B, 제이콥슨, E.W. 회색 상자 모델링 - 분기와 경험, 17차 세계 회의, Int. 서울자동제어연맹. 페이지 11415-11420
  5. ^ a b c d e f g h i j 휘튼, B, 2013년 그레이 박스 모델인 ANZIAM J.54(CTAC 2012) 페이지 C187–C199의 역전을 이용한 모델 완성검증.
  6. ^ a b Draper, Norman R.; Smith, Harry (25 August 2014). Applied Regression Analysis. John Wiley & Sons. pp. 657–. ISBN 978-1-118-62568-2.
  7. ^ a b Weisberg, Sanford (25 November 2013). Applied Linear Regression. Wiley. ISBN 978-1-118-59485-8.
  8. ^ 히튼, J, 2012년 신경망 수학 소개, 히튼 리서치 주식회사(Chesterfield, MO), ISBN 978-1475190878
  9. ^ Stergiou, C.; Siganos, D. (2013). "Neural networks". Archived from the original on 2009-12-16. Retrieved 2013-07-03.
  10. ^ a b Lawson, Charles L.; J. Hanson, Richard (1 December 1995). Solving Least Squares Problems. SIAM. ISBN 978-0-89871-356-5.
  11. ^ a b c Press, W.H.; Teukolsky, S.A.; Vetterling, W.T.; Flannery, B.P. (2007). Numerical Recipes (3rd ed.). Cambridge University Press. ISBN 978-0-521-88068-8.
  12. ^ Gelman, Andrew; Carlin, John B.; Stern, Hal S.; Dunson, David B.; Vehtari, Aki; Rubin, Donald B. (1 November 2013). Bayesian Data Analysis, Third Edition. CRC Press. ISBN 978-1-4398-4095-5.
  13. ^ 2013년 수학공부. 지원되는 회색 상자 모델
  14. ^ a b Hauth, J. (2008), Grey Box Modelling for Nonlinear Systems (PDF) (dissertation, Kaiserslautern University of Technology).
  15. ^ a b 내시, J.C.와 워커 스미스, M. 1987. 비선형 모수 추정, Marcel Dekker, Inc.(뉴욕)
  16. ^ a b c 위튼, 1971년 W.J. 광물 처리 공정에 적용되는 모델 건축 기법, Common. on Mineral Processing Plants(호주)의 자동 제어 시스템에 적용. 129-148, S. 퀸즐랜드 브랜치, 브리즈번, Metal, S. 퀸즐랜드 브랜치.
  17. ^ a b c d 휘튼, 1994년 W.J. 비선형 모델, SIGNUM 뉴스레터, 29(3–4), 2–5. 10.1145/192527.192535.
  18. ^ a b c 휘튼, B, 2014년 모델 반전, ANZIAM J. 55 (EMAC2013) pp를 사용하여 일반 미분 방정식의 형태를 결정한다.C329-C347.
  19. ^ 다항식
  20. ^ 스플라인(수학)
  21. ^ a b c d 코조비치, T. 그리고 휘튼 W. J., 1994. 시뮬레이션 모델의 품질 평가, 광물 처리의 혁신, (Lauretian University, Sudbury) 페이지 437–446. ISBN 088667025X
  22. ^ a b c 코조비치, T. 1989년 모델 - 광물 처리를 위한 자동화된 모델 제작자, PhD 논문, 퀸즐랜드 대학교의 개발 및 적용.
  23. ^ 샤오, J, 1998년 모델 건축 기법의 확장 및 광물 처리, PhD 논문, 퀸즐랜드 대학교.
  24. ^ a b Linhart, H.; Zucchini, W. (1986). Model selection. Wiley. ISBN 978-0-471-83722-0.
  25. ^ a b Miller, Alan (15 April 2002). Subset Selection in Regression. CRC Press. ISBN 978-1-4200-3593-3.
  26. ^ Deming, William Edwards (2000). Out of the Crisis p272. MIT Press. ISBN 978-0-262-54115-2.