대리 데이터

Surrogate data

대리 데이터([1]유사 데이터라고도 함)는 일반적으로 측정된 데이터 [2]집합의 자기 상관 구조와 같은 다양한 통계 특성을 재현하는 ARMA 프로세스와 같은 잘 정의된(선형) 모델을 사용하여 생성되는 시계열 데이터를 말합니다.결과 대리 데이터는 예를 들어 경험적 데이터의 비선형 구조에 대한 검정에 사용될 수 있습니다. 대리 데이터 검정을 참조하십시오.

대리 데이터 또는 유사한 데이터는 수학적 모델이 구축되는 사용 가능한 데이터를 보완하는 데 사용되는 데이터를 참조할 수 있습니다.이 정의에 따라, 다른 [1]소스에서 생성되거나(, 합성 데이터) 변환될 수 있다.

사용하다

대리 데이터는 환경 및 실험실 환경에서 사용되며, 한 출처의 연구 데이터가 다른 [3]출처의 특성 추정에 사용된다.예를 들어, 그것은 동물 [4]종들의 개체수 추이를 모델링하는데 사용되어 왔다.또한 [5]특정 지역의 모든 종에 대한 실제 데이터를 수집하기가 어렵기 때문에 생물 다양성을 모델링하는 데에도 사용될 수 있다.

대리 데이터는 예측에 사용할 수 있습니다.예측 [6]정확도를 높이기 위해 유사한 영상 시리즈의 데이터를 풀링할 수 있습니다.대리 데이터를 사용하면 모형이 과거 데이터에서 [7]볼 수 없는 패턴을 설명할 수 있습니다.

대리 데이터의 또 다른 용도는 모형의 비선형성을 검정하는 것입니다.대리 데이터 테스트라는 용어는 이러한 [8]방식으로 모형을 분석하는 데 사용되는 알고리즘을 가리킵니다.이러한 검정은 일반적으로 데이터 생성을 수반하는 반면, 일반적으로 대리 데이터는 여러 [1]가지 방법으로 생성되거나 수집될 수 있습니다.

방법들

대용 데이터의 한 가지 방법은 유사한 조건이나 매개변수를 가진 소스를 찾아 [4]모델링에 사용하는 것입니다.또 다른 방법은 기본 시스템의 패턴에 초점을 맞추고 관련 데이터 소스에서 유사한 패턴(예를 들어 다른 관련 종이나 환경 [5]영역에서의 패턴)을 검색하는 것이다.

별도의 소스로부터의 기존 데이터를 사용하는 대신, 통계 프로세스를 [2]통해 대리 데이터를 생성할 수 있으며, 이는 모델 또는 [8]시스템의 제약을 이용한 무작위 데이터 생성을[1] 수반할 수 있다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b c d Kaefer, Paul E. (2015). Transforming Analogous Time Series Data to Improve Natural Gas Demand Forecast Accuracy (M.Sc. thesis). Marquette University. Retrieved 2016-02-18.
  2. ^ a b Prichard; Theiler (1994). "Generating surrogate data for time series with several simultaneously measured variables" (PDF). Physical Review Letters. 73 (7): 951–954. arXiv:comp-gas/9405002. Bibcode:1994PhRvL..73..951P. doi:10.1103/physrevlett.73.951. PMID 10057582. S2CID 32748996.
  3. ^ "Surrogate Data Meaning". Columbia Analytical Services, Inc., now ALS Environmental. Retrieved February 15, 2017. What is Surrogate Data? Data from studies of test organisms or a test substance that are used to estimate the characteristics or effects on another organism or substance.
  4. ^ a b Hernández-Camacho, Claudia J.; Bakker, Victoria. J.; Aurioles-Gamboa, David; Laake, Jeff; Gerber, Leah R. (September 2015). Aaron W. Reed (ed.). "The Use of Surrogate Data in Demographic Population Viability Analysis: A Case Study of California Sea Lions". PLOS ONE. 10 (9): e0139158. Bibcode:2015PLoSO..1039158H. doi:10.1371/journal.pone.0139158. PMC 4587556. PMID 26413746.
  5. ^ a b Faith, D.P.; Walker, P.A. (1996). "Environmental diversity: on the best-possible use of surrogate data for assessing the relative biodiversity of sets of areas". Biodiversity and Conservation. Springer Nature. 5 (4): 399–415. doi:10.1007/BF00056387. S2CID 24066193.
  6. ^ Duncan, George T.; Gorr, Wilpen L.; Szczypula, Janusz (2001). "Forecasting Analogous Time Series". In J. Scott Armstrong (ed.). Principles of Forecasting: A Handbook for Researchers and Practitioners. Kluwer Academic Publishers. pp. 195–213. ISBN 0-7923-7930-6.
  7. ^ Kaefer, Paul E.; Ishola, Babatunde; Brown, Ronald H.; Corliss, George F. (2015). Using Surrogate Data to Mitigate the Risks of Natural Gas Forecasting on Unusual Days (PDF). International Institute of Forecasters: 35th International Symposium on Forecasting. forecasters.org/isf.
  8. ^ a b Schreiber, Thomas; Schmitz, Andreas (1999). "Surrogate time series". Physica D. 142 (3–4): 346–382. arXiv:chao-dyn/9909037. Bibcode:2000PhyD..142..346S. CiteSeerX 10.1.1.46.3999. doi:10.1016/s0167-2789(00)00043-9. S2CID 13889229.

추가 정보