데이터 기반 모델
Data-driven model데이터 기반 모델은 입력 변수, 내부 변수 및 출력 변수 간의 관계를 설정하기 위해 시스템 또는 프로세스의 수명 동안 수집된 과거 데이터에 주로 의존하는 계산 모델의 클래스입니다.수많은 기사와 출판물에서 흔히 볼 수 있는 데이터 기반 모델은 확률 분포에 대한 엄격한 가정에 의해 제기되는 한계를 극복하면서 이전의 통계 모델에서 발전했습니다.이러한 모델은 특히 빅 데이터, 인공 지능 및 기계 학습 시대에 다양한 분야에서 두각을 나타내었으며, 여기서 사용 가능한 데이터를 기반으로 귀중한 통찰력과 예측을 제공합니다.
배경
이러한 모형은 종종 지나치게 [1]제한적인 것으로 입증된 확률 분포에 대한 특정 가정을 기반으로 한 초기 통계 모형에서 발전했습니다.1950년대와 1960년대에 데이터 기반 모델의 출현은 디지털 컴퓨터의 발전, 인공지능 연구의 발전, 패턴 인식 및 자동 [2]분류와 같은 비행동 모델링의 새로운 접근법의 도입과 일치했습니다.
주요 개념
데이터 기반 모델은 대규모 데이터 세트를 지능적으로 처리하고 분석하는 것을 목표로 하는 광범위한 기술 및 방법론을 포함합니다.예를 들어 퍼지 논리, 불확실성 [3]처리를 위한 퍼지 및 러프 세트, 근사 [4]함수를 위한 신경망, 전역 최적화 및 진화 컴퓨팅,[5] 통계 학습 [6]이론 및 베이지안 [7]방법이 있습니다.이러한 모델은 [8]경제, 고객 관계 관리, 금융 서비스, 의료 및 군대를 포함한 다양한 분야에서 응용되고 있습니다.
인공지능의 하위 분야인 머신러닝은 과거 데이터를 사용하여 예측하고 [9]패턴을 식별할 수 있는 모델을 만드는 데도 중점을 두기 때문에 데이터 중심 모델링과 밀접한 관련이 있습니다.사실, 많은 데이터 기반 모델은 데이터를 [10]처리하고 분석하기 위해 회귀, 분류 및 클러스터링 알고리듬과 같은 기계 학습 기술을 통합합니다.
최근 몇 년 동안 데이터 기반 모델의 개념은 수자원 분야에서 상당한 관심을 끌었으며,[11] 수많은 응용 프로그램, 학술 과정 및 과학 출판물에서 물리학보다 데이터에 의존하는 모델의 일반화로 이 용어를 사용하고 있습니다.이 분류는 다양한 출판물에 소개되었으며 지난 10년 동안 하이브리드 모델의 개발에 박차를 가했습니다.하이브리드 모델은 수문 모델에 사용되는 물리적 기반 정보의 정도를 정량화하고 모델 구축 프로세스가 주로 물리학에 의해 주도되는지 아니면 순수하게 데이터 기반인지 결정하려고 합니다.결과적으로, 데이터 기반 모델은 수자원 관리 [12]및 연구 내에서 논의 및 탐색의 필수 주제가 되었습니다.
"데이터 기반 모델링"(DDM)이라는 용어는 머신 러닝 및 인공 지능을 포함한 고급 계산 기술과 함께 과거 데이터를 사용하여 근본적인 추세, 패턴, 경우에 따라 다음과 같은 모델을 만들 수 있는 전반적인 패러다임을 의미한다,예측을 하다[13] 데이터 기반 모델은 또는 를 사용하여 구축할 수 있습니다시스템 동작을 제어하는 기본 프로세스에 대한 자세한 지식이 없으면 이러한 지식이 누락되거나 [14]단편화될 때 특히 유용합니다.
레퍼런스
- ^ 데이비드, A. 프리드먼.(2006).소위 "허버 샌드위치 추정기"와 "강력한 표준 오류"에 대해.미국 통계학자, 60(4): 299-302.doi:10.1198/000313006X152207
- ^ 리처드, O., 두다, 피터, E., 하트 (1973)패턴 분류 및 장면 분석.
- ^ J., A., Goguen. (1973).자데 L.A..퍼지 집합.정보와 통제, 제8권 (1965), 338–353페이지자데 L.A..유사성 관계 및 퍼지 정렬.정보 과학, vol. 3 (1971), 페이지 177–200..기호논리학 저널, 38(4):656-657. doi:10.2307/2272014.
- ^ 사이먼, 헤이킨(2009).신경망과 학습 기계 3판: 사이먼 헤이킨.
- ^ David, E., Goldberg. (1988).검색, 최적화 및 기계 학습의 유전 알고리즘.앨라배마 대학교.
- ^ Vapnik, V. (1995).통계적 학습 이론의 성격.스프링거.
- ^ 폴, 휴슨(2015).베이지안 데이터 분석 3번째 edn A.겔만, J. B. 칼린, H. S. 스턴, D. B. 던슨, A.Vettari 및 D. B. Rubin, 2013 Boca Raton, Chapman 및 Hall-CRC 676 페이지, ISBN 1-4398-4095-4.왕립통계학회지 사회의 A-통계 시리즈, 178(1):301-301. doi:10.1111/J.1467-985X.2014.12096_1.X
- ^ Usama, M., Fayyad., Gregory, Piatetsky-Shapiro., Padhraic, Smyth. (1996).데이터 마이닝에서 데이터베이스의 지식 검색까지.Ai Magazine, 17(3):37-54. doi:10.1609/AIMAG.V17I3.1230
- ^ 미첼, T. M. (1997).기계 학습.컴퓨터 과학 분야의 맥그로 힐 시리즈.
- ^ Alpaydin, E. (2020).기계 학습 소개.MIT 출판사ISBN 978-0-262-01243-0
- ^ 로버트, 제이, 에이브라하트, 린다, 엠, 씨, 디미트리, 솔로마틴(2008).실용적인 수력 정보학: 물 응용 분야의 계산 지능과 기술 개발.
- ^ 지에이, 코르조, 페레즈(2009).수문 예측을 위한 하이브리드 모델: 데이터 기반 및 개념 모델링 기술의 통합.
- ^ 포스터, 프로보스트.톰, 포싯.(2013).비즈니스를 위한 데이터 과학:데이터 마이닝 및 데이터 분석적 사고에 대해 알아야 할 사항.
- ^ M., Cheng., Fangxin, Fang., Christopher, C., Pain., Ionel, Michael, Navon.(2020).심층 컨볼루션 생성 적대 네트워크를 사용한 비선형 시공간 유체 흐름의 데이터 기반 모델링.응용 기계 공학에서의 컴퓨터 방법, 365:113000-. doi:10.1016/J.CMA.2020.113000