지구과학 기계학습
Machine learning in earth sciences지구과학에서의 기계학습의 응용에는 지질지도, 가스누출검출 및 지질특징 식별이 포함된다.머신 러닝(ML)은 컴퓨터 시스템이 명시적인 명령과 프로그래밍을 [1]필요로 하지 않으면서 방대한 데이터 세트를 분류, 클러스터링, 식별 및 분석할 수 있도록 하는 인공지능(AI)의 일종입니다.지구과학은 지구의 기원, 진화, 그리고[2] 미래에 대한 학문이다.지구 시스템은 고체 지구, 대기권, 수권,[3] 생물권을 포함한 4개의 주요 요소로 세분될 수 있다.
지구과학 탐사의 성격에 따라 다양한 알고리즘이 적용될 수 있다.일부 알고리즘은 특정 목표에 대해 다른 알고리즘보다 훨씬 더 나은 성능을 발휘할 수 있습니다.예를 들어, 컨볼루션 뉴럴 네트워크(CNN)는 이미지 해석에 뛰어나고, 인공 뉴럴 네트워크(ANN)는 토양 분류에서[4] 잘 수행되지만, SVM(support-vector machine) 학습보다 훈련하는 데 계산 비용이 더 많이 든다.머신러닝의 응용은 무인항공기(UAV),[5] 초고해상도 원격감지 기술 및 고성능 컴퓨팅[6] 유닛과 같은 다른 기술의 개발로 인해 대규모 고품질 데이터셋과 고급 알고리즘의 가용성으로 이어지면서 최근 수십 년 동안 인기를 끌고 있다.
중요성
지구과학의 복잡성
지구과학의 문제들은 종종 [7]복잡하다.잘 알려져 있고 설명된 수학적 모델을 자연 환경에 적용하는 것은 어렵기 때문에 기계 학습은 일반적으로 이러한 비선형 [8]문제에 대한 더 나은 대안이다.생태학적 데이터는 일반적으로 비선형이며 고차 상호작용으로 구성되며,[9][10] 결측 데이터와 함께 선형성과 같은 비현실적인 가정이 모델에 적용되므로 기존 통계는 성능이 저하될 수 있다.많은 연구자들은 기계 학습이 삼림 캐노피 [11]구조의 특성화, 기후에 의한 범위 변화 [12]예측, 지질학적 측면의 묘사 [13]등 지구과학의 전통적인 통계 모델을 능가한다는 것을 발견했다.숲의 덮개 구조를 특징짓는 것은 과학자들이 기후 [14]변화에 대한 식생 반응을 연구할 수 있게 해준다.기후에 의한 범위 변화를 예측함으로써 정책 입안자들은 기후 [15]변화의 결과를 극복하기 위한 적절한 대화 방법을 채택할 수 있다.지질학적 측면을 묘사하는 것은 지질학자들이 지역의 [16]개발과 관리에 필수적인 지질학을 이해하는 데 도움이 된다.
액세스 불능 데이터
지구과학에서는 일부 데이터는 종종 접근하거나 수집하기 어렵기 때문에 기계학습 방법으로 쉽게 구할 수 있는 데이터에서 데이터를 추론하는 것이 [10]바람직하다.예를 들어, 열대 우림의 지질 지도는 두꺼운 식생과 암반 돌출부가 잘 [17]드러나지 않기 때문에 어렵다.머신러닝 어프로치를 사용한 리모트센싱의 적용은 도달 불가능한 [17]영역에 수동으로 매핑할 필요 없이 신속한 매핑을 위한 대체 방법을 제공합니다.
시간 비용 절감
분류와 주석 등의 수작업이 지구과학 [10]연구 흐름의 병목현상이기 때문에 기계학습은 전문가의 노력을 줄일 수도 있다.지리학적 매핑은 특히 광활한 외딴 지역에서 전통적인 [18]방법으로는 노동력, 비용 및 시간 집약적입니다.원격 감지 및 기계 학습 접근 방식을 통합하면 일부 필드 매핑 요구를 [18]제거할 수 있는 대체 솔루션을 제공할 수 있습니다.
일관성과 편견이 없음
인간의 수작업에 비해 일관성과 편견이 없는 것도 기계학습의 장점이다.다이노플라겔라테스의 식별에 있어서 인간과 기계 학습의 성과를 비교한 연구에서 기계 학습은 [19]인간만큼 체계적인 편견이 있는 경향이 없는 것으로 밝혀졌다.인간에게 존재하는 반복 효과는 분류가 종종 가장 최근에 소환된 [19]계층으로 편향된다는 것이다.이 연구의 라벨링 작업에서, 한 종류의 다이노플라겔라테가 샘플에서 거의 발생하지 않는 경우, 전문 생태학자들은 일반적으로 이것을 올바르게 [19]분류하지 않을 것이다.체계적 편견은 인간의 [19]분류정확도를 크게 악화시킨다.
최적의 머신 러닝 알고리즘
다양한 분야에서 기계학습이 광범위하게 사용됨에 따라 다양한 학습방법 알고리즘이 적용되고 있다.기계학습 알고리즘은 지구과학 문제를 푸는 데 응용되어 [20][4][7]연구자들에게 많은 관심을 불러일으켰다.특정 목적에 적합한 알고리즘을 선택하면 [21]정확도가 크게 향상될 수 있습니다.예를 들어, AVIRIS-NG 초분광 데이터를 사용한 인도 Hutti의 금 함유 화강암-그린스톤 암석의 암석학적 매핑은 Support Vector Machine(SVM)과 랜덤 [22]포레스트 간의 전체 정확도에서 10% 이상의 차이를 보인다.일부 알고리즘은 몇 가지 중요한 정보를 공개할 수도 있습니다.'화이트박스 모델'은 결과와 방법론을 쉽게 설명할 수 있는 투명 모델인 반면 '블랙박스' 모델은 그 [21]반대다.예를 들어 Support-Vector Machine(SVM; 지원 벡터 머신)이 산사태의 민감도 평가 정확도에서 가장 좋은 결과를 얻었지만, 그 결과는 영역이 특정 [7]클래스로 분류된 방법과 이유를 설명하는 전문가 규칙의 형태로 다시 쓰여질 수 없습니다.이와는 대조적으로, 의사결정 트리는 이해하기 쉬운 투명한 모델을 가지며,[7] 사용자는 모델에 편견이 있는 경우 이를 관찰하고 수정할 수 있다.계산 능력이 우려되는 경우, 인공 신경망이 토양 [4]분류와 같은 다른 알고리즘을 약간 능가할 수 있다는 사실에도 불구하고 인공 신경망과 같은 보다 계산 요구가 까다로운 학습 방법은 덜 선호된다.
다음은 일반적으로 적용되는 알고리즘의 [23]주요 내용입니다.
서포트 벡터 머신(SVM)
Support Vector Machine(SVM)에서는 교육 프로세스 중에 녹색과 빨간색 점으로 표시된 교육 데이터 세트에 의해 의사 결정 경계가 결정되었습니다.보라색 데이터는 결정 경계 아래에 있으므로 빨간색 클래스에 [7]속합니다.가장 가까운 K개의 네이버
가장 가까운 K 인접 라우터는 유사성에 따라 데이터를 분류합니다.k는 투표 프로세스에 고려되는 네이버 수를 나타내는 파라미터입니다.예를 들어, 그림 k = 4에서는 가장 가까운 4개의 인접 라우터가 고려됩니다.가장 가까운 4개의 이웃에서 3개는 빨간색 클래스에 속하고 1개는 녹색 클래스에 속합니다.보라색 데이터는 빨간색 [24]클래스로 분류됩니다.Decision Tree(결정 트리)
Decision Tree는 관련 선택에서 발생할 수 있는 결과를 보여줍니다.Decision Tree는 Classification Tree와 Regression Tree로 나눌 수 있습니다.위 그림은 출력이 이산 클래스이기 때문에 분류 트리를 보여줍니다.회귀 트리의 경우 출력은 숫자입니다.이것은 화이트 박스 모델로 투명하며 사용자가 모델에 [7]편견이 있는 경우 이를 발견할 수 있습니다.랜덤 포레스트
랜덤 포레스트에서는 복수의 결정 트리가 앙상블 방법으로 함께 사용된다.모델을 교육하는 동안 다중 의사결정 트리가 생성됩니다.다른 Decision Tree가 다양한 결과를 포기할 수 있습니다.과반수 투표/평균화 과정을 통해 최종 결과가 발표됩니다.이 방법을 사용하면 단일 Decision Tree만 [22]사용하는 정확도가 높아집니다.뉴럴 네트워크
뉴럴 네트워크는 생물학적 뇌의 뉴런을 모방합니다.여러 개의 레이어로 구성되어 있으며, 그 사이의 레이어는 숨겨진 레이어입니다.연결의 무게는 교육 프로세스 중에 조정됩니다.그 사이의 논리가 불분명하기 때문에 '블랙박스 조작'이라고 한다.CNN(Convolutional Neural Network)[24]은 영상 처리에 일반적으로 사용되는 뉴럴 네트워크의 하위 클래스입니다.
사용.
매핑
지질학적 또는 암석학적 매핑 및 광물 전망 매핑
지질학적 또는 암석학적 매핑은 지질학적 특징과 지질학적 단위를 보여주는 지도를 만든다.광물 전망 매핑은 지질 지도, 항공 자기 이미지 등과 같은 다양한 데이터 세트를 활용하여 광물 탐사에 특화된 지도를 제작합니다.원격감지와 지구물리학 데이터에서 [25]얻은 스펙트럼 이미지를 입력해 기계학습 기술로 데이터를 처리함으로써 지질/석질학적 매핑과 광물적 전망 매핑을 수행할 수 있다.스펙트럼 이미지는 전자파 스펙트럼에서 선택된 전자파장 대역을 이미징하는 것이며, 기존 이미징은 전자파 [26]스펙트럼에서 세 가지 파장 대역(빨강, 녹색, 파랑)을 캡처합니다.랜덤 포레스트 및 서포트 벡터 머신(SVM) 등은 원격 감지 지구물리학 데이터에 사용되는 일반적인 알고리즘이며, SLIC-CNN([5]단순 선형 반복 클러스터링-컨볼루션 뉴럴 네트워크) 및 컨볼루션 뉴럴 네트워크(CNN)[18] 등은 항공 사진 및 이미지를 다룰 때 일반적으로 적용된다.공중 및 위성 원격 감지 지구물리 데이터의 [22]지구물리 데이터로 대규모 매핑을 수행할 수 있으며,[5] 고해상도를 위해 무인항공기(UAV)의 이미지로 소규모 매핑을 수행할 수 있습니다.
식생 커버는 대규모 및 소규모 매핑 모두에서 다양한 연구에서 보고된 바와 같이 원격 감지를 통한 지질 매핑의 주요 장애물 중 하나이다.식생은 스펙트럼[25] 이미지의 품질에 영향을 미치거나 항공 [5]이미지에서 암석 정보를 흐리게 한다.
객관적으로 | 입력 데이터 세트 | 위치 | 머신 러닝 알고리즘(MLA) | 성능 |
---|---|---|---|---|
금을 함유한 화강암-녹석[22] 암석의 암석학적 매핑 | AVIRIS-NG 초분광 데이터 | 인도 후티 | 선형 판별 분석(LDA), 랜덤 포레스트, | 지원 벡터 머신(SVM)이 다른 머신 러닝 알고리즘(MLA)을 능가하는 퍼포먼스 |
열대우림의[17] 암석학적 지도 | 자기 벡터 반전, 3차 RGB 지도, 밴드 4, 3, 2를 조합한 Landsat 8의 거짓 색상(RGB) | 브라질, 신젠토 리나멘트 | 랜덤 포레스트 | 다음 두 가지 예측 맵이 생성되었습니다. (1) 원격감지 데이터로 생성된 지도는 지질도 대비 정확도가 52.7%에 불과하나, 몇 가지 새로운 암석학적 단위가 확인된다. (2) 원격감지 데이터와 공간적 제약으로 생성된 지도는 정확도가 78.7%이지만 새로운 암석학적 단위가 식별되지 않음 |
광물[27] 탐사를 위한 지질도 | 프로그레시브 스캔 SAR(TopSAR)를 통한 공중 편파 지형 관측, 지구 물리학 데이터 | 서태즈메이니아 주 | 랜덤 포레스트 | 지질학적 매핑에 대한 TopSAR의 신뢰성은 낮지만 지구물리학적 데이터로 정확합니다. |
지질 및 광물학적 매핑[citation needed] | 멀티 스펙트럼 및 하이퍼 스펙트럼 위성 데이터 | 중부 제빌레트 모로코 | 서포트 벡터 머신(SVM) | 분류에 초분광 데이터를 사용하는 정확도는 멀티 스펙트럼 데이터를 사용하는 것보다 약간 높아 각각 93.05%와 89.24%를 얻어 기계 학습이 광물 탐사에 신뢰할 수 있는 도구임을 보여준다. |
다중 물리 데이터를 클러스터[28] 맵에 통합 | 공기 자성체, 주파수 전자파, 방사선 측정, 지면 중력 측정 | 트뢰넬라그, 미드노르웨이 | 랜덤 포레스트 | 생성된 클러스터 지도는 기존 지질 지도와 만족스러운 관계를 가지지만 사소한 부적합과는 관련이 있다. |
무인항공기(UAV)[5]를 이용한 고해상도 지질도 | 초해상도 RGB 이미지 | 타일리 워터프론트 랴오닝 성 중국 | 단순 선형 반복 클러스터링-컨볼루션 뉴럴 네트워크(SLIC-CNN) | 그 결과 주요 지질단위 지도 작성에서는 만족스러웠지만 페그마타이트, 미세암, 제방 지도 작성에서는 저조한 성능을 보였다.UAV는 암석이 노출되지 않은 곳의 암석 정보를 수집할 수 없었다. |
지표면 지질도[18] 리모트 예측 매핑(RPM) | 항공 사진, Landsat 리플렉턴스, 고해상도 디지털 표고 데이터 | 남래 지질 지역 노스웨스트 준주 캐나다 | 컨볼루션 뉴럴 네트워크(CNN), 랜덤 포레스트 | 결과적으로 CNN의 정확도는 국지적으로 훈련받은 영역에서 76%였고, 독립적인 테스트 영역의 경우 68%였다.CNN은 랜덤 포레스트보다 약간 높은 4%의 정확도를 달성했다. |
산사태 발생률 및 위험도 매핑
산사태 발생률이란 지역의 [29]지형 상황에 따라 산사태가 발생할 가능성을 말합니다.산사태 발생률 지도는 도시계획 및 재해관리 [7]업무에 유용한 산사태 위험 지역을 강조 표시할 수 있다.기계 학습 알고리즘의 입력 데이터 세트에는 지형 정보, 암석 정보, 위성 이미지 등이 포함되며, 일부는 토지 사용, 토지 커버, 배수 정보, 연구 요구에 따른 식생[7][30][31][32] 커버 등이 포함될 수 있다.산사태 민감도 매핑을 위한 기계 학습 훈련에서는 훈련 및 테스트 데이터 세트가 필요하다.[7]교육 및 테스트를 위해 데이터 세트를 할당하는 방법에는 두 가지가 있습니다. 하나는 데이터 세트의 스터디 영역을 무작위로 분할하는 방법이고, 다른 하나는 전체 스터디를 두 데이터 세트의 인접한 두 부분으로 분할하는 방법입니다.분류 모델을 테스트하기 위해서는 연구 영역을 무작위로 두 [7][33]개의 데이터셋으로 분할하는 것이 일반적이지만, 자동화 알고리즘이 인접 [7]토지의 전문가 처리 데이터 입력으로 새로운 영역의 매핑을 수행할 수 있도록 연구 영역을 두 개의 인접 부분으로 분할하는 것이 더 유용하다.
객관적으로 | 입력 데이터 세트 | 위치 | 머신 러닝 알고리즘(MLA) | 성능 |
---|---|---|---|---|
산사태 감수성 평가[7] | 디지털 표고 모델(DEM), 지질도, 30m 랜드샛 이미지 | 프루슈카 고라 산 세르비아 | 서포트 벡터 머신(SVM), Decision Tree, | 서포트 벡터 머신(SVM)의 퍼포먼스가 다른 제품보다 우수하다 |
산사태 감수성[33] 맵핑 | ASTER 위성 기반 지형 데이터, 지질도 | 혼슈 섬 일본. | 인공신경망(ANN) | 산사태 발생확률의 90%이상의 정확도. |
등급별[30] 산사태 민감도 구역 | 공간 데이터 레이어: 기울기, 측면, 상대적 완화, 암석학, 구조 피쳐, 토지 이용, 육지 커버, 배수 밀도 | 우타라크핸드 주 차몰리 및 루드라프라야그 지구의 일부 인도 | 인공신경망(ANN) | 이 접근법의 AUC는 0.88에 도달합니다.이 접근방식을 통해 산사태 위험에 대한 정확한 평가가 이루어졌다. |
지역별 산사태 위험[31] 분석 | 지형 경사, 지형적 측면, 지형적 곡률, 배수구로부터의 거리, 암석학, 라인먼트로부터의 거리, TM 위성 이미지에서 육지 커버, 식생지수(NDVI), 강수량 데이터 | 셀랑고르 주 동부는 말레이시아 | 인공신경망(ANN) | 이 접근법은 82.92%의 예측 정확도를 달성했습니다. |
기능 식별 및 검출
불연속 분석
단층면, 침상면 등과 같은 불연속성은 [34]엔지니어링에서 중요한 의미를 가집니다.암석파열은 간섭물체, 막대 모양의 식생 [35]등 존재여도 사진 측량 분석을 통해 기계학습으로 자동인식이 가능하다.이미지를 분류하기 위한 머신 트레이닝에서 데이터 증강은 트레이닝 데이터셋의 [35]과적합을 방지하고 증가시키기 위한 일반적인 방법입니다.예를 들어 암석 골절 인식 연구에서는 훈련용 68개의 이미지와 테스트 데이터 세트용 23개의 이미지를 랜덤 [35]분할하여 준비했습니다.그런 다음 데이터를 보강하고 플립 [35]및 랜덤 자르기 방식으로 교육 데이터 세트를 8704개의 이미지로 늘렸습니다.그 접근법은 대부분의 경우 [35]암석 파열을 정확하게 인식할 수 있었다.음의 예측값(NPV)과 특이도는 0.[35]99를 초과했습니다.이는 기계 학습과 함께 불연속 분석의 견고성을 입증했다.
객관적으로 | 입력 데이터 세트 | 위치 | 머신 러닝 알고리즘(MLA) | 성능 |
---|---|---|---|---|
암석[35] 균열의 인식 | 현장 조사에서 수집된 바위 이미지 | 관악산, 북한산, 서울, 코리아 그리고. 강원도 정선군 코리아 | 컨볼루션 뉴럴 네트워크(CNN) | 그 접근법은 대부분의 경우 암석 파열을 정확하게 인식할 수 있었다.음수 예측 값(NPV)과 특수성이 0.99를 초과합니다. |
이산화탄소 누출 검출
이산화탄소가 안전하고 효과적으로 [36]지하에 저장되는지에 대한 대중의 관심이 높아짐에 따라 지질학적 격리현장에서 배출되는 이산화탄소를 정량화하는 것에 대한 관심이 높아지고 있다.지질학적 격리장소는 온실가스를 포획하고 지질층의 깊은 지하에 매장하는 것이다.지질학적 격리 장소로부터의 이산화탄소 누출은 원격감지와 비감독 클러스터링 알고리즘(ISODATA)[37]의 도움을 받아 행성 응력 응답에 의해 간접적으로 검출할 수 있다.토양2 CO 농도의 증가는 이산화탄소에 [38]의해 산소가 치환되면서 식물에 대한 스트레스 반응을 일으킨다.식생에 의한 스트레스 신호는 REI([38]Red Edge Index)를 사용하여 검출할 수 있습니다.초분광 영상은 유사한 식물 [38]반응을 가진 픽셀을 클러스터링하는 비감독 알고리즘에 의해 처리됩니다.CO 누출이 알려진2 영역의 초분광 정보를 추출하여 CO 누출이 있는2 영역을 스펙트럼 [38]이상이 있는 클러스터된 픽셀과 일치시킬 수 있도록 했다.접근방식을 통해 CO 누출을 효율적으로2 식별할 수 있지만 추가 [38]연구가 필요한 몇 가지 한계가 있다.붉은 가장자리 지수(REI)는 높은 엽록소 흡수, 식생 변화, 그림자 효과 등의 이유로 정확하지 않을 수 있습니다.따라서 일부 스트레스 받은 픽셀이 건강한 [38]픽셀로 잘못 식별되었습니다.계절성, 지하수 테이블 높이 또한 [38]식물의 CO에2 대한 스트레스 반응에 영향을 미칠 수 있다.
객관적으로 | 입력 데이터 세트 | 위치 | 머신 러닝 알고리즘(MLA) | 성능 |
---|---|---|---|---|
지질학적[37] 격리현장에서 CO2 누출 검출 | 항공 초분광 이미지 | 배출 제로 연구 및 테크놀로지(ZERT), 미국 | 반복적 자기조직화 데이터 분석 기술(ISODATA) 방법 | 이 접근법은 CO 누출 지역을2 탐지할 수 있었지만, 식물의 생장기와 같은 다른 요인들도 결과를 방해했습니다. |
유입수 정량화
암석질량평가(RMR) 시스템은[39] 6개의 매개변수를 입력해 지구기계적 수단에 의한 세계적으로 채택된 암석질량분류시스템이다.물의 유입량은 지하수 상태를 나타내는 분류 체계 입력 중 하나이다.암석 터널 면의 물 유입량 정량화는 전통적으로 현장에서 육안으로 관찰하여 수행되었으며, 이는 안전상의 [40]문제로 인해 노동력과 시간이 소요됩니다.기계학습은 건설현장에서 [40]촬영한 영상을 분석하여 물의 유입량을 파악할 수 있다.접근법의 분류는 대부분 RMR 시스템을 따르지만, 육안 [40][39]검사만으로 구별하기 어려운 습기와 습기 상태를 조합한다.이미지는 비손상 상태, 습윤 상태, 물방울 상태, 유동 상태 및 분출 [40]상태로 분류되었습니다.영상을 분류하는 정확도는 [40]약 90%였습니다.
객관적으로 | 입력 데이터 세트 | 위치 | 머신 러닝 알고리즘(MLA) | 성능 |
---|---|---|---|---|
암석터널면[40] 유입수 정량 | 유입수 이미지 | - | 컨볼루션 뉴럴 네트워크(CNN) | 접근법은 93.01%의 평균 정확도를 달성했다. |
분류
토양분류
토양 조사 방법에서 가장 비용 효율적인 방법은 CPT([41]Cone Intraction Testing)입니다.테스트는 금속 원뿔을 토양에 밀어넣는 방식으로 수행되며 일정한 속도로 밀어내는 데 필요한 힘은 준연속 로그로 [4]기록된다.기계 학습은 원뿔 침투 테스트 로그 데이터를 [4]입력하여 토양을 분류할 수 있습니다.기계 학습을 사용하여 분류하기 위해 데이터 분석에 필요한 두 가지 작업, 즉 세분화와 분류 [4]부분이 있다.분할 부분은 CONCC(Constraint Clustering and Classification) 알고리즘을 사용하여 단일 영상 시리즈 데이터를 [4]세그먼트로 분할할 수 있습니다.분류 부분은 Decision Tree(DT), 인공신경망(ANN) 또는 Support Vector Machine(SVM)[4]으로 수행할 수 있습니다.세 가지 알고리즘을 비교하는 동안 인공신경망(ANN)이 부식질 점토와 이탄 분류에서 가장 잘 수행되었고, Decision Tree가 점토 이탄 [4]분류에서 가장 잘 수행되었음을 입증했다.이 방법에 의한 분류는 매우 높은 정확도에 도달할 수 있으며, 가장 복잡한 문제의 경우에도 정확도는 83%였으며, 잘못 분류된 분류는 지질학적으로 인접했다.[4]이러한 정확도는 대부분의 전문가에게 충분하다는 사실을 고려하면,[4] 그러한 접근법의 정확도는 100%라고 볼 수 있다.
객관적으로 | 입력 데이터 세트 | 위치 | 머신 러닝 알고리즘(MLA) | 성능 |
---|---|---|---|---|
토양분류[4] | 콘 침투 테스트(CPT) 로그 | - | Decision Tree, 인공신경망(ANN), 서포트 벡터 머신 | 인공신경망(ANN)은 부식질 점토와 이탄을 분류하는 데 있어 다른 점토와 이탄을 분류하는 데 있어 다른 점토와 이탄을 분류하는 데 있어 Decision Tree가 더 뛰어났다.Support Vector Machine은 세 가지 중 가장 낮은 성능을 보였다. |
지질구조분류
배사선, 리플 마크, 이종석, 스크래치, 익상 주름, 단층, 응결, 진흙 조각, 편마세, 부딘, 현무암 기둥 및 제방과 같은 노출된 지질 구조는 딥 러닝 [20]모델을 통해 자동으로 식별할 수 있다.연구에 따르면 3층 컨볼루션 뉴럴 네트워크(CNN)와 전송 학습은 각각 약 80%와 90%의 높은 정확도를 가지고 있으며 KNN, 인공 뉴럴 네트워크(ANN), 극한 경사 부스팅(XGBoost)과 같은 다른 것들은 10~30%[20]의 낮은 정확도를 가지고 있는 것으로 나타났다.그레이스케일 이미지와 컬러 이미지는 모두 테스트되었으며, 정확한 차이는 거의 없기 때문에 색상이 지질 [20]구조 식별에 그다지 중요하지 않다는 것을 알 수 있다.
객관적으로 | 입력 데이터 세트 | 위치 | 머신 러닝 알고리즘(MLA) | 성능 |
---|---|---|---|---|
지질구조분류[20] | 지질 구조 이미지 | - | K개의 가장 가까운 네이버(KNN(KNN; 가장 가까운 네이버), 인공신경망(ANN), Extreme Gradient Boost(XGBoost), 3층 컨볼루션 뉴럴 네트워크(CNN), 전송 학습 | 3계층 컨볼루션 뉴럴 네트워크(CNN)와 전송 학습은 각각 약 80%와 90%의 정확도에 도달했으며, 다른 것들은 약 10%에서 30% 사이의 비교적 낮은 범위에 있었다. |
예측 및 예측
지진 조기 경보 시스템 및 예보
지진 조기 경보 시스템은 종종 국소 충격 소음에 취약하기 때문에 잘못된 경보를 [42]발령한다.기계 학습 방법을 사용하여 지진 파형과 노이즈 신호를 구별함으로써 잘못된 경보를 제거할 수 있습니다.이 방법은 두 부분으로 구성되며, 첫 번째 부분은 최초 도달 P파의 특징을 학습하고 추출하는 GAN(Generative Adversarial Network)을 사용한 비감독 학습과 P파를 구별하는 랜덤 포레스트로 구성된다.이 접근법은 P파 인식에서 99.2%를 달성했으며 98.4%의 [42]정확도로 노이즈 신호에 의한 잘못된 트리거를 방지할 수 있습니다.
실험실 지진은 실제 지진을 모방하기 위해 실험실 환경에서 발생한다.기계 학습의 도움으로 지진의 전조로서 음향 신호의 패턴을 수동으로 검색할 필요 없이 식별할 수 있다.고장 전 남은 시간 예측은 고장으로부터 기록된 연속 음향 시계열 데이터를 사용한 연구에서 입증되었습니다.적용된 알고리즘은 랜덤 포레스트가 약 10개의 슬립 이벤트를 통해 훈련되어 남은 장애 시간을 예측하는 데 탁월하게 수행되었습니다.고장을 예측하기 위해 음향 신호를 식별했으며, 그 중 하나는 이전에 확인되지 않았습니다.이 실험실에서 발생하는 지진은 지구처럼 복잡하지는 않지만,[43] 이것은 향후의 지진 예측 작업을 이끄는 중요한 진보를 만든다.
객관적으로 | 입력 데이터 세트 | 위치 | 머신 러닝 알고리즘(MLA) | 성능 |
---|---|---|---|---|
지진파형[42] 판별 | 지진 데이터 세트 | 캘리포니아 남부 및 일본 | GAN(Generative Adversarial Network), 랜덤 포레스트 | 이 접근법은 99.2%의 정확도로 P파를 인식하고 98.4%의 정확도로 노이즈 신호에 의한 잘못된 트리거를 방지할 수 있다. |
다음[43] 지진에 대한 남은 시간 예측 | 연속 음향 시계열 데이터 | - | 랜덤 포레스트 | 예측의2 R 값은 0.89에 도달하여 우수한 성능을 보였습니다. |
유량방전예측
실시간 흐름 데이터는 예를 들어 홍수 이벤트 [44]중 대피, 저수지 수위 조절 등의 의사결정에 필수적이다.하천 유량 데이터는 하천 수위를 측정하는 하천게이지에서 제공하는 정보로 추정할 수 있다.그러나 홍수 이벤트에서 발생한 물과 잔해는 하천을 손상시킬 수 있으며 중요한 실시간 데이터가 누락될 수 있다.누락된[10] 데이터를 추론하는 기계 학습 기능은 과거 스트림 게이지 데이터와 실시간 데이터를 모두 사용하여 스트림 흐름을 예측할 수 있게 한다.SHEM은 그 목적에[45] 부합할 수 있는 기계 학습을 이용한 하천 수문학 추정 모델입니다.정확성을 검증하기 위해 예측 결과를 실제 기록된 데이터와 비교한 결과 정확도는 0.78에서 0.99 사이인 것으로 나타났다.
객관적으로 | 입력 데이터 세트 | 위치 | 머신 러닝 알고리즘(MLA) | 성능 |
---|---|---|---|---|
데이터가[45] 누락된 스트림플로우 견적 | NWIS-Web에서 데이터 스트리밍 | 아이다호와 워싱턴의 4개의 다양한 분수령에서 미국 | 랜덤 포레스트 | 그 추정치는 배출물의 과거 데이터와 잘 관련되어 있었다.정확도는 0.78 ~ 0.99입니다. |
도전
불충분한 트레이닝 데이터
머신러닝에는 [10]충분한 트레이닝 및 검증 데이터가 필요합니다.그러나 위성 원격 감지 데이터와 같이 매우 유용한 일부 제품에는 1970년대 이후 수십 년의 데이터만 포함되어 있습니다.연간 데이터에 관심이 있는 경우 사용할 [46]수 있는 표본은 50개 미만입니다.이러한 양의 데이터는 적절하지 않을 수 있습니다.지질 구조의 자동 분류 연구에서 모델의 단점은 데이터 [20]집합의 크기를 늘리기 위한 데이터 증강의 도움을 받더라도 작은 훈련 데이터 집합이다.스트림플로우 예측에 대한 또 다른 연구는 정확도가 충분한 과거 데이터의 가용성에 따라 결정되므로 충분한 훈련 데이터가 머신러닝의 [45]성과를 결정한다.교육 데이터가 불충분하면 과적합이라는 문제가 발생할 수 있습니다.과적합은 모형에서 노이즈 및 원하지 않는 세부 사항에 대해 학습하기 때문에 기계[47] 학습에 부정확한 결과를 초래합니다.
데이터 입력에 의해 제한됨
기계학습은 인간이 쉽게 할 수 있는 일부 작업을 수행할 수 없다.예를 들어 암반질량평가시스템(RMR)[40] 이미지별 암반터널면 수분유입량 정량에서는 육안검사만으로 감쇠상태와 습윤상태를 구별할 수 없어 기계학습으로 분류하지 않았다.일부 작업에서는 기계 학습이 인간의 수동 작업을 완전히 대체하지 못할 수 있습니다.
블랙박스 조작
예를 들어, 인공 신경 네트워크(ANN)와 같은 많은 기계 학습 알고리즘에서는 숨겨진 계층에서 결과가 어떻게 생성되는지에 대한 명확한 [48]관계와 설명이 알려져 있지 않기 때문에 '블랙 박스' 접근법으로 간주된다.Decision Tree와 같은 'White-box' 접근법은 사용자에게 [49]알고리즘 세부사항을 보여줄 수 있습니다.관계를 조사하려면 이러한 '블랙박스' 접근 방식은 적합하지 않습니다.그러나 '블랙박스' 알고리즘의 성능은 대개 [50]더 우수하다.
레퍼런스
- ^ 뮬러, J. P., & Massaron, L. (2021)바보들을 위한 기계 학습.John Wiley & Sons.
- ^ Resources., National Academies Press (U.S.) National Research Council (U.S.). Commission on Geosciences, Environment, and (2001). Basic research opportunities in earth science. National Academies Press. OCLC 439353646.
- ^ Miall, A.D. (December 1995). "The blue planet: An introduction to earth system science". Earth-Science Reviews. 39 (3–4): 269–271. doi:10.1016/0012-8252(95)90023-3. ISSN 0012-8252.
- ^ a b c d e f g h i j k l Bhattacharya, B.; Solomatine, D.P. (March 2006). "Machine learning in soil classification". Neural Networks. 19 (2): 186–195. doi:10.1016/j.neunet.2006.01.005. ISSN 0893-6080. PMID 16530382. S2CID 14421859.
- ^ a b c d e Sang, Xuejia; Xue, Linfu; Ran, Xiangjin; Li, Xiaoshun; Liu, Jiwen; Liu, Zeyu (2020-02-05). "Intelligent High-Resolution Geological Mapping Based on SLIC-CNN". ISPRS International Journal of Geo-Information. 9 (2): 99. Bibcode:2020IJGI....9...99S. doi:10.3390/ijgi9020099. ISSN 2220-9964.
- ^ Si, Lei; Xiong, Xiangxiang; Wang, Zhongbin; Tan, Chao (2020-03-14). "A Deep Convolutional Neural Network Model for Intelligent Discrimination between Coal and Rocks in Coal Mining Face". Mathematical Problems in Engineering. 2020: 1–12. doi:10.1155/2020/2616510. ISSN 1024-123X.
- ^ a b c d e f g h i j k l Marjanović, Miloš; Kovačević, Miloš; Bajat, Branislav; Voženílek, Vít (November 2011). "Landslide susceptibility assessment using SVM machine learning algorithm". Engineering Geology. 123 (3): 225–234. doi:10.1016/j.enggeo.2011.09.006. ISSN 0013-7952.
- ^ Merembayev, Timur; Yunussov, Rassul; Yedilkhan, Amirgaliyev (November 2018). "Machine Learning Algorithms for Classification Geology Data from Well Logging". 2018 14th International Conference on Electronics Computer and Computation (ICECCO). IEEE: 206–212. doi:10.1109/icecco.2018.8634775. ISBN 978-1-7281-0132-3. S2CID 59620103.
- ^ De'ath, Glenn; Fabricius, Katharina E. (November 2000). "Classification and Regression Trees: A Powerful Yet Simple Technique for Ecological Data Analysis". Ecology. 81 (11): 3178–3192. doi:10.1890/0012-9658(2000)081[3178:cartap]2.0.co;2. ISSN 0012-9658.
- ^ a b c d e Thessen, Anne (2016-06-27). "Adoption of Machine Learning Techniques in Ecology and Earth Science". One Ecosystem. 1: e8621. doi:10.3897/oneeco.1.e8621. ISSN 2367-8194.
- ^ Zhao, Kaiguang; Popescu, Sorin; Meng, Xuelian; Pang, Yong; Agca, Muge (August 2011). "Characterizing forest canopy structure with lidar composite metrics and machine learning". Remote Sensing of Environment. 115 (8): 1978–1996. Bibcode:2011RSEnv.115.1978Z. doi:10.1016/j.rse.2011.04.001. ISSN 0034-4257.
- ^ LAWLER, JOSHUA J.; WHITE, DENIS; NEILSON, RONALD P.; BLAUSTEIN, ANDREW R. (2006-06-26). "Predicting climate-induced range shifts: model differences and model reliability". Global Change Biology. 12 (8): 1568–1584. Bibcode:2006GCBio..12.1568L. CiteSeerX 10.1.1.582.9206. doi:10.1111/j.1365-2486.2006.01191.x. ISSN 1354-1013.
- ^ Tartakovsky, Daniel M. (2004). "Delineation of geologic facies with statistical learning theory". Geophysical Research Letters. 31 (18). Bibcode:2004GeoRL..3118502T. CiteSeerX 10.1.1.146.5147. doi:10.1029/2004gl020864. ISSN 0094-8276.
- ^ Hurtt, George C.; Dubayah, Ralph; Drake, Jason; Moorcroft, Paul R.; Pacala, Stephen W.; Blair, J. Bryan; Fearon, Matthew G. (June 2004). "Beyond Potential Vegetation: Combining Lidar Data and a Height-Structured Model for Carbon Studies". Ecological Applications. 14 (3): 873–883. doi:10.1890/02-5317. ISSN 1051-0761.
- ^ Lawler, Joshua J.; White, Denis; Neilson, RONALD P.; Blaustein, Andrew R. (2006-06-26). "Predicting climate-induced range shifts: model differences and model reliability". Global Change Biology. 12 (8): 1568–1584. Bibcode:2006GCBio..12.1568L. CiteSeerX 10.1.1.582.9206. doi:10.1111/j.1365-2486.2006.01191.x. ISSN 1354-1013.
- ^ Akpokodje, E. G. (June 1979). "The importance of engineering geological mapping in the development of the Niger delta basin". Bulletin of the International Association of Engineering Geology. 19 (1): 101–108. doi:10.1007/bf02600459. ISSN 1435-9529. S2CID 129112606.
- ^ a b c Costa, Iago; Tavares, Felipe; Oliveira, Junny (April 2019). "Predictive lithological mapping through machine learning methods: a case study in the Cinzento Lineament, Carajás Province, Brazil". Journal of the Geological Survey of Brazil. 2 (1): 26–36. doi:10.29396/jgsb.2019.v2.n1.3. ISSN 2595-1939. S2CID 134822423.
- ^ a b c d Latifovic, Rasim; Pouliot, Darren; Campbell, Janet (2018-02-16). "Assessment of Convolution Neural Networks for Surficial Geology Mapping in the South Rae Geological Region, Northwest Territories, Canada". Remote Sensing. 10 (2): 307. Bibcode:2018RemS...10..307L. doi:10.3390/rs10020307. ISSN 2072-4292.
- ^ a b c d Culverhouse, PF; Williams, R; Reguera, B; Herry, V; González-Gil, S (2003). "Do experts make mistakes? A comparison of human and machine identification of dinoflagellates". Marine Ecology Progress Series. 247: 17–25. Bibcode:2003MEPS..247...17C. doi:10.3354/meps247017. ISSN 0171-8630.
- ^ a b c d e f Zhang, Ye; Wang, Gang; Li, Mingchao; Han, Shuai (2018-12-04). "Automated Classification Analysis of Geological Structures Based on Images Data and Deep Learning Model". Applied Sciences. 8 (12): 2493. doi:10.3390/app8122493. ISSN 2076-3417.
- ^ a b Loyola-Gonzalez, Octavio (2019). "Black-Box vs. White-Box: Understanding Their Advantages and Weaknesses From a Practical Point of View". IEEE Access. 7: 154096–154113. doi:10.1109/ACCESS.2019.2949286. ISSN 2169-3536. S2CID 207831043.
- ^ a b c d Kumar, Chandan; Chatterjee, Snehamoy; Oommen, Thomas; Guha, Arindam (April 2020). "Automated lithological mapping by integrating spectral enhancement techniques and machine learning algorithms using AVIRIS-NG hyperspectral data in Gold-bearing granite-greenstone rocks in Hutti, India". International Journal of Applied Earth Observation and Geoinformation. 86: 102006. Bibcode:2020IJAEO..8602006K. doi:10.1016/j.jag.2019.102006. ISSN 0303-2434. S2CID 210040191.
- ^ #갤러리
- ^ a b Haykin, Simon S. (2009). Neural Networks and Learning Machines. Prentice Hall. ISBN 978-0-13-147139-9.
- ^ a b Harvey, A. S.; Fotopoulos, G. (2016-06-23). "Geological Mapping Using Machine Learning Algorithms". ISPRS - International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. XLI-B8: 423–430. doi:10.5194/isprsarchives-xli-b8-423-2016. ISSN 2194-9034.
- ^ Mattikalli, N (January 1997). "Soil color modeling for the visible and near-infrared bands of Landsat sensors using laboratory spectral measurements". Remote Sensing of Environment. 59 (1): 14–28. Bibcode:1997RSEnv..59...14M. doi:10.1016/s0034-4257(96)00075-2. ISSN 0034-4257.
- ^ Radford, D. D., Cracknell, M. J., Roach, M. J., & Cumming, G. V. (2018년)태즈메이니아 서부의 지질 지도는 레이더와 무작위 숲을 사용한다.IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 11(9), 3075-3087.
- ^ Wang, Y, Ksienzyk, A. K., Liu, M. 및 Brönner, M. (2021).클러스터 분석을 사용한 다지물리 데이터 통합: Norway 중부의 Tröndelag에서 지질 매핑 지원.지구물리학저널, 225(2), 1142-1157.
- ^ "Phillips River landslide hazard mapping project", Landslide Risk Management, CRC Press, pp. 457–466, 2005-06-30, doi:10.1201/9781439833711-28, ISBN 9780429151354, retrieved 2021-11-12
- ^ a b 샤우한, 샤르마, M., 아로라, M.K., N.G. & Gupta. (2010년)인공신경망에서 도출된 등급을 통한 산사태 감수성 구역화.국제 응용 지구 관측 및 지리 정보 저널, 12(5), 340-350.
- ^ a b Biswajeet, Pradhan; Saro, Lee (November 2007). "Utilization of Optical Remote Sensing Data and GIS Tools for Regional Landslide Hazard Analysis Using an Artificial Neural Network Model". Earth Science Frontiers. 14 (6): 143–151. Bibcode:2007ESF....14..143B. doi:10.1016/s1872-5791(08)60008-1. ISSN 1872-5791.
- ^ Dou, Jie; Yamagishi, Hiromitsu; Pourghasemi, Hamid Reza; Yunus, Ali P.; Song, Xuan; Xu, Yueren; Zhu, Zhongfan (2015-05-19). "An integrated artificial neural network model for the landslide susceptibility assessment of Osado Island, Japan". Natural Hazards. 78 (3): 1749–1776. doi:10.1007/s11069-015-1799-2. ISSN 0921-030X. S2CID 51960414.
- ^ a b Kawabata, Daisaku; Bandibas, Joel (December 2009). "Landslide susceptibility mapping using geological data, a DEM from ASTER images and an Artificial Neural Network (ANN)". Geomorphology. 113 (1–2): 97–109. Bibcode:2009Geomo.113...97K. doi:10.1016/j.geomorph.2009.06.006. ISSN 0169-555X.
- ^ "International society for rock mechanics commission on standardization of laboratory and field tests". International Journal of Rock Mechanics and Mining Sciences & Geomechanics Abstracts. 15 (6): 319–368. December 1978. doi:10.1016/0148-9062(78)91472-9. ISSN 0148-9062.
- ^ a b c d e f g Byun, Hoon; Kim, Jineon; Yoon, Dongyoung; Kang, Il-Seok; Song, Jae-Joon (2021-07-08). "A deep convolutional neural network for rock fracture image segmentation". Earth Science Informatics. 14 (4): 1937–1951. Bibcode:2021EScIn..14.1937B. doi:10.1007/s12145-021-00650-1. ISSN 1865-0473. S2CID 235762914.
- ^ Repasky, Kevin (2014-03-31). Development and Deployment of a Compact Eye-Safe Scanning Differential absorption Lidar (DIAL) for Spatial Mapping of Carbon Dioxide for Monitoring/Verification/Accounting at Geologic Sequestration Sites (Report). doi:10.2172/1155030. OSTI 1155030.
- ^ a b Bellante, G.J.; Powell, S.L.; Lawrence, R.L.; Repasky, K.S.; Dougher, T.A.O. (March 2013). "Aerial detection of a simulated CO2 leak from a geologic sequestration site using hyperspectral imagery". International Journal of Greenhouse Gas Control. 13: 124–137. doi:10.1016/j.ijggc.2012.11.034. ISSN 1750-5836.
- ^ a b c d e f g BATESON, L; VELLICO, M; BEAUBIEN, S; PEARCE, J; ANNUNZIATELLIS, A; CIOTOLI, G; COREN, F; LOMBARDI, S; MARSH, S (July 2008). "The application of remote-sensing techniques to monitor CO2-storage sites for surface leakage: Method development and testing at Latera (Italy) where naturally produced CO2 is leaking to the atmosphere". International Journal of Greenhouse Gas Control. 2 (3): 388–400. doi:10.1016/j.ijggc.2007.12.005. ISSN 1750-5836.
- ^ a b Bieniawski, Z. T. (1988), "The Rock Mass Rating (RMR) System (Geomechanics Classification) in Engineering Practice", Rock Classification Systems for Engineering Purposes, West Conshohocken, PA: ASTM International, pp. 17–17–18, doi:10.1520/stp48461s, ISBN 978-0-8031-6663-9, retrieved 2021-11-12
- ^ a b c d e f g Chen, Jiayao; Zhou, Mingliang; Zhang, Dongming; Huang, Hongwei; Zhang, Fengshou (March 2021). "Quantification of water inflow in rock tunnel faces via convolutional neural network approach". Automation in Construction. 123: 103526. doi:10.1016/j.autcon.2020.103526. ISSN 0926-5805. S2CID 233849934.
- ^ Coerts, Alfred (1996). Analysis of static cone penetration test data for subsurface modelling : a methodology. Koninklijk Nederlands Aardrijkskundig Genootschap/Faculteit Ruimtelijke Wetenschappen Universiteit Utrecht. ISBN 90-6809-230-8. OCLC 37725852.
- ^ a b c Li, Zefeng; Meier, Men-Andrin; Hauksson, Egill; Zhan, Zhongwen; Andrews, Jennifer (2018-05-28). "Machine Learning Seismic Wave Discrimination: Application to Earthquake Early Warning". Geophysical Research Letters. 45 (10): 4773–4779. Bibcode:2018GeoRL..45.4773L. doi:10.1029/2018gl077870. ISSN 0094-8276. S2CID 54926314.
- ^ a b Rouet-Leduc, Bertrand; Hulbert, Claudia; Lubbers, Nicholas; Barros, Kipton; Humphreys, Colin J.; Johnson, Paul A. (2017-09-22). "Machine Learning Predicts Laboratory Earthquakes". Geophysical Research Letters. 44 (18): 9276–9282. arXiv:1702.05774. Bibcode:2017GeoRL..44.9276R. doi:10.1002/2017gl074677. ISSN 0094-8276. S2CID 118842086.
- ^ Kirchner, James W. (March 2006). "Getting the right answers for the right reasons: Linking measurements, analyses, and models to advance the science of hydrology". Water Resources Research. 42 (3). Bibcode:2006WRR....42.3S04K. doi:10.1029/2005wr004362. ISSN 0043-1397.
- ^ a b c Petty, T.R.; Dhingra, P. (2017-08-08). "Streamflow Hydrology Estimate Using Machine Learning (SHEM)". JAWRA Journal of the American Water Resources Association. 54 (1): 55–68. doi:10.1111/1752-1688.12555. ISSN 1093-474X.
- ^ Karpatne, Anuj; Ebert-Uphoff, Imme; Ravela, Sai; Babaie, Hassan Ali; Kumar, Vipin (2019-08-01). "Machine Learning for the Geosciences: Challenges and Opportunities". IEEE Transactions on Knowledge and Data Engineering. 31 (8): 1544–1554. arXiv:1711.04708. doi:10.1109/tkde.2018.2861006. ISSN 1041-4347. S2CID 42476116.
- ^ Farrar, Donald E.; Glauber, Robert R. (February 1967). "Multicollinearity in Regression Analysis: The Problem Revisited". The Review of Economics and Statistics. 49 (1): 92. doi:10.2307/1937887. hdl:1721.1/48530. ISSN 0034-6535. JSTOR 1937887.
- ^ Taghizadeh-Mehrjardi, R.; Nabiollahi, K.; Kerry, R. (March 2016). "Digital mapping of soil organic carbon at multiple depths using different data mining techniques in Baneh region, Iran". Geoderma. 266: 98–110. Bibcode:2016Geode.266...98T. doi:10.1016/j.geoderma.2015.12.003. ISSN 0016-7061.
- ^ Delibasic, Boris; Vukicevic, Milan; Jovanovic, Milos; Suknovic, Milija (August 2013). "White-Box or Black-Box Decision Tree Algorithms: Which to Use in Education?". IEEE Transactions on Education. 56 (3): 287–291. Bibcode:2013ITEdu..56..287D. doi:10.1109/te.2012.2217342. ISSN 0018-9359. S2CID 11792899.
- ^ Merghadi, Abdelaziz; Yunus, Ali P.; Dou, Jie; Whiteley, Jim; ThaiPham, Binh; Bui, Dieu Tien; Avtar, Ram; Abderrahmane, Boumezbeur (August 2020). "Machine learning methods for landslide susceptibility studies: A comparative overview of algorithm performance". Earth-Science Reviews. 207: 103225. Bibcode:2020ESRv..20703225M. doi:10.1016/j.earscirev.2020.103225. ISSN 0012-8252. S2CID 225816933.