기계학습제어

Machine learning control

MLC(Machine Learning Control, MLC)머신러닝, 지능형 제어, 제어 이론의 하위 분야로서 머신러닝의 방법으로 최적의 제어 문제를 해결한다.주요 적용은 선형 제어 이론 방법이 적용되지 않는 복잡한 비선형 시스템이다.

문제 및 태스크의 유형

네 가지 유형의 문제가 공통적으로 부딪힌다.

  • 제어 매개변수 식별: MLC는 제어법의 구조가 주어졌지만 매개변수를 알 수 없는 경우 매개변수 식별으로[1] 해석된다.PID 제어기[2] 또는 이산 시간 최적 제어기의 계수를 최적화하는 유전 알고리즘이 한 예다.[3]
  • 첫 번째 유형의 회귀 문제로서 제어 설계: MLC는 센서 신호와 최적의 작동 명령이 모든 상태에 대해 알려진 경우 센서 신호에서 작동 명령까지의 일반적인 비선형 매핑에 근사하다.한 예는 알려진 전체 상태 피드백에서 센서 피드백을 계산하는 것이다.신경망은 이 작업에 일반적으로 사용된다.[4]
  • 두 번째 유형의 회귀 문제로서 제어 설계: MLC는 또한 발전소의 비용 함수를 최소화하는 임의의 비선형 제어 법칙을 식별할 수 있다.이 경우 모델, 제어법 구조, 최적화 작동 명령 등을 알 필요가 없다.최적화는 발전소에서 측정한 제어성능(비용함수)에만 기초한다.유전자 프로그래밍은 이러한 목적을 위한 강력한 회귀 기법이다.[5]
  • 강화 학습 제어:제어법은 강화 학습을 사용하여 측정된 성능 변화(후진)에 걸쳐 지속적으로 갱신될 수 있다.[6]

예를 들어, MLC는 신경망 제어, 유전 알고리즘 기반 제어, 유전 프로그래밍 제어, 강화 학습 제어로 구성되며, 방법론적으로 인공지능로봇 제어와 같은 다른 데이터 기반 제어와 중복된다.

적용들

MLC는 많은 비선형 제어 문제에 성공적으로 적용되어 알 수 없고 종종 예상치 못한 작동 메커니즘을 탐구하고 있다.응용 프로그램 예:

  • 위성의 고도 제어.[7]
  • 건물 열 제어.[8]
  • 피드백 난류 제어.[2][9]
  • 수상 차량에서 원격으로 작동함.[10]
  • 더 많은 엔지니어링 MLC 애플리케이션은 PJ Fleming & RC Purshouse(2002)의 검토 기사에 요약되어 있다.[11]

모든 일반 비선형 방법의 경우, MLC는 다양한 작동 조건에 대해 보장된 수렴, 최적성 또는 강건성이 없다.

참조

  1. ^ 토마스 벡&한스폴 슈웨펠(1993년 봄) "매개 변수 최적화를 위한 진화 알고리즘 개요", Journal of Evolution Computing(MIT Press), vol.1, no. 1,p. 1-23
  2. ^ a b N. Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J.P.Bonnet & E. Moreau, (2015) "Multi-Input Genetic Algorithm for Experimental Optimization of the Reattachment Downstream of a Backward-Facing Step with Surface Plasma Actuator", Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.
  3. ^ Zbigniew Michalewicz, Cezary Z.Janikow & Jacek B. Krawczyk(1992년 7월) "최적 제어 문제를 위한 수정된 유전자 알고리즘", [응용프로그램이 있는 컴퓨터 & 수학], vol. 23, no 12, pp. 83-94.
  4. ^ C. Lee, J. Kim, D. Babcock & R. Goodman(1997) "항력저감을 위한 난류조절에 신경망적용", Vol. 6, No. 9, 페이지 1740-1747
  5. ^ D. C. 드라코풀로스 & S. 켄트(1997년 12월), "예측과 제어를 위한 유전자 프로그래밍", 신경 컴퓨팅 & 애플리케이션(스프링어), 제6권, 제4권, 페이지 214-228.
  6. ^ Andrew G. Barto(1994년 12월) "강제 학습 제어", 신경 생물학에 대한 현재 의견, 제6권, 제4권, 페이지 888–893
  7. ^ 디미트리스.C. 드라코풀로스 & 안토니아. J. Jones(1994) 신경 유전적 적응적 태도 제어, 신경 컴퓨팅 & 애플리케이션(Springer), 제 2, 4, 페이지 183-204.
  8. ^ 조나단 A.라이트, 헤더 A.Loosemore & Raziyeh Farmani(2002) "다중기준 유전 알고리즘에 의한 건물 설계제어 최적화 [에너지 및 건물], vol. 34, no. 9, 페이지 959-972.
  9. ^ Steven J. Brunton & Bernd R.Noack(2015) 폐쇄 루프 난류 제어: 진행도전, 적용 기계 검토, 67권, 5호, 050801, 페이지 1-48.
  10. ^ J. Javadi-Moghaddam, & A. Bagheri(2010년 "수중 원격 작동 차량에 대한 적응형 신경-피지 슬라이딩 모드 기반 유전 알고리즘 제어 시스템"), Expert Systems with Applications, vol. 37 no. 1, 647-660.
  11. ^ Peter J. Fleming, R. C. Purshouse(2002 "제어 시스템 엔지니어링의 진화 알고리즘: 조사" 제어 엔지니어링 관행, vol. 10, no. 11, 페이지 1223-1241

추가 읽기

  • 디미트리스 C 드라코풀로스(1997년 8월) "신경 적응 제어를 위한 진화 학습 알고리즘", 스프링거 ISBN978-3-540-76161-7.
  • 토마스 두리에즈, 스티븐 L. 브런튼 & 버른드 R. 노크(2016년 11월) "기계 학습 제어 - 비선형 역학난류 길들이기," 스프링거ISBN 978-3-319-40624-4