선형-정량-가우스 제어
Linear–quadratic–Gaussian control제어 이론에서 선형 2차-가우스(LQG) 제어 문제는 가장 근본적인 최적 제어 문제 중 하나이다.가우스 노이즈가 가우스 노이즈에 의해 구동되는 선형 시스템과 관련이 있다.문제는 2차 비용 기준의 기대치를 최소화하는 의미에서 최적의 출력 피드백 법칙을 결정하는 것이다.출력 측정은 가우스 노이즈에 의해 손상된 것으로 가정되며, 마찬가지로 초기 상태는 가우스 랜덤 벡터로 가정한다.
이러한 가정 하에서 선형 제어 법칙의 종류 내에서 최적의 제어 체계는 제곱합 인수에 의해 도출될 수 있다.[1]LQG 제어기로 알려진 이 제어법은 고유하며 단순히 Kalman 필터(Linear-Quadratic State Estimator(LQE))와 LQR(Linear-Quadratic Regulator)의 조합일 뿐이다.분리 원리는 상태 추정기와 상태 피드백은 독립적으로 설계될 수 있다고 명시한다.LQG 제어는 선형 시간 변이 시스템뿐만 아니라 선형 시간 변이 시스템 모두에 적용되며 쉽게 계산되고 구현되는 선형 동적 피드백 제어 법칙을 구성한다: LQG 제어기 자체는 제어 시스템과 같은 동적 시스템이다.두 시스템은 동일한 상태 치수를 가지고 있다.
분리 원리에 대한 더 깊은 설명은 LQG 컨트롤러가 더 넓은 종류의 비선형 컨트롤러에서 여전히 최적이라는 것이다.즉, 비선형 제어 방식을 활용해도 비용 기능의 기대 가치는 개선되지 않는다.이 버전의 분리 원리는 공정 및 출력 소음원이 가우스 마팅게일 가능성이 있는 경우에도 시스템 역학이 선형인 한 최적 제어는 최적의 상태 추정기(더 이상 Kalma가 아닐 수 있음)로 분리된다는 확률 제어의 분리 원리의 특별한 경우다.n 필터) 및 LQR 조절기.[2][3]
고전적인 LQG 설정에서 LQG 제어기의 구현은 시스템 상태의 치수가 클 때 문제가 될 수 있다.축소 주문 LQG 문제(고정 주문 LQG 문제)는 LQG 컨트롤러의 상태 수를 사전 수정하여 이를 극복한다.이 문제는 더 이상 분리할 수 없기 때문에 해결하기가 더 어렵다.또한, 해결책은 더 이상 독특하지 않다.이러한 사실에도 불구하고 수치 알고리즘은 국소적으로 최적의 축소된 LQG 제어기에 필요한 조건과 충분한 조건을 구성하는 관련 최적 투영 방정식을[8][9] 해결할 수 있다[4][5][6][7].[4]
LQG 최적성은 양호한 건전성 속성을 자동으로 보장하지 않는다.[10]폐쇄 루프 시스템의 강력한 안정성은 LQG 컨트롤러 설계 후 별도로 점검해야 한다.건전성을 촉진하기 위해 일부 시스템 매개변수를 결정론적 매개변수 대신 확률적으로 가정할 수 있다.관련된 더 어려운 제어 문제는 제어기 매개변수만 다른 유사한 최적 제어기로 이어진다.[5]
비용 함수의 기대 가치를 계산하여 최적의 이익뿐만 아니라 다른 안정적인 이익 집합도 계산할 수 있다.[11]
마지막으로, LQG 컨트롤러는 동요된 비선형 시스템을 제어하는 데도 사용된다.[12]
문제 및 해결책에 대한 수학적 설명
연속시간
연속 시간 선형 동적 시스템 고려
여기서 은(는) 시스템의 상태 변수의 벡터를 나타내고, 은(는) 제어 입력 벡터 y{\{\은(으) 피드백에 사용할 수 있는 측정된 출력의 벡터를 나타낸다.가우스 시스템 노이즈 ( ) 과 (와 가우스 가 모두 시스템에 영향을 미친다.이 시스템으로 볼 때 목표}모든 시간에({\displaystyle{\mathbf{}}t}선형적으로 지난 측정 y(t′), 0≤ t′<>t{\displaystyle{\mathbf{y}}(to의 생략),0\leq t'<에만 의존할 수 있는 제어 입력 역사 진로가(t){\displaystyle{\mathbf{너}}(t)를 찾는 것인데, 즉는 과목은}는 절차다.c왕ost 기능이 최소화됨:
여기서 는) 예상 값을 나타낸다.마지막 시간(수평) 은(는) 유한하거나 무한할 수 있다.수평선이 무한대 경향이 있는 경우 비용 함수의 첫 번째 T( ) x( T) 는 무시해도 될 정도로 문제와는 무관하게 된다.또한 비용을 유한하게 유지하려면 비용 함수를 로 해야 한다
LQG 제어 문제를 해결하는 LQG 컨트롤러는 다음 방정식으로 지정된다.
매트릭스 ( ) 는 첫 번째 방정식으로 대표되는 관련 칼만 필터의 칼만 이득이라고 한다. 마다 이 필터는 과거 측정 및 입력을 하여 상태 x x ( ) 의 를 생성한다.The Kalman gain is computed from the matrices , the two intensity matrices associated to the white Gaussian noises 및 ( ) { 으로 E [( 0) ( 0) mathr이 5가지 행렬은 다음과 같은 관련 행렬 Riccati 미분식을 통해 Kalman 이득을 결정한다.
솔루션 ( ), t t을 (를) 고려할 때 Kalman 이득은 동일하다.
) 행렬을 피드백 게인 행렬이라고 한다.이 행렬은 행렬 ( t), ( ), () , ( t ), R ( t) 및 F 에 의해 다음과 같은 연관된 행렬 Riccati 미분식을 통해 결정된다
솔루션 ( ), T 을(를) 고려할 때 피드백 이득은 동일하다.
두 행렬 Riccati 미분 방정식의 유사성을 관찰하십시오. 첫 번째 행렬은 시간에서 앞으로, 두 번째 행렬은 시간에서 뒤로입니다.이러한 유사성을 이중성이라고 한다.첫 번째 행렬 Riccati 미분방정식은 선형 2차 추정 문제(LQE)를 해결한다.두 번째 매트릭스 Riccati 미분방정식은 선형 2차 조절기 문제(LQR)를 해결한다.이러한 문제는 이중적이며 함께 선형-정차-가우스 제어 문제(LQG)를 해결한다.그래서 LQG 문제는 독립적으로 해결할 수 있는 LQE와 LQR 문제로 분리된다.따라서 LQG 문제를 분리형이라고 한다.
When and the noise intensity matrices , do not depend on and when 는 LQG 제어기가 시간 내 변동성 동적 시스템이 되는 경향이 있다.이 경우 두 번째 행렬 Riccati 미분 방정식은 관련 대수 Riccati 방정식으로 대체될 수 있다.
이산 시간
이산 시간 LQG 제어 문제는 연속 시간 제어 문제와 유사하기 때문에 아래 설명은 수학 방정식에 초점을 맞춘다.
이산 시간 선형 시스템 방정식은
Here represents the discrete time index and represent discrete-time Gaussian white noise processes with covariance matrices , respectively, and are independent of서로서로
최소화할 2차 비용 함수는
이산 시간 LQG 컨트롤러는
- )\ {
and corresponds to the predictive estimate .
Kalman 이득은 동등하다.
여기서 은(는) 시간 내에 전진하는 다음과 같은 행렬 Riccati 차이 방정식에 의해 결정된다.
피드백 게인 행렬이 동일함
여기서 은(는) 시간에 역행하는 다음과 같은 행렬 Riccati 차이 방정식에 의해 결정된다.
문제 공식의 모든 행렬이 시간 변이성이며 수평선 이 무한대로 움직이는 경향이 있는 경우 이산 시간 LQG 컨트롤러는 시간 변이성이 된다.이 경우 매트릭스 Riccati 차이 방정식은 연관된 이산 시간 대수 Riccati 방정식으로 대체될 수 있다.이 값들은 시간 변화량 선형 2분율 추정기와 시간 변화량 선형 2분율 조정기를 이산 시간에서 결정한다. 대신 비용을 유한하게 유지하려면 이 경우 을(를) 고려해야 한다.
참고 항목
참조
- ^ Karl Johan Astrom (1970). Introduction to Stochastic Control Theory. Vol. 58. Academic Press. ISBN 0-486-44531-3.
- ^ Anders Lindquist (1973). "On Feedback Control of Linear Stochastic Systems". SIAM Journal on Control. 11 (2): 323–343. doi:10.1137/0311025..
- ^ Tryphon T. Georgiou and Anders Lindquist (2013). "The Separation Principle in Stochastic Control, Redux". IEEE Transactions on Automatic Control. 58 (10): 2481–2494. arXiv:1103.3005. doi:10.1109/TAC.2013.2259207.
- ^ a b Van Willigenburg L.G.; De Koning W.L. (2000). "Numerical algorithms and issues concerning the discrete-time optimal projection equations". European Journal of Control. 6 (1): 93–100. doi:10.1016/s0947-3580(00)70917-4. Matlab Central에서 관련 소프트웨어 다운로드.
- ^ a b Van Willigenburg L.G.; De Koning W.L. (1999). "Optimal reduced-order compensators for time-varying discrete-time systems with deterministic and white parameters". Automatica. 35: 129–138. doi:10.1016/S0005-1098(98)00138-1. Matlab Central에서 관련 소프트웨어 다운로드.
- ^ Zigic D.; Watson L.T.; Collins E.G.; Haddad W.M.; Ying S. (1996). "Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem". International Journal of Control. 56 (1): 173–191. doi:10.1080/00207179208934308.
- ^ Collins Jr. E.G; Haddad W.M.; Ying S. (1996). "A homotopy algorithm for reduced-order dynamic compensation using the Hyland-Bernstein optimal projection equations". Journal of Guidance Control & Dynamics. 19 (2): 407–417. doi:10.2514/3.21633.
- ^ Hyland D.C; Bernstein D.S. (1984). "The optimal projection equations for fixed order dynamic compensation" (PDF). IEEE Transactions on Automatic Control. AC-29 (11): 1034–1037. doi:10.1109/TAC.1984.1103418. hdl:2027.42/57875.
- ^ Bernstein D.S.; Davis L.D.; Hyland D.C. (1986). "The optimal projection equations for reduced-order discrete-time modeling estimation and control" (PDF). Journal of Guidance Control and Dynamics. 9 (3): 288–293. Bibcode:1986JGCD....9..288B. doi:10.2514/3.20105. hdl:2027.42/57880.
- ^ Green, Michael; Limebeer, David J. N. (1995). Linear Robust Control. Englewood Cliffs: Prentice Hall. p. 27. ISBN 0-13-102278-4.
- ^ Matsakis, Demetrios (March 8, 2019). "The effects of proportional steering strategies on the behavior of controlled clocks". Metrologia. 56 (2): 025007. doi:10.1088/1681-7575/ab0614.
- ^ Athans M. (1971). "The role and use of the stochastic Linear-Quadratic-Gaussian problem in control system design". IEEE Transactions on Automatic Control. AC-16 (6): 529–552. doi:10.1109/TAC.1971.1099818.
추가 읽기
- Stengel, Robert F. (1994). Optimal Control and Estimation. New York: Dover. ISBN 0-486-68200-5.