예측 상태 표현
Predictive state representation![]() | 이 기사의 주제는 위키피디아의 일반적인 공신력 가이드라인을 충족하지 못할 수 있다. – · · 책 · · (2011년 3월) (이 를 |
컴퓨터 과학에서 예측 상태 표현(PSR)은 취한 조치와 그에 따른 관찰의 역사로부터 제어된 동적 시스템의 상태를 모델링하는 방법이다.PSR은 시스템에서 수행될 수 있는 미래 시험(실험)에 대한 예측의 벡터로서 시스템의 상태를 포착한다.[1]테스트는 동작-관찰 쌍의 시퀀스이며, 그 예측은 테스트의 동작-시퀀스가 시스템에서 실행될 경우 테스트의 관찰-시퀀스가 발생할 확률이다.PSR을 사용할 때의 장점 중 하나는 예측이 관측 가능한 수량과 직접 관련이 있다는 것이다.이는 시스템의 상태가 관측되지 않은 명목 상태에 대한 확률 분포로 표현되는 부분 관측 가능한 마르코프 의사결정 프로세스(POMDP)와 같은 다른 동적 시스템의 모델과는 대조적이다.[2]
참조
- ^ James, Michael R.; Singh, Satinder (2004). "Learning and discovery of predictive state representations in dynamical systems with reset". Twenty-first international conference on Machine learning - ICML '04. p. 53. CiteSeerX 10.1.1.67.5179. doi:10.1145/1015330.1015359. ISBN 978-1-58113-838-2. S2CID 9111832.
- ^ Izadi, Masoumeh T.; Precup, Doina (9 August 2003). "A planning algorithm for predictive state representations". Proceedings of the 18th International Joint Conference on Artificial Intelligence. Ijcai'03: 1520–1521.
- Littman, Michael L.; Richard S. Sutton; Satinder Singh (2002). "Predictive Representations of State" (PDF). Advances in Neural Information Processing Systems 14 (NIPS). pp. 1555–1561.
- Singh, Satinder; Michael R. James; Matthew R. Rudary (2004). "Predictive State Representations: A New Theory for Modeling Dynamical Systems" (PDF). Uncertainty in Artificial Intelligence: Proceedings of the Twentieth Conference (UAI). pp. 512–519.
- Wiewiora, Eric Walter (2008), Modeling Probability Distributions with Predictive State Representations (PDF)