강화 학습(RL)은 소프트웨어 에이전트가 누적 보상 개념을 극대화하기 위해 환경에서 어떻게 조치를 취해야 하는지에 관한 기계 학습 영역이다.
총 10페이지 중 다음 10페이지가 이 범주에 속한다.이 목록은 최근 변경사항을 반영하지 않을 수 있다(자세히 알아보기).