사후 대응 계획

Reactive planning

인공지능에서 반응적 계획자율적 에이전트에 의한 행동 선택을 위한 일련의 기법을 의미한다. 이러한 기법은 두 가지 측면에서 고전적인 계획과는 다르다. 첫째, 그들은 시기적절하게 작동하기 때문에 매우 역동적이고 예측할 수 없는 환경에 대처할 수 있다. 둘째로, 그들은 현재 상황에 따라 매 순간 다음 행동을 한 번만 계산한다. 반응형 계획자는 종종(그러나 항상은 아님) 반응형 계획을 이용하는데, 이는 에이전트의 우선순위와 행동을 설명하는 저장된 구조물이다.

비록 반응적 계획이라는 용어는 적어도 1988년으로 거슬러 올라가지만, "반응적 계획"이라는 용어는 이제 사전적 계획을 위한 반의어로 사용되는 경멸적[according to whom?] 용어가 되었다. 반응적 계획을 사용하는 거의 모든 에이전트가 능동적이기 때문에 일부 연구자들은 반응적 계획을 동적 계획으로 언급하기 시작했다.

사후 대응적 계획 표현

반응형 계획을 대표할 수 있는 몇 가지 방법이 있다. 모두 기본적인 대표 단위와 이들 단위를 계획으로 구성하기 위한 수단이 필요하다.

조건-조치 규칙(생산자)

조건 수행 규칙 또는 if-then 규칙은 형식의 규칙으로, 조건의 경우 동작이다. 이런 규칙들을 생산이라고 부른다. 규칙의 의미는 다음과 같다:조건이 유지되면 조치를 취하라. 동작은 외부(예: 무언가를 집어서 이동) 또는 내부(예: 내부 메모리에 사실을 기록하거나 새로운 규칙 집합을 평가)가 될 수 있다. 조건은 일반적으로 부울이며, 액션을 수행하거나 수행하지 않을 수 있다.

생산규칙은 비교적 평평한 구조로 정리될 수 있지만, 어떤 종류의 계층 구조로 정리되는 경우가 더 많다. 예를 들어, 서브섬션 아키텍처는 상호연결된 동작의 계층으로 구성되며, 각각은 실제로 적절한 입력에 반응하는 유한한 상태 기계로 구성된다. 그런 다음 이들 계층은 단순한 스택으로 구성되며, 상위 계층은 하위 계층의 목표를 포괄한다. 다른 시스템은 트리를 사용할 수도 있고, 현재 가장 중요한 목표/규칙 하위 집합을 변경하기 위한 특별한 메커니즘을 포함할 수도 있다. 평탄한 구조물은 비교적 쉽게 지을 수 있지만 단순한 행동에 대한 설명만 허용하거나, 부족한 구조를 보완하기 위해 엄청나게 복잡한 조건을 필요로 한다.

모든 분산 작용 선택 알고리즘의 중요한 부분은 충돌 해결 메커니즘이다. 이것은 둘 이상의 규칙 조건이 주어진 순간에 유지될 때 제안된 행동 사이의 충돌을 해결하기 위한 메커니즘이다. 그 갈등은 예를 들면 다음과 같이 해결될 수 있다.

  • 사전에 규칙에 고정된 우선 순위를 할당하고
  • 선호도 할당(: Sky 아키텍처)
  • 규칙 간 학습 관련 유틸리티(예: ACT-R),
  • 계획적인 형태를 이용하기 위해

전문가 시스템은 규칙 선정의 유예와 같은 다른 간단한 경험적 접근법을 사용하는 경우가 많지만, 단순한 접근방식이 있는 큰 시스템에서는 좋은 행동을 보장하기가 어렵다.

갈등 해결은 상호 배타적인 조치를 취하고자 하는 규칙에만 필요하다(c.f. Blumberg 1996).

이러한 종류의 대응 계획의 일부 제한은 브롬(2005)에서 찾을 수 있다.

유한 상태 기계

유한 상태 기계(FSM)는 시스템의 행동 모델이다. FSM은 컴퓨터 공학에서 널리 사용된다. 에이전트 모델링 동작은 가능한 응용 프로그램 중 하나일 뿐이다. 일반적인 FSM은, 에이전트의 행동을 기술하는 데 사용될 때, 이러한 상태들 간의 전환과 상태들의 집합으로 구성된다. 전환은 실제로 조건 동작 규칙이다. 매 순간 FSM의 한 상태만 활성화되며, 그 전환이 평가된다. 전환이 수행되면 다른 상태가 활성화된다. 즉, 일반적으로 전환은 다음과 같은 형태의 규칙이다. 조건경우 새로운 상태를 활성화한다. 그러나 전환은 실제로 상태를 변경하지 않고 전환 작업을 실행할 수 있도록 일부 시스템의 '셀프' 상태에도 연결할 수 있다.

FSM에 의한 행동을 생산하는 방법에는 두 가지 방법이 있다. 그들은 디자이너에 의해 상태와 연관되어 있는 것에 의존한다 - 그들은 '행동' 또는 스크립트일 수 있다. 'act'는 해당 FSM이 주어진 상태일 경우 대리인이 수행해야 하는 원자 행동이다. 이 작업은 그때마다 수행된다. 그러나 후자의 경우가 더 많다. 여기서 모든 상태는 스크립트와 연관되어 있는데, 이 스크립트는 해당 FSM이 지정된 상태일 경우 에이전트가 수행해야 하는 일련의 작업을 설명한다. 전환이 새로운 상태를 활성화하면 이전 스크립트는 단순히 중단되고, 새로운 스크립트가 시작된다.

스크립트가 더 복잡하면 여러 스크립트로 세분화하여 계층적 FSM을 이용할 수 있다. 그러한 자동화된 상태에서는 모든 주가 변전소를 포함할 수 있다. 원자 수준의 상태만이 스크립트(복잡하지 않음) 또는 원자 작용과 연관되어 있다.

계산적으로 계층적 FSM은 FSM과 동등하다. 이는 각 계층적 FSM이 고전적 FSM으로 변환될 수 있다는 것을 의미한다. 그러나 계층적 접근방식은 설계를 더 잘 촉진한다. 계층적 FSM을 사용하는 컴퓨터 게임봇의 ASM 예는 데미안 섬라(2005)의 논문을 참조한다.

퍼지 접근법

만약 그렇다면 규칙과 FSM 모두 퍼지 논리와 결합할 수 있다. 조건, 상태 및 작용은 각각 부울 또는 "예/아니오"가 아니라 근사하고 부드럽다. 결과적으로, 결과 행동은 특히 두 작업 사이의 전환의 경우에 더 부드럽게 전환될 것이다. 그러나 퍼지 조건의 평가는 바삭바삭한 조건의 평가보다 훨씬 느리다.

알렉스 챔판다드의 건축물을 보라.

연결론자들이 접근한다.

반응적 계획은 인공 신경망이나 자유 흐름 계층 구조와 같은 연결론적 네트워크로도 표현될 수 있다. 기본 표현 단위는 장치에 "추상적 활동"을 공급하는 여러 입력 링크와 활동을 다음 단위에 전파하는 출력 링크가 있는 단위다. 각 장치 자체는 활동 변환기로 작동한다. 전형적으로 단위는 층층 구조로 연결된다.

연결론적 네트워크의 긍정적인 점은 첫째로, 결과적 동작이 명확한 경우 규칙과 FSM에 의해 생성된 행동보다 더 부드럽다는 것이다. 둘째, 네트워크는 종종 적응적이며, 셋째, 억제 메커니즘을 사용할 수 있기 때문에 동작도 사전적으로 설명할 수 있다(규칙을 통해서만 행동을 설명할 수 있다).통합적으로 그러나 이 방법에는 몇 가지 결점도 있다. 첫째로, 설계자의 경우 if-then 규칙과 비교하여 네트워크에 의한 행동을 기술하는 것이 훨씬 더 복잡하다. 둘째, 특히 적응형 기능을 이용해야 하는 경우 비교적 간단한 동작만 설명할 수 있다.

대응적 계획 알고리즘

일반적인 사후 대응 계획 알고리즘은 if-den의 규칙을 평가하거나 연결론적 네트워크의 상태를 계산한다. 그러나 일부 알고리즘에는 특별한 특징이 있다.

  • Rete 평가: 적절한 논리 표현으로(바삭바삭한 규칙에만 적합) 매번 규칙을 재평가할 필요가 없다. 대신 이전 단계의 평가를 저장하는 캐시 형태를 사용할 수 있다.
  • 스크립트 언어: 때로는 규칙이나 FSM이 구조의 원시 요소(예: Sky)가 되기도 한다. 그러나 보다 자주 사후 대응 계획은 스크립팅 언어로 프로그래밍되며, 여기서 규칙은 (JAM 또는 ABL과 같이) 원시 요소 중 하나일 뿐이다.

조향

조향은 작용제의 항법에 사용되는 특수 반응 기법이다. 가장 단순한 형태의 반응형 조향 장치는 센서 입력을 이펙터 출력에 직접 매핑하는 브레이텐버그 차량에 사용되며, 이를 따르거나 피할 수 있다. 더 복잡한 시스템은 에이전트에게 영향을 미치는 매력적이거나 혐오스러운 힘의 중첩에 기초한다. 이런 종류의 조종은 크레이그 레이놀즈의 에 관한 원작을 바탕으로 한 것이다. 조향 방법을 사용하면 다음과 같은 간단한 형태를 얻을 수 있다.

  • 골네비게이션 쪽으로.
  • 장애물 회피 행동
  • 뒤이은 행동.
  • 다가오는 적
  • 포식자 기피
  • 군중들의 행동

조향의 장점은 계산적으로 매우 효율적이라는 것이다. 컴퓨터 게임에서 수백 명의 병사들이 이 기술에 의해 조종될 수 있다. 그러나 더 복잡한 지형(예: 건물)의 경우, 조향은 (예: 밀라니[1]에서와 같이) 경로 탐색과 결합되어야 하며, 이는 계획상의 한 형태다.

참고 항목

참조


외부 링크