정보 세트(게임 이론)

Information set (game theory)

게임 이론에서, 정보 집합은 특정 플레이어의 경우, 해당 플레이어가 관찰한 것이 게임의 현재 시점에서 플레이어가 구별할 수 없는 결정 정점을 보여주는 집합이다. 결정 정점에 대한 더 나은 아이디어는 그림 1을 참조하십시오. 만약 게임이 완벽한 정보를 가지고 있다면, 모든 정보 세트에는 오직 한 명의 멤버, 즉 각 플레이어가 게임에서 현재 시점까지의 찬스 움직임과 선수 전략의 정확한 조합을 알기 때문에 그 단계에서 실제로 도달한 포인트만 포함된다. 그렇지 않으면 일부 선수가 지금까지 경기에서 어떤 일이 벌어졌는지, 포지션이 무엇인지 정확히 알 수 없는 경우다.

그림 1: 각 꼭지점(각각 1과 2의 경우 A와 B)에 옵션을 표시하여 각 플레이어의 가능한 정보를 나타내는 게임 트리

정보 세트는 광범위한 형태 게임에서 사용되며 게임 나무에서 자주 묘사된다. 게임 트리는 게임을 시작할 때부터의 경로와 각 플레이어의 다음 동작에 따라 만들 수 있는 후속 경로를 보여준다. 정보 세트는 그림 1과 같이 게임의 현재 단계에서 특정 플레이어의 옵션을 보여주는 정점을 표시하거나 점선, 원을 사용하여 각 플레이어의 가능한 움직임을 표시하기 위해 게임 트리에 쉽게 묘사할 수 있다.

좀 더 구체적으로, 광범위한 형태에서 정보 집합은 다음과 같은 의사결정 노드 집합이다.

  1. 세트의 모든 노드는 한 플레이어의 것이다.
  2. 게임이 정보 집합에 도달하면 이동 중인 플레이어는 정보 집합 내의 노드를 구분할 수 없다. 즉, 정보 집합에 두 개 이상의 노드가 포함된 경우 해당 집합이 속한 플레이어는 집합의 어느 노드에 도달했는지 알지 못한다.

광범위한 형태의 게임은 종종 각 플레이어가 여러 정보 세트를 형성하는 여러 동작을 할 수 있는 것을 포함한다. 플레이어는 정보 집합의 옵션에 기초하여 이러한 정점 각각에서 선택을 하는 것이다. 이것은 플레이어의 전략으로 알려져 있으며, 플레이라고도 하는 플레이의 시작부터 종료까지 플레이어의 경로를 제공할 수 있다. 경기의 플레이로부터, 우연이 개입되지 않는 한, 각 선수의 전략에 따라 항상 결과를 알 수 있을 것이다. 그러면 항상 단수적인 결과가 나오지는 않을 것이다. 모든 게임 플레이가 전략적인 것은 아니다. 왜냐하면 게임 플레이는 또한 우연한 움직임을 수반할 수 있기 때문이다. 우연의 움직임과 관련된 경우, 전략의 벡터는 발생할 수 있는 게임의 다중 결과의 확률 분포를 초래할 수 있다. 매번 움직임이 다를 가능성이 높기 때문에 우연이 개입됐을 때 게임의 여러 결과가 만들어질 수 있다. 그러나 전략의 강도에 기초하여 어떤 결과는 다른 결과보다 높은 확률을 가질 수 있다.

정보 집합의 개념은 포커의 게임을 연구하면서 동기 부여를 받은 존 폰 노이만(John von Neumann)에 의해 소개되었다.

Battle of the sexes 1
Battle of the sexes 2

오른쪽에는 넓은 형태로 나타나는 성 게임 전투의 두 가지 버전이 있다. 아래에는 이 두 게임의 정상적인 형태도 나와 있다.

첫 번째 게임은 단순히 순차적이다. 2번 선수가 움직일 기회가 있을 때, 1번 선수가 O(페라)를 선택했는지, F(오트볼)를 선택했는지 알고 있다.

두 번째 게임도 순차적이지만 점선은 2번 선수의 정보 세트를 보여준다. 2번 선수가 움직이면 1번 선수가 무엇을 했는지 알지 못한다는 것을 보여주는 일반적인 방법이다.

이 같은 차이는 두 경기에 대한 예측으로도 이어진다. 첫 경기에서는 1번 선수가 우세하다. 그들은 일단 플레이어 1이 오페라를 선택했다는 것을 알고 나면, 플레이어 2가 f(오토볼)를 선택하고 0을 얻는 것보다 o(페라)를 선택하고 2를 얻는 것이 더 낫기 때문에 그들이 O(페라)를 안전하게 선택할 수 있다는 것을 알고 있다. 공식적으로, 그것은 게임을 풀기 위해 하위 게임 완성도를 적용하는 것이다.

두 번째 게임에서 2번 선수는 1번 선수가 무엇을 했는지 관찰할 수 없기 때문에 동시 게임으로 보는 편이 나을 것이다. 그래서 내시 평형으로는 얻을 수 없는 어떤 것도 게임에서 얻을 수 없고, 우리는 표준 3의 평형도를 가지고 있다.

  1. 둘 다 오페라를 선택한다.
  2. 둘 다 풋볼을 선택하다.
  3. 또는 둘 다 혼합 전략을 사용하며, 플레이어 1은 O(페라) 3/5를, 플레이어 2는 F(오트볼) 3/5를 선택한다.

참고 항목

참조

  • Binmore, Ken (2007). Game Theory: A very short introduction. Oxford University Press. pp. 88–89. ISBN 0-19-921846-3.