스프래그-그룬디 정리

Sprague–Grundy theorem

결합 게임 이론에서, 스프래그-그룬디 정리정상적인 플레이 컨벤션 하에서 모든 공평한 게임은 님(Nim)의 1에이프 게임이나 님(Nim)의 무한 일반화에 해당한다고 명시하고 있다.따라서 그것은 자연수, 즉 등가선 게임에서 힙의 크기, 무한 일반화의 서수 수, 또는 또는 그 대신에 추가 연산이 여러 개의 힙을 결합하여 님에서 하나의 등가선 힙을 형성하는 대수적 시스템에서 그 1-heap 게임의 가치를 님으로 나타낼 수 있다.

공평한 게임의 그룬디 가치나 민첩한 가치는 게임이 동등한 독특한 민첩성이다.자연수에 의해 포지션이 인덱싱되는 게임의 경우(예: 힙 크기에 의해 인덱싱되는 님 그 자체) 게임의 연속적인 포지션에 대한 민첩성의 순서를 게임의 님 시퀀스라고 한다.

스프래그-그룬디 정리와 그 증거는 R. P. 스프래그(1936)[1]P. M. 그룬디(1939)에 의해 독자적으로 발견된 이론의 주요 결과를 캡슐화한다.[2]

정의들

스프래그-그룬디 정리의 목적상 게임은 엔드 조건(모든 게임이 끝나게 된다: 무한의 라인이 없다)과 정상적인 플레이 조건(움직이지 못하는 선수)을 만족시키는 완벽한 정보를 가진 2인용 순차 게임이다.

경기 중 어느 지점에서든 선수의 위치는 그들이 할 수 있는 일련의 움직임이다.일례로 제로 게임을 두 선수 모두 합법적인 움직임이 없는 투 플레이어 게임으로 규정할 수 있다.두 플레이어를 A}(앨리스의 경우)와 B B}(Bob의 경우)로 지칭하면 각 플레이어의 동작 집합이 비어 있으므로 ( )= ({ {로 위치를 표시한다

공평한 게임은 게임에서 주어진 어떤 지점에서, 각 플레이어가 정확히 같은 일련의 움직임을 허용받는 게임이다.정상적인 플레이는 공정한 경기의 한 예다.님에는 하나 이상의 물체가 쌓여 있고, 두 명의 플레이어(우리는 앨리스와 밥이라고 부름)가 돌아가면서 힙을 선택하고 그 속에서 하나 이상의 물체를 제거한다.우승자는 최종 힙에서 최종 오브젝트를 제거하는 선수다.게임은 공정하다. 왜냐하면 앨리스가 그녀의 차례에서 할 수 있는 동작은 밥이 그의 차례라면 할 수 있는 동작과 정확히 같기 때문이다.이와는 대조적으로, 체커와 같은 게임은 공정하지 않다. 왜냐하면 앨리스가 빨간색으로 놀고 있고 밥이 검은색으로 칠하고 있었다고 가정할 때, 만약 앨리스의 차례라면, 그녀는 빨간 조각만 움직일 수 있고, 밥의 차례라면 검은 조각만 움직일 수 있기 때문이다.

따라서 공평한 게임의 구성은 어느 쪽이든 같은 포지션으로 기록될 수 있다는 점에 유의하십시오. 누구의 차례든 이동은 동일하기 때문이다.예를 들어 제로 게임의 위치는 간단히 라고 쓸 수 있는데 왜냐하면 앨리스의 차례라면 그녀는 할 동작이 없고, 밥의 차례라면 그도 할 동작이 없기 때문이다.이동은 다음 선수를 남겨두는 위치와 연관될 수 있다.

그렇게 하면 위치가 반복적으로 정의될 수 있다.예를 들어 앨리스와 밥이 하는 님의 다음 게임을 생각해 보자.

님의 게임 예

A B C 1 2 앨리스는 A 0에서 1을 B 0에서 1을 B 0에서 1을 B 0에서 1을 B 0에서 1을 B 0에서 1을 B 0에서 1을 B 0에서 1을 B 0에서 1을 C 0에서 0에서 0을 1로 가져갔기 때문에 앨리스가 이긴다.
  • 게임의 6단계(모든 힙이 비어 있을 때)에서 위치는 {} 인데 이는 밥이 유효한 동작을 할 수 없기 때문이다.이 직책의 명칭은 0 {\ 입니다
  • 5단계에서 앨리스는 정확히 한 가지 옵션을 가지고 있었다: 힙 C에서 한 가지 물체를 제거하는 것, 즉 밥은 움직이지 않게 하는 것.그녀의 움직임은 Bob을 위치 에 남겨두기 때문에 그녀의 위치는 { 라고 쓰여 있다 우리는 이 의 이름을 1
  • 4단계에서 Bob은 B에서 하나를 제거하거나 C에서 하나를 제거하는 두 가지 옵션을 가지고 있었다.그러나 Bob이 어떤 힙에서 객체를 제거했는지는 중요하지 않다는 점에 유의하십시오.어느 쪽이든 앨리스는 정확히 하나의 더미 속에 하나의 물체를 남겨 두게 될 것이다.그래서, 우리의 재귀적 정의를 사용한다면, 밥은 정말로 오직 한 가지 움직임만을 가지고 있다: 따라서, 밥의 위치는{ 1
  • 3단계에서 앨리스는 C에서 두 개를 제거하거나, C에서 하나를 제거하거나, B에서 하나를 제거하는 세 가지 옵션을 가졌다.C에서 두 개를 제거하면 Bob이 1 에 위치하게 된다 C에서 하나를 제거하면 Bob은 각각의 크기 1인 { 1 의 두 개의 더미를 갖게 된다그러나 B에서 1을 제거하면 밥은 한 무더기에 두 개의 물체를 갖게 된다.His moves would then be and , so her move would result in the position . We call this position . Alice's position is then the set of all her moves:
  • 같은 재귀적 논리에 따라 2단계에서 밥의 위치는 { { } {\
  • 마침내 1단계에서 앨리스의 위치는

.

님버스

본 예제에서 언급된 특수 이름 names 1}, }을를) 님버라고 부른다.일반적으로 님 게임에서 님 에서 님 게임에서 n {\ *개의 객체가 정확히 하나의 힙에 개의 객체가 있는 위치에 해당한다.Formally, nimbers are defined inductively as follows: is , , and for all ,

님버라는 단어는 게임 님에서 유래한 것이지만 님버는 어떤 유한하고 공정한 게임의 위치를 기술하는데 사용될 수 있으며, 사실 스프래그-그룬디 정리는 유한하고 공정한 게임의 모든 예는 님버 한 과 연관될 수 있다고 기술하고 있다.

콤비네이션 게임스

포지션을 함께 추가하면 두 경기를 병행할 수 있다.예를 들어, 힙 A B 을(를) 사용한 님 게임을 한 번 더 생각해 보십시오

예제 게임 2

A' B' C' 1 1 1 B' 1 A' 1 1 Bob은 B' 0 1 B' 0 1 B' 0 1 B' 0 Bob에서 1 B. 0 Bob은 움직임이 없기 때문에 앨리스가 이긴다.

우리는 그것을 우리의 첫 번째 와 결합하여 여섯 개의 히프를 가진 복합 게임을 얻을 수 있다. displaystyle A 및 C C

콤바인드 게임

Sizes of heaps     Moves  A  B  C  A' B' C'       1  2  2  1  1  1   Alice takes 1 from A  0  2  2  1  1  1   Bob takes 1 from A'  0  2  2  0  1  1   Alice takes 1 from B'  0  2  2  0  0  1   Bob takes 1 from C'  0  2  2  0  0  0   Alice takes 2 from B  0  0  2  0  0  0   Bob takes 2 from C  0  0  0  0  0  0   Alice has no moves, so Bob wins.

두 게임을 구분하기 위해 첫 번째 예시 게임의 시작 위치 에 라벨을 붙인다. 그리고 파란색으로 색칠하십시오.

번째 예제 게임의 경우 시작 위치 에 라벨을 붙이고 빨간색으로 칠하십시오.

복합 게임의 출발 위치를 계산하려면 첫 번째 게임에서 플레이어가 움직여서 두 번째 게임을 그대로 두거나 두 번째 게임에서 첫 번째 게임을 그대로 둘 수 있다는 점을 기억해야 한다.따라서 복합 경기의 출발 위치는 다음과 같다.

The explicit formula for adding positions is: , which means that addition is both commutative and associative.

등가성

공정한 경기의 포지션은 두 가지 결과 등급으로 나뉜다: 다음 선수(턴이 있는 선수)가 승리하거나(N 이전 선수가 승리한다( P예를 들어 (는) -position이고, 1}은는) -position이다.

두 위치 , {\ G은(는 어떤 위치 (를) 추가하든 항상 동일한 결과 등급에 있으면 동일하다.공식적으로 H + G(가) + H 과(와) 동일한 결과 클래스에 속하는 경우에만 G ′

우리의 러닝 예시를 이용하기 위해, 위의 1차 경기와 2차 경기 모두에서, 앨리스가 매번 Bob을 {\ 포지션으로 밀어 넣는 동작을 할 수 있다는 것을 알 수 있다. 두 S S (는) - positions이다.(복합 게임에서 은 N -positions를 가진 선수라는 점에 유의하십시오.사실, + (는 P {\ {\ -위치인데, 우리가 Lema 2에서 보게 될 것처럼 을(를) 의미한다.

퍼스트 보조정리

주 정리를 증명하기 위한 중간 단계로서 위치 G 및 모든 {\ {P - 위치 A 대해 G + G\약 A이 유지됨을 보여준다.의 동등성 정의에 따르면 이는 G+ 및 A+ + H 이(가) 모든 에 대한 결과 클래스를 공유한다는 것을 보여주는 것과 같다.

+ 이(가) - 위치라고 가정합시다.그러면 플레이어는 A+ + A에 대한 승리 전략을 가지고 있다 A {\이() P 포지셔닝으로 존재)에 따라 A displaysty 에 응답하고 이동에 대응한다.+ 에 대한 승자 전략에 따라 G + H 유사한 이유로 존재함).따라서 + + 도 P - 위치여야 한다.

On the other hand, if is an -position, then is also an -position, because the next player has a winning strategy: choose a -position from among+ 옵션에서 앞 단락부터 을(를) 해당 위치에 추가하는 것이 여전히 -position이라고 결론짓는다.따라서 이 경우 + + 은(는) + - 여야 한다

이 두 가지 사례밖에 없기 때문에 보조정리기가 버티고 있다.

제2 보조정리

한 단계 더 나아가 {\을(를) -position인 경우에만 한다

In the forward direction, suppose that . Applying the definition of equivalence with , we find that (which is equal to by commutativity of addition) is in the same outcome class as G + {\ 는) {\ -position: 이동에 대해 이전 플레이어는 다른 복사본에서 동일한 이동으로 응답할 수 있으므로 항상 마지막 이동이어야 한다

In the reverse direction, since is a -position by hypothesis, it follows from the first lemma, , that . Similarly, since is also a -position, it follows from the first lemma in the form that .연관성과 일치성에 의해, 이러한 결과의 오른쪽은 동일하다.또한 동등성은 결과 등급에 대한 동등성 관계이기 때문에 \ 약은 동등성 관계. \ \\ \ g'의 transitability를 통해 우리는 로 결론을 내릴 수 있다

증명

우리는 구조 유도에 의해 모든 포지션이 민첩하다는 것을 증명한다.주어진 게임의 초기 위치가 더 민첩해야 한다는 보다 구체적인 결과는 게임 자체가 더 민첩하다는 것을 보여준다.

Consider a position . By the induction hypothesis, all of the options are equivalent to nimbers, say . So let . We will show that , where is the mex (minimum exclusion) of the numbers , that is, the smallest non-negative integer not equal to some .

우리가 가장 먼저 주목해야 할 것은 두 번째 보조정리기를 통해 g 약 G이다 (가) 0이면 그 주장은 사소한 사실일 뿐이다.Otherwise, consider . If the next player makes a move to in , then the previous player can move to in , and conversely if the next player makes a move in 이 후, 보조마사의 전방 함축에 의한 {\ 위치.따라서 + 은(는 P {\ {\{P -포지션이며, 보조마사의 역 함축적 의미를 g G{ G을(는)라고 한다

G + m G(가) P{\{\위치임을 보여주자, 두 번째 보조정리기를 다시 한 번 한다는 것은G ≈ m ≈ m m 이전 플레이어에 대해 명시적인 전략을 부여하여 그렇게 한다.

G 이(가) 비어 있다고 가정해 보십시오. + m 이(가) null 집합으로, P {\ -position이다.

왜냐하면 m{m\displaystyle}은 최소 제외 수 아니면 옵션에 ∗ m′{\displaystyle *m의}어디 m′<>m{\displaystyle m'<입니다 나이}., 이전 선수 G장조′{\displaystyle G의}∗에 m′{ 움직일 수 있는 다음 선수 구성 요소 ∗ m{\displaystyle *m}에 움직이고려해 보라.\displ. 그리고 앞에서 보듯이 어떤 포지션 플러스 그 자체는 -position이다.

만약 제가 &lt와 마지막으로, 대신 다음 선수는 구성 요소에서 G옵션에 ni{\displaystyle *n_{나는}∗{\displaystyle G의}′}를 움직인다.;m{\displaystyle n_{나는}<, ∗ m{\displaystyle *m}에서 제일}그 때 이전 선수 움직임 나는{\displaystyle *n_{나는}n∗에}, ni입니다. 가정합니다..{\d 이전 플레이어는 i 에서 m 로 이동한다 두 경우 모두 결과는 포지션 플러스 그 자체다.( 이(가) 모든 와(와) 다르다고 정의되었기 때문에 n = n_{i}=m일 수 없음)

요약하면, ′ G 약 G'}과 G {\을(를) 가지고 있다 transitability에 의해 G\ 으로 결론짓는다.

개발

(가) 공평한 게임의 위치라면 m{\ * 같은 고유한 m{\ m 그룬디 값 또는 그룬디 번호라고 하며, 이 값을 각각의 그러한 위치에 할당하는 함수를 스프래그룬디 함수라고 한다.R. L. Sprague와 P. M. Grundy는 독립적으로 이 기능의 명시적 정의를 내렸으며, 님 포지션에 대한 동등성의 어떤 개념에 기초하지 않았으며, 다음과 같은 속성을 가지고 있음을 보여주었다.

  • 크기 단일 님 {\ m즉, m 의 Grundy 값은 m
  • 포지션은 그룬디 값이 0인 경우에만 다음 플레이어가 이동할 수 있는 손실(, P -position)이다.
  • 유한한 위치 집합의 합계의 그룬디 값은 그 총계의 그룬디 값의 님섬일 뿐이다.

It follows straightforwardly from these results that if a position has a Grundy value of , then has the same Grundy value as , and therefore belongs to the same outcome class, for any position .따라서 스프래그와 그룬디는 이 글에 기술된 정리를 명시적으로 진술한 적은 없지만, 그들의 결과로부터 직접 따르며 그들에게 공로를 인정받는다.[3][4]이러한 결과는 이후 결합 게임 이론의 분야로 발전되었는데, 특히 리차드 가이, 엘윈 베를캄프, 존 호튼 콘웨이 등이 현재 스프래그-그룬디 정리에 캡슐화되어 있고, 여기에 기술된 형태로 그 증거를 증명하고 있다.이 분야는 '수학적 희곡승리 방법'과 '숫자와 게임'이라는 책에 소개되어 있다.

참고 항목

참조

  1. ^ Sprague, R. P. (1936). "Über mathematische Kampfspiele". Tohoku Mathematical Journal (in German). 41: 438–444. JFM 62.1070.03. Zbl 0013.29004.
  2. ^ Grundy, P. M. (1939). "Mathematics and games". Eureka. 2: 6–8. Archived from the original on 2007-09-27. 1964년, 27:9-11 인쇄
  3. ^ Smith, Cedric A.B. (1960), "Patrick Michael Grundy, 1917–1959", Journal of the Royal Statistical Society, Series A, 123 (2): 221–22
  4. ^ Schleicher, Dierk; Stoll, Michael (2006). "An introduction to Conway's games and numbers". Moscow Mathematical Journal. 6 (2): 359–388. arXiv:math.CO/0410026. doi:10.17323/1609-4514-2006-6-2-359-388.

외부 링크