샤플리 값

Shapley value
2012년 로이드 샤플리

샤플리 가치는 협동 게임 이론솔루션 개념이다. 1951년 도입해 2012년 노벨경제학상을 받은 로이드 샤플리를 기리기 위해 이름을 올렸다.[1][2]협동 게임에 그것은 모든 플레이어의 연합에 의해 생성된 총 잉여금의 고유한 분배(선수들 중)를 할당한다. 샤플리 값은 바람직한 특성들의 집합으로 특징지어진다. 하트(1989)는 그 주제에 대한 조사를 제공한다.[3][4]

설정은 다음과 같다: 참가자들의 연합이 협력하고, 그 협력으로부터 일정한 전체적인 이득을 얻는다. 어떤 선수들은 다른 선수들보다 연정에 더 많은 기여를 할 수도 있고 다른 협상력을 가질 수도 있기 때문에(예를 들어 전체 흑자를 파괴하겠다고 위협할 수도 있기 때문에, 어떤 특정한 게임에서 선수들 사이에 생성된 흑자의 최종 분배는 어떤 것이 일어나야 하는가? 또는 다른 표현으로 각 참가자가 전체적인 협력에 얼마나 중요한지, 그리고 그 또는 그녀가 합리적으로 기대할 수 있는 보상은 무엇인가? 샤플리 값은 이 질문에 대한 하나의 가능한 답을 제공한다.

비용 함수가 오목한 비용 공유 게임의 경우 무정부 상태의 가격최적화하고 안정성의 가격이 뒤따르는 최적의 비용 공유 규칙이 바로 샤플리 가치 비용 공유 규칙이다.[5]

형식 정의

공식적으로, 연합 게임은 다음과 같이 정의된다. There is a set N (of n players) and a function that maps subsets of players to the real numbers: , with , where denotes the empty set. 함수를 특성 함수라고 한다.

함수에는 다음과 같은 의미가 있다. S가 선수 연합이라면, S의 가치라고 불리는 v S)는 멤버가 협력으로 얻을 수 있는 총 예상 보상의 합계를 설명한다.

샤플리 가치는 선수들이 모두 협업을 한다고 가정해 총 이득을 선수들에게 분배하는 한 방법이다. 아래에 열거된 특정 바람직한 성질을 가진 유일한 분포라는 점에서 "공정한" 분포다. 샤플리 값에 따르면,[6] 가 선수에게 연합 게임(, ) 주는 금액은

여기서 n은 총 선수 수이고 합계는 선수 i가 포함되지 않은 N의 모든 서브셋 S에 걸쳐 있다. 이 공식은 다음과 같이 해석할 수 있다: 각 행위자가 공정한 보상으로 의 기여 v v(S∪{i}) - S)를 요구하고 각 행위자에 대해 이 기여의 평균을 각각 다른 순열에서 취한다고 상상한다.그의 연합은 형성될 수 있다.

Shapley 값에 대한 대체 등가 공식은 다음과 같다.

여기서 합계가 n! n 주문 R 에 걸쳐 있고, R (는) 주문 R 보다 앞에 있는 의 플레이어 집합이기도 하다 마지막으로 표현될 수 있다.

which can be interpreted as

In terms of synergy

From the characteristic function one can compute the synergy that each group of players provides. The synergy is the unique function , such that

for any subset of players. In other words, the 'total value' of the coalition comes from summing up the synergies of each possible subset of .

Given a characteristic function , the synergy function is calculated via

using the Inclusion exclusion principle. In other words, the synergy of coalition is the value , which is not already accounted for by its subsets.

The Shapley values are given in terms of the synergy function by [7][8]

여기서 합계는 (를) 포함하는 N 모든 하위 집합 에 대한 값이다

라고 해석할 수 있다.

각 연정의 시너지가 모든 조합원 간에 균등하게 나뉘는 셈이다.

사업예시

비즈니스에 대한 간단한 설명을 고려하십시오. 주인인 o는 그녀가 없으면 어떠한 이득도 얻을 수 없다는 점에서 결정적인 자본을 제공한다. w1,...,wm m 노동자가 있으며, 각각 총 이익에 p의 금액을 기여한다. 내버려두다

이 연합 게임의 가치 함수는

여기서 m { \{의 카디널리티 이 연합 게임의 샤플리 값을 계산하면 mp/2는 소유주, p/2는 m 작업자 각 1인당

이것은 시너지의 관점에서 이해할 수 있다. w 시너지 기능은

그래서 시너지를 내는 유일한 연합은 소유주와 개인 노동자들 사이의 일대일이다.

공식을 사용하여 w w에서 Shapley 값을 계산함

and

Glove game

The glove game is a coalitional game where the players have left- and right-hand gloves and the goal is to form pairs. Let

where players 1 and 2 have right-hand gloves and player 3 has a left-hand glove.

The value function for this coalitional game is

The formula for calculating the Shapley value is

where R is an ordering of the players and is the set of players in N which precede i in the order R.

The following table displays the marginal contributions of Player 1.

Observe

By a symmetry argument it can be shown that

Due to the efficiency axiom, the sum of all the Shapley values is equal to 1, which means that

Properties

The Shapley value has many desirable properties.

Efficiency

The sum of the Shapley values of all agents equals the value of the grand coalition, so that all the gain is distributed among the agents:

Proof:

since is a telescoping sum and there are N ! different orderings R.

대칭

이(가) 다음과 같은 의미에서 동등한 두 배우라면

j 를) 하지않는 N {\ N}의 부분집합 S {\ S}에 대해, i() = j )

이 재산은 동등의 동등 대우라고도 불린다.

선형성

gain function {\ vw {\displaystyle 의해 설명되는 두 개의 연합게임을 결합할 경우 분산 이득은 v에서 도출된 이득과 w 에서 도출된 이득에 대응해야 한다

모든 에 대해 또한 실제 번호 에 대해

모든 에 대해

Null 플레이어

게임 에서 null i 샤플리 값 () 은 0이다. 이() 포함되지 않은 모든 연합 에 대해 v( { ) = ) v} 이면 v v}에서 null이다.

플레이어가 을(를) 설정한 경우 샤플리 값은 모든 게임 집합에서 효율성, 대칭성, 선형성, Null 플레이어 등 4가지 특성을 모두 만족하는 유료 벡터를 제공하는 유일한 맵이다.

독립 실행형 테스트

If is a subadditive set function, i.e., , then for each agent : .

Similarly, if is a superadditive set function, i.e., , then for each agent : .

그래서 협력이 긍정적인 외연을 가지면 모든 대리인(약점)이 얻고, 부정적인 외연을 가지면 모든 대리인(약점)이 진다.[9]: 147–156

익명성.

i j 이(가) 두 에이전트로, 과(와) 동일한 게인 함수인 경우, 의 역할이 교환된 것을 제외하고, i)= = \ \ \displaystate \data.. 이는 대리인의 라벨 부착이 이익 배정에 역할을 하지 않는다는 것을 의미한다.

한계주의

샤플리 값은 플레이어 의 한계 기여만 인수로 사용하는 함수로 정의할 수 있다.

특성화

샤플리 값은 바람직한 특성을 가질 뿐만 아니라, 이러한 특성 중 일부분을 만족하는 유일한 지급 규칙이기도 하다. 예를 들어 효율성, 대칭성, 선형성 및 Null 플레이어의 네 가지 특성을 만족하는 유일한 지급 규칙이다.[10] 자세한 특성은 을 참조하십시오.

아우만-샤플리 값

1974년 저서에서 로이드 샤플리로버트 아우만은 샤플리 가치의 개념을 무한의 게임(비원자적 측정에 대해 정의됨)으로 확장하여 대각선 공식을 만들었다.[11] 이것은 후에 장프랑수아 머텐스아브라함 네이만에 의해 확장되었다.

위에서 보듯이, n인칭 게임의 가치는 모든 선수의 임의적인 순서에 따라 각각의 선수에게 가치나 연합이나 선수 이전의 선수들에 대한 기여에 대한 기대를 연관시킨다. 선수가 많고 각 개인이 단역할만 할 때, 주어진 선수보다 앞선 모든 선수의 집합은 경험적으로 선수들의 좋은 표본으로 생각되어, 주어진 극소수 선수의 가치가 모든 선수 모집단의 "완벽한" 표본 가치에 대한 "그의" 기여로 간주된다.

상징적으로, v가 각 연정 c 측정 가능한 집합 I의 부분 집합과 연관된 연정적 가치 함수라면 일반성의 손실 없이 =[0 , {\로 생각할 수 있다.

여기서( )( s)(는 게임 내 최소 플레이어 ds의 샤플리 값을 나타내며, tI는 모든 플레이어의 비율 t를 포함하는 전체 플레이어 집합 I의 완벽한 샘플이며, + ds 가입 후 얻은 연합이다. 이것은 대각 공식의 휴리스틱 형식이다.

Assuming some regularity of the worth function, for example assuming v can be represented as differentiable function of a non-atomic measure on I, μ, with density function , with c) 의 특성 함수. 그런 조건하에서

( )= (I)

단계 함수로 밀도를 근사하고 밀도 함수의 각 수준에 대한 비율 t를 유지함으로써 알 수 있듯이,

대각 공식은 이후 오만과 샤플리에 의해 개발된 형태를 가진다(1974년).

μ 이상의 μ는 벡터 값을 매길 수 있다(함수가 정의되고 μ의 범위에서 구별되는 한, 위의 공식은 의미가 있다).

위의 주장에서 측정치에 원자 )= ( I) 이(가) 더 이상 사실이 아닌 경우 - 대각 공식이 대부분 비원자 게임에 적용되는 이유다.

함수 f가 더 이상 다를 수 없을 때 이 대각 공식을 확장하기 위해 두 가지 접근법이 배치되었다. Mertens는 원래의 공식으로 돌아가서 적분 후에 파생상품을 취함으로써 스무딩 효과의 혜택을 얻는다. 네이먼은 다른 접근법을 취했다. Mertens(1980)에서 Mertens의 접근 방식을 기본으로 적용했던 것으로 돌아가자.[12]

This works for example for majority games—while the original diagonal formula cannot be used directly. How Mertens further extends this by identifying symmetries that the Shapley value should be invariant upon, and averaging over such symmetries to create further smoothing effect commuting averages with the derivative operation as above.[13] A survey for non atomic value is found in Neyman (2002)[14]

Generalization to coalitions

The Shapley value only assigns values to the individual agents. It has been generalized[15] to apply to a group of agents C as,

In terms of the synergy function above, this reads [7][8]

where the sum goes over all subsets of that contain .

This formula suggests the interpretation that the Shapley value of a coalition is be thought of as the standard Shapley value of a single player, if the coalition is treated like a single player.

Value of a player to another player

The Shapley value was decomposed in [16] into a matrix of values

각 값 j( ) j 값을 나타낸다 이 행렬은 만족한다.

즉, 전체 게임에 대한 플레이어 의 가치는 모든 개별 플레이어에게 주어진 가치의 합이다.

위에서 정의한 과(와)의 시너지 측면에서 이 값은

여기서 합계는 j (를) 포함하는 N 모든 하위 S 을(를) 초과한다

이 값은 i{\i} 및 {\j}을를) 포함하는 모든 하위 집합에 대한 합으로 해석할 수 있으며, 각 하위 S{\ 대한 합은 다음과 같다.

  • 해당 부분 집합의 ( ) 에 대한 시너지를 취한다.
  • 이를 부분 S{\의 플레이어 수로 나눈다 잉여 가치 i{\가 이 연합에서 얻는 이익으로 해석한다.
  • 이를 S 로 더 나누어 플레이어 j에 귀속되는 플레이어 j값을 구하십시오.

In other words, the synergy value of each coalition is evenly divided among all pairs of players in that coalition, where generates surplus for .


In machine learning

The Shapley value provides a principled way to explain the predictions of nonlinear models common in the field of machine learning. By interpreting a model trained on a set of features as a value function on a coalition of players, Shapley values provide a natural way to compute which features contribute to a prediction.[17] This unifies several other methods including Locally Interpretable Model-Agnostic Explanations (LIME),[18] DeepLIFT,[19] and Layer-Wise Relevance Propagation.[20]

See also

References

  1. ^ Shapley, Lloyd S. (August 21, 1951). "Notes on the n-Person Game -- II: The Value of an n-Person Game" (PDF). Santa Monica, Calif.: RAND Corporation.
  2. ^ Roth, Alvin E., ed. (1988). The Shapley Value: Essays in Honor of Lloyd S. Shapley. Cambridge: Cambridge University Press. doi:10.1017/CBO9780511528446. ISBN 0-521-36177-X.
  3. ^ Hart, Sergiu (1989). "Shapley Value". In Eatwell, J.; Milgate, M.; Newman, P. (eds.). The New Palgrave: Game Theory. Norton. pp. 210–216. doi:10.1007/978-1-349-20181-5_25. ISBN 978-0-333-49537-7.
  4. ^ Hart, Sergiu (May 12, 2016). "A Bibliography of Cooperative Games: Value Theory".
  5. ^ Phillips, Matthew; Marden, Jason R. (July 2018). "Design Tradeoffs in Concave Cost-Sharing Games". IEEE Transactions on Automatic Control. 63 (7): 2242–2247. doi:10.1109/tac.2017.2765299. ISSN 0018-9286. S2CID 45923961.
  6. ^ For a proof of unique existence, see Ichiishi, Tatsuro (1983). Game Theory for Economic Analysis. New York: Academic Press. pp. 118–120. ISBN 0-12-370180-5.
  7. ^ a b Grabisch, Michel (October 1997). "Alternative Representations of Discrete Fuzzy Measures for Decision Making". International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems. 5 (5): 587–607. doi:10.1142/S0218488597000440. ISSN 0218-4885.
  8. ^ a b Grabisch, Michel (1 December 1997). "k-order additive discrete fuzzy measures and their representation". Fuzzy Sets and Systems. 92 (2): 167–189. doi:10.1016/S0165-0114(97)00168-1. ISSN 0165-0114.
  9. ^ a b Herve Moulin (2004). Fair Division and Collective Welfare. Cambridge, Massachusetts: MIT Press. ISBN 9780262134231.
  10. ^ Shapley, Lloyd S. (1953). "A Value for n-person Games". In Kuhn, H. W.; Tucker, A. W. (eds.). Contributions to the Theory of Games. Annals of Mathematical Studies. 28. Princeton University Press. pp. 307–317. doi:10.1515/9781400881970-018. ISBN 9781400881970.
  11. ^ Aumann, Robert J.; Shapley, Lloyd S. (1974). Values of Non-Atomic Games. Princeton: Princeton Univ. Press. ISBN 0-691-08103-4.
  12. ^ Mertens, Jean-François (1980). "Values and Derivatives". Mathematics of Operations Research. 5 (4): 523–552. doi:10.1287/moor.5.4.523. JSTOR 3689325.
  13. ^ Mertens, Jean-François (1988). "The Shapley Value in the Non Differentiable Case". International Journal of Game Theory. 17 (1): 1–65. doi:10.1007/BF01240834. S2CID 118017018.
  14. ^ Neyman, A., 2002. Value of Games with infinitely many Players, "Handbook of Game Theory with Economic Applications," Handbook of Game Theory with Economic Applications, Elsevier, edition 1, volume 3, number 3, 00. R.J. Aumann & S. Hart (ed.).[1]
  15. ^ Grabisch, Michel; Roubens, Marc (1999). "An axiomatic approach to the concept of interaction among players in cooperative games". International Journal of Game Theory. 28 (4): 547-565. doi:10.1007/s001820050125. S2CID 18033890.
  16. ^ Hausken, Kjell; Mohr, Matthias (2001). "The Value of a Player in n-Person Games". Social Choice and Welfare. 18 (3): 465–83. doi:10.1007/s003550000070. JSTOR 41060209. S2CID 27089088.
  17. ^ Lundberg, Scott M.; Lee, Su-In (2017). "A Unified Approach to Interpreting Model Predictions". Advances in Neural Information Processing Systems. 30: 4765–4774. arXiv:1705.07874. Retrieved 2021-01-30.
  18. ^ Ribeiro, Marco Tulio; Singh, Sameer; Guestrin, Carlos (2016-08-13). "Why Should I Trust You?". New York, NY, USA: ACM. doi:10.1145/2939672.2939778. ISBN 978-1-4503-4232-2.
  19. ^ Shrikumar, Avanti; Greenside, Peyton; Kundaje, Anshul (2017-07-17). "Learning Important Features Through Propagating Activation Differences". PMLR. pp. 3145–3153. ISSN 2640-3498. Retrieved 2021-01-30.
  20. ^ Bach, Sebastian; Binder, Alexander; Montavon, Grégoire; Klauschen, Frederick; Müller, Klaus-Robert; Samek, Wojciech (2015-07-10). Suarez, Oscar Deniz (ed.). "On Pixel-Wise Explanations for Non-Linear Classifier Decisions by Layer-Wise Relevance Propagation". PLOS ONE. Public Library of Science (PLoS). 10 (7): e0130140. Bibcode:2015PLoSO..1030140B. doi:10.1371/journal.pone.0130140. ISSN 1932-6203. PMC 4498753. PMID 26161953.

Further reading

External links