밸런스 설정

Set balancing

수학에서 집합 균형 문제는 집합을 거의 동일한 특성을 가진 두 개의 하위 집합으로 나누는 문제입니다.그것은 실험 [1]: 71–72 설계에서 자연스럽게 발생한다.

피험자 그룹이 있습니다.각 주제에는 이진법으로 간주되는 몇 가지 특징이 있습니다.예를 들어, 각 피험자는 젊거나 늙거나, 흑백이거나, 키가 크거나, 키가 작거나 등입니다.목표는 피험자를 치료 그룹(T)과 대조군 그룹(C)의 두 하위 그룹으로 나누는 것이다. 각 특징에 대해 T에서 이 특징을 가진 피험자의 수가 C에서 이 특징을 가진 피험자의 수와 거의 동일하도록 하는 것이다. 예를 들어, 두 그룹 모두 대략적으로 같은 수의 젊은이와 같은 수의 흑인을 가져야 한다.e, 같은 수의 키 큰 사람 등

행렬 표현

설정 밸런싱의 문제는 다음과 같이 기술할 수 있습니다.

m은 일반 모집단의 피험자 수입니다.

n은 잠재적인 기능의 수입니다.

피사체는 0 1 n × m 매트릭스인 A A로 설명됩니다. 각 열은 피사체를 나타내고 각 행은 피사체를 나타냅니다. j가 i j 경우 } i {\}= j j i {\ i가 없는 경우).

그룹 분할은 b{\b×{\ m1벡터에 설명되며, 가 치료 그룹 b 1{displaystyle }인 {}=1입니다.j는 컨트롤 그룹 C에 있습니다.

기능의 균형은 c { cb로 설명합니다.은 nx 특집에서 나는 함께 나는 T에서 만약 내 < c{\displaystyle 나는}만약 내입니다. c;0{\displaystyle c_{나는}>. 0}일 경우 그 다음에는 더 많은 과목은{\displaystyle 나는}c의 나는}{\displaystyle c_{나는}그 숫자 값이 불균형;0{\displaystyle c_{나는}<. 0}일 경우 그 다음에는 나는{\displaystyle과 더 많은 화제들이 있다. 나는}C에

지정된 파티션의 불균형은 다음과 같이 정의됩니다.

세트 밸런싱의 문제는 I를 최소화하는 b(\displaystyle I(b)를찾는 입니다

랜덤화 알고리즘

대략적인 해법은 다음과 같은 매우 간단한 랜덤화 알고리즘을 사용하여 찾을 수 있습니다.

각 피험자를 1/2 확률로 치료 그룹에 보냅니다.

행렬 공식에서:

1,-1}의 각 값에 1/2 확률로 b의 랜덤으로 선택합니다.

놀랍게도 이 알고리즘은 A A를 완전히 무시하지만 피쳐가 많을 경우 작은 불균형을 실현합니다.형식적으로 랜덤

실증:

}) 특징 i하게 의 ii 피사체 수)로 .다음 두 가지 경우를 고려합니다.

간단한 경우: lnn \ _ } , easy, easy,,,,,,,,,,,,, {\ {\ {\ {\ {\ {\ {\ {\ {\ {\ {\ {\ {\ {\ {\ {\ {\ {\ {\,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1일 경우 의 불균형은 최대 (되어 있음)가 됩니다

하드 케이스: i> {\i}> {\ m n . j마다 } = 。 각 변수 j { X_j 랜덤입니다.i {\ i 불균형: ={\ X { \_ {} { 체르노프로부터 독립된 랜덤 변수이며, > a : 0 style : 0> style : 0 > style : 0 : 0>

{ a ={ 4m \ ln n }} 를 선택하고 다음을 얻습니다.

노조에 맹세하건대

b [i : c m n]2 \ \ left [ \ i : { \ { m \ n } \ ]\{{}} 。

레퍼런스

  1. ^ Mitzenmacher, Michael & Upfal, Eli (2005). Probability and Computing: Randomized Algorithms and Probabilistic Analysis. Cambridge University Press. ISBN 0-521-83540-2.