이항분포 b(n,p)는 성공 확률인 p인 베르누이 분포를 n번 실행했을 때 성공한 횟수를 모델링 하는 확률 분포이다. 이번 글에서는 이 이항분포의 분산을 구해보도록 하겠다.
이항 분포의 정체
이항 분포 b(n,p)에 해당하는 확률 변수를 X라고 하면 X는 서로 독립인 Bernoulli(p) 확률변수 n개의 합과 같다. 이 사실을 표현하면 아래와 같다.
$$X = \sum_{i=1}^{n} X_i \text{ ,$X_i$는 독립인 Bernoulli(p)} $$
이항 분포의 분산
$X_i$는 독립이기 때문에 다음의 식이 성립한다.
$$Var(X) = \sum_{i=1}^{n} Var(X_i)$$
$X_i$의 분산은 p(1-p)는 이것을 n개 더한 값이 $X$의 분산이 된다. 따라서
$$Var(X) = np(1-p)$$