본문 바로가기
수학&통계학

이산확률분포 : 베르누이 분포, 이항 분포

by 코스믹구구 2026. 5. 11.
728x90
이산형 확률분포 중 가장 기본이 되는 두 분포를 정리한다.
베르누이 분포는 "한 번 시도했을 때 성공이냐 실패냐"를 다루고,
이항 분포는 "그 시도를 n번 반복했을 때 k번 성공할 확률"을 다룬다.
단순히 공식을 외우는 것보다, 공식이 어떻게 유도되는지 이해하면 훨씬 오래 기억된다.

① 베르누이 분포 (Bernoulli Distribution)

개념

딱 두 가지 결과만 나오는 단 한 번의 시행베르누이 시행(Bernoulli Trial)이라고 한다. 결과는 성공(1) 또는 실패(0)이며, 성공 확률을 p, 실패 확률을 1-p로 표기한다.

  • 동전 한 번 던져 앞면(성공) or 뒷면(실패)
  • 이메일 한 통을 발송했을 때 수신자가 열었는가(1) 안 열었는가(0)
  • 제품 하나를 검사했을 때 불량(1) or 정상(0)

 

확률 질량 함수(PMF) 유도

X = 1 (성공)일 확률은 p, X = 0 (실패)일 확률은 1-p다. 이 두 경우를 하나의 식으로 깔끔하게 표현하면 아래와 같다.

STEP 1 두 경우를 각각 쓰면
  P(X = 1) = p
  P(X = 0) = 1 − p
→ 이걸 x에 0과 1을 대입했을 때 두 경우가 모두 나오는 단일 식으로 표현하고 싶다. STEP 2 x = 1 대입 시 p1(1−p)0 = p ✓
  x = 0 대입 시 p0(1−p)1 = 1−p ✓
→ 지수 자리에 x와 1−x를 쓰면 두 경우가 자동으로 처리된다. 결과 f(x) = px(1−p)1−x  ,   x = 0, 1
f(x) = P(X = x) = px(1−p)1−x  ,   x = 0, 1
p: 성공 확률  |  1−p: 실패 확률

 

평균(기댓값)과 분산 유도

평균 E[X]

기댓값은 각 값 × 그 값이 나올 확률의 합이다.

E[X] = Σ x · P(X = x)
     = 0 · (1−p) + 1 · p
     = p → 실패(0)는 기댓값에 기여하지 않으므로, 성공 확률 p가 그대로 평균이 된다.

분산 Var(X)

분산은 E[X²] − (E[X])² 공식을 활용한다.

STEP 1 E[X²] 계산
E[X²] = 0² · (1−p) + 1² · p = p
→ X는 0 또는 1만 가지므로 X² = X. 따라서 E[X²] = E[X] = p STEP 2 분산 계산
Var(X) = E[X²] − (E[X])²
         = p − p²
         = p(1−p) → p와 1−p를 묶으면 더 직관적인 형태가 된다.

 

공식 요약

확률 질량 함수
px(1−p)1−x
x = 0 또는 1
평균 (기댓값)
E[X] = p
성공 확률 그 자체
분산
Var(X) = p(1−p)
p = 0.5일 때 최대

 

시각화: p = 0.3인 베르누이 분포

📌 예시: 광고 클릭률이 30%인 경우 — X = 1(클릭), X = 0(미클릭)
X = 0
P = 0.70 (실패)
X = 1
P = 0.30 (성공)

평균 E[X] = 0.3  |  분산 Var(X) = 0.3 × 0.7 = 0.21

💡 분산이 p(1−p)인 직관적 이해
p = 0 이거나 p = 1이면 결과가 항상 정해져 있으므로 분산 = 0 (불확실성 없음)
p = 0.5일 때 0.5 × 0.5 = 0.25로 분산이 최대 → 결과를 가장 예측하기 어려운 상태

 

반응형

② 이항 분포 (Binomial Distribution)

개념

베르누이 시행을 n번 독립적으로 반복했을 때, 정확히 k번 성공할 확률을 구하는 분포다. 각 시행은 독립이고, 매 시행마다 성공 확률 p는 동일하다.

  • 불량률 5%인 공장에서 제품 20개를 뽑았을 때 정확히 2개가 불량일 확률
  • 클릭률 30%인 광고를 10명에게 보냈을 때 3명이 클릭할 확률
  • 자유투 성공률 80%인 선수가 5번 시도했을 때 4번 성공할 확률

 

확률 질량 함수(PMF) 유도

STEP 1 성공 k번, 실패 n−k번이 순서 상관없이 나오는 확률
  특정 순서(예: 성공-성공-실패-...)일 확률 = pk(1−p)n−k
→ 각 시행이 독립이므로 확률을 곱한다. STEP 2 n번 중 k번 성공하는 순서의 가짓수 = C(n,k) = n! / k!(n−k)!
→ 순서가 달라도 "k번 성공"이라는 사건은 같다. 조합(Combination)으로 경우의 수를 센다. STEP 3 둘을 곱하면
f(k) = C(n,k) · pk(1−p)n−k → 경우의 수 × 각 경우의 확률 = 전체 확률
f(k) = P(X = k) = C(n,k) · pk(1−p)n−k  ,   k = 0, 1, 2, …, n
C(n,k) = n! / k!(n−k)!  |  p: 성공 확률  |  n: 시행 횟수
💡 C(n,k)가 왜 필요한가? — 구체적 예시
3번 시도 중 2번 성공(k=2)하는 경우: 성성실 / 성실성 / 실성성 → 3가지
C(3,2) = 3! / 2!1! = 3 ✓
각 경우의 확률 = p² (1−p) → 전체 = 3 · p²(1−p)

 

평균(기댓값)과 분산 유도

평균 E[X]

이항 분포는 베르누이 시행 n번의 합이다. 각 시행의 결과를 X₁, X₂, …, Xₙ이라 하면 X = X₁ + X₂ + ··· + Xₙ 이고, 기댓값의 선형성에 의해 아래가 성립한다.

E[X] = E[X₁ + X₂ + ··· + Xₙ]
     = E[X₁] + E[X₂] + ··· + E[Xₙ]
     = p + p + ··· + p   (n개)
     = np → 각 Xi는 베르누이 분포이므로 E[Xi] = p. 이를 n번 더한다.

분산 Var(X)

각 시행이 독립이므로 분산도 합산할 수 있다.

Var(X) = Var(X₁) + Var(X₂) + ··· + Var(Xₙ)
         = p(1−p) + p(1−p) + ··· + p(1−p)   (n개)
         = np(1−p) → 독립 시행의 분산은 합산 가능. 각 Xi의 분산 p(1−p)를 n번 더한다.

 

공식 요약

확률 질량 함수
C(n,k)·pk(1−p)n−k
k = 0, 1, …, n
평균 (기댓값)
E[X] = np
시행 수 × 성공 확률
분산
Var(X) = np(1−p)
= npq  (q = 1−p)

 

시각화: n=5, p=0.3인 이항 분포

📌 예시: 클릭률 30%인 광고를 5명에게 발송 — k명이 클릭할 확률
k = 0
0.168
k = 1
0.360
k = 2
0.309
k = 3
0.132
k = 4
0.028
k = 5
 

평균 E[X] = 5 × 0.3 = 1.5  |  분산 Var(X) = 5 × 0.3 × 0.7 = 1.05

 

이항계수 C(n,k) 계산 예시

n k C(n,k) 계산 결과
5 0 5! / 0!5! = 1 1
5 1 5! / 1!4! = 5 5
5 2 5! / 2!3! = 10 10
5 3 5! / 3!2! = 10 10
5 4 5! / 4!1! = 5 5
5 5 5! / 5!0! = 1 1
📌 검증: 모든 확률의 합은 1
이항 분포에서 k = 0부터 n까지 모든 P(X=k)의 합은 반드시 1이 되어야 한다.
이는 수학적으로 이항정리 (p + (1−p))ⁿ = 1ⁿ = 1 로부터 자동 보장된다.
⚠️ 이항 분포의 전제 조건
이항 분포를 적용하려면 아래 조건이 모두 충족되어야 한다.
1. 각 시행은 독립이어야 한다
2. 각 시행의 결과는 성공/실패 두 가지뿐이어야 한다
3. 매 시행마다 성공 확률 p가 일정해야 한다
4. 시행 횟수 n이 사전에 고정되어 있어야 한다

 

 

③ 베르누이 vs 이항 분포 비교

구분 베르누이 분포 이항 분포
시행 횟수 1번 n번
확률변수 X 0 또는 1 0, 1, 2, …, n
PMF px(1−p)1−x C(n,k)·pk(1−p)n−k
평균 p np
분산 p(1−p) np(1−p)
관계 이항 분포 = 베르누이 시행 n번의 합
💡 n=1이면 이항 분포 = 베르누이 분포
이항 분포에 n=1을 대입하면 C(1,k)·pk(1−p)1−k = pk(1−p)1−k
→ 베르누이 분포와 동일한 식이 나온다. 베르누이 분포는 이항 분포의 특수한 경우다.

📌 핵심 정리

  • 베르누이 분포: 1번 시행, 성공(1)/실패(0) → PMF = px(1−p)1−x
  • 베르누이 평균 = p  |  분산 = p(1−p)
  • 이항 분포: n번 독립 반복, k번 성공 → PMF = C(n,k)·pk(1−p)n−k
  • 이항 평균 = np  |  분산 = np(1−p)
  • C(n,k): n번 중 k번 성공하는 순서의 경우의 수 = n! / k!(n−k)!
  • 이항 분포의 평균·분산은 베르누이 분포의 평균·분산을 n배한 것 (독립 합산)
  • n=1이면 이항 분포 = 베르누이 분포 (특수 케이스)
  • 이항 분포 적용 조건: 독립 시행 / 이분 결과 / 고정 p / 고정 n
728x90