728x90
이산형 확률분포 중 가장 기본이 되는 두 분포를 정리한다.
베르누이 분포는 "한 번 시도했을 때 성공이냐 실패냐"를 다루고,
이항 분포는 "그 시도를 n번 반복했을 때 k번 성공할 확률"을 다룬다.
단순히 공식을 외우는 것보다, 공식이 어떻게 유도되는지 이해하면 훨씬 오래 기억된다.
베르누이 분포는 "한 번 시도했을 때 성공이냐 실패냐"를 다루고,
이항 분포는 "그 시도를 n번 반복했을 때 k번 성공할 확률"을 다룬다.
단순히 공식을 외우는 것보다, 공식이 어떻게 유도되는지 이해하면 훨씬 오래 기억된다.
① 베르누이 분포 (Bernoulli Distribution)
개념
딱 두 가지 결과만 나오는 단 한 번의 시행을 베르누이 시행(Bernoulli Trial)이라고 한다. 결과는 성공(1) 또는 실패(0)이며, 성공 확률을 p, 실패 확률을 1-p로 표기한다.
- 동전 한 번 던져 앞면(성공) or 뒷면(실패)
- 이메일 한 통을 발송했을 때 수신자가 열었는가(1) 안 열었는가(0)
- 제품 하나를 검사했을 때 불량(1) or 정상(0)
확률 질량 함수(PMF) 유도
X = 1 (성공)일 확률은 p, X = 0 (실패)일 확률은 1-p다. 이 두 경우를 하나의 식으로 깔끔하게 표현하면 아래와 같다.
STEP 1 두 경우를 각각 쓰면
P(X = 1) = p
P(X = 0) = 1 − p
→ 이걸 x에 0과 1을 대입했을 때 두 경우가 모두 나오는 단일 식으로 표현하고 싶다. STEP 2 x = 1 대입 시 p1(1−p)0 = p ✓
x = 0 대입 시 p0(1−p)1 = 1−p ✓
→ 지수 자리에 x와 1−x를 쓰면 두 경우가 자동으로 처리된다. 결과 f(x) = px(1−p)1−x , x = 0, 1
P(X = 1) = p
P(X = 0) = 1 − p
→ 이걸 x에 0과 1을 대입했을 때 두 경우가 모두 나오는 단일 식으로 표현하고 싶다. STEP 2 x = 1 대입 시 p1(1−p)0 = p ✓
x = 0 대입 시 p0(1−p)1 = 1−p ✓
→ 지수 자리에 x와 1−x를 쓰면 두 경우가 자동으로 처리된다. 결과 f(x) = px(1−p)1−x , x = 0, 1
f(x) = P(X = x) = px(1−p)1−x , x = 0, 1
p: 성공 확률 | 1−p: 실패 확률
평균(기댓값)과 분산 유도
평균 E[X]
기댓값은 각 값 × 그 값이 나올 확률의 합이다.
E[X] = Σ x · P(X = x)
= 0 · (1−p) + 1 · p
= p → 실패(0)는 기댓값에 기여하지 않으므로, 성공 확률 p가 그대로 평균이 된다.
= 0 · (1−p) + 1 · p
= p → 실패(0)는 기댓값에 기여하지 않으므로, 성공 확률 p가 그대로 평균이 된다.
분산 Var(X)
분산은 E[X²] − (E[X])² 공식을 활용한다.
STEP 1 E[X²] 계산
E[X²] = 0² · (1−p) + 1² · p = p
→ X는 0 또는 1만 가지므로 X² = X. 따라서 E[X²] = E[X] = p STEP 2 분산 계산
Var(X) = E[X²] − (E[X])²
= p − p²
= p(1−p) → p와 1−p를 묶으면 더 직관적인 형태가 된다.
E[X²] = 0² · (1−p) + 1² · p = p
→ X는 0 또는 1만 가지므로 X² = X. 따라서 E[X²] = E[X] = p STEP 2 분산 계산
Var(X) = E[X²] − (E[X])²
= p − p²
= p(1−p) → p와 1−p를 묶으면 더 직관적인 형태가 된다.
공식 요약
확률 질량 함수
px(1−p)1−x
x = 0 또는 1
평균 (기댓값)
E[X] = p
성공 확률 그 자체
분산
Var(X) = p(1−p)
p = 0.5일 때 최대
시각화: p = 0.3인 베르누이 분포
📌 예시: 광고 클릭률이 30%인 경우 — X = 1(클릭), X = 0(미클릭)
평균 E[X] = 0.3 | 분산 Var(X) = 0.3 × 0.7 = 0.21
💡 분산이 p(1−p)인 직관적 이해
p = 0 이거나 p = 1이면 결과가 항상 정해져 있으므로 분산 = 0 (불확실성 없음)
p = 0.5일 때 0.5 × 0.5 = 0.25로 분산이 최대 → 결과를 가장 예측하기 어려운 상태
p = 0 이거나 p = 1이면 결과가 항상 정해져 있으므로 분산 = 0 (불확실성 없음)
p = 0.5일 때 0.5 × 0.5 = 0.25로 분산이 최대 → 결과를 가장 예측하기 어려운 상태
반응형
② 이항 분포 (Binomial Distribution)
개념
베르누이 시행을 n번 독립적으로 반복했을 때, 정확히 k번 성공할 확률을 구하는 분포다. 각 시행은 독립이고, 매 시행마다 성공 확률 p는 동일하다.
- 불량률 5%인 공장에서 제품 20개를 뽑았을 때 정확히 2개가 불량일 확률
- 클릭률 30%인 광고를 10명에게 보냈을 때 3명이 클릭할 확률
- 자유투 성공률 80%인 선수가 5번 시도했을 때 4번 성공할 확률
확률 질량 함수(PMF) 유도
STEP 1 성공 k번, 실패 n−k번이 순서 상관없이 나오는 확률
특정 순서(예: 성공-성공-실패-...)일 확률 = pk(1−p)n−k
→ 각 시행이 독립이므로 확률을 곱한다. STEP 2 n번 중 k번 성공하는 순서의 가짓수 = C(n,k) = n! / k!(n−k)!
→ 순서가 달라도 "k번 성공"이라는 사건은 같다. 조합(Combination)으로 경우의 수를 센다. STEP 3 둘을 곱하면
f(k) = C(n,k) · pk(1−p)n−k → 경우의 수 × 각 경우의 확률 = 전체 확률
특정 순서(예: 성공-성공-실패-...)일 확률 = pk(1−p)n−k
→ 각 시행이 독립이므로 확률을 곱한다. STEP 2 n번 중 k번 성공하는 순서의 가짓수 = C(n,k) = n! / k!(n−k)!
→ 순서가 달라도 "k번 성공"이라는 사건은 같다. 조합(Combination)으로 경우의 수를 센다. STEP 3 둘을 곱하면
f(k) = C(n,k) · pk(1−p)n−k → 경우의 수 × 각 경우의 확률 = 전체 확률
f(k) = P(X = k) = C(n,k) · pk(1−p)n−k , k = 0, 1, 2, …, n
C(n,k) = n! / k!(n−k)! | p: 성공 확률 | n: 시행 횟수
💡 C(n,k)가 왜 필요한가? — 구체적 예시
3번 시도 중 2번 성공(k=2)하는 경우: 성성실 / 성실성 / 실성성 → 3가지
C(3,2) = 3! / 2!1! = 3 ✓
각 경우의 확률 = p² (1−p) → 전체 = 3 · p²(1−p)
3번 시도 중 2번 성공(k=2)하는 경우: 성성실 / 성실성 / 실성성 → 3가지
C(3,2) = 3! / 2!1! = 3 ✓
각 경우의 확률 = p² (1−p) → 전체 = 3 · p²(1−p)
평균(기댓값)과 분산 유도
평균 E[X]
이항 분포는 베르누이 시행 n번의 합이다. 각 시행의 결과를 X₁, X₂, …, Xₙ이라 하면 X = X₁ + X₂ + ··· + Xₙ 이고, 기댓값의 선형성에 의해 아래가 성립한다.
E[X] = E[X₁ + X₂ + ··· + Xₙ]
= E[X₁] + E[X₂] + ··· + E[Xₙ]
= p + p + ··· + p (n개)
= np → 각 Xi는 베르누이 분포이므로 E[Xi] = p. 이를 n번 더한다.
= E[X₁] + E[X₂] + ··· + E[Xₙ]
= p + p + ··· + p (n개)
= np → 각 Xi는 베르누이 분포이므로 E[Xi] = p. 이를 n번 더한다.
분산 Var(X)
각 시행이 독립이므로 분산도 합산할 수 있다.
Var(X) = Var(X₁) + Var(X₂) + ··· + Var(Xₙ)
= p(1−p) + p(1−p) + ··· + p(1−p) (n개)
= np(1−p) → 독립 시행의 분산은 합산 가능. 각 Xi의 분산 p(1−p)를 n번 더한다.
= p(1−p) + p(1−p) + ··· + p(1−p) (n개)
= np(1−p) → 독립 시행의 분산은 합산 가능. 각 Xi의 분산 p(1−p)를 n번 더한다.
공식 요약
확률 질량 함수
C(n,k)·pk(1−p)n−k
k = 0, 1, …, n
평균 (기댓값)
E[X] = np
시행 수 × 성공 확률
분산
Var(X) = np(1−p)
= npq (q = 1−p)
시각화: n=5, p=0.3인 이항 분포
📌 예시: 클릭률 30%인 광고를 5명에게 발송 — k명이 클릭할 확률
평균 E[X] = 5 × 0.3 = 1.5 | 분산 Var(X) = 5 × 0.3 × 0.7 = 1.05
이항계수 C(n,k) 계산 예시
| n | k | C(n,k) 계산 | 결과 |
|---|---|---|---|
| 5 | 0 | 5! / 0!5! = 1 | 1 |
| 5 | 1 | 5! / 1!4! = 5 | 5 |
| 5 | 2 | 5! / 2!3! = 10 | 10 |
| 5 | 3 | 5! / 3!2! = 10 | 10 |
| 5 | 4 | 5! / 4!1! = 5 | 5 |
| 5 | 5 | 5! / 5!0! = 1 | 1 |
📌 검증: 모든 확률의 합은 1
이항 분포에서 k = 0부터 n까지 모든 P(X=k)의 합은 반드시 1이 되어야 한다.
이는 수학적으로 이항정리 (p + (1−p))ⁿ = 1ⁿ = 1 로부터 자동 보장된다.
이항 분포에서 k = 0부터 n까지 모든 P(X=k)의 합은 반드시 1이 되어야 한다.
이는 수학적으로 이항정리 (p + (1−p))ⁿ = 1ⁿ = 1 로부터 자동 보장된다.
⚠️ 이항 분포의 전제 조건
이항 분포를 적용하려면 아래 조건이 모두 충족되어야 한다.
1. 각 시행은 독립이어야 한다
2. 각 시행의 결과는 성공/실패 두 가지뿐이어야 한다
3. 매 시행마다 성공 확률 p가 일정해야 한다
4. 시행 횟수 n이 사전에 고정되어 있어야 한다
이항 분포를 적용하려면 아래 조건이 모두 충족되어야 한다.
1. 각 시행은 독립이어야 한다
2. 각 시행의 결과는 성공/실패 두 가지뿐이어야 한다
3. 매 시행마다 성공 확률 p가 일정해야 한다
4. 시행 횟수 n이 사전에 고정되어 있어야 한다
③ 베르누이 vs 이항 분포 비교
| 구분 | 베르누이 분포 | 이항 분포 |
|---|---|---|
| 시행 횟수 | 1번 | n번 |
| 확률변수 X | 0 또는 1 | 0, 1, 2, …, n |
| PMF | px(1−p)1−x | C(n,k)·pk(1−p)n−k |
| 평균 | p | np |
| 분산 | p(1−p) | np(1−p) |
| 관계 | 이항 분포 = 베르누이 시행 n번의 합 | |
💡 n=1이면 이항 분포 = 베르누이 분포
이항 분포에 n=1을 대입하면 C(1,k)·pk(1−p)1−k = pk(1−p)1−k
→ 베르누이 분포와 동일한 식이 나온다. 베르누이 분포는 이항 분포의 특수한 경우다.
이항 분포에 n=1을 대입하면 C(1,k)·pk(1−p)1−k = pk(1−p)1−k
→ 베르누이 분포와 동일한 식이 나온다. 베르누이 분포는 이항 분포의 특수한 경우다.
📌 핵심 정리
- 베르누이 분포: 1번 시행, 성공(1)/실패(0) → PMF = px(1−p)1−x
- 베르누이 평균 = p | 분산 = p(1−p)
- 이항 분포: n번 독립 반복, k번 성공 → PMF = C(n,k)·pk(1−p)n−k
- 이항 평균 = np | 분산 = np(1−p)
- C(n,k): n번 중 k번 성공하는 순서의 경우의 수 = n! / k!(n−k)!
- 이항 분포의 평균·분산은 베르누이 분포의 평균·분산을 n배한 것 (독립 합산)
- n=1이면 이항 분포 = 베르누이 분포 (특수 케이스)
- 이항 분포 적용 조건: 독립 시행 / 이분 결과 / 고정 p / 고정 n
728x90
'수학&통계학' 카테고리의 다른 글
| 연속형 확률분포 : 균일분포, 지수분포 (0) | 2026.05.11 |
|---|---|
| 이산확률분포 : 포아송 분포 (0) | 2026.05.11 |
| 통계 분석 : 확률과 확률분포 (0) | 2026.05.10 |
| 통계 개념 (3) : 측정과 척도 및 기타 용어 (0) | 2026.05.10 |
| 통계 개념(2) : 모집단과 표본, 표본추출 (0) | 2026.05.10 |