이산확률분포 : 베르누이 분포, 이항 분포

728x90

이산형 확률분포 중 가장 기본이 되는 두 분포를 정리한다.
베르누이 분포는 "한 번 시도했을 때 성공이냐 실패냐"를 다루고,
이항 분포는 "그 시도를 n번 반복했을 때 k번 성공할 확률"을 다룬다.
단순히 공식을 외우는 것보다, 공식이 어떻게 유도되는지 이해하면 훨씬 오래 기억된다.

① 베르누이 분포 (Bernoulli Distribution)

개념

딱 두 가지 결과만 나오는 단 한 번의 시행을 베르누이 시행(Bernoulli Trial)이라고 한다. 결과는 성공(1) 또는 실패(0)이며, 성공 확률을 p, 실패 확률을 1-p로 표기한다.

동전 한 번 던져 앞면(성공) or 뒷면(실패)
이메일 한 통을 발송했을 때 수신자가 열었는가(1) 안 열었는가(0)
제품 하나를 검사했을 때 불량(1) or 정상(0)

확률 질량 함수(PMF) 유도

X = 1 (성공)일 확률은 p, X = 0 (실패)일 확률은 1-p다. 이 두 경우를 하나의 식으로 깔끔하게 표현하면 아래와 같다.

STEP 1 두 경우를 각각 쓰면
  P(X = 1) = p
  P(X = 0) = 1 − p
→ 이걸 x에 0과 1을 대입했을 때 두 경우가 모두 나오는 단일 식으로 표현하고 싶다. STEP 2 x = 1 대입 시 p¹(1−p)⁰ = p ✓
  x = 0 대입 시 p⁰(1−p)¹ = 1−p ✓
→ 지수 자리에 x와 1−x를 쓰면 두 경우가 자동으로 처리된다. 결과 f(x) = p^x(1−p)^1−x , x = 0, 1

f(x) = P(X = x) = p^x(1−p)^1−x , x = 0, 1

p: 성공 확률 | 1−p: 실패 확률

평균(기댓값)과 분산 유도

평균 E[X]

기댓값은 각 값 × 그 값이 나올 확률의 합이다.

E[X] = Σ x · P(X = x)
= 0 · (1−p) + 1 · p
= p → 실패(0)는 기댓값에 기여하지 않으므로, 성공 확률 p가 그대로 평균이 된다.

분산 Var(X)

분산은 E[X²] − (E[X])² 공식을 활용한다.

STEP 1 E[X²] 계산
E[X²] = 0² · (1−p) + 1² · p = p
→ X는 0 또는 1만 가지므로 X² = X. 따라서 E[X²] = E[X] = p STEP 2 분산 계산
Var(X) = E[X²] − (E[X])²
= p − p²
= p(1−p) → p와 1−p를 묶으면 더 직관적인 형태가 된다.

공식 요약

확률 질량 함수

p^x(1−p)^1−x

x = 0 또는 1

평균 (기댓값)

E[X] = p

성공 확률 그 자체

분산

Var(X) = p(1−p)

p = 0.5일 때 최대

시각화: p = 0.3인 베르누이 분포

📌 예시: 광고 클릭률이 30%인 경우 — X = 1(클릭), X = 0(미클릭)

X = 0

P = 0.70 (실패)

X = 1

P = 0.30 (성공)

평균 E[X] = 0.3 | 분산 Var(X) = 0.3 × 0.7 = 0.21

💡 분산이 p(1−p)인 직관적 이해
p = 0 이거나 p = 1이면 결과가 항상 정해져 있으므로 분산 = 0 (불확실성 없음)
p = 0.5일 때 0.5 × 0.5 = 0.25로 분산이 최대 → 결과를 가장 예측하기 어려운 상태

② 이항 분포 (Binomial Distribution)

개념

베르누이 시행을 n번 독립적으로 반복했을 때, 정확히 k번 성공할 확률을 구하는 분포다. 각 시행은 독립이고, 매 시행마다 성공 확률 p는 동일하다.

불량률 5%인 공장에서 제품 20개를 뽑았을 때 정확히 2개가 불량일 확률
클릭률 30%인 광고를 10명에게 보냈을 때 3명이 클릭할 확률
자유투 성공률 80%인 선수가 5번 시도했을 때 4번 성공할 확률

확률 질량 함수(PMF) 유도

STEP 1 성공 k번, 실패 n−k번이 순서 상관없이 나오는 확률
특정 순서(예: 성공-성공-실패-...)일 확률 = p^k(1−p)^n−k
→ 각 시행이 독립이므로 확률을 곱한다. STEP 2 n번 중 k번 성공하는 순서의 가짓수 = C(n,k) = n! / k!(n−k)!
→ 순서가 달라도 "k번 성공"이라는 사건은 같다. 조합(Combination)으로 경우의 수를 센다. STEP 3 둘을 곱하면
f(k) = C(n,k) · p^k(1−p)^n−k → 경우의 수 × 각 경우의 확률 = 전체 확률

f(k) = P(X = k) = C(n,k) · p^k(1−p)^n−k , k = 0, 1, 2, …, n

C(n,k) = n! / k!(n−k)! | p: 성공 확률 | n: 시행 횟수

💡 C(n,k)가 왜 필요한가? — 구체적 예시
3번 시도 중 2번 성공(k=2)하는 경우: 성성실 / 성실성 / 실성성 → 3가지
C(3,2) = 3! / 2!1! = 3 ✓
각 경우의 확률 = p² (1−p) → 전체 = 3 · p²(1−p)

평균(기댓값)과 분산 유도

평균 E[X]

이항 분포는 베르누이 시행 n번의 합이다. 각 시행의 결과를 X₁, X₂, …, Xₙ이라 하면 X = X₁ + X₂ + ··· + Xₙ 이고, 기댓값의 선형성에 의해 아래가 성립한다.

E[X] = E[X₁ + X₂ + ··· + Xₙ]
     = E[X₁] + E[X₂] + ··· + E[Xₙ]
     = p + p + ··· + p (n개)
     = np → 각 Xi는 베르누이 분포이므로 E[Xi] = p. 이를 n번 더한다.

분산 Var(X)

각 시행이 독립이므로 분산도 합산할 수 있다.

Var(X) = Var(X₁) + Var(X₂) + ··· + Var(Xₙ)
= p(1−p) + p(1−p) + ··· + p(1−p) (n개)
= np(1−p) → 독립 시행의 분산은 합산 가능. 각 Xi의 분산 p(1−p)를 n번 더한다.

공식 요약

확률 질량 함수

C(n,k)·p^k(1−p)^n−k

k = 0, 1, …, n

평균 (기댓값)

E[X] = np

시행 수 × 성공 확률

분산

Var(X) = np(1−p)

= npq (q = 1−p)

시각화: n=5, p=0.3인 이항 분포

📌 예시: 클릭률 30%인 광고를 5명에게 발송 — k명이 클릭할 확률

k = 0

0.168

k = 1

0.360

k = 2

0.309

k = 3

0.132

k = 4

0.028

k = 5

평균 E[X] = 5 × 0.3 = 1.5 | 분산 Var(X) = 5 × 0.3 × 0.7 = 1.05

이항계수 C(n,k) 계산 예시

n	k	C(n,k) 계산	결과
5	0	5! / 0!5! = 1	1
5	1	5! / 1!4! = 5	5
5	2	5! / 2!3! = 10	10
5	3	5! / 3!2! = 10	10
5	4	5! / 4!1! = 5	5
5	5	5! / 5!0! = 1	1

📌 검증: 모든 확률의 합은 1
이항 분포에서 k = 0부터 n까지 모든 P(X=k)의 합은 반드시 1이 되어야 한다.
이는 수학적으로 이항정리 (p + (1−p))ⁿ = 1ⁿ = 1 로부터 자동 보장된다.

⚠️ 이항 분포의 전제 조건
이항 분포를 적용하려면 아래 조건이 모두 충족되어야 한다.
1. 각 시행은 독립이어야 한다
2. 각 시행의 결과는 성공/실패 두 가지뿐이어야 한다
3. 매 시행마다 성공 확률 p가 일정해야 한다
4. 시행 횟수 n이 사전에 고정되어 있어야 한다

③ 베르누이 vs 이항 분포 비교

구분	베르누이 분포	이항 분포
시행 횟수	1번	n번
확률변수 X	0 또는 1	0, 1, 2, …, n
PMF	p^x(1−p)^1−x	C(n,k)·p^k(1−p)^n−k
평균	p	np
분산	p(1−p)	np(1−p)
관계	이항 분포 = 베르누이 시행 n번의 합

💡 n=1이면 이항 분포 = 베르누이 분포
이항 분포에 n=1을 대입하면 C(1,k)·p^k(1−p)^1−k = p^k(1−p)^1−k
→ 베르누이 분포와 동일한 식이 나온다. 베르누이 분포는 이항 분포의 특수한 경우다.

📌 핵심 정리

베르누이 분포: 1번 시행, 성공(1)/실패(0) → PMF = p^x(1−p)^1−x
베르누이 평균 = p | 분산 = p(1−p)
이항 분포: n번 독립 반복, k번 성공 → PMF = C(n,k)·p^k(1−p)^n−k
이항 평균 = np | 분산 = np(1−p)
C(n,k): n번 중 k번 성공하는 순서의 경우의 수 = n! / k!(n−k)!
이항 분포의 평균·분산은 베르누이 분포의 평균·분산을 n배한 것 (독립 합산)
n=1이면 이항 분포 = 베르누이 분포 (특수 케이스)
이항 분포 적용 조건: 독립 시행 / 이분 결과 / 고정 p / 고정 n

728x90

'수학&통계학' 카테고리의 다른 글

연속형 확률분포 : 균일분포, 지수분포 (0)	2026.05.11
이산확률분포 : 포아송 분포 (0)	2026.05.11
통계 분석 : 확률과 확률분포 (0)	2026.05.10
통계 개념 (3) : 측정과 척도 및 기타 용어 (0)	2026.05.10
통계 개념(2) : 모집단과 표본, 표본추출 (0)	2026.05.10

구구 코스모스

이산확률분포 : 베르누이 분포, 이항 분포

① 베르누이 분포 (Bernoulli Distribution)

개념

확률 질량 함수(PMF) 유도

평균(기댓값)과 분산 유도

평균 E[X]

분산 Var(X)

공식 요약

시각화: p = 0.3인 베르누이 분포

② 이항 분포 (Binomial Distribution)

개념

확률 질량 함수(PMF) 유도

평균(기댓값)과 분산 유도

평균 E[X]

분산 Var(X)

공식 요약

시각화: n=5, p=0.3인 이항 분포

이항계수 C(n,k) 계산 예시

③ 베르누이 vs 이항 분포 비교

📌 핵심 정리

'수학&통계학' 카테고리의 다른 글

티스토리툴바

이산확률분포 : 베르누이 분포, 이항 분포

① 베르누이 분포 (Bernoulli Distribution)

개념

확률 질량 함수(PMF) 유도

평균(기댓값)과 분산 유도

평균 E[X]

분산 Var(X)

공식 요약

시각화: p = 0.3인 베르누이 분포

② 이항 분포 (Binomial Distribution)

개념

확률 질량 함수(PMF) 유도

평균(기댓값)과 분산 유도

평균 E[X]

분산 Var(X)

공식 요약

시각화: n=5, p=0.3인 이항 분포

이항계수 C(n,k) 계산 예시

③ 베르누이 vs 이항 분포 비교

📌 핵심 정리

'수학&통계학' 카테고리의 다른 글

관련글

티스토리툴바