본문 바로가기
수학&통계학

연속형 확률분포 : 균일분포, 지수분포

by 코스믹구구 2026. 5. 11.
728x90
연속형 확률분포 중 균일 분포지수 분포를 정리한다.
두 분포 모두 "연속형"이라는 공통점이 있지만 쓰임새와 모양이 전혀 다르다.
균일 분포는 모든 구간이 똑같이 평평하고, 지수 분포는 처음에 높다가 급격히 감소하는 모양이다.
각 분포의 PDF, 평균, 분산이 어떻게 유도되는지 단계별로 살펴본다.

① 균일 분포 (Uniform Distribution)

개념

연속형 확률변수 X가 구간 [a, b] 안의 모든 값에 대해 동일한 확률을 가지는 분포다. 어떤 구간이든 길이가 같으면 확률도 같다.

❓ "모든 값에 동일한 확률"이면 특정 값의 확률은?
연속형이므로 특정 한 점의 확률은 항상 0이다. "동일한 확률"이란 같은 길이의 구간에 대한 확률이 항상 같다는 의미다.
예) [2, 3] 구간의 확률 = [5, 6] 구간의 확률 (길이가 똑같이 1이므로)

 

확률 밀도 함수(PDF) 유도

전체 확률의 합(적분)은 반드시 1이어야 한다. [a, b] 구간 전체의 넓이가 1이 되려면 높이(밀도)는 얼마여야 할까?

조건 전체 확률 = 1
  ∫ab f(x) dx = 1
→ f(x)가 상수 c라면: c × (b − a) = 1 풀면 c = 1 / (b − a)
→ 구간의 길이 (b−a)의 역수가 밀도값이 된다. 결과 f(x) = 1/(b−a)   (a ≤ x ≤ b),   0 (otherwise)
f(x) = 1 / (b − a)  ,   a ≤ x ≤ b
a: 구간의 하한  |  b: 구간의 상한
구간 밖(x < a 또는 x > b)에서는 f(x) = 0

 

📌 균일 분포 PDF 형태 (a=2, b=6 예시)

 

구간 확률 계산

연속형이므로 특정 구간 [c, d]에 속할 확률은 PDF를 적분해 구한다. 균일 분포에서는 넓이 = 밑변 × 높이로 간단히 계산된다.

P(c ≤ X ≤ d) = ∫cd f(x) dx
             = ∫cd 1/(b−a) dx
             = (d − c) / (b − a) → 전체 구간 중 [c,d]가 차지하는 비율. 직사각형 넓이를 전체 넓이로 나눈 것.
P(c ≤ X ≤ d) = (d − c) / (b − a)
단, a ≤ c < d ≤ b

 

평균(기댓값)과 분산 유도

평균 E[X]

E[X] = ∫ab x · f(x) dx
     = ∫ab x · 1/(b−a) dx
     = 1/(b−a) · [x²/2]ab
     = 1/(b−a) · (b²−a²)/2
     = (b+a)(b−a) / (2(b−a))
     = (a + b) / 2 → 구간의 중앙값. 직관적으로도 "가운데"가 평균이 되는 게 자연스럽다.

분산 Var(X)

STEP 1 E[X²] 계산
E[X²] = ∫ab x² · 1/(b−a) dx
       = 1/(b−a) · [x³/3]ab
       = (b³ − a³) / (3(b−a))
       = (a² + ab + b²) / 3   ← 인수분해: b³−a³ = (b−a)(b²+ab+a²)
STEP 2 분산 = E[X²] − (E[X])²
Var(X) = (a² + ab + b²)/3 − ((a+b)/2)²
         = (a² + ab + b²)/3 − (a² + 2ab + b²)/4
         = (4(a²+ab+b²) − 3(a²+2ab+b²)) / 12
         = (a² − 2ab + b²) / 12
         = (b − a)² / 12 → 구간의 길이(b−a)가 넓을수록 분산이 커진다. 구간이 좁을수록 값이 몰려 분산이 작아진다.

공식 요약

확률 밀도 함수(PDF)
1 / (b − a)
구간 [a, b] 내 상수
평균
E[X] = (a+b)/2
구간의 중앙값
분산
Var(X) = (b−a)²/12
길이 제곱에 비례
💡 분산이 (b−a)²/12인 직관적 이해
분모 12는 적분 과정에서 자연스럽게 나오는 수지만, 핵심은 분자 (b−a)²다.
구간이 넓을수록(= b−a가 클수록) 값이 넓게 퍼지므로 분산도 커진다.
반대로 구간이 매우 좁아지면 (b→a) 분산 → 0. 값이 한 점에 집중되는 것과 같다.
⚠️ 균일 분포는 현실에서 드물다
완벽한 균일 분포는 자연 현상에서 거의 없다. 주로 다른 분포로의 변환 기저로 쓰이거나, 사전 지식이 전혀 없을 때 기본 가정(무정보 사전분포)으로 활용한다. 또한 시뮬레이션에서 난수를 생성할 때 U(0,1) 균일분포가 출발점이 된다.

 

반응형

 

② 지수 분포 (Exponential Distribution)

개념

어떤 사건이 다음에 발생하기까지 걸리는 시간(또는 간격)을 모델링하는 연속형 분포다. 포아송 분포가 "단위 시간에 몇 번 발생했는가"를 다룬다면, 지수 분포는 "다음 사건까지 얼마나 기다려야 하는가"를 다룬다.

❓ 포아송 분포와 지수 분포의 차이는?
두 분포는 같은 현상의 두 가지 관점이다.
• 포아송: "1시간 동안 몇 건이 발생했는가?" → 이산형, 횟수
• 지수: "다음 사건이 발생할 때까지 몇 분이나 기다려야 하는가?" → 연속형, 시간 간격

확률 밀도 함수(PDF) 유도

λ를 단위 시간당 평균 발생 횟수(포아송의 λ와 동일)라 할 때, 다음 사건이 발생하기까지 걸리는 시간 X의 분포를 구해보자.

STEP 1 "X > x"일 확률, 즉 시간 x까지 사건이 0번 발생할 확률
포아송 분포에서 시간 x 동안 평균 발생 횟수 = λx
P(시간 x 동안 0번 발생) = e−λx · (λx)⁰ / 0! = e−λx → 즉, P(X > x) = e⁻λˣ (아직 사건이 안 일어났을 확률) STEP 2 누적 분포 함수(CDF) F(x) = P(X ≤ x)
F(x) = 1 − P(X > x) = 1 − e−λx → x까지 사건이 한 번이라도 발생했을 확률 STEP 3 CDF를 미분하면 PDF
f(x) = F'(x) = d/dx (1 − e−λx) = λe−λx  (x ≥ 0) → x < 0은 시간이 음수이므로 f(x) = 0
f(x) = λe−λx  ,   x ≥ 0
λ(람다): 단위 시간당 평균 발생 횟수 (포아송의 λ와 동일)
x: 다음 사건까지 걸리는 시간 (x ≥ 0)
x < 0에서는 f(x) = 0

 

CDF와 확률 계산

누적 분포 함수(CDF): F(x) = P(X ≤ x) = 1 − e−λx  (x ≥ 0)

P(X > x) = e−λx  ← 무기억성의 핵심 수식

P(a ≤ X ≤ b) = F(b) − F(a) = e−λa − e−λb

 

평균(기댓값)과 분산 유도

평균 E[X]

E[X] = ∫0 x · λe−λx dx
→ 부분적분 활용: ∫u dv = uv − ∫v du  (u=x, dv=λe⁻λˣdx)      = [x·(−e−λx)]0 + ∫0 e−λx dx
     = 0 + [−e−λx/λ]0
     = 0 − (0 − 1/λ)
     = 1 / λ → λ=2(시간당 2번 발생)이면 평균 대기 시간 = 1/2. 직관과 일치!

분산 Var(X)

STEP 1 E[X²] 계산 (부분적분 두 번 적용)
E[X²] = ∫0 x² · λe−λx dx = 2/λ² → 부분적분을 반복 적용하면 E[Xⁿ] = n!/λⁿ 이라는 일반식이 나온다. STEP 2 분산 = E[X²] − (E[X])²
Var(X) = 2/λ² − (1/λ)²
         = 2/λ² − 1/λ²
         = 1 / λ²

 

공식 요약

확률 밀도 함수(PDF)
λe−λx
x ≥ 0
평균
E[X] = 1/λ
발생률의 역수
분산
Var(X) = 1/λ²
평균의 제곱
💡 E[X] = 1/λ의 직관
λ = 시간당 평균 발생 횟수 → 1/λ = 한 번 발생하는 데 걸리는 평균 시간
시간당 4번 발생하면(λ=4) → 평균 대기 시간 = 1/4시간 = 15분
분산 = (1/λ)² = 평균² → 표준편차 = 평균. 지수 분포는 항상 표준편차 = 평균이다.

 

무기억성 (Memoryless Property)

지수 분포의 가장 독특한 성질이다. "지금까지 기다린 시간이 얼마든 상관없이, 앞으로 기다려야 하는 시간의 분포는 항상 동일하다."

수식으로 P(X > s + t | X > s) = P(X > t)
→ "이미 s만큼 기다렸을 때, 추가로 t만큼 더 기다릴 확률"이 처음부터 t만큼 기다릴 확률과 같다. 증명 P(X > s+t | X > s) = P(X > s+t) / P(X > s)
                       = e−λ(s+t) / e−λs
                       = e−λt
                       = P(X > t) ✓
📌 무기억성의 핵심
이미 기다린 시간이 "소모"되지 않는다. 마치 매 순간 새로 시작하는 것처럼 동작한다.
연속형 분포 중 무기억성을 갖는 유일한 분포가 지수 분포다.
이산형 중에서는 기하 분포(Geometric Distribution)가 무기억성을 가진다.

 

⑤ 포아송 분포와 지수 분포의 관계

포아송 분포
단위 시간에
몇 번 발생?
이산형 | 횟수
공통 모수
λ (람다)
단위 시간당
평균 발생 횟수
지수 분포
다음 사건까지
얼마나 걸려?
연속형 | 시간 간격

두 분포는 같은 λ를 공유하며 서로 쌍을 이룬다.

  • 포아송 과정(Poisson Process)에서 사건 간 시간 간격은 지수 분포를 따른다
  • 지수 분포의 평균 1/λ는 포아송 분포의 평균 λ와 역수 관계다
  • 포아송의 무작위 독립 발생 가정 → 지수 분포의 무기억성으로 이어진다

 

⑥ 균일 분포 vs 지수 분포 비교

구분 균일 분포 지수 분포
PDF 형태 평평한 직사각형 오른쪽으로 감소하는 곡선
PDF 1/(b−a) λe−λx
정의 구간 [a, b] (유한) [0, ∞) (반무한)
모수 a, b (구간 하한·상한) λ (발생률)
평균 (a+b)/2 1/λ
분산 (b−a)²/12 1/λ²
무기억성 없음 있음
관련 분포 무정보 사전분포 포아송 분포

📌 핵심 정리

  • 균일 분포: [a,b] 구간 내 모든 값이 동일한 확률 → PDF = 1/(b−a)
  • 균일 분포 구간 확률: P(c≤X≤d) = (d−c)/(b−a) — 길이 비율
  • 균일 분포 평균 = (a+b)/2  |  분산 = (b−a)²/12
  • 지수 분포: 다음 사건까지의 대기 시간 → PDF = λe−λx (x ≥ 0)
  • 지수 분포 CDF: F(x) = 1 − e−λx
  • 지수 분포 평균 = 1/λ  |  분산 = 1/λ²  |  표준편차 = 평균
  • 무기억성: P(X>s+t | X>s) = P(X>t) — 연속형 중 유일
  • 포아송↔지수: 같은 λ 공유. 포아송(횟수) ↔ 지수(사건 간 시간)
728x90