연속형 확률분포 : 균일분포, 지수분포

728x90

연속형 확률분포 중 균일 분포와 지수 분포를 정리한다.
두 분포 모두 "연속형"이라는 공통점이 있지만 쓰임새와 모양이 전혀 다르다.
균일 분포는 모든 구간이 똑같이 평평하고, 지수 분포는 처음에 높다가 급격히 감소하는 모양이다.
각 분포의 PDF, 평균, 분산이 어떻게 유도되는지 단계별로 살펴본다.

① 균일 분포 (Uniform Distribution)

개념

연속형 확률변수 X가 구간 [a, b] 안의 모든 값에 대해 동일한 확률을 가지는 분포다. 어떤 구간이든 길이가 같으면 확률도 같다.

❓ "모든 값에 동일한 확률"이면 특정 값의 확률은?

연속형이므로 특정 한 점의 확률은 항상 0이다. "동일한 확률"이란 같은 길이의 구간에 대한 확률이 항상 같다는 의미다.
예) [2, 3] 구간의 확률 = [5, 6] 구간의 확률 (길이가 똑같이 1이므로)

확률 밀도 함수(PDF) 유도

전체 확률의 합(적분)은 반드시 1이어야 한다. [a, b] 구간 전체의 넓이가 1이 되려면 높이(밀도)는 얼마여야 할까?

조건 전체 확률 = 1
∫_a^b f(x) dx = 1
→ f(x)가 상수 c라면: c × (b − a) = 1 풀면 c = 1 / (b − a)
→ 구간의 길이 (b−a)의 역수가 밀도값이 된다. 결과 f(x) = 1/(b−a) (a ≤ x ≤ b), 0 (otherwise)

f(x) = 1 / (b − a) , a ≤ x ≤ b

a: 구간의 하한 | b: 구간의 상한
구간 밖(x < a 또는 x > b)에서는 f(x) = 0

📌 균일 분포 PDF 형태 (a=2, b=6 예시)

구간 확률 계산

연속형이므로 특정 구간 [c, d]에 속할 확률은 PDF를 적분해 구한다. 균일 분포에서는 넓이 = 밑변 × 높이로 간단히 계산된다.

P(c ≤ X ≤ d) = ∫_c^d f(x) dx
= ∫_c^d 1/(b−a) dx
= (d − c) / (b − a) → 전체 구간 중 [c,d]가 차지하는 비율. 직사각형 넓이를 전체 넓이로 나눈 것.

P(c ≤ X ≤ d) = (d − c) / (b − a)

단, a ≤ c < d ≤ b

평균(기댓값)과 분산 유도

평균 E[X]

E[X] = ∫_a^b x · f(x) dx
     = ∫_a^b x · 1/(b−a) dx
     = 1/(b−a) · [x²/2]_a^b
     = 1/(b−a) · (b²−a²)/2
     = (b+a)(b−a) / (2(b−a))
     = (a + b) / 2 → 구간의 중앙값. 직관적으로도 "가운데"가 평균이 되는 게 자연스럽다.

분산 Var(X)

STEP 1 E[X²] 계산
E[X²] = ∫_a^b x² · 1/(b−a) dx
       = 1/(b−a) · [x³/3]_a^b
       = (b³ − a³) / (3(b−a))
       = (a² + ab + b²) / 3   ← 인수분해: b³−a³ = (b−a)(b²+ab+a²)
STEP 2 분산 = E[X²] − (E[X])²
Var(X) = (a² + ab + b²)/3 − ((a+b)/2)²
         = (a² + ab + b²)/3 − (a² + 2ab + b²)/4
         = (4(a²+ab+b²) − 3(a²+2ab+b²)) / 12
         = (a² − 2ab + b²) / 12
         = (b − a)² / 12 → 구간의 길이(b−a)가 넓을수록 분산이 커진다. 구간이 좁을수록 값이 몰려 분산이 작아진다.

공식 요약

확률 밀도 함수(PDF)

1 / (b − a)

구간 [a, b] 내 상수

평균

E[X] = (a+b)/2

구간의 중앙값

분산

Var(X) = (b−a)²/12

길이 제곱에 비례

💡 분산이 (b−a)²/12인 직관적 이해
분모 12는 적분 과정에서 자연스럽게 나오는 수지만, 핵심은 분자 (b−a)²다.
구간이 넓을수록(= b−a가 클수록) 값이 넓게 퍼지므로 분산도 커진다.
반대로 구간이 매우 좁아지면 (b→a) 분산 → 0. 값이 한 점에 집중되는 것과 같다.

⚠️ 균일 분포는 현실에서 드물다
완벽한 균일 분포는 자연 현상에서 거의 없다. 주로 다른 분포로의 변환 기저로 쓰이거나, 사전 지식이 전혀 없을 때 기본 가정(무정보 사전분포)으로 활용한다. 또한 시뮬레이션에서 난수를 생성할 때 U(0,1) 균일분포가 출발점이 된다.

② 지수 분포 (Exponential Distribution)

개념

어떤 사건이 다음에 발생하기까지 걸리는 시간(또는 간격)을 모델링하는 연속형 분포다. 포아송 분포가 "단위 시간에 몇 번 발생했는가"를 다룬다면, 지수 분포는 "다음 사건까지 얼마나 기다려야 하는가"를 다룬다.

❓ 포아송 분포와 지수 분포의 차이는?

두 분포는 같은 현상의 두 가지 관점이다.
• 포아송: "1시간 동안 몇 건이 발생했는가?" → 이산형, 횟수
• 지수: "다음 사건이 발생할 때까지 몇 분이나 기다려야 하는가?" → 연속형, 시간 간격

확률 밀도 함수(PDF) 유도

λ를 단위 시간당 평균 발생 횟수(포아송의 λ와 동일)라 할 때, 다음 사건이 발생하기까지 걸리는 시간 X의 분포를 구해보자.

STEP 1 "X > x"일 확률, 즉 시간 x까지 사건이 0번 발생할 확률
포아송 분포에서 시간 x 동안 평균 발생 횟수 = λx
P(시간 x 동안 0번 발생) = e^−λx · (λx)⁰ / 0! = e^−λx → 즉, P(X > x) = e⁻λˣ (아직 사건이 안 일어났을 확률) STEP 2 누적 분포 함수(CDF) F(x) = P(X ≤ x)
F(x) = 1 − P(X > x) = 1 − e^−λx → x까지 사건이 한 번이라도 발생했을 확률 STEP 3 CDF를 미분하면 PDF
f(x) = F'(x) = d/dx (1 − e^−λx) = λe^−λx (x ≥ 0) → x < 0은 시간이 음수이므로 f(x) = 0

f(x) = λe^−λx , x ≥ 0

λ(람다): 단위 시간당 평균 발생 횟수 (포아송의 λ와 동일)
x: 다음 사건까지 걸리는 시간 (x ≥ 0)
x < 0에서는 f(x) = 0

CDF와 확률 계산

누적 분포 함수(CDF): F(x) = P(X ≤ x) = 1 − e^−λx (x ≥ 0)

P(X > x) = e^−λx ← 무기억성의 핵심 수식

P(a ≤ X ≤ b) = F(b) − F(a) = e^−λa − e^−λb

평균(기댓값)과 분산 유도

평균 E[X]

E[X] = ∫₀^∞ x · λe^−λx dx
→ 부분적분 활용: ∫u dv = uv − ∫v du (u=x, dv=λe⁻λˣdx)      = [x·(−e^−λx)]₀^∞ + ∫₀^∞ e^−λx dx
     = 0 + [−e^−λx/λ]₀^∞
     = 0 − (0 − 1/λ)
     = 1 / λ → λ=2(시간당 2번 발생)이면 평균 대기 시간 = 1/2. 직관과 일치!

분산 Var(X)

STEP 1 E[X²] 계산 (부분적분 두 번 적용)
E[X²] = ∫₀^∞ x² · λe^−λx dx = 2/λ² → 부분적분을 반복 적용하면 E[Xⁿ] = n!/λⁿ 이라는 일반식이 나온다. STEP 2 분산 = E[X²] − (E[X])²
Var(X) = 2/λ² − (1/λ)²
= 2/λ² − 1/λ²
= 1 / λ²

공식 요약

확률 밀도 함수(PDF)

λe^−λx

x ≥ 0

평균

E[X] = 1/λ

발생률의 역수

분산

Var(X) = 1/λ²

평균의 제곱

💡 E[X] = 1/λ의 직관
λ = 시간당 평균 발생 횟수 → 1/λ = 한 번 발생하는 데 걸리는 평균 시간
시간당 4번 발생하면(λ=4) → 평균 대기 시간 = 1/4시간 = 15분
분산 = (1/λ)² = 평균² → 표준편차 = 평균. 지수 분포는 항상 표준편차 = 평균이다.

무기억성 (Memoryless Property)

지수 분포의 가장 독특한 성질이다. "지금까지 기다린 시간이 얼마든 상관없이, 앞으로 기다려야 하는 시간의 분포는 항상 동일하다."

수식으로 P(X > s + t | X > s) = P(X > t)
→ "이미 s만큼 기다렸을 때, 추가로 t만큼 더 기다릴 확률"이 처음부터 t만큼 기다릴 확률과 같다. 증명 P(X > s+t | X > s) = P(X > s+t) / P(X > s)
                       = e^−λ(s+t) / e^−λs
                       = e^−λt
                       = P(X > t) ✓

📌 무기억성의 핵심
이미 기다린 시간이 "소모"되지 않는다. 마치 매 순간 새로 시작하는 것처럼 동작한다.
연속형 분포 중 무기억성을 갖는 유일한 분포가 지수 분포다.
이산형 중에서는 기하 분포(Geometric Distribution)가 무기억성을 가진다.

⑤ 포아송 분포와 지수 분포의 관계

포아송 분포

단위 시간에
몇 번 발생?

이산형 | 횟수

⇄

공통 모수

λ (람다)

단위 시간당
평균 발생 횟수

⇄

지수 분포

다음 사건까지
얼마나 걸려?

연속형 | 시간 간격

두 분포는 같은 λ를 공유하며 서로 쌍을 이룬다.

포아송 과정(Poisson Process)에서 사건 간 시간 간격은 지수 분포를 따른다
지수 분포의 평균 1/λ는 포아송 분포의 평균 λ와 역수 관계다
포아송의 무작위 독립 발생 가정 → 지수 분포의 무기억성으로 이어진다

⑥ 균일 분포 vs 지수 분포 비교

구분	균일 분포	지수 분포
PDF 형태	평평한 직사각형	오른쪽으로 감소하는 곡선
PDF	1/(b−a)	λe^−λx
정의 구간	[a, b] (유한)	[0, ∞) (반무한)
모수	a, b (구간 하한·상한)	λ (발생률)
평균	(a+b)/2	1/λ
분산	(b−a)²/12	1/λ²
무기억성	없음	있음
관련 분포	무정보 사전분포	포아송 분포

📌 핵심 정리

균일 분포: [a,b] 구간 내 모든 값이 동일한 확률 → PDF = 1/(b−a)
균일 분포 구간 확률: P(c≤X≤d) = (d−c)/(b−a) — 길이 비율
균일 분포 평균 = (a+b)/2 | 분산 = (b−a)²/12
지수 분포: 다음 사건까지의 대기 시간 → PDF = λe^−λx (x ≥ 0)
지수 분포 CDF: F(x) = 1 − e^−λx
지수 분포 평균 = 1/λ | 분산 = 1/λ² | 표준편차 = 평균
무기억성: P(X>s+t | X>s) = P(X>t) — 연속형 중 유일
포아송↔지수: 같은 λ 공유. 포아송(횟수) ↔ 지수(사건 간 시간)

728x90

'수학&통계학' 카테고리의 다른 글

연속형 확률분포 : t분포, 카이제곱 분포, F분포 (0)	2026.05.11
연속형 확률분포 : 정규분포 (0)	2026.05.11
이산확률분포 : 포아송 분포 (0)	2026.05.11
이산확률분포 : 베르누이 분포, 이항 분포 (0)	2026.05.11
통계 분석 : 확률과 확률분포 (0)	2026.05.10

구구 코스모스

연속형 확률분포 : 균일분포, 지수분포

① 균일 분포 (Uniform Distribution)

개념

확률 밀도 함수(PDF) 유도

구간 확률 계산

평균(기댓값)과 분산 유도

평균 E[X]

분산 Var(X)

공식 요약

② 지수 분포 (Exponential Distribution)

개념

확률 밀도 함수(PDF) 유도

CDF와 확률 계산

평균(기댓값)과 분산 유도

평균 E[X]

분산 Var(X)

공식 요약

무기억성 (Memoryless Property)

⑤ 포아송 분포와 지수 분포의 관계

⑥ 균일 분포 vs 지수 분포 비교

📌 핵심 정리

'수학&통계학' 카테고리의 다른 글

티스토리툴바

연속형 확률분포 : 균일분포, 지수분포

① 균일 분포 (Uniform Distribution)

개념

확률 밀도 함수(PDF) 유도

구간 확률 계산

평균(기댓값)과 분산 유도

평균 E[X]

분산 Var(X)

공식 요약

② 지수 분포 (Exponential Distribution)

개념

확률 밀도 함수(PDF) 유도

CDF와 확률 계산

평균(기댓값)과 분산 유도

평균 E[X]

분산 Var(X)

공식 요약

무기억성 (Memoryless Property)

⑤ 포아송 분포와 지수 분포의 관계

⑥ 균일 분포 vs 지수 분포 비교

📌 핵심 정리

'수학&통계학' 카테고리의 다른 글

관련글

티스토리툴바