728x90
연속형 확률분포 중 균일 분포와 지수 분포를 정리한다.
두 분포 모두 "연속형"이라는 공통점이 있지만 쓰임새와 모양이 전혀 다르다.
균일 분포는 모든 구간이 똑같이 평평하고, 지수 분포는 처음에 높다가 급격히 감소하는 모양이다.
각 분포의 PDF, 평균, 분산이 어떻게 유도되는지 단계별로 살펴본다.
두 분포 모두 "연속형"이라는 공통점이 있지만 쓰임새와 모양이 전혀 다르다.
균일 분포는 모든 구간이 똑같이 평평하고, 지수 분포는 처음에 높다가 급격히 감소하는 모양이다.
각 분포의 PDF, 평균, 분산이 어떻게 유도되는지 단계별로 살펴본다.
① 균일 분포 (Uniform Distribution)
개념
연속형 확률변수 X가 구간 [a, b] 안의 모든 값에 대해 동일한 확률을 가지는 분포다. 어떤 구간이든 길이가 같으면 확률도 같다.
❓ "모든 값에 동일한 확률"이면 특정 값의 확률은?
연속형이므로 특정 한 점의 확률은 항상 0이다. "동일한 확률"이란 같은 길이의 구간에 대한 확률이 항상 같다는 의미다.예) [2, 3] 구간의 확률 = [5, 6] 구간의 확률 (길이가 똑같이 1이므로)
확률 밀도 함수(PDF) 유도
전체 확률의 합(적분)은 반드시 1이어야 한다. [a, b] 구간 전체의 넓이가 1이 되려면 높이(밀도)는 얼마여야 할까?
조건 전체 확률 = 1
∫ab f(x) dx = 1
→ f(x)가 상수 c라면: c × (b − a) = 1 풀면 c = 1 / (b − a)
→ 구간의 길이 (b−a)의 역수가 밀도값이 된다. 결과 f(x) = 1/(b−a) (a ≤ x ≤ b), 0 (otherwise)
∫ab f(x) dx = 1
→ f(x)가 상수 c라면: c × (b − a) = 1 풀면 c = 1 / (b − a)
→ 구간의 길이 (b−a)의 역수가 밀도값이 된다. 결과 f(x) = 1/(b−a) (a ≤ x ≤ b), 0 (otherwise)
f(x) = 1 / (b − a) , a ≤ x ≤ b
a: 구간의 하한 | b: 구간의 상한
구간 밖(x < a 또는 x > b)에서는 f(x) = 0
구간 밖(x < a 또는 x > b)에서는 f(x) = 0
📌 균일 분포 PDF 형태 (a=2, b=6 예시)

구간 확률 계산
연속형이므로 특정 구간 [c, d]에 속할 확률은 PDF를 적분해 구한다. 균일 분포에서는 넓이 = 밑변 × 높이로 간단히 계산된다.
P(c ≤ X ≤ d) = ∫cd f(x) dx
= ∫cd 1/(b−a) dx
= (d − c) / (b − a) → 전체 구간 중 [c,d]가 차지하는 비율. 직사각형 넓이를 전체 넓이로 나눈 것.
= ∫cd 1/(b−a) dx
= (d − c) / (b − a) → 전체 구간 중 [c,d]가 차지하는 비율. 직사각형 넓이를 전체 넓이로 나눈 것.
P(c ≤ X ≤ d) = (d − c) / (b − a)
단, a ≤ c < d ≤ b
평균(기댓값)과 분산 유도
평균 E[X]
E[X] = ∫ab x · f(x) dx
= ∫ab x · 1/(b−a) dx
= 1/(b−a) · [x²/2]ab
= 1/(b−a) · (b²−a²)/2
= (b+a)(b−a) / (2(b−a))
= (a + b) / 2 → 구간의 중앙값. 직관적으로도 "가운데"가 평균이 되는 게 자연스럽다.
= ∫ab x · 1/(b−a) dx
= 1/(b−a) · [x²/2]ab
= 1/(b−a) · (b²−a²)/2
= (b+a)(b−a) / (2(b−a))
= (a + b) / 2 → 구간의 중앙값. 직관적으로도 "가운데"가 평균이 되는 게 자연스럽다.
분산 Var(X)
STEP 1 E[X²] 계산
E[X²] = ∫ab x² · 1/(b−a) dx
= 1/(b−a) · [x³/3]ab
= (b³ − a³) / (3(b−a))
= (a² + ab + b²) / 3 ← 인수분해: b³−a³ = (b−a)(b²+ab+a²)
STEP 2 분산 = E[X²] − (E[X])²
Var(X) = (a² + ab + b²)/3 − ((a+b)/2)²
= (a² + ab + b²)/3 − (a² + 2ab + b²)/4
= (4(a²+ab+b²) − 3(a²+2ab+b²)) / 12
= (a² − 2ab + b²) / 12
= (b − a)² / 12 → 구간의 길이(b−a)가 넓을수록 분산이 커진다. 구간이 좁을수록 값이 몰려 분산이 작아진다.
E[X²] = ∫ab x² · 1/(b−a) dx
= 1/(b−a) · [x³/3]ab
= (b³ − a³) / (3(b−a))
= (a² + ab + b²) / 3 ← 인수분해: b³−a³ = (b−a)(b²+ab+a²)
STEP 2 분산 = E[X²] − (E[X])²
Var(X) = (a² + ab + b²)/3 − ((a+b)/2)²
= (a² + ab + b²)/3 − (a² + 2ab + b²)/4
= (4(a²+ab+b²) − 3(a²+2ab+b²)) / 12
= (a² − 2ab + b²) / 12
= (b − a)² / 12 → 구간의 길이(b−a)가 넓을수록 분산이 커진다. 구간이 좁을수록 값이 몰려 분산이 작아진다.
공식 요약
확률 밀도 함수(PDF)
1 / (b − a)
구간 [a, b] 내 상수
평균
E[X] = (a+b)/2
구간의 중앙값
분산
Var(X) = (b−a)²/12
길이 제곱에 비례
💡 분산이 (b−a)²/12인 직관적 이해
분모 12는 적분 과정에서 자연스럽게 나오는 수지만, 핵심은 분자 (b−a)²다.
구간이 넓을수록(= b−a가 클수록) 값이 넓게 퍼지므로 분산도 커진다.
반대로 구간이 매우 좁아지면 (b→a) 분산 → 0. 값이 한 점에 집중되는 것과 같다.
분모 12는 적분 과정에서 자연스럽게 나오는 수지만, 핵심은 분자 (b−a)²다.
구간이 넓을수록(= b−a가 클수록) 값이 넓게 퍼지므로 분산도 커진다.
반대로 구간이 매우 좁아지면 (b→a) 분산 → 0. 값이 한 점에 집중되는 것과 같다.
⚠️ 균일 분포는 현실에서 드물다
완벽한 균일 분포는 자연 현상에서 거의 없다. 주로 다른 분포로의 변환 기저로 쓰이거나, 사전 지식이 전혀 없을 때 기본 가정(무정보 사전분포)으로 활용한다. 또한 시뮬레이션에서 난수를 생성할 때 U(0,1) 균일분포가 출발점이 된다.
완벽한 균일 분포는 자연 현상에서 거의 없다. 주로 다른 분포로의 변환 기저로 쓰이거나, 사전 지식이 전혀 없을 때 기본 가정(무정보 사전분포)으로 활용한다. 또한 시뮬레이션에서 난수를 생성할 때 U(0,1) 균일분포가 출발점이 된다.
반응형
② 지수 분포 (Exponential Distribution)
개념
어떤 사건이 다음에 발생하기까지 걸리는 시간(또는 간격)을 모델링하는 연속형 분포다. 포아송 분포가 "단위 시간에 몇 번 발생했는가"를 다룬다면, 지수 분포는 "다음 사건까지 얼마나 기다려야 하는가"를 다룬다.
❓ 포아송 분포와 지수 분포의 차이는?
두 분포는 같은 현상의 두 가지 관점이다.• 포아송: "1시간 동안 몇 건이 발생했는가?" → 이산형, 횟수
• 지수: "다음 사건이 발생할 때까지 몇 분이나 기다려야 하는가?" → 연속형, 시간 간격
확률 밀도 함수(PDF) 유도
λ를 단위 시간당 평균 발생 횟수(포아송의 λ와 동일)라 할 때, 다음 사건이 발생하기까지 걸리는 시간 X의 분포를 구해보자.
STEP 1 "X > x"일 확률, 즉 시간 x까지 사건이 0번 발생할 확률
포아송 분포에서 시간 x 동안 평균 발생 횟수 = λx
P(시간 x 동안 0번 발생) = e−λx · (λx)⁰ / 0! = e−λx → 즉, P(X > x) = e⁻λˣ (아직 사건이 안 일어났을 확률) STEP 2 누적 분포 함수(CDF) F(x) = P(X ≤ x)
F(x) = 1 − P(X > x) = 1 − e−λx → x까지 사건이 한 번이라도 발생했을 확률 STEP 3 CDF를 미분하면 PDF
f(x) = F'(x) = d/dx (1 − e−λx) = λe−λx (x ≥ 0) → x < 0은 시간이 음수이므로 f(x) = 0
포아송 분포에서 시간 x 동안 평균 발생 횟수 = λx
P(시간 x 동안 0번 발생) = e−λx · (λx)⁰ / 0! = e−λx → 즉, P(X > x) = e⁻λˣ (아직 사건이 안 일어났을 확률) STEP 2 누적 분포 함수(CDF) F(x) = P(X ≤ x)
F(x) = 1 − P(X > x) = 1 − e−λx → x까지 사건이 한 번이라도 발생했을 확률 STEP 3 CDF를 미분하면 PDF
f(x) = F'(x) = d/dx (1 − e−λx) = λe−λx (x ≥ 0) → x < 0은 시간이 음수이므로 f(x) = 0
f(x) = λe−λx , x ≥ 0
λ(람다): 단위 시간당 평균 발생 횟수 (포아송의 λ와 동일)
x: 다음 사건까지 걸리는 시간 (x ≥ 0)
x < 0에서는 f(x) = 0
x: 다음 사건까지 걸리는 시간 (x ≥ 0)
x < 0에서는 f(x) = 0

CDF와 확률 계산
누적 분포 함수(CDF): F(x) = P(X ≤ x) = 1 − e−λx (x ≥ 0)
P(X > x) = e−λx ← 무기억성의 핵심 수식
P(a ≤ X ≤ b) = F(b) − F(a) = e−λa − e−λb
P(X > x) = e−λx ← 무기억성의 핵심 수식
P(a ≤ X ≤ b) = F(b) − F(a) = e−λa − e−λb
평균(기댓값)과 분산 유도
평균 E[X]
E[X] = ∫0∞ x · λe−λx dx
→ 부분적분 활용: ∫u dv = uv − ∫v du (u=x, dv=λe⁻λˣdx) = [x·(−e−λx)]0∞ + ∫0∞ e−λx dx
= 0 + [−e−λx/λ]0∞
= 0 − (0 − 1/λ)
= 1 / λ → λ=2(시간당 2번 발생)이면 평균 대기 시간 = 1/2. 직관과 일치!
→ 부분적분 활용: ∫u dv = uv − ∫v du (u=x, dv=λe⁻λˣdx) = [x·(−e−λx)]0∞ + ∫0∞ e−λx dx
= 0 + [−e−λx/λ]0∞
= 0 − (0 − 1/λ)
= 1 / λ → λ=2(시간당 2번 발생)이면 평균 대기 시간 = 1/2. 직관과 일치!
분산 Var(X)
STEP 1 E[X²] 계산 (부분적분 두 번 적용)
E[X²] = ∫0∞ x² · λe−λx dx = 2/λ² → 부분적분을 반복 적용하면 E[Xⁿ] = n!/λⁿ 이라는 일반식이 나온다. STEP 2 분산 = E[X²] − (E[X])²
Var(X) = 2/λ² − (1/λ)²
= 2/λ² − 1/λ²
= 1 / λ²
E[X²] = ∫0∞ x² · λe−λx dx = 2/λ² → 부분적분을 반복 적용하면 E[Xⁿ] = n!/λⁿ 이라는 일반식이 나온다. STEP 2 분산 = E[X²] − (E[X])²
Var(X) = 2/λ² − (1/λ)²
= 2/λ² − 1/λ²
= 1 / λ²
공식 요약
확률 밀도 함수(PDF)
λe−λx
x ≥ 0
평균
E[X] = 1/λ
발생률의 역수
분산
Var(X) = 1/λ²
평균의 제곱
💡 E[X] = 1/λ의 직관
λ = 시간당 평균 발생 횟수 → 1/λ = 한 번 발생하는 데 걸리는 평균 시간
시간당 4번 발생하면(λ=4) → 평균 대기 시간 = 1/4시간 = 15분
분산 = (1/λ)² = 평균² → 표준편차 = 평균. 지수 분포는 항상 표준편차 = 평균이다.
λ = 시간당 평균 발생 횟수 → 1/λ = 한 번 발생하는 데 걸리는 평균 시간
시간당 4번 발생하면(λ=4) → 평균 대기 시간 = 1/4시간 = 15분
분산 = (1/λ)² = 평균² → 표준편차 = 평균. 지수 분포는 항상 표준편차 = 평균이다.
무기억성 (Memoryless Property)
지수 분포의 가장 독특한 성질이다. "지금까지 기다린 시간이 얼마든 상관없이, 앞으로 기다려야 하는 시간의 분포는 항상 동일하다."
수식으로 P(X > s + t | X > s) = P(X > t)
→ "이미 s만큼 기다렸을 때, 추가로 t만큼 더 기다릴 확률"이 처음부터 t만큼 기다릴 확률과 같다. 증명 P(X > s+t | X > s) = P(X > s+t) / P(X > s)
= e−λ(s+t) / e−λs
= e−λt
= P(X > t) ✓
→ "이미 s만큼 기다렸을 때, 추가로 t만큼 더 기다릴 확률"이 처음부터 t만큼 기다릴 확률과 같다. 증명 P(X > s+t | X > s) = P(X > s+t) / P(X > s)
= e−λ(s+t) / e−λs
= e−λt
= P(X > t) ✓
📌 무기억성의 핵심
이미 기다린 시간이 "소모"되지 않는다. 마치 매 순간 새로 시작하는 것처럼 동작한다.
연속형 분포 중 무기억성을 갖는 유일한 분포가 지수 분포다.
이산형 중에서는 기하 분포(Geometric Distribution)가 무기억성을 가진다.
이미 기다린 시간이 "소모"되지 않는다. 마치 매 순간 새로 시작하는 것처럼 동작한다.
연속형 분포 중 무기억성을 갖는 유일한 분포가 지수 분포다.
이산형 중에서는 기하 분포(Geometric Distribution)가 무기억성을 가진다.
⑤ 포아송 분포와 지수 분포의 관계
포아송 분포
단위 시간에
몇 번 발생?
몇 번 발생?
이산형 | 횟수
⇄
공통 모수
λ (람다)
단위 시간당
평균 발생 횟수
평균 발생 횟수
⇄
지수 분포
다음 사건까지
얼마나 걸려?
얼마나 걸려?
연속형 | 시간 간격
두 분포는 같은 λ를 공유하며 서로 쌍을 이룬다.
- 포아송 과정(Poisson Process)에서 사건 간 시간 간격은 지수 분포를 따른다
- 지수 분포의 평균 1/λ는 포아송 분포의 평균 λ와 역수 관계다
- 포아송의 무작위 독립 발생 가정 → 지수 분포의 무기억성으로 이어진다
⑥ 균일 분포 vs 지수 분포 비교
| 구분 | 균일 분포 | 지수 분포 |
|---|---|---|
| PDF 형태 | 평평한 직사각형 | 오른쪽으로 감소하는 곡선 |
| 1/(b−a) | λe−λx | |
| 정의 구간 | [a, b] (유한) | [0, ∞) (반무한) |
| 모수 | a, b (구간 하한·상한) | λ (발생률) |
| 평균 | (a+b)/2 | 1/λ |
| 분산 | (b−a)²/12 | 1/λ² |
| 무기억성 | 없음 | 있음 |
| 관련 분포 | 무정보 사전분포 | 포아송 분포 |
📌 핵심 정리
- 균일 분포: [a,b] 구간 내 모든 값이 동일한 확률 → PDF = 1/(b−a)
- 균일 분포 구간 확률: P(c≤X≤d) = (d−c)/(b−a) — 길이 비율
- 균일 분포 평균 = (a+b)/2 | 분산 = (b−a)²/12
- 지수 분포: 다음 사건까지의 대기 시간 → PDF = λe−λx (x ≥ 0)
- 지수 분포 CDF: F(x) = 1 − e−λx
- 지수 분포 평균 = 1/λ | 분산 = 1/λ² | 표준편차 = 평균
- 무기억성: P(X>s+t | X>s) = P(X>t) — 연속형 중 유일
- 포아송↔지수: 같은 λ 공유. 포아송(횟수) ↔ 지수(사건 간 시간)
728x90
'수학&통계학' 카테고리의 다른 글
| 연속형 확률분포 : t분포, 카이제곱 분포, F분포 (0) | 2026.05.11 |
|---|---|
| 연속형 확률분포 : 정규분포 (0) | 2026.05.11 |
| 이산확률분포 : 포아송 분포 (0) | 2026.05.11 |
| 이산확률분포 : 베르누이 분포, 이항 분포 (0) | 2026.05.11 |
| 통계 분석 : 확률과 확률분포 (0) | 2026.05.10 |