728x90
통계를 배우다 보면 어디서나 정규분포가 등장한다.
가설 검정, 신뢰구간, 회귀분석, 머신러닝의 가정들 — 모두 정규분포를 기반으로 한다.
이번 글은 정규분포의 모든 것을 담는다.
PDF가 왜 그 모양인지, 표준화가 무엇인지, 그리고 왜 정규분포가 통계의 중심이 될 수 있는지까지 하나씩 짚어본다.
가설 검정, 신뢰구간, 회귀분석, 머신러닝의 가정들 — 모두 정규분포를 기반으로 한다.
이번 글은 정규분포의 모든 것을 담는다.
PDF가 왜 그 모양인지, 표준화가 무엇인지, 그리고 왜 정규분포가 통계의 중심이 될 수 있는지까지 하나씩 짚어본다.
① 정규분포란? — 개념과 직관
한 줄 정의
평균 μ를 중심으로 좌우 대칭인 종(bell) 모양의 연속형 확률분포다. 자연계와 사회현상에서 가장 흔하게 나타나는 분포이며, 통계적 추론의 대부분이 정규분포를 기반으로 설계되어 있다.
왜 정규분포가 이렇게 자주 나타날까?
이는 단순한 우연이 아니라 수학적으로 증명된 현상이다. 서로 독립적인 수많은 확률변수들의 합(또는 평균)은, 각 변수의 분포와 무관하게, 표본 수가 충분히 크면 정규분포에 가까워진다. 이것이 바로 뒤에서 다룰 중심극한정리(CLT)다.
- 사람의 키 → 수백 가지 유전자·환경 요인의 합 → 정규분포
- 측정 오차 → 수많은 독립적 오차 요인의 합 → 정규분포
- 제품 무게 → 생산 과정의 무수한 미세 변동의 합 → 정규분포
② 확률 밀도 함수(PDF)
f(x) = (1 / σ√(2π)) · exp(−(x−μ)² / 2σ²)
−∞ < x < ∞
μ: 위치 모수 (평균, 분포의 중심) | σ: 척도 모수 (표준편차, 분포의 넓이)
π ≈ 3.14159… | e ≈ 2.71828…
μ: 위치 모수 (평균, 분포의 중심) | σ: 척도 모수 (표준편차, 분포의 넓이)
π ≈ 3.14159… | e ≈ 2.71828…
공식의 각 부분 해석
e의 지수부: −(x−μ)²/2σ²
(x−μ)² : x가 평균 μ에서 멀어질수록 값이 커진다 → 지수가 더 음수가 됨 → f(x)가 급격히 작아짐
→ 평균에서 가까울수록 확률이 높고, 멀어질수록 빠르게 감소하는 구조 2σ² : 분모에 σ²이 있어서 σ가 클수록 지수 감소가 완만 → 분포가 넓고 평평해짐
→ σ가 크면 퍼진 분포, 작으면 뾰족한 분포 앞 계수: 1/σ√(2π)
전체 면적 = 1이 되도록 맞춰주는 정규화 상수
→ ∫f(x)dx = 1 조건 충족. σ가 커지면 분포가 넓어지므로 높이(계수)는 낮아진다. 결론 μ는 분포의 "위치", σ는 분포의 "모양(넓이)"을 결정한다.
(x−μ)² : x가 평균 μ에서 멀어질수록 값이 커진다 → 지수가 더 음수가 됨 → f(x)가 급격히 작아짐
→ 평균에서 가까울수록 확률이 높고, 멀어질수록 빠르게 감소하는 구조 2σ² : 분모에 σ²이 있어서 σ가 클수록 지수 감소가 완만 → 분포가 넓고 평평해짐
→ σ가 크면 퍼진 분포, 작으면 뾰족한 분포 앞 계수: 1/σ√(2π)
전체 면적 = 1이 되도록 맞춰주는 정규화 상수
→ ∫f(x)dx = 1 조건 충족. σ가 커지면 분포가 넓어지므로 높이(계수)는 낮아진다. 결론 μ는 분포의 "위치", σ는 분포의 "모양(넓이)"을 결정한다.
μ와 σ 변화에 따른 분포 모양

정규분포의 기본 성질
- 좌우 대칭: μ를 기준으로 완벽한 좌우 대칭 → 평균 = 중앙값 = 최빈값
- 단봉(Unimodal): 꼭짓점(최고점)이 x = μ 위치에 딱 하나
- 점근적: 양쪽 꼬리가 x축에 무한히 가까워지지만 닿지 않는다 (−∞ ~ ∞)
- 면적 = 1: 전체 구간 적분값은 1 (확률의 합)
- 변곡점: x = μ ± σ 위치에 변곡점이 존재 (곡선이 볼록에서 오목으로 바뀌는 지점)
💡 변곡점이 σ 위치인 이유
f''(x) = 0을 풀면 x = μ ± σ가 나온다. 이 지점에서 곡선의 굽는 방향이 바뀐다.
실제로 정규분포 그래프를 그려보면 μ±σ 위치에서 "S자로 꺾이는" 느낌을 받을 수 있는데, 그게 바로 변곡점이다.
이 사실 덕분에 그래프를 보고 σ의 대략적인 위치를 눈대중으로 파악할 수 있다.
f''(x) = 0을 풀면 x = μ ± σ가 나온다. 이 지점에서 곡선의 굽는 방향이 바뀐다.
실제로 정규분포 그래프를 그려보면 μ±σ 위치에서 "S자로 꺾이는" 느낌을 받을 수 있는데, 그게 바로 변곡점이다.
이 사실 덕분에 그래프를 보고 σ의 대략적인 위치를 눈대중으로 파악할 수 있다.
평균과 분산
평균 E[X] = ∫−∞∞ x · f(x) dx = μ → 대칭성에 의해 평균이 μ임을 직관적으로 알 수 있다. (적분 유도는 치환 t=(x−μ)/σ 후 가우스 적분 활용) 분산 Var(X) = E[(X−μ)²] = ∫−∞∞ (x−μ)² · f(x) dx = σ² → 부분적분 후 가우스 적분 ∫t²e^{-t²/2}dt = √(2π) 활용하면 σ²이 도출된다.
평균
E[X] = μ
위치 모수 그 자체
분산
Var(X) = σ²
척도 모수의 제곱
표기
X ~ N(μ, σ²)
정규분포 표기법
③ 68-95-99.7 규칙 (경험적 규칙)
정규분포의 가장 유명한 성질 중 하나다. 평균에서 표준편차 1·2·3배 범위 안에 데이터가 얼마나 들어오는지를 알려준다.

| 구간 | 확률 (정확값) | 근사값 | 바깥 비율 | 양쪽 꼬리 각각 |
|---|---|---|---|---|
| μ ± 1σ | 0.6827 | 약 68.3% | 31.7% | 15.85% |
| μ ± 2σ | 0.9545 | 약 95.4% | 4.6% | 2.28% |
| μ ± 3σ | 0.9973 | 약 99.7% | 0.27% | 0.135% |
💡 이 수치가 왜 중요한가?
• 품질관리의 "6시그마(6σ)" → μ±6σ 안에 들어오면 불량률 0.00034% 이하
• 이상값(Outlier) 탐지 → 통상 μ±2σ 또는 μ±3σ 벗어나면 이상값 의심
• 통계 검정의 유의수준 → 5%는 μ±2σ의 바깥 4.6%에서 비롯된 관습
• 품질관리의 "6시그마(6σ)" → μ±6σ 안에 들어오면 불량률 0.00034% 이하
• 이상값(Outlier) 탐지 → 통상 μ±2σ 또는 μ±3σ 벗어나면 이상값 의심
• 통계 검정의 유의수준 → 5%는 μ±2σ의 바깥 4.6%에서 비롯된 관습
📌 정확한 계산은 표준정규분포 Z표 활용
위 수치는 P(μ−kσ ≤ X ≤ μ+kσ)를 적분한 결과다. 정규분포의 PDF는 닫힌 형태의 부정적분이 존재하지 않아 수치 적분표(Z표)를 사용한다.
위 수치는 P(μ−kσ ≤ X ≤ μ+kσ)를 적분한 결과다. 정규분포의 PDF는 닫힌 형태의 부정적분이 존재하지 않아 수치 적분표(Z표)를 사용한다.
반응형
④ 표준 정규 분포 (Standard Normal Distribution, Z 분포)
정의
μ = 0, σ = 1인 특수한 정규분포다. X ~ N(0, 1)로 표기하며, 확률변수를 보통 Z로 표기한다.
f(z) = (1 / √(2π)) · e−z²/2 , −∞ < z < ∞
μ=0이므로 (x−μ) 항이 사라지고, σ=1이므로 분모의 σ와 σ² 도 사라진다.
왜 표준정규분포가 필요한가?
μ와 σ가 제각각인 수많은 정규분포 각각에 대한 확률표를 만들면 무한히 많은 표가 필요하다. 하지만 어떤 정규분포든 표준화 과정을 거치면 모두 동일한 표준정규분포로 변환된다. 따라서 Z표 하나만으로 모든 정규분포의 확률을 계산할 수 있다.
원래 확률변수
X ~ N(μ, σ²)
→
표준화 변환 공식
Z = (X − μ) / σ
→
표준 정규분포
Z ~ N(0, 1)
표준화(Z-score)의 의미
Z = (X − μ) / σ
→ "X가 평균에서 표준편차의 몇 배만큼 떨어져 있는가"를 나타내는 값 예시 시험 평균 70점, 표준편차 10점. 내 점수 85점.
Z = (85 − 70) / 10 = +1.5
→ 나는 평균보다 1.5 표준편차 위에 있다 (상위 약 6.7%) 증명: Z의 평균과 분산
E[Z] = E[(X−μ)/σ] = (E[X] − μ)/σ = (μ−μ)/σ = 0
Var(Z) = Var((X−μ)/σ) = Var(X)/σ² = σ²/σ² = 1 → 어떤 정규분포든 표준화하면 평균 0, 분산 1이 된다.
→ "X가 평균에서 표준편차의 몇 배만큼 떨어져 있는가"를 나타내는 값 예시 시험 평균 70점, 표준편차 10점. 내 점수 85점.
Z = (85 − 70) / 10 = +1.5
→ 나는 평균보다 1.5 표준편차 위에 있다 (상위 약 6.7%) 증명: Z의 평균과 분산
E[Z] = E[(X−μ)/σ] = (E[X] − μ)/σ = (μ−μ)/σ = 0
Var(Z) = Var((X−μ)/σ) = Var(X)/σ² = σ²/σ² = 1 → 어떤 정규분포든 표준화하면 평균 0, 분산 1이 된다.
Z표(표준정규분포표) 읽는 법
📌 Z표란?
P(Z ≤ z) = Φ(z) 값을 z에 대해 미리 계산해 놓은 표다. Z표의 행은 z의 소수점 첫째 자리, 열은 소수점 둘째 자리를 나타낸다.
예시 P(Z ≤ 1.96) 구하기
Z표에서 행 "1.9", 열 "0.06" → 0.9750
→ P(Z ≤ 1.96) ≈ 97.5%
응용 1 P(Z ≥ 1.96) = 1 − 0.9750 = 0.0250 (2.5%)
→ 오른쪽 꼬리 확률 응용 2 P(−1.96 ≤ Z ≤ 1.96) = 0.9750 − 0.0250 = 0.9500 (95%)
→ 대칭성 활용. 이것이 "95% 신뢰구간"의 기반이 된다. 응용 3 P(Z ≤ −z) = 1 − P(Z ≤ z) = 1 − Φ(z)
→ 대칭성: 왼쪽 꼬리 = 1에서 오른쪽 대응값 빼기
Z표에서 행 "1.9", 열 "0.06" → 0.9750
→ P(Z ≤ 1.96) ≈ 97.5%
응용 1 P(Z ≥ 1.96) = 1 − 0.9750 = 0.0250 (2.5%)
→ 오른쪽 꼬리 확률 응용 2 P(−1.96 ≤ Z ≤ 1.96) = 0.9750 − 0.0250 = 0.9500 (95%)
→ 대칭성 활용. 이것이 "95% 신뢰구간"의 기반이 된다. 응용 3 P(Z ≤ −z) = 1 − P(Z ≤ z) = 1 − Φ(z)
→ 대칭성: 왼쪽 꼬리 = 1에서 오른쪽 대응값 빼기
자주 쓰이는 Z 임계값
| 신뢰수준 | 유의수준 α | 양측 기각역 Z값 | 단측 기각역 Z값 |
|---|---|---|---|
| 90% | 0.10 | ±1.645 | 1.282 |
| 95% | 0.05 | ±1.960 | 1.645 |
| 99% | 0.01 | ±2.576 | 2.326 |
| 99.9% | 0.001 | ±3.291 | 3.090 |
💡 Z = ±1.96이 왜 95%인가?
P(−1.96 ≤ Z ≤ 1.96) = Φ(1.96) − Φ(−1.96) = 0.9750 − 0.0250 = 0.9500
→ 95% 신뢰구간, 양측 5% 유의수준 검정에서 핵심 임계값
이 수치는 통계 검정 어디서나 등장하므로 반드시 기억해두는 것이 좋다.
P(−1.96 ≤ Z ≤ 1.96) = Φ(1.96) − Φ(−1.96) = 0.9750 − 0.0250 = 0.9500
→ 95% 신뢰구간, 양측 5% 유의수준 검정에서 핵심 임계값
이 수치는 통계 검정 어디서나 등장하므로 반드시 기억해두는 것이 좋다.
⑤ 정규분포 확률 계산 과정
일반 정규분포 → 표준정규분포 변환 후 Z표 활용
문제 X ~ N(50, 100) (μ=50, σ²=100, σ=10)일 때 P(40 ≤ X ≤ 65) 구하기
STEP 1 표준화
x=40: Z = (40−50)/10 = −1.0
x=65: Z = (65−50)/10 = +1.5
STEP 2 확률 변환
P(40 ≤ X ≤ 65) = P(−1.0 ≤ Z ≤ 1.5)
= Φ(1.5) − Φ(−1.0)
= 0.9332 − (1 − 0.8413)
= 0.9332 − 0.1587
= 0.7745 (약 77.45%)
STEP 1 표준화
x=40: Z = (40−50)/10 = −1.0
x=65: Z = (65−50)/10 = +1.5
STEP 2 확률 변환
P(40 ≤ X ≤ 65) = P(−1.0 ≤ Z ≤ 1.5)
= Φ(1.5) − Φ(−1.0)
= 0.9332 − (1 − 0.8413)
= 0.9332 − 0.1587
= 0.7745 (약 77.45%)
⚠️ 자주 하는 실수: P(Z ≤ −z) 계산
Z표는 보통 P(Z ≤ z)만 제공한다. 음수 z의 경우:
P(Z ≤ −z) = P(Z ≥ z) = 1 − Φ(z) (대칭성 활용)
예) Φ(−1.0) = 1 − Φ(1.0) = 1 − 0.8413 = 0.1587
Z표는 보통 P(Z ≤ z)만 제공한다. 음수 z의 경우:
P(Z ≤ −z) = P(Z ≥ z) = 1 − Φ(z) (대칭성 활용)
예) Φ(−1.0) = 1 − Φ(1.0) = 1 − 0.8413 = 0.1587
⑥ 정규분포의 가법성 (재생성)
정규분포의 매우 유용한 성질이다. 서로 독립인 정규분포 확률변수들의 선형 결합도 정규분포를 따른다.
X ~ N(μ₁, σ₁²), Y ~ N(μ₂, σ₂²) 이고 X, Y 독립이면:
합 X + Y ~ N(μ₁+μ₂, σ₁²+σ₂²)
차 X − Y ~ N(μ₁−μ₂, σ₁²+σ₂²) → 차이의 분산도 더해진다! (독립이므로 공분산=0) 상수배 aX + b ~ N(aμ₁+b, a²σ₁²) → 표준화 Z=(X−μ)/σ도 이 성질의 특수 케이스: a=1/σ, b=−μ/σ 일반화 Σaᵢ Xᵢ ~ N(Σaᵢμᵢ, Σaᵢ²σᵢ²) (독립인 경우)
합 X + Y ~ N(μ₁+μ₂, σ₁²+σ₂²)
차 X − Y ~ N(μ₁−μ₂, σ₁²+σ₂²) → 차이의 분산도 더해진다! (독립이므로 공분산=0) 상수배 aX + b ~ N(aμ₁+b, a²σ₁²) → 표준화 Z=(X−μ)/σ도 이 성질의 특수 케이스: a=1/σ, b=−μ/σ 일반화 Σaᵢ Xᵢ ~ N(Σaᵢμᵢ, Σaᵢ²σᵢ²) (독립인 경우)
📌 가법성이 중요한 이유
여러 정규 확률변수를 조합해도 여전히 정규분포가 유지되므로, 복잡한 통계 분석에서도 정규분포 체계를 그대로 활용할 수 있다.
예) n개 표본의 합 → 정규 / 평균 → 정규 / 두 집단의 차이 → 정규
여러 정규 확률변수를 조합해도 여전히 정규분포가 유지되므로, 복잡한 통계 분석에서도 정규분포 체계를 그대로 활용할 수 있다.
예) n개 표본의 합 → 정규 / 평균 → 정규 / 두 집단의 차이 → 정규
⑦ 중심극한정리 (Central Limit Theorem, CLT)
정규분포가 통계의 중심이 되는 근본적인 이유가 바로 중심극한정리다.
중심극한정리 (Central Limit Theorem)
X₁, X₂, …, Xₙ이 평균 μ, 분산 σ² 인 분포에서 i.i.d. 추출될 때
X̄ = (X₁+X₂+…+Xₙ)/n → N(μ, σ²/n) (n → ∞)
원래 분포의 모양이 무엇이든 관계없이
표본 크기 n이 충분히 크면 표본 평균 X̄의 분포는 정규분포에 가까워진다.
표본 크기 n이 충분히 크면 표본 평균 X̄의 분포는 정규분포에 가까워진다.
표준화한 표본평균
Z = (X̄ − μ) / (σ / √n) → N(0, 1)
σ/√n: 표준오차(Standard Error) — 표본 평균의 표준편차
n이 커질수록 표준오차가 작아진다 → 표본 평균이 모평균에 더 가까워진다
n이 커질수록 표준오차가 작아진다 → 표본 평균이 모평균에 더 가까워진다
언제부터 "충분히 크다"고 볼 수 있나?
- 원래 분포가 대칭적이면 n ≥ 30 정도면 충분
- 심하게 비대칭(왜도가 큰 분포)이면 n ≥ 100 이상이 필요할 수 있다
- 원래 분포가 정규분포라면 n에 상관없이 항상 정확히 정규분포
💡 CLT가 통계의 핵심인 이유
현실에서 모집단이 어떤 분포를 따르는지 모르는 경우가 대부분이다.
그런데 CLT 덕분에 표본만 충분히 크면 "분포를 몰라도" 정규분포 기반의 추론을 적용할 수 있다.
→ 신뢰구간, 가설 검정, 회귀분석 등 대부분의 통계 기법이 이 원리 위에 세워져 있다.
현실에서 모집단이 어떤 분포를 따르는지 모르는 경우가 대부분이다.
그런데 CLT 덕분에 표본만 충분히 크면 "분포를 몰라도" 정규분포 기반의 추론을 적용할 수 있다.
→ 신뢰구간, 가설 검정, 회귀분석 등 대부분의 통계 기법이 이 원리 위에 세워져 있다.
⑧ 정규 분포 vs 표준 정규 분포 비교
| 구분 | 정규 분포 | 표준 정규 분포 |
|---|---|---|
| 표기 | X ~ N(μ, σ²) | Z ~ N(0, 1) |
| 평균 | μ (임의의 실수) | 0 |
| 분산 | σ² (양수) | 1 |
| (1/σ√2π) e^{−(x−μ)²/2σ²} | (1/√2π) e^{−z²/2} | |
| 관계 | Z = (X − μ) / σ 로 변환 | |
| 확률 계산 | 직접 계산 어려움 | Z표(표준정규분포표) 활용 |
| 변곡점 | x = μ ± σ | z = ±1 |
| 용도 | 모델링, 분포 표현 | 확률 계산, 가설 검정 |
📌 핵심 정리
- 정규분포: X ~ N(μ, σ²), PDF = (1/σ√2π)e^{−(x−μ)²/2σ²}
- 평균 = μ, 분산 = σ² | 평균 = 중앙값 = 최빈값 (완전 대칭)
- 변곡점: x = μ ± σ 위치
- 68-95-99.7 규칙: μ±1σ(68.3%), μ±2σ(95.4%), μ±3σ(99.7%)
- 표준정규분포: Z ~ N(0,1), Z표로 모든 정규분포 확률 계산 가능
- 표준화: Z = (X−μ)/σ → "평균에서 σ 몇 배 떨어졌는가"
- 주요 임계값: Z=1.645(90%), Z=1.960(95%), Z=2.576(99%)
- 가법성: 독립 정규변수의 선형 결합 → 정규분포 유지
- 중심극한정리(CLT): 어떤 분포든 n이 크면 표본평균 → 정규분포
- 표준오차: σ/√n — n이 클수록 표본평균이 모평균에 집중
728x90
'수학&통계학' 카테고리의 다른 글
| 기술 통계량 (중심 측도) (0) | 2026.05.11 |
|---|---|
| 연속형 확률분포 : t분포, 카이제곱 분포, F분포 (0) | 2026.05.11 |
| 연속형 확률분포 : 균일분포, 지수분포 (0) | 2026.05.11 |
| 이산확률분포 : 포아송 분포 (0) | 2026.05.11 |
| 이산확률분포 : 베르누이 분포, 이항 분포 (0) | 2026.05.11 |