“데이터 분포를 안다는 건, 숫자의 성격을 이해하는 것!”
숫자들이란 참 신기합니다. 각각은 조용히 자리를 지키고 있는 것 같지만, 함께 모이면 이야기가 생깁니다.
통계학에서는 이 ‘이야기’를 데이터의 분포(Distribution) 라고 부릅니다.

오늘은 데이터를 그냥 보지 않고 어떻게 흩어져 있는지, 어떻게 생겼는지까지 들여다보는 날이에요.
우리가 배울 것은 바로 이 세 가지!
- 정규분포 (Normal Distribution)
- 왜도 (Skewness)
- 첨도 (Kurtosis)
자, 이제 데이터의 얼굴을 함께 그려볼까요?
정규분포란? – “세상의 중심, 종 모양 곡선”
✔ 정의부터!
정규분포는 우리가 가장 많이 만나게 되는 분포예요.
그래프 모양이 종(bell)처럼 생겼다고 해서 벨 커브(bell curve) 라고도 불리죠.
✔ 특징
- 평균을 중심으로 좌우 대칭
- 중앙에 데이터가 가장 몰려 있음
- 극단값은 양쪽 꼬리에 있음
✔ 예시
- 시험 점수
- 키와 몸무게
- IQ 점수
이런 데이터는 대부분 사람들이 비슷한 값을 갖고, 극소수만 아주 크거나 작아요. 바로 이게 정규분포예요!
비유로 이해하기
정규분포는 운동회에서 100명의 평균 달리기 기록을 쟀을 때 나오는 모습 같아요.
거의 대부분이 평균 근처에서 비슷하게 달리고, 몇 명만 엄청 빠르거나 느려요.
왜도(Skewness) – “데이터의 치우침을 보여줘요”

✔ 정의
왜도는 데이터가 어느 한쪽으로 치우쳐 있는가를 보여주는 값이에요.
- 왜도 = 0 👉 완벽한 정규분포 (좌우 대칭)
- 양(+)의 왜도 👉 오른쪽으로 꼬리가 길다 (작은 값 많고, 큰 값 몇 개)
- 음(-)의 왜도 👉 왼쪽으로 꼬리가 길다 (큰 값 많고, 작은 값 몇 개)
예를 들어 회사에서 임원 연봉 데이터를 보면 대부분은 일반 직원 수준인데, 몇 명의 임원이 너무 많이 받아요. 이때 연봉 데이터는 오른쪽으로 꼬리가 긴 양의 왜도를 보입니다.
첨도(Kurtosis) – “데이터의 뾰족함을 보여줘요”

✔ 정의
첨도는 데이터가 얼마나 중앙에 몰려 있는가, 또는 꼬리가 두꺼운가 얇은가를 나타내요.
- 표준 정규분포의 첨도 = 0
- 첨도 > 0 (뾰족한 분포)
→ 대부분 데이터가 중앙에 몰려 있고, 꼬리는 길어요.
(예: 대부분 학생이 비슷한 점수를 받았고, 소수만 낮거나 높음) - 첨도 < 0 (평평한 분포)
→ 전체적으로 골고루 퍼진 분포예요.
(예: 만족도 설문에서 모든 선택지가 고르게 나왔을 때)
케이크 위에 생크림을 동그랗게 쌓았다고 상상해보세요. 뾰족하게 높이 쌓으면 첨도가 높고 납작하게 퍼지면 첨도가 낮아요!
📚 요약 정리 테이블
개념 | 뜻 | 쉽게 말하면 | 예시 |
정규분포 | 평균 중심 종 모양 | 대부분이 비슷한 값, 극단값은 소수 | 시험점수, 키, IQ |
왜도 | 좌우 치우침 | 데이터가 한쪽으로 몰렸는가? | 연봉, 부동산 가격 |
첨도 | 뾰족함 | 데이터가 가운데 몰렸는가? | 평균 몰림 시험, 전반적으로 퍼진 점수 |

실습! 내가 만든 데이터로 분포를 알아보자
- 내 하루 공부 시간을 7일간 기록해 보세요.
- 평균을 구하고, 가장 높은 날과 가장 낮은 날 비교해 보세요.
- 오른쪽으로 치우쳤나요? 왼쪽인가요?
- 대부분 비슷하게 공부했나요? 아니면 들쭉날쭉했나요?
이런 과정이 바로 데이터 분포를 해석하는 연습입니다!
왜 데이터 분포를 알아야 할까?
📍 이유 1: 평균만으로는 진짜 모습을 알 수 없어요
→ 평균이 같아도 왜도와 첨도에 따라 전혀 다른 분포일 수 있어요.
📍 이유 2: 통계 분석 기법을 올바르게 선택해야 해요
→ 정규분포를 가정하는 검정은 정규성을 만족해야 합니다!
📍 이유 3: 데이터의 신뢰성, 특이점, 대표성을 판단할 수 있어요.

🔁 오늘의 복습 과제
- 뉴스 기사나 통계 리포트를 보며 정규분포인지, 치우침이 있는지 찾아보세요.
- 직접 데이터를 모아서, 그래프로 그려보고 정규성 확인해보기!
- Excel, Jamovi, SPSS에서 히스토그램 또는 정규성 검정을 해보면 금상첨화!
'논문 연구 > 논문 통계' 카테고리의 다른 글
Day 6: 가설 수립 – 귀무가설과 대립가설을 마스터하자! (2) | 2025.08.02 |
---|---|
Day 5: 통계 연구, 어디서부터 시작할까? – 연구 문제 정의와 변수 설정 (1) | 2025.08.02 |
Day 3 : 평균부터 표준편차까지! 데이터의 얼굴을 읽는 통계 지표 (2) | 2025.07.31 |
Day 2: 변수의 세계로 첫 발! - 명목형, 서열형, 구간형, 비율형 변수 완전정복 (0) | 2025.07.31 |
Day 1: 통계란 무엇인가요? – 진짜 쉽게 알려드릴게요! (6) | 2025.07.31 |