논문 연구/논문 통계

Day 4: 숫자들의 숨은 얼굴을 찾아라! - 정규분포, 왜도, 첨도

삶을 그리다 2025. 8. 2. 11:51
“데이터 분포를 안다는 건, 숫자의 성격을 이해하는 것!”

 

숫자들이란 참 신기합니다. 각각은 조용히 자리를 지키고 있는 것 같지만, 함께 모이면 이야기가 생깁니다.

통계학에서는 이 ‘이야기’를 데이터의 분포(Distribution) 라고 부릅니다.

데이터의 분포(Distribution)


오늘은 데이터를 그냥 보지 않고 어떻게 흩어져 있는지, 어떻게 생겼는지까지 들여다보는 날이에요.

 

우리가 배울 것은 바로 이 세 가지!

  • 정규분포 (Normal Distribution)
  • 왜도 (Skewness)
  • 첨도 (Kurtosis)

자, 이제 데이터의 얼굴을 함께 그려볼까요?

 

정규분포란? – “세상의 중심, 종 모양 곡선”

 정의부터!

정규분포는 우리가 가장 많이 만나게 되는 분포예요.
그래프 모양이 종(bell)처럼 생겼다고 해서 벨 커브(bell curve) 라고도 불리죠.

✔ 특징

  • 평균을 중심으로 좌우 대칭
  • 중앙에 데이터가 가장 몰려 있음
  • 극단값은 양쪽 꼬리에 있음

 예시

  • 시험 점수
  • 키와 몸무게
  • IQ 점수

이런 데이터는 대부분 사람들이 비슷한 값을 갖고, 극소수만 아주 크거나 작아요. 바로 이게 정규분포예요!

비유로 이해하기

정규분포는 운동회에서 100명의 평균 달리기 기록을 쟀을 때 나오는 모습 같아요.
거의 대부분이 평균 근처에서 비슷하게 달리고, 몇 명만 엄청 빠르거나 느려요.

 

왜도(Skewness) – “데이터의 치우침을 보여줘요”

왜도(Skewness)

 정의

왜도는 데이터가 어느 한쪽으로 치우쳐 있는가를 보여주는 값이에요.

  • 왜도 = 0 👉 완벽한 정규분포 (좌우 대칭)
  • 양(+)의 왜도 👉 오른쪽으로 꼬리가 길다 (작은 값 많고, 큰 값 몇 개)
  • 음(-)의 왜도 👉 왼쪽으로 꼬리가 길다 (큰 값 많고, 작은 값 몇 개)

예를 들어 회사에서 임원 연봉 데이터를 보면 대부분은 일반 직원 수준인데, 몇 명의 임원이 너무 많이 받아요. 이때 연봉 데이터는 오른쪽으로 꼬리가 긴 양의 왜도를 보입니다.

 

첨도(Kurtosis) – “데이터의 뾰족함을 보여줘요”

첨도(Kurtosis)

정의

첨도는 데이터가 얼마나 중앙에 몰려 있는가, 또는 꼬리가 두꺼운가 얇은가를 나타내요.

  • 표준 정규분포의 첨도 = 0
  • 첨도 > 0 (뾰족한 분포)
    → 대부분 데이터가 중앙에 몰려 있고, 꼬리는 길어요.
    (예: 대부분 학생이 비슷한 점수를 받았고, 소수만 낮거나 높음)
  • 첨도 < 0 (평평한 분포)
    → 전체적으로 골고루 퍼진 분포예요.
    (예: 만족도 설문에서 모든 선택지가 고르게 나왔을 때)

케이크 위에 생크림을 동그랗게 쌓았다고 상상해보세요. 뾰족하게 높이 쌓으면 첨도가 높고 납작하게 퍼지면 첨도가 낮아요!

 

📚 요약 정리 테이블

개념 쉽게 말하면 예시
정규분포 평균 중심 종 모양 대부분이 비슷한 값, 극단값은 소수 시험점수, 키, IQ
왜도 좌우 치우침 데이터가 한쪽으로 몰렸는가? 연봉, 부동산 가격
첨도 뾰족함 데이터가 가운데 몰렸는가? 평균 몰림 시험, 전반적으로 퍼진 점수
통계 데이터

 

실습! 내가 만든 데이터로 분포를 알아보자

  1. 내 하루 공부 시간을 7일간 기록해 보세요.
  2. 평균을 구하고, 가장 높은 날과 가장 낮은 날 비교해 보세요.
  3. 오른쪽으로 치우쳤나요? 왼쪽인가요?
  4. 대부분 비슷하게 공부했나요? 아니면 들쭉날쭉했나요?

이런 과정이 바로 데이터 분포를 해석하는 연습입니다!

 

왜 데이터 분포를 알아야 할까?

📍 이유 1: 평균만으로는 진짜 모습을 알 수 없어요
→ 평균이 같아도 왜도와 첨도에 따라 전혀 다른 분포일 수 있어요.

📍 이유 2: 통계 분석 기법을 올바르게 선택해야 해요
→ 정규분포를 가정하는 검정은 정규성을 만족해야 합니다!

📍 이유 3: 데이터의 신뢰성, 특이점, 대표성을 판단할 수 있어요.

데이터 분포

🔁 오늘의 복습 과제

  • 뉴스 기사나 통계 리포트를 보며 정규분포인지, 치우침이 있는지 찾아보세요.
  • 직접 데이터를 모아서, 그래프로 그려보고 정규성 확인해보기!
  • Excel, Jamovi, SPSS에서 히스토그램 또는 정규성 검정을 해보면 금상첨화!