; ; Day 3 : 평균부터 표준편차까지! 데이터의 얼굴을 읽는 통계 지표
 

Day 3 : 평균부터 표준편차까지! 데이터의 얼굴을 읽는 통계 지표

🪄 "숫자가 많아 보여도, 사실은 단 하나의 얼굴이에요"

여러분은 이런 문장을 들어본 적 있나요?

"이번 시험 평균은 72점이야."
"우리 반 키의 중앙값은 160cm래."
"그 제품의 만족도 편차가 크대."

 

이 모든 말은 통계 지표를 활용한 표현이에요.
수많은 숫자들을 한눈에 요약하고, 비교하고, 의미를 찾게 해주는 마법의 도구랍니다.

 

자, 그럼 오늘 배울 4가지 통계 지표부터 살펴볼까요?

1. 평균 (Mean) – "전체의 중심을 말해줘요"

✔ 정의:

모든 값을 더한 후, 그 값을 데이터 개수로 나눈 값
가장 많이 쓰이고, 우리에게 가장 익숙한 통계 지표예요.

✔ 예시:

시험 점수: 70점, 80점, 90점 → (70+80+90)/3 = 80점

✔ 언제 유용할까?

• 대체로 값들이 고르게 분포되어 있을 때
• 중심값을 대표로 쓸 수 있을 때

✔ 주의할 점:

극단적인 값(예: 10, 100 같은 이상치)이 포함되면 평균이 왜곡될 수 있어요!

 

2. 중앙값 (Median) – "가운데 있는 값이에요"

✔ 정의:

값들을 순서대로 나열했을 때, 정 가운데 있는 값

홀수 개 → 가운데 값
짝수 개 → 가운데 두 개의 평균

✔ 예시:

55, 60, 65, 70, 100 → 중앙값은 65
55, 60, 65, 70 → (60+65)/2 = 62.5

✔ 언제 유용할까?

• 극단값이 있어서 평균이 왜곡될 때
• 실제 '중간 사람'이 궁금할 때 (예: 소득의 중간값)

✔ 특징:

평균보다 현실을 더 잘 반영하는 경우가 많아요! 특히 소득, 주택 가격, 시험 성적 분포 등에서 많이 쓰여요.

 

 

3. 범위 (Range) – "최고와 최저의 거리"

✔ 정의:

최댓값 - 최솟값

✔ 예시:

40, 55, 60, 65, 80 → 80 - 40 = 40

✔ 언제 유용할까?

• 데이터의 산포(흩어짐) 정도를 파악할 때
• 극단적인 변화 폭이 중요할 때

✔ 한계:

단 두 개의 값(최대, 최소)만 사용하기 때문에, 전체적인 분포는 알 수 없어요.

 

4. 표준편차 (Standard Deviation) – "흩어짐의 대표선수"

✔ 정의

각 데이터가 평균에서 얼마나 떨어져 있는지를 나타내는 값
→ 쉽게 말해, **"데이터들이 평균에서 얼마나 퍼져 있는가?"**를 알려줘요.

✔ 계산 개념 (쉽게 설명하면)

  1. 각 값에서 평균을 뺀다 (편차)
  2. 그 편차를 제곱한다
  3. 모두 더한다
  4. 데이터 개수로 나누고
  5. 다시 루트를 씌운다! 🌱

✔ 예시

평균이 70인 점수에서, 어떤 사람은 60, 또 다른 사람은 80이라면
→ 둘 다 평균에서 10만큼 떨어짐 → 표준편차는 10 정도로 나와요.

✔ 해석 팁:

• 표준편차가 작다 → 데이터가 평균에 몰려 있음 (균일)
• 표준편차가 크다 → 데이터가 여기저기 퍼져 있음 (다양)

 

 

요약: 한 문장으로 정리하기!

통계 지표 무슨 뜻인가요? 언제 사용하나요?
평균 전체의 중심값 일반적인 대표값, 고르게 분포된 경우
중앙값 가운데 있는 값 이상치가 있는 경우
범위 최고-최저 간 차이 데이터 폭 파악
표준편차 퍼져 있는 정도 흩어짐을 정량적으로 파악할 때

 

실전 연습 – 어떤 지표를 써야 할까?

Q1. 우리 반 학생들의 키가 궁금해요. 누가 가장 평균적인 키일까요?
 평균

Q2. 서울시 아파트의 가격이 너무 들쭉날쭉해요. 진짜 중간 가격은?
 중앙값

Q3. 한 제품의 품질이 들쭉날쭉한지 알고 싶어요.
 표준편차

Q4. 연봉이 얼마나 차이나는지 궁금해요. 최고-최저 간 격차는?
 범위



📝 오늘의 실습 과제

  1. 여러분의 하루 생활 데이터를 수집해보세요!
  1. 각 지표를 계산해보세요.
    • 평균 공부 시간은?
    • 중앙값은 몇 시쯤 쉬었나요?
    • 하루 활동 시간 범위는?
    • 시간 사용의 표준편차는?

이렇게 직접 계산해보면, 지표가 진짜 내 삶을 보여주는 언어라는 걸 느끼게 될 거예요!

📚 다음 시간 예고: 데이터 분포의 얼굴을 그려보자!

다음은 Day 4: 정규분포, 왜도, 첨도에 대해 배워볼 거예요.
숫자들이 어떤 모습으로 퍼져 있는지, 그래프와 함께 알아볼 거예요 📈