728x90
; ;
"둘이 잘 어울리네요.""이 두 현상은 왠지 함께 움직이는 것 같아.""비가 오는 날, 커피 판매량이 늘어나는 것 같던데?" 이런 말들은 통계와는 아무런 관련이 없어 보이지만, 사실은 통계학의 매우 중요한 주제인 ‘상관관계’(correlation)를 본능적으로 느끼고 있는 것입니다.우리는 일상 속에서도 무의식적으로 "무엇과 무엇이 관련이 있을까?"라는 질문을 자주 던지고 있습니다.기온이 높을수록 냉방기기의 판매가 증가하고, 시험을 열심히 준비할수록 점수가 올라가며, 사회적 신뢰가 높을수록 국민의 행복도도 증가하는 현상들.이 모든 것이 숫자들 사이의 ‘관계’를 이해하고자 하는 욕구에서 출발합니다. 그런데, 이런 관계를 객관적으로, 수치로, 과학적으로 증명하려면 어떻게 해야 할까요?그 해답이 바로 ‘상관분석..
통계를 공부하다 보면 아주 중요한 질문을 마주하게 됩니다.“세 개 이상의 그룹 평균을 비교하려면 어떻게 해야 하나요?” 이 질문은 통계 분석의 핵심 원리를 이해하는 데 매우 깊은 함의를 담고 있습니다. 대부분의 초보 학습자는 두 집단 간의 평균 비교에서는 독립표본 t검정을 사용하면 된다는 사실을 알고 있습니다. 예컨대 남학생과 여학생의 시험 점수를 비교하거나, 약 복용 그룹과 비복용 그룹의 혈압 변화를 비교할 때 t검정은 유용한 도구입니다. 하지만 현실의 대부분 문제는 두 개 이상의 조건이 존재합니다. 다음과 같은 상황을 상상해보시겠어요?세 가지 다이어트 프로그램을 제공했을 때, 체중감량 효과가 서로 다를까?A학급, B학급, C학급 학생들의 수학 성적 평균이 서로 차이가 날까?커피를 하루 1잔 이하, 2..
“과연 두 집단은 정말 다를까?” – 그 질문에 통계가 답하다 통계를 배운다는 것은 숫자를 계산하는 기술을 익히는 것을 넘어, 세상을 더 객관적으로 바라보는 눈을 갖는 과정입니다. 그중에서도 오늘 배울 독립표본 t검정(Independent Samples t-Test)은 통계학의 수많은 분석 도구 중에서도 매우 실용적이며, 실제 연구나 비즈니스 분석, 심지어 언론 보도나 정책 판단에서도 빈번하게 활용되는 중요한 기법입니다. 왜냐하면, 우리는 현실에서 무언가를 비교하고 싶어 할 때가 많기 때문입니다. 예를 들어,“남성과 여성의 하루 평균 스마트폰 사용 시간이 다를까?”“코로나 이후 재택근무자와 출근근무자의 업무 만족도에 차이가 있을까?”“A반과 B반의 수학 시험 성적은 차이가 있는가?”“신제품을 사용한 집단..
우리가 데이터를 다룰 때 가장 먼저 마주하는 질문은 “이 수치들의 중심은 어디일까?”, 그리고 “값들이 얼마나 퍼져 있을까?”입니다. 예를 들어, 학급의 시험 점수를 보며 평균이 80점이라면, 우리는 대부분의 학생이 그 언저리에 있다고 추정할 수 있습니다. 하지만 이때 중요한 질문 하나가 추가됩니다. “그 평균 근처에 대부분이 있는가, 아니면 극단적인 값들 때문에 평균만 그렇게 나온 걸까?”이 두 질문에 답해주는 핵심 도구가 바로 평균(Mean)과 표준편차(Standard Deviation)입니다. 이 두 통계 지표는 기술통계(Descriptive Statistics)의 기초 중의 기초이자, 모든 통계분석의 출발점이라 할 수 있습니다. 평균은 전체 데이터의 중심을 알려주며, 표준편차는 그 중심에서 데이터..
통계는 관계를 밝혀내는 언어입니다통계를 배우다 보면, 처음에는 숫자의 집합처럼 느껴지던 데이터가 어느 순간 말없이 많은 이야기를 하고 있다는 것을 느끼게 됩니다. 처음에는 단지 숫자들이 나열되어 있는 것처럼 보이지만, 그 숫자들 사이에는 어떤 규칙성, 경향성, 그리고 때로는 의미 있는 인과관계가 숨어 있습니다. 특히 우리가 흔히 접하는 사회조사나 마케팅 리서치, 여론조사 결과 등을 조금 더 깊이 이해하려면, 단일 변수의 빈도나 평균만으로는 부족합니다. 두 변수 간의 관계, 다시 말해 “이것과 저것은 관련이 있을까?”라는 질문에 대답할 수 있어야 합니다. 이때 필요한 분석 방법이 바로 교차분석(Cross Tabulation Analysis)입니다. 교차분석은 두 개 이상의 범주형 변수 간의 관련성을 탐색하..
“설문조사에서 가장 많이 나온 응답은 무엇이었나요?”“사람들이 가장 선호한 항목은 무엇일까요?”이러한 질문에 답하기 위한 가장 기초적인 통계 분석이 바로 빈도분석(Frequency Analysis)입니다. 빈도분석이란 무엇일까요?각 항목(값)이 얼마나 자주 등장했는지를 세는 것.통계 분석의 기초 중의 기초로, 데이터를 정리하는 첫걸음이며, 명목형 변수와 서열형 변수에서 특히 많이 활용되는 분석 기법이기도 합니다. 예를 들어 한 대학생을 대상으로 조사한 ‘가장 좋아하는 커피 종류’ 결과에서, 200명 중 85명이 아메리카노를 골랐다면? 아메리카노의 빈도는 85이며, 이는 해당 커피가 가장 선호된 항목임을 알려줍니다. Jamovi는 이런 빈도분석을 정말 직관적이고 쉽게 처리할 수 있도록 도와주는 강력한 도구..