; ; 공분산 분석(ANCOVA, Analysis of Covariance)의 기본 개념
 

공분산 분석(ANCOVA, Analysis of Covariance)의 기본 개념

공분산 분석(ANCOVA)는 독립 변수(범주형 변수)와 종속변수(연속형 변수)의 사이에서 외생변수의 영향력을 통제하고, 변수의 차이를 분석하는 통계 기법으로 집단의 순수한 효과를 파악하기 위한 분석방법입니다. 공분산 분석(ANCOVA)는 분산 분석(ANOVA)과 회귀 분석의 결합 형태라고 볼 수 있습니다.

공분산 분석의 목적

공분산 분석은 독립 변수의 효과를 확인하면서 외생 변수(연속형 변수)의 영향을 제거하고, 독립 변수와 종속 변수 간의 관계를 더 명확히 파악하는 데 사용되는 분석방법입니다.

그렇기 때문에 독립변수, 종속변수, 외생변수(예: 통제변수, 공변인 등)와 같은 변수를 주요 구성으로 갖고 있습니다.

주요 구성 요소:

  1. 독립 변수: 비교하고자 하는 그룹(범주형, 예: 실험 그룹 vs 대조 그룹).
  2. 종속 변수: 독립 변수의 영향을 받고자 하는 변수(연속형, 예: 테스트 점수).
  3. 외생변수(Covariate): 종속 변수에 영향을 미칠 수 있는 변수(연속형, 예: 사전 점수).

공분산 분석(ANCOVA)가 필요한 이유는?

목적에서 설명한 것 처럼 독립 변수와 종속 변수 간의 관계를 분석하고, 설명하고자 할 때, 종속 변수에 영향을 미칠 수 있는 외생 변수가 있을 경우, ANCOVA를 통해 외생 변수의 영향을 통계적으로 통제할 수 있습니다. 이러한 통제를 통해 종속변수에 대한 집단의 순수한 효과를 파악할 수있습니다.

 

예를 들어, 학생들의 성적을 비교할 때, 사전 시험 점수(공변인)와 같은 요인의 영향을 통제하여 실험 그룹과 대조 그룹 간의 순수한 차이를 파악할 수 있습니다.

연구 가설의 설정

공분산 분석에서 설정할 수 있는 주요 연구 가설은 다음과 같습니다.

귀무가설(Null Hypothesis, \(H_0)\)

  • 독립 변수가 종속 변수에 유의미한 영향을 미치지 않는다.
    \(H_0: \mu_1 = \mu_2 = \mu_3\) (그룹 평균에 차이가 없다.)

대립가설(Alternative Hypothesis, \(H_a)\)

  • 독립 변수가 종속 변수에 유의미한 영향을 미친다.
    \(H_a: \mu_1 \neq \mu_2 \neq \mu_3\) (그룹 평균에 차이가 있다.)

공변인과 종속 변수 간의 관계 가설

  • 공변인이 종속 변수와 유의미한 상관 관계를 가진다.
    \(H_0: \beta = 0\) (공변인이 종속 변수에 영향을 미치지 않는다.)
    \(H_a: \beta \neq 0\) (공변인이 종속 변수에 영향을 미친다.)

공분산 분석(ANCOVA)의 사용 예시

연구 질문

"새로운 학습 방법이 학생들의 학업 성취도에 미치는 효과는 기존 방법과 비교하여 어떤가? 단, 사전 학업 수준(사전 점수)의 영향을 통제하여 순수한 학습 방법의 효과를 분석한다."

분석 설정

독립 변수 (범주형 데이터)

  • 학습 방법:
    • 새로운 학습 방법 그룹
    • 기존 학습 방법 그룹

종속 변수 (연속형 데이터)

  • 학업 성취도:
    • 학기 말 시험 점수

공변인 (연속형 데이터)

  • 사전 학업 수준:
    • 학기 초 사전 시험 점수

가설 설정

귀무가설 \((H_0)\): 학습 방법(새로운 vs 기존)에 따른 학업 성취도 평균 차이는 없다.
\(H_0: \mu_{\text{새로운 방법}} = \mu_{\text{기존 방법}}\)

대립가설 \((H_a)\): 학습 방법(새로운 vs 기존)에 따른 학업 성취도 평균 차이가 있다.
\(H_a: \mu_{\text{새로운 방법}} \neq \mu_{\text{기존 방법}}\)

공변인 효과: 사전 학업 수준이 학업 성취도에 영향을 미친다.
\(H_0: \beta_{\text{공변인}} = 0 \quad \text{vs.} \quad H_a: \beta_{\text{공변인}} \neq 0\)

데이터 구조

학생 ID 학습 방법 사전 점수 (공변인) 성취도 점수 (종속 변수)
1 새로운 방법 70 85
2 기존 방법 65 78
3 새로운 방법 75 88
4 기존 방법 60 70
... ... ... ...

분석 단계

  1. 데이터 입력: SPSS 또는 Python 등 통계 소프트웨어에 데이터를 입력합니다.
  2. ANCOVA 실행:
    • 종속 변수: 학업 성취도 점수
    • 독립 변수: 학습 방법
    • 공변인: 사전 점수
  3. 모델 평가: 공변인(사전 점수)이 학업 성취도에 얼마나 영향을 미치는지 확인한 후, 학습 방법(독립 변수)이 성취도에 미치는 영향을 분석합니다.

결과 해석

1. 공변인 효과 검정

  • \(p\)-값 < 0.05: 사전 점수는 학업 성취도에 유의미한 영향을 미침.
  • 따라서 공변인의 영향을 통제한 후, 학습 방법 효과를 평가합니다.

2. 독립 변수 효과 검정

  • \(p\)-값 < 0.05: 학습 방법에 따른 학업 성취도 평균 차이가 유의미함.
    • 새로운 학습 방법이 기존 방법보다 성취도를 더 높였다는 결론.

 

SPSS에서 공분산 분석(ANCOVA)을 수행하는 단계는 다음과 같습니다. 예제를 통해 상세히 설명하겠습니다.

 

예제 데이터

  • 독립 변수 (범주형): 학습 방법 (새로운 vs 기존)
  • 공변인 (연속형): 사전 점수
  • 종속 변수 (연속형): 학기 말 시험 점수

SPSS에서 공분산 분석 단계

1. 데이터 입력

  1. 변수 생성:
    • SPSS 데이터 파일(.sav)을 열고, 아래와 같이 데이터를 입력합니다:
      • 학습방법 (Group): 1 = 기존 방법, 2 = 새로운 방법 (범주형)
      • 사전 점수 (PreScore): 연속형 변수
      • 성취도 점수 (PostScore): 연속형 변수
    ID Group PreScore PostScore
    1 1 65 78
    2 2 70 85
    3 1 60 70
    4 2 75 88
  2. 데이터 타입 확인:
    • Variable View 탭에서 변수 유형을 확인하고, Group은 "Nominal(명목형)"으로, 나머지는 "Scale(척도형)"으로 설정합니다.

2. 공분산 분석 실행

  1. 분석 메뉴로 이동:
    • 메뉴에서 Analyze → General Linear Model → Univariate를 클릭합니다.
  2. 변수 설정:
    • Dependent Variable: PostScore (종속 변수)
    • Fixed Factor: Group (독립 변수)
    • Covariate: PreScore (공변인)
  3. 옵션 설정:
    • Model:
      • "Custom"을 선택한 후, Group과 PreScore의 효과를 포함합니다.
    • Plots:
      • 독립 변수(Group)를 x축에 설정하고, "Add" 버튼을 눌러 결과를 시각화합니다.
    • Post Hoc:
      • Group을 선택하고, "Bonferroni" 또는 "LSD"를 선택하여 그룹 간 평균 차이를 분석합니다.
    • Options:
      • "Descriptive statistics"와 "Homogeneity tests"를 체크하여 결과에 대한 추가 정보를 제공합니다.
  4. 실행:
    • "OK"를 눌러 분석을 실행합니다.

3. 결과 해석

SPSS는 다음과 같은 주요 결과를 제공합니다:

  1. Descriptive Statistics:
    • 그룹별 평균과 표준편차를 확인합니다.
  2. Levene's Test of Equality of Error Variances:
    • 공분산 분석의 기본 가정인 "오차 분산의 동일성"을 검정합니다.
    • (p)-값 > 0.05라면 가정을 충족한 것으로 간주합니다.
  3. Tests of Between-Subjects Effects:
    • 독립 변수(Group)와 공변인(PreScore)의 효과를 검정합니다.
    • (p)-값 < 0.05이면 해당 변수는 종속 변수에 유의미한 영향을 미칩니다.
  4. Pairwise Comparisons (Post Hoc 결과):
    • Bonferroni 또는 LSD를 통해 그룹 간 평균 차이를 검정합니다.

예시 결과 해석

  • 독립 변수(Group)의 (p)-값이 0.03이라면, 학습 방법에 따른 성취도 점수의 차이가 유의미합니다.
  • 공변인(PreScore)의 (p)-값이 0.01이라면, 사전 점수가 성취도 점수에 유의미한 영향을 미칩니다.

추가 팁

  • 그래프 결과는 Plots 탭에서 확인할 수 있습니다.
  • 공분산 분석을 실행한 후 결과를 논문이나 보고서에 활용할 때, "독립 변수의 주효과와 공변인의 효과를 통제한 결과"라는 점을 강조해야 합니다.

 

 

공분산 분석(ANCOVA)의 결과를 **표로 작성하고 해석**하는 방법을 단계별로 설명하겠습니다. 예제를 바탕으로 작성하므로 실제 분석 시 참고하시면 됩니다.

결과 요약: 주요 표 구성

SPSS에서 주요 결과는 아래와 같은 표로 나타납니다.

(1) Descriptive Statistics (기술 통계)

그룹별로 종속 변수의 평균과 표준편차를 제공합니다.

Group N Mean (PostScore) Std. Deviation
기존 방법 (1) 30 70.50 5.25
새로운 방법 (2) 30 75.80 4.95

 

해석: 새로운 방법 그룹의 평균 점수가 기존 방법 그룹보다 약 5.3점 높습니다. 하지만, 이 차이가 통계적으로 유의한지는 추가 분석이 필요합니다.

(2) Levene's Test of Equality of Error Variances (오차 분산의 동일성 검정)

Test Statistic df1 df2 Sig. (p-value
1.75 1 58 0.192

 

해석: (p)-값이 0.192 > 0.05이므로 오차 분산이 동일하다는 가정을 충족합니다.

(3) Tests of Between-Subjects Effects (주효과 검정)

Source Type III Sum of Squares df Mean Square F Sig. (p-value)
Corrected Model 420.25 2 210.12 15.87 0.000
Intercept 56780.12 1 56780.12 4285.67 0.000
PreScore (공변인) 180.45 1 180.45 13.60 0.001
Group (학습 방법) 235.75 1 235.75 17.75 0.000
Error 770.45 57 13.52    

해석:

  • 공변인(PreScore): (p)-값이 0.001로 유의미하므로, 사전 점수가 성취도에 영향을 미친다고 볼 수 있습니다.
  • 독립 변수(Group): (p)-값이 0.000으로 유의미하므로, 학습 방법에 따라 성취도 점수가 달라집니다.
  • F값은 효과의 크기를 나타냅니다. 높은 값일수록 큰 차이를 의미합니다.

(4) Pairwise Comparisons (사후 검정)

Group Comparison Mean Difference Std. Error Sig. (p-value)
기존 vs. 새로운 -5.30 1.25 0.000

 

해석: 기존 방법과 새로운 방법 간의 평균 차이는 5.30점이며, (p)-값이 0.000으로 유의미합니다. 즉, 새로운 학습 방법이 성취도 점수를 유의미하게 높이는 것으로 나타났습니다.

결과 해석 (예시)

논문에서 공분산 분석(ANCOVA) 결과를 보고하는 방법은 APA 스타일을 따르는 것이 일반적입니다. 아래는 공분산 분석 결과를 논문에 적합한 표로 정리하고, 이를 기반으로 해석한 예시입니다.

결과표 작성

Table 1. Descriptive Statistics by Group

Group N Mean (PostScore) Std. Deviation
Traditional Method (1) 30 70.50 5.25
New Method (2) 30 75.80 4.95

Table 2. ANCOVA Results

Source SS df MS F p Partial η²
PreScore (Covariate) 180.45 1 180.45 13.60 0.001 0.193
Group (Teaching Method) 235.75 1 235.75 17.75 0.000 0.237
Error 770.45 57 13.52      
Total 56780.12 59        

Table 3. Pairwise Comparisons

Group Comparison Mean Difference Std. Error p
Traditional vs. New -5.30 1.25 0.000

 

결과 해석

연구 질문

새로운 학습 방법이 기존 학습 방법에 비해 학생들의 학업 성취도를 유의미하게 향상시키는가?

결과 요약

오차 분산의 동일성 검정: Levene's Test 결과 (p = 0.192 > 0.05)로, 오차 분산이 동일하다는 가정을 충족합니다.

 

기술 통계:

  • 새로운 학습 방법 그룹의 평균 성취도 점수(75.80점)가 기존 학습 방법 그룹(70.50점)보다 약 5.3점 더 높았습니다.

공변인 효과:

  • 사전 점수(PreScore, 공변인)는 성취도 점수에 유의미한 영향을 미쳤습니다 ((F(1, 57) = 13.60, p = 0.001, \eta² = 0.193)).
  •  PreScore(공변인)의 (p = 0.001 < 0.05)로, 사전 점수가 성취도에 유의미한 영향을 미칩니다.
  • 이는 학생들의 사전 학업 수준이 성취도 점수와 높은 상관이 있음을 의미합니다.

독립 변수 효과:

  • 학습 방법(Group)은 성취도 점수에 유의미한 영향을 미쳤습니다 ((F(1, 57) = 17.75, p = 0.000, \eta² = 0.237)).
  • Group(학습 방법)의 (p = 0.000 < 0.05)로, 새로운 학습 방법이 기존 방법보다 성취도를 유의미하게 높이는 것으로 나타났습니다.
  • 학습 방법에 따른 점수 차이가 공변인의 영향을 통제한 후에도 여전히 유의미합니다.

사후 검정:

  • 그룹 간 비교에서, 새로운 학습 방법은 기존 방법보다 성취도를 유의미하게 높였습니다 (Mean Difference = -5.30, (p = 0.000)).

평균 비교: 새로운 방법 그룹의 평균 점수는 75.80점, 기존 방법 그룹은 70.50점으로, 약 5.30점의 차이가 있었습니다.

 

공분산 분석 결과, 새로운 학습 방법이 기존 학습 방법보다 학생들의 학업 성취도에 긍정적인 영향을 미치는 것으로 나타났습니다 (p < 0.05). 공변인(사전 점수)을 통제한 결과에서도 이러한 차이는 통계적으로 유의미했으며, 학습 방법의 효과 크기((\eta² = 0.237))는 중간 수준 이상의 영향을 나타냅니다.

 

참고사항

표 작성 팁:

  • 표는 APA 스타일을 준수하여 제목을 표 위에 배치하고, 단위나 약어를 설명합니다.
  • 예: (SS) = Sum of Squares, (df) = degrees of freedom, (MS) = Mean Square, (p) = Probability Value.

해석 팁:

  • F값p값을 중심으로 결과를 서술하고, 효과 크기((\eta²))를 포함하여 결과의 실질적 의미를 강조합니다.
  • 사후 검정을 통해 그룹 간 차이를 구체적으로 설명합니다.

 

 

논문에서의 결과 작성 예시

연구 결과

본 연구는 새로운 학습 방법이 기존 학습 방법에 비해 학생들의 학업 성취도를 유의미하게 향상시키는지 검증하기 위해 공분산 분석(ANCOVA)을 실시하였다. 분석 결과는 다음과 같다.

  1. 기술 통계
    그룹별 학업 성취도 점수를 살펴본 결과, 새로운 학습 방법 그룹의 평균 점수는 75.80(SD = 4.95)로, 기존 학습 방법 그룹의 평균 점수인 70.50(SD = 5.25)보다 약 5.30점 높았다(Table 1 참조).
  2. 오차 분산의 동일성 검정
    Levene’s Test 결과, 두 그룹 간 오차 분산의 동일성 가정이 충족되었다((p = 0.192 > 0.05)). 따라서 공분산 분석을 수행할 수 있는 조건이 만족되었다.
  3. 공분산 분석 결과
    공분산 분석 결과, 공변인(사전 점수)이 학업 성취도 점수에 유의미한 영향을 미쳤다((F(1, 57) = 13.60, p = 0.001, \eta² = 0.193)). 이는 학생들의 사전 학업 수준이 성취도에 중요한 영향을 미친다는 것을 의미한다.
  4. 독립 변수인 학습 방법의 주효과는 유의미하였다((F(1, 57) = 17.75, p = 0.000, \eta² = 0.237)). 이는 새로운 학습 방법이 기존 학습 방법보다 학업 성취도 점수를 유의미하게 높인다는 것을 나타낸다(Table 2 참조).
  5. 사후 분석(Pairwise Comparisons)
    사후 검정 결과, 새로운 학습 방법 그룹과 기존 학습 방법 그룹 간의 평균 차이(-5.30점)가 통계적으로 유의미하였다((p = 0.000); Table 3 참조).

본 연구 결과, 새로운 학습 방법이 기존 학습 방법보다 학생들의 학업 성취도에 긍정적인 영향을 미쳤음이 확인되었다. 특히, 사전 점수(공변인)를 통제한 후에도 학습 방법의 효과는 여전히 유의미하게 나타났다. 효과 크기((\eta² = 0.237))는 중간 수준 이상의 효과를 시사하며, 새로운 학습 방법이 학업 성취도를 향상시키는 데 효과적임을 뒷받침한다.

공분산 분석(ANCOVA)의 장점

  1. 공변인의 영향을 제거함으로써 독립 변수의 순수한 효과를 확인할 수 있다.
  2. 외생 변수에 의해 왜곡될 수 있는 결과를 방지한다.
  3. 통제 변수를 포함하여 실험의 신뢰도를 높인다.

주의할 점

  • 공변인과 독립 변수 간에 상호작용이 없어야 합니다(독립적이어야 함).
  • 공변인과 종속 변수 간의 관계는 선형이어야 합니다.
  • 집단 내 공분산(공변인과 종속 변수의 관계)이 동일해야 합니다(공통 경사 가정).