1. T-검증이 필요한 경우

T-검증은 다음과 같은 경우에 사용됩니다.

  1. 두 그룹 간 평균 비교

    • 예: 남성과 여성의 학업 성취도 차이 비교
    • 예: 신약과 기존 약을 복용한 그룹 간 혈압 차이 비교
  2. 표본 크기가 작을 때 (n < 30)

    • 모집단의 분산을 알지 못하는 경우 T-검증이 적절합니다.
    • 표본 크기가 작으면 정규성을 가정해야 하므로, 사전 정규성 검정이 필요할 수 있습니다.
  3. 변수가 연속형이고 정규성을 만족할 때

    • 종속변수가 연속형(예: 시험 점수, 키, 몸무게 등)이어야 합니다.
    • 독립변수(집단 변수)는 범주형(예: 성별, 실험군/대조군 등)이어야 합니다.
    • 샘플이 충분하지 않으면 정규성 검정을 통해 정규 분포를 따르는지 확인해야 합니다.

2. T-검증의 종류 및 SPSS 사용법

T-검증은 크게 독립표본 T-검증, 대응표본 T-검증, 일표본 T-검증 세 가지가 있습니다.

1) 독립표본 T-검증 (Independent Samples T-test)

  • 서로 다른 두 그룹의 평균 차이를 비교할 때 사용
  • 예: 남성과 여성의 평균 시험 점수 차이 비교
SPSS에서 독립표본 T-검증 실행 방법
  1. 데이터 입력

    • 한 열에 연속형 종속변수(예: 시험 점수) 입력
    • 다른 한 열에 그룹 변수(예: 성별, 1=남성, 2=여성) 입력
  2. 분석 실행

    • 상단 메뉴에서 Analyze(분석) → Compare Means(평균 비교) → Independent-Samples T Test 선택
    • "Test Variable"에 연속형 변수(예: 시험 점수) 추가
    • "Grouping Variable"에 그룹 변수(예: 성별) 추가 후 Define Groups(그룹 정의) 클릭하여 그룹 코드 입력(예: 1, 2)
    • OK 클릭하여 실행
  3. 결과 해석

    • Levene’s Test에서 등분산 가정 검정 수행 (p-value > 0.05이면 등분산 가정 O, 아래 행 사용)
    • "Sig. (2-tailed)" 값 확인 → p-value < 0.05이면 유의한 차이 있음

2) 대응표본 T-검증 (Paired Samples T-test)

  • 동일한 집단에서 두 시점의 평균 차이를 비교할 때 사용
  • 예: 다이어트 전후 체중 변화 비교
SPSS에서 대응표본 T-검증 실행 방법
  1. 데이터 입력

    • 한 열에 첫 번째 측정값(예: 다이어트 전 체중) 입력
    • 다른 열에 두 번째 측정값(예: 다이어트 후 체중) 입력
  2. 분석 실행

    • Analyze(분석) → Compare Means(평균 비교) → Paired-Samples T Test 선택
    • "Paired Variables"에 두 변수를 추가 (예: 다이어트 전 체중, 다이어트 후 체중)
    • OK 클릭하여 실행
  3. 결과 해석

    • "Sig. (2-tailed)" 값 확인 → p-value < 0.05이면 두 시점 간 유의한 차이 있음

3) 일표본 T-검증 (One-Sample T-test)

  • 모집단의 특정 값(기준 값)과 표본의 평균을 비교할 때 사용
  • 예: 한 학급의 평균 시험 점수가 전국 평균(70점)과 차이가 있는지 확인
SPSS에서 일표본 T-검증 실행 방법
  1. 데이터 입력

    • 한 열에 비교할 연속형 변수(예: 시험 점수) 입력
  2. 분석 실행

    • Analyze(분석) → Compare Means(평균 비교) → One-Sample T Test 선택
    • "Test Variable"에 비교할 변수(예: 시험 점수) 추가
    • "Test Value"에 비교 기준 값(예: 70) 입력
    • OK 클릭하여 실행
  3. 결과 해석

    • "Sig. (2-tailed)" 값 확인 → p-value < 0.05이면 모집단 평균과 유의한 차이 있음

3. T-검증 전 확인해야 할 사항

  1. 정규성 검정 (Kolmogorov-Smirnov 또는 Shapiro-Wilk Test)

    • T-검증을 수행하기 전에 정규성 검정을 해야 함
    • Analyze → Descriptive Statistics → Explore → Plots → Normality plots with tests 선택 후 실행
    • p-value > 0.05이면 정규성 만족 (T-검증 가능), 아니면 비모수 검정(Wilcoxon rank-sum test) 고려
  2. 등분산 검정 (Levene’s Test)

    • 독립표본 T-검증에서는 두 그룹 간 분산이 같은지 확인 필요
    • p-value > 0.05이면 등분산 가정 가능
  3. 표본 크기

    • T-검증은 표본 크기가 작아도 사용 가능하지만, 충분한 표본이 있을수록 신뢰도가 증가

4. T-검증의 결과 해석

  • t 값 (t-statistic): 두 그룹 간 차이가 얼마나 큰지를 나타냄
  • p-value (Sig. 값, 유의 확률):
    • p < 0.05 → 그룹 간 차이가 통계적으로 유의함
    • p > 0.05 → 그룹 간 차이가 통계적으로 유의하지 않음
  • 신뢰구간 (Confidence Interval): 평균 차이가 존재할 수 있는 범위를 제공

결론

SPSS에서 T-검증을 수행할 때는 먼저 데이터의 정규성을 확인하고, 적절한 T-검증 방법을 선택한 후 분석을 진행해야 합니다. 결과 해석 시 p-value를 확인하여 두 그룹 간 차이가 유의한지를 판단하면 됩니다.


상관관계 분석(Correlation Analysis) 개요

상관관계 분석은 두 변수 간의 관계가 얼마나 밀접한지를 측정하는 통계 기법입니다.


1. 상관관계를 사용해야 하는 경우

다음과 같은 경우에 상관관계를 사용합니다.

  1. 두 변수 간의 연관성을 확인하고 싶을 때

    • 예: 공부 시간과 시험 점수의 관계
    • 예: 광고비와 매출액의 관계
  2. 변수 간 선형적 관계(linear relationship)가 있는지 확인하고 싶을 때

    • 한 변수가 증가할 때 다른 변수가 증가 또는 감소하는지 확인
  3. 변수 간 인과관계를 가정하지 않고 연관성만 분석할 때

    • 상관관계는 인과관계를 의미하지 않으며, 두 변수가 단순히 함께 변화하는지를 나타냄
  4. 회귀 분석을 수행하기 전에 변수 간 관련성을 파악할 때

    • 회귀 분석 전에 독립변수와 종속변수 간 상관관계를 확인하여 적절한 변수를 선택

2. SPSS에서 상관관계 분석 방법

SPSS에서 상관관계 분석을 수행하는 방법을 설명해 드릴게요.

1) 데이터 입력

  • 각 변수(예: 공부 시간, 시험 점수)를 별도의 열(Column)에 입력
  • 한 행(Row)은 한 개체(사람, 실험 단위 등)에 해당

2) 상관관계 분석 실행

  1. 상단 메뉴에서 Analyze(분석) → Correlate(상관) → Bivariate(이변량) 선택
  2. 상관관계를 분석할 변수(예: 공부 시간, 시험 점수)를 선택하여 오른쪽 상자로 이동
  3. 상관계수(Correlation Coefficient) 선택
    • Pearson(피어슨): 정규분포를 따르는 연속형 변수 간 상관관계 분석
    • Spearman(스피어만): 서열(순위) 데이터 또는 비정규분포 데이터에 적합
    • Kendall’s tau(켄달): 서열 데이터 간 관계 측정 시 사용
  4. Options(옵션) 클릭
    • "Means and standard deviations(평균 및 표준편차)" 체크 가능
  5. OK 클릭하여 분석 실행

3. 상관관계 분석 결과 해석

1) 상관계수(Correlation Coefficient, r) 값 해석

  • r = +1 → 완전한 양의 상관관계 (한 변수가 증가하면 다른 변수도 증가)
  • r = -1 → 완전한 음의 상관관계 (한 변수가 증가하면 다른 변수는 감소)
  • r = 0 → 상관관계 없음
r 값 범위상관관계 정도
0.00 ~ 0.19매우 약한 관계
0.20 ~ 0.39약한 관계
0.40 ~ 0.59보통의 관계
0.60 ~ 0.79강한 관계
0.80 ~ 1.00매우 강한 관계

2) 유의확률(Significance, p-value) 확인

  • p < 0.05 → 상관관계가 통계적으로 유의함
  • p > 0.05 → 상관관계가 통계적으로 유의하지 않음

3) 상관 행렬 (Correlation Matrix)

SPSS 출력 결과는 보통 행렬 형태로 제공되며, 변수가 여러 개일 경우 모든 변수 간 상관관계를 보여줌.

예제:

공부 시간시험 점수
공부 시간1.0000.75**
시험 점수0.75**1.000
  • 0.75는 공부 시간과 시험 점수 간 강한 양의 상관관계를 의미
  • **는 유의확률(p < 0.01) 기준에서 유의미함을 나타냄

4. 상관관계 분석 전 고려해야 할 점

  1. 정규성 검정

    • Pearson 상관계수를 사용하려면 정규성을 만족해야 함
    • Analyze → Descriptive Statistics → Explore → Normality Test 실행
  2. 선형성 검정

    • 상관관계 분석은 선형 관계를 가정하므로 산점도(Scatter Plot) 그래프를 통해 선형성을 검토해야 함
    • Graphs → Chart Builder → Scatter/Dot 선택하여 그래프 확인
  3. 이상치(Outliers) 확인

    • 이상값이 있으면 상관계수에 영향을 줄 수 있으므로 Boxplot 등을 사용하여 확인

5. 상관관계 분석의 한계

  1. 인과관계를 설명할 수 없음

    • 상관관계는 두 변수 간의 관계만을 나타낼 뿐, 원인과 결과를 설명하지 않음
    • 예: 아이스크림 판매량과 익사 사고는 양의 상관관계를 보이지만, 이는 온도의 영향 때문
  2. 공변량 문제(Covariate Confounding)

    • 두 변수 간의 관계가 다른 변수의 영향을 받을 가능성이 있음
    • 예: 운동량과 체중 감소 간 상관관계가 있지만, 식단이라는 추가 요인이 영향을 줄 수 있음
  3. 비선형 관계를 감지하지 못함

    • 상관계수는 선형 관계를 가정하므로, 비선형 관계를 분석하기 위해서는 다른 기법(예: 회귀 분석)이 필요할 수 있음

6. 결론

  • 상관관계 분석은 두 변수 간의 관계를 파악하는 데 유용한 도구
  • SPSS에서 Pearson, Spearman, Kendall’s tau 방법을 선택하여 분석 가능
  • p-value가 유의하면 상관관계가 통계적으로 의미 있음
  • 그러나 상관관계가 높다고 해서 인과관계를 의미하는 것은 아님

회귀분석(Regression Analysis) 개요

회귀분석은 한 변수(종속변수, Y)가 다른 변수(독립변수, X)의 영향을 받는지를 분석하고, 이 관계를 수식으로 나타내는 통계 기법입니다. 

1. 회귀분석을 사용해야 하는 경우

다음과 같은 경우에 회귀분석을 사용합니다.

  1. 변수 간의 인과관계를 분석하고 싶을 때

    • 예: 광고비(X)와 매출액(Y)의 관계 분석
    • 예: 공부 시간(X)과 시험 점수(Y)의 관계 분석
  2. 독립변수가 종속변수에 미치는 영향을 수량적으로 측정하고 싶을 때

    • 광고비가 10% 증가하면 매출이 몇 % 증가하는지 예측
  3. 미래 값을 예측하고 싶을 때

    • 특정 연령대의 평균 소득을 예측
    • 고객 만족도 점수에 따라 재구매 가능성을 예측
  4. 두 개 이상의 독립변수가 종속변수에 미치는 영향을 동시에 분석하고 싶을 때

    • 다중회귀분석(Multiple Regression) 사용

2. 회귀분석의 종류

1) 단순 회귀분석(Simple Regression)

  • 독립변수(X) 1개 → 종속변수(Y) 예측
  • 예: 공부 시간(X)이 시험 점수(Y)에 미치는 영향

2) 다중 회귀분석(Multiple Regression)

  • 독립변수(X) 2개 이상 → 종속변수(Y) 예측
  • 예: 공부 시간(X₁), 학원 수강 여부(X₂), 가정 학습 시간(X₃)이 시험 점수(Y)에 미치는 영향

3. SPSS에서 회귀분석 실행 방법

1) 데이터 입력

변수별 데이터를 열(Column)에 입력, 한 행(Row)은 한 개체(응답자)

응답자공부 시간 (X)학원 여부 (X)시험 점수 (Y)
12160
23070
35185
41050
54180
  • X: 독립변수(공부 시간, 학원 여부)
  • Y: 종속변수(시험 점수)

2) SPSS에서 회귀분석 실행

① 단순 회귀분석 실행 방법
  1. Analyze(분석) → Regression(회귀) → Linear(선형 회귀) 클릭
  2. 변수 설정
    • 종속변수(Y): 시험 점수 선택
    • 독립변수(X): 공부 시간 선택
  3. Statistics(통계량) 옵션 설정
    • Estimates(계수), Confidence intervals(신뢰구간), Model fit 체크
  4. Plots(그래프)
    • ZPRED(Z-예측값) vs. ZRESID(Z-잔차) 선택하여 선형성 및 정규성을 확인할 수 있도록 설정
  5. OK 클릭 → 분석 실행
② 다중 회귀분석 실행 방법
  • 위와 동일한 과정에서 독립변수(X)를 여러 개 추가

4. 회귀분석 결과 해석

1) Model Summary (모형 요약)

Model Summary ------------------------------------ R | R Square | Adjusted R Square 0.85 | 0.72 | 0.69
  • R(Squared Multiple Correlation): 독립변수와 종속변수 간 상관관계 (1에 가까울수록 관계 강함)
  • R Square(결정계수, R2R^2): 독립변수가 종속변수를 설명하는 비율 (72% → 독립변수들이 종속변수의 72%를 설명함)

2) ANOVA(분산분석) 결과 확인

ANOVA ------------------------------------ F | Sig. 23.45 | 0.001
  • F값이 크고, p-value(Sig.) < 0.05 → 회귀 모형이 유의미함

3) Coefficients(회귀계수) 해석

Coefficients ------------------------------------ Predictor (X) | B | Beta | t | Sig. Intercept | 40.2 | - | 3.5 | 0.002 공부 시간(X1) | 5.8 | 0.60 | 6.8 | 0.001 학원 여부(X2) | 12.5 | 0.45 | 4.2 | 0.005
회귀식 작성

시험점수(Y)=40.2+5.8(공부시간)+12.5(학원여부)시험 점수(Y) = 40.2 + 5.8(공부 시간) + 12.5(학원 여부)

  • 공부 시간이 1시간 증가하면 시험 점수는 5.8점 증가
  • 학원 수강(1)일 경우 시험 점수가 12.5점 더 높음
  • p-value(Sig.) < 0.05 → 모든 독립변수가 유의미한 영향을 미침

5. 회귀분석 가정(Assumptions) 체크

회귀분석을 수행할 때, 다음 가정을 만족하는지 확인해야 합니다.

① 선형성(Linear Relationship)

  • 산점도(Scatter Plot) 분석 → 선형 패턴이면 OK

② 독립성(Independence)

  • Durbin-Watson 통계량: 1~3이면 독립성 만족

③ 등분산성(Homoscedasticity)

  • 잔차(Residual) 그래프 분석 → 일정한 패턴이면 OK

④ 다중공선성(Multicollinearity)

  • VIF(Variance Inflation Factor) 값이 10 미만이면 문제 없음

6. 회귀분석의 한계

  1. 상관관계가 인과관계를 의미하지 않음

    • 독립변수가 종속변수에 영향을 미친다고 단정할 수 없음
    • 제3의 변수(교란 변수)의 영향을 고려해야 함
  2. 비선형 관계를 설명할 수 없음

    • 회귀분석은 기본적으로 선형 관계를 가정
    • 비선형 모델(로지스틱 회귀, 다항 회귀 등)이 필요할 수 있음
  3. 이상치(Outliers)가 결과에 큰 영향을 줄 수 있음

    • Boxplot을 활용하여 이상치를 탐색하고 제거할 필요 있음

7. 결론

  • 회귀분석은 변수 간의 관계를 수량적으로 분석하고 미래 예측을 수행하는 중요한 방법
  • SPSS에서 단순 또는 다중 회귀분석을 쉽게 실행할 수 있음
  • 회귀계수(B)와 p-value(Sig.)를 해석하여 변수의 유의성을 판단
  • 가정(선형성, 독립성, 등분산성, 다중공선성)을 검토하여 분석 결과의 신뢰성을 확보해야 함

신뢰도 분석(Reliability Analysis) 개요

신뢰도 분석은 설문지나 척도의 일관성을 평가하는 데 사용됩니다


1. 신뢰도 분석을 사용해야 하는 경우

신뢰도 분석은 측정 도구(설문지, 검사, 평가 척도 등)가 일관되게 측정하는지를 확인할 때 사용합니다.

신뢰도 분석이 필요한 상황

  1. 설문 문항의 일관성 검토

    • 동일한 개념(예: 직무 만족도, 고객 만족도 등)을 측정하는 문항들이 얼마나 일관되게 응답되었는지 확인할 때 사용
  2. 심리 척도(Psychometric Scale)의 신뢰성 평가

    • 리커트(Likert) 척도로 구성된 설문지(예: "매우 동의한다"~"매우 동의하지 않는다")가 얼마나 신뢰할 수 있는지 분석
  3. 테스트-재테스트 신뢰도 평가

    • 동일한 문항을 반복 측정했을 때, 일관된 결과를 얻을 수 있는지 검토
  4. 변수들 간의 내적 일관성 검토

    • 여러 개의 항목이 같은 개념을 측정하는지 확인

2. 신뢰도 분석의 핵심 개념

1) 크론바흐 알파(Cronbach’s Alpha) 계수

  • 신뢰도를 평가하는 대표적인 방법
  • 0에서 1 사이의 값으로 나타나며, 값이 클수록 신뢰도가 높음
크론바흐 알파(α) 값신뢰도 수준
0.90 이상매우 높음 (Excellent)
0.80 ~ 0.89높음 (Good)
0.70 ~ 0.79보통 (Acceptable)
0.60 ~ 0.69낮음 (Questionable)
0.50 ~ 0.59매우 낮음 (Poor)
0.50 미만신뢰할 수 없음 (Unacceptable)

2) 항목-전체 상관(Item-Total Correlation)

  • 개별 문항이 전체 신뢰도에 얼마나 기여하는지 나타냄
  • 값이 낮으면 해당 문항을 제거하는 것이 신뢰도를 높이는 데 도움이 될 수 있음

3. SPSS에서 신뢰도 분석 실행 방법

1) 데이터 입력

  • 문항별 응답을 각각의 열(Column)에 입력
  • 각 행(Row)은 한 응답자의 데이터

예시) 고객 만족도 설문 (1~5점 척도)

응답자문항1문항2문항3문항4문항5
145434
234323
355545
..................

2) SPSS에서 신뢰도 분석 실행

  1. 상단 메뉴에서
    Analyze(분석) → Scale(척도) → Reliability Analysis(신뢰도 분석) 클릭
  2. 문항 선택
    • 신뢰도를 분석할 문항을 "Items(항목)" 영역으로 이동
  3. 모델 선택
    • Model(모델) → Cronbach’s Alpha 선택
  4. 옵션 설정
    • Statistics(통계량) 버튼 클릭 → Scale if item deleted(문항 삭제 시 신뢰도 변화) 체크
  5. OK 클릭하여 분석 실행

4. 신뢰도 분석 결과 해석

1) 크론바흐 알파(Cronbach’s Alpha) 값 해석

출력 결과에서 "Reliability Statistics" 부분을 확인하면 크론바흐 알파 값이 나타남.

예제:

Reliability Statistics Cronbach’s Alpha | .82
  • 신뢰도 계수(Cronbach’s Alpha) = 0.82 → 신뢰도가 높음

2) 항목-전체 상관(Item-Total Correlation) 확인

출력 결과에서 "Item-Total Statistics" 테이블을 확인

Item-Total Statistics Item | Corrected Item-Total Correlation | Cronbachs Alpha if Item Deleted 문항 1 | 0.45 | 0.80 문항 2 | 0.60 | 0.78 문항 3 | 0.55 | 0.79 문항 4 | 0.30 | 0.85 문항 5 | 0.65 | 0.77
  • Corrected Item-Total Correlation(항목-전체 상관계수): 0.4 이상이면 좋은 문항
  • Cronbach’s Alpha if Item Deleted(문항 제거 시 신뢰도):
    • 특정 문항을 제거하면 신뢰도가 올라간다면, 해당 문항은 제거 고려 가능

5. 신뢰도를 높이는 방법

  1. 신뢰도가 너무 낮을 경우(α < 0.7), 개선 방법

    • 신뢰도가 낮은 문항을 제거 (항목-전체 상관이 낮은 항목 확인)
    • 문항 수를 늘려서 일관성을 강화
    • 유사한 문항을 추가하여 측정 항목을 세분화
    • 응답자들에게 질문의 명확성을 높이도록 문항 수정
  2. 신뢰도가 너무 높은 경우(α > 0.9), 개선 방법

    • 문항들이 중복되는 경우가 많을 수 있음 → 유사 문항 제거 고려

6. 신뢰도 분석의 한계

  1. 내적 일관성만 평가 가능

    • 크론바흐 알파는 응답의 일관성을 측정할 뿐, 측정도구의 타당성(Validity)은 평가하지 않음
  2. 문항 수에 따라 값이 영향받음

    • 문항 수가 많으면 α 값이 높아질 수 있음 → 실제 신뢰도를 과대평가할 가능성 있음
  3. 이분형 문항(예: Yes/No 질문)에 적절하지 않음

    • 이분형 데이터는 크론바흐 알파 대신 KR-20(Kuder-Richardson Formula 20) 계수를 사용할 수 있음

7. 결론

  • 신뢰도 분석은 설문 문항의 일관성을 평가하는 중요한 과정
  • SPSS에서 Cronbach’s Alpha 계수를 사용하여 신뢰도를 확인 가능
  • 항목-전체 상관(Item-Total Correlation) 값을 분석하여 신뢰도가 낮은 문항을 제거하면 신뢰도를 향상시킬 수 있음
  • 신뢰도와 타당도는 별개이므로, 타당도 검증(탐색적 요인분석 등)도 함께 수행하는 것이 중요

카이제곱(χ²) 검정(Chi-Square Test) 개요

카이제곱 검정은 범주형 변수 간의 독립성 또는 적합성을 검정하는 통계 기법입니다.

1. 카이제곱 검정을 사용해야 하는 경우

① 독립성 검정 (Chi-Square Test for Independence)

  • 두 개의 범주형 변수가 서로 독립적인지 여부를 검정할 때 사용
  • 예: 성별(남/여)과 제품 선호도(선호함/선호하지 않음)가 관련이 있는가?

② 적합성 검정 (Chi-Square Goodness-of-Fit Test)

  • 관찰된 데이터가 기대값과 얼마나 일치하는지 검정할 때 사용
  • 예: 한 마트에서 고객들이 선호하는 결제 방식(현금, 카드, 모바일 결제)의 비율이 특정 분포를 따르는가?

2. 카이제곱 검정의 가정(Assumptions)

  1. 범주형(명목형) 데이터여야 함
    • 연속형 변수를 사용할 수 없음 (연속형 변수는 그룹으로 변환 가능)
  2. 모든 기대 빈도(Expected Frequency)가 5 이상이어야 함
    • 만약 5 미만인 셀이 많다면, 피셔의 정확 검정(Fisher’s Exact Test) 또는 요약된 데이터(합쳐진 범주) 사용 고려
  3. 독립적인 샘플이어야 함
    • 동일한 개체에서 여러 번 데이터를 수집하면 안 됨

3. SPSS에서 카이제곱 검정 실행 방법

1) 데이터 입력

SPSS 데이터 시트에 범주형 데이터를 입력해야 합니다.

예제 데이터: 성별과 제품 선호도
응답자성별 (Gender)제품 선호도 (Preference)
1남자선호함
2여자선호하지 않음
3남자선호함
4여자선호함
5남자선호하지 않음
  • 성별(Gender): 남자(1), 여자(2) (범주형)
  • 제품 선호도(Preference): 선호함(1), 선호하지 않음(2) (범주형)

2) SPSS에서 독립성 검정 실행 방법

  1. 상단 메뉴에서
    Analyze(분석) → Descriptive Statistics(기술 통계) → Crosstabs(교차분석) 클릭
  2. 변수 설정
    • 행(Row): 독립변수(예: 성별)
    • 열(Column): 종속변수(예: 제품 선호도)
  3. Statistics(통계량) 버튼 클릭
    • Chi-square(카이제곱 검정) 체크
    • Expected Counts(기대 빈도) 체크하여 기대 빈도 확인
  4. Cells(셀) 옵션 설정
    • Observed(관찰값), Expected(기대값) 선택
  5. OK 클릭 → 분석 실행

4. 카이제곱 검정 결과 해석

① 교차표 확인 (Crosstab Table)

Crosstab Table
--------------------------------- | 선호함 | 선호하지 않음 | 합계 --------------------------------- 남자 (1) | 20 | 10 | 30 여자 (2) | 15 | 25 | 40 --------------------------------- 합계 | 35 | 35 | 70
  • 남자(1) 중 20명이 제품을 선호, 10명이 선호하지 않음
  • 여자(2) 중 15명이 제품을 선호, 25명이 선호하지 않음

② 카이제곱 검정 결과 확인 (Chi-Square Test Results)

Chi-Square Tests
--------------------------------------------------- Test | Value | df | Asymp. Sig. (2-sided) --------------------------------------------------- Pearson Chi-Square | 5.231 | 1 | 0.022
  • Pearson Chi-Square(피어슨 카이제곱 값) = 5.231
  • p-value(Sig.) = 0.022유의수준 0.05보다 작음 → 유의한 차이가 있음

5. 결과 해석

  • p-value(0.022) < 0.05이므로, 성별과 제품 선호도는 독립적이지 않다.
  • 즉, 성별에 따라 제품 선호도가 차이가 있다고 볼 수 있음.
  • 만약 p-value > 0.05라면, 성별과 제품 선호도 간에는 유의미한 차이가 없다고 해석함.

6. 적합성 검정 실행 방법 (Goodness-of-Fit Test)

이 검정은 특정 분포(예: 예상 비율)를 따르는지 확인할 때 사용됩니다.

① 예제 데이터: 결제 방식 선호도 (Cash, Card, Mobile)

  • 예상 비율: 현금(40%), 카드(40%), 모바일(20%)
  • 실제 응답: 현금(35명), 카드(45명), 모바일(20명)

② SPSS에서 적합성 검정 실행 방법

  1. Analyze(분석) → Nonparametric Tests(비모수 검정) → Legacy Dialogs → Chi-Square 클릭
  2. 변수 선택
    • 범주형 변수(예: 결제 방식) 선택
  3. Expected Values(기대값 입력)
    • 예상 비율(40%, 40%, 20%)을 입력
  4. OK 클릭 → 분석 실행

7. 카이제곱 검정의 한계

  1. 데이터가 5 미만인 셀이 많으면 결과가 왜곡될 수 있음

    • 해결책: 피셔의 정확 검정(Fisher’s Exact Test) 또는 변수를 통합하여 범주 수 줄이기
  2. 상관관계는 알 수 있지만, 인과관계는 확인할 수 없음

    • 예: 성별과 제품 선호도가 관련이 있더라도, 성별이 직접적으로 선호도를 결정한다고 단정할 수 없음
  3. 샘플 크기가 작을 경우 검정력이 낮음

    • 최소 5개 이상의 데이터가 각 범주에 포함되도록 설정

8. 결론

  • 카이제곱 검정은 두 개의 범주형 변수 간 관계를 분석하는 유용한 방법
  • SPSS에서 Crosstabs 기능을 활용하여 독립성 검정을 쉽게 수행 가능
  • p-value가 0.05보다 작으면 변수 간 관계가 유의미함을 의미
  • 기대 빈도가 너무 작을 경우 피셔의 정확 검정을 고려해야 함