엑셀 t-test 해석 - egsel t-test haeseog

엑셀 통계분석

엑셀로 t-검정(t-test) 하기 (독립표본 t-검정)

오늘은 엑셀을 통해 t검정(t-test)을 하는 방법을 공부해보겠습니다.

예를 들어, A반과 B반의 성적 데이터가 있는데요.

A반과 B반의 평균이 통계적으로 유의한 차이가 있는가, 검증을 하려고 합니다.

두 집단 간의 평균 차이를 검증하는거니,

독립표본 t-검정을 실시해야겠죠.

엑셀을 통해 독립표본 t-검정(t-test)을 하는 방법을 자세히 살펴보겠습니다.

[데이터] - [데이터 분석] 메뉴에 들어갑니다.

만약, [데이터 분석] 메뉴가 안 나타난다면,

아래 링크를 참조하세요.

데이터 분석 메뉴 만드는 방법

여러가지 분석 메뉴들이 나오는데요.

우선 t-검정(t-test)에 들어가기 앞서, 등분산검정을 해야 합니다.

따라서 "F-검정: 분산에 대한 두 집단"을 선택해주세요.

변수 1 입력 범위에는 A반의 점수가 있는 A열을,

변수 2 입력 범위에는 B반의 점수가 있는 B열을 선택해주세요.

그럼 단측검정 p값이 0.48248이 나왔는데,

양측검정의 p값은 0.48248에 2를 곱해주면 됩니다.

결국 p값이 0.96496이 나오네요.

등분산검정은 p값이 0.05보다 크면 등분산,

작으면 등분산이 아니라고 할 수 있는데,

0.05보다 훨씬 크게 나왔으니 등분산이라 할 수 있겠죠.

"t-검정: 등분산 가정 두집단"을 클릭합니다.

만약 등분산이 아니었다면, "t-검정: 이분산 가정 두집단"을 클릭해야 합니다.

A반과 B반의 점수가 입력되어 있는 범위를 선택해줍니다.

그럼 결과가 나오는데요.

양측검정 p값이 0.022756이 나왔네요.

p값이 0.05보다 작으므로,

결국 A반과 B반의 점수 차이는 통계적으로 유의하다고 할 수 있겠네요.

이런 방법으로 엑셀을 통해 t-검정(t-test)을 할 수가 있습니다.

어렵지 않죠?

이상 엑셀을 통한 t-검정(t-test) 방법에 대해 살펴보았습니다.

참고

엑셀로 카이제곱 검정

엑셀로 분산분석

엑셀로 상관계수 산출

엑셀로 회귀분석 하기

SPSS로 독립표본 t-검정 하기

2 표본 t-검정(two sample t-Test)은 두 모집단의 평균값이 동일한지 판별하는 검정이다.

2 표본 t-검정(two sample t-Test)을 해본다.

한 식물학자는 같은 열대 밀림에 서식하는 두 식물 종의 평균 높이가 같은지 아닌지 알고 싶다. 모든 종을 채취해서 높이를 측정하고 평균을 내는 일은 비효율적이었다. 그래서 20개의 표본을 채취하고 높이를 기록했다.

두 개의 서로 다른 모집단(popluation)에서 채취한 같은 크기(size)의 두 표본(sample)으로 두 종의 모집단(population)이 의 평균 높이가 같은지 t-검정(t-Test)으로 판별할 수 있다.

1단계: 두 표본의 분산(variance)가 같은지 알아본다.

2 표본 t-검정(two sample t-Test)을 하기 위해서, 선행작업으로 두 모집단(population)의 분산(variance)이 같은지 다른지 판별한다. 간략한 판별법으로 두 표본에 분산 값 중 큰 분산의 값이 작은 분산의 값에 4배가 되지 않으면 모집단(population)의 분산(variance)이 같다고 간주한다.

분산(variance)의 크기비율이 12.9/8.134 = 1.586 이므로 4보다 작다. 두 모집단(population)의 분산(variance)은 통계적으로 같다고 본다.

2단계: 2표본 t-검정(two sample t-Test)을 한다.

데이터 분석 툴에 들어가서 2표본 t-검정(two-sample t-Test)을 한다.

데이터 분석에 들어간다.

혹시 없다면, 데이터 분석 툴 업로드 하기 받아온다.

3단계: 데이터 분석 툴에서 분석한다.

t-Test 등분산 가정 두 집단을 선택하고 변수 1에 A2:A17, 변수 2에 B2:B17을 입력한다.

평균(Mean): 식물 1 표본의 평균 15.15, 식물 2 표본의 평균 15.8
분산(Variance): 식물 1 표본의 분산 8.134211, 식물 2 표본의 분산 12.90526
관측수(Observation): 표본의 수이다. 20
공동(Pooled) 분산: s²p= [ (n1-1) s^²₁+ (n2-1) s²₂ ] / (n1+n2-2)를 해서 구해진 변수 1, 변수 2의 공동(pooled)으로 구한 분산 값이다. 후에 t 통계량을 구할 때 쓰인다.
가설 평균 차(Hypothesized mean difference): 두 표본의 평균의 차이를 가정한 값이다. 여기서 '0' 값이다. 앞선 가정 선정에서 두 식물의 높이가 같은지 아닌지 알고 검정하기 때문이다.
자유도(dgrees of freedom): 20+20-2 = 38
t 통계량(t statistics): t = [ x1 – x2 ] / √ [ s^2p(1/n1 + 1/n2) ]에 의해 구해진다. 여기서는, t = [15.15-15.8] / √ [ 10.51974(1/20+1/20) ] = -0.63374.
P(T <=t) 양측 검정: 여기서 양측 검정(two-tailed t-Test)에 p-값(p-value)은 0.530047이다. 유의 수준에서 알파 값 0.05보다 크다. 그래서 가설을 기각할 수 없다. 두 식물종의 평균 높이가 다르다는 어떠한 통계적 근거를 제시하지 못한다.
t 기각치 양측 검정(t Critical Two-tail): 알파값 0.05, 자유도 38에서 t-기각치(t Critical value) 표에서 찾을 수 있는 값이다. 이 값은 2.024394. 통계 검정에서 구해진 t-통계량(t-statistic)은 -0.63374로 t-기각치 보다 작다. 이는 또한 가설을 기각할 수 없다. 그러므로, 두 식물종의 평균 높이가 다르다는 어떠한 통계적 근거를 제시하지 못한다.