실험 정보

[실험 정보] 통계 검정 엑셀로 t- test 및 p-value 값 구하기

몽이 researcher 2024. 8. 15. 00:55
반응형

두가지 값에 대한 비교 검증을 통해 데이터들의 유의미한 차이가 있는지 확인하는 p - value 값을 엑셀을 이용하여 쉽고 빠르게 확인해볼까요?

안녕하세요~ 

실험을 하면서 데이터 비교는 필수죠. 그때마다 유의성 검사를 통해 p-value 값을 그래프상에 표시하는 것이 중요한 만큼 값을 구하는 것을 찾으시는 분들이 많을 것 같아 이렇게 글을 쓰게 되었습니다. 

 

하나씩 차근차근 하면 어느새 결과 값을 구할 수 있을거에요.

 

 

 

시작!

 

 

1. 엑셀을 우선 셋팅해서 t-test를 할 수 있는 환경을 만들어줍니다. 

파일 → 더보기 → 옵션 → 추가기능 → 관리에서 추가기능 선택되어있는지 확인 → 확인 버튼 클릭(창 자동 닫힘)

t-test, p-value 구하기 1 - 엑셀 설정
t-test, p-value 구하기 1 - 엑셀 설정

 

 

2.  1번에 이어서 개발도구 카테고리에서 excel 추가 기능을 확인해줍니다.

개발도구 탭 → Excel 추가기능 → 체크 박스 모두 체크 → 확인버튼 클릭(창 자동 닫힘)

 

t-test, p-value 구하기 2 - 엑셀 설정

 

 

여기서 잠깐 등분산과 이분산의 정의에 대해 짚고 넘어가봅시다.

※ 용어 정리

분산(Variance)이란?
: data의 퍼져있는 정도를 의미합니다. 

등분산(Homogeneity of variance)이란?
: 2개의 모집단(Population)에서 추출된 각 sample 간의 분산이 같은 경우를 의미합니다.

이분산(Heteroscedasticity of variance)이란?
: 2개의 모집단(Population)에서 추출된 각 sample 간의 분산이 다른 경우를 의미합니다. 

 

등분산과 이분산
등분산과 이분산 (출처: http://elearning.kocw.net/contents4/document/lec/2012/KonKuk_glocal/Eomgwangmoon/3.pdf)

 

3. 이제 t-test 를 하기 전에 F 검정을 통해 등분산 또는 이분산 여부를 확인해줍니다. 

데이터 탭 → 데이터 분석 → F-검정: 분산에 대한 두 집단 클릭 → 확인버튼 클릭(창 자동 닫힘)

t-test, p-value 구하기 3 - F 검정
t-test, p-value 구하기 3 - F 검정

 

 

4. F-검정의 범위를 선택하여 값을 도출해 줍니다.

변수 입력범위 드레그하여 설정 → 값 도출하여 표시할 Cell 선택 → 유의수준은 0.05 기입 → 확인

t-test, p-value 구하기 4 - F 검정
t-test, p-value 구하기 4 - F 검정

 

 

5. 도출된 값을 확인하였을때 단측검정 값만 나오므로 양측검정 값을 도출해 줍니다. 

    이때, 값이 0.05 이상일 경우,  등분산 가정 두집단을 수행합니다. 

값에서 P(F<=f) 단측 검정 값을 확인 → 빈 Cell에 단측 검정 값의 *2 값 계산하여 값 확인 → 값이 0.05 이상은 등분산, 0.05 미만은 이분산 수행 결정. 아래의 예시에서는 0.75 즉, 0.05이상 값임으로 등분산 수행

t-test, p-value 구하기 5 - 등분산, 이분산 여부 확인
t-test, p-value 구하기 5 - 등분산, 이분산 여부 확인

 

 

6. 4번 방법과 동일하게  t-test를 수행하되 0.05 값 이상이므로 등분산을 수행합니다.

4번 방법과 동일하게 진행 → t-검정 등분산 가정 두집단을 비교하였을때 P(T<=t) 양측 검정 값을 확인 → 이때 p값이 0.05 이하는 유의미한 차이가 있는 것으로 확인

t-test, p-value 구하기 6- t-test
t-test, p-value 구하기 6- t-test

 

7. 마지막으로 p value에 따른 유의성 의미를 확인하여 그래프에 표시해줍니다.

기호 유의성 의미
ns p > 0.05
* p ≤ 0.05
** p ≤ 0.01
*** p ≤ 0.001

 

 

 

 

엑셀로 t test 해보는것 어렵지 않답니다.

많은 도움이 되길 바라며 저는 또 다른 주제로 찾아오겠습니다. 

 

반응형