반응형
두가지 값에 대한 비교 검증을 통해 데이터들의 유의미한 차이가 있는지 확인하는 p - value 값을 엑셀을 이용하여 쉽고 빠르게 확인해볼까요?

안녕하세요~
실험을 하면서 데이터 비교는 필수죠. 그때마다 유의성 검사를 통해 p-value 값을 그래프상에 표시하는 것이 중요한 만큼 값을 구하는 것을 찾으시는 분들이 많을 것 같아 이렇게 글을 쓰게 되었습니다.
하나씩 차근차근 하면 어느새 결과 값을 구할 수 있을거에요.
시작!
1. 엑셀을 우선 셋팅해서 t-test를 할 수 있는 환경을 만들어줍니다.
파일 → 더보기 → 옵션 → 추가기능 → 관리에서 추가기능 선택되어있는지 확인 → 확인 버튼 클릭(창 자동 닫힘)

2. 1번에 이어서 개발도구 카테고리에서 excel 추가 기능을 확인해줍니다.
개발도구 탭 → Excel 추가기능 → 체크 박스 모두 체크 → 확인버튼 클릭(창 자동 닫힘)

여기서 잠깐 등분산과 이분산의 정의에 대해 짚고 넘어가봅시다.

※ 용어 정리
분산(Variance)이란?
: data의 퍼져있는 정도를 의미합니다.
등분산(Homogeneity of variance)이란?
: 2개의 모집단(Population)에서 추출된 각 sample 간의 분산이 같은 경우를 의미합니다.
이분산(Heteroscedasticity of variance)이란?
: 2개의 모집단(Population)에서 추출된 각 sample 간의 분산이 다른 경우를 의미합니다.

3. 이제 t-test 를 하기 전에 F 검정을 통해 등분산 또는 이분산 여부를 확인해줍니다.
데이터 탭 → 데이터 분석 → F-검정: 분산에 대한 두 집단 클릭 → 확인버튼 클릭(창 자동 닫힘)

4. F-검정의 범위를 선택하여 값을 도출해 줍니다.
변수 입력범위 드레그하여 설정 → 값 도출하여 표시할 Cell 선택 → 유의수준은 0.05 기입 → 확인

5. 도출된 값을 확인하였을때 단측검정 값만 나오므로 양측검정 값을 도출해 줍니다.
이때, 값이 0.05 이상일 경우, 등분산 가정 두집단을 수행합니다.
값에서 P(F<=f) 단측 검정 값을 확인 → 빈 Cell에 단측 검정 값의 *2 값 계산하여 값 확인 → 값이 0.05 이상은 등분산, 0.05 미만은 이분산 수행 결정. 아래의 예시에서는 0.75 즉, 0.05이상 값임으로 등분산 수행

6. 4번 방법과 동일하게 t-test를 수행하되 0.05 값 이상이므로 등분산을 수행합니다.
4번 방법과 동일하게 진행 → t-검정 등분산 가정 두집단을 비교하였을때 P(T<=t) 양측 검정 값을 확인 → 이때 p값이 0.05 이하는 유의미한 차이가 있는 것으로 확인

7. 마지막으로 p value에 따른 유의성 의미를 확인하여 그래프에 표시해줍니다.
기호 | 유의성 의미 |
ns | p > 0.05 |
* | p ≤ 0.05 |
** | p ≤ 0.01 |
*** | p ≤ 0.001 |
엑셀로 t test 해보는것 어렵지 않답니다.
많은 도움이 되길 바라며 저는 또 다른 주제로 찾아오겠습니다.

반응형
'실험 정보' 카테고리의 다른 글
[실험 정보] 실험 기초 정복 ppm to percent, ppm to concentration, 농도 계산 (0) | 2024.04.24 |
---|---|
[실험 정보] 실험 기초 정복 몰 농도 계산(개념, 공식, 예시) (0) | 2023.03.27 |
[실험 정보] 실험 기초 정복 Serial dilution (0) | 2023.03.26 |
[실험 정보] Real-time PCR 결과 해석 발현량 보정(House keeping gene) (2) | 2023.03.26 |
[실험 정보] Real-time PCR 용어 정리(feat. 실험 안될 때 해결 방법) (0) | 2023.03.16 |