독립성을 어떻게 판단?
독립인 상황 - 1반과 2반의 비교
=> (지난 8-3강) 먼저 σ1, σ2가 같은지 본다 (2가지 경우로 또 나뉨) → (2가지 경우 모두)PROC TTEST로 확인.
(8-3강 : https://intelligentcm.tistory.com/146)
독립이 아닌 상황 - 1반의 1개월 전과 1반의 현재 비교
=> (이번 8-4강)
8. 독립이 아닌 두 모집단에 대한 검정
0) 독립 표본에 의한 두 모평균의 비교 - 독립 표본 t-검정
(8-3강 : https://intelligentcm.tistory.com/146)
1) 쌍 관측에 의한 두 모평균의 비교 - 대응 표본 t-검정
1> 조건 (정규성 가정은 있지만 독립성이 빠짐)
- 모두 정규 분포에서 추출된 확률 표본(X_1~X_m, Y_1~Y_n)이다.
2> 문제와 해결
- 문제 : 독립이 아니면 X^-Y^가 정규 분포가 안 된다.
→ X_i와 Y_i가 한 사람에게 나왔다고 생각하고 한 쌍으로 묶는다.
→ 'D_i = X_i - Y_i' 인 새로운 변수를 만든다. → S_D^2 = D_i들의 표본분산
→ 이제 변수가 D_i로 하나만 있다.
→ 일표본 검정 : PROC UNIVARIATE, TTEST
- 총 자료는 2n개이지만 이들을 짝으로 만들었기 때문에 자유도는 n-1이다.
3> 신뢰구간
4> 검정
3) μ1-μ2에 관한 검정 방법 총정리
X_1, ..., X_m, Y_1, ..., Y_n의 독립성 check (by 맨 위에서 얘기한 data의 성질로 판단)
1> 독립인 경우 (이표본 t-검정)
PROC TTEST 에서 class와 var를 설정한다.
2> 독립이 아닌 경우
D_i = X_i - Y_i
9. 독립이 아닌 두 모집단에 대한 검정 실습
1) 쌍 관측에 의한 두 모평균의 비교 - 대응 표본 t-검정
1> PROC TTEST
- paired라는 명령어를 이용해서 X_i와 Y_i를 결정할 수 있다.
- PROC TTEST data=SAS-dataset;
- paired X_i*Y_i : X_i와 Y_i를 결정하고 짝지어준다. (사실 짝은 위에 data 만드는 과정에서 나란히 적어주면 된다.)
2> 예시 1
DATA paired;
INPUT id pretest posttest @@;
CARDS;
01 80 82 02 73 71 03 70 95 04 60 69 05 88 100
06 84 71 07 65 75 08 37 60 09 91 95 10 98 99
11 52 65 12 78 83 13 40 60 14 79 86 15 59 62
;
RUN;
proc ttest data= paired;
paired pretest*posttest;
run;
- Difference = pretest - posttest : Difference라는 새로운 확률 변수를 만들었다.
- H0 설정을 하지 않으면 default로 δ0가 0으로 설정된다.
- 3번째 box (default로 δ0가 0으로 설정된 듯)
[양측 검정 유의 확률] = 'Pr > |t|' = p0 = 0.0079
[t-Value(t0)] = -3.09 < 0
→ t-Value(t0)가 0보다 작으므로 검정통계량 t-Value(t0)가 왼쪽으로 치우침
→
우측 검정 유의 확률 = 1-p0/2 = 0.99...
좌측 검정 유의 확률 = p0/2 = 0.0039...
- 양측 검정 유의 확률 = 0.0079 → '귀무 가설 : 점수 차이가 일정δ0 이하'를 기각할 수 있다.
- 좌측 검정 유의 확률 = 0.0039 → '귀무 가설 : μ1 − μ2이 일정δ0 이상'를 기각할 수 있다.
- 우측 검정 유의 확률 = 0.0039 → '귀무 가설 : μ1 − μ2이 일정δ0 이하'를 기각할 수 없다.
3> 예시 2
DATA paired;
INPUT id pretest posttest @@;
d=pretest-posttest;
CARDS;
01 80 82 02 73 71 03 70 95 04 60 69 05 88 100
06 84 71 07 65 75 08 37 60 09 91 95 10 98 99
11 52 65 12 78 83 13 40 60 14 79 86 15 59 62
;
RUN;
proc ttest data= paired;
var d; /*paired pretest*posttest;를 변경함*/
run;
'SAS' 카테고리의 다른 글
9-1강 - 범주형 자료의 분석 (0) | 2020.06.08 |
---|---|
[통계 개념&SAS] 8-5강 - 모비율 차에 대한 검정 (0) | 2020.06.08 |
[통계 개념&SAS] 8-3강 - 가설 검정 (독립인 모집단이 2개인 경우) (0) | 2020.05.12 |
[통계 개념&SAS] 8-2강 - 유의 확률 (p-value) (0) | 2020.05.07 |
[통계 개념&SAS] 8-1강 - 가설 검정 (단일 표본) (0) | 2020.05.07 |