SAS의 확률 밀도 함수들 특징
1) 이산형 분포와 연속형 분포의 공통점
1> 누적 분포를 계산해준다. (누적 분포로 표현 가능)
2) 차이점
1> 이산형 분포 : m이 parameter 중 맨 마지막에 온다. ex> probbnml(p, n, m)
2> 연속형 분포 : x가 parameter 중 맨 앞에 온다. ex>
1. 이산형 분포
2개 있다
1) 이항 분포
1> probnml(p, n, x) : X가 B(n, p) 분포를 따를 때, X가 x이하가 나올 확률
2> 줄임말 : probabilty binomial
2) 포아송 분포
1> possion(m, x) : X가 p(m)을 따를 때, X가 x이하일 확률
(평균이 m이다.)
2. 연속형 분포
1) 정규 분포
0> 표준 정규 분포에 관한 함수이다.
1> probnorm(z) : Z가 표준 정규 분포를 따를 때, Z가 z이하일 확률
(하지만 확률에 해당되는 x값을 구하는 것도 중요하다.) (그래서 아래 함수를 이용)
2> probit(p) : 'P(Z <= z) = p'를 만족하는 z 구하기
3> probnorm(z)과 probit(p)에 대한 설명
- 역함수 관계이다.
- 누적 확률을 대상으로 한다. (상위 확률이 아니다.)
2) 감마 분포
0> 세부 내용
- 감마 분포의 경우 β = 1인 경우를 주로 다루며 여기서도 그러하다.
- '1/β = λ'로 부르기도 함
1> probgam(x, a) : X가 Γ(a, 1)을 따를 때, X가 x이하일 확률
2> gaminv(p, a) : 'P(X <= x) = p'를 만족하는 x 구하기
cf> 여기까지 모델링할 때 배운 분포
표본들로 이루어진 분포 3가지 배움
카이제곱, T-분포, F-분포
cf> 표본 분포
3) T-분포
cf> 사전 지식
- 독립된 표준 정규 분포들(n개)의 제곱의 합 => 자유도가 n인 카이제곱
- 독립된 정규 분포들이
1> probt(t, df) : 자유도가 df인 T-분포의 누적확률
2> tinv(p, df) : 자유도가 df인 T-분포일 때, 누적확률 p를 가지는 x의 값
4) 카이 제곱 분포 (χ2 분포)
0> α = k/2, β = 2인 감마 분포
1> probchi(x, df) : 자유도가 df인 카이 제곱 분포의 누적 확률
2> cinv(p, df) : 자유도가 df일 때 카이 제곱 분포일 때, 누적확률 p를 가지는 x의 값
3> 카이제곱 만드는 법
- 독립된 표준 정규 분포들의 n개의 제곱 합
- (n-1)S^2 / σ^2 ~ χ2(n-1)
5) F-분포
0> F-분포
1> probf(x, df)
2> finv(p, df)
'SAS' 카테고리의 다른 글
5-2강 - SAS 기본 procedure 2 (PRINT, RANK) (0) | 2020.04.19 |
---|---|
5-1강 - SAS 기본 procedure 1 (SORT, GCHART) (0) | 2020.04.16 |
3-2강 - SAS data 단계 (변수의 외부 파일 출력, SAS dataset 출력, 설명 부여, SAS 연산자 및 함수) (FILE & PUT, OUTPUT, LABEL) (0) | 2020.04.08 |
3-1강 - SAS data 단계 (dataset 생성, datset 및 변수의 제어) (0) | 2020.03.21 |
[통계 개념] 2강 - Data의 요약 및 표현 (0) | 2020.03.21 |