본문 바로가기

SAS

[통계 개념] 4강 - 여러가지 확률 분포

SAS의 확률 밀도 함수들 특징

1) 이산형 분포와 연속형 분포의 공통점

1> 누적 분포를 계산해준다. (누적 분포로 표현 가능)

2) 차이점

1> 이산형 분포 : m이 parameter 중 맨 마지막에 온다. ex> probbnml(p, n, m)

2> 연속형 분포 : x가 parameter 중 맨 앞에 온다. ex> 

 

1. 이산형 분포

2개 있다

1) 이항 분포

1> probnml(p, n, x) : X가 B(n, p) 분포를 따를 때, X가 x이하가 나올 확률

2> 줄임말 : probabilty binomial

2) 포아송 분포

1> possion(m, x) : X가 p(m)을 따를 때, X가 x이하일 확률

(평균이 m이다.)

 

 


 

2. 연속형 분포

1) 정규 분포

0> 표준 정규 분포에 관한 함수이다.

1> probnorm(z) : Z가 표준 정규 분포를 따를 때, Z가 z이하일 확률

(하지만 확률에 해당되는 x값을 구하는 것도 중요하다.) (그래서 아래 함수를 이용)

2> probit(p) : 'P(Z <= z) = p'를 만족하는 z 구하기

3> probnorm(z)과 probit(p)에 대한 설명

- 역함수 관계이다.

- 누적 확률을 대상으로 한다. (상위 확률이 아니다.)

 

2) 감마 분포

0> 세부 내용

- 감마 분포의 경우 β = 1인 경우를 주로 다루며 여기서도 그러하다.

- '1/β = λ'로 부르기도 함

 

1> probgam(x, a) : X가 Γ(a, 1)을 따를 때, X가 x이하일 확률

2> gaminv(p, a) : 'P(X <= x) = p'를 만족하는 x 구하기

 

cf> 여기까지 모델링할 때 배운 분포

표본들로 이루어진 분포 3가지 배움

카이제곱, T-분포, F-분포

 

cf> 표본 분포

 

3) T-분포

cf> 사전 지식

- 독립된 표준 정규 분포들(n개)의 제곱의 합 => 자유도가 n인 카이제곱

- 독립된 정규 분포들이

1> probt(t, df) : 자유도가 df인 T-분포의 누적확률

2> tinv(p, df) : 자유도가 df인 T-분포일 때, 누적확률 p를 가지는 x의 값

 

4) 카이 제곱 분포 (χ2 분포)

0> α = k/2, β = 2인 감마 분포 

1> probchi(x, df) : 자유도가 df인 카이 제곱 분포의 누적 확률

2> cinv(p, df) : 자유도가 df일 때 카이 제곱 분포일 때, 누적확률 p를 가지는 x의 값

3> 카이제곱 만드는 법

- 독립된 표준 정규 분포들의 n개의 제곱 합

- (n-1)S^2 / σ^2 ~ χ2(n-1)

 

5) F-분포

0> F-분포

1> probf(x, df)

2> finv(p, df)