본문 바로가기

SAS

5-1강 - SAS 기본 procedure 1 (SORT, GCHART)

1. SORT

cf> 이전에 BY와 함께 사용함 (참고 : https://intelligentcm.tistory.com/46)

0) 소개

기준 변수에 의해 결정되는 순서에 따라 데이터 SET 내의 관측 값을 재배열

1) 문법

※ <> 기호는 '내부에 무언가를 써도 되고 안 써도 된다는 옵션'이란 뜻

1> 기본 문법

- PROC SORT 'optinon-list'

- BY <DESCENDING> variable : 아무 말이 없으면 변수(variable)을 오름차순으로 정렬

2> option-list

- DATA = SAS-data-set : 정렬할 dataset을 명시

- OUT = SAS-data-set : 결과를 저장할 다른 dataset을 명시

  • OUT은 SORT 이외에도 쓸 수 있다.
  • SORT를 하게 되면 원래 재배열한 것을 원래 data에 덮어쓴다.

 

 


 

2. GCHART

0) 소개

1> 그래프로 자료를 표현하려고 할 때 사용

2> 'GCHART'의 G는 graphic option을 사용한다는 뜻

3> 수치형 변수가 아니면 그릴 수 없다 -> 그래프 그려야 한다.

 

1) GChart의 결정사항

1> chart의 형태

2> chart의 변수

3> grouping 변수

 

2) 문법

1> 기본 문법

- PROC GCHART DATA = SAS-data-set : dataset 명시

- BY variable : (먼저 변수에 따라 sort하고) 변수(variable)별로 결과를 출력 ex> 성별이라면 남녀별로 결과 출력

- VBAR variable ... / option : 수직 막대 그래프를 그려라

- HBAR variable ... / option : 수평 막대 그래프를 그려라

- BLOCK variable ... / option : 3차원 볼록 그래프를 그려라

- PIE variable ... / option : 원형 그래프를 그려라

 

2> VBAR, HBAR, PIE에서 사용할 optiopn

- DISCRETE : 수치를 이산형으로 취급

- TYPE=FREQ ; PERCENT ; CFREQ ; CPERCENT ; SUM ; MEAN : 막대의 높이를 나타내 주는 값 지정

(VBAR의 경우 x에는 변수가 있지만 y에 변수가 설정될 때 어떠한 방식으로 표현할 지)

(FREQ와 PERCENT를 주로 사용)

  • 자료가 하나일 때는 주로 FREQ 사용
  • 자료가 2개 이상일 때에는 정확한 비교를 위해 PERCENT 사용

- SYMBOL='char' (거의 안 씀)

 

3> 예시

GCHART 에러!!!

- VBAR KIND / FREQ=COUNT TYPE=PERCENT

  •  VBAR KIND : KIND에 관해서 (SUB, CAR, BUS, SUB_BUS에 따라)
  • / FREQ=COUNT : 이미 빈도를 COUNT에 저장해두어서 COUNT 변수를 FREQ에 설정
  • TYPE = PERCENT : 그래서 첫 번째 그래프는 백분율로 나왔다. 

- PIE KIND / FREQ=COUNT

 

cf> 옵션문

1> 단독 옵션이면 '/' 없이 사용

2> 아니면 '/'가 필요