1. SORT
cf> 이전에 BY와 함께 사용함 (참고 : https://intelligentcm.tistory.com/46)
0) 소개
기준 변수에 의해 결정되는 순서에 따라 데이터 SET 내의 관측 값을 재배열
1) 문법
※ <> 기호는 '내부에 무언가를 써도 되고 안 써도 된다는 옵션'이란 뜻
1> 기본 문법
- PROC SORT 'optinon-list' :
- BY <DESCENDING> variable : 아무 말이 없으면 변수(variable)을 오름차순으로 정렬
2> option-list
- DATA = SAS-data-set : 정렬할 dataset을 명시
- OUT = SAS-data-set : 결과를 저장할 다른 dataset을 명시
- OUT은 SORT 이외에도 쓸 수 있다.
- SORT를 하게 되면 원래 재배열한 것을 원래 data에 덮어쓴다.
2. GCHART
0) 소개
1> 그래프로 자료를 표현하려고 할 때 사용
2> 'GCHART'의 G는 graphic option을 사용한다는 뜻
3> 수치형 변수가 아니면 그릴 수 없다 -> 그래프 그려야 한다.
1) GChart의 결정사항
1> chart의 형태
2> chart의 변수
3> grouping 변수
2) 문법
1> 기본 문법
- PROC GCHART DATA = SAS-data-set : dataset 명시
- BY variable : (먼저 변수에 따라 sort하고) 변수(variable)별로 결과를 출력 ex> 성별이라면 남녀별로 결과 출력
- VBAR variable ... / option : 수직 막대 그래프를 그려라
- HBAR variable ... / option : 수평 막대 그래프를 그려라
- BLOCK variable ... / option : 3차원 볼록 그래프를 그려라
- PIE variable ... / option : 원형 그래프를 그려라
2> VBAR, HBAR, PIE에서 사용할 optiopn
- DISCRETE : 수치를 이산형으로 취급
- TYPE=FREQ ; PERCENT ; CFREQ ; CPERCENT ; SUM ; MEAN : 막대의 높이를 나타내 주는 값 지정
(VBAR의 경우 x에는 변수가 있지만 y에 변수가 설정될 때 어떠한 방식으로 표현할 지)
(FREQ와 PERCENT를 주로 사용)
- 자료가 하나일 때는 주로 FREQ 사용
- 자료가 2개 이상일 때에는 정확한 비교를 위해 PERCENT 사용
- SYMBOL='char' (거의 안 씀)
3> 예시
GCHART 에러!!!
- VBAR KIND / FREQ=COUNT TYPE=PERCENT
- VBAR KIND : KIND에 관해서 (SUB, CAR, BUS, SUB_BUS에 따라)
- / FREQ=COUNT : 이미 빈도를 COUNT에 저장해두어서 COUNT 변수를 FREQ에 설정
- TYPE = PERCENT : 그래서 첫 번째 그래프는 백분율로 나왔다.
- PIE KIND / FREQ=COUNT
cf> 옵션문
1> 단독 옵션이면 '/' 없이 사용
2> 아니면 '/'가 필요
'SAS' 카테고리의 다른 글
6-1강 - 자료의 정리 및 요약 1 (MEANS, UNIVARIATE) (0) | 2020.04.26 |
---|---|
5-2강 - SAS 기본 procedure 2 (PRINT, RANK) (0) | 2020.04.19 |
[통계 개념] 4강 - 여러가지 확률 분포 (0) | 2020.04.16 |
3-2강 - SAS data 단계 (변수의 외부 파일 출력, SAS dataset 출력, 설명 부여, SAS 연산자 및 함수) (FILE & PUT, OUTPUT, LABEL) (0) | 2020.04.08 |
3-1강 - SAS data 단계 (dataset 생성, datset 및 변수의 제어) (0) | 2020.03.21 |