본문 바로가기
반응형

전체 글35

[SAS 기초] Informat / Format 오늘은 SAS에서 데이터의 입력 형식과 출력 형식을 지정할 수 있는 Informat/Format 구문을 공부해보자. 1. Informat / Format SAS에서는 변수를 처리할 때 단순히 숫자, 문자, 날짜의 형태로만 받아들이지않고, 굉장히 세부적으로 변수의 입력 형식, 출력 형식을 지정할 수 있다. SAS엔 변수의 입/출력 형식을 지정하는 Informat-Format 구문이 존재한다. 두 구문의 용법과 차이는 다음과 같다. INFORMAT : 데이터의 입력 형식을 지정하는 구문, DATA step에서만 사용할 수 있다. (용법) INFORMAT var.name format; FORMAT : 데이터의 출력 형식을 지정하는 구문, DATA와 PROC step에서 모두 사용할 수 있다. (용법) FORM.. 2022. 5. 26.
[SAS 기초] 데이터 정렬 및 병합 구문 (SORT/MERGE/SET) 데이터를 분석하다보면 두 개이상의 데이터 셋을 Key변수를 기준으로 결합해야하는 경우가 종종 있다. 오늘은 여러가지 병합 방법과 SAS를 사용해 병합을 수행하는 법을 살펴보겠다. 1. SORT 구문 데이터를 병합하기 전에는 병합의 기준이 될 Key 변수를 먼저 정렬해야한다. SAS에서 정렬은 PROC SORT 명령어를 사용해 수행할 수 있다. PROC SORT data=라이브러리명.데이터명 out = 새 데이터명; /* 정렬한 데이터를 새로운 데이터로 만들고 싶을 때, out 옵션을 사용. */ BY key descending; /* 내림차순으로 정렬하고 싶을 때만 descending 추가 */ RUN; SORT 구문을 사용하여 아래의 데이터 셋 A와 B를 각각 ID를 기준으로 정렬해보자. proc so.. 2022. 5. 19.
[SAS 기초] 반복문 DO 사용법 오늘은 SAS의 반복문 DO 구문을 살펴보겠다. R이나 Python에는 for, while, until, repeat 등등 다양한 반복문 명령어가 존재하지만, SAS는 DO 어쩌구~만 입력하면 반복문을 수행해준다. 오늘은 다양한 DO 구문을 활용하여 구구단을 만들어보겠다! 1. DO i=start TO end BY by; 먼저 살펴볼 DO 구문의 첫 번째 용법은 시작점과 끝점 그리고 증가분을 지정하여 사용하는 방법이다. R과 Python등에서 사용되는 For문이라고 생각하면 이해가 쉬울 것 같다. DATA 데이터명; DO i = 초기값 TO 마지막값 BY 증가량; 반복시행문; OUTPUT; /* 반복시행 결과를 행으로 추가한다.*/ END; /* DO 구문을 종료하라는 명령어 - 반드시 DO 구문과 함께.. 2022. 5. 18.
[Preprocessing] Quantile Normalization Quantile Normalization 방법은 생물정보학에서 자주 사용되는 Microarray를 표준화하는 방법 중 하나이다. 이번 포스팅에서는 Quantile Normalization을 수행하는 방법과 R로 간단히 코드를 작성해보려고한다. 1. DNA Microarray 란? DNA Microarray란 흔히 DNA칩 혹은 바이오칩으로 알려져있으며, 고체 표면위에 매우 작은 DNA 조각들을 부착해 놓은 것을 말한다. 실험 대상의 유전자를 DNA 칩과 결합시켰을 때, 각 유전자들의 발현량을 수치화하여 자료를 얻게 되고 그 자료를 분석하여 병의 원인이나 이상 유전자등을 찾는데 사용된다. 이러한 Microarray data는 짧은 시간 내에 대량의 자료를 얻을 수 있다는 큰 장점이 있지만, 그만큼 다양한 .. 2022. 5. 16.
[SAS 기초] 조건문(WHERE ~ IF ELSE) 오늘은 SAS에서 조건문에 대해 공부해보겠다. 조건/반복문 공부를 위한 예제로 다음과 같은 데이터를 생성하였다. (데이터 생성 관련 코드는 이전 게시물을 참고!) 2022.03.23 - [Programming/SAS] - [SAS 기초] 데이터 생성과 처리 관련 구문 [SAS 기초] 데이터 생성과 처리 관련 구문 이번 포스팅에서는 SAS 기초 문법을 살펴보겠다. - 앞으로는 동일한 주제에 대해서 SAS, R, Python 버전으로 모두 포스팅 하려고 합니다. 3가지 버전으로 모두 포스팅이 완료되는대로 글 마지막에 링 harang3418.tistory.com 1. WHERE 구문 where 조건 구문은 조건에 맞는 데이터를 출력할 수 있도록 한다. 용법은 다음과 같다. DATA 라이브러리.새로운데이터명; .. 2022. 4. 26.
[Python 기초] 데이터 객체 생성 및 처리 관련 구문 이번 포스팅에서는 데이터 생성 및 처리에 관련한 Python 기초 구문들을 살펴보겠다. * 사용 환경 필자는 Python 프로그래밍을 위해 Jupyter notebook을 사용하고있다. (주변에 파이썬을 자주 사용하시는 분들은 Visual studio를 많이 사용하시던데,, 필자는 익숙한게 Jupyter notebook이라 그냥 사용 중..ㅎㅎ) * 파이썬 라이브러리란? 파이썬에는 R의 pacakge와 마찬가지로 다양하고 유용한 함수들을 포함하고 있는 라이브러리가 존재한다. 특정 라이브러리는 import 구문을 사용하여 불러 올 수 있으며, 라이브러리 내장 함수를 사용하고 싶을 경우, 라이브러리명.함수명()으로 사용하면 된다. 예를 들어, 라이브러리 numpy 안에 있는 mean()함수를 사용하여 주어진.. 2022. 4. 14.
반응형