본문 바로가기
반응형

통계12

[SAS 기초] 반복문 DO 사용법 오늘은 SAS의 반복문 DO 구문을 살펴보겠다. R이나 Python에는 for, while, until, repeat 등등 다양한 반복문 명령어가 존재하지만, SAS는 DO 어쩌구~만 입력하면 반복문을 수행해준다. 오늘은 다양한 DO 구문을 활용하여 구구단을 만들어보겠다! 1. DO i=start TO end BY by; 먼저 살펴볼 DO 구문의 첫 번째 용법은 시작점과 끝점 그리고 증가분을 지정하여 사용하는 방법이다. R과 Python등에서 사용되는 For문이라고 생각하면 이해가 쉬울 것 같다. DATA 데이터명; DO i = 초기값 TO 마지막값 BY 증가량; 반복시행문; OUTPUT; /* 반복시행 결과를 행으로 추가한다.*/ END; /* DO 구문을 종료하라는 명령어 - 반드시 DO 구문과 함께.. 2022. 5. 18.
[Preprocessing] Quantile Normalization Quantile Normalization 방법은 생물정보학에서 자주 사용되는 Microarray를 표준화하는 방법 중 하나이다. 이번 포스팅에서는 Quantile Normalization을 수행하는 방법과 R로 간단히 코드를 작성해보려고한다. 1. DNA Microarray 란? DNA Microarray란 흔히 DNA칩 혹은 바이오칩으로 알려져있으며, 고체 표면위에 매우 작은 DNA 조각들을 부착해 놓은 것을 말한다. 실험 대상의 유전자를 DNA 칩과 결합시켰을 때, 각 유전자들의 발현량을 수치화하여 자료를 얻게 되고 그 자료를 분석하여 병의 원인이나 이상 유전자등을 찾는데 사용된다. 이러한 Microarray data는 짧은 시간 내에 대량의 자료를 얻을 수 있다는 큰 장점이 있지만, 그만큼 다양한 .. 2022. 5. 16.
[SAS 기초] 조건문(WHERE ~ IF ELSE) 오늘은 SAS에서 조건문에 대해 공부해보겠다. 조건/반복문 공부를 위한 예제로 다음과 같은 데이터를 생성하였다. (데이터 생성 관련 코드는 이전 게시물을 참고!) 2022.03.23 - [Programming/SAS] - [SAS 기초] 데이터 생성과 처리 관련 구문 [SAS 기초] 데이터 생성과 처리 관련 구문 이번 포스팅에서는 SAS 기초 문법을 살펴보겠다. - 앞으로는 동일한 주제에 대해서 SAS, R, Python 버전으로 모두 포스팅 하려고 합니다. 3가지 버전으로 모두 포스팅이 완료되는대로 글 마지막에 링 harang3418.tistory.com 1. WHERE 구문 where 조건 구문은 조건에 맞는 데이터를 출력할 수 있도록 한다. 용법은 다음과 같다. DATA 라이브러리.새로운데이터명; .. 2022. 4. 26.
밀도 기반 군집 방법 - DBSCAN 오늘은 1996년 처음으로 제안된 밀도 기반 군집 방법, DBSCAN에 대해서 알아보겠다. ESTER, Martin, et al. A density-based algorithm for discovering clusters in large spatial databases with noise. In: kdd. 1996. p. 226-231. 1. Introduction DBSCAN (Density-Based Spatial Clustering of Applications with Noise)는 이름에서도 나타나있는 large spatial data에 적용하기 위해 제안된 군집 방법이다. Ester 등(1996)에 따르면 Large spatial data에 clustering algorithm을 적용하기 위해서.. 2022. 3. 10.
보조 혼합 샘플링을 이용한 베이지안 로짓 모형(Bayesian logit models with auiliary mixture sampling) 오랜만에 돌아온 논문 리뷰. 오늘은 드디어 게재된 나의 소중한 석사 논문을 리뷰해보려고 한다. (내가 쓰고, 내가 리뷰) Title : Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data Authors : Eun Hee Rhee, Beom Seuk Hwang 1. Introduction 로짓 모형(Logit model)은 범주형 자료를 분석할 때, 가장 일반적으로 사용되는 모형으로 잘 알려져있다. 이때, 로짓 모형의 모수를 추정하는 방법으로는 Frequentist의 MLE와 Bayesian에서의 MCMC를 고려할 수 있다. 베이지안 관점에서 로짓 모형에 대한 추론은 오랜 시간 연구되어 왔으며,.. 2022. 3. 7.
다양한 사전 분포 _ Prior distribution 저번 포스팅에서 Prior distribution에 대해 간략하게 언급했었고, 이번 포스팅에서는 prior distribution의 종류를 정리해 보려고 한다. 1. 사전 분포란 ? What is the prior distribution? 사전 분포란 베이지안 통계분석에서 등장하는 용어로, 데이터의 분포를 결정하는 모수 $\theta$ (parameter)에 대한 사전 정보를 나타내는 분포이다. 데이터를 관찰하기 이전에 이미 알고있는 정보를 나타낸다고 생각하면 된다. 예를 들어, 2021년 8월에 남자아이가 태어날 확률을 알고싶다면, 태어날 아이의 성별은 {여자, 남자}로 두 가지 경우만 존재하기 때문에, 남자아이가 태어날 확률이 $\cfrac{1}{2}$라고 생각해도 되지만, 우리가 지난 10년 간 8.. 2021. 1. 29.
반응형