728x90 전체 글42 [Python 기초] 데이터 객체 생성 및 처리 관련 구문 이번 포스팅에서는 데이터 생성 및 처리에 관련한 Python 기초 구문들을 살펴보겠다. * 사용 환경 필자는 Python 프로그래밍을 위해 Jupyter notebook을 사용하고있다. (주변에 파이썬을 자주 사용하시는 분들은 Visual studio를 많이 사용하시던데,, 필자는 익숙한게 Jupyter notebook이라 그냥 사용 중..ㅎㅎ) * 파이썬 라이브러리란? 파이썬에는 R의 pacakge와 마찬가지로 다양하고 유용한 함수들을 포함하고 있는 라이브러리가 존재한다. 특정 라이브러리는 import 구문을 사용하여 불러 올 수 있으며, 라이브러리 내장 함수를 사용하고 싶을 경우, 라이브러리명.함수명()으로 사용하면 된다. 예를 들어, 라이브러리 numpy 안에 있는 mean()함수를 사용하여 주어진.. 2022. 4. 14. [R 기초] 데이터 객체 생성 및 처리 관련 구문 이번 포스팅에서는 '데이터 객체 생성 및 처리 관련 구문'에 대한 R 기초 문법을 살펴보겠다. - 동일한 주제에 대한 SAS,Python 포스팅을 보고싶으시다면 아래 링크를 참고해주세요- * 사용 환경 필자는 R 프로그래밍을 위해 R studio(R version 4.0.2)를 사용하고있다. 참고로, R version 4.0.x에서 특정 패키지들을 사용하기 위해선 R tools 40 설치가 필수적인데, 필자는 처음에 설치를 제대로 하지 못해서 많이 애를 먹었다..ㅠㅠ 혹시 나와같은 실패를 겪고있을 분들을 위해, 필자가 참고했던 좋은 영상 링크를 걸어둘테니 필요하신 분들은 꼭 참고해 보시길! https://youtu.be/F5LYjvLxNJw 1. 워킹 디렉토리 설정(Working Directory) R에.. 2022. 3. 25. [SAS 기초] 데이터 생성과 처리 관련 구문 이번 포스팅에서는 SAS 기초 문법을 살펴보겠다. - 앞으로는 동일한 주제에 대해서 SAS, R, Python 버전으로 모두 포스팅 하려고 합니다. 3가지 버전으로 모두 포스팅이 완료되는대로 글 마지막에 링크를 걸어둘테니 다른 프로그램 버전이 보고싶으시다면 아래 링크를 참고해주세요. - * 사용 환경 필자는 SAS 프로그래밍을 위해 SAS OnDemand for Academics을 사용하고 있다. SAS에서 학습용으로 무료로 사용할 수 있도록 만들어준 SAS studio 환경이다. https://welcome.oda.sas.com/home SAS OnDemand for Academics welcome.oda.sas.com 위 링크에서 이메일로 간단히 프로필을 설정한 뒤, sas studio를 누르면 자유.. 2022. 3. 23. 표본 샘플링 방법(2) - 메트로폴리스-헤이스팅스 알고리즘(Metropolis-Hastings Algorithm) 저번 rejection sampling에 이어 이번 포스팅에서도 타겟 분포로부터 표본을 생성해낼 수 있는 샘플링 알고리즘 중 하나인 M-H Algorithm을 살펴보겠다. 2022.03.14 - [Statistics/Bayesian With Python] - 표본 샘플링 방법(1) - 기각 샘플링(Rejection Sampling) 표본 샘플링 방법(1) - 기각 샘플링(Rejection Sampling) Bayesian과 Frequentist들의 가장 큰 차이점은 모수, parameter에 대한 관점의 차이이다. Frequentist들은 모수 $\theta$를 Unknown constant로 가정하며, Bayesian은 모수 $\theta$를 Random variable로 가정한다.. harang341.. 2022. 3. 16. 표본 샘플링 방법(1) - 기각 샘플링(Rejection Sampling) Bayesian과 Frequentist들의 가장 큰 차이점은 모수, parameter에 대한 관점의 차이이다. Frequentist들은 모수 $\theta$를 Unknown constant로 가정하며, Bayesian은 모수 $\theta$를 Random variable로 가정한다. 때문에, 대표적인 Frequentist의 방법인 MLE처럼 표본 $x$에 의해 값(ex, $\hat{\theta} = \cfrac{\sum_{i=1}^{N}x_i}{N}$)으로 계산되는 것과 달리, Bayesian에서 모수 $\theta$는 확률 분포를 갖게된다. 따라서, Bayesian 접근법에서는 모수를 추정하기 위해 모수의 사후 분포(posterior distribution)에서 표본을 생성하게 된다. 그러나 종종 모수.. 2022. 3. 14. 밀도 기반 군집 방법 - DBSCAN 오늘은 1996년 처음으로 제안된 밀도 기반 군집 방법, DBSCAN에 대해서 알아보겠다. ESTER, Martin, et al. A density-based algorithm for discovering clusters in large spatial databases with noise. In: kdd. 1996. p. 226-231. 1. Introduction DBSCAN (Density-Based Spatial Clustering of Applications with Noise)는 이름에서도 나타나있는 large spatial data에 적용하기 위해 제안된 군집 방법이다. Ester 등(1996)에 따르면 Large spatial data에 clustering algorithm을 적용하기 위해서.. 2022. 3. 10. 이전 1 ··· 3 4 5 6 7 다음 320x100