본문 바로가기
반응형

Statistics10

표본 샘플링 방법(3) - 깁스 샘플링(Gibbs Sampling) 이번 포스팅에서는 베이지안에서 연구되었던 샘플링 방법 중 가장 이상적인(?) 샘플링 방법인 깁스 샘플링에 대해서 살펴보겠다. - 이전 포스팅- 2022.03.14 - [Statistics/Bayesian With Python] - 표본 샘플링 방법(1) - 기각 샘플링(Rejection Sampling) 표본 샘플링 방법(1) - 기각 샘플링(Rejection Sampling) Bayesian과 Frequentist들의 가장 큰 차이점은 모수, parameter에 대한 관점의 차이이다. Frequentist들은 모수 $\theta$를 Unknown constant로 가정하며, Bayesian은 모수 $\theta$를 Random variable로 가정한다.. harang3418.tistory.com 20.. 2023. 6. 1.
표본 샘플링 방법(2) - 메트로폴리스-헤이스팅스 알고리즘(Metropolis-Hastings Algorithm) 저번 rejection sampling에 이어 이번 포스팅에서도 타겟 분포로부터 표본을 생성해낼 수 있는 샘플링 알고리즘 중 하나인 M-H Algorithm을 살펴보겠다. 2022.03.14 - [Statistics/Bayesian With Python] - 표본 샘플링 방법(1) - 기각 샘플링(Rejection Sampling) 표본 샘플링 방법(1) - 기각 샘플링(Rejection Sampling) Bayesian과 Frequentist들의 가장 큰 차이점은 모수, parameter에 대한 관점의 차이이다. Frequentist들은 모수 $\theta$를 Unknown constant로 가정하며, Bayesian은 모수 $\theta$를 Random variable로 가정한다.. harang341.. 2022. 3. 16.
표본 샘플링 방법(1) - 기각 샘플링(Rejection Sampling) Bayesian과 Frequentist들의 가장 큰 차이점은 모수, parameter에 대한 관점의 차이이다. Frequentist들은 모수 $\theta$를 Unknown constant로 가정하며, Bayesian은 모수 $\theta$를 Random variable로 가정한다. 때문에, 대표적인 Frequentist의 방법인 MLE처럼 표본 $x$에 의해 값(ex, $\hat{\theta} = \cfrac{\sum_{i=1}^{N}x_i}{N}$)으로 계산되는 것과 달리, Bayesian에서 모수 $\theta$는 확률 분포를 갖게된다. 따라서, Bayesian 접근법에서는 모수를 추정하기 위해 모수의 사후 분포(posterior distribution)에서 표본을 생성하게 된다. 그러나 종종 모수.. 2022. 3. 14.
밀도 기반 군집 방법 - DBSCAN 오늘은 1996년 처음으로 제안된 밀도 기반 군집 방법, DBSCAN에 대해서 알아보겠다. ESTER, Martin, et al. A density-based algorithm for discovering clusters in large spatial databases with noise. In: kdd. 1996. p. 226-231. 1. Introduction DBSCAN (Density-Based Spatial Clustering of Applications with Noise)는 이름에서도 나타나있는 large spatial data에 적용하기 위해 제안된 군집 방법이다. Ester 등(1996)에 따르면 Large spatial data에 clustering algorithm을 적용하기 위해서.. 2022. 3. 10.
보조 혼합 샘플링을 이용한 베이지안 로짓 모형(Bayesian logit models with auiliary mixture sampling) 오랜만에 돌아온 논문 리뷰. 오늘은 드디어 게재된 나의 소중한 석사 논문을 리뷰해보려고 한다. (내가 쓰고, 내가 리뷰) Title : Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data Authors : Eun Hee Rhee, Beom Seuk Hwang 1. Introduction 로짓 모형(Logit model)은 범주형 자료를 분석할 때, 가장 일반적으로 사용되는 모형으로 잘 알려져있다. 이때, 로짓 모형의 모수를 추정하는 방법으로는 Frequentist의 MLE와 Bayesian에서의 MCMC를 고려할 수 있다. 베이지안 관점에서 로짓 모형에 대한 추론은 오랜 시간 연구되어 왔으며,.. 2022. 3. 7.
다양한 사전 분포 _ Prior distribution 저번 포스팅에서 Prior distribution에 대해 간략하게 언급했었고, 이번 포스팅에서는 prior distribution의 종류를 정리해 보려고 한다. 1. 사전 분포란 ? What is the prior distribution? 사전 분포란 베이지안 통계분석에서 등장하는 용어로, 데이터의 분포를 결정하는 모수 $\theta$ (parameter)에 대한 사전 정보를 나타내는 분포이다. 데이터를 관찰하기 이전에 이미 알고있는 정보를 나타낸다고 생각하면 된다. 예를 들어, 2021년 8월에 남자아이가 태어날 확률을 알고싶다면, 태어날 아이의 성별은 {여자, 남자}로 두 가지 경우만 존재하기 때문에, 남자아이가 태어날 확률이 $\cfrac{1}{2}$라고 생각해도 되지만, 우리가 지난 10년 간 8.. 2021. 1. 29.
반응형