본문 바로가기
Statistics/논문 리뷰

ZIP and Binomial regression with Random effect_요약 정리

by Kanii 2020. 12. 28.
반응형

세미나 일시 : 2020-07-30

논문 제목 : Zero - Inflated Poisson and Binomial Regression with Random Effect :A case study

논문 저자 : Daniel B.Hall


1.  The Motivating Example 

 'Whitefly Example' (이 예제는 논문 후반부에 다시 사용됨.)

Whitefly라는 해충이 존재한다고 한다. (한국말로는 '가루이'라고 한다.)  이 해충을 박멸하기 위해서는 살충제를 살포해야하는데, 살포하는 방법에 따라 살충제의 효과가 얼마나 달라지는지를 알고싶다.

 

이 예제에서는 '살충제의 효과'를 2가지의 지표로 측정하였다. 

-> Responces 

$I_{ijk\ell}$ : The number of immatures insects (살충제 살포 이후에 새로 태어난 미성숙 개체의 수 )

$L_{ijk\ell}$ : The number of live insects (살충제 살포 이후에 살아남은 개체의 수)

 

$i$ : Treatments (1~6, H : Hand Watering , C : No pesticide , 0,1,2,4 : Subirrigation )

$j$ : Block 1~3

$k$ : Plant 1~3, $k^{th}$ plant from trio

$\ell$ : Time 1~12

이 실험에서 실험 단위 (EU) 는 trio of plants이다. 관찰 단위 (OU)는 식물 하나.

따라서 Responces의 총 길이는 6(처치 수)*3(블럭)*3(관찰단위)*12(Time)으로 648 이지만, 결측값이 8개 존재하므로, 그 값은 제외하여 총 640(=N)이 이 예제 데이터의 size이다.

 

이러한 데이터를 분석하기 위한 기본적인 method를 떠올려봐라 하면 가장 먼저 GLM을 떠올릴 수 있을 것이다.

이 논문의 저자 역시 Natural approach 로 GLM을 적용하여 간단한 분석의 결과를 보여주었다.

 

For responce $I_{ijk\ell}$, Assume $Y_{ij\cdot\ell} \sim poisson(\lambda_{ij\cdot\ell})$

$$log(\lambda_{ij\cdot\ell}) = \mu + \tau_i + \alpha_j + (\tau\alpha)_{ij} + \delta_\ell+ (\tau\delta)_{i\ell} + (\alpha\delta)_{j\ell}+\beta log(n_{ij\cdot\ell})$$

 

Poisson GLM에 의한 결과

For responce $L_{ijk\ell}$, Assume $Y_{ij\cdot\ell} \sim Bin(n_{ij\cdot\ell},\pi_{ij\cdot\ell})$
$$log(\pi_{ij\cdot\ell}) = \tau_i + \alpha_j + (\tau\alpha)_{ij} + \delta_\ell+ (\tau\delta)_{i\ell} + (\alpha\delta)_{j\ell}$$

 

Binomial GLM에 의한 결과

Table 2와 3는 observed data 과 모형에 의한 predicted value 를 그룹화 해서, 그것들의 비율차이를 나타낸 것이다.

(표에 나타난 $k$는 앞서서 정의했던 아래첨자 $k$와는 다른 것임을 명시한다.)

이 표를 보면 k=0 혹은 =1일때, Observed 와 predicted의 차이가 큰 것을 알 수 있는데, 이는 0이 전체 데이터에서 각각 35%, 25%정도로 큰 비율을 차지하고 있기때문에, 일반적인 분석방법이 제대로 데이터를 설명하고 있지 못하다고 볼 수 있다. 

 

이처럼 Count data에서 0의 비율이 큰 경우, Zero-inflated method를 활용하는 것이 권장된다.

따라서, 이 논문에서는 각각의 response에 대해서 Zero-inflated poisson reg, Zero-inflated Binomial reg를 전개했고,

EM-Algorithm을 사용하여 모수를 추정하였으며, 그 결과 그냥 GLMM을 사용한 모형보다 더 좋은 성능을 보였다.

 

구체적인 수식 전개는 논문을 참고하시길..

 

 

반응형

댓글