14 G-Estimation of Structural Nested Models
이 챕터에서는 평균 인과효과를 추정하기 위한 세 번째 방법인 g-estimation
을 살펴본다. 마찬가지로 예제 데이터는 NHEFS
데이터이다. IP 가중치, 표준화, 그리고 g-estimation
은 종종 함께 g-methods
라고 불리는데, 시간에 따라 변화하는 처치와 관련되어 일반화된(generalized) 처치를 적용하는 연구 설계를 따르기 때문이다.
g-estimation
을 설명하는 것은 모델이 포화 상태인 경우에도 구조적 모델(structural model)을 지정함으로써 용이해진다. g-estimation
을 통해 모수를 추정하는 모델을 구조적 중첩 모델(structural nested models)이라고 한다. 세 가지 g-methods
는 서로 다른 모델링 가정을 기반으로 한다.
14.1 The causal question revisited
처치군과 통제군에 대한 교환가능성이란 \(L\)이라는 교란변수들에 의해 조건적으로 달성될 수 있다고 가정한다. 따라서 서로 다른 척도를 가진 변수들에 대한 평균 인과효과는 \(E[Y^{a=1, c=0}] - E[Y^{a=0, c=0}]\)으로 정의될 수 으며, 전체 모집단에 대한 평균 인과효과를 측정할 수 있다. 그러나 때로 우리는 모집단의 특정 서브셋에서의 평균 인과효과에 대해 관심을 가질 수 있다. 이러한 서브셋에서의 인과효과를 추정하기 위해서 우리는 수열의 곱(product term)을 이용한 한계구조모델(marginal structural models, Chapter 12)을 사용하거나 서브셋에 대해서만 표준화를 적용하는 방법 등을 사용할 수 있다 (Chapter 13).
14.2 Exchangeability revisited
조건부 교환 가능성(conditional exchangeability)은 두 그룹이 동일한 처치 수준을 받았을 경우 처치받은 그룹과 처치받지 않은 그룹의 결과값의 분포가 동일하다는 것을 의미한다.
처치를 받지 않은 반사실적 결과 \(Y^{a=0}\)에 대해서, 금연 예제에 따르면 조건부(\(L\)에 대한) 금연 확률은 반사실적 결과인 \(Y^{a=0}\)의 모든 값에 대해 동일하다:
\[ \Pr[A=1|Y^{a=0}, L] = \Pr[A=1|L] \] 마찬가지로 처치 확률에 대한 로지스틱 모델도 다음과 같이 나타낼 수 있다:
\[ \mathrm{logit}\Pr[A=1|Y^{a=0}, L] = \alpha_0 + \alpha_1Y^{a=0} + \alpha_2 L. \] + \(alpha_2\): \(L\) (교란변수) 각각에 대한 모수(계수값)
만약 \(L\)이 \(p\)개의 교란변수라면 \((L_1 \dots L_p)\), \(a_2 L = \sum^p_{j=1}\alpha_{2j}L_j\).
실제로는 모든 개인에 대한 변수 \(Y^{a=0}\)의 값을 알 수 없기 때문에 이 모델을 실제 데이터셋에 적합할 수는 없다.
조건부 교환 가능성이 있고 모델이 올바르게 특정되어 있다면 모수 \(\alpha_1\)에 대해 어떠한 추정치를 기대할 수 있을까? \(Y^{a=0}\)이 \(L\)에 조건부 \(A\)를 예측하지 않기 때문에 \(\alpha_1\)의 추정치의 예상값은 0이 된다.
14.3 Structural nested mean models
우리가 알고싶은 것은 특정한 \(L\)의 수준에서 나타나는 처치 \(A\)의 평균 인과효과이다: \(E[Y^{a=1}|L] - E[Y^{a=0}|L]\). \(L\)에 의한 효과 수정이 존재하지 않는다면, 이러한 차이는 모든 층위에서 동일하게 나타날 것이다: \(E[Y^{a=1}-Y^{a=0}|L] = \beta_1\). 즉, \(\beta_1\)은 전체 모집단과 모든 층위 각각에 있어서 동일한 평균 인과효과를 나타내는 것이며, 이로 인하여 조건부 인과효과는 \(E[Y^{a}-Y^{a=0}|L] = \beta_1a\)라고 나타낼 수 있다.
하지만 일반적으로 \(L\)에 의한 효과 수정이 존재할 수 있다. 이 경우에는 위의 모델에 수열의 곱을 추가하여 \(L\)에 조건적인 인과효과를 나타낼 수 있다: \(E[Y^{a}-Y^{a=0}|L] = \beta_1a + \beta_2aL\).
조건부 교환가능성의 가정이 충족된다면, 같은 \(L\)의 값에서 처치군과 통제군의 개개인들의 평균적인 조건부 효과는 동일하게 나타날 것이다.
-
\(E[Y^{a}-Y^{a=0}|A = a, L] = \beta_1a + \beta_2aL\).
구조적 중첩 평균 모델(Structural nested mean model)
\(\beta_1, \beta_2\): 평균 인과효과를 보여주는
g-estimation
으로 추정된 결과예제에 따르면, 각각 \(A\)와 \(L\)의 수준별 \(Y\)에 대한 \(A\), 체중 증가에 대한 금연의 평균 인과효과를 보여주는 결과값이 된다.
데이터 자체에 검열(censoring)이 존재할 경우, 인과효과는 \(E[Y^{a=1, c=0}-Y^{a=0, c=0}|A, L]\)로 나타낼 수 있다. 즉, 이는 처치 \(A\)의 효과에 대한 교란과 선택 편향 모두를 조정한 차이의 결과라고 할 수 있다.
IP 가중치와 표준화가 교란으로 인한 편향과 선택 편향 모두를 조정하는 데 사용될 수 있는 반면에, g-estimation
은 교란에 의한 편향만을 조정할 수 있다.
- 따라서
g-estimation
을 사용할 때, 첫 번째로 필요한 것은 IP 가중치에 의해 검열된 것으로 인해 나타날 수 있는 선택 편향을 조정해주는 것이다. 그렇게 먼저 조정해서 만들어진 검열되지 않은 경우의 의사 모집단을 만든 이후에 (선택 편향을 조정한 이후에) 추가적으로g-estimation
을 이용해 교란 편향을 조정하는 것이다:
\[ E[Y^{a, c= 0}-Y^{a=0, c=0}|A=a, L] = \beta_1a + \beta_2aL. \] ## Rank preservation