22  Target Trial Emulation

관측 자료로부터의 인과 추론은 일종의 가설적인 무작위 시행을 모방(emulate)하고자 하는 노력이라고 할 수 있다. 이 챕터에서는 이를 목표 임상시험(target trial)이라고 한다. 다만 파트 I과 파트 II에서는 처치의 시점이 고정된 경우를 주로 살펴본 데 반하여, 앞선 챕터와 마찬가지로 여기에서는 지속적인 처치 전략을 비교하기 위한 보다 실제적인 목표 임상시험에 대한 내용을 다루고자 한다. 시간에 따라 변화하는 혹은 변화하지 않는 교란변수들에 대한 정보를 확보하는 것이 가능하다면, 이러한 방법을 통하여 인과 효과를 타당하게 추정할 수 있을 것이라고 기대하고 있다.

22.1 Intention-to-treat effect and per-protocol effect

이 섹션에서는 의도한 대로 처치(Intention-to-treat, ITT) 효과와 프로토콜에 따른 처치(Per-protocol, PP) 효과에 대해 설명하고 있다. ITT 효과는 모든 참가자를 처음 배정된 그룹에 따라 분석함으로써, 치료를 받기로 한 대상자들이 실제로 처치를 받았는지 여부와 상관없이 처치 계획의 효과를 평가한다. 반면, PP 효과는 연구 프로토콜을 완전히 준수한 참가자들만을 대상으로 하여, 실제 처치를 받은 사람들의 결과만을 분석함으로써, 처치 자체의 효과를 더 정확하게 평가할 수 있다.

  • ITT 효과에서 유의할 점은 처치 A가 결과 Y에 대해 효과가 없을 때(null effect), 할당된 처치 Z 또한 결과 Y에 대해 효과가 없다는 것을 의미한다. 이러한 ’무효 보존(null preservation)’은 중요한 특성으로, 실제로 효과가 없을 때 효과가 없는게 타당하다는 것을 정당화하기 때문이다.

  • PP 효과는 \(\Pr[Y^{z=1,a=1 = 1}]\)\(\Pr[Y^{z=0,a=0 = 1}]\)로 정의할 수 있는데, 이는 처치를 받은 그룹과 받지 않은 그룹에서 결과 Y가 1이 될 확률의 차이를 의미한다.

  • ITT 효과는 PP 효과에 비해 더 보수적인 추정치이다. 만약 처치 준수가 완벽하지 않아 효과가 감소되었다면, ITT 효과의 위험비(risk ratio)는 1과 PP 효과의 위험비 사이의 값을 갖게 되므로, ITT 효과는 PP 효과의 하한선으로 생각할 수 있다. 그러나 ITT 효과는 불완전한 준수로 인한 영향을 고려하지 않기 때문에, 실제 효과를 과소평가할 수 있다.

    • 높은 비준수가 있는 무작위 대조시험에서는 ITT 효과에만 의존하는 것이 적절하지 않다.

    • ITT 효과 분석은 처치의 준수도가 낮은 경우 실제 처치 효과를 과소평가할 수 있기 때문이다. 따라서, 더 정확한 효과를 추정하기 위해선 PP 효과를 추정하고, g-방법과 같은 통계적 방법을 사용하여 교란변수를 조정해야 한다.

22.2 target trial with sustained treatment strategies

목표 임상시험의 모방을 통해 연구자들은 실제 임상 환경에서의 처치 전략이 특정 결과에 미치는 잠재적인 효과를 더 잘 이해할 수 있다. 이러한 접근 방식은 처치 준수, 시간에 따른 변화, 그리고 다양한 환자의 서브셋에서의 처치 효과를 포함한 다양한 요소를 고려한다.

  • 실제 세계의 관찰 데이터를 사용하여 무작위 시험을 모방하는 것이 최종 목표이므로, 실제와 유사한 특성을 가진 실용적인 시험만을 고려한다. 즉, 무작위 대조시험이 실제 임상 환경과 유사한 조건에서 이루어져야 한다는 것으로 실제 환경에서의 처치를 모방하려 할 때 참가자와 연구자 모두가 처치에 대해 알고 있어야 하며 누구도 위약을 받지 않아야 한다는 것을 의미한다.

  • 예를 들어, HIV 감염인들 사이에서 항레트로바이러스 치료가 5년간 사망 위험에 미치는 영향을 추정하기 위한 무작위 시험을 고려할 수 있다. 이러한 시험에서는 참가자가 치료 시작 시점에 배정받은 치료 전략을 따르지 않을 수도 있으며, 이러한 프로토콜 이탈은 ITT 효과에 영향을 줄 수 있다. 그러나 실제로 치료를 받는 것에 대한 효과(즉, PP 효과)를 추정하는 것이 종종 연구자들의 실질적인 목표일 수 있다. 이는 처치 배정의 효과가 아니라 실제 시행된 치료의 효과를 비교하고자 할 때 중요하다.

22.3 Emulating a target trial with sustained strategies

관찰 데이터를 사용하여 지속적인 처치 전략의 장기적 효과를 추정하는 방법론을 설명하고, 실제 임상시험을 할 수 없을 때 이를 모방하기 위한 접근법을 다루고 있다. 명확한 목표 시험 프로토콜을 설정하면 관찰 분석을 통해 대답하고자 하는 인과적 질문을 명확히 할 수 있다. 이를 위해, 연구자들은 적격 기준, 추적 관찰의 시작과 끝, 처치 전략, 결과, 인과 대조, 데이터 분석 계획 등을 정의해야 한다. 관찰 연구에서의 인과 효과를 목표 시험과 비교함으로써, 연구자들은 비교하고자 하는 처치 전략을 명확히 할 수 있다.

22.4 Time zero

이 섹션에서는 ’시간 제로(Time zero)’의 개념에 대해 다루고 있다. 관찰 연구에서 목표 시험을 모방할 때 시작 시점을 정의하는 데 필요한 개념으로 연구 대상자가 연구에 포함되는 시점, 즉 처치나 개입이 시작되는 기준점을 의미한다.

  • 무작위 대조시험에서 시간 제로는 개인이 적격 기준을 충족하며 처치 전략에 배정될 때를 의미한다. 관찰 분석에서도 비슷한 규칙이 적용되며, 추적 관찰을 목표 시험에서 시작했을 시간에 시작해야 한다. 그렇지 않으면 추정치 해석이 어렵고 처치에 의해 영향을 받은 선택으로 인해 편향될 수 있다.

  • 관찰 연구에서 시간 제로의 모방 오류는 자주 발생하며, 이는 때때로 시간 제로의 선택이 유일하지 않거나, 시간 제로에서 처치 전략을 유일하게 할당할 수 없기 때문이다. 이 문제들에 대한 해결책으로는 시간 제로를 결정하는 여러 방법이나, 처치 전략을 개인에게 할당하는 방법이 제안되고 있다.

22.5 A unified approach to answer What If questions with data

여기서는 두 가지 인과 추론 분석틀인 반사실(counterfactuals)과 인과 다이어그램(causal diagrams)을 통합하고자 한다. 명확한 목표 임상시험(target trial) 모방은 이 두 분석틀을 재현하고 실천 가능한 인과 추론으로 구체화한다. 실험(experiment)이라는 익숙한 과학적 개념을 중심으로 인과 추론을 구성함으로써, 목표 임상시험은 연구자들이 그들의 전문 지식을 사용하여 잘 정의된 인과 추론 질문을 명확히 할 수 있도록 도울 수 있다. 인과적 질문이 명확히 제시되면, 연구 설계와 데이터 분석이 자연스럽게 이어진다. 목표 임상시험 분석틀은 다양한 분야의 다양한 인과 질문에 적용 가능하며, 각 분야의 용어와 방법론에 관계없이 유용하다.

또한 무작위 시험(randomized trials)과 관찰 연구(observational studies)의 인과 분석도 통합할 수 있다고 주장한다. 관찰 데이터의 분석이 목표 시험을 모방하는 경우와 진정한 무작위 시험의 분석 사이에는 기본적으로 무작위 배정을 제외하고는 차이가 없기 때문이다. 즉, 무작위 시험은 무작위 배정이 있는 추적 연구로 볼 수 있고, 관찰 연구는 무작위 배정이 없는 추적 연구로 볼 수 있다.

장기간 지속되는 처치 전략의 효과를 추정하는 무작위 시험에서는 프로토콜에서 크게 벗어날 가능성이 있으며(예: 할당된 전략에 대한 불완전한 준수, 추적 관찰 손실), 이는 우리가 일반적으로 관찰 연구와만 연관시키는 혼동(confounding)과 선택 편향(selection bias)에 노출될 수 있다. 인과 효과를 추정할 때, 무작위 시험과 관찰 연구 모두 시간에 따라 변하는 예측 요인에 대한 조정이 필요할 수 있다.

마지막으로 무작위 실험이 인과 추론을 위해 관찰 연구보다 훨씬 우월하다고 간주되었던 과거와 달리, 장기간 지속되는 처치 전략에 대한 인과 추론을 위한 통합된 접근 방식을 구현할 수 있도록 목표 임상시험 분석틀과 g-method 를 제안하고 있다. 무작위 실험이 항상 가능한 것은 아니기 때문에, 관찰 데이터를 사용하여 목표 임상시험을 모방하는 것이 중요하다.