1장 근거 기반 운동의 기원

잉게마르 보흘린 (Ingemar Bohlin)

서론

1990년대 초, 근거중심의학(Evidence-Based Medicine, EBM)은 새로운 의학교육 및 진료 패러다임으로 제안되었다. 이 개념의 지지자들은 임상 진료를 탄탄한 과학적 근거에 기반하도록 보장하려면, 새로운 기본 원칙들이 필요하다고 주장했다. 이러한 원칙들은 서로 독립적으로 발전해온 여러 분야로부터 유래하였다. 본 장에서는 EBM의 등장에 기여한 네 가지 독립적 탐구의 흐름을 개관한다:

  • 성과 중심 운동(the outcomes movement),
  • 임상역학(clinical epidemiology),
  • 무작위 임상시험(randomized clinical trials),
  • 연구 종합 방법론(methodology of research synthesis).

이 장은 각 흐름의 전개 과정을 요약하고, 그것이 EBM의 탄생에 어떤 관련성을 가지는지를 설명한다. 마지막 절에서는 이러한 발전 간에 존재하는 긴장 관계를 다룬다.


성과 중심 운동 (The outcomes movement)

1970년대 초부터 연속적으로 발표된 일련의 논문들에서 역학자 존 웬버그(John Wennberg)는 미국 내 지역별로 건강관리 실천 방식이 상당히 다르다는 점을 보여주었다. 그는 지역 병원의 퇴원 기록과 함께 Medicare 및 Medicaid와 같은 건강보험 청구의 대규모 국가 데이터베이스를 활용하여 분석하였다. 예를 들어, 메인(Maine)주에서는 70세 여성의 자궁적출술(hysterectomy) 시행 비율이 한 병원 권역에서는 20%인 반면, 다른 지역에서는 70%에 이르렀으며, 버몬트(Vermont)주의 경우 편도절제술(tonsillectomy)을 받은 아동의 비율이 병원 시장에 따라 8%에서 거의 70%까지 차이가 있었다고 한다 (Wennberg, 1984).

 

웬버그는 이러한 차이를 “진료 스타일 요인(practice style factor)”, 즉 의료 전문직 내에서 지역적으로 채택된 상이한 접근 방식에 기인한다고 보았다. 이에 대한 대체 설명들도 제안되었는데, 예를 들어 특정 의학적 질환이 지역적으로 불균등하게 분포되어 있을 수 있고, 새로운 치료법이 지역별로 도입되는 속도에도 차이가 있다는 점이 그것이다 (Smits, 1986). 이러한 반론에도 불구하고, 웬버그의 발견은 적어도 미국에서는 임상적 의사결정이 보편적으로 유효한 과학적 지식에 기반하고 있지 않다는 점을 명확하게 보여주는 증거로 받아들여졌다.

 

1989년, 미국에서는 의료정책 및 연구기구(Agency for Health Care Policy and Research, AHCPR)가 설립되었다. 이 신설 기관은 의료 개입의 결과를 문서화하는 연구를 지원하는 역할을 담당하였다. 당시로서는 새롭게 부상한 연구 분야였으며, ‘의료 치료 효과성 연구(medical treatment effectiveness research)’로 불리기도 했지만, ‘환자 성과 연구(patient outcomes research)’ 혹은 줄여서 ‘성과 연구(outcomes research)’라는 용어가 더 일반적이었다.

 

이러한 연구에 사용된 데이터는 웬버그가 오래전부터 활용해온 것과 같은 데이터베이스에서 수집한 것으로, 개별 환자의 의료 개입, 합병증 발생 여부, 사망률 등에 관한 정보를 포함하고 있었다. AHCPR이 자금을 지원한 연구의 목적은 특정 환자군에서 개입의 결과를 문서화함으로써 다양한 의료 치료법의 효과성과 비용에 대한 지식 기반을 구축하는 것이었다. 그리고 이 지식을 토대로 임상 의사결정을 지원하는 지침(Guidelines)이 개발되었다 (Raskin and Maklan, 1991). 1999년, AHCPR은 의료 연구 및 질 관리 기구(Agency for Healthcare Research and Quality, AHRQ)로 이름이 바뀌었으며, 부분적으로 새로운 임무를 부여받게 되었다 (Gray et al., 2003).

 

임상 진료 지침(clinical practice guidelines)은 1930년대 초부터 전문 의료 협회들에 의해 발간되어 왔다. 1970년대 중반부터는 발간된 진료 지침의 수가 꾸준히 증가하였으며, 1990년대 초에는 그 양이 너무 많아져서, 세계 최대의 생의학 문헌 서지 데이터베이스인 Medline을 운영하는 미국 국립의학도서관(National Library of Medicine)은 진료 지침을 독립된 출판 유형(publication type)으로 정의하기에 이르렀다 (Weisz et al., 2007).

 

 

1980년대 말에는 웬버그와 동료들이 밝혀낸 진료 관행의 지역 간 변이가 미국 내 보건의료 정책 결정자들 사이에서 널리 알려지게 되었고, 이에 따라 임상 진료 지침은 하나의 해결책으로 주목받았다 (Woolf, 1990). AHCPR의 설립은 매우 중요한 전환점이었다. 이 기구의 핵심 임무 중 하나는 의사의 임상적 판단을 지침을 통해 규제하는 것이었다. 1989년 12월 부시 대통령이 서명한 AHCPR 설립 법안은, 설립 후 1년 이내인 1991년 1월까지 세 가지 의학적 질환에 대한 진료 지침을 발간하고, 2년 뒤에는 해당 지침이 의료의 질과 비용에 미친 영향을 의회에 보고할 것을 명시하였다 (Woolf, 1990; Gray et al., 2003).

 

성과 연구(outcomes research)는 특정 개입이 대규모 인구 집단에 미치는 효과에 관한 지식을 생산한다. 이로부터 생성되는 근거는 확률적(probabilistic)이다. 성과 연구의 부상은 오랜 갈등—즉, 의학의 과학적 토대를 실험실 과학(laboratory science)이 제공해야 하는가, 아니면 통계학(statistics)이 제공해야 하는가에 대한 논쟁—에서 새로운 국면을 형성했다.

 

Rosser Matthews(1995)는 이 논쟁의 여러 단계를 문서화하였으며, 19세기 초부터 20세기 중반까지 프랑스, 독일, 영국에서 벌어진 논의를 다룬다. 19세기 후반, 클로드 베르나르(Claude Bernard)는 의학은 실험실 기반의 실험 과학이 되어야 한다고 주장한 대표적인 인물이었다. 몇십 년 후, 칼 피어슨(Karl Pearson)이 개척한 생물측정학적 접근(biometrical approach)은 의료 통계학(medical statistics)이라는 학문 분야를 낳게 된다. 이 시기 형성된 의학과 수리통계학 간의 연계는 이후 매우 강력해졌으며, 그 이전 수십 년간은 생리학, 병리학 및 관련 학문들이 의학교육을 지배해왔다.

 

이러한 현상은 부분적으로 1910년에 미국과 캐나다의 의학교육에 대한 영향력 있는 보고서가 출간된 것에 기인한다. 이 보고서는 질병의 기본 메커니즘에 대한 의사의 이해 필요성을 강조하였다 (Bluhm and Borgerson, 2011; Newton, 2001). 제2차 세계대전 이후의 시대에도, 생의학(biomedical science)은 여전히 양대서양권에서 의학의 근간을 이루었다.

 

진료 지침과 전문가 자율성 간의 긴장

전문 직업 집단의 실천을 통제하려는 진료 지침은 일반적으로 그 구성원들의 전문적 판단권에 대한 위협으로 인식된다. 의료 전문가 집단이 오랫동안 병태생리(pathophysiology)에 의존해온 점을 고려할 때, 인구 기반의 확률적 자료에 근거한 진료 지침의사의 재량권(professional discretion)과 심각한 충돌을 일으킬 수 있다.

 

이에 따라, 임상의들의 반발을 방지하기 위해 AHCPR의 일부 직원들은 다음과 같은 점을 강조했다: 기관이 발간한 진료 지침은 기존의 의료 지식을 대체(supplant)하기보다는 보완(supplement)하기 위한 것이다. 두 명의 AHCPR 대표는 이 지침이 ‘요리책식 의료(cookbook medicine)’의 경직된 형태를 구현하는 것은 아니다라고 주장했다 (Raskin and Maklan, 1991).

 

성과 운동의 부상과 경제적 맥락

성과 연구 접근법은 1980년대 미국과 영국을 중심으로 큰 힘을 얻기 시작했으며, 10년 말에는 “성과 운동(the outcomes movement)”이라는 용어가 등장하게 된다 (Epstein, 1990). 이 운동은 수집된 데이터의 임상적 관련성 외에도, 경제적 고려에 의해 촉진되었다. 제2차 세계대전 이후, 미국에서 의료 체계는 급속히 팽창했고 의료비는 급증했으며, 1960년대에 들어 비용 억제를 위한 본격적인 노력이 시작되었다.

 

성과 연구에서 대규모 등록(registry) 데이터로부터 정보를 수집하고 분석하는 기술은, 이전까지 성공적이지 못했던 의료비 통제를 위한 새로운 경로를 열었다. 특정 개입의 비용이 산정 가능하다면, 임상적 의사결정뿐만 아니라, 어떤 약물이나 외과적 시술에 정책적 우선순위를 둘지에 대한 결정대규모 인구 집단에서의 성과 정보에 근거할 수 있게 된다.

 

1988년, 『뉴잉글랜드 의학저널(New England Journal of Medicine)』의 편집장 아놀드 렐만(Arnold Relman)은 성과 연구의 부상을 ‘미국 의료의 세 번째 혁명’으로 명명하였다. 확장(Expansion)의 시대와 비용 억제(Cost Containment)의 시대 이후, 미국 의료 체계는 이제 “평가와 책임의 시대(the Era of Assessment and Accountability)”에 진입하고 있다고 보았다 (Relman, 1988).

 

 

임상역학과 무작위 임상시험
Clinical epidemiology and randomized clinical trials

성과 중심 운동(outcomes movement)이 부상하던 시기에, 공중보건 분야에서 오랫동안 사용되던 방법들이 임상 진료에도 유용할 수 있다는 제안이 이미 제기되고 있었다. 1960~70년대에 이르러, 미국과 캐나다에서는 “임상역학(clinical epidemiology)”이라는 용어가 점차 사용되기 시작했으며, 이는 의학교육 및 진료에 대한 새로운 접근을 지칭하는 개념이었다. 그 핵심 아이디어는, 개별 환자에 대한 임상적 의사결정이 역학적 근거, 즉 양적이고 인구 기반의 연구 결과에 의해 뒷받침되어야 한다는 것이었다. 오랫동안 의학교육에서 중시되었던 생물학적 과정에 대한 실험실 기반 증거는 임상 진료의 근거로서 점점 더 불충분한 것으로 간주되었고, 따라서 새로운 과학적 기반이 필요하다는 인식이 확산되었다 (Daly, 2005).

 

다시 말해, 임상역학은 20세기 후반 수십 년 간 성과 중심 운동과 함께 진행된 의료 실천의 근거 전환—즉 병태생리와 관련 학문에서 확률적이고 인구 기반의 근거로의 이동—의 일부였다.

 

“임상역학”이라는 용어는 1938년 존 폴(John Paul)이 미국임상연구학회(American Society for Clinical Investigation) 회장으로서 처음 도입했으며, 그는 20년 후 이 주제에 대한 책도 출판하였다 (Paul, 1938, 1958). 임상적 의사결정이 역학적 데이터에 기반해야 한다는 원칙은 당시 널리 수용되지 않았지만, 1980년대 전반기에 들어서면서, 존 폴의 책과 동일한 제목을 가진 책 세 권이 연이어 출판되었다: Clinical Epidemiology (Fletcher et al., 1982; Feinstein, 1985; Sackett et al., 1985).

 

이 중 Sackett 등(1985)의 교과서는 토론토 외곽의 맥마스터대학교(McMaster University)에 소속된 세 명의 저자들이 공동 집필하였다. 맥마스터 의과대학에서 신입 의사들에게 가장 강조한 기술은, 주어진 임상 문제와 관련된 연구를 식별하고 평가하는 능력이었다. 이러한 절차를 구체화한 것이 바로 Sackett 등이 1985년에 출판한 교과서의 핵심이었으며, 이후 맥마스터 그룹이 발표한 많은 출판물들의 핵심이기도 했다.

 

이들이 이러한 절차에 부여한 중요성은 대단히 컸으며, 이를 “비판적 평가(critical appraisal)”라 불렀고, 이 용어는 종종 임상역학과 동의어처럼 사용되기도 했다. 이러한 비판적 평가는 의사의 임상 경험, 특히 권위 있는 전문가의 권고에 대해 강한 회의적 태도를 견지하는 맥마스터 그룹의 입장과 일치하였다. 이 그룹은 무작위 임상시험(RCTs)의 중요성을 일관되게 강조해왔다.

 

대조군(control group)의 사용실험적 방법의 발전에서 핵심적인 단계이며, 그 다음은 실험군과 대조군에 무작위로 배정(randomized allocation)하는 것이다. 이 각각의 단계는 분야별로 서로 다른 시점에서 독립적으로 도입되어 왔다. 예를 들어, 미국의 심리학 및 사회과학 분야에서는 20세기 초 수십 년간 통제된 실험(controlled experiments)이 일반적이었다 (Oakley, 2000). 더 거슬러 올라가면, 18세기 중반 스코틀랜드 해군 외과의사 제임스 린드(James Lind)가 수행한 괴혈병(scurvy) 실험이 유명한 예이다 (Carpenter, 1986). 무작위화(randomization) 절차는 1880년대 중반 미국의 실험심리학에서 적용되었고 (Stigler, 1978, 1999), 1920년대 초 교육 연구에서도 사용되었다 (Oakley, 2000). 

 

하지만 무작위화가 통계 기법으로서 확립된 계기는 영국의 로널드 A. 피셔(Ronald A. Fisher)의 업적을 통해서였다. 그의 책 The Design of Experiments는 특히 큰 영향을 미쳤다 (Fisher, 1935). 피셔의 아이디어는 농업 실험의 맥락에서 개발된 것이었지만, 이는 1948년에 보고된 한 임상시험에서 엄격하게 구현되었다. 이 임상시험은 런던대학교의 의료통계학 교수 오스틴 브래드포드 힐(Austin Bradford Hill)이 설계한 것으로, 환자들은 치료군(효과를 알아보고자 하는 물질을 투여받는 그룹)과 대조군(투여받지 않는 그룹)에 무작위로 배정되었다. 힐의 1948년 연구는 의학 연구에 새로운 시대를 연 획기적인 연구로 간주되며 (Gehan and Lemak, 1994; Rosser Matthews, 1995), 근대 임상시험의 기틀로 평가받고 있다.

 

그러나 현대 임상시험의 표준은 의학계나 임상 연구자들의 결정에 의해 수립된 것이 아니다. 규제기관(regulatory bodies)의 결정에 따라, 이중맹검(double-blind) 무작위 임상시험(RCT)의학 연구에서 필수적인 설계 방식으로 자리잡게 되었다. 여기서 이중맹검이란, 환자와 연구자 모두 자신이 어떤 처치를 받았는지를 모르게 하는 방식을 의미한다. 일련의 법적 절차 이후, 미국 식품의약국(FDA)은 1970년에 이 표준을 제약 산업에 강제하였고, 1970년대 후반이 되면 대부분의 서구 국가 정부 기관들이 이를 채택하게 되었다 (Bodewitz et al., 1987; Rosser Matthews, 1995; Marks, 1997).

 

 

Sackett 등(1985)의 교과서는 임상의들이 임상 문제에 대한 해답을 스스로 찾도록 독려하였으며, 상급 동료의 판단에 의존하지 말 것을 강조했다. 이 책은 임상 진료 현장에서 직면하는 문제와 관련된 인과관계에 대한 근거(evidence of causation)어떻게 비판적으로 평가할 것인지에 대해 실용적인 가이드를 제공하였다. 이 가이드에는 임상 연구에서 사용된 방법의 상대적 강도를 판단할 수 있는 ‘근거의 규칙(rules of evidence)’이 포함되어 있었다.

 

무작위 시험(randomized trials)이 다른 연구 설계에 비해 갖는 이점은 책 전반에 걸쳐 거듭 강조되었으며, 다음과 같은 단순한 근거 위계(scale of evidence)도 제시되었다. 최상단에는 RCTs(Randomized Controlled Trials)가 위치하고, 그 아래에 코호트 연구(cohort studies), 환자-대조군 연구(case-control studies), 그리고 증례열(case series)이 순서대로 배치되었다 (Sackett et al., 1985, pp. 225, 297).

 

책의 개정 및 확장판인 제2판(1991년)에서는 “연구 위계(study hierarchy)”라는 용어가 새롭게 도입되었고, 이후 이 위계는 “근거의 위계(hierarchy of evidence)”로 불리며, 근거중심의학(Evidence-Based Medicine, EBM)의 핵심 요소로 자리 잡게 되었다 (예: Rinchuse et al., 2008; Greenhalgh, 2019).

 

이 EBM이라는 용어는 맥마스터 교과서의 1991년판에서 두 번 등장한다. 첫 번째는 서문에서 간략히 언급되며, 두 번째는 책의 마지막 장에 별표(*)로 삽입된 주석 속 문장에서 다음과 같이 언급된다:

“우리 동네에서는 비판적 평가를 임상 진료에 통합하는 것을 종종 ‘근거중심의학’이라고 부른다.”
(“Around our town, the incorporation of critical appraisal into clinical practice often is called ‘evidence-based medicine’”) (Sackett et al., 1991, pp. xii, 398).

 

같은 해, 이 교과서의 제2판 공동 저자였던 고든 가이앗(Gordon Guyatt)은 주요 의학 저널 부록에 실린 사설(editorial)에서 이 개념을 보다 상세히 소개하였다 (Guyatt, 1991).

 

하지만 ‘근거중심의학’이라는 개념이 공식적으로 널리 주목받기 시작한 계기는 다음 해, 1992년 Journal of the American Medical Association에 실린 기획 기사(programmatic article)였다. 이 글은 가이앗이 의장으로 참여한 대규모 집필 그룹(Evidence-Based Medicine Working Group)이 작성하였으며, EBM을 의학 실천의 새로운 패러다임으로 제시하였다 (Evidence-Based Medicine Working Group, 1992). 새로운 패러다임은, ‘근거의 규칙’에 기반한 비판적 평가 능력을 갖춘 실천가의 기술을 강조하면서, 임상 경험병태생리학적 과정에 대한 이해의 중요성은 상대적으로 감소시켰다. 이러한 패러다임 전환은 최근 임상 연구의 발전에 기인한다는 설명도 덧붙여졌다.

 

이 논문에서는 특히 두 가지 방법론이 중요하다고 지적되었다.

  • 하나는 무작위 대조군 시험(Randomized Controlled Trial, RCT)이고,
  • 다른 하나는 메타분석(meta-analysis)이었다. 이 메타분석은 다음과 같이 평가되었다:

“무작위 시험 그 자체만큼이나 치료 정책 결정에 깊은 영향을 미칠 수 있는 기법이다.”
(“[Meta-analysis is] a technique that may have as profound an effect on setting treatment policy as have randomized trials themselves”)
(Evidence-Based Medicine Working Group, 1992, p. 2420).

 


메타분석(Meta-analysis)과 체계적 문헌고찰(Systematic reviews)

1970년대 초까지 사회과학 분야에서 발표된 연구의 양이 방대해지자, 기존의 연구 결과 요약 방식이 충분한가에 대한 의문이 제기되었다. 이에 따라, 콜로라도 대학교의 교육심리학 교수인 진 글래스(Gene Glass)가 제안한 새로운 방법은, 명시적인 방법론에 의존하지 않는 전문가의 서술식 고찰을 대체하는 접근으로 대부분 긍정적으로 받아들여졌다.

 

메타분석(meta-analysis)이라는 이름은 글래스가 1976년에 자신의 혁신적 기법에 붙인 것으로, 유사한 주제를 다룬 개별 연구들로부터 양적 데이터를 통합하는 통계 기법이었다. 글래스와 동료는 심리치료의 효과에 관한 약 400개의 연구 결과를 종합하는 과정에서 이 방법을 개발하였으며 (Smith and Glass, 1977), 이어서 학급 규모가 학생 성취도에 미치는 영향에 관한 80개의 연구를 종합하였다 (Glass and Smith, 1979).

 

글래스와 그의 팀과는 독립적으로, 이 시기에 사회과학 연구자들 중 두 집단이 유사한 통계 기법을 개발하기도 했지만, ‘메타분석’이라는 용어는 빠르게 널리 채택되었다. 1980년대 중반이 되면, 메타분석에 관한 교과서들이 몇 권 출간되었으며, 대표적으로 Glass et al. (1981), Light and Pillemer (1984), Cooper (1984) 등이 있다. 이로써 메타분석은 양적 사회과학 분야에서 상당히 확립된 방법론이 되었다.

 

그 시점에서 특정 치료법에 대한 임상시험의 수는 사회과학 연구 수에 비해 훨씬 적었지만, 상반된 결과를 낳은 연구들로 인한 불확실성을 해소할 필요성은 결코 덜하지 않았다. 일부 초기 시도들이 서로 다른 임상연구들로부터 양적 데이터를 모으려는 방향으로 이루어졌고, 이를 목적으로 한 논문 몇 편이 1970년대에 발표되었으나, 본격적으로 통계적 절차를 활용하여 일련의 임상시험 결과를 종합하는 방법이 의학 연구에서 새로운 방식으로 도입된 시기는 1980년대 초였다. 이 방법을 지지한 선두 그룹 중 하나는 옥스퍼드에 기반을 둔 연구자들이었다.

 

이 그룹이 발표한 최초의 메타분석 연구급성 심근경색(acute myocardial infarction) 환자에게 정맥 내 스트렙토키나제(streptokinase)를 투여했을 때의 효과를 다루었다. 총 8건의 임상시험이 확인되었는데, 모두 소규모 연구였다. 그 중 5건은 스트렙토키나제가 사망률을 감소시킨다는 결과를 보여주었고, 3건은 사망 위험 증가를 시사했으나, 통계적으로 유의미한 결과는 두 건뿐이었다. 그러나 이들 결과를 종합한 결과, 옥스퍼드 연구팀은 정맥 내 스트렙토키나제 치료가 사망률을 20% 감소시킨다는 결론에 도달했으며, 이 결과는 통계적으로 유의미하였다 (Stampfer et al., 1982). 3년 뒤, 같은 팀이 수행한 더 큰 규모의 메타분석에서도 같은 결론이 재확인되었고, 그 근거는 더 강화되었다 (Yusuf et al., 1985).


이러한 연구들과 다양한 치료 개입에 대한 근거를 평가한 유사한 연구들임상 연구에 대한 중요한 기여로 환영받았지만, 동시에 이 방법론에 대한 강한 반대도 제기되었다. 회의론자들이 주목한 핵심 문제는, 바로 어떤 연구를 메타분석에 포함시킬 것인가를 결정하는 문제였다.

  • 이 문제는 주로 두 가지 측면에서 제기되었다: 연구 간의 이질성(heterogeneity)연구의 질(quality).
    • 한편으로는, 진단 도구, 약물 종류 및 용량, 환자군 구성 등 개입 조건이 다르기 때문에, 연구 간 비교 자체가 오해를 불러일으킬 수 있다는 비판이 있었다. 과연 연구들 간에 어느 정도의 동질성이 확보되어야 메타분석 결과가 의미 있을 수 있는가?라는 질문이 제기된 것이다.
    • 또 다른 비판은, 철저하게 수행된 임상시험 결과가, 명백한 방법론적 결함이 있는 연구들과 함께 종합되는 것이 부적절하다는 것이었다.

이러한 쟁점을 둘러싸고, 1986년 미국 메릴랜드 주 베서스다(Bethesda)에서는 메타분석 지지자와 반대자들이 한 자리에 모여 그 장단점을 논의할 수 있는 워크숍이 개최되었다. 해당 워크숍의 결과는 (Yusuf et al., 1987) 문서로 정리되었는데, 결론적으로 워크숍에서 명확한 합의는 도출되지 못했다. 그럼에도 불구하고, 메타분석은 1980년대 후반부터 1990년대 초에 걸쳐 임상 연구의 중심적 위치를 차지하게 되었다.

 

 

베서스다(Bethesda) 워크숍 참석자 중에는 토머스 챌머스(Thomas Chalmers)도 있었다. 그는 마운트 시나이 메디컬 센터(Mount Sinai Medical Center)를 포함한 미국의 여러 기관에서 활동한 경력이 있는 인물이었다. 그는 이 워크숍에서 이론적·기획적 차원에서 의학 분야 메타분석의 대표적인 옹호자로서의 역할을 자처하였다. 챌머스는 메타분석이 하나의 독립된 과학적 학문 분야로 확립되어야 한다고 강력히 주장했다. 메타분석 역시 그에 포함된 임상시험이 준수했던 것과 동일한 수준의 엄격한 기준을 적용받아야 한다는 것이 그의 핵심 논지였다.

 

의학 메타분석의 객관성(objectivity)재현 가능성(replicability), 그리고 궁극적으로 그 결과의 신뢰성(reliability)을 확보하기 위해, 챌머스와 그의 동료들은 이러한 통합 분석(synthesis)을 수행할 때 적용할 지침(guidelines)을 개발하였다 (예: Sacks et al., 1987). 이 지침이 실제로 어느 정도 잘 준수되었는지는 별개의 문제로 하더라도, 이 시기 의학 분야에 발표된 메타분석의 수는 급격히 증가하였다. 예를 들어, EBM을 새로운 패러다임으로 선포한 다중저자 논문이 발표되기 1년 전인 1991년, 의학 메타분석 논문이 431편 출판되었으며, 이는 불과 5년 전인 1986년의 21편에 비해 큰 폭의 증가였다 (Dickersin and Berlin, 1992).

 

1970년대 후반부터, 영국의 산부인과 의사 이안 챌머스(Iain Chalmers)(※ 토머스 챌머스와는 무관한 인물)의 주도 아래, 여러 연구팀이 임신과 출산의 다양한 측면을 다룬 연구들을 대상으로 한 메타분석을 수행하였다. 1989년, 이들은 방대한 2권짜리 저작(Chalmers et al., 1989)을 출간한 후, 이안 챌머스는 저자 팀들이 임상시험 결과를 계속 종합해 나가도록 독려하였다. 이러한 작업은 훗날 보건의료 전반에 대한 연구를 통합하는 세계적 조직으로 발전하는 씨앗이 되었다. 1992년, 챌머스의 멘토였던 역학자 아치 코크레인(Archie Cochrane)을 기리기 위해, 코크레인 센터(Cochrane Centre)가 옥스퍼드에 설립되었고, 이는 영국 국민보건서비스(NHS)의 재정 지원을 받았다. 이듬해인 1993년, 국제 네트워크인 코크레인 콜라보레이션(Cochrane Collaboration)이 창립되었다.

 

1980년대 후반과 1990년대 초, 양적 데이터를 종합하려는 시도를 하지 않은 문헌고찰(literature reviews)에서도, 메타분석을 수행할 때 적용되는 기본적인 지침들이 여전히 유효하다는 점이 인식되었다. 이러한 인식은, ‘메타분석(meta-analysis)’보다 더 포괄적인 용어의 필요성을 시사했다. 실제로 코크레인 콜라보레이션이 설립될 무렵의 여러 출판물들에서, 이안 챌머스는 “체계적 문헌고찰(systematic review)”이라는 용어를 사용하기 시작했다 (예: Chalmers et al., 1992). 이 용어는 곧 형식화된 지침에 따라 수행된 통합 연구(synthesis)를 지칭하는 데 채택되었으며, 주로 무작위 임상시험(RCTs)을 중심으로 이루어지는 종합을 의미하게 되었다. 그 결과, ‘메타분석’이라는 용어는 이제 주로 체계적 문헌고찰의 한 부분으로 수행되는 통계적 계산 절차를 가리키는 말로 사용되고 있다. (연구 통합의 역사에 대한 더 상세한 설명은 Bohlin, 2012 참고.)

 

긴장(Tensions)

앞선 섹션에서는 20세기 의학 연구의 역사 속에서 등장한 네 가지 뚜렷한 접근 방식을 개관했다. 즉, 성과 중심 운동(outcomes movement), 임상역학(clinical epidemiology), 무작위 대조군 시험(RCTs), 그리고 연구 통합(research synthesis)이 그것이다. 이들 각각의 접근 방식은 근거중심의학(Evidence-Based Medicine, EBM)의 중심 구성요소로 해석되어 왔다. 예컨대, 1990년대 초까지 “성과 중심 운동은 근거중심의학으로 진화하였다”고 해석되기도 했다 (Tanenbaum, 2006).

 

의료 관행의 지역 간 변이를 문서화함으로써 1980년대 성과 연구를 촉진시킨 존 웬버그(John Wennberg)는, 아치 코크레인(Archie Cochrane), 데이비드 새킷(David Sackett)과 함께 EBM의 창립자 중 한 명으로 묘사되기도 한다 (Timmermans and Berg, 2003). 여기서 코크레인이 인용되는 이유는, 체계적 문헌고찰(systematic reviews)이 EBM의 핵심 기둥(cornerstone) 또는 전체 근거 운동의 초석으로 간주되기 때문이다 (예: Petticrew, 2001; Dixon-Woods, 2006).

 

하지만, 이 장에서 다룬 네 가지 탐구 노선과 EBM의 관계는 흔히 생각되는 것보다 훨씬 더 복잡하다. 이들 접근 간, 혹은 EBM과 각각의 접근 간의 유사점과 차이점을 자세히 논의할 공간은 부족하며, 여기서는 두 가지 주요 긴장 관계에 대해서만 간략히 언급한다.

  • 하나는 무작위 실험(randomized experiments)성과 연구(outcomes research) 간의 관계이고,
  • 다른 하나는 EBM과 연구 통합 방법론(research synthesis methods) 간의 관계이다.

1970년대 초부터, 개별 환자의 의학적 상태, 개입 이력, 그리고 그 결과에 대한 정보를 포함하는 컴퓨터 기반 데이터베이스임상 실천에 중요한 자원으로 제안되었다 (초기 예: Rosati et al., 1973). 하지만 초기부터, 이러한 데이터의 임상적 의의는 무작위 임상시험의 힘을 강조하는 연구자들에 의해 의문을 제기받았다 (예: Byar, 1980). 이러한 논쟁은, 실제 진료 현장에서 수집된 데이터의 관련성(relevance)과 잘 설계된 RCT의 방법론적 엄격성(rigour)을 둘러싼 갈등이었으며, 1990년대 초 AHCPR이 성과 연구에 막대한 자금을 지원하면서 더욱 심화되었다 (Tanenbaum, 1995). 성과 연구RCT 모두 생리학적 메커니즘에 대한 증거와는 달리, 확률적이고 인구 기반의 근거(probabilistic and population-based evidence)를 제공하지만, “관련성 vs. 엄격성(relevance vs. rigour)”이라는 논점은 두 방법 사이의 지속적인 긴장의 원천이었다.


또 다른 분열은, 비판적 평가(critical appraisal)연구 통합 방법(research synthesis methods) 사이에서도 발생했다.
EBM 개념이 등장한 몇 년 후 발표된 한 사설(editorial)에서, 고든 가이앗(Gordon Guyatt)이 이끄는 맥마스터(McMaster)의 임상역학자들은, “근거 기반 실천가(evidence-based practitioners)”와 “근거 사용자(evidence users)”를 구분하였다.

  • 전자는 1차 의학 문헌에서 근거를 식별하고, 평가하며, 적용하는 능력을 갖춘 임상의를 의미하고,
  • 후자는 체계적 문헌고찰, 임상 진료 지침, 또는 ‘사전 평가된(pre-appraised)’ 근거 형태에 의존하는 사람을 지칭한다.

이 사설은, 많은 임상의들—아마도 대다수—가 비판적 평가 능력을 습득하는 데 필요한 시간과 노력을 투자할 준비가 되어 있지 않다는 점을 사실상 인정한 것이었다. 하지만 이 능력은 맥마스터에서 EBM 초기부터 교육의 최우선 순위로 삼아온 것이었다 (Guyatt et al., 2000). 몇 년 후 한 인터뷰에서, 가이앗은 이러한 입장을 포기하는 것이 매우 힘들었고, 그 짧은 사설을 작성하는 데 “1년을 고뇌했다”고 고백했다 (Daly, 2005).

 

요약하자면, 이 장에서 살펴본 네 가지 탐구의 흐름은 근거중심의학(EBM)이라는 개념을 형성하는 기반이 되었고, 나아가 오늘날 흔히 언급되는 근거 운동(evidence movement)의 구성 요소가 되었다. 그러나 이들 요소는 동질적인 단일 체계(homogeneous entity)를 형성한 것이 아니며, 오히려 복잡하게 얽힌 상호작용과 심층적인 긴장관계 속에서 존재해왔다.

 

+ Recent posts