1. 놀랍게도 앞으로 우리나라 의사국가시험 필기시험은 "가장 옳은 답가지 하나를 고르는" 단일정답형(A형) 문항으로만 구성된다.

 

 

2. 이 무슨 당연한 소리를 '놀랍다'거나 '흥미로운' 이라고 하는거냐 싶겠지만, 과거(짧게는 세달 전, 길게는 십여년 전)에는 A형 말고 의사국가시험에 다른 유형의 문항이 있었다. 

 

 

3. 예를 들어서, 답가지가 열몇개씩 있는 "R형"이라든가, 아니면 "①가, 나, 다 ②가, 다 ③나, 라 ..." 와 같은 보기로 구성된 "K형"이라든가.

 

 

4. 하지만 한번 더 놀랍게도, 문항의 유형은 이것 말고도 훨씬 더 많다 (B형, C형, I형 등등).

 

5. 의사국가시험에 있거나 있었던 A형, R형, K형 문항, 그리고 그 밖의 여러 OO형을 보면 도대체 앞에 붙은 알파벳(A, R, K 등)이 어떤 영어단어의 앞글자이거나, 뭔가 심오한 의미가 있지 않을까라는 생각을 자연스럽게 하게 된다.

 

6. 하지만 마지막으로 한번 더 놀랍게도, 사실 이 알파벳에는 아무런 의미가 없다. 그냥 새로운 문제 유형을 개발하며 (대체로) 알파벳 순서대로 붙인 것이다.

 

1.
"RCT 연구에서 불가피하게 발생하는 unblinding 을 고려하지 않으면 잘못된 결과해석으로 이어질 수 있다. 즉, intervention의 효과를 평가하기 위해 사용하는 평가의 의도가 피험자에게 노출되어서는 안 된다. 예를 들어, 모든 의대생은 매우 명확하게 국가면허시험을 잘 보고자 하는 동기가 높다. 따라서 교육과정과 무관하게 국가시험의 의도가 학생에게 unblind되어있으므로, 교육과정 개편의 효과성을 평가하는 방법으로서 국가시험에서의 성취도를 사용하는 것은 거의 의미가 없다." 

 

2.
아, 그렇다면 어떤 교육과정이 "의도적"으로 [학생이 국가시험에서 고득점을 할 동기]를 억제하려는 시도를 했다면 국시 성취도를 평가 지표로 쓰는 의미가 있을 수도 있겠다...?

 

3.

쓰면서 계속 생각이 꼬리를 무는데, 실제로 소위 big 5 의대에서는 2와 같은 시도를 해볼 만 하다고 생각한다.(우리 학교 아니라고 막말하는건 아니고...) 자대 졸업생에 비해서 자대 병원의 인턴/레지던트 T.O.가 여유가 있는 경우, 여러가지 방식으로 의도적으로 국가시험에 고득점에 대한 강박이나 집착을 낮추고, 그 대신 의사로서의 추구할 수 있는 다양한 진로를 추구해보게 한다면 나름대로 의미있는 시도일지도. 이런 시도를 했는데 국가시험 합격률이 유지되면 그 경우에는 성과 지표로서 의미가 있겠다.

 

4.

영국 의과대학의 MRCP 시험 점수 분포

1

역사적으로 볼 때, 의료에서 규제medical regulation의 주된 관심은 자기 자신을 '의사'라고 부를 수 있는지를 확립하는 것이었다. 과거에는 '미용사' '사기꾼'을 배제시키는 것이기도 했다. 규제가 점진적으로 발전해오면서, 의료행위를 시작하는 시점에 대한 관심이 더 높아지게 되었다. 이 시점은 의과대학생이 의사로 이행하는 이 시점이면서, International Medical Graduates (IMG)가 의료인력에 편입되는 순간이기도 하다.

 

2

의사국가면허시험은 이러한 규제의 한 가지 방법이다. 하지만 모든 국가가 의사국가면허시험을 쓰고 있지는않다. 예를 들어, 영국은 2016년 현재 의사국가면허시험NLE이 없다. 그 대신, 영국은 역사적으로 external examiner에 의존해왔다. GMC와 같은 기관에서 나온 의학교육자들이 의과대학에 방문하여 퀄리티를 점검한다. 국외 의과대학을 졸업한 경우에는 PLAB이라는 시험을 본다.

 

3

많은 국가가 의사국가면허시험을 도입하여 활용하고 있지만, 환자성과가 NLE의 도입으로 향상된다는 근거는 비교적 부족하다. 더 뛰어난 의사들이 NLE에서 더 좋은 성적을 얻는다는 근거는 있지만, NLE에서 점수를 잘 받은 사람이 더 좋은 의료기관에서 근무한다는 점이 교란요인으로 작용할 것이다. 어떤 연구에서는 NLE점수가 낮은 지원자가 궁극적으로 덜 좋은less respected 또는 퍼포먼스가 떨어지는 기관에서 근무하는 결과를 낳음을 보여주기도 하였다.

 

한편, NLE의 결과로 의사의 역량이 더 향상된다는 근거도 없다(도입 전후의 비교 연구가 필요하다). 일부 저자들은 NLE는 전문직으로 들어서는 진정한 장벽이 아니며, 따라서 대중을 보호하지 못한다고 주장하기도 한다. 예컨대 USMLE를 보는 거의 모든 지원자가 궁극적으로 이 시험에 통과하기 때문이다.

 

4

NLE의 목적은 대중들에게 '면허를 받은 의사는 안전하고 독립적 진료 수행이 가능하다'라는 것을 보여주는 것이 될 수 있다. 유사하게 환자, 사회, 병원에 어디서 교육을 받았든, 최소한의 역량은 갖추었음을 보장하기 위한 것이라고 볼 수도 있다. 그러나 대중의 안심reassurance’적어도 부분적으로는 – ‘대중의 인식에 달려 있다. 따라서 대중과 정책결정자가 인식하는 NLE의 역할 NLE실제로 달성하는 것의 잠재적 차이에서 위험이 발생한다. 만약 NLE가 실제로 하는 일이 대중을 안심시키는 것 밖에 없다면, NLE가 환자안전을 향상시킨다는 잘못된 신뢰는 의료 규제의 더 중요한 측면에 대한 관심을 NLE가 뺏어오는distract 것이 된다.

 

5

종합하면, NLE를 반대하는 사람 뿐 아니라 지지하는 사람에게도 근거는 취약하다. IMG가 뒤쳐진다는 강력한 통계적 근거가 있지만, 그 이유는 불명확하다. NLE도입을 통해 의사의 수행능력이나 환자 안전이 향상된다는 근거는 부족하나, 시험결과와 전반적 수행능력Overall performance의 상관관계는 강력하다.

 

따라서 NLE를 도입하는 것의 이득은 기존의 규제 시스템이 얼마나 효과적으로 작동하는가에 달려있을 것이다. 달리 말하면, 정책입안자와 규제기구는 one size fits all 접근법에서 벗어나야 하며, ‘기존 규제 시스템existing regulatory system'의 관점에서 NLE의 근거를 살펴보아야 한다.

 

 

 

출처:

Archer, J., Lynn, N., Coombes, L., Roberts, M., Gale, T., Price, T., & Regan de Bere, S. (2016). The impact of large scale licensing examinations in highly developed countries: a systematic review. BMC medical education, 16(1), 1-11.

1

의사면허의 목적은 안전하고 효율적인 의료행위에 필요한 지식과 스킬을 확실히 갖추게 하는 것에 있다. 기저의 원칙은 면허는 모든 의사에게 적용되어야 한다는 것이다. , 어디서 수련을 받았든, 어떤 세팅에서 진료를 하든 면허가 있어야 한다. 나라마다 다소 차이는 있지만, 독립적 진료행위 면허(unrestricted license to practice)를 받기 위해서는 아래 세 가지의 전부 혹은 일부를 갖춰야 한다.

• 인증받은 의과대학 졸업

• 일정 기간의 감독 하 의료행위(의과대학 졸업 후에 이뤄지기도 함)

• 하나 또는 그 이상의 의사면허시험에 합격

 

그렇다면, 의사면허시험(National Licensing Exam, 이하 NLE)는 어떠한 경향성(trends)을 가지고 있는가?

 

2

NLE는 점점 더 흔해질 것이다.

 

첫째, 의과대학의 수와 다양성 증가하고 있기 때문이다. 지난 20년간 의과대학의 수가 지나치게 증가하여 의학교육의 질을 떨어뜨린다는 우려가 높아져 왔으며, Dr Hans Karle 2003 WMA general assembly에서 의과대학이 1995년부터 54%증가했다고 말했다. 문제는 실제로 학부의학교육의 다양해짐에 따라 지역 간 또는 학교 간 차이가 발생한다는 것이다. 예를 들어, 영국에서는 의과대학에 따라 RCGP RCP 회원자격시험 합격률이 다르다. 미국의 USMLE Step 2에서도 학교마다 평균점수의 상당한 차이가 확인되는데, 이러한 차이는 학교 내 기준(intramural standard) 차이에 기인한다. 이는 Step 1이나 Step 2 CK에서도 마찬가지였다.

 

둘째, 의료인력 유동성이 높아지기 때문이다. 의료인력의 유동성에 대한 접근은 유럽과 북미 간 차이가 있다. 예컨대 유럽에서, 의료진의 이동은 1940년대부터 관찰되었으며 해가 지날수록 그 패턴이 다양해지고 있다. 그러나 유럽에서 의과대학 학부교육에 필요한 기간은 European directive에 의해서 강제되며, 최소 5, 5500시간이 요구된다. 대부분의 유럽 국가에서는 의사국가시험이 없으며, 각 의과대학은 자신의 졸업시험이 있다. 유럽과 달리 미국과 캐나다는 모든 의과대학 졸업생이 NLE를 응시해야 하고, 어느 의과대학을 졸업했든 의사로서 근무work할 수 있으려면 NLE를 통과해야 한다. 영국과 같은 일부 국가에서는 질관리프로그램을 활용하여(모든 영국 의과대학은 GMC에서 인증을 받아야 함) NLE와 비슷한 성과를 내고자 한다. 하지만 이 시스템에도 불구하고 영국 역시 NLE 도입을 고려하고 있다.

 

셋째, NLE 퍼포먼스가 실제 퍼포먼스를 예측하기 때문이다. 일정 수준에서 NLE 퍼포먼스는 이후 의료행위의 퍼포먼스를 예측한다.

 

이 밖에도 NLE를 지지하는 주장의 근거로는 다음이 있다.

• 의료행위의 핵심 영역에서 현저하게 부족한 의사를 가려낼 수 있다는 점

• 공립, 사립 의과대학에 대해서 지속적이고 객관적인 역량 스탠다드를 제공하여 환자를 보호한다는 점

• 해외에서 이주한 의사가 수련과 진료를 시작하기에 앞서 퀄리티를 보증ensure해준다는 점

• 의과대학 (교육의) 스탠다드를 높여준다는 점

 

3

NLE에서 내용특이성이 고려되어야 한다.

 

어떤 평가방법을 사용하든지, 한 케이스에서의 퍼포먼스가 다른 케이스에서의 퍼포먼스를 아주 잘 예측해주지는 못한다. 이러한 현상을 내용(사례) 특이성이라고 한다. 따라서, 고부담 결정을 충분히 반복가능하게 지지해줄 수 있는 점수를 얻으려면, 평가의 길이가 충분히 길어야 하고, 충분한 영역을 포함하여야 한다.

 

4

NLE에서 인지능력 평가를 위한 새로운 시도들이 있다.

 

CBT(1세대: 종이 포맷을 컴퓨터로만 옮긴 것, 2세대: 멀티미디어 문항 및 단답형 문항을 활용하는 것, 3세대: 실제 임상환경의 특징을 반영하여, 시뮬레이션 및 상호작용 요소를 포함하는 시험)가 발전하고 있고(USMLE Step 3 CCS3세대 CBT이다), 비교적 최근에는 문항 자동화 생성(AIG)도 있다. 소프트웨어를 사용하여 수백개의, 새로운 문항을 만드는 것이다. 앞으로 몇 년간 NLE에 컴퓨터-기반 시뮬레이션이 추가될 것으로 기대된다. 다만, 모든 것을 최대한 현실과 유사하게 시뮬레이션 한다는 것이 매혹적으로 보일지 모르지만, written simulation의 파란만장한 역사로부터 그 위험성에 대해서도 배울 점이 많다.

 

최근까지 NLE는 거의 전적으로 closed-book test였기에, 주로 정보를 recall하는 능력을 평가했다. 하지만 CBT에서 응시자는 온라인 참고문헌을 볼 수 있게 될 것이며, 이 역시 3세대 CBT의 또 다른 특징이다. 이러한 시험 방식은 현재 의사의 실제 진료 모습을 더 잘 모방하는 것이며, 피험자의 스스로의 한계를 찾아내는 능력까지를 (간접적으로)평가할 수 있게 될 것이다. 뿐만 아니라, 필요한 외부 자료에 접근하는 능력, 수집된 정보를 환자진료결정에 통합하는 능력도 평가할 수 있게 될 것이다.

 

5

NLE에서 OSCE(OBJECTIVE STRUCTURED CLINICAL EXAMINATIONS)이 활용될 것이다.

 

Harden and Gleeson 1979 OSCE를 처음 설명한 이후 OSCE는 빠르게 전파되었다. 최근에는 호주, 캐나다, 한국, 스위스, 대만, 영국, 미국의 의사면허시험에도 도입되었다. 하지만 여전히 스테이션 수는 적은 편이어서, 합격-불합격 결과가 충분하 reproducible하지 않은 경우가 많다.

 

6

근무지기반평가(Workplace-based assessment, WBA)가 형성적 목적으로 더 많이 사용되겠지만, NLE에서 WBA를 어떻게 사용할 수 있을지는 어려운 문제이다.

 

비록 WBA가 일상의 진료행위를 더 잘 반영하고, 피험자의 학습을 자극할 수 있지만, 총괄평가에서 활용이 쉽지는 않다. WBA가 피훈련자들 사이의 실제 차이를 반영할 수 있지만, 피험자 간 차이의 원인이 판단을 내리는 기준이 교수마다 다르거나, 피험자가 진료한 환자 집단의 특성이 다르거나, 피험자가 진료 시에 활용가능한 자원이 달라서 생겼을 수도 있기 때문이다. 본질적으로 WBA는 임상적 맥락과 분리할 수 없기 때문에, 총괄평가적 활용을 정당화하기 어렵다.

 

7

명확하게, NLE는 많은 한계가 있다. NLE는 기껏해야 진료에 필요한 역량을 측정할 뿐이며, 실제로 진료를 유능하게competently할 것인지를 알려주지는 않는다. 따라서 NLE에서 좋은 퍼포먼스를 보이는 것이 실제 진료를 잘 하는 것으로 이어지지 않을 수 있다. 그러나 NLE에서 안 좋은 퍼포먼스를 보이는 것은 (환경적 요인이 의사의 부족한 점을 보완해줄지라도) 실제 진료에서도 안 좋은 모습을 보일 가능성이 많다.

 

 

 

 

출처:

Swanson, D. B., & Roberts, T. E. (2016). Trends in national licensing examinations in medicine. Medical education, 50(1), 101-114.

1

유럽의사면허시험은 매혹적인 것이지만, 부작용은 충분히 논의되지 않았다. 다섯 가지 신화를 하나씩 살펴보자.

 

2

신화 1: 유럽의사시험 혹은 의사국가시험은 의료행위에 있어서 중요한 영역을 평가하게 해줄 것이다.

 

아니다! 중앙화된 시험은 가장 중요한 학습성과 대신 국가(혹은 유럽) 수준에서 쉽게 평가가능한 것을 강조할 것이다. 시험의 초점은 written exam에 맞춰질 것이고, MCQ가 주를 이룰 것이며, 임상술기나 태도보다는 지식을 평가하게 될 것이다. Schuwirth가 주장한 것처럼 국가시험은 '낮은' 레벨의 스킬에 초점을 두게 되나, 최근의 추세는 프로페셔널리즘, 스칼라십, 과학적 사고 등의 '높은' 수준의 스킬을 강조한다. 과거에는 측정에 대한 논쟁에서 '신뢰도'를 강조했지만, 이제는 'systemic validity'의 개념을 강조하는 데에 이르렀다. 이것은 교육시스템, 교육과정, 교육변화instructional change에 대한 것이다. 중앙화된 시험은 덜 중요한 학습성과를 평가하게 되면서, 교사의 교육과 학생의 학습 패턴에 영향을 주어 뒤틀리게 한다.

 

3

신화 2: 유럽의사시험 혹은 의사국가시험은 평가행위assessment practice의 향상을 가져올 것이다.

 

아니다! 현재의 근거를 보면, 중앙화된 시험이 있는 시스템에서는 평가의 혁신은 저해된다. NMBE는 아마도 평가 전문가들로 구성된 중앙 팀의 가장 좋은 예이며, [평가의 실천][현장의 이해]에 국제적으로 중요한 기여를 한 것이 사실이다. 그러나 NBME와 같은 기구의 우선순위는 필연적으로 달라야 하기 때문에, 평가 실무의 최첨단cutting edge에서 작업work하고, 현장에서 새로운 이니셔티브를 이끌기에 적합하지 않다. 비슷하게, Peter Scoles NBME가 미국에서 문지기 시험Gateway Examination의 지위를 갖게 되면서, USMLE를 변화시키기 위해서는 6~10년의 시간이 필요하게 되었다고 강조하였다. 의과대학의 졸업시험으로 OSCE가 처음 도입된 것은 30년 전이었지만, 다수의 의과대학에서 이미 그것을 도입한지 수 년이 지나서야 중앙화된 시험에 도입되기 시작하였다는 사실도 반례가 될 수 있다.

 

더 나아가서, 중앙화된 시험에 대해서는 근본적인 우려가 있는데, 그 특성상 평가에 대한 낡은outmoded 관점을 가질 수 밖에 없고, 학생들로 하여금 평가란 교육과정이나 교육 프로그램에서 분리되어 어느 한 시점에서 가장 잘 이뤄질 수 있는 것이라는 오해를 가지게 만든다는 것이다. Schuwirth '역량의 관점에서, 이러한 시험(한 차례로 끝나는 시험)은 평가와 교육의 misalignment를 가져온다'고 지적했다.

 

평가는 교육 프로세스의 (외부적) 결과 측정이 아니라, 교육 프로세스의 (내부적) 핵심 부품으로 인식되어야 한다. 또한 평가는 psychometric measurement problem으로만 인식되어서는 안 되며, 교육설계의 문제educational design problem로 인식되어야 한다. , 평가의 목적은 단순히 한 학생의 기준충족여부를 결정하는 것이 아니라, 특정 학생의 역량에 대한 정보를 바탕으로 개개인의 요구에 맞춰 수업과 과목을 tailor하는 데 사용되도록 하는 것이어야 한다. 무엇보다도 이것은 평가가 교육과정에 통합되어야 (교육이 끝날 때 single-shot으로 하는 것이 아니라) 가능할 것이다.

 

4

신화 3: 표준화와 국제화의 시대에, 유럽의사시험 혹은 의사국가시험은 uniformity를 향상시킴으로서 우리의 요구를 충족시킬 것이다.

 

아니다! 의심할 여지 없이, 모든 학교에 해당되는 핵심 역량이 있고, 공통의 평가가 적절한 부분이 있지만, 중요하고 유의한 차이 또한 존재한다. UK에서는 GMC 'promoting equality and diversity'를 질관리프로그램의 한 목표로 지정하고 있다. 또한 국제적으로 기증자(donor) 국가에 의해서 주도되는 시험을 활용하게 된다면, 전 세계적으로 인지적 성취를 강조하는 결과를 초래함으로써, 좋은 교육은 무엇인가에 대한 로컬한 가치는 무시하는 결과로 이어질 것이다.

 

5

신화 4: 의사국가시험은 시스템의 퍼포먼스를 추적할 수 있는 지표이다.

 

Smith '성능 데이터 출판publication으로 인한 의도하지 않은 행동 결과의 수많은 사례'를 언급하며, 그 예로 '터널비전, 최적화미달, 근시, 측정 고정, 게이밍, 골화, 오역 및 잘못된 표현'과 같은 문제를 기술했다. (Smith (1995) identified a ‘huge number of instances of unintended behavioural consequences of the publication of performance data’ and described problems such as ‘tunnel vision, sub-optimization, myopia, measure fixation, gaming, ossification, misinterpretation and misrepresentation’.)

 

또 다른 연구자는 지표indicator는 복잡한 상황을 제대로 반영하지 못할 수 있으며, 각 기관이 지표에만 초점을 맞추려 노력하는 게이밍이 발생하여 시스템이 훼손될 가능성을 지적했다. Hecker and Violato의 연구에 따르면, 의사국가시험의 퍼포먼스를 교육과정평가의 지표로 사용할 때 문제가 발생할 수 있다. USMLE 점수에 기반하여 이들은 '의학교육개혁의 변화는 학생의 성취에 별다른 영향을 주지 못한다'는 결론을 도출하면서도, 동시에 종속변수는 면허시험 점수이며, 의사의 중요한 특성인 공감/문제해결/임상추론 등을 평가하지 못한다는 한계를 인지하고 있었다.

 

표준화된 시험과 고정된 교육과정의 문제는 가장 중요하게 다뤄져야 할 유형의 교육을 죽인다는 데 있다. 그러나 학생이 고득점으로 시험을 통과하게 도와주려는 선생의 노력을 누가 비난할 수 있겠는가? 문제는, 표준화된 시험이 전체 학교 시스템을 평가하는 자료로 사용되는 상황에서 학생이 이 시험에서 좋은 성적을 받도록 가르치려는 유혹을 피하는 것은 거의 불가능하다는 사실이다.

 

6

신화 5: 유럽의사시험 혹은 의사국가시험은 더 안전한 의료행위를 하게 해서 공공을 보호할 것이다.

 

아니다! 중앙화된 시험이 존재하지 않는다고 해서 수준미달의 의사를 양성한다는 근거는 없다. 또한 그러한 시험을 도입한다고 향상된다는 근거 또한 없다. 의사국가시험이 없는 UK의 의과대학 졸업생이 진료역량 측면에서 의사국가시험이 있는 미국의 의사보다 열등하다는 근거는 없다. 또한 Papadakismedical board가 진료중인 의사에게 시행한 징계조치(displinary action) (의사면국가시험에서 측정된 퍼포먼스보다) 비전문직업적 행위와 더 강력한 연관이 있음을 보여준 바 있다.

 

7

전체적인 이득에 대한 근거가 없음을 고려하면, 왜 상당한 양의 자원이 유럽의사시험 혹은 의사국가시험에 투입되어야 하는가를 물어야 할 것이다. 의사국가시험의 도입과 활용에 대한 단계를 아래의 여섯 가지로 나눠볼 수 있다.

(1) Assessment procedures in the medical school are completely independent with no external standards.

(2) The school’s assessment procedures are subject to external inspection and approval in line with specified standards (such as those offered by the WFME).

(3) Examinations in a school are monitored by external examiners including student pass/fail decisions (the current practice in the UK, with the process quality assured by the General Medical Council).

(4) Assessment instruments and some questions are shared between schools and common questions are introduced in examinations.

(5) Students are required to take and pass both an internal school examination and an external European or national examination.

(6) Only a single European or national examination is taken by the student.

 

 

출처: 

Harden, R. M. (2009). Five myths and the case against a European or national licensing examination. Medical Teacher, 31(3), 217-220.

+ Recent posts