JAMA2025 Feb 27. doi: 10.1001/jama.2025.0136. Online ahead of print.

Deleting My Mother's Email Account

 

 

“이메일 계정을 영구히 삭제하시겠습니까?”

 

나는 **"예"**와 "아니오" 위에 커서를 올려놓고, 클릭할 준비를 한다. 커서는 컴퓨터 화면에서 깜빡이며, 한 치의 흔들림 없이 나를 바라본다. 무엇을 해야 하는지는 안다. 그러나 그것을 할 준비가 되었는지는 확신할 수 없다.

 

어머니께서 이야기를 반복하고 사소한 것들을 잊기 시작했을 때, 우리는 그것을 스트레스 탓으로 돌렸다. 그녀의 바쁜 일정, 정치 활동 출마, 혹은 무엇이든 간에... 단지 ‘진짜 이유’만은 아니기를 바랐다. 그러나 더는 그렇게 둘러댈 수 없는 순간이 찾아왔다. 그 뒤를 이은 것은 진료, 검사, 평가였고… 결국은 알츠하이머병(Alzheimer disease)이라는 진단이었다.¹

 

나는 의사의 시선으로 그것을 바라보았다. 그러나 그 시선은 개인적인 명료함도, 병의 경과를 바꿀 수 있는 힘도 주지 못했다. 나는 앞으로 벌어질 일을 알고 있다고 생각했다. 환자와 그 가족들이 이 병으로 어떤 영향을 받는지를 수없이 보아왔다. 기억이 점차 침식되고, 자율성이 사라지며, 자아라는 존재 자체가 서서히 무너져가는 과정을 말이다. 하지만 30년이 넘는 임상 경험도 내 어머니—나의 중심이자 영감이었던 그 생기 넘치고 빛났던 여성—에게서 그 과정을 지켜보는 일에 대비시키진 못했다.

 

어머니는 나에게 진정한 롤모델이었다. 용기를 갖고 살라는 것, 괴롭힘이나 편견, 불의에 맞서라는 것, 순간에 머물지 말고 큰 꿈을 품으라는 것, 그리고 야심찬 목표를 세우라는 것을 가르쳐주셨다. 비판적으로 사고하는 법, 연구하는 법을 알려주셨고, 언제나 가장 도전적인 일을 마주하라고 격려하셨다. 어머니는 늘 변함없는 지지자였고, **내가 어떤 이야기를 해도 판단 없이 오직 사랑으로 받아주는 ‘안식처’**였다. 그녀는 정말 대단한 분이었고, 오늘날 내가 된 사람—전문가로서도, 인간으로서도—그 모든 기반은 어머니가 마련해주신 것이다.

 

하지만 알츠하이머병은 지성이나 관대함에 관심이 없다.

 

처음엔 그녀도 자신의 어려움을 감췄다. 결단력과 자신에게 쓴 메모들로 효과적으로 보완했다. 어느 서랍 속에 숨겨진 종이에는 그녀의 필체로 단 한 줄이 적혀 있었다.

 

“기억, 신경과 의사.”

 

그녀는 알고 있었다. 하지만 행동하지 않았다. 우리가 눈치채고 개입할 때까지.

 

**경미한 로고페닉 실어증(logopenic aphasia)**은 점차 완전한 실어증으로 진행되었고, 감정 기복은 공격성으로, 다시 부드러운 순응으로 변했다. 시간이 흐르며 그녀는 기억을 잃고, 독립성을 잃고, 결국 그녀 자신이라는 존재의 본질을 잃었다.

 

나는 그 전 과정을 함께하며, 돕기 위해 애썼다. 기억 센터, 신경과 전문의, 신경심리학자, 그리고 다양한 전문가들을 찾아갔다. 광범위한 검사, 약물 치료, 상담을 받게 했다. 나는 조율하고, 지지하고, 해석하고, 모니터링하며, 안내하고, 교육했다—그러면서도 단순히 그녀의 아들로 존재하기 위해 안간힘을 썼다.

 

그녀의 이메일을 관리하는 일도 내 역할 중 하나였다. 처음에는 사적인 영역을 침범하는 듯한, 죄스러운 기분이 들었다. 하지만 미납 요금, 깜빡한 약속, 그녀의 상태를 모르는 친구들의 메시지가 걱정되었다. 그래서 마지못해 로그인했다. 그녀의 받은 편지함은 스팸, 청구서, 오래된 사진, 그리고 한때 생기 넘쳤던 삶의 파편들로 가득 차 있었다. 나는 그 모든 메일을 읽고, 스팸을 삭제하고, 사진을 저장하고, 중요한 것 같으면 전달했다. 그 과정은 끝이 없었고, 상실감을 불러왔지만 이상하게도 위로가 되었다. 그녀를 위해 할 수 있는, 유일하게 손에 잡히는 무언가였기 때문이다.

 

마침내 모든 걸 정리했다. 그런데도 나는 계속 로그인을 했다. 혹시 잊혀진 친구가 연락을 줄까 싶어서. 하지만 로그인할 때마다 그녀가 없다는 사실이 또렷하게 다가왔고, 마음은 산산이 부서졌다.

 

얼마 전, 어머니는 세상을 떠나셨다. 그 상실의 무게는 지금도 깊게 내리눌러 있다. 그녀—정열적이고 사랑이 넘쳤던 존재—는 이제 없다. 그러나 매일 나는 그녀의 이메일을 열고, 의미 없는 메일 하나하나에 “스팸”을 누른다. 이제 그녀의 받은 편지함은 공허한 공간이 되었다—과거에 존재했던 의미 있는 삶에 대한 조용한 증언일 뿐이다.

 

나는 컴퓨터 앞에 앉아 화면을 응시한다. 화면에는 다시 프롬프트가 뜬다.

 

“이메일 계정을 영구히 삭제하시겠습니까?”

 

커서는 여전히 깜빡이고, 내 손은 마우스 위에 머문다. 나는 머뭇거린다. ‘종결’이라는 무게가 나를 짓누른다. 그녀의 부재는 너무 생생하다. 눈을 감자 그녀가 떠오른다—질병으로 무너진 모습이 아니라, 나의 삶과 가치관을 형성해주고 오늘날의 나를 만든 그 어머니의 모습이.

 

화면은 아무 말 없이 정지되어 있다. 나는 깊이 숨을 들이쉬고, 눈을 뜬다. 화면에 떠 있는 마지막 질문을 바라본다. 손을 가다듬는다. 나는, 아직도 준비가 되었는지 모르겠다.

 

하지만, 나는 클릭한다.

 

 

 

 

 

 

 

 

 

인공지능(AI)의 급속한 발전은 다양한 산업 분야에서 경제성과 효율성을 크게 향상시켰으며, 의료 분야도 예외는 아니다. 이 혁신의 최전선에는 **대형 언어 모델(large language models, 이하 LLMs)**이 있다.¹–³ 이들은 임상 업무 수행에 있어 초기부터 유의미한 성과를 보였다. AI가 문서화(documentation), 의사소통(communication), 심지어 임상적 추론(clinical reasoning)과 같은 핵심 역량을 *보완(augment)*할 것으로 예상되는 가운데, 의료 교육에서는 필연적으로 다음과 같은 핵심 질문이 제기된다: “AI 시대에 미래의 의사들을 어떻게 교육해야 하는가?”

 

AI가 제공하는 가능성은 분명 매력적이지만, 이를 현대 의학교육에 성공적으로 통합하려면 그 장점과 한계를 섬세하게 이해하는 것이 필수적이다. 더불어, AI 활용은 유능하고(compentent), 공감하며(compassionate), 적응력 있는(adaptable) 의사를 양성하려는 의료 교육의 본래 목적과도 부합해야 한다. 이 글에서는 AI가 교육, 학습, 평가 방식에 혁신을 가져오면서 다음 세대의 의사 양성 방식을 어떻게 변화시킬 수 있는지를 고찰하고자 한다. 현재의 활용 가능성을 넘어, 이들 모델은 **교육 기회의 표준화와 민주화(standardization and democratization)**를 가능케 하여, 과거에는 상상하기 어려웠던 기회들을 제공하고 있다.

 

LLM은 임상적 과업에서 놀라운 성과를 보여왔다.¹² 일부 맥락에서는 이 모델들이 표준화된 평가 기준에서 인간 의사와 유사하거나 오히려 뛰어난 성과를 보이기도 했다.⁴ 겉으로 보기에는, 이러한 성공이 곧 LLM이 임상적 의사결정에 필요한 **추론 과정(reasoning)**을 복제한다는 뜻처럼 보일 수 있다. 만약 이것이 사실이라면, 이러한 추론 능력은 모델이 결과를 도출하는 ‘블랙박스’를 열어, 의학 실천을 보완할 수 있는 투명하고 합리적인 과정을 제공할 전례 없는 기회를 의미한다. 그러나 최근 연구들은 이 모델들이 실제로 논리적 추론을 수행하는지에 대해 의문을 제기하고 있으며, 이들이 단지 통계적 패턴 인식에 의존하는 것이 아닌가 하는 문제 제기가 이어지고 있다.⁵–⁸ LLM은 훈련 데이터에서 패턴을 인식하고 이를 재현하는 방식으로 작동한다. 이러한 작동 방식은 임상적 문맥에서는 **유행어(buzzwords)**나 **자주 함께 등장하는 임상 특성(co-occurring clinical features)**에 반응하여, 그럴듯해 보이지만 **기전적 깊이(mechanistic depth)**가 부족한 진단이나 치료 계획을 생성하게 만들 수 있다.

 

의학교육의 목표는 단순한 사실 전달이 아니라, 임상 가설(clinical hypothesis)에 도달하는 사고 과정을 가르치는 데 있다. 실제 임상에서는 상황이 미묘하지만 중대한 방식으로 변화할 수 있다: 새로운 증상이 나타나거나, 병력(history)을 다시 고려하게 되거나, 검사 결과가 기존 정보를 뒤흔들 수도 있다. 이처럼, 진정한 추론은 과거 데이터를 기반으로 ‘가장 가능성 높은 답’을 고르는 것이 아니라, 실시간으로 사고 방식을 재평가하는 과정이다. LLM이 미국의사면허시험(USMLE)과 같은 단일 정답(single-answer) 평가에서 좋은 성과를 보이는 것은 고무적이지만, 이는 동적인 임상적 추론 능력을 반영한다기보다는, 패턴을 인식하고 사실을 회상하는 능력을 보여주는 것이다. LLM이 임상 추론 교육에서 파트너 역할을 수행하려면, 복잡한 임상 사례를 단계적으로 추론하고, 자신의 의사결정을 정당화하며, 불확실성과 모호함 속에서도 진단적 사고를 반복적으로 정제해 나가는 새로운 평가 기준이 필요하다.²

 

 

진정한 임상 추론(clinical reasoning) 능력을 갖춘 대형 언어 모델(LLM)이 개발된다면, 의학교육의 패러다임은 근본적으로 변화할 수 있다. 최근 수년간 사례 기반 학습(case-based learning)이 현대 의학교육의 핵심으로 자리 잡음에 따라, 이러한 모델은 교육적 사례에서 **의대생의 사고 과정을 평가하고 비평하는 ‘비판적 조력자(informed critic)’**로 기능할 수 있으며, **튜터(tutor), 평가자(grader), 심지어 토론 파트너(discussion partner)**의 역할까지 수행할 수 있게 된다. 이와 같은 기술은 또한 복잡한 텍스트—예컨대, 교내 교육과정 문서, 의학 교과서, 동료 심사 기반 생물의학 논문—를 학습자 수준에 맞게 해석할 수 있는 도구로서 활용될 수 있다. 이러한 기능은 의대생뿐 아니라, 전공의(resident), 임상의(attending physician)에게도 유용하다. 왜냐하면 의학은 끊임없이 변화하는 분야이므로, 이러한 도구를 개발하는 일은 의료계 전체가 자기 속도에 맞춰 발전해 나갈 수 있도록 하는 기반을 마련하는 작업이기 때문이다.

 

이제 더 이상, 임상 실습 중 우연히 마주치는 환자만을 대상으로 학습하는 시대는 지났다. LLM은 다양한 환자 증례 수백 가지를 빠르게 제시함으로써 고차원 임상 기술을 정교하게 연마하는 데 기여할 수 있다. 또한 지리적 또는 사회인구학적 특성으로 인해 특정 유형의 환자에 편중된 교육 경험을 갖게 되는 문제를 보완하기 위해, LLM을 활용해 희귀질환이나 특이 환자 증례를 포함한 폭넓은 임상 경험을 제공할 수 있다. 이를 구체적으로 실현하는 방법 중 하나는 LLM을 표준화 환자(standardized patient, SP)와의 상호작용에 활용하는 것이다. 즉, 객관적 구조화 임상시험(objective structured clinical examination, OSCE)에서 표준화 환자 역할을 수행하는 특화된 도구를 사용하는 방식이다. 우리는 이러한 도구를 SP-LLM이라 명명했으며, 이는 의사소통 기술을 연습할 수 있는 손쉽고 접근 가능한 환경을 제공한다.⁹ SP-LLM은 SP의 역할을 연기하도록 훈련 및 프롬프트(prompt) 설정이 가능하며, 이어서 학생의 수행을 평가하도록 다시 프롬프트할 수도 있다. 이로 인해 학생들은 *초희귀질환(ultrarare diseases)*이나 *문화적으로 특수한 환자 표현(culturally distinct presentations)*을 포함한 다양한 상황에 노출될 수 있다.

 

또한, LLM은 의학교육 전문성을 전 세계적으로 분산시킬 수 있는 확장 가능하고 비용 효율적인 학습 도구가 될 잠재력을 지니고 있다. 이들은 학생의 질문에 대해 정확한 설명을 생성하고, 표준화 시험이나 기관 내 교육과정을 대비하는 데 도움을 줄 수 있으며, 특히 **자원이 제한된 환경(resource-limited settings)**에서 그 가치가 더욱 크다. 예컨대, 환자 다양성이 부족하거나 환자 수 자체가 적은 학교에서는 이러한 LLM 기반 모델을 교육 보완 수단으로 활용함으로써, 학생들이 보다 포괄적인 임상 경험을 접할 수 있도록 보장할 수 있다. 그러나 이러한 도구에 공정하고 광범위하게 접근하려면, 각 기관의 자원 수준과 지역 간 경제적 차이를 고려한 기술 라이선스 모델이 필요하며, 자원이 풍부한 기관과 제한된 기관 간의 협력 파트너십도 중요하다.

 

의학교육 맥락에서 LLM을 개발하고 검증하는 일은—임상 추론 과정이 면밀히 검토될 수 있는 이 환경에서—이후 임상 실무에 통합될 수 있는 기반을 제공한다. AI가 투명하고 신뢰할 수 있는 방식으로 추론할 수 있다는 것을 보여줄 수 있다면, 의료 전반에 걸쳐 LLM을 폭넓게 응용할 수 있는 기반이 마련되며, 이는 곧 **신뢰 가능한 임상 의사결정 지원 시스템(clinical decision support)**으로 나아가는 길이 열릴 것이다.

 


AI가 **일상적인 문서화(routine documentation)**나 **의무기록 검토(medical record review)**와 같은 업무를 수행하게 됨에 따라, **미래의 의사들은 이러한 기술의 책임 있는 관리자(responsible stewards)**로서의 역할을 감당해야 한다. 미래의 의사에게는 임상 추론(clinical reasoning), 데이터 해석(data interpretation), **윤리적 감독(ethical oversight)**과 같은 고차원의 역량이 요구된다. 따라서 의학교육은 변화하는 환경에 적응해야 하며, 학생들에게 **알고리즘 기반 결과물(algorithmic outputs)**을 비판적으로 평가하고, 문맥에 맞게 해석하며, 환자 진료에 안전하게 통합하는 방법을 가르쳐야 한다. 이를 위해 교육과정은 **데이터 시스템 리터러시(data systems literacy)**에 대한 심층적인 교육을 포함하여, 의사가 이 강력한 도구들을 신중하게 구현하고 감독할 수 있는 능력을 갖추도록 해야 한다.

 

그러나 이러한 기술적 정교함(technical sophistication)은 **핵심 임상 기술(core clinical skills)**을 희생해서는 안 된다. 기술은 언제든 실패할 수 있기 때문에, 의학교육은 AI 기반 진료와 전통적 진료 모두에 자신감을 갖춘 의사를 양성해야 한다. 그래야만 예기치 못한 시스템 중단(unplanned downtimes), 보안 침해(security breaches), 그리고 전염병을 포함한 공중보건 위기(unprecedented public health challenges) 등의 다양한 상황에서도 환자 진료의 질이 최고 수준으로 유지될 수 있다. 이러한 **이중 역량(dual competency)**을 갖추기 위해서는 **병력 청취(history taking), 신체검진(physical examination), 감별진단(differential diagnosis)**과 같은 기본 임상 기술을 보조 도구 없이 스스로 수행하도록 도전하는 학습 경험을 통해 지속적으로 강화해야 한다. 다행히도, 이러한 이중 역량을 구축할 수 있는 길은 이미 존재한다. 오늘날 전통적인 방식으로 훈련받은 임상의들이 실제 임상 현장에서 AI를 적극적으로 통합하고 있으며, 이들로부터 얻은 교훈은 다음 세대를 위한 교육에 유용한 통찰을 제공할 수 있다.

 

미래의 의과대학은 단순히 AI를 수용하는 데 그치지 않고, 검증된 교육 방법과의 통합을 통해 접근성의 격차를 해소하고, 확장성과 교육의 엄격함을 동시에 확보해야 한다. 이때 가장 중요한 것은, **임상 진료에서의 인간적인 요소(human elements of clinical care)**를 보존하는 동시에, 끊임없이 변화하는 의료 환경에 적응하는 의사를 양성하는 것이다. 이러한 비전을 실현하려면, 신기술—특히 신흥 AI 기술의 능력과 한계, 그리고 궁극적으로 다가올 인공지능 일반화(artificial general intelligence)의 확산—을 정면으로 마주해야 한다. 이러한 도전에 대응하려면, **의사와 교육자는 이 모델에 대해 깊이 이해하고 있는 기계학습 전문가(machine learning experts)**와 협업해야 하며, 이를 통해 의학교육과 환자 진료의 수준을 최고로 유지할 수 있어야 한다.

 

비록 의학교육은 앞으로도 지속적으로 AI와 같은 최신 기술을 통합해 나갈 것이지만, 그것이 진정으로 최상위 수준의 임상 진료(elite clinical care)의 기반이 되기 위해서는, 다음 세대의 의사에게 반드시 철저한 추론의 원칙(rigor in reasoning), 공감(empathy), **도덕적 판단(moral judgment)**을 심화된 수준으로 체득하게 해야 한다.

 

 

 

 

 

JAMA. 2025 Mar 31.  doi: 10.1001/jama.2025.2789. Online ahead of print.

Building the AI-Enabled Medical School of the Future

Avena, K. M., Quintanilha, L. F., Luzardo Filho, R. L., & Andrade, B. B. (2025, January). Lessons learned from the expansion of medical schools in Brazil: a review of challenges and opportunities. In Frontiers in Education (Vol. 9, p. 1494445). Frontiers Media SA.

 

 

🇧🇷 브라질 의학교육, 어디까지 왔을까?

의과대학의 확장, 민영화, 그리고 형평성의 교차점

 

👩‍⚕️ 요즘 전 세계적으로 의학교육(📚 medical education)이 빠르게 변화하고 있다는 거, 알고 계셨나요? 오늘은 최근에 나온 흥미로운 논문을 소개해보려고 해요. 이 논문은 브라질의 의학교육 시스템이 어떻게 확장되고 있는지, 그 과정에서 어떤 도전과 기회가 있는지를 아주 잘 정리해줍니다.


1️⃣ 브라질은 지금 ‘의대 대확장 시대’

브라질은 지난 10여 년간 의과대학(medical schools) 수와 정원을 엄청나게 늘렸습니다. 그 중심에는 정부 주도의 **Mais Médicos 프로그램(PMM, 2013)**이 있었죠. 이 정책은 지방 소도시나 의료 취약지역에도 의료 인력을 공급하려는 목적에서 시작됐어요. 실제로 **2014년 이후 생긴 의과대학 정원이 전체의 55.7%**에 달한다고 하니, 변화의 폭이 정말 컸죠!

 

하지만 문제는 여기서 끝나지 않아요. 확장은 되었는데, **교육의 질(quality of education)**이나 **접근성의 형평성(equity of access)**은 여전히 숙제로 남아 있거든요.

“Increasing access to medical training is crucial to meet the health needs of the population, especially in underserved regions, yet the quality of education and equity in access must be non-negotiable priorities.”
→ “보건서비스가 부족한 지역에서 국민의 건강 수요를 충족하기 위해 의학교육에 대한 접근성 확대는 필수적이다. 하지만 교육의 질과 접근의 형평성은 결코 타협할 수 없는 우선순위이다.”


2️⃣ 민영화(Privatization)라는 양날의 검

🔍 의과대학 정원 확장의 주체를 살펴보면, 놀랍게도 87%가 민간기관에 의해 제공되고 있어요. 특히 사립 의대 등록금은 브라질 최저임금의 7배가 넘는다고 하니, 일반 서민 가정엔 상당한 부담이겠죠. 

🎓 물론 정부는 **학자금 대출(FIES)**이나 장학 프로그램(PROUNI) 같은 제도를 통해 저소득층 학생들의 진입 장벽을 낮추려 하고 있어요. 그런데 여전히 많은 학생들은 등록금의 벽을 넘지 못하고 있는 실정이에요.

“This reality clearly limits access to medical education to a portion of the economically privileged population.”
→ “이러한 현실은 경제적으로 특권층에 속한 일부 인구만이 의학교육에 접근할 수 있도록 만든다.”


3️⃣ 농촌 의사 부족, 브라질만의 문제가 아니야

🌏 브라질처럼 농촌 지역 의사 부족 문제는 전 세계 공통 이슈예요. 캐나다, 호주, 인도 등도 똑같은 고민을 안고 있어요. 예를 들어 캐나다는 농촌 출신 학생을 선발하거나, 커리큘럼에 농촌 보건 경험을 포함하는 방식으로 대응하고 있죠. 브라질도 비슷하게 우선전공(전공의) 자리를 의료 취약 지역에 집중 배치하고, 지역사회 기반 임상 경험을 강조하는 등 유사한 노력을 기울이고 있어요.

“Countries like India and China have also been undergoing substantial transformations in the context of medical education, highlighting the need to assess and share experiences to address common challenges and promote advancements in the quality and accessibility of health services on an international scale.”
→ “인도와 중국도 의학교육의 맥락에서 중대한 변화를 겪고 있으며, 이는 공통의 도전 과제를 해결하고 보건서비스의 질과 접근성을 국제적으로 개선하기 위한 경험 공유의 필요성을 부각시킨다.”


4️⃣ 교육의 질은 누가 책임질까?

🧪 학생 수는 늘었는데, 실습병원, 임상현장, 교수진은 그대로라면…? 우려가 되는 부분이죠. 실제로 브라질에서는 의학교육 종사자의 보상이 진료 행위보다 현저히 낮아서 교수 확보에 어려움을 겪고 있다고 해요. 그럼에도 불구하고, 대형 병원 외에도 1차의료(primary care), 커뮤니티 병원, 비응급 의료기관 같은 다양한 현장 기반 교육 기회는 학생들에게 더 넓은 시야를 제공할 수 있다는 점에서 긍정적인 요소로 작용하고 있어요.

“These alternative settings not only enrich clinical exposure but also cultivate interest in underserved areas, thereby contributing to workforce redistribution and addressing systemic inequities.”
→ “이러한 대안적 현장들은 임상 경험을 풍부하게 할 뿐만 아니라, 의료취약지역에 대한 관심을 키워 의료 인력 분포의 재조정과 구조적 불평등 해결에 기여할 수 있다.”


5️⃣ 앞으로 우리가 고민해야 할 질문들

📌 이 논문이 던지는 가장 중요한 메시지는 이거예요:
“교육의 접근성을 넓히는 것도 중요하지만, 질과 형평성은 절대 타협해서는 안 된다.”

그리고 이 문장도 꼭 기억해두세요:

“There is an urgent need to focus on training physicians that transcend technical skills and include cultural and socio-emotional skills.”
→ “기술적 역량을 넘어, 문화적·사회정서적 역량을 포함하는 의사 양성이 시급히 요구된다.”


✍️ 마무리하며…

브라질의 경험은 단지 그들만의 문제가 아니라, 의학교육을 통해 사회적 형평성과 공공의 이익을 실현해야 하는 전 세계의 과제이기도 해요. 우리는 ‘의과대학이 늘었다’는 양적인 수치 뒤에 숨어 있는 질, 형평성, 윤리, 공공성을 계속해서 질문해야 합니다.


서론

브라질의 학부 수준 의과대학 과정의 최근 확장은, 보건 인력의 지역 간 불균형 문제를 완화하기 위한 핵심 전략으로 등장하였다. 학부와 레지던트 과정 모두에서 신설 정원의 대대적인 재구조화는 2013년 정부가 도입한 “Mais Médicos 프로그램” (Programa Mais Médicos, PMM)에 의해 촉진되었으며, 이 프로그램은 브라질 공공보건 시스템인 SUS (Sistema Único de Saúde) 내에서 서비스에 대한 접근성과 질을 향상시키는 것을 목표로 하였다. 더불어, **교육부(MEC)**는 신규 의과대학 과정의 인가 및 기존 과정의 정원 확대에 관한 지침을 수립하였고, 이는 브라질의 교육 및 보건 환경이 매우 복합적인 양상을 띠고 있음을 여실히 보여준다.

 

이러한 정부 주도의 정책은 특히 보건 인력이 부족한 지역에서 의과대학 정원의 현저한 증가를 이끌었고, 동시에 민간 고등교육 기관들의 시장 진입을 촉진하였다. 이러한 신규 정원 확대는 또한 교육부 포고령 제328/2018호(Brazil Ministry of Education, 2018)에 의해 부과되었던 의과대학 신설에 대한 5년간의 유예 조치가 철회되면서 가속화되었다. 이 유예 기간 동안 일부 기관들은 사법부의 인가를 통해 활동을 개시하기도 하였으며, 해당 포고령의 철회로 인해 현재 수백 건의 의과대학 개설 요청 절차가 진행 중에 있어, 향후 정원 수의 급격한 증가가 예상된다.

 

그럼에도 불구하고, 의과대학의 양적 확대와 지역 분포의 개선에도 불구하고, 현재의 의학교육 과정(Figure 1 참조)은 여러 비판과 도전 과제에 직면해 있다. 이에 본 연구는, 브라질 남동부, 북동부, 중서부 지역에서 의과대학의 기획, 실행, 운영에 직접 관여한 소수의 의학교육 전문가들의 경험을 바탕으로 구성되었으며, 역사적 맥락, 극복한 도전들, 현 정부 정책의 주요 성과와 한계에 대한 자세한 분석을 제공한다. 또한, 현재 의학교육의 구조가 향후에 미칠 잠재적 영향에 대해서도 비판적 성찰을 제시한다.

 

 

본 연구는 의학교육의 확산, 지역화, 민영화가 동시에 진행되는 브라질의 현실 속에서, 의학교육 및 보건의료 서비스의 질을 우선시하는 공공정책 논의에 기여하기 위한 비판적이고도 건설적인 분석을 제공한다. 여기서 도출된 교훈과 통찰은 정책 입안자들에게 실질적인 지침을 제공하고, 의사 부족 및 보건 인력의 불균등한 분포 문제를 겪고 있는 다른 국가들에게도 혁신적이고 지속가능한 해결책을 모색하는 데 있어 영감을 줄 수 있을 것이다.

 

연구는 정부 공식 보고서, 법령, 학술 문헌을 수집하여 역사적 및 현대적 주요 경향을 파악하는 방식으로 수행되었으며, **국가 교육 기본법(LDB, Lei de Diretrizes e Bases da Educação Nacional, 1996)**과 **의과대학 교육과정에 대한 국가 교육위원회(CNE, Conselho Nacional de Educação)**의 **국가교육과정지침(DCNs, Diretrizes Curriculares Nacionais, 2014)**을 포함한 규제 프레임워크에 대한 체계적 검토가 이루어졌다. 또한, 국제적 기준들과의 비교를 통해 법적 체계와 최신 근거 기반 연구들 간의 간극과 개선점을 식별하였다. 이 접근 방식은, 보건 분야 고등교육의 민영화 및 의과대학의 지역 분포에 대한 데이터를 종합적으로 검토하고, 전문가 인터뷰 및 논의를 통한 질적 자료를 더해 해석하는 데 유효하였다.

 

따라서 본 연구는, 브라질 내 의학교육의 확산과 민영화가 초래하는 복잡한 현실 속에서, 의료 인력의 양적 증가만이 아닌, 교육의 질을 고려한 정책적 접근이 필요함을 강조하며, 향후 지속가능하고 공공의 이익을 반영하는 의학교육 정책 설계를 위한 비판적이고도 건설적인 논의를 제공하고자 한다. 여기서 제시된 교훈과 통찰은, 유사한 문제에 직면한 국가들에게도 유의미한 방향성을 제공할 것이다.

 

 

브라질 의학교육의 역사적 맥락

교육은 한 국가의 사회적, 경제적, 인적 발전을 위한 핵심 기반 중 하나를 이룬다. 경제와 혁신이 가속화되는 세계화 시대에 있어, 질 높은 교육을 통한 인재 양성은 국가 경쟁력의 결정적인 요소로 작용한다(Garcia, 2022). 지난 수십 년 동안의 진전에도 불구하고, 브라질의 교육 시스템은 여전히 심각한 도전과제들에 직면해 있으며, 특히 양질의 교육에 대한 지역 간 접근성 격차는 여전하다(Albuquerque et al., 2017). 이러한 불균형은 국민 건강 증진에도 큰 영향을 미치고 있으며, 이는 브라질 헌법(1988)에서 건강을 국가가 보장해야 할 권리로 명시하고 있음에도 불구하고, 여전히 전국 곳곳에서 의료 전문 인력의 부족 현상이 지속되고 있음을 의미한다.

 

따라서 의사의 양성은 모든 국민이 건강 서비스를 보장받을 수 있도록 하는 데 있어 핵심적인 역할을 한다. 이는 의료 인력의 지역 간 불균형이 곧 의료 서비스의 질과 효율성에 직접적인 영향을 미치기 때문이다(Perim, 2020). 브라질의 경우, 인구 1,000명당 2.6명의 의사라는 평균 수치는 일견 적절해 보일 수 있으나, 이는 실제로는 경제적으로 더 발달한 지역들(중서부, 남부, 남동부) 및 **주요 도시(수도권 지역)**에 의료 인력이 과도하게 집중된 결과로 왜곡된 수치이다. 반대로, 북부와 북동부 지역, 그리고 내륙의 중소 도시들은 심각한 의사 부족 현상을 겪고 있다. 구체적인 수치로 살펴보면, 인구 1,000명당 의사 수는 중서부(3.10명), 남동부(3.39명), 남부(2.95명) 지역이 월등히 높은 반면, 북부(1.45명), 북동부(1.93명) 지역은 상대적으로 현저히 낮은 수치를 기록하고 있다(Figure 2 참조). 이와 마찬가지로, 수도권 지역의 인구 1,000명당 의사 수는 내륙 도시 평균의 약 3.3배에 달하며, 극심한 불균형을 보여준다(Scheffer et al., 2023).

 

 

 

브라질 의학교육의 규제 체계
Regulatory frameworks of Brazilian medical education

 

앞서 언급된 여러 도전과제를 고려할 때, 보건 취약 지역의 수요를 충족하고 전국적으로 공평한 건강서비스 접근성을 보장하기 위해, 우선순위 지역에 의사를 전략적으로 양성하고 배치하는 정책의 필요성은 명백하다. 이러한 점을 해결하기 위해, 브라질의 의학교육은 오랜 기간에 걸쳐 법적 체계와 다양한 정부 프로그램을 통해 발전해왔으며, 이들은 의료 전문직 교육의 확장과 질적 향상을 목표로 설계되었다. 이 중 핵심적인 것은 1996년에 제정된 **국가교육기본법(LDB, Lei de Diretrizes e Bases da Educação Nacional)**과 2014년에 수립된 **의과대학 교육과정에 대한 국가교육과정지침(DCNs, Diretrizes Curriculares Nacionais)**이다(Brazil, 1996; 2014). 이들 규제 틀은 의학교육의 전반적인 기반을 제공하지만, 의사의 지역 간 불균형 문제나, 민간 의과대학의 급속한 확장에 따른 교육의 질 저하 문제는 여전히 해결되지 않고 있다. 본 연구는 이러한 논의에 기여하고자, 현재 정책의 강점과 한계에 대한 통찰을 제공하고, 최신 연구 결과를 바탕으로 정책 개혁이 필요한 영역을 식별하였다.

 

**LDB(1996)**는 브라질 교육의 근간을 규정하며, 의사를 포함한 보건 전문가 양성의 원칙을 정의한다. 이 법은 전인적이며 인간 중심적이고 윤리적인 교육을 강조하며, 보건의 전 영역과 국민 건강 증진을 포괄하는 접근을 요구한다. 한편, **의과대학 DCNs(2014)**는 각 대학이 교육과정을 설계할 때 지켜야 할 방향성을 명시하며, 비판적 사고력, 팀워크, 공공보건에 대한 민감성과 같은 핵심 역량 개발에 중점을 둔다.

 

이러한 법적 틀 외에도, 2013년에 도입된 **“Mais Médicos 프로그램(PMM)”**은 브라질의 의학교육과 보건 시스템에 중대한 영향을 미쳤다. 이 프로그램은 의사 인력이 부족한 지역, 특히 오지나 취약 지역에서의 건강서비스 접근성을 향상시키기 위해, 외국 의사를 유치하고 지역 배치를 우선시하였다(Brazil, 2013). 정치적 논란과 비판에도 불구하고, PMM은 지역 간 건강 불균형을 완화하고 1차 보건의료를 강화하는 데 기여하였다.

 

또한, 이 프로그램은 의과대학의 수와 학부 정원의 확장을 가속화하였고, 의료 인력이 부족한 지역에 더 많은 정원을 배정하였다. 그러나 여전히 인프라 부족, 의사의 불균등 분포, 경제적으로 취약한 지역에서의 인력 유치 및 유지의 어려움 등 다양한 문제가 지속되고 있다. 이러한 도전 과제는 브라질 보건 및 교육 시스템의 복합성을 드러내며, 양질의 교육과 공정한 인력 분포를 동시에 달성할 수 있는 통합적 정책의 필요성을 부각시킨다.

 

나아가, PMM은 의과대학의 재조직과 정원 확대를 더욱 추진하였으며, 인구 대비 의과대학 정원 수 및 의사 수가 낮은 지역을 중심으로 우선적으로 신규 대학 및 정원을 배정하였다(Brazil Ministry of Education, 2024b). 그러나 이러한 노력에도 불구하고, 일부 교육기관의 인프라 부족, 전국적인 의사 분포의 불균형, 경제적 취약 지역에서의 인력 유지 문제는 여전히 해결되지 않고 있다. 이러한 역사적 도전과제들브라질 교육 및 보건 시스템의 복잡성을 상기시키며, 전국적으로 양질의 의학교육과 공정한 인력 분포 및 유지를 보장할 수 있는 정책의 통합적 설계가 얼마나 중요한지를 보여준다. 특히, 보건 서비스가 부족한 지역을 우선 고려한 정책적 대응이 절실히 요구된다.

 

브라질 의학교육의 민영화
Privatization of Brazilian medical education

브라질 의사 인구에 대한 최근 인구통계 보고서(Scheffer et al., 2023)에 따르면, 2022년 기준으로 브라질에는 총 389개의 의과대학이 존재하며, 학부 과정에서 41,805개의 정원을 제공하고 있었다. 이 중 23,287개(55.7%)의 정원은 2014년 PMM(Mais Médicos 프로그램) 도입 이후 새롭게 창설된 것이다. 이 보고서의 추가 분석 결과, 해당 시기는 브라질 의학교육의 민영화가 본격적으로 지속된 시점임을 확인할 수 있다. 2013년부터 2022년까지 새롭게 신설된 의과대학 정원의 약 87%가 민간 고등교육기관에 의해 제공된 반면, *그 이전 시기의 해당 비율은 53.4%*에 불과했다. 절대 수치로 보면, 지난 20년 동안 **공립 고등교육기관의 연간 정원은 5,917명에서 9,725명으로 증가(+64%)**한 반면, 민간 의과대학은 7,001명에서 32,080명으로 무려 358% 증가하였다.

 

이러한 상황에서, 의과대학 정원의 급속한 증가, 공공기관의 관리 부실 및 예산 삭감에 따른 쇠퇴, 그리고 동시적인 민영화의 확대교육의 질에 대한 정당한 우려를 불러일으켰다. 연구자들은 이러한 요인들이 종합적으로 의학교육의 질 저하에 기여할 수 있다고 지적하고 있다. 예를 들어, 정원의 대폭 확대에 따른 입학 기준의 완화는 학생 탈락률 증가나 교육 수준 저하의 위험과 관련될 수 있다. 그러나 현재까지 교육부(MEC)가 시행하는 기관 평가 및 졸업생 성과 평가(ENADE: National Student Performance Exam)는 이러한 시나리오를 명확하게 뒷받침하지는 않는다.

 

최근 연구에서는 브라질 의학교육의 전반적 상황을 분석하고, 규제기관이 수행한 기관 평가 결과를 기반으로 학부 교육의 성과를 추론하였다. 그 결과, 대다수 브라질 의과대학 과정은 '예비 과정 개념(CPC)' 지표에서 평균 3점(5점 만점)을 기록, 전반적으로 중간 수준에 해당하는 것으로 나타났다(Brito et al., 2024; Santos Júnior et al., 2021). 본 연구진의 또 다른 연구에서는 **ENADE 점수 평균이 2.7점(5점 만점)**으로 확인되었으며, 낮은 등급(1~2점)을 받은 학교 수는 상당히 감소한 것으로 나타났다(Figure 3). 이러한 데이터는 매우 고무적인 수준은 아니지만, 최근 학교 수의 확대가 교육의 질을 현저히 저하시키지는 않았음을 시사한다. 그럼에도 불구하고, 질적 향상을 위한 개선 여지는 충분히 존재함이 명백하다.


의사의 지리적 분포 개선을 위한 노력
The quest for better geographical distribution of doctors

브라질 의학교육의 최근 변화 중 또 하나 주목할 만한 지점은, 내륙 지방 도시들에서 의과대학의 존재가 확대되었다는 것이다. 이 움직임은 의사 인력이 대도시 및 경제 선진 지역에 집중된 기존 구조를 개선하기 위한 것이었으며, 전국적인 불균형 해소를 목표로 했다. 이러한 목표는 적어도 일부는 성취되었으며, 오지 지역에서 건강 서비스 접근성이 향상되었다는 증거가 존재한다. 이는 신규 의과대학 졸업생들을 해당 지역에 유치하고 유지하기 위한 정책적 노력의 결과로 평가된다. 이 맥락에서, 가정의학 및 지역사회 의학(Family and Community Medicine) 전공의 과정의 도입은 브라질 의학교육 분야에서 중대한 진전을 의미한다. 또한, 혁신적 교육 방법론의 도입의대생이 다양한 사회 계층, 특히 농촌과 도시 외곽 지역에서 실제로 훈련할 수 있는 기회를 확대시켰다(Separavich & Couto, 2021).

 

최근 조사에 따르면, 브라질 전역의 의과대학 정원 중 대다수가 내륙 지역(주 외곽 도시)에 위치하고 있으며, 이는 특히 남부와 남동부 지역에서 두드러진다. 이러한 현상은 의과대학의 수 및 정원 확대와 맞물려, 브라질 내 의사 분포의 지역적 불균형 해소라는 목표가 어느 정도 달성되었음을 시사한다(Figueiredo et al., 2019). 이전까지 교육 기회가 적었던 지역에 새 정원이 신설되면서, 농촌 지역 출신 및 저소득층 학생들도 의학교육에 접근할 수 있게 되었다. 이와 관련하여, 사회경제적 기준에 따라 장학금 제공을 의무화하는 법적 조항 등도 주목할 만하다.

 

이러한 추세를 뒷받침하듯, 모든 지역에서 정원 밀도가 증가하였고, 특히 국가 내 가장 취약한 북부와 북동부 지역의 증가가 두드러졌다. 물론, 졸업생들이 수도권 이외 지역에 정착하지 않고 유출되는 문제는 여전히 제기되고 있으며, 이는 사회경제적 여건, 보건 인프라, 전문성 개발 프로그램의 부족다요인적 요인과 연관된다(Oliveira et al., 2015). 그럼에도 불구하고, 해마다 약 22,000명 이상의 새로운 의사들이 이러한 지역에서 배출되고 있는 것으로 추정된다. 특히, 가정의학 전공의 과정에서 지급되는 의무적 장학금, 지역 보건 시스템 연간 총수입의 10%를 재정적으로 대응하는 제도 등은 이러한 지역에서의 의료 인력 양성과 유지를 위한 중요한 전략으로 작용하고 있으며, 주민 1인당 의사 수 및 보건시설 수 증가에 기여하고 있다(Figueiredo et al., 2019).

 

그러나, 정원 분포의 지역적 균형을 이루기 위한 노력에도 불구하고, 여전히 외딴 지역이나 취약 지역에서는 의사 부족 현상이 심각하게 나타난다. 일부 연구자들은 이러한 확장 정책이 실제로 계획된 목표에 얼마나 부합했는지에 대해 의문을 제기하고 있다. 이로 인해, 현재 의과대학 확장 정책의 성과를 전반적으로 점검하고 재평가하려는 움직임이 나타나고 있다.

 

 

주의 깊게 살펴보아야 할 지점들: 상품화된 교육, 교육의 질, 접근성의 불평등
Points of attention: education as a commodity, quality of training, and inequity of access

브라질 의학교육의 확장이 가져온 직접적 혹은 간접적 이점에도 불구하고(Figueiredo et al., 2019), 이 과정에서 발생할 수 있는 문제적 결과들에 대한 성찰이 시급하다. 예를 들어, 의학교육의 질을 훼손하지 않으면서 교육 기관을 어떻게 확장할 것인가, 농촌 및 취약 지역에서 일할 수 있는 졸업생 수를 어떻게 늘릴 것인가, 그리고 민간 교육 부문을 어떻게 지속가능한 방식으로 발전시킬 것인가는 전 세계 의학교육 전문가들이 공통적으로 우려하는 핵심 사안이다(Couper & Worley, 2010).

 

브라질의 경우, 의과대학 등록금이 지나치게 높다는 점은 잘 알려져 있다. 최근 보도에 따르면, 브라질 의과대학 평균 등록금은 최저임금의 약 7배, 브라질 가구당 평균 소득의 약 6배에 달한다고 한다(Globo, 2024). 이처럼 막대한 규모의 경제적 자금 흐름대형 기업 집단의 강력한 이해관계를 유발하며, 의학교육 확대의 본래 목적이었던 ‘보건서비스 접근성의 민주화’는 민간의 이익에 의해 영향을 받을 수밖에 없는 상황이 되었다. 다시 말해, 의학교육 민영화의 영향으로, 공공의 목적보다 사적 이익이 우선될 수 있다는 점은 부인할 수 없다.

 

의과대학의 민영화와 관련된 경제적 요인 역시 주요한 숙고 지점이다. 현재 일부 법적 조항과 정부 재정 지원 제도—예: 모두를 위한 대학 프로그램(PROUNI)(Brazil Ministry of Education, 2024c), 고등교육 학생 금융기금(FIES)(Brazil Ministry of Education, 2024a)—은 다양한 배경의 학생들이 의학교육에 접근할 수 있도록 지원하고 있으며, 보건 인력 구성이 브라질 인구의 다양성을 더 잘 반영하도록 기여하고 있다. 그러나, 민간 의과대학의 높은 등록금은 여전히 상당한 재정적 부담을 유발하며, 이는 곧 경제적으로 특권을 가진 계층만이 의학교육에 접근할 수 있는 현실을 강화한다.

 

임상 교육의 질은 의학교육의 핵심 기둥으로, 이는 미래의사가 복잡한 보건 요구에 효과적으로 대응할 수 있도록 준비시키는 데 결정적인 역할을 한다. 특히 브라질처럼 의대생 수가 급증하는 국가에서는, 임상 수련의 수용 능력(capacity)에 큰 압박이 가해진다. 그럼에도 불구하고, 의미 있는 임상 학습은 반드시 전통적인 대학병원에만 의존할 필요는 없다(Hays et al., 2019). 1차 진료기관, 지역 커뮤니티 병원, 비급성 의료기관 등은 만성질환 관리, 전체 환자 경로에 대한 이해, 지역 기반 의료 경험을 포함한 다양하고 가치 있는 교육 기회를 제공한다. 이러한 대안적 임상 현장은 교육적 다양성을 확대할 뿐만 아니라, 취약 지역에 대한 관심을 고취시켜 인력 재배치에도 기여한다.

 

이와 같은 잠재력을 실현하려면, 자원을 전략적으로 재배분하고, 보건-교육 간 협력을 촉진하며, 기관의 사명과 교육 목표를 일치시키는 정책적 노력이 필요하다. 더불어, 혁신성과 질적 개선에 대한 확고한 헌신을 바탕으로, 의학교육은 공감 능력과 전문성을 동시에 갖춘 인재를 지속적으로 양성할 수 있다. 다만, 지속적인 감독과 엄격한 모니터링 체계는 반드시 병행되어야 하며, 이를 통해 노력의 실효성과 형평성을 담보할 수 있다.

 

브라질에서의 의학교육 확장과 민영화는 국민 전체에 대한 보건서비스 접근성을 높이기 위한 중요한 조치로 평가받고 있다(Oliveira et al., 2019). 그러나 이와 같은 정책이 의학교육의 질과 교육 접근성의 형평성 확보를 위한 효과적인 제도적 장치와 함께 시행되어야만, 국민 건강 수요에 부응할 수 있는 적절한 인력 양성이 가능하다. 지금까지의 교훈은, 브라질 내 의학교육 전략을 지속적으로 개선하고 적응시키려는 정치적, 사회적 헌신이 반드시 필요하다는 점을 분명히 하고 있으며, 특히 윤리성과 교육의 질무분별한 경제 논리에 종속되지 않도록 하는 것이 무엇보다 중요하다는 점을 시사한다.

 

 

새로운 국면: 시행/확장이 부분적으로 차단됨
A new phase: implementation/expansion (partially) blocked

앞서 살펴본 바와 같이, 브라질 의과대학 확대 전략은 부분적인 성공을 거두었다(Kemper et al., 2016). 그 주요한 성과로는, 의학교육 접근성의 확대, 내륙 지방의 건강서비스 확충, 의사 인적 구성의 다양화 등을 들 수 있다. 그러나 여전히 지리적 분포의 불균형, 교육의 질에 대한 의문, 그리고 윤리적·경제적 문제(예: 일부 교육 그룹이 전국 정원의 대다수를 독점하는 현상)와 같은 문제점도 여전히 존재한다.

 

이러한 확장 중심 정책전문직 양성의 질에 대한 우려를 불러일으켰으며, 그 결과 **브라질 의사협회(AMB)**와 **의학연방위원회(CFM)**는 고액 등록금, 과도한 확장, 불충분한 규제라는 구조 하에서 무분별하게 증가하는 의과대학 설립에 대해 명확한 반대 입장을 표명하였다. 이러한 비판에 따라, 2018년 브라질 교육부(MEC)는 새로운 의과대학 설립을 잠정 중단하였다. 이는 교육의 질이 확보되지 않은 상황에서의 의과대학 급증을 억제하고, 정원 인가 기준을 재논의하기 위한 조치였다.

 

그러나 실제 실행 과정에서는, 사법 절차를 통한 정원 인가가 지속되면서 모라토리엄(중단 기간) 동안에도 수천 개의 정원이 새로 생겼다. 현재도 교육부에는 수백 건의 의과대학 신설 요청이 접수되어 있으며, 이미 인가를 받았으나 운영 승인을 받지 못한 학교들도 존재한다(Exam Magazine, 2023; Brazil Ministry of Education, 2023; Social Communication Advisory of the Brazilian Ministry of Education, 2023; São Paulo Medical Association, 2024).


새로운 규정의 수립
The establishment of new rules

2023년 12월, 브라질 교육부(MEC)는 관보를 통해 포고령 제531/2023호를 발표하였다(Brazil Ministry of Education, Secretariat for Regulation and Supervision of Higher Education, 2023). 이 규정은 사법 결정에 따라 개시된 의과대학 신설 및 정원 증원 요청을 처리하기 위한 새로운 지침을 마련한 것이다. 주요 목적은, 기존의 사법적 결정에 의한 인가 절차의 표준화를 명문화하고, 구체적인 수정사항 반영을 가능하게 만드는 것이었다.

 

따라서, 사전 선별(pre-selection) 절차는 해당 지방자치단체의 사회적 필요성과 보건의료 서비스(SUS) 내 적절한 공공시설의 존재 여부를 기준으로 한다. 특히, 의과대학 신설을 위한 인가 공고에서 이미 사전 선정된 보건지역에 위치한 사법 요청은 사회적 수요가 인정된다. 또한, 인구 대비 의사 수가 OECD 평균보다 낮은 지자체도 사전 선별 대상에 포함된다.

 

2023년 공고에 따른 규정에 따르면, 민간기관이 제출한 사법적 요청최대 60명 정원까지 인가가 가능하다. 정원 증원 요청의 경우, 기존 정원의 최대 30%까지만 허용되며, 240명을 초과하는 기존 과정에서는 정원 증원이 불가하다.

 

또한, PMM(Brazil, 2013)의 기준에 부합하기 위해, 해당 교육기관은 SUS 지역 보건 책임자의 서명이 포함된 협약서를 제출해야 하며, 이 서명은 과정을 운영하는 데 필요한 구조를 제공하겠다는 약속을 의미한다. 이 구조는 **해당 과정 또는 증원된 정원 수에 대해, 연간 총수입의 10%에 해당하는 재정적 대응(fiscal counterpart)**으로 구성된다. 더불어, 교육의 질 확보 조건으로, 해당 학부 과정은 **현장(in loco) 평가에서 과정 개념 점수(CC, Course Concept) 4점 이상(5점 만점)**을 획득해야 한다.

브라질 보건부에 따르면, 신규 의과대학 설립 및 기존 과정의 정원 증원 요청은 다음과 같은 요건을 충족해야 한다:

  • 요청된 정원 1명당 최소 5개의 SUS 병상 제공 가능
  • 다학제적 1차 보건의료팀의 존재
  • 응급 병상 또는 응급실의 존재
  • SUS 병상을 학습용으로 제공하겠다는 약속
  • 80병상 이상을 갖춘 병원 또는 교육병원 후보 기관이 해당 보건 지역에 존재하고, 현행 법령상 교육병원 인증을 받을 수 있는 잠재력을 가질 것

추가로, 정원 증원 요청은 다음 조건도 충족해야 한다:

  • 가정의학 팀당 최대 학생 수 3명 이내 유지
  • 우선 전문과목에서 최소 3개의 레지던트 과정 운영, 해당 과정들의 전체 정원 점유율이 50%를 초과할 것

 

 

교훈과 시사점
Lessons learned

 

브라질의 사례는, 의학교육의 질을 보장하기 위한 강력한 감독 및 규제 메커니즘의 필요성을 잘 보여준다. 기관에 대한 엄격한 인가(accreditation) 절차와 정기적인 평가 시스템은 이와 같은 맥락에서 중요한 역할을 한다. 나아가, 의학교육의 확장 및 민영화로 인해 시장 경쟁이 심화되고 있는 현실에서, 교육 인프라에 대한 투자, 그리고 그보다도 더 중요한 교수진 역량 강화에 대한 지속적 투자가 반드시 필요하다(Quintanilha et al., 2020). 특히 이 마지막 요소는 브라질 의학교육의 핵심적 과제 중 하나로 꼽히며, 이는 일반적으로 브라질에서 의료 교육 활동이 임상 진료 활동에 비해 훨씬 낮은 보상을 받기 때문이다(Quintanilha et al., 2023).

 

이와 더불어, 의과대학 접근성의 형평성을 보장하기 위한 공공정책도 매우 중요하다. 예를 들어, 학생 학자금 지원 제도와 같은 정책 메커니즘은 의학교육 내 다양성과 포용성(inclusion)을 실현하기 위한 필수 조건으로 작용한다. 또한, 입학생의 기초역량을 보완해주는 프로그램이나, 졸업 후 취약 지역으로 진출하는 젊은 의사들을 위한 전환기 지원 프로그램은 교육의 질과 보건 인력의 지역 정착에 실질적인 도움을 줄 수 있다(Figure 4 참조).

 

 

궁극적으로, 급격한 사회적 변화를 겪고 있는 현대 사회에서, 기술적 역량을 넘어서는 문화적·사회정서적 역량까지 포괄하는 의사 양성의 필요성이 그 어느 때보다 커지고 있다. 이러한 맥락에서 주목할 만한 것은, **브라질 의학교육협회(ABEM)**가 최근 제안한 의과대학 교육과정 지침 개정안이다. 이 문서는 2024년 11월에 최초 공개되었으며, 포괄적 교육(comprehensive training), 핵심 역량 개발, 그리고 포용성, 형평성, 다양성과 관련된 요소들을 통합적으로 반영하고자 한다.

 

또한, 이 지침은 역학 전환(epidemiological transition), 기후 변화, 보건의료에서의 기술 통합과 같은 동시대적 주제들과 더불어, 사회적 취약성에 놓인 인구집단—예: 빈곤층, LGBTQIA+ 인구, 장애인 등—에 대한 의학교육의 책임과 배려를 강조하고 있다. 이러한 논의는, 브라질과 같은 다원적(plural) 사회의 요구를 반영하는 의학교육의 방향성을 나타낸다.

 

 

다른 국가들과 비교한 브라질
Brazil compared to other countries

앞서 살펴보았듯이, 브라질은 최근 몇 년간 의학교육 영역에서의 급격한 확장기를 경험하고 있으며, 이는 보건 전문직 양성의 세계적 변화 흐름을 반영하고 있다(O’Sullivan & Chater, 2019; Table 1). **인도(India)**와 중국(China) 또한 의학교육의 맥락에서 상당한 전환기를 겪고 있으며, 이는 공통된 도전과제를 해결하고 전 세계적으로 보건서비스의 질과 접근성을 향상시키기 위한 경험 공유와 비교 평가의 필요성을 강조한다.

 

 

브라질과 마찬가지로, 다른 국가들도 의사 분포의 불균형 문제에 직면해 있으며, 이로 인한 보건의료 접근성 저하를 완화하기 위한 공공정책을 도입하고 있다(O’Sullivan & Chater, 2019). 예를 들어, 캐나다는 농촌 및 오지 지역에서의 보건서비스 제공의 형평성 확보라는 과제를 안고 있으며, 이에 대응하기 위해 입학 정책, 농촌보건 중심 교육과정, 현장 경험, 농촌 출신 학생의 선발 확대 등의 전략을 활용하고 있다(O’Sullivan & Chater, 2019; Grierson & Vanstone, 2021). 브라질에서는 의사 부족 지역에 우선전공(residency)의 자리를 마련하고, 지역 보건 수요에 대한 민감한 대응을 정책 의제로 삼고 있다.

 

의학교육의 확장 및 민영화 흐름은 인도에서도 유사하게 나타나며, 과정 수와 정원이 급증하고 있고, 민간 부문의 존재감이 상당히 크다. 그러나 브라질과 달리, 경제적으로 취약한 지방에서는 민간 부문의 영향력이 상대적으로 작다(Oliveira et al., 2019). 이러한 차이는 브라질의 **PMM 프로그램(Brazil, 2013)**과 같은 정책의 중요성을 강조한다. 해당 정책은 대도시 외곽 지역에서 민간 참여를 유도하고, 사회경제적 기준에 따른 장학금 제공 및 총수입의 10%를 지역 보건 시스템에 환류시키는 조건을 부과한다.

 

또 다른 BRICS 회원국인 중국세계에서 가장 큰 의학교육 시스템을 운영하고 있으며, 전혀 다른 양상을 보여준다. 2002년부터 2018년까지 학생 수 연간 증가율 7.3%, 졸업생 수 8.2% 증가라는 성장세를 보였지만, 중국의 의학교육은 공립기관 중심이며, 정부의 강력한 개입이 특징이다(Hou et al., 2014). 특히 교육의 질을 보장하기 위한 인가 프로그램의 강도와 구조적 안정성은 주목할 만하다. 2020년에는 중국의 의학교육 인가기구가 세계의학교육연맹(WFME)으로부터 국제 공인 기관으로 인정받았으며, 이는 중국 임상의학의 교육 수준이 국제적 기준에 부합함을 보여주는 이정표가 되었다(Wang, 2021).

 

대도시 외 지역에서의 의료 제공과 인구 대표성 확보라는 측면에서, 브라질 모델과 유사한 접근은 호주에서도 확인할 수 있다. 비록 규모는 다르지만, 정부 재정 지원, 의학교육 확대, 농촌 임상학교 설립, 교육과정 지침 개정 등의 방식으로 지난 수십 년간 호주의 의학교육은 변화해왔다(Brooks et al., 2001). 예를 들어, 학생의 농촌 의료 현장 참여를 의무화하고(Roberts et al., 2012), 원주민 학생의 입학 확대 및 문화적 건강 이해 증진에 노력해왔다(Roberts et al., 2012; Biggs & Wells, 2011). 이와 유사하게, 브라질의 신규 의과대학은 법적으로 아프로-원주민 브라질인의 삶과 생물심리사회적 맥락을 고려하도록 요구되고 있으며, 장학금과 학자금 지원제도를 통해 국민 전체의 대표성을 의학교육 내에 반영하려는 노력이 이어지고 있다.

 

또한, 보건의료의 세계화는 의사들의 국제적 이동성을 촉진시키고 있다(Monrouxe et al., 2022). 현재 점점 더 많은 브라질 의대생과 의사들이 해외에서의 진로 기회를 모색하고 있으며, 이는 전문성과 연구훈련, 근무환경, 보수 등에서의 향상된 조건을 제공하는 선진 의료 시스템 국가들로의 이동을 선호하는 세계적 흐름을 반영한다. 반면 브라질 내에서는 자원 부족, 인프라 미비, 낮은 보상 체계 등으로 인해 일부 지역에서 의사 유지가 어렵고, 이로 인해 해외 진출이 매력적인 대안으로 부상하고 있다(Garcia-Rosa et al., 2024). 이러한 현상은, 글로벌 경쟁 환경에서 의사 이탈의 근본 원인을 해결하고, 국내 의사 경력 경로의 매력도를 높이기 위한 강력한 정책적 대응이 필요함을 시사한다.

 

이상의 데이터를 종합하면, 문화적, 정치적, 사회경제적 배경이 다름에도 불구하고, 많은 국가들이 자국민의 건강보장을 위해 의학교육의 재편과 확장을 추진하거나 준비하고 있음을 알 수 있다. 따라서 국제적 모범 사례를 참고하며 각국의 전략을 벤치마킹하는 것이 권장되며, 그 과정에서 브라질 모델의 역사, 법제도, 도전과제 및 잠재력정리·공유하는 일은 전 세계 의학교육 향상에 기여할 수 있는 매우 중요한 작업이다.


결론 Conclusion

브라질의 교육 및 보건의료 환경이 지닌 **복합성(complexity)**을 고려할 때, **의학교육의 확장(expansion), 지역화(internalization), 민영화(privatization)**는 의미 있는 진전이자 동시에 상당한 도전 과제를 동반하는 이중적 성격을 지니고 있음이 분명하다. 의학교육에 대한 접근성을 확대하는 것은, 특히 의료 서비스가 부족한 지역의 국민 건강 수요를 충족하기 위해 반드시 필요한 조건이다. 그러나 동시에, **교육의 질(quality of education)**과 **접근의 형평성(equity in access)**은 절대적으로 타협할 수 없는 우선 순위로 자리매김해야 한다.

 

이러한 맥락에서, 교육의 탁월성을 촉진하고, 보건 인력의 지역 간 균등 분포를 달성하며, 경제적 이익이 의학 전문직의 윤리적·인도주의적 가치보다 우선하지 않도록 보장하는 정책에 대한 지속적이고 효과적인 헌신이 반드시 요구된다.

 

또한 본 연구의 결론은, 의사 분포의 지리적 불균형의학교육의 질적 격차를 해결하기 위한 강력한 전략의 필요성을 강조한다. 이 전략은 의과대학의 급속한 양적 팽창학문적 엄격성 보장, 교육 인프라 확충, 농촌 및 취약 지역에서의 인재 유치 및 유지 간의 균형을 맞추는 데 초점을 두어야 한다. 더불어, **포괄적인 교육과정(comprehensive training)**은 현대 의료가 요구하는 역량의 개발을 강조해야 하며, *포용성(inclusion), 형평성(equity), 다양성(diversity)*을 갖춘 의료 전문직의 문화 형성에 기여해야 한다.

 

이 연구는 또한 향후 연구의 방향성에 대해서도 제안한다. 특히, 민영화가 교육 성과 및 보건의료 접근성에 미치는 장기적인 영향에 대한 평가가 중요하다. 앞으로의 연구는 이러한 구조적 변화가 의과대학 졸업생의 전문성 프로파일, 노동시장 역학, 그리고 공공 보건 및 사회적 형평성에 미치는 폭넓은 파급 효과를 어떻게 조정하고 있는지를 면밀히 탐색해야 한다.

 

이러한 핵심 영역들을 다루는 미래 연구는, 브라질 국민의 보건 수요와 의학교육의 목표를 보다 정밀하게 조율하는 정책 설계에 기여할 수 있을 것이다.

Acad Med2021 Jan 1;96(1):126-133.  doi: 10.1097/ACM.0000000000003618.

Identifying Entrustable Professional Activities for Shared Decision Making in Postgraduate Medical Education: A National Delphi Study

 

👩‍⚕️ 전공의 교육에서 공유 의사결정(SDM), 어떻게 가르칠 수 있을까?

네덜란드 연구진이 개발한 4개의 EPA와 18개의 행동 지표

안녕하세요! 오늘은 최근 읽은 흥미로운 논문 하나를 소개해 보려고 해요. 😊
바로 **전공의(Postgraduate trainee)**들을 대상으로 **공유 의사결정(Shared Decision Making, SDM)**을 어떻게 교육하면 좋을지에 대해 다룬 논문인데요, 무려 **EPA(Entrustable Professional Activities)**까지 개발해서 구체적인 지침을 제시하고 있습니다!


🧩 왜 공유 의사결정(SDM)이 중요한데?

SDM은 환자 중심 진료의 핵심이자, 좋은 진료의 정점이라고들 하죠. 의사와 환자가 서로의 정보를 바탕으로 함께 숙고하고 함께 결정하는 과정이니까요.

하지만 현실에서는… 잘 안 됩니다. 😢

그래서 전 세계적으로 SDM 교육이 강조되고 있고, CanMEDS 같은 역량 프레임워크에서도 의사소통(Communication) 역량의 중요한 부분으로 포함되고 있어요.
문제는 ‘배우는 것과 실천하는 것 사이의 간극(transfer gap)’이 있다는 거예요.
그걸 메우기 위해 이 연구에서는 **진짜 임상에서 실행 가능한 EPA를 만들자!**는 목표를 세운 거죠.


📌 어떤 방법으로 연구했을까?

이 연구는 네덜란드에서 다양한 분야의 전문가 32명과 함께 **델파이 기법(Delphi technique)**을 활용해 총 3라운드에 걸쳐 EPA와 행동 지표를 다듬어 나갔어요.
EPA라는 게 원래 그 분야의 전문가가 ‘이 정도면 혼자 해도 돼’라고 믿고 맡길 수 있는 활동을 뜻하잖아요.
그만큼 실천 중심이면서도, 교육적으로 구체적이어야 해요!


✅ 결과: 최종 합의된 4개 EPA와 18개 행동 지표

연구진은 최종적으로 다음과 같은 결론을 냈어요:

“In this Delphi study, a multidisciplinary Dutch panel of 32 experts reached consensus on 4 EPAs and 18 associated behavioral indicators for SDM that residents should be trained in during postgraduate medical education to increase the routine application of SDM.”
“이 델파이 연구에서는, 네덜란드 전문가 패널이 전공의 교육을 위한 SDM 관련 4개의 EPA와 18개의 행동 지표에 대해 합의하였다.”

 

👉 핵심 EPA 예시 중 일부는 다음과 같아요:

  • 환자와 *공유 의사결정의 필요성(desirability)*에 대해 논의한다
  • 환자의 선호(preferences)와 숙고(deliberation) 과정을 탐색한다
  • 치료 옵션에 대해 환자와 함께 논의한다
  • 환자와 함께 충분히 근거 있는 결정을 내린다

또한 행동 지표에는 다음과 같은 내용이 포함되어 있어요:

  • 환자의 관점과 개인적 목표를 이해하려 노력한다
  • 관련된 제3자(예: 보호자, 다른 의료인)의 정보를 반영한다

이런 식으로 단계별 행동 수준까지 구체화한 게 인상적이었어요!


💬 연구진의 핵심 의견도 들어볼까요?

이 연구에서 제시한 EPA는 기존의 SDM 모델과 일치하면서도, 전공의 수련의 마지막 단계에서 요구되는 수준을 기준으로 구성되었어요. 그리고 의학지식(Medical Knowledge), 의사소통(Communication), 협업(Collaboration), 근거중심의학(Evidence-Based Medicine) 등 다양한 역량이 통합되어 있다는 점이 특징이에요. 📚

“The developed EPAs … aim to deliver clinicians that are able to routinely apply adequate SDM.”
“개발된 EPA들은 일상적으로 적절한 SDM을 적용할 수 있는 임상의 양성을 목표로 한다.”

 

그리고 이런 말도 덧붙였죠:

“We intended to develop EPAs that Warm et al categorized … as process-oriented.”
“우리는 이번 연구에서 Warm 등이 ‘과정 중심’이라고 분류한 유형의 EPA를 개발하고자 했다.”

 

즉, 특정 질병 평가 같은 진료과 특화(content-oriented) 과업이 아니라, 모든 임상 상황에 적용 가능한 SDM 과정 자체에 집중한 EPA라는 뜻이에요.


🧠 시사점: 이제 남은 건 현장에 적용하는 일!

연구진은 말합니다:

“Longitudinal workplace training is necessary to bridge the transfer gap … and to support integration of the SDM EPAs into the professional repertoire of future clinicians.”
“전이의 간극을 메우고, 향후 임상의들이 SDM EPA를 전문 역량으로 통합할 수 있도록 하기 위해서는 장기적인 현장 기반 교육이 필요하다.”

 

🔄 SDM은 한 번 배워서 끝나는 게 아니고,
🔍 현장에서 관찰하고 피드백하며,
🧑‍⚕️ 점점 자기 것으로 만들어가야 한다는 거죠!


🙋‍♀️ 한 가지 아쉬운 점은?

이번 델파이 조사에는 전공의들이 직접 참여하지 않았다는 점이에요. 연구진은 그 이유를 이렇게 설명했어요:

“We believe that the concepts of EPAs and SDM are too complex for residents.”
“EPA와 SDM이라는 개념이 전공의에게는 다소 복잡하다고 판단했다.”

 

하지만 동시에 이렇게 덧붙였어요:

“Including residents might have given us more insight into the transfer gap…”
“전공의를 포함했더라면 SDM 교육에서 그들이 경험하는 전이 간극에 대한 더 많은 통찰을 얻을 수 있었을 것이다.”

 

결국 앞으로의 연구에서는 전공의의 목소리도 꼭 담아야겠죠? 😊


✨ 마무리하며…

이 연구는 **“SDM을 어떻게 교육할 것인가?”**라는 질문에 대해
📌 *구체적인 실천 단위(EPA)*와
📌 *행동 수준에서의 평가 기준(behavioral indicators)*을
제시했다는 점에서 매우 실용적이에요.

 

SDM 교육의 방향을 고민하는 의료교육자나 교육과정 개발자분들께 꼭 추천하고 싶은 논문입니다!

 


**공유 의사결정(Shared Decision Making, SDM)**은 환자를 의학적 의사결정 과정에 참여시키기 위한 현시점에서 가장 선호되는 접근 방식이며, **양질의 환자 진료의 정점(the pinnacle of good patient care)**으로 간주된다.¹⁻⁶ 이 **상호작용적 과정(interactive process)**에서, *의료진과 환자는 환자의 충분히 숙지된 선호도(informed preferences)*와 *임상 근거(clinical evidence)*를 바탕으로 신중한 결정을 함께 내린다.⁷

 

의료진과 환자 모두 SDM의 중요성을 인식하고 있음에도 불구하고,⁸⁻⁹ SDM은 임상 현장에서 일상적으로 적용되지 않고 있다.¹⁰⁻¹¹ 이러한 *실천의 격차(performance gap)*는 전 세계적으로 SDM 교육의 중요성이 더 강조되도록 만들었고,¹²⁻¹³ **주요 의학 역량 프레임워크(medical competency frameworks)**에 SDM을 포함시키는 계기가 되었다.¹⁴⁻¹⁵ 그러나 일상 임상 실천에서 SDM이 일관되게 적용되지 않는 현실은, 아마도 *SDM 기술 학습과 실제 적용 간의 복잡한 전이(transfer)*에서 비롯된 것으로 보인다.¹²⁻¹³,¹⁶

 

우리는 이러한 **전이 과정을 지원하는 것이 SDM의 지속 가능한 임상 적용(sustainable implementation)**을 향상시킬 것으로 기대한다. *이러한 전이는 특히, 복합적인 기술(complex skills)이 진정성 있는 임상 환경(authentic clinical environment) 안에서 학습되고, **강력한 경험(powerful experiences)**에 의해 유도되며, **임상 수행에 대한 성찰(reflection on clinical performance)**을 통해 이루어질 때 가장 효과적인 것으로 간주된다.*¹⁷⁻¹⁹

 

우리는 **SDM을 자기주도적 임상 현장 학습(self-directed workplace learning)**에 통합하는 것이 효과적일 것이라고 기대하지만, 임상 실천에서 요구되는 SDM 역량에 대한 합의 부족은 기대한 교육 성과를 저해할 수 있다.²⁰⁻²¹

 

전공의(Postgraduate medical education) 교육은 **복합 역량(complex competencies)**의 자기주도적 현장 학습을 위한 이상적인 교육 환경으로 여겨진다.²² 많은 전공의 교육 프로그램에서는 이러한 복합 역량을 임상 실천에 효과적으로 전이시키기 위해, **Entrustable Professional Activities (EPAs, 위임 가능한 전문 활동)**라는 개념을 활용한다.²³⁻²⁶

 

**역량(competencies)**이란 일반적으로 *태도(attitude), 지식(knowledge), 행동(behavior)*을 포함하는 포괄적인 개념인 반면, **EPA는 이러한 역량을 임상 실천에 적용할 수 있도록 의료 전문직의 언어로 구체화한 것이다. EPA는 관찰과 피드백에 집중할 수 있도록 설계되어 있기 때문에, **복잡한 SDM 행동을 학습자의 역량 레퍼토리 안에 통합하는 데 기여할 수 있다.**¹⁸⁻¹⁹

 

이 연구의 목적은 전공의 교육 중 가르쳐야 할 SDM 관련 EPA와 이에 수반되는 행동 지표(behavioral indicators)에 대한 합의를 도출하는 것이다.

 


방법

맥락 (Context)

 

우리는 모든 진료과에서 사용할 수 있는 SDM 관련 EPA를 개발하는 것을 목표로 하였다. 네덜란드에서는 각 진료과(departments of medical specialty)가 **네덜란드 왕립의학협회(Royal Dutch Medical Association)**가 정한 **국가적 기준(national requirements)**을 바탕으로 전공의 교육과정을 운영한다.

 

전공과에 따라 교육 과정의 기간은 2년에서 7년까지 다양하며, **현장 중심의 수련(workplace-based training)**과 **형식 교육(formal education)**이 균형을 이루고 있다. 2015년 이후, 네덜란드의 전공의 교육 과정은 **CanMEDS 역량 프레임워크(CanMEDS competency framework)**에 따라 전공의를 교육하도록 의무화되어 있다. 대부분의 진료과에서는 이 역량들을 특정 EPA로 전환하여, 전공의의 역량 발달과 감독 수준을 결정하는 데 활용한다.²⁴,²⁷

 

일부 전공과 교육과정에서는 SDM을 중요한 주제 또는 의사소통 역량(communication competencies)의 일부로 언급하고 있으나, **임상 현장에서 요구되는 구체적인 과업(tasks)과 행동(behaviors)**에 대해서는 명확히 기술되어 있지 않다.

 

 

연구 설계 (Design)

우리는 2017년 4월부터 8월까지 **네덜란드 전문가들을 대상으로 온라인 델파이 조사(modified online Delphi study)**를 수행하여, 전공의 교육을 위한 **SDM 관련 EPA와 그에 수반되는 행동 지표(behavioral indicators)**에 대한 **합의(consensus)**를 도출하고자 했다. **델파이 기법(Delphi technique)**은 의학교육 연구에서 널리 사용되는 합의 도출 방법이다.²⁸⁻³¹ 이 기법은 **질문지(questionnaire)**를 여러 차례 반복(“rounds”)하여 특정 주제에 대한 합의를 이끌어내는 방식이며, 각 회차마다 이전 회차의 결과를 피드백하는 방식으로 진행된다. 합의를 도출하기 위해서는 최소 2회의 연속된 라운드가 필요하다.³²⁻³⁴

 

첫 번째 델파이 라운드에서 사용할 EPA 및 행동 지표 목록은 기존 문헌과 인터뷰 연구를 통해 도출하였다. 우선, A.B.는 **SDM의 개념틀(frameworks), 역량(competencies), 행동(behaviors)**을 설명하는 주요 문헌들을 검토하였고,¹³,²¹,³⁵⁻³⁷ 여기에 **스노우볼 기법(snowball method)**과 Web of Science의 관련 인용을 활용하여 자료를 보완하였다. 다음으로, 우리는 네덜란드의 SDM, 의사–환자 소통, 의학교육 분야 전문가들을 대상으로 인터뷰 연구를 수행하였다(해당 연구는 별도로 보고 예정). A.B.는 총 **17명의 전문가들과 반구조화된 대면 인터뷰(semi-structured face-to-face interviews)**를 실시하였으며, 모든 인터뷰는 **녹음(audiotaped)**되었고 **전사(transcribed)**되어, 자료 수집과 분석을 반복(iterative)하는 과정 속에서 **주제 분석(thematic analysis)**이 수행되었다.

 

문헌 검토와 인터뷰 결과를 종합하여, 우리는 ten Cate의 지침에 따라 EPA와 행동 지표를 공식화하였다.²⁴ 이 목록은 **SDM 전문가들로 구성된 국가 자문 위원회(national advisory board)**와 논의되었으며, 이후 의료인, SDM 연구자, 교육자 등 다양한 배경을 지닌 연구팀이 내용과 형식에 대해 합의를 이룰 때까지 수정되었다.


참여자 (Participants)

우리는 **목적 표집(purposive sampling)**을 통해 SDM, 의사–환자 소통, 의학교육에 대한 전문성과 특별한 관심을 지닌 전문가들을 기반으로 전문가 패널 후보 목록을 구성하였다.³⁸ 특히, 가정의학(family medicine) 전공의 수련과정의학적 커뮤니케이션 교육의 오랜 전통을 가지고 있기 때문에, 이 분야에서 활동하는 전문가들이 우선적으로 고려되었다. 최종적으로 다음 네 가지 범주의 전문가들이 목록에 포함되었다:

  1. 일상적인 환자 진료에 종사하는 임상의(clinicians active in routine patient care)
  2. SDM에 특별한 관심을 가진 환자 대표(patient representatives)
  3. 의학적 커뮤니케이션, SDM, 또는 근거중심의학(EBM) 교육에서 활동하는 트레이너, 교육 코디네이터 및 교육 개발자(trainers, coordinators, and educational developers)
  4. SDM, 의사소통 또는 환자 참여(patient participation)에 대해 연구하는 연구자들(researchers)

우리는 연구 목적, 절차, 예상 소요 시간 등을 담은 이메일을 통해 총 57명의 전문가 후보들에게 참여를 요청하였다. 참여에 동의한 이들에게는 **연구 참여 동의(informed consent)**를 받은 후 첫 번째 델파이 라운드에 초대하였다. (네덜란드 의학교육협회 윤리심의위원회 승인, 파일번호 894) 연구 기간 동안, 이전 라운드를 완료한 모든 전문가 패널은 다음 라운드에 초대되었다. **연구 조교는 모든 설문 데이터를 익명화 처리(pseudonymized)**하여, 전문가들의 익명성이 보장되도록 하였다.

 

 

자료 수집 (Data Collection)

우리는 **웹 기반 설문 도구인 Qualtrics(Qualtrics, Provo, Utah)**를 사용하여 **3라운드의 수정된 온라인 델파이 연구(modified online Delphi study)**를 수행하였다. **그림 1(Figure 1)**은 각 라운드의 주요 초점과 그 결과를 요약하고 있다. 1차, 2차, 3차 라운드의 기간은 각각 2주, 3주, 6주였으며, 일정은 다음과 같았다: 1차 라운드(4월 19일 ~ 5월 2일), 2차 라운드(5월 29일 ~ 6월 19일), 3차 라운드(7월 13일 ~ 8월 25일).

 

우리는 연구에 참여하지 않은 전문가 7명과 함께 1차 라운드 설문지를 파일럿 테스트한 후, 설문 내용과 레이아웃을 수정하였다. 본 연구의 목적은 전공의 수련을 마친 후 수행할 수 있어야 하는 SDM 관련 EPA 목록에 대한 합의 도출이었다. 각 EPA 및 행동 지표에 대해, 다음 두 가지 문장을 제시하였다:

  • “이 EPA/행동 지표를 교육과정에 포함시키고 싶다.”
  • “이 EPA/행동 지표는 임상 실천에 적용 가능하다.”

전문가들은 각 문항에 대해 **7점 리커트 척도(1 = 전혀 동의하지 않음, 7 = 매우 동의함)**로 평가하였다. 1차 탐색 라운드에서는 위의 두 문장에 대해 각 EPA와 행동 지표 목록을 평가하도록 요청하였다. 각 라운드에서는 **점수에 대한 설명, 문구 수정 제안, 추가적인 EPA 및 행동 지표 제안 등을 적을 수 있는 자유응답 칸(open text box)**을 함께 제공하였다. 1차 라운드에서는 **참여자의 인구통계학적 특성(demographic characteristics)**도 조사하였다.

 

2차 라운드는 다음의 두 가지로 시작되었다:

  1. 각 설문 항목에 대한 참여자의 개인 점수와 전체 집단 평균 점수에 대한 요약,
  2. 1차 분석 후 수정된 새로운 설문 버전을 제공하였다. 다시 한 번, 전문가들에게 각 EPA와 행동 지표에 대해 앞서 사용된 동일한 두 문장을 기반으로 평가해달라고 요청하였다.

이 라운드의 목적은 다음과 같았다:

  1. 거의 최종본(near-final list)에 포함되어야 할 EPA 및 행동 지표에 대한 합의 도출,
  2. 아직 합의에 도달하지 못한 항목들에 대한 재수정 및 재검토.

3차 라운드는 두 부분으로 구성되었다.

 

  • 첫 번째 부분에서는, 2차 라운드에서 합의에 도달하지 못한 행동 지표 중, 분석을 통해 재구성(reformulated)된 항목들을 제시하고, 전문가들에게 이를 **다시 평가(rerate)**하도록 요청하였다. 해당 항목이 이번 라운드에서 합의에 도달하면 최종 목록에 포함될 것임을 사전에 공지하였다.
  • 두 번째 부분에서는, 2차 라운드에서 이미 합의에 도달한 EPA 및 행동 지표 목록을 제시하고, 다음과 같은 질문을 던졌다:
    • “전공의 교육을 위한 이 SDM 관련 EPA 및 행동 지표의 거의 최종 목록에 동의하십니까?”
      응답 선택지는 “예(yes)” 또는 “아니오(no)”였다.

자료 분석 (Data Analyses)

우리는 설문지의 정량적 항목들을 **SPSS 24 for Windows(IBM Corp., Armonk, New York)**를 사용하여 **기술통계(descriptive statistics)**로 분석하였다. 델파이 연구에서는 합의(consensus)의 표준 정의가 존재하지 않기 때문에 연구팀은 1차와 2차 라운드에서 개별 EPA 및 행동 지표에 대해 다음 기준을 만족할 경우 합의에 도달한 것으로 정의하였다:

  • 중앙값(median score) ≥ 6점,
  • 전문가 패널의 ≥ 75%가 해당 항목에 대해 6점 이상을 부여한 경우
    (문장: “이 EPA/행동 지표를 교육과정에 포함시키고 싶다.”)

이 연구는 교육과정에 포함시켜야 할 SDM 관련 EPA 및 행동 지표의 전체 목록을 개발하는 것이 목적이었기 때문에, 위 문장에 대한 응답을 합의 판단 기준으로 삼았다.

3차 라운드에서는 전문가 패널의 ≥ 80%가 ‘예’라고 응답한 경우, **최종 목록에 대한 합의(consensus on the near-final list)**에 도달한 것으로 간주하였다.²⁸

A.B.는 **자유 응답란에 기록된 모든 정성적 피드백(qualitative feedback)**을 분류하여 **반복적으로 나타나는 주제(recurring themes)**를 도출하였다. 연구팀은 각 라운드 이후 이러한 주제를 기반으로, EPA 및 행동 지표의 수정 필요 여부와 그 구체적인 방식에 대해 논의하였다.

 

최종 EPA 및 행동 지표는 **전문 번역가(professional translator)**가 영어로 번역하였고, 이후 의료교육 및 SDM 용어에 능통한 네이티브 네덜란드어 사용자가 이를 **다시 네덜란드어로 역번역(back-translation)**하여 번역의 **정확성(accuracy)**을 검증하였다. 연구팀은 최종 영어 번역본을 승인하였다.

 

 

결과 (Results)

델파이 절차 (Delphi Procedure)

초대된 57명의 전문가 패널 후보자 중 35명이 참여에 동의하여 **응답률은 61%**였다. 1차 라운드는 총 32명이 완료하였으며, 이는 **응답률 91%**에 해당한다. 이 중 2명은 시간 부족으로 설문을 완료하지 못했으며, 1명은 의학교육에 대한 지식 부족을 이유로 참여를 포기하였다. 1차 라운드를 완료한 32명의 전문가 전원은 2차와 3차 라운드에도 계속 참여하였다.

 

전문가들의 연령은 31세에서 61세 사이였으며, 평균 연령은 47세였다. **여성은 21명으로, 전체의 66%**를 차지하였다. 우리는 연구 설계 당시 중요하다고 판단한 **모든 전문 직역(professional backgrounds)**이 이 전문가 패널에 포함되어 있었으며, *참여자의 특성은 표 1(Table 1)*에 요약되어 있다.

 


델파이 결과 (Delphi Results)

1차 라운드에서는, **6개의 EPA와 26개의 행동 지표(behavioral indicators)**를 전문가 패널에게 제시하였다 (각 라운드 요약은 그림 1과 보충 디지털 부록 1 [Supplemental Digital Appendix 1: http://links.lww.com/ACADMED/A997] 참조). 전문가 피드백을 바탕으로 5개의 EPA를 수정하였다.

 

그중, 다음 두 EPA 간의 중복성이 언급되었다:

  • “전공의는 환자의 개인적 맥락에 맞게 의사소통을 조정한다”
  • “전공의는 공유 의사결정의 필요성(desirability)에 대해 환자에게 알린다”

이 두 항목은 행동 지표 역시 중복되는 것으로 판단되어, **“전공의는 공유 의사결정의 필요성에 대해 환자와 논의한다”**라는 새로운 EPA로 통합하였고, 기존 행동 지표들은 이 통합된 EPA 하에 재배열하였다.

또한, 다음의 두 EPA 간에도 유사성이 있다는 피드백이 있었다:

  • “전공의는 환자의 선호도를 탐색한다”
  • “전공의는 옵션에 대해 숙고하도록 환자를 돕는다”

이에 따라, 이 둘 역시 **“전공의는 환자의 선호도와 숙고 과정을 탐색한다”**는 새로운 EPA로 통합하였고, 관련 행동 지표 역시 이에 맞추어 재배열되었다.

한편, **“전공의는 치료 옵션에 대해 환자에게 정보를 제공한다”**는 EPA는 지나치게 지시적인(directive) 표현이라는 비판을 받아, **“전공의는 치료 옵션에 대해 환자와 논의한다”**로 수정되었다.

반면, **“전공의는 환자와 함께 충분히 근거 있는 결정을 내린다”**는 EPA는 긍정적으로 평가되었으며, 수정 제안이 없었기 때문에 변경 없이 유지되었다.

1차 라운드에서 제시된 총 26개의 행동 지표 중 15개는 전문가들의 정성적 피드백을 반영하여 수정되었으며 (자세한 내용은 보충 디지털 부록 1 참조), 다음과 같은 통합 작업도 이루어졌다:

  • “전공의는 환자의 선호도가 그들의 관점 및 개인적 목표 및 가치와 어떻게 연결되는지 명확히 한다”
  • “전공의는 환자에게 다양한 선택지를 숙고하도록 조언하며, 이 과정에서 환자의 관점, 목표 및 가치를 고려한다”

이 두 항목은 **“전공의는 환자의 선호도가 그들의 관점 및 개인적 목표 및 가치에 적절히 부합하는지 여부에 대해 논의한다”**는 하나의 행동 지표로 통합되었다.

또한, 15개의 수정된 행동 지표 중 13개에는 경미한 문구 수정을 적용하였다. 나머지 11개의 행동 지표는 전문가들이 긍정적으로 평가했거나 수정 제안이 없었기 때문에 그대로 유지되었다.

 

 

2차 라운드 (Round 2)

1차 라운드 결과로 도출된 4개의 EPA와 25개의 행동 지표2차 라운드에서 전문가 패널에게 제시하였다 (Figure 1 및 보충 디지털 부록 1 참조: http://links.lww.com/ACADMED/A997). 2차 라운드에서 4개의 EPA 모두에 대해 합의가 이루어졌으며, 관련된 정성적 피드백도 제공되지 않았기 때문에, 이들 EPA는 수정 없이 거의 최종본(near-final list)에 포함되었다.

 

행동 지표 25개 중 17개에 대해서도 합의가 이루어졌고, 의미 있는 수정 제안이 없었기 때문에, 이들 역시 수정 없이 거의 최종 목록에 포함되었다. 합의에 도달하지 못한 8개의 행동 지표 중 2개는, 전문가의 정성적 피드백을 바탕으로 **재구성(reformulation)**하였다.

  • **“전공의는 자신의 선호도를 중립적인 방식으로 논의에 제시한다”**는 행동 지표는,
    → **“전공의는 필요 시 자신의 선호도를 제시한다(the resident introduces own preferences where indicated)”**로 수정되었다.
  • **“전공의는 의사, 가족, 친구 등 관련 보건의료인이나 제3자의 정보(환자의 선호도 관련)를 의사결정에 포함시킨다”**는 행동 지표는,
    → **“전공의는 선호도 논의(deliberation of preferences)에 관련 있는 경우, 관련된 제3자(보건의료인, 가족, 친구 포함)의 제공 정보를 포함한다”**로 수정되었다.

나머지 6개의 행동 지표는 합의에도 도달하지 못했으며, 의미 있는 수정 제안도 없었기 때문에 제거되었다.

 


3차 라운드 (Round 3)

3차 라운드에서는 2차 라운드에서 재구성된 2개의 행동 지표와, **2차 라운드에서 합의에 도달한 4개의 EPA와 17개의 행동 지표(거의 최종본)**를 전문가들에게 제시하였다 (Figure 1 및 Supplemental Digital Appendix 1 참조).

전문가들은 **재구성된 행동 지표 2개에 대해 평가(rating)**를 다시 수행하였다. 이 중 **“전공의는 필요 시 자신의 선호도를 제시한다(the resident introduces own preferences where indicated)”**는 행동 지표에 대해서는 합의에 도달하지 못하였다, 이는 해당 항목에 대해 *“교육과정에 포함시키고 싶다”*는 진술에 대해 전문가의 56%만이 6점 이상을 부여했기 때문이다.

이 항목에 대해 제시된 주요 논거는 다음과 같았다:

“전공의의 선호가 환자의 의사결정 과정에 과도한 영향을 미칠 수 있으며, 선호를 중립적으로 제시하는 것은 현실적으로 매우 어렵다.”

 

반면, **“전공의는 선호도에 대한 논의에 관련 있는 경우, 관련 제3자가 제공한 정보를 포함한다(the resident includes the information provided by involved third parties … if this is relevant for the deliberation of preferences)”**는 행동 지표는 합의에 도달하였다.
중앙값(median)은 6점, 전문가 중 81%가 6점 이상을 부여하였다 (Table 2 참조).

최종 결과 요약

3회의 델파이 라운드 후, 전공의 교육을 위한 SDM 관련 EPA 4개와 행동 지표 18개에 대한 합의가 이루어졌다 (Table 2 참조).
총 32명의 전문가 중 30명(94%)이 이 목록에 동의하였다.
동의하지 않은 2명의 전문가는 어떠한 정성적 피드백도 제공하지 않았다.

합의에 도달한 **모든 EPA 4개는 “임상 실천에 적용 가능하다”**는 문장에 대해서도 높은 점수를 받았다.
그러나, 행동 지표 18개 중 11개만이 “임상 적용 가능성” 항목에서 전문가 패널의 75% 이상이 6점 이상을 부여하였다 (Table 2 참조).

 

 

논의 (Discussion)

주요 결과 요약 (Summary of Main Findings)

이 델파이 연구에서는, 다학제적(multidisciplinary) 네덜란드 전문가 패널 32명이 **전공의 수련 중 교육되어야 할 공유 의사결정(SDM) 관련 4개의 EPA와 이에 연계된 18개의 행동 지표(behavioral indicators)**에 대해 **합의(consensus)**에 도달하였다. 이는 SDM의 일상적 적용을 촉진하기 위한 교육적 기반을 제공하고자 한 것이다.
**거의 최종본(near-final list)**에 대해 30명(94%)의 전문가가 동의한 점은 높은 수준의 합의를 나타낸다.


주요 결과에 대한 성찰 (Reflection on Main Findings)

이번에 개발된 EPA들은 잘 알려진 SDM 모델들과 일치하며,³⁵ ³⁶ **전공의 교육의 마지막 단계에서 도달해야 할 숙련 수준(end-stage proficiency level)**에 맞추어 SDM 행동을 구체적으로 기술하고 있다. 이는 일상 임상에서 적절한 SDM을 실천할 수 있는 임상의 양성을 목표로 한다.²³

 

**행동 지표들은 각 EPA의 구성 요소(building blocks)**를 명확히 하여, 학습자의 개별적인 현장 학습 요구에 따라 학습이 조정될 수 있도록(tailored learning) 지원한다. 이 EPA들은 *이론과 실제를 정렬(alignment)*시키고, *역량과 실제 수행을 연결(bridge)*하려는 의도로, **전문 직무 단위(unit of professional practice)**로 역량을 기술한 것이다.²⁴

 

2015년 CanMEDS 역량 프레임워크에서는 **SDM이 3개의 보조 역량(enabling competencies)**으로 **일반적으로 기술(generic)**되어 있다. 이 보조 역량들은 다음을 강조한다:

  • 환자의 고유한 선호와 상황에 SDM을 적절히 적용하는 능력
  • 환자 및 가족과 **존중(respectful), 비판단적(nonjudgmental), 문화적으로 안전한 방식(culturally safe manner)**으로 논의하는 능력
  • 환자가 정보에 기반해 건강 관련 결정을 내릴 수 있도록 의사소통 기술과 전략을 활용하는 능력

이와 달리, 본 연구에서 개발한 SDM EPA들은 의사결정의 실제 과정을 기술하며, 이는 하나의 진료 접촉이 아닌 여러 차례에 걸쳐 일어날 수 있는 과정을 반영한다. 또한, **의학지식, 의사소통, 협업, 근거중심의학(EBM)**과 같은 복합 역량(domain)을 통합적으로 반영하고 있다.

이러한 접근 방식은 Warm 등(2014)이 제안한 분류에 따라, “과정 중심(process-oriented)” EPA로 간주될 수 있다. 이들은 특정 진료과의 내용 중심(content-oriented) EPA—예: 비뇨기과에서 요실금 평가—와는 구별된다.³⁹

 

Shorey 등(2019)의 스코핑 리뷰에서는, 대부분의 기존 연구들이 **진료과 특화 EPAs(specialty-specific EPAs)**의 개발에 집중되어 있었음을 보여준다.²⁶ 본 연구의 SDM EPA들은 SDM이 특정 임상 문맥(context)에 따라 다르게 적용되어야 함을 반영하고 있으며, 이는 다음과 같은 요소를 고려한 것이다:

  • 의학적 필요(medical needs)
  • 환자의 가치와 선호(values and preferences)
  • 임상과에 따라 구체화된 실제 과업(concrete clinical tasks)

이러한 EPA들은 SDM의 실제적 구현을 뒷받침하는 데 유용할 수 있다.⁴⁰


시사점 (Implications)

다음 단계는, 본 연구에서 개발한 **SDM EPA들을 기존 역량 기반 현장 교육과정(competency-based workplace curricula)**에 **구현(implementation)**하는 것이다. SDM 교육의 효과에 대한 기존 문헌 리뷰에 따르면, 대부분의 교육介入은 단회성(single session)에 그쳤고, 시간이 지남에 따라 임상에서의 지속적 실천이 약화되었다.¹²,⁴¹⁻⁴³

 

따라서, **SDM의 학습과 지속적 임상 실천 간의 전이 간극(transfer gap)**을 메우기 위해서는 장기적(longitudinal) 현장 기반 교육이 필수적이다.²² 이는 미래의 임상의들이 SDM EPA를 자신만의 전문적 역량으로 통합할 수 있도록 돕는다.

 

이번 연구에서 제시한 **EPA들은 임상 현장에서의 SDM 수행을 관찰하고 이에 대한 피드백을 제공하는 도구(tool)**로 활용될 수 있다. 그러나 EPA를 단순한 ‘체크리스트’로 사용하는 것을 방지하기 위해, **개별 학습자의 학습 과정(individual learning process)**이 출발점이 되어야 한다.

 

현재 많은 전공의 교육 프로그램에서 EPA가 사용되는 방식에 비추어 볼 때, 이 EPA들은 전공의의 역량 수준을 평가하는 데 있어서도 지침 역할을 할 수 있다. 또한, **임상 지도자의 SDM 역량을 향상시키기 위한 지속적 직무 교육(continuous professional education)**에도 통합될 수 있다. 왜냐하면, **현장 기반 학습(workplace-based learning)에서는 적절한 롤모델링(role modeling)**이 핵심이기 때문이다.

 

SDM은 근거중심의학(EBM)의 핵심 구성 요소이며, 문헌에 따르면 전공의들은 환자 중심 커뮤니케이션과 같은 복합 기술을 의학적 전문성과 통합된 형태로 학습할 때 가장 효과적이라고 보고된다.¹⁸,¹⁹

 

따라서, 우리는 **SDM EPA들을 전공의용 EBM 교육과정(Postgraduate EBM curricula)**에 통합하는 것을 제안한다.¹⁷,¹⁹

향후 연구에서는 다음과 같은 부분들을 다루어야 한다:

  • **SDM 학습의 장애 요인과 촉진 요인(barriers and facilitators)**에 대한 탐색
  • **임상에서 실제로 사용할 수 있는 언어 표현(language for practice)**의 구체적 예시 제공
    → 이를 통해 학습자들이 임상에서 실제 SDM을 연습할 수 있도록 지원해야 한다.

 

 

강점 및 한계 (Strengths and Limitations)

우리가 알기로, 본 연구는 SDM을 위한 EPA와 행동 지표(behavioral indicators)에 대해 수행된 최초의 연구이다. 우리는 **델파이 기법(Delphi technique)**이 EPA와 행동 지표에 대한 합의를 도출하는 데 적합한 접근 방식이라고 판단하였다. 전문가들이 개별적으로, 익명으로 설문지를 작성하게 함으로써, 다른 패널 구성원의 직접적인 영향력을 제한하고 개별 의견의 비중을 동등하게 유지할 수 있었다.²⁹⁻³¹ 또한 이전 라운드의 결과를 다음 라운드에 피드백함으로써, 전문가들이 타인의 평가와 비교해 자신의 초기 견해를 재고하도록 유도하였다.

 

우리는 참여자의 다양한 배경 차이와 우리가 중요하다고 판단한 모든 직역이 포함된 점이, 개발된 EPA의 질을 향상시켰다고 믿는다. 이러한 EPA의 질적 수준은 전공의 교육 과정에 보다 쉽게 도입되는 데 도움이 될 수 있다. 1차 라운드를 완료한 전문가 32명 전원이 전체 델파이 과정을 완료한 것은, 주제에 대한 전문가들의 관심, 연구의 중요성, 그리고 각 라운드가 신속하게 이어졌다는 점을 반영한다.

 

1차 델파이 라운드에서 사용된 EPA와 행동 지표는, **우리 연구팀이 사전에 수행한 포괄적인 기초 작업(comprehensive preliminary work)**을 바탕으로 개발된 항목들이었다. 물론 전통적인 델파이 연구에서는 전문가들이 항목 자체를 직접 생성하는 방식이 일반적이지만, 우리는 그러한 방식이 전문가들에게 지나치게 많은 시간을 요구할 수 있다고 판단하였다.

 

이러한 선택은 개발된 EPA와 행동 지표의 구성에 일정한 영향을 미쳤을 가능성이 있다. 하지만, 우리는 전문가들이 적극적으로 정성적 피드백을 제공하도록 권장함으로써 이러한 영향을 최소화하려고 하였다. 전문가 피드백을 분석한 결과, EPA와 행동 지표의 내용에 대해 본질적인 변화가 필요하다는 의견은 거의 없었으며, 이는 우리가 개발한 항목들이 본 연구 목적에 적합했음을 시사한다고 할 수 있다.

 

이 델파이 연구는 **네덜란드 국내 수준(national level)**에서만 수행되었으며, 이는 SDM이 언어와 문화에 매우 민감한 주제이기 때문이다. 그럼에도 불구하고, 개발된 EPA들은 **다른 국가에서도 자국의 필요에 맞추어 적용 가능한 일반적 요소(generic elements)**를 포함하고 있다.

 

우리는 비록 이 EPA들이 전공의 수련(postgraduate medical training) 과정에서 활용되는 것을 목적으로 개발되었음에도, 이번 델파이 연구에 전공의를 참여시키지 않기로 결정하였다. 이는 우리가 판단하기에 EPA와 SDM이라는 개념 자체가 전공의에게는 다소 복잡하다고 여겨졌기 때문이다. 그러나, 전공의를 포함하였다면, SDM 교육을 받는 과정에서 그들이 경험하는 전이의 간극(transfer gap)에 대해 더 많은 통찰을 얻을 수 있었을 것이다.

 

 

 

 

🧩 최종 선정된 SDM 관련 EPA와 행동 지표 목록 (내용 번역)


① 전공의는 환자와 공유 의사결정의 필요성에 대해 논의한다

(The resident discusses the desirability of shared decision making with the patient)

  • 환자에게 선택이 필요하기 때문에 공유 의사결정이 바람직하다는 점을 설명한다.
  • 공유 의사결정의 목적과 이 과정을 어떻게 수행할 수 있는지 설명한다.
  • 환자의 관점(예: 우려, 기대, 질문 등)을 명확히 하고, 이를 존중한다.
  • 의사결정 과정에서 환자의 표현을 지원하고, 환자의 **지적 수준과 건강 정보 이해 능력(health literacy)**을 고려한다.

② 전공의는 환자와 치료 옵션에 대해 논의한다

(The resident discusses the options for management with the patient)

  • **기다려 보기 전략(wait-and-see option)**을 포함해 현재 사용 가능한 치료 옵션들최신 지견, 근거중심 가이드라인이나 권고사항에 따라 안내한다.
  • 환자의 선호와 관점을 고려하여 **최소한으로 필요한 정보(minimally required information)**를 제공하고, 그 정보가 개인에게 어떤 의미가 있는지 설명한다.
  • 치료 옵션에 대해 명확하고 객관적인 정보를 제공한다.
  • 각 치료 옵션의 잠재적 이점과 위험, 결과를 논의한다.
  • 환자 교육 자료나 의사결정 도구(예: 웹사이트 등)를 활용하거나 안내한다.
  • 환자가 정보를 이해하고 해석했는지 확인하고, 필요 시 충분한 숙고 시간을 제공한다.

③ 전공의는 환자의 선호와 숙고 과정을 탐색한다

(The resident explores the patient’s preferences and deliberations)

  • 환자의 **선호도(preferences)**와 치료 옵션에 대한 입장을 명확히 한다.
  • 환자의 개인적 맥락을 고려하여, 각 옵션의 실행 가능성, 실현 가능성, 실용성을 탐색한다.
  • 관련된 제3자(예: 보건의료인, 가족, 친구)가 제공한 정보가 선호도 논의에 관련이 있다면 이를 포함한다.
  • 다양한 치료 옵션의 장단점을 요약하여 설명하고, 환자의 판단이 그에 부합하는지 확인한다.

④ 전공의는 환자와 함께 충분히 근거 있는 결정을 내린다

(The resident takes a well-argued decision together with the patient)

  • 환자의 속도와 리듬에 맞춰 결정을 **조율(adjust)**하며, 의학적 긴급성을 함께 고려한다.
  • 가장 중요한 논의 사항에 기반하여, 환자와 공동으로 결정을 내린다.
  • 환자가 결정에 동의하는지 확인하고, 그 결정의 실천적 결과 및 향후 적용에 대해 논의한다.
  • 결정의 근거와 그에 대한 전공의의 판단 이유의무기록에 남긴다.
 

 

Med Educ2019 Sep;53(9):861-873.  doi: 10.1111/medu.13905. Epub 2019 May 20.

Accounting for complexity in medical education: a model of adaptive behaviour in medicine

 

🧠 시스템 사고와 의학교육: 이제는 ‘적응’을 말할 때

의사로 살아간다는 건 단순한 과학지식만으로는 해결되지 않는 복잡한 세상과 매일 마주하는 일입니다. 그런데 의학교육은 아직도 ‘환원주의(reductionism)’의 틀 안에 머물러 있지 않나요? 오늘은 그 한계를 극복하고자 제안된 **시스템 사고(Systems Thinking)**와 **복잡 적응 시스템(Complex Adaptive Systems, CAS)**에 대한 흥미로운 논문을 소개할게요. 이 글은 의사 교육을 바꾸기 위한 시사점을 가득 담고 있어요. 의학교육자, 수련의, 정책 입안자 모두에게 꼭 필요한 이야기입니다.


1️⃣ 복잡한 문제 앞에서, 지식만으론 부족하다

의사들은 매일 복잡한 환자 상황을 마주하죠. 그런데 전통적인 의학교육은 대부분 기초 과학 중심의 환원주의 교육에 집중해왔어요.
하지만 저자들은 이렇게 말합니다:

"복잡한 문제를 성공적으로 해결할 수 있는 능력과 환원주의 과학에 대한 전문성 사이에는 커다란 간극이 존재한다.
There exists a broad gap between expertise in reductionist science and the capacity to successfully solve complex problems."

 

즉, 지식은 단지 ‘도구(tool)’일 뿐이고, **현실에서는 ‘적응(adaptation)’이 전략(strategy)**이어야 한다는 거예요.


2️⃣ 전문가란, '적응하는 사람'이다

논문에서는 복잡한 문제를 잘 풀어내는 의사의 핵심 조건으로 **적응적 행동(adaptive behaviour)**을 꼽아요.
‘정답’이 없는 상황에서 유연하게 반응하고, 계속 학습하고, 변화에 대응할 수 있어야 한다는 뜻이죠.

"탁월함(excellence)은 고정된 표준이 아니라, 핵심 가치에 의해 이끌리고 현실 세계와의 상호작용을 통해 지속적으로 반응하고 개선하려는 노력이다.
Excellence is defined as a continuous effort to respond and improve, driven by core values and guided by real-world interactions."

 

💡 결국, 좋은 의사는 단순히 시험을 잘 보는 사람이 아니라, 끊임없이 배우고 반응하며 실천하는 사람이라는 겁니다.


3️⃣ 교육은 '적응'을 키워주는 방향으로 바뀌어야 해요

그럼 이런 적응하는 의사를 키우려면 어떻게 해야 할까요?
저자들은 4가지 교육 전략을 제안합니다.


Approach 1: 적응력 있는 사람을 뽑자!

입시 단계부터 지적 유연성, 도덕적 추론, 모호성에 대한 수용력 같은 특성을 보는 게 중요하다고 해요.

"이러한 개인은 상대적이고 비절대적인 지식의 성격을 이해하고, 모순을 받아들이며, 이를 더 큰 틀 안에 통합할 수 있다.
Such an individual understands the relativistic, non-absolute nature of knowledge, accepts contradiction and is capable of integrating contradiction into an overriding whole."

 

👉 미국의 WICS 모델(지혜, 지능, 창의성 기반 평가)은 기존 시험보다 더 높은 성과 예측력을 보였다고 해요!


Approach 2: 인식론적 겸손(epistemic humility)을 가르치자

지식의 한계를 인정하는 태도, 즉 *"내가 모를 수도 있다"*는 겸손이 중요합니다.

"인식론적 겸손은 지식의 가치를 존중하지만 그 적용에는 비판적이다. 이는 제한적이면서도 해방적인 태도다.
Epistemic humility respects the value of knowledge but does not hesitate to be critical in its application. In this sense it is both limiting and liberating."

 

📉 너무 ‘근거 중심’만 외치다 보면 오히려 환자의 복잡성을 놓칠 수 있어요.


Approach 3: 과도한 체계화는 피하자

표준화된 평가도구, 일률적인 행동기준… 이런 게 오히려 진짜 문제 해결 능력을 평가하기 어렵게 만들어요.

"완전히 체계화된 평가방식은 복잡한 문제 해결 능력을 평가하는 데 타당성이 떨어질 수 있다.
If standardisation of behavioural anchors and the use of surrogate outcomes lack validity in the assessment of complex problem-solving skills…"

 

👀 평가의 틀도 유연해야, 학생이 유연하게 자라날 수 있겠죠?


Approach 4: 적응적 행동을 교육의 중심에 두자

이제는 '정답'을 가르치기보다는, 현장에서 스스로 판단하고 반응하는 습관을 기르는 게 핵심이에요.

"적응적 행동의 우선성을 가르치고 강화하는 교육이야말로 고품질 임상 실무의 본질을 담고 있다.
This approach would teach and reinforce the primacy of adaptive behaviour in high-quality clinical practice."

 

👩‍⚕️ 이걸 위해선 기초과학과 임상경험을 분리된 이원 구조가 아니라, 통합적으로 병행하는 교육과정이 필요하다는 제안도 함께 나옵니다.


📌 결론: 의학교육에도 ‘적응적 리더십’이 필요하다

이제 우리는 Flexner 모델을 넘어, ‘복잡성’을 인정하고, ‘적응’을 키워주는 교육을 준비해야 합니다.

"이제는 의학교육에 적응적 리더십(adaptive leadership)이 필요한 때다.
The time has arrived for adaptive leadership in medical education."


✨ 마무리하며

이 논문은 단순한 이론이 아니라, 의학교육의 패러다임 전환을 촉구하는 선언에 가깝습니다.
의학교육자이든, 학생이든, 정책입안자든—이제는 다음의 질문을 던져야 할 때예요.

“우리는 지식을 가르치고 있는가,
아니면 적응할 수 있는 전문가를 키우고 있는가?”

 


서론 (INTRODUCTION)

**시스템 사고(Systems thinking)**생의학적 시스템에 대한 환원주의적 지식환자의 진료라는 복잡한 현실 사이에 존재하는 간극을 메우는 것을 목표로 한다.

 

1990년대 이후, **복잡성 과학(complexity science)**은 다양한 산업과 학문 분야에서 조직이 자신들의 작업 방식을 바라보는 관점을 변화시켰다.¹⁻⁵ 이러한 연관된 개념들은 **보건의료 산업(health care industry)**에도 도입되어, 보건의료 조직과 임상 운영의 방식에 영향을 미치고 있다.⁶ 그러나 *의학교육(medical education)*은 이러한 근본적인 아이디어에 대해 상대적으로 천천히 반응해왔다.⁷ 더욱이, 실제로 시스템 사고가 도입된 사례들에서도 **그 구현은 대체로 시스템 사고 도구(systems-thinking tools)**에 국한되었으며, 이 도구들의 기원, 근거, 전반적인 전략에 대한 인식이 부족한 상태에서 활용된 경우가 많았다.

 

이러한 상황은 결국, **수련의나 실무자들이 ‘지속적 질 향상(continuous quality improvement)’, ‘환자 안전 문화(culture of patient safety)’, ‘현장 기반 학습(practice-based learning)’, ‘팀워크(teamwork)’**와 같은 중요한 시스템 개념들에 대해 잘못된 이해를 가지게 되는 결과를 초래하였다.

 

이 논문의 목적은 다음의 세 가지로 요약된다.

  1. **수련의, 임상의, 의학교육자들에게 시스템 사고에 대한 명확한 근거(rationale)**를 제공하는 것
  2. 전문직 실무에 시스템 사고를 적용하기 위한 단순한 적응적 행동(adaptive behaviour) 프레임워크를 개발하는 것
  3. 이 프레임워크가 채용(recruitment), 전문성(professionalism), 평가와 피드백(assessment and evaluation) 등 의료 실무와 의학교육의 여러 영역에 미치는 시사점을 상상해보는 것

앞으로의 세기에 직면하게 될 복잡한 보건의료 과제들에 효과적으로 대응하기 위해서는, **시스템 개념에 대한 더 깊은 이해(deeper understanding of systems concepts)**가 본질적으로 필수적이다.


PART I: 복잡한 문제와 의료 실무

복잡한 문제 해결 (Complex problem solving)

일상생활과 임상의학(clinical medicine)에서 우리는 **복잡한 문제(complex problems)**에 매일 직면한다. 복잡한 문제는 ‘완고(stubborn)’하다. 이들은 몇 가지 고전적인 특징들 때문에 쉽게 해결되지 않는다(그림 S1 참고).

 

 

복잡한 문제는 **많은 요소들이 작동하는 시스템(system)**에서 발생한다. 이 요소들은 서로 연결되어(interconnected) 있으며 **상호 의존성(mutual dependencies)**을 가진다. 요소들 사이의 상호작용은 **역동적(dynamic)**이며, 따라서 시스템의 행동도 역동적이다. 또한 이 시스템의 요소들과 그 상호작용은 명확하게 드러나지 않으며(intransparent), 문제 해결의 목표 설정(goal setting) 또한 단순하지 않다. 문제 해결의 목표는 자명하지 않을 수도 있으며, 때로는 여러 개일 수도 있고, 상충하는 경우도 있다(antagonistic goals).

 

따라서 요소의 수가 많고, 이 요소들이 불투명하고 서로 얽혀 있을수록 문제는 더욱 복잡해진다.⁸

 

복잡한 시스템은 **예측 불가능한 행동(unpredictable behaviour)**을 보인다. 서로 강하게 연결된 시스템의 일부만이 드러나 있는 상태에서는, *잘 정의된 변수들을 입력하더라도 전체 시스템 수준에서 예상치 못한 행동(emergent phenomena)*이 나타날 수 있다.

 

게다가 부정 및 긍정적 피드백 메커니즘, 자극 임계치, 보조인자(cofactor) 관계, 동적 상호작용 등 다양한 관계들로 인해, 입력을 신중하게 조절(titration)했음에도 **예상치 못한 결과(non-linear behaviour)**가 나타난다.⁵⁻⁹

 

이러한 복잡계의 특성은 시스템의 한 부분에서 일어난 아주 미세한 교란이, 시스템의 전혀 다른 먼 부분에 극적인 결과를 초래하는 **‘나비효과(butterfly effect)’**의 존재를 설명해준다.¹⁰ 또한, 이는 초고속 슈퍼컴퓨터조차 주식 시장이나 날씨의 움직임을 정확히 예측하기 어려운 이유를 설명해준다.¹¹ 복잡한 문제 해결은 지식만으로는 충분하지 않다. 이에는 인지적, 정서적, 사회적 자원이 필요하다.

 

예를 들면:

  • 인지적 유연성(cognitive flexibility)
  • 반복적 사고 처리(iterative processing)
  • 동기(motivation)
  • 자기 신뢰(self-confidence)
  • 인내(perseverance) 등이 요구된다.¹²⁻¹³

이러한 기술과 태도는 문제 해결자가 변화에 적응하고, 새로운 지식을 생성하며, 성과를 지속적으로 향상시킬 수 있도록 해준다.

이러한 특성들은 모여서 **적응적 행동(adaptive behaviour)**의 핵심 요소를 구성한다.
→ 적응적 행동은

“새롭거나 변화하는 환경 또는 상황적 요구에 대응하여 나타나는 인지적, 정서적, 동기적, 행동적 조정”
으로 정의된다.¹⁴

 

복잡한 문제 해결 능력은 학습될 수 있다. 경험을 모의(simulate)하거나, 학생들을 실제의 복잡한 문제 해결 상황에 직접 노출시키는 방식이 가장 효과적이다.¹⁵⁻¹⁸ 한편, 별도로 진행된 연구들도 **적응 기술(adaptive skills)**이 학습 가능하며, 경직된 사고방식을 가진 사람들보다 학업적·비학업적 성과가 더 높다는 증거를 보여준다. 이러한 적응력 향상정서적 웰빙(emotional well-being), 자기 효능감(self-efficacy), **회복탄력성(resilience)**의 향상과도 관련이 있다.¹⁹⁻²¹

 


의사들은 복잡한 시스템 속에서 실천하며, 복잡한 문제를 다룬다

의사들은 다양한 복잡한 시스템(complex systems) 안에서 진료 활동을 수행한다. 정보 플랫폼, 질병 유행(epidemics), 보건의료 체계 자체와 같은 **생물학적 및 조직적 시스템(biologic and organisational systems)**은 무수히 많은 상호연결된(interconnected)·역동적인(dynamic) 요소들로 구성되어 있으며, 이들은 **집합적으로 복잡계의 행동(complex system behaviours)**을 만들어낸다.²²⁻²⁷

 

개별 환자 진료(patient care) 또한 본질적으로 **복잡성(complexity)**을 지닌다. 환자들은 **생물학적·심리사회적 시스템(biologic and psychosocial systems)**에 내재된 다양한 문제를 호소하며 병원을 찾는다. 이 시스템들 역시 *역동적이며 불투명(intransparent)*하다.²⁸ 게다가, 환자 및 그 가족들과 함께 진료 목표(goal)를 설정해야 하는 책임까지 더해지면, 복잡성은 더욱 심화된다.


의학교육은 여전히 문제 해결에 있어 주로 환원주의적 접근을 장려한다

20세기 초, **환원주의적 실증과학(reductionist empirical science)**현대 의학의 과학, 교육, 실천의 근간이 되었다. Flexner 보고서(Flexner Report)의 지원 아래, **미국의학협회(American Medical Association)**와 **의학교육위원회(Council on Medical Education)**는 **미국 의과대학에 대한 엄격한 기준(strict expectations)**을 도입하였다. 당시 이들의 명시적 목표는, _“질병의 과학적 기초에만 집중하는 ‘이상적인’ 커리큘럼”_을 구현하는 것이었다.²⁹ 이후, 보험 수가 체계(reimbursement practices), 병원 간 경쟁, **국립보건원(National Institutes of Health)**의 우선순위에 의해 **환원주의적 과학은 의학의 본질에 깊이 스며들게 되었다.**³⁰⁻³³ 그 결과, 좁은 전문성(narrow expertise), 임상적 세분화(clinical specialisation), 목표 지향적 약물 개발(targeted drug development), 기술 의존적 진료가 오늘날 **학문적 의료기관(academic medical centres)**을 지배하게 되었다.³⁴

 

오늘날의 의과대학생들은 기초과학 전문가들에 의해 구성된 엄격한 기초과학 교육 커리큘럼을 통해 의학을 처음 접하게 된다.
기초 교육과 임상 교육 모두에서, 학생들은 **“건강의 상위 개념도 결국 더 기본적인 구성 요소로 환원할 수 있으며, 생물학적 시스템은 가장 기초적인 수준에서 연구해야 가장 잘 이해할 수 있다”**는 관점을 학습하게 된다. 이러한 관점은 학생들이 배우는 근거의 생성(generation of evidence), 실천에의 적용(application to practice), 병상에서의 실무(bedside work) 전반을 조직하는 **기본 원리(organising principles)**로 작동한다.³⁵⁻³⁶ 이처럼 **기계론적 문제와 해법(mechanistic problems and solutions)**에 집중하는 교육은 너무나 철저하게 이루어졌기 때문에, 일부 학자들은 의학교육을 본질적으로 환원주의적 노력이라 묘사하기도 한다.³⁷


실천의 간극: 순수한 환원주의적 접근은 과제 해결에 불충분하다

환원주의 과학에 대한 전문성복잡한 문제를 성공적으로 해결할 수 있는 역량 사이에는 *커다란 간극(practice gap)*이 존재한다.³⁸ 비록 생의학 과학(biomedical sciences)에 대한 우리의 이해가 눈에 띄게 진보했음에도 불구하고, 인간 질병의 방대한 영역을 뒷받침하는 메커니즘에 대해서는 여전히 무지한 상태이다. 게다가 우리가 알고 있는 기존 지식조차도 **불확실성(uncertainty)**을 내포하고 있으며, 이는 복잡하고 역동적인 시스템의 행동을 설명하기에는 단편적이고 정적인(piecemeal and static) 모형일 뿐이다.³⁹⁻⁴⁰

 

이러한 **‘복잡성의 간극(complexity gap)’**은 보건의료 시스템의 모든 수준에서 그 영향을 드러낸다. 예를 들어:

  • 의사, 병원, 보건의료 시스템은 시간, 자원, 규정 준수 압력에 의해 움직이며, 이로 인해 복잡한 진료 차원을 고려하지 않고 단순히 *근거(evidence)*를 적용하는 경우가 많다.⁴¹⁻⁴²
  • 예컨대, 복합적인 질환을 가진 환자에게 의사는 **단일 질환 중심의 진료지침(disease-specific guidelines)**을 적용할 수 있는데, 이는 대개 지침을 뒷받침한 연구에서 제외된 환자군이다.⁴³⁻⁴⁴
  • 병원 차원에서 보면, **울혈성 심부전(congestive heart failure)**은 Medicare 환자 입원 사유 중 가장 흔한 원인 중 하나임에도, 재입원을 줄이기 위한 외래 치료 프로토콜은 자주 무시된다.⁴⁵⁻⁴⁶
  • **보건의료 정책 전반(system wide)**에서는, 정책 입안자들이 환자의 경험, 인구 집단의 건강, 진료 비용을 동시에 개선하려 애쓰지만, 이 세 목표는 상호 독립적이지 않고 때로는 상충하기까지 하기에 어려움을 겪는다.⁴⁷

전체적으로 볼 때, 현재의 고도로 전문화(specialised)되고 분절화(compartmentalised)된 보건의료 시스템은 **서비스의 질, 비용, 이용 측면에 부정적인 영향을 미치는 단절된 진료(fragmented care)**에 시달리고 있다는 강력한 증거가 있다.⁶,⁴⁸⁻⁵⁰


환원주의적 의학교육 커리큘럼은 예상치 못한 방식으로 임상 실무에 부정적 영향을 미친다

복잡한 문제 해결에 필요한 많은 자질들은 대학 시절에 잘 발달되지만, 기초의학 교육과정 동안에는 그 발달이 정체되거나 퇴보하는 경향을 보인다. 의과대학생들은 다음과 같은 영역에서 발달이 정지되거나 지체된다:

  • 도덕적 추론 능력(moral reasoning)
  • 지식에 대한 신념(epistemologic development)
  • **모호성과 불확실성에 대한 수용력(tolerance of ambiguity and uncertainty)**⁵¹⁻⁵⁵

이러한 현상은 매우 중요한 의미를 가진다. 이 영역들에서의 **발달 지체(disturbed development)**는 다음과 같은 결과를 초래하는 것으로 나타났다:

  • 임상 성과 저하
  • 보건의료 비용 증가
  • 의료 과오(medical error)에 대한 수용의 장벽 형성⁵³,⁵⁵⁻⁶³

또한 일부 연구는 **적응적 특성(adaptive traits)**의 발달 저하와 **우울 및 불안(depression and anxiety)**의 발병 사이에 *허용적 관계(permissive relationship)*가 있을 수 있음을 시사한다.⁶⁴⁻⁶⁶

 

간극을 메우기 (Bridging the gap)

**시스템 사고(Systems thinking)**생의학 시스템에 대한 환원주의적 지식환자 진료의 복잡한 현실 사이의 간극을 메우는 것을 목표로 한다. 이 개념은 70여 년 전, 생물 전체의 생물학을 환원주의 과학만으로는 설명할 수 없다고 회의했던 생물학자들에 의해 처음 개발되었다. 이후 약 50년 전, 이 개념은 생태학(ecology), 공학(engineering), 경제학(economics), 사회학(sociology) 등의 다양한 학문 분야로 확산되었다.

 

초기의 시스템 사고**‘적응하는 전체(adaptive whole)’**라는 개념에 초점을 맞추었다. 이 개념은 어떤 존재(생물학적이든 아니든)의 행동을 그 **구성 과정들이 상호작용하면서 나타나는 *창발적 속성(emergent property)***으로 간주하였다.
이러한 존재들은 변화하는 환경과 상호작용하는 가운데, **회복탄력성(resilience)**을 보여주며, 적응하고 생존할 수 있는 능력을 지닌다.⁶⁷ 

 

시스템 과학은 이러한 시스템의 행동을 지배하는 근본 원리를 밝혀내려는 시도라고 할 수 있다. 중요하게도, 시스템 사고는 환원주의적 과학에 기반한 합리적 사전 계획(rational pre-planning)이나 조직적 사고(systematic ideas)—즉, _엄격한 역할, 규칙, 책임_에 의존하는 접근—의 연장선이 아니다. 이러한 접근은 다음과 같은 복잡한 문제의 고전적 특성들을 설명하는 데 실패한다:

  • 모호한 목표(ambiguous goals)
  • 상호 연결성(interconnectedness)
  • 불투명성(lack of transparency)
  • 역동적 행동(dynamic behaviour)

이에 반해, 시스템 사고팀워크(teamwork), 지속적 질 향상(continuous quality improvement), **시스템 기반 실무(system-based practice)**와 같은 개념들의 **근거(rationale)**를 제시하는데, 이는 복잡성의 간극(complexity gap)을 넘는 적응적 다리(adaptive bridges)—즉, 반응성과 역동성을 갖춘 ‘학습(learning)’의 과정—로 작용한다.⁶⁸

 

여기서 ‘체계적(systematic)’ 개념과 ‘적응적(adaptive)’ 개념 사이의 구분은 매우 중요하며, 이것이 바로 현대 의학교육 및 실무에서 시스템 개념이 오용(misapplication)되는 이유를 설명해준다. 예를 들어, **팀워크에 ‘엄격한 역할과 책임’(systematic approach)**만을 적용할 경우, **복잡한 문제 해결에 필수적인 다양한 관점의 유연성과 조율력(flexibility and leverage of diverse perspectives)을 제공하지 못한다. 이는 **적응적 접근(adaptive approach)**의 핵심적 특징이다.

 

이 논문의 다음 부분에서는,

  • **적응적 행동(adaptive behaviour)**을 통합한 **전문직 실무 모델(model of professional practice)**을 설명하고,
  • 이러한 개념적 구분을 명확히 하며,
  • 널리 사용되는 시스템 개념들의 근거를 구체적으로 밝힐 것이다.

PART II: 복잡 적응 시스템(Complex Adaptive Systems, CAS)과 의료 실무

복잡 적응 시스템: 구성 요소 (Complex adaptive systems: components)

많은 **복잡한 시스템(complex systems)****자발적으로 조직화된 행동(spontaneous organised behaviour)**을 나타낸다. 이러한 시스템의 예로는 자기조직화 분자(self-organising molecules), 신체의 면역계(immune system), 주식 시장(stock market), 인간 조직(human organisations) 등이 있다.

 

이들은 수많은 요소들, 역동적 상호작용, **불투명성(lack of transparency)**에도 불구하고, **질서(order)**를 만들어낸다.
더 나아가, 이 시스템들은 **회복탄력성(resilience)**을 지니며, 교란(perturbation) 이후 **재조직(reorganise)**된다.²¹⁻²³,⁶⁹

이러한 행동 양상 덕분에, **복잡 적응 시스템(complex adaptive systems, CASs)**미국 의료 시스템(American health care system), 학술 의학 센터(academic medical centre), 또는 만성 질환 환자의 치료와 같은 복잡한 시스템을 최적화하는 데 유용한 개념들을 보여준다.

 

중요하게도, CAS는 **복잡한 문제 해결(complex problem solving)**과 **적응적 행동(adaptive behaviour)**의 핵심 구성 요소와 역동성도 함께 보여준다.


CAS는 복잡성의 간극을 분산 통제를 통해 극복한다

복잡 적응 시스템은 **사전에 계획된 합리적 전략(rational advance planning)**이나 **전지적 중앙 조작자(omnipotent central operator)**의 통제에 의해 ‘성공’하는 것이 아니라, **각 구성 요소가 주변 시스템과의 지역적 상호작용(local system interactions)**에 민감하게 반응하는 능력을 통해 시스템 전반의 *질서 있고 회복력 있는 행동(emergent system behaviour)*을 만들어낸다.

 

이러한 **자기 조직화(self-organisation)**를 가능하게 하는 몇 가지 핵심 요소들이 있다(<Figure 1>, panel a):

  1. **각 요소는 고유한 특성(characteristics)**을 지니며, 전체 시스템 조직에 의미 있는 기여를 한다.
  2. 이 요소들은 특정한 ‘매력적 힘(attractor)’—즉 그들을 조직화로 유도하는 중심 가치나 목표—에 의해 자극받는다.
  3. 각 요소는 **적응 능력(adaptive capacity)**을 가지고 있어, 주변 요소들과 건설적인 상호작용을 통해 ‘전체(whole)’로 조직화될 수 있다.
  4. 이 전체 시스템의 **회복탄력성 있는 행동(resilient behaviour)**은 **과도한 외부 혹은 중앙 통제의 부재(absence of excessive external or centralised control)**에 의존한다.
    → 즉, 복잡 적응 시스템에 대한 과도한 통제는 시스템이 지역적 교란에 대해 시의적절하고 건설적으로 대응할 수 있는 능력을 약화시킨다.

네 가지 CAS 구성 요소엄격하고 외부에서 적용된 규칙들이 다루지 못하는 복잡한 시스템의 고유한 도전 과제들을 극복할 수 있도록 한다.

 


CAS 구성 요소는 의료 실무의 복잡한 문제 해결에도 유사하게 적용된다

  • **의학 지식과 기술적 전문성(medical knowledge and technical expertise)**은 *의사가 의료 시스템(전문직, 병원, 외래 진료 등)*에 기여할 수 있도록 해주는 **핵심 특성(characteristics)**이다.
  • 복잡한 문제 해결 상황에서, 의사는 병상에서 **적응적 행동(adaptive behaviour)**을 발휘할 수 있도록 자율성(autonomy)—즉 과도한 외부나 중앙 통제의 부재—을 부여받는다.
  • 이러한 행동은 **의료 전문성의 핵심 가치를 형성하는 신념들(values)**에 의해 **유도(attracted)**된다.

만약 이 네 가지 CAS 구성 요소 중 어느 하나라도 부재하게 되면, 의사의 복잡한 문제 해결 능력은 저해된다.

 

 

복잡 적응 시스템: 역동성 (Complex adaptive systems: dynamics)

**복잡 적응 시스템(CASs)의 적응적 행동(adaptive behaviour)**은 **매우 특징적인 역동성(characteristic dynamics)**으로 나타난다. 이 세 가지 역동성은 단지 ‘편리하거나 바람직한 행동’이 아니다. 이들은 자기 조직화 시스템(self-organising systems)의 내재적이고 불가피한(inherent and unavoidable) 속성들이다.

 

인접한 요소들의 변화하고 예측 불가능한 행동에 지속적으로 노출되는 CAS의 각 요소는, 전체 시스템에 대해 반복적(iterative) 또는 지속적인(continuous) 방식으로 민감하게 반응해야 한다.

 

예를 들어,

  • **개별 물고기(fish)**는 **주변 물고기들과 지속적으로 상호작용하지 않으면 무리(school)**에 융합될 수 없다.
  • 이러한 인접 요소들의 행동에 적응하는 과정에서, 물고기들은 **공진화 행동(co-evolutionary behaviour)**을 나타낸다.
  • 이들은 ‘어트랙터(attractor)’—즉 생존과 같은 중심 목표—에 의해 움직이며, 서로 상호작용하면서 **조직 최적화(optimise organisation)**를 이루어낸다.
  • 물고기의 경우, **유전자 풀의 생존(survival of the gene pool)**은 **본능적인 무리 행동(schooling behaviour)**에 의해 향상된다.

이러한 개념들은 **최적의 의료 서비스(optimal medical care)**에서도 반드시 작동하고 있다.

  • 환자는 **다학제 팀(multidisciplinary team)**의 구성원들과 본인 간의 **조정된 상호작용(coordinated interactions)**에 의존한다.
  • 이처럼 함께 적응해가는 과정은 곧 **팀워크(teamwork)**의 본질이다.
  • 예측할 수 없는 생리적 반응(unpredictable physiology)에 적절히 대응하기 위해, 각 팀원은 환자의 **생체징후(vital signs)**와 다른 팀원들의 행동을 지속적으로 모니터링해야 한다.
  • **전문직업성(professionalism)**이라는 **어트랙터(attractor)**에 의해 각 팀원은 *환자의 상태를 개선하기 위한 공동의 목표(goal)*에 맞춰 자신의 행동을 조직화한다.

이 두 사례(물고기의 무리 행동과 다학제 팀의 임상 실천)에 나타난 **CAS의 역동성(dynamics)**은, 핵심 시스템 개념들(core systems concepts)— 즉,

  • 팀워크(teamwork)
  • 지속적 질 향상(continuous quality improvement)
    의 **이론적 근거(rationale)**를 잘 보여준다.
    ( 참고)

 

 

복잡 적응 시스템: 실천에 대한 시사점
(Complex adaptive systems: implications for practice)

복잡 적응 시스템(CAS) 모델은 실천에 있어 여러 측면에서 강력한 영향력을 지닌다. 전체적으로 볼 때, **CAS에서 얻는 통찰(insights)**은 다음과 같은 중요한 사실을 강하게 시사한다: → **시스템 사고(systems thinking)**란 본질적으로 ‘체계적 조직(systematic organisation)’이 아니라 ‘적응(adaptation)’에 관한 것이다. 

즉, **체계화를 독립적 개입(systematisation as a stand-alone intervention)**으로 도입할 경우,
그 **경직되고 사전 결정된 사고방식(rigid, predetermined thinking)**은

  • **복잡한 문제 해결(complex problem solving)**을 방해하고,
  • **회복탄력성(resilience)**을 약화시킨다.

이러한 CAS 관점환자 진료의 최전선에서 수집된 경험적 근거에 의해 뒷받침되며,⁷⁰⁻⁷²
이미 여러 보건의료 기관들이 이 개념을 채택하여 진료의 질을 향상시키는 데 활용하고 있다.⁷³⁻⁷⁶


CAS 프레임워크는 또한 전문직 실천의 두 가지 핵심 요소에 대한 이해를 확장시킨다:

  1. 의료 전문직업성(medical professionalism)
  2. 의사의 자율성(physician autonomy)

① 전문직업성 (Professionalism)

  • 여기서 전문직업성은 단순히 **사회와의 계약적 의무를 충족시키는 일련의 명확한 행동들(well-circumscribed behaviours)**이 아니다.⁷⁷⁻⁷⁸
  • 그것은 복잡한 문제의 모호성(ambiguity) 속에서 방향을 잃지 않도록 도와주는 **‘나침반(compass)’**과 같다. 
    → 반면, **알고리즘(algorithms)**이나 규칙(rules) 같은 ‘지도(roadmaps)’는 너무 경직되어 복잡한 문제에 효과적으로 대응하지 못한다.
    (<Figure 2>, panel b 참고)

② 자율성 (Autonomy)

  • 자율성은 단지 **전문직의 이타적 서비스에 대한 사회의 보상(quid pro quo)**이나, 전문성에 대한 존중의 표현을 의미하는 것이 아니다.
  • 자율성은 전문가가 적응적 행동(adaptive behaviour)—즉 복잡한 문제 해결 및 혁신(innovation)—을 발휘할 수 있도록 해주는 **본질적 실천 조건(essential practice condition)**이다.

마지막으로, CAS 프레임워크는 실천에서 지식과 기술(knowledge and technology)의 역할 자체를 재정의한다.

  • **환원주의적 지식(reductionist knowledge)**과 **전문성(expertise)**은 전문가를 정의하지 않는다.
  • 이러한 특성들만으로는 **전문가(professional)**와 **기술자(technician)**를 구분할 수 없다.

전문가를 기술자와 구분 짓는 핵심은 다음 두 가지이다:

  1. 적응 능력(adaptive capacity)
  2. 공유된 가치 체계(shared value system)

→ 이것이 바로 **‘시스템 행동(systems behaviour)’**이며, (<Figure 2>, panel a 참고)

이러한 행동 특성이 전문가를 진정한 전문가로 만들어주는 요소이다.

 

 

 

PART III: 의학교육에서 복잡성을 고려하기
(Accounting for Complexity in Medical Education)

 

**의료 전문가를 적응적 존재(adaptive professional)**로 바라보는 관점은 의학교육과 실천 모두에 중대한 시사점을 가진다.
만약 *지식이 도구적(instrumental)*이며, 적응적 전문가가 복잡한 문제를 해결하기 위해 실용적으로(pragmatically) 활용하는 수단이라면, 순수한 환원주의적 교육과 실천의 한계는 자명해진다. 이러한 접근은 ‘전략(strategy)’과 ‘도구(tool)’를 혼동하는 셈이다.

 

논문의 마지막 섹션에서는 이러한 발달을 **지원(support)**하기 위한 일반적인 접근 방식(general approaches) 몇 가지를 살펴본다. 각 접근법은 구체적인 개입(intervention) 사례로 설명되며, 추가적인 개입 예시는 에 정리되어 있다.²,⁷⁹⁻⁸⁷


접근법 1: 적응적 수련의와 의사 선발하기
(Approach 1: Recruit adaptive trainees and physicians)

지난 수십 년간, 심리학자들은 ‘현실 세계(real-world)’ 지능에 대한 정의를 회복하려는 관심을 지속적으로 보여왔다. 이러한 연구들을 하나의 흐름으로 본다면, 이는 **피아제(Piaget)**의 인지 발달 이론을 더 넓고 깊게 확장한 것이라 볼 수 있다.

단순한 인지 기능을 넘어,

  • 인식론적 겸손(epistemic humility),
  • 모호성 수용(tolerance of ambiguity),
  • **도덕적 추론(moral reasoning)**과 같은 영역까지 포괄하고,
  • 고도로 기능하는 성인의 특징으로서 통합된 ‘탈형식(post-formal)’ 단계를 추가하는 방식이다.⁸⁸

이러한 개인은 다음과 같은 특성을 보인다:

  • 지식은 상대적이며 절대적이지 않다는 점을 이해하고,
  • 모순을 수용하며,
  • 모순을 더 큰 통합 구조 속에 포함시킬 수 있다.

결과적으로, 이들은 좋은 판단력(good judgement), 실용적 의사결정(practical decision making),
그리고 현실 세계의 복잡성 속에서 적응할 수 있는 능력을 발휘한다.⁸⁹⁻⁹⁰

 

의료 실천의 본질적 복잡성은 다음을 시사한다: **적응성(adaptability)**은 선발(admissions)채용(recruitment) 전반에서 특별히 주목해야 할 속성이라는 것. 현대 직장에서의 성공에 있어 적응 능력은 핵심 요소이며,⁹¹ 이는 학업 및 비학업 성과 모두에 긍정적인 영향을 미치는 것으로 나타났다.⁹² 지난 20년간 **로버트 스턴버그(Robert Sternberg)**는 이러한 통합적 지능(intelligence) 개념이 **학생 선발(student admissions)**에 실제 적용 가능함을 입증해 왔다. 그는 **‘성공 지능(successful intelligence)’**을 확장한 WICS 모델즉,

  • 지혜(wisdom),
  • 지능(intelligence),
  • 창의성(creativity)
    —을 바탕으로,
    **SAT와 ACT 같은 기존 학업능력 시험을 보완할 수 있는 평가 도구(assessment tools)**를 개발하였다.⁹³

하나의 다기관 연구에서는, 1,000명이 넘는 학생들을 대상으로 WICS 기반 평가가 SAT 단독 사용 대비, 대학 GPA 예측력을 두 배 향상시키는 것으로 나타났다. 또한, 이 평가 모델은 기존 대학 입시 평가에서 흔히 나타나는 인종 및 민족 간 격차완화시키는 효과도 있었다.⁹⁴ 

 

이러한 노력들은 다음을 강조한다. → **의학교육 및 실천의 전 교육 과정(training and practice continuum)**에 걸쳐, ‘적응 행동(adaptive behaviour)’을 선발 기준(selection criteria)에 통합하는 것이 잠재적 이점과 실효성을 갖고 있음을 보여준다.

 

 

접근법 2: *인식론적 겸손(epistemic humility)*을 가르치고 실천으로 보여주기

수천 년 전부터, ‘지혜로운 사람(wise man)’이란 자신이 모르는 것을 자각하는 사람이라고 여겨져 왔다.⁹⁵ 현대에 와서는 이러한 **지적 통찰력(intellectual lucidity)**을 **인식론적 겸손(epistemic humility)**이라는 용어로 설명한다. 여기서 epistemic은 **지식의 본질(nature of knowledge)**을, humility는 불확실성(uncertainty)에 대한 인정을 의미한다. 최근 수십 년 동안, 이 개념은 임상적 의사결정(clinical decision making)에서 과학을 활용하는 방식과 관련하여 점차 적용되어 왔다.⁹⁶⁻⁹⁷

 

이 분야의 주요 논의는 다음과 같은 점에 주목한다:
복잡한 환자 진료(complex patient care)에 과학 지식을 적용하는 데는 본질적인 불확실성이 존재하며,
윤리적이고 지적으로 엄격한 진료를 위해 의사는 이 불확실성을 인정해야 할 의무가 있다는 것이다.⁹⁸

 

이러한 시각은 다음과 같은 인식에 기반하고 있다:

  • **확률 기반 과학(probabilistic science)**은 본질적으로 불확실한 도구이며,
  • **통계적 평균(statistical averages)**은 결코 개별 환자의 진료를 완전히 설명할 수 없다.⁴²,⁹⁹

하지만 전통적인 의학교육은 이러한 불확실성을 충분히 고려하지 못하는 경우가 많다. 학생과 의사들은 실무에서 **근거(evidence)**와 **진료지침(guidelines)**을 활용하도록 교육받지만, 심지어 최고 수준의 근거조차 그 한계에 대해서는 충분히 조명되지 않는다.¹⁰⁰⁻¹⁰¹ 이러한 간과는 다음과 같은 방식으로 수련의의 과학 지식에 대한 이해와 활용 방식에 중대한 영향을 미친다:

  • **p-value를 오해(misinterpretation)**하거나,
  • **통계 기법의 정밀성(precision)**을 **결정의 확실성(certainty)**과 혼동하고,
  • 각 사례의 고유한 맥락을 고려하지 않은 채 근거를 기계적으로 적용하는 일이 발생한다.¹⁰²⁻¹⁰³

그 결과, **과학의 무비판적 적용(undiscerning application)**은 **적응적 행동(adaptive behaviour)**을 **억제(stifle)**한다. **인식론적 겸손(epistemic humility)**은 지식의 가치를 존중하되, 그 적용에 있어 비판적 자세를 잃지 않는다. 이 점에서 그것은 제약적이면서도 해방적인(limiting and liberating) 태도이다. *불완전한 과학(imperfect science)*의 한계를 인정함으로써,

  • → 의사와 과학자는 지식에 대한 무비판적 종속에서 벗어나,
    환자와 사회의 요구에 유연하게 대응하고, 탐색하며, 혁신할 수 있는 자유를 갖게 된다.

이를 위해서는,

  • 통계학의 교과서적 전달을 넘어서,
  • 과학적 추론에 깔린 환원주의적 전제를 비판적으로 분석할 수 있는 **교육과정(curriculum)**이 필요하다.¹⁰²,¹⁰⁴⁻¹⁰⁵

이러한 분석은 현대 의학 문헌(contemporary medical literature) 속 사례들을 활용하여 이루어지는 것이 이상적이다.¹⁰⁶
이러한 균형 잡힌 교육적 접근은 오늘날 많은 수련의와 실무자들이 보이는 **경직된 과학주의(scientism)**를 완화시킬 수 있을 것이다.

 

 

접근법 3: *과도한 체계화(excessive systematisation)*를 피하기

**체계화(systematisation)**는 흔히 **완고하고 해결하기 어려운 문제(stubborn problems)**에 대응하기 위해 택해지는 일반적인 반응이다. 사실상 문제의 난이도와 복잡성이 클수록, 우리는 더 **체계적(systematic)**이고 **환원주의적(reductionist)**인 접근에 끌리는 경향이 있다.² 의학교육자에게 이러한 성향은, **측정과 관찰의 엄격함을 중시하는 과학적 문화(culture of science)**에서 비롯된다.¹⁰⁷ 여기에 더해, **신뢰성과 공정성(trust and fairness)**이 높아질 것이라는 기대가 체계화의 가치를 더욱 강화시킨다.¹⁰⁸⁻¹⁰⁹

 

하지만 이러한 **복잡한 문제에 대한 경직된 반응(rigid responses)**은 **반드시 건설적인 것은 아니다.**²²,¹¹⁰⁻¹¹¹


의학교육에서 과도한 체계화의 대표적 사례
→ **수련의 평가(evaluating trainees)**에 표준화된 방법들을 사용하는 것이다.

**전통적 역량 기반 의학교육(competency-based medical education, CBME)**에서 사용되는 평가 도구들은,

  • **객관적이고 관찰 가능한 행동 기준(objective and observable behavioural standards)**에 근거하고 있으며,
  • 이러한 행동들은 **안정된 방식으로 바람직한 결과(desired outcomes)**에 인과적으로 연결된 것으로 간주된다.

물론 CBME는 여러 영역에서 효과적이라는 점이 입증되었지만,¹¹²⁻¹¹⁴ 동시에 **보다 복잡한 역량(complex competencies)**을 제대로 평가할 수 있는지에 대한 우려도 제기되어 왔다.¹¹⁵⁻¹¹⁷ 이러한 **불일치(discrepancy)**는 자연스러운 것이다. 왜냐하면, 지속적으로 변화하고, 불투명하며, 상호 연결된 시스템에서의 문제에는 **‘정답’(one right answer)**이란 것이 존재하지 않기 때문이다. 특히 그 목표조차 명확하지 않을 때는 더욱 그렇다.⁸¹,¹¹⁸⁻¹¹⁹

 

궁극적으로 진정으로 유효(valid)한 성공 측정, 각 사례마다 *합의된 목표에 부합하는 유리한 임상적 결과(clinical outcome)*를 도출했는가에 있다.¹²⁰⁻¹²² 이러한 맥락에서, **실시간(real-time)**이면서 미세한 수준(granular)의 임상 결과 데이터는 **의사 훈련에서 핵심적인 역할(pivotal role)**을 수행하게 된다.¹²³,¹²⁴


만약 우리가

  • 행동 기준의 표준화,
  • 대리 결과(surrogate outcomes) 사용(즉, 실제 임상 결과 대신 간접 지표 활용)
    복잡한 문제 해결 능력 평가의 타당성을 저해한다고 판단한다면,
    → **기존 역량(competencies)에 대한 재구성(reframing)**이 도움이 될 수 있다.

즉,

  • **기술적 역량(technical competencies)****적응적 역량(adaptive competence)**별도로 평가함으로써,
  • 각각의 행동 군집에 대해 더 유효한(valid) 평가를 수행할 수 있게 된다.

이러한 접근은 다음과 같은 유익을 제공한다:

  • **의료 실천의 전략(strategy)**과 **도구(tool)**를 혼동하지 않게 해준다.
  • 유연하고 반응적인 대응이 필요한 상황에서도, **경직되고 부적응적인 행동(rigid maladaptive behaviours)**에 보상을 제공하는 오류를 피할 수 있다.
  • 또한,
    → **개별 역량(individual competencies)**에 대한 독립적 평가가 지닌 기술적 과제들을 다루며,¹²⁵
    → **개입(remediation)**의 목표와 방법에 대해 더 의미 있는 방향 제시를 제공할 수 있다.¹²⁶,¹²⁷

 

 

접근법 4: *적응적 행동(adaptive behaviour)*을 장려하기

전문직은 어떤 행동을 지향해야 하는가? 완벽하고 표준화된(perfect, standardised) 행동이라는 개념은 복잡한 시스템에서는 아무런 의미가 없다. 목표가 상충하기도 하고, 끊임없이 변화하며, 불투명하고 예측 불가능한 시스템 속에서는 **완벽성(perfection)**이 존재할 여지가 없다. 이러한 기준 대신, **탁월함(excellence)**
→ **핵심 가치(core values)**에 의해 추진되고,
→ **현실 세계와의 상호작용(real-world interactions)**에 의해 안내되며,
→ **반응하고 개선하려는 지속적인 노력(continuous effort to respond and improve)**으로 정의된다.¹¹¹,¹²⁸

 

‘학습(learning)’이라는 개념은 시스템 사고의 핵심 개념들

  • 시스템 기반 실무(systems-based practice),
  • 현장 기반 학습(practice-based learning),
  • 학습 조직(learning institutions)—에서
    정적이고 투명한 시스템을 전제로 하는 전통적 교수법과는 근본적으로 다르다.

→ **체계적 학습(systematic learning)**은 다음과 같은 방식으로 이뤄진다:

  • 강의실 교육(classroom learning)
  • 지침 기반 모듈(training modules)
  • 연례 질 향상 프로젝트(annual quality improvement projects)
  • 표준화 시뮬레이션(standardised simulation)

반면, **시스템 사고에 기반한 학습(systems-thinking learning)**은 → **지속적인 경험 기반 학습(continuous experiential learning)**을 통해 이루어진다. ( 참고)¹²⁹,¹³⁰

 


이러한 관점은 전통적인 의과 교육과정(medical curriculum)의 구조에 대해 중대한 질문을 던진다.

  • Part 1에서 살펴보았듯이, 만약 환원주의적 의학교육이
    적응적 행동을 억제하고,
    → 그로 인해 환자 결과가 악화되고 의료비용이 증가한다면,¹³¹
  • 그리고 만약 **임상 경험(clinical experience)**이
    회복력 있고, 자원이 풍부하며, 효과적인 전문가를 훈련하는 데 핵심 요소라면,
    Flexner 모델은 최적의 방식이 아닐 수 있다.

기초과학 중심 교육 → 임상 중심 경험이라는 이원적(two-part) 교육구조 대신, 기초과학과 임상 실습을 의대 입학 초반부터 동시에 수행하는 방식이 타당하지 않겠는가? 이러한 병렬적 교육은 다음과 같은 이점을 가진다:

  • 훈련 전이(training transfer) 강화
  • 핵심 전문직 가치(core professional values) 발달 기회 증진
  • 근거(evidence)에 대한 더 실용적 이해
  • 복잡한 문제 해결 및 평생학습에 필요한 습관(habits) 형성¹³²⁻¹³⁶

무엇보다 중요한 점은, → 이러한 교육 접근은 **고품질 임상 실무에서 적응적 행동의 우선성(primacy of adaptive behaviour)**을 가르치고 강화하는 데 기여한다.


결론: 적응적 리더십(Adaptive Leadership)

우리는 지금, 의료 실천(medical practice)의 새로운 시대의 문턱에 서 있다. **Flexner 세기(Flexner century)**는 환원주의적 생의학(reductionist biomedicine)에 대한 **중대한 헌신(important commitment)**을 의료 실천의 핵심 원리로 제시하였다. 이러한 헌신은 의료 전문직의 도약을 이끈 본질적인 전진이었지만,  **오늘날 의사들이 직면한 현실 세계의 문제들(real-world problems)**을 해결하기에는 불충분하다.

 

다가오는 세기에는, 우리는 **의료의 복잡성(complexity)을 고려(accounting for complexity)**함으로써 이 중요한 도구(tool)의 영향력을 더욱 확장해야 한다. 이러한 노력은 이미 시작되었다:

  • **시스템 접근법(system approaches)**을 활용한 의학 연구
  • 정보 기술의 진보(new information technologies)
  • 실무에 시스템 개념을 도입하는 시도들

그러나 궁극적으로, **의학교육의 리더들(leaders in medical education)**이 이 개념들을 깊이 이해하고교육 실천에 통합하려는 노력을 기울여야 한다. **지금이 바로, 의학교육에서 *적응적 리더십(adaptive leadership)*이 요구되는 시점이다.**²,⁸⁶

BMC Med Res Methodol. 2019 Mar 12;19(1):55.  doi: 10.1186/s12874-019-0701-4.

Advancing complexity science in healthcare research: the logic of logic models

 

 

📌 복잡한 중재를 위한 새로운 로직 모델: Type 4 Logic Model 이야기

“로직 모델이 복잡성을 담을 수 있을까?”

안녕하세요! 오늘은 의료현장이나 보건의료교육 등에서 자주 활용되는 **로직 모델(Logic Model)**에 대한 아주 흥미로운 논문을 소개해보려고 해요. 바로 복잡하고 변화무쌍한 환경에서 중재(intervention)를 설계하고 평가할 때, 우리가 어떤 로직 모델을 선택하고 어떻게 활용할 수 있을지를 다룬 논문이에요.


🧭 기존 로직 모델의 한계

우리가 익숙하게 써온 로직 모델들은 대체로 **선형적(linear)**이에요. 예를 들면 이런 흐름이죠:

투입(Input) → 활동(Activity) → 산출(Output) → 결과(Outcome)

 

이 방식은 단순하거나 복잡하긴 해도 예측 가능한(complicated) 중재에는 잘 맞아요.
하지만 요즘 우리가 다루는 중재는 어떤가요?
👉 사람, 조직, 맥락에 따라 매번 다른 형태를 취하는, 아주 복잡하고 적응적인(complex and adaptive) 형태가 많죠.

그런 중재를 기존 모델로 설명하려고 하다 보면 이런 문제가 생겨요:

  • 팀원이나 촉진자의 역할이 환경마다 달라지고
  • 실행 과정에서 나타나는 결과가 불규칙하게 분포하고
  • 초반의 작은 변화가 후속 성과에 큰 영향을 미치기도 해요.

이런 변화무쌍한 중재를 기존 로직 모델로는 제대로 표현하기 어렵다는 게 연구진의 문제의식이었어요.


💡 그래서 나온 게 Type 4 로직 모델!

이 논문의 가장 중요한 기여는 바로 **“Type 4 Logic Model”**이라는 새로운 유형의 모델을 제안했다는 거예요.

이 모델은 기존의 Type 1~3 모델과 다르게, 중재가 맥락(context)에 따라 어떻게 달라지고, 그것이 결과에 어떤 영향을 주는지를 역동적으로 표현하려고 해요.

“Type 4 logic models must convey a dynamic relationship between the facilitation of an intervention, the users/recipients of the intervention, contextual moderators and outcomes.”
→ “Type 4 로직 모델은 중재의 촉진, 수혜자, 맥락적 조절 변수(contextual moderators), 결과 간의 역동적인 관계를 전달해야 한다.”


🛠️ 어떻게 만들까? 정성적 분석이 핵심!

이 모델을 만들기 위해 연구진은 **프레임워크 분석법(framework analysis)**이라는 정성적 방법을 사용했어요.

  • 각 병동을 행(row)으로,
  • 중재 구성요소, 조절 변수, 결과를 열(column)로 두고,
  • 엄청난 양의 데이터를 구조화하면서 반복적으로 이론을 구성하고 수정한 거죠.

그리고 이 과정에서 깨달은 건,

“Only by creating a type 2 logic model and testing and refining its contents did the full complexity of PET become apparent.”
→ “Type 2 모델을 만들고, 그 내용을 테스트하고 수정하는 과정을 거쳐서야 PET 중재의 진정한 복잡성이 드러났다.”


👥 이해관계자 합의? 꼭 필요하지 않을 수도!

전통적인 로직 모델은 종종 모든 이해관계자가 동의하는 모델을 만드는 데 사용돼요. 하지만 이 논문에서는 새로운 시선을 제안해요.

“Accommodating differences of opinion may be more suitable for complex interventions given that the potential for disagreement increases with more complex problems.”
→ “복잡한 문제일수록 의견 불일치는 더 많아지므로, 이를 있는 그대로 수용하는 것이 오히려 더 적절할 수 있다.”

 

실제로 연구진은 어떤 병동에서는 PET 문서를 ‘중심적’이라고 봤고, 다른 병동에서는 ‘주변적’이라고 봤던 경험을 공유해요. 그 둘 다 틀렸다기보단, 서로 다른 맥락에서는 둘 다 맞을 수 있다는 가능성을 모델이 포용해야 한다는 거죠.


🎯 Type 4 모델의 새로운 역할: 촉진자를 위한 안내서

이제 이 모델은 단순한 설계도가 아니라, 미래의 중재 사용자(future users), 특히 **촉진자(facilitators)**가 중재를 어떻게 맥락에 맞게 조정할지를 스스로 판단하고 계획할 수 있도록 돕는 도구로 바뀌었어요.

“A new role for type 4 logic models emerges: to guide how future users of complex interventions adapt them to context.”
→ “복잡한 중재의 향후 사용자가 그 중재를 맥락에 맞게 조정할 수 있도록 안내하는 것, 그것이 Type 4 로직 모델의 새로운 역할이다.”


✍️ 마무리하며…

이 논문은 단순한 이론 제안이 아니라, 실제 행동 연구(action research) 현장에서 다양한 병동에서 PET 중재를 실행하고 정교화한 과정을 통해 복잡한 중재에 맞는 모델이 어떻게 구성되어야 하는지를 실증적으로 보여준 사례예요.

기존의 로직 모델로는 담기 어려웠던 맥락 중심성(context-sensitivity), 촉진의 역동성(facilitation dynamics), 그리고 결과의 불확정성을 포착하고자 한 이 시도는, 복잡한 현실 속에서 중재를 설계하고 실행하는 우리 모두에게 중요한 통찰을 줍니다.

 


배경 (Background)

의료 연구에서 '과정 평가(process evaluations)'의 중요성은 2008년 영국 의학연구위원회(MRC; Medical Research Council)의 가이드라인이 발표된 이후 확고히 자리 잡았다 [1]. 이 가이드라인은 중재(intervention)의 작동 원리에 대한 이론, 즉 때로는 "프로그램 이론(programme theory)" 혹은 *"변화 이론(theory of change)"*이라고도 불리는 개념을 도출하기 위해 정성적(qualitative) 과정 평가의 활용을 적극적으로 권장하였다. 이러한 이론은 중재를 최적의 방식으로 개발하고 활용하기 위해 필수적이라고 간주되었다 [1].

 

그러나 최근 들어, **MRC 가이드라인이 복잡한 중재(complex interventions)**를 평가하는 데 따르는 도전 과제를 충분히 다루고 있는지에 대한 의문이 제기되고 있다 [2–6]. **복잡성 과학(complexity science)**의 영향을 받은 학자들은, MRC 가이드라인이 다양한 환경에서도 대체로 동일하게 작동하는 ‘복잡한(complicated)’ 중재에는 적절할 수 있지만, 사회적 시스템을 변화시키고자 하는 ‘복합적인(complex)’ 중재에는 부적절하다고 주장한다 [2–6].

 

복합적 중재는 그 자체가 목표하는 사회 시스템을 변화시키기 때문에, **기존의 맥락적 요소(contextual factors)**가 중재의 형태를 직접적으로 형성하게 된다. *피드백 루프(feedback loops)*를 통해 **중재를 수행하는 사람과 받는 사람이 맥락에 맞게 중재를 조정(adapt)**할 수 있게 되고, 이는 결국 수행할 활동의 내용과 결과물 자체를 변화시킬 가능성을 내포한다 [5].

 

이러한 역동성의 한 사례는 공중보건 영역, 그 중에서도 *학교 기반 영양 교육 프로그램(school-based nutrition education interventions)*에서 찾아볼 수 있다. 정성적 탐색 연구에 따르면, 영양사들의 실천은 그들의 과거 경험과 각 학교의 맥락에 따라 다양하게 달라졌으며, 학생교사의 요구와 목표를 직관적으로 인식하여 중재를 전략적으로 조정함으로써 참여를 유지하려는 경향을 보였다. 이처럼 중재와 맥락 사이의 경계가 모호해지는 현상은 전통적인 평가 기법으로는 포착하기 어렵다 [7].

 

이러한 더 복잡한 중재를 설계하고 평가하는 데 적합한 방법론에 대해서는 **활발한 논쟁(debate)**이 이어지고 있다. 특히, 중재의 개발(developmental) 단계에 보다 많은 주목이 필요하며, 중재가 실제 실행 과정에서 유연하게 적응할 수 있도록 허용하는 형성적(formative) 방법이 점점 더 많이 권장되고 있다 [4, 5]. 그러나 복잡한 중재의 **이론 기반 평가(theoretical evaluation)**의 필요성은 여전히 인정받고 있음에도 불구하고, 새로운 연구 패러다임 하에서 '로직 모델(logic models)'이 어떤 역할을 해야 하는지는 여전히 불분명하다.


**로직 모델(logic models)**은 과정 평가에서 **중재(intervention)의 기반 이론을 단순하고 도식적인 형태(diagrammatical form)**로 표현하는 역할을 맡는다(관련 핵심 용어에 대한 용어집은 Additional file 1: Appendix 1 참조). 로직 모델을 지지하는 이들에 따르면, 로직 모델은 평가자가 다음과 같은 작업을 수행하는 데 유용할 수 있다:

  • 중재가 어떻게 결과를 도출하는지를 정확히 이해하도록 돕고 [1, 3],
  • **경험적 자료(empirical data)**를 조직하며,
  • 과정(process) 및 결과(outcome) 지표를 평가 목적에 맞게 명확히 설정하고 [8],
  • 이해관계자들이 변화의 필요성과 그 실행 방법에 대해 의견을 조율할 수 있도록 의사소통의 매개체 역할을 한다 [9].

또한, 로직 모델은 **프로그램의 논리(programme logics)**를 **연구 자금 제공자(funders)**에게 보여주거나, 연구 결과를 초기 시험 장소 외부로 이전하는 지식 전이(knowledge transfer) 과정에도 기여할 수 있다 [10].

 

하지만, 현재 보건의료 분야에서 사용되는 로직 모델에 대한 기존 지침들은 ‘중재와 맥락 간의 상호작용(interaction between interventions and context)’을 거의 고려하지 않고 있다 [2–6]. 이러한 한계로 인해, 일부 학자들은 로직 모델이 그 유용성의 한계에 도달했다고 주장하기도 한다 [4, 8, 10–16]. 실제로 로직 모델의 유용성은 BMC Medical Research Methodology 학술지에서도 자주 다뤄져 온 주제이다 [8, 11, 17, 18]. 이와 관련된 논의에 대응하여, *Greenwood et al.*은 다음과 같은 의문을 제기하였다: "로직 모델이 맥락에 따라 적응하는 복잡한 중재의 역동성을 표현할 수 있는가?" 그들은 다음과 같이 주장한다:

"아무리 정교하더라도, 로직 모델 단독으로는 충분하지 않다. 복잡성(complexity)은 순수한 정성적 서술만으로는 이해될 수 없기 때문이다" [11].

 

이러한 주장은 **정성적 로직 모델(qualitative logic models)**에 대한 성급한 배척으로 보인다. 현재 의료 연구에서 지배적인 형태의 로직 모델은 복잡하고 적응적인 중재를 설명하기에 부족할 수 있지만, 보다 유연하고 역동적인(dynamic) 형태의 로직 모델이 가능하다.

 

이를 뒷받침하기 위해, 저자들은 환자 경험 도구(Patient Experience Toolkit) 중재를 개발하고 평가한 자신의 경험을 예시로 들어 설명한다. 아울러, 저자들은 문헌에 대한 **스코핑 리뷰(scoping review)**를 통해 **로직 모델 유형에 대한 일종의 유형 분류(typology)**를 제안하며, ‘유형 4(type 4)’ 로직 모델이라고 명명된 **역동적 모델(dynamic models)**을 개발하기 위한 **공식적인 방법론(methodology)**도 함께 제시한다.

 

저자들은 이러한 접근을 통해 연구자들이
a) 중재를 평가할 때 어떤 유형의 로직 모델을 사용해야 할지 선택하는 데 도움을 주고,
b) 복잡한 중재를 모델링하는 데 따르는 도전 과제를 극복하는 데 기여하길 기대한다.


본론 (Main)

환자 경험 향상 도구(Patient Experience Toolkit, PET) 중재의 모델링

**환자 경험 향상 도구(PET: Patient Experience Toolkit)**는 **보건의료 전문가들이 환자 경험 자료(patient experience data)를 되돌아보고 이를 바탕으로 실질적인 변화를 이끌어내도록 유도하는 촉진 기반의 과정(facilitated process)**을 안내하기 위해 개발된 중재이다. 이 중재의 평가 연구의 일환으로 **다양한 유형의 로직 모델(logic models)**이 시험되었다.

 

이 과정은 다음과 같은 단계로 구성되어 있다:

  • 다학제 팀(multi-disciplinary team) 구성,
  • 환자 피드백에 대한 반성적 검토(reflection),
  • 질 향상(QI: Quality Improvement) 기법을 활용한 변화 실천.

이 연구는 영국 북부의 3개 NHS 트러스트(NHS Trust) 소속의 **6개 병동(wards)**에서 수행되었으며, PET 중재가 매우 상이한 맥락에서 작동하는 방식을 비교할 수 있도록 병동을 의도적으로 다양하게 선정하였다. 병동 팀과 환자 대표는 연구자들과 함께 행동 연구(action research) 프로젝트에 참여하여, **1년간 PET 중재를 실행하고 정교화(refinement)**하였다.

 

이 평가 연구의 주요 목표는 **PET 중재가 어떻게 작동하는지에 대한 일반화 가능한 이론(generalisable theory)**을 로직 모델 접근법을 활용하여 도출하는 것이었다.

**[Figure 1]**은 PET 중재에 대한 로직 모델을 제시하고 있다. 이 모델은 프로젝트 기간 동안 수집된 대규모 정성적 데이터셋프레임워크 기법(framework method) [19]을 사용해 분석함으로써 **점진적(iterative)**으로 개발되었다.
로직 모델의 범주(중재 자원과 활동, 조절 변수, 결과)는 프레임워크 매트릭스의 **세로축(column)**을 구성하였으며, **각 병동은 별도의 행(row)**으로 설정되어 방대한 데이터를 로직 모델과 관련된 방식으로 구성, 요약, 분석할 수 있도록 했다.

 

초기 로직 모델 구조는 **이론 개발을 위한 체계적 조직 틀(organising framework)**로서 유용하게 작용했지만, 프로젝트 중반 이후로 TM 연구자는 이 모델이 중재의 내재된 논리(underlying logics)를 정확히 반영하지 못하고 있다는 우려를 점차 갖게 되었다.

프레임워크 매트릭스의 병동별 열(column)에 대한 분석 결과, 행동 연구자의 촉진 방식(facilitation)에 따라 중재의 형태가 병동마다 상당히 달라지고 있다는 점이 드러났다. 전체 병동을 아우르는 하나의 로직 모델은 다음 네 가지 주요 측면에서 **PET 중재의 역동성(dynamics)**을 포착하지 못하고 있었다:

 

 


1. 역할(Roles)
병동 팀 구성원의 역할과 책임은 ‘참여 의지와 역량(willingness and capacity to engage)’에 따라 달랐으며, 행동 연구자는 각 팀의 상황에 맞게 자신의 역할을 **유연하게 조정(adapt)**하였다. 예컨대, 어떤 팀에서는 **병동 관리자(ward manager)**나 **환자 대표(patient representative)**가 수행한 촉진 업무를, 다른 팀에서는 행동 연구자가 직접 수행하였다.


2. 촉진과 조절 변수 간의 상호작용(Interaction between the facilitation and moderators)
행동 연구자들은 **각 병동의 고유한 조절 변수(moderators)**에 적극적으로 반응하였다. 예를 들어, 개선 활동을 지지하지 않는 병동 문화(즉, 낮은 직원 참여도, 낮은 웰빙, 낮은 자기 효능감)가 존재할 경우, **코칭(coaching)**이 특히 중요하게 작동하였다. 또한, 조직적 지원 부족이나 의사결정 상부 전달 경로의 부재 역시 행동 연구자가 경영진과의 관계를 구축함으로써 극복할 수 있었다. 그러나 초기 로직 모델은 촉진과 조절 변수 간의 이러한 역동성을 반영하지 못하고, 마치 **조절 변수가 단순한 방해 요인이나 촉진 요인(enablers or barriers)**으로만 작용한 것처럼 암시하였다.


3. 근접 결과(proximal outcomes)의 불규칙한 패턴
로직 모델에서 식별된 일부 근접 결과(예: 공유된 아젠다의 형성, 행동 계획 수립 및 실행, 환자 대표의 의미 있는 참여)는 모든 병동에서 관찰되었고, 따라서 **PET의 핵심 매개 변수(core mediators)**로 간주될 수 있다. 그러나 다른 근접 결과들은 병동마다 상이한 조절 변수 극복 노력과 관련되었으며, 예컨대 병동 문화 개선이나 행위자 간의 연결성 향상 등이 그러하였다.


4. 근접 결과가 후속 성공에 미치는 영향
마지막으로, 초기 로직 모델은 근접 결과의 출현이 프로젝트의 향후 성과를 강화하는 방식을 설명하지 못했다. 초기의 개선 효과와 근접 결과의 출현은 중재에 보다 수용적인 맥락을 형성하여, 이후의 개선 활동이 보다 쉽게 실행될 수 있는 기반을 마련해 줄 수 있음에도 불구하고, 이는 로직 모델에 반영되지 않았다.


보건의료 연구에서 사용되는 로직 모델의 유형 분류
(A typology of logic models used in healthcare research)

초기 로직 모델이 PET 중재(Patient Experience Toolkit intervention)를 정확히 설명하지 못한 결과, TM 연구자는 다른 로직 모델 접근법이 존재하는지 탐색하기 위해 이 분야 전체를 검토하게 되었다. 이 과정에서 **스코핑 리뷰(scoping review)**를 수행하였고, 이는 기존의 지침들에서 유래한 기법들을 바탕으로 진행되었다 [20].

 

문헌 검색은 Medline/PubMed, ASSIA, 그리고 Google Scholar를 활용하였으며, **회색 문헌(grey literature)**과 정식 출판 문헌(published literature) 모두에서 관련 논문을 찾아보았다. 로직 모델링의 특정 접근법을 지지하거나, 이 분야를 개관(review)한 논문을 선정 기준에 포함시켰으며, **건강(health)**을 중심 주제로 다룬 경우만 포함되었다.

각 논문은 다음 기준에 따라 평가되었다:

  • 로직 모델의 핵심 특성(core characteristics),
  • **복잡성(complexity)**을 어떻게 모델링하는지 (복잡성을 중재 자체의 속성으로 보는지, 혹은 맥락의 속성으로 보는지 여부).

이러한 차이를 반영하기 위해 **유형 분류 체계(typology)**가 개발되었으며, 이는 검색 및 분석 과정 중 반복적으로 정교화되었다(refined). 이 과정에서, 새로운 통찰을 제공하지 않는 논문은 배제되었다. 결과적으로, 총 9편의 핵심 논문이 다음 기준으로 선정되었다:

  • 독자적인 로직 모델 접근을 제시한 논문 [3, 21–24],
  • 로직 모델링 분야의 다양성을 드러낸 리뷰 논문 [3, 25–28].

이 논문들에 대한 추가 분석을 통해 **네 가지 축으로 구성된 유형 분류 체계(four-pronged typology)**가 도출되었으며 (Figure 2 참조), 이후 TM은 각 유형이 PET 중재를 설명할 수 있는지 평가하였다.

 


1형 및 2형 로직 모델 (Type 1 and Type 2 Logic Models)

회고적으로 보았을 때, PET 중재의 초기 로직 모델은 2형(type 2) 로직 모델이었다. 1형 로직 모델은 이보다 더 단순하며, **중재 구성요소(intervention components)**와 **결과(outcomes)**의 단순 나열로 이루어진다. 대표적인 사례는 W.K. Kellogg Foundation의 모델이 있다 [21]. 이러한 모델은 **중재의 계획 단계(planning stage)**에서는 적절할 수 있고, 가장 적은 자원을 소모하는 장점이 있지만, **중재와 관련된 맥락 요소(contextual aspects)**를 설명하지 못한다.

 

따라서, PET 중재를 위해 1형이 아닌 2형 로직 모델을 선택한 것은 적절한 판단이었다. 왜냐하면 이 평가의 핵심 목적 중 하나는 **PET의 실행을 가능하게 하거나 제약하는 맥락적 요소(contextual factors)**를 이해하는 것이었기 때문이다.

 

하지만 앞서 언급한 바와 같이, 2형 로직 모델은 PET 중재의 복잡성을 모델링할 수 없었다. 선형적 구조(linear structure)—즉, 투입(inputs) → 산출/결과(outputs/outcomes) 순으로 흐르는 구조—는 행동 연구자(action researchers)의 촉진을 통해 중재가 어떻게 변화하는지를 전혀 담아내지 못했다.

 

이는 "시스템 기반(system-based)" 로직 모델에서도 마찬가지이다 [22, 25]. 이들 모델은 중재와 맥락을 분리된 항목으로 기술하며, 고급형 2형 모델로 분류된다 (Figure 3 참조).

 


2형 로직 모델을 사용하는 연구자들 중 상당수는, 자신의 모델이 중재의 역동성을 잘 표현하지 못한다는 점을 인지하고 있다. 이 때문에 **로직 모델 해석에 대한 주석(caveats)**을 **모델 본문에 덧붙이는 서술(narrative)**에 포함시키는 것이 일반적이다 (추가 용어집: Additional file 1: Appendix 1 참조).

예컨대, PET 중재의 경우, 모델의 내용을 설명하는 것뿐만 아니라, 이를 선형적이고 고정적인 방식으로 해석하지 않도록 주의시키는 내용이 서술에 포함되어야 할 것이다.

그러나 이런 방식은 다음과 같은 근본적인 질문을 제기한다:

PET 중재의 역동성(dynamics)을 더 잘 설명할 수 있는 대안적 로직 모델 유형이 존재하는가?

 

만약 존재한다면, 이는 모델 외 서술(narrative)에 대한 의존도를 줄이고, 그 대신 모델 자체에 포착된 중재의 핵심적 요소들을 더 효과적으로 설명하는 데 집중할 수 있도록 도와줄 것이다.


3형 로직 모델 (Type 3 Logic Models)

3형 로직 모델은 모델의 각 요소(factor)들 사이의 연결 관계를 명확히 제시함으로써, 중재의 논리(logics)를 보다 완전하게 표현한다. 이는 중재가 결과를 어떻게 도출하는지정확히 보여주는 구조를 가지고 있다. 이 유형에 해당하는 대표적인 하위 형태가 바로 **"드라이버 다이어그램(driver diagrams)"**으로, 이는 **임프루브먼트 사이언스(improvement science)**에서 흔히 사용된다 [24].

이러한 모델들은 다음과 같은 특징을 가진다:

  • **중재 구성 요소(intervention components)**를 명확하게 나열하고,
  • **입력(input)**이 어떻게 결과(outcome)로 이어지는지에 대한 선형적 흐름을 화살표로 시각화한다 (Figure 4 참조).

 

3형 로직 모델은 중재 구성 요소와 결과 간의 정확한 관계를 가설로 정립하고 이를 검증하는 데 유용하다. 또한, 이 모델은 실천 지향적(practitioner-oriented) 성격이 강해, 변화의 필요성과 실행 방식에 대한 합의(consensus)를 구축하는 과정에서도 자주 사용된다 [24]. 그러나 이 모델은 중재(intervention) 자체에 초점을 맞추며, 중재가 이루어지는 맥락(intervention settings)에 대한 고려는 부족하다. 따라서, **맥락에 따라 중재의 형태가 달라지는 경우(adaptive interventions)**를 포괄하기 어렵다.

 

일부 3형 로직 모델은 **“대안적 인과 경로(alternative causal strands)”**를 포함하여, 다양한 환경에서 중재가 작동하는 방식을 전달하려는 노력을 보여주기도 한다 [3, 12, 13]. 그러나 이 경우에도 포용할 수 있는 변이 수준은 포함된 경로(strands)의 수에 따라 제한된다.

 

따라서 여전히 다음과 같은 질문은 남는다:

"중재가 실행될 때마다 전혀 다른 형태를 취할 가능성이 있는 경우, 이를 로직 모델이 과연 설명할 수 있는가?"


4형 로직 모델? (Type 4 Logic Models?)

중재의 성공이 맥락(context)에 따른 적응(adaptation)에 달려 있음을 잘 보여주는 모델의 대표적인 예는 바로 Promoting Action on Research Implementation in Health Services (PARIHS) 모델이다 (Figure 5 참조).

 

 

비록 PARIHS 모델은 전통적인 의미의 로직 모델은 아니지만, ‘촉진(facilitation)’과 ‘맥락(context)’을 중심에 두고 있다는 점에서, PET와 같은 복잡한 중재(complex interventions)—특히 **피드백 루프(feedback loops)**를 통해 수행 과정에서 적응하는 형태의 중재—에 매우 적절하다 [5].

 

또한, PARIHS 모델은 주로 ‘회고적(retrospective)’ 분석에 사용되었지만, ‘사전적(prospective)’ 전략 수립, 즉 프로젝트가 시작되기 이전 단계에서 실행 전략을 설계하는 데도 활용 가능하다 [14].

 

이러한 특성은 로직 모델의 전통적인 역할—즉, **정확한 행동 지침(procedural guidance)**을 제공하는 기능—에서 벗어나, 맥락 민감형(context-sensitive) 촉진 전략의 개발을 지원하는 도구로서의 잠재적 역할 확장을 시사한다.

**다음 절에서는, PARIHS 모델의 핵심 요소들을 전통적인 로직 모델 구조에 통합하여, 4형 로직 모델(type 4 logic model)**을 구성한다.

 

PARIHS 모델을 활용한 PET 중재의 모델링 (Figure 6)
(Using PARIHS to model the PET intervention)

PARIHS 모델과 마찬가지로, 본 연구에서 제안한 **4형 로직 모델(type 4 logic model)**은 향후 PET를 실제로 적용하려는 사용자들이 실행 계획을 수립할 때 도움을 주는 것을 목표로 한다. 이 모델은 사용자들에게 **중재가 실행될 맥락(context)을 사전적으로 평가(prospectively assess)**하는 방법에 대한 지침과 함께 제공되며, **모델 내에 제시된 조절 변수(moderators)**가 긍정적 또는 부정적 영향을 미치는 경우, 이에 대해 **촉진자(facilitator)가 어떻게 반응해야 하는지에 대한 조언(advice)**도 포함한다.

하지만 이 모델은 몇 가지 **잠재적 약점(potential weaknesses)**을 내포하고 있다.

  • **높은 추상성 수준(high level of abstraction)**으로 인해, 촉진자가 어떻게 행동해야 하는지를 구체적으로 안내하지는 않으며,
  • 대신 각 촉진자가 자신이 활동하는 맥락을 평가한 후, 판단하여 결정하도록 위임한다.
  • 또한, 이 모델은 중재가 다양한 환경에서 다양한 형태로 실행될 수 있도록 허용하기 때문에,
  • 전통적 로직 모델보다 이해관계자(stakeholders) 간의 ‘모델 내용에 대한 합의’ 형성에는 덜 중점을 둔다.

결과적으로, 4형 로직 모델은 ‘변화의 필요성과 실행 방식에 대한 이해관계자 간 합의 형성’을 목적으로 사용할 경우에는 부적절할 수 있다.

 


논의: 로직 모델 분야 발전을 위한 원칙들
(Discussion: Principles for advancing the field of logic models)

본 연구에서 제안한 **4형 로직 모델 접근법(type 4 logic model approach)**은 다음과 같은 점을 보여준다:

중재가 실행될 때마다 서로 다른 형태를 취할 수 있는 복잡한 중재(complex interventions)의 역동성(dynamics)을, 정성적으로 모델링하는 것이 가능하다.

 

그러나 다음과 같은 점도 함께 인식할 필요가 있다:

  • 4형 로직 모델이 항상 필요한 것은 아니다.
  • 프로젝트에서 로직 모델이 어떤 역할을 해야 하는지, 그리고 해당 중재의 복잡성이 어느 수준인지에 따라 적절한 로직 모델 유형은 달라질 수 있다.

예를 들어,

  • 단지 중재 및 실행 환경(delivery setting)을 대략적으로 표현하는 것이 목적이라면, 1형 또는 2형 로직 모델이면 충분하다.
  • 반면, 중재의 역동성을 보다 완전하게 포착하려면, 3형 또는 4형 로직 모델이 요구된다.

Figure 7은 연구자들이 다양한 로직 모델 유형 중에서 어떤 모델을 선택할지 판단하는 데 도움을 줄 수 있지만,
여기에서는 4형 로직 모델을 개발한 경험에 기반하여, **이 모델이 어떻게 체계적으로 구성될 수 있는지에 대한 공식적인 방법론(formal methodology)**을 제시하고자 한다.

 

 


정성적 연구를 통해 로직 모델을 구축하라
(Create logic models through robust qualitative research)

탄탄한 로직 모델을 개발하기 위해, 연구자들에게는 **정성적 데이터 분석을 위한 프레임워크 접근법(framework approach)**을 사용할 것을 권장한다 [19]. 이 접근법은 **복수의 중재 현장(multiple intervention sites)**에 걸친 데이터를 관리하고 분석하는 데 매우 유용하다.

로직 모델의 범주들—예:

  • 중재 메커니즘(intervention mechanisms),
  • 조절 변수(moderators),
  • 결과(outcomes)—는 **프레임워크 매트릭스의 열(column)**을 구성할 수 있으며,
    각 중재 현장은 **행(row)**으로 할당되어,
    방대한 데이터를 구조화하고 분석 가능하도록 한다.

이러한 방식은 **귀납적(inductive)**으로도, 혹은 **기존 이론에 기반한 연역적 요소(deductive elements)**를 병합하는 방식으로도 수행 가능하다. 후자의 경우, **로직 모델의 초기 구성은 선행 이론(prior theory)**으로부터 영향을 받는다.
모델의 강건성(robustness)을 확보하려면, 반드시 경험적 데이터(empirical data)와의 반복적인 검증(testing)이 필수적이다.

 

이미 복잡하고 적응적(complex and adaptive) 성격을 지닌 것으로 알려진 중재의 경우, 연구자들은 **4형 로직 모델의 개요(outline)**를 사용하여, 프레임워크 매트릭스에 포함된 데이터에 근거해 내용을 채워갈 수 있다.

 

하지만 실제로는, 중재의 복잡성 수준은 연구 초기에 명확하지 않은 경우가 많다. 이러한 경우, 연구자는 데이터 분석 중에 다양한 로직 모델 유형을 실험적으로 적용해 볼 수 있다. 예를 들어, PET 중재의 경우, 처음에는 복잡한(complicated) 중재처럼 보였다.
→ 즉, **여러 구성 요소(component parts)**가 유사한 방식으로 상호작용하는 구조였다 [5].

 

하지만, 2형 로직 모델을 개발하고 이를 반복적으로 테스트·수정하는 과정을 거치면서, PET 중재의 진정한 복잡성이 드러났다.
→ 우리는 2형 모델이 다음 네 가지를 제대로 전달하지 못함을 확인했다:

  1. 환경별로 달라지는 촉진자(facilitators)와 수혜자(users/recipients)의 역할 차이,
  2. 조절 변수에 대한 촉진자의 대응 방식이 중재 형태에 미치는 영향,
  3. 환경별로 불규칙하게 나타나는 결과 패턴,
  4. 초기 근접 결과(proximal outcomes)가 중재의 이후 성공에 미치는 영향.

→ 만약 중재가 이와 유사한 특성들을 공유한다면, 4형 로직 모델의 사용이 필수적이다.


중재의 논리를 설명하기 위해 서사를 활용하라
(Use narrative to describe intervention logics)

**서사(narrative)**는 언제나 중재의 이론적 기반을 설명하고, 로직 모델의 내용을 해석하는 핵심적인 수단이다. 만약 어떤 로직 모델의 서사가, 1형, 2형 또는 3형 로직 모델이 중재의 역동성을 설명하기에 부족하다는 점을 반복적으로 설명해야 한다면, 이는 4형 로직 모델의 필요성을 시사하는 또 하나의 신호이다.

 

본 연구의 경우, 우리는 모델 내에서 **구체적인 활동(activity)**이나 **자원(resources)**의 목록 대신, **핵심 중재 메커니즘(core intervention mechanisms)**만을 제시하였다. 이는 중재가 다양한 환경에서 다양한 방식으로 실행될 수 있도록 유연성을 확보하기 위한 조치였다.

 

이러한 접근은 다음과 같은 시각과 일치한다:

  • 중재란, 맥락에 민감하게 반응하는 ‘기저 메커니즘(underlying mechanisms)’에 의해 구성된다 [31],
  • 또는, 중재는 **정확한 형태(precise forms)**가 아니라 **기능(functions)**으로 정의되어야 하며,
  • 각기 다른 환경에서 다양한 형태로 나타날 수 있다 [2, 3].

이러한 방식에서는, **서사가 중재의 작동 메커니즘/기능에 대한 증거 기반(evidence base)**을 설명하고 인용해야 하며,
이는 모든 유형의 로직 모델에서 공통적으로 요구되는 요소이다 [23].


역동적 관계와 조건적 의존성을 모델링하기 위해 다양한 도형과 화살표를 활용하라
(Use diverse shapes and arrows to model dynamic relationships and contingencies)

비록 본 논문에서는 하나의 4형 로직 모델 형태를 제안하고 있지만, 연구자들은 자신이 다루는 중재의 특성에 적합하도록 이를 실험적으로 수정·확장해볼 것을 권장한다.

**정책 분석 분야의 광범위한 문헌(policy analysis literatures)**에서는 **다양한 유형의 선(lines)과 화살표(arrows)**를 활용하여 **로직 모델 내의 역동적인 관계(dynamic relationships)**와 **조건적 의존성(contingencies)**을 효과적으로 표현할 수 있음을 강조하고 있으며, 경우에 따라서는 벤 다이어그램(Venn diagram) 대신 삼각형(triangles), 원(circles)다양한 도형을 활용하는 것도 가능하다 [3, 12, 13].

 

하지만 가장 핵심적으로 기억해야 할 사항은 다음과 같다:

**4형 로직 모델(type 4 logic models)**은 반드시 다음 네 요소 간의 **역동적 관계(dynamism)**를 효과적으로 전달해야 한다:

  • 중재의 촉진(facilitation)
  • 중재 사용자 또는 수혜자(users/recipients)
  • 맥락적 조절 변수(contextual moderators)
  • 결과(outcomes)

바로 이 관계의 역동성4형 모델을 다른 로직 모델들과 구분 짓는 핵심 요소다.

 

따라서, 4형 로직 모델의 시각적 구조를 수정하더라도, 다음 두 가지 핵심 기능은 반드시 유지되어야 한다:

  1. 맥락이 중재 실행(delivery)에 미치는 영향을 어떻게 시각화할 것인가,
  2. 원래 제안된 모델에서 ‘벤 다이어그램’과 ‘점선 이중 화살표(dotted, double-headed arrows)’가 수행했던 기능을 어떤 형태로든 대체할 수 있을 것인가.
  • 벤 다이어그램프로젝트 촉진자와 중재 수혜자 간의 역할 및 관계의 다양성을 시각적으로 표현할 수 있게 해주었으며,
  • 점선 이중 화살표는 **일부 근접 결과(proximal outcomes)**가 중재의 구체적인 형태에 따라 달라질 수 있음과,
    이들이 이후 단계에서 중재의 기능을 개선할 수 있는 방식으로 작용함을 표현하는 데 사용되었다.

맥락적 조절 변수의 전체 스펙트럼을 포함하라
(Include the full spectrum of contextual moderators)

4형 로직 모델은 중재(interventions)만큼이나 맥락(context)을 중심에 둔다. 이는 중재를 단순한 독립 변수가 아닌, **“시스템 안에서 일어나는 사건(events in systems)”**으로 보는 관점과 일치한다 [2].

 

본 연구에서는 **상이한 특성을 가진 6개의 병동/진료과(hospital wards/departments)**가 참여하여, PET 중재에 대한 맥락의 영향을 심층적으로 관찰할 수 있었다. 우리는 기존의 **‘맥락 프레임워크(context frameworks)’**를 활용하여, ‘내부(inner)’와 ‘외부(outer)’ 맥락 조절 변수를 구분하였으며, **결과(outcomes)**는 **‘핵심(core)’ 혹은 ‘맥락적(contextual)’**으로 분류하였다. 또 다른 분류 방식으로는, **미시/중간/거시 수준(micro/meso/macro levels)**으로 구분하는 체계를 사용할 수도 있었을 것이다 [32].

 

어떤 방식을 선택하든, 맥락적 조절 변수의 전체 스펙트럼(full spectrum)을 시각적으로 표현하는 것은 필수적이다.
이는 다음과 같은 논의에 실질적인 기초를 제공할 수 있다:

  • 중재가 어떻게 맥락에 맞게 조정될 수 있을지,
  • 또는, 맥락의 수용성(receptiveness)을 어떤 수준(level)에서, 어떻게 향상시킬 수 있을지에 대한 이해를 증진시킬 수 있다.

 

 

촉진자(facilitators)를 주요 대상으로 로직 모델을 설계하라

(Target logic models at facilitators)

 

**4형 로직 모델(type 4 logic models)**은 **환경에 따라 형태가 달라지는 복잡하고 적응적인 중재(complex, adaptive interventions)**를 위해 설계되었기 때문에, 로직 모델이 전통적으로 수행해왔던 다음 두 가지 역할은 점점 적합성을 잃고 있다:

  • 이해관계자(stakeholders) 간의 합의(consensus)를 이끌어내는 수단,
  • 긍정적인 결과를 달성하기 위한 구체적 행위 지침(precise guidance) 제공.

그러나 복잡한 중재는 '유연한 촉진 기능(flexible facilitation function)'을 통해 맥락에 적응하기 때문에, 이는 곧 **중재가 실행(implementation) 및 맥락(context)과 '불가분하게 연결되어 있다(inextricably linked)'**는 것을 의미한다 [29].

 

이러한 점에서, 4형 로직 모델은 다음과 같은 새로운 역할을 가질 수 있다:

복잡한 중재의 미래 사용자(future users)가, 중재를 맥락에 맞게 적응(adapt)시킬 수 있도록 안내하는 도구.

 

모든 로직 모델에는 어느 정도의 **설명 서사(narrative)**가 동반되지만, 4형 로직 모델의 서사는 특히 **촉진자가 맥락을 평가(assess context)**하고, 그에 따라 ‘맥락 민감적 촉진 전략(context-sensitive facilitation strategies)’을 개발할 수 있도록 맞춤화(tailored) 될 수 있다. 이러한 방식은 복잡한 중재의 확산(scale-up) 가능성을 향상시킬 수 있는 잠재력을 갖는다.


의견 불일치를 반영하라
(Incorporate differences of opinion)

끝으로, 우리가 제안하는 4형 로직 모델은 전통적인 로직 모델에 비해 이해관계자 간의 합의를 도출하는 데는 덜 적합하다는 점을 인정하면서도, **복잡한 중재(complex interventions)**일수록 문제의 복잡성 증가에 따라 의견 불일치의 가능성도 커지기 때문에, 의견 차이를 수용하는 접근이 오히려 더 적절할 수 있다는 점을 강조한다 [33].

 

흥미롭게도 일부 연구에서는,

  • 로직 모델이 변화 제안에 대한 합의를 강요하면서 오히려 불필요한 마찰(friction)을 야기한 사례가 보고되었으며 [15],
  • 소외된 목소리(marginalised voices)를 억압(suppress)할 수 있다는 경고도 제기되었다 [12, 16].

본 연구에서도, PET 관련 문서(document)에 대해 이해관계자 간 견해 차이가 존재했다:

  • 어떤 이들은 해당 문서를 중재의 핵심 요소로 보았고,
  • 다른 이들은 주변적(peripheral) 요소로 간주했다.

또한, 조절 변수(moderating factors)의 중요도 순서에 대해서도 이견이 있었다:

  • 일부는 **인력 부담(staffing pressures)**의 중요성을 축소했으나,
  • 다른 일부는 이를 해결하지 않고는 개선 작업이 불가능하다고 주장했다.

우리는 이러한 차이를 해결하거나 특정 입장을 우선시하지 않고,

각각의 입장이 서로 다른 맥락에서는 모두 옳을 수 있다는 가능성을 모델에 반영하였다.


결론 (Conclusion)

본 논문에서는, 중재 연구(intervention research)에서 연구자들이 다양한 로직 모델 유형을 선택할 수 있도록, 그 **강점과 약점을 포함한 로직 모델의 유형 분류(typology)**를 제안하였다. 또한, **기존 로직 모델보다 더 역동적인(dynamically expressive) 모델을 개발하기 위한 공식적인 방법론(formal methodology)**을 제시하였다. 이 방법론은 PARIHS 모델의 핵심 요소를 전통적 로직 모델 구조에 통합하는 방식으로 구성되었다.

 

이러한 **“4형” 로직 모델(type 4 logic models)**

  • **중재(interventions)**와 맥락(context) 사이의 상호작용(interaction)을 표현할 수 있는 잠재력을 가지지만,
  • 그만큼 **로직 모델의 활용 방식에 대한 인식 변화(change in use)**도 필요하다.

왜냐하면 4형 로직 모델은 다양한 환경에서 형태를 달리하는 복잡한 중재를 대상으로 설계되었기 때문에,
다음과 같은 전통적 활용 목적은 점점 부적절해지고 있기 때문이다:

  • 다양한 이해관계자 간 합의 형성,
  • 행동 지침 제공을 통한 긍정적 결과 유도.

우리는 다음을 제안한다:

  • **4형 로직 모델은 합의 구축(consensus-building) 활동이 아니라, 철저한 정성적 연구(rigorous qualitative research)**를 통해 개발되고 정교화되어야 한다.
  • 또한, 이 모델은 복잡한 중재의 미래 사용자들이 ‘맥락 민감형 촉진 전략(context-sensitive facilitation strategies)’을 설계할 수 있도록 돕는 안내서 역할을 해야 한다.

이러한 접근의 장점은, 복잡한 중재의 확산(scale-up) 가능성을 실질적으로 향상시킬 수 있다는 점이다.

 

 

 

 

 
 

Advancing the Quality of Medical Education Worldwide: ECFMG's 2023 Medical School Accreditation Requirement 

Journal of Medical Regulation (2019) 105 (4): 8–16. https://doi.org/10.30770/2572-1852-105.4.8

 

 

 

🎓 [국제 의과대학 인증] 왜 ECFMG는 2023년부터 인증을 요구하기 시작했을까?

의료인력의 국경을 넘는 이동성이 점점 더 활발해지면서, 이제는 한 나라의 의사 자격 기준이 전 세계적으로도 신뢰받을 수 있어야 하는 시대가 되었어요. 그래서 미국의 ECFMG (Educational Commission for Foreign Medical Graduates), 즉 외국의과대학졸업자교육위원회는 2023년부터 새로운 인증 요건을 도입했어요. 바로, _의과대학이 WFME가 인정한 인증기관으로부터 인증을 받았는지 여부_를 ECFMG 인증의 필수 조건으로 삼겠다는 거죠.


1. 🧭 왜 이런 변화가 필요했을까?

간단히 말하면 의학교육 환경이 너무 빠르게, 그리고 너무 다양하게 변화하고 있기 때문이에요.

  • 지난 20년간 전 세계 의과대학 수가 약 50%나 증가했고,
  • 일부 학교는 정부 인가 없이 운영하거나, 면허와 무관한 학위를 주기도 했어요.
  • 국가마다 의과대학 인증 시스템이 있기도 하고 없기도 하고, 기준도 천차만별이었죠.

그러다 보니, 규제기관이나 수련 병원 입장에서는
“이 지원자가 나온 학교, 과연 믿을 만한 교육을 제공했을까?” 하는 의문이 생길 수밖에 없어요.

🎤 연구진의 핵심 메시지

Patients everywhere deserve safe, well-educated physicians.
전 세계 모든 환자들은 안전하고, 충분히 교육받은 의사를 만날 자격이 있다.”


2. 🏛️ 무엇이 바뀌었나?

이제부터는 ECFMG 인증을 받기 위해서는 다음 조건이 충족되어야 해요:

✔️ **의과대학이 WFME(World Federation for Medical Education)**가 인정한
**공신력 있는 인증기관(accrediting agency)**으로부터 인증을 받아야 한다!

 

즉, 학교가 어느 나라에 있든 간에, 공식적인 ‘인증기관’이 인증한 학교여야만 ECFMG 인증에 지원할 수 있다는 뜻이에요.

🎤 원문 인용

“By requiring the recognition of medical school accrediting agencies, in addition to medical school accreditation, ECFMG seeks to foster greater transparency and ongoing quality improvement in undergraduate medical education.”

의과대학 인증에 더해 인증기관의 공인도 요구함으로써,
ECFMG는 학부 의학교육에서 투명성과 지속적인 질 향상을 도모하고자 한다.


3. 🌍 글로벌 흐름과 발맞춘 결정

이 변화는 단지 미국만의 일이 아니에요. 이미 WHO(세계보건기구), WMA(세계의사회), IAMRA(국제의료규제기관협회) 등 다양한 국제 보건기구들이 ‘의학교육 인증체계 도입’을 각국에 권고해 왔어요.

🎤 WHO의 권고

“By 2020, all countries will have established accreditation mechanisms for health training institutions.”

2020년까지 모든 국가는 보건인력 교육기관에 대한 인증체계를 구축해야 한다.

 

WFME는 현재 여러 국가의 인증기관을 심사하고 있으며, 중국, 인도네시아, 조지아, 네덜란드 등에서 공인을 받은 기관이 생겨나고 있어요.


4. 📈 이 변화는 어떤 효과를 내고 있을까?

의과대학들이 인증을 받기 위해 교육과정을 정비하고, 운영 체계를 개선하고 있어요.

심지어 처음에는 인증에 실패했던 학교들도 기준에 맞게 개선한 후 인증에 성공한 사례들이 보고되고 있어요.

학생들도 의대 지원 전에 해당 학교가 인증됐는지 확인하는 일이 중요해졌고,
수련 프로그램에서는 좀 더 신뢰할 수 있는 기준으로 IMG(국제의료졸업생)를 선발할 수 있게 되었죠.

🎤 연구진의 평가

“Accreditation fosters quality improvement, transparency and, above all, public trust.”

인증은 교육의 질 향상과 투명성, 그리고 그 무엇보다 ‘대중의 신뢰’를 증진시킨다.


✍️ 마무리하며

이 논문은 단순히 하나의 정책 변화를 이야기하는 것이 아니라, 🌐 의학교육의 글로벌 품질 관리와 신뢰의 미래를 어떻게 설계할 것인가에 대한 이야기예요. 한국을 포함한 많은 나라에서도, 이런 글로벌 기준과 흐름을 염두에 두고 의과대학 인증 및 교육과정 개선 전략을 고민할 필요가 있어 보입니다.


서론 (Introduction)

제2차 세계대전 이후, 미국에는 자국에서 의학을 계속하고자 하는 *이민자 의사들(immigrant physicians)*의 유입이 급증하였다. 이 시기는 전쟁 이후 가족의 의료 수요를 충족시키기 위해 병원이 급격히 증가하던 시기로, 이에 따라 **레지던트 수련 자리(residency training positions)**도 증가하였고, 미국 의과대학(U.S. medical schools)만으로는 이를 채울 수 없었다. 당시, **미국의 의사면허 위원회, 병원, 그리고 수련 프로그램(GME programs)**은 이러한 외국인 의사들이 보유한 자격(credentials)과 그들이 미국 내에서 진료를 수행할 수 있는지를 평가할 준비가 거의 되어 있지 않았다.

 

이에 따라, 국가 차원의 평가 및 인증 체계를 개발하고자, **미국 주 의료위원회 연맹(Federation of State Medical Boards, FSMB)**은 “중앙 심사 기관(central screening agency)” 설립을 제안하였다. 이 기관은 **외국 의과대학 졸업자(IMGs; International Medical Graduates)**의 자격을 검토하고, **주 면허시험에 응시하기 전에 사전 시험(preliminary examination)**을 시행하는 역할을 수행하도록 기획되었다.¹

 

이러한 IMG 인증 프로세스는 미국의사협회(AMA), 미국병원협회(AHA), 미국의과대학협회(AAMC), 그리고 FSMB의 승인을 받아, 1956년 **비영리 민간기관인 외국의과대학졸업자교육위원회(ECFMG; Educational Commission for Foreign Medical Graduates)**가 설립되었다.¹

 

이후 ECFMG는 32만 명이 넘는 IMG들의 인증을 수행하였으며, 이는 의료 규제 당국, 수련 프로그램, 그리고 일반 대중에게 이들 의사들이 적절한 자격 심사를 거쳤으며, 기초 의학 지식에 대한 기준을 충족했다는 신뢰를 제공해 왔다.²

 

현재 미국에서 면허를 보유한 의사의 약 1/4은 IMG 출신이다.³ ECFMG의 인증은 다음과 같은 경우 필수적이다.

  • _미국 수련 인증기관(ACGME)이 인증한 레지던시 프로그램_에 진입하려는 경우
  • _무제한 주 면허(unrestricted state medical license)_를 취득하려는 경우

따라서, **IMG들이 미국 의료 시스템에 진입하는 관문(gatekeeper)**으로서, ECFMG는 이들 의사가 적절한 의과대학 교육을 수료했는지 확인할 책무의료계와 대중에 대해 가지고 있다.


ECFMG의 역사적 역할에서 변화의 필요성 대두

ECFMG는 설립 이래로 개별 지원자의 자격 검토 및 역량 평가에 주력해 왔으며, 이들이 졸업한 의과대학의 질은 별도로 평가하지 않았다. 그러나 최근에는 다음과 같은 문제들이 대두되면서, ECFMG는 **향후 인증 요건에 ‘의과대학의 질적 지표’**를 포함시키기로 결정하였다. 즉, **공신력 있는 인증기관(accrediting body)**으로부터 _인증(accreditation)_을 받은 의과대학을 졸업했는지가 하나의 조건이 된 것이다.

 

이러한 변화는 다음의 이유에서 기인한다:

  • 의과대학의 질과 인증 시스템은 국가별로 매우 다양하다.
  • 새로운 의과대학 설립이 수십 년간 급증해 왔으며, 이에 따라 국제 간 의사 이동성도 증가하고 있다.
  • _일부 의과대학은 상업적 목적을 우선시하며, 교육 및 자격에 대한 정보를 왜곡_하고 학생들을 기만하는 경우도 있다.

2023 Medical School Accreditation Requirement의 도입

이에 따라 ECFMG는 **2010년에 ‘2023년 의과대학 인증 요건(Medical School Accreditation Requirement)’**을 도입하였다. 이는 전 세계적으로 의과대학 교육의 질을 향상시키고, 인증 활동을 자극하기 위한 정책적 메커니즘으로 설계되었다.

 

이 요건의 도입 목적은 다음과 같다:

  • **의과대학 교육에 대한 글로벌 평가 기준(global standards)**의 적용을 장려한다.
  • 학생, 규제기관, 일반 대중에게 이들이 적절한 교육을 받았음을 확신할 수 있도록 한다.
  • **국제 보건 인력(global health workforce)**을 강화하려는 기타 국제 보건 기구의 이니셔티브와 방향을 같이 한다.⁴
  • **공개된 기준과 보고 체계(public standards and reporting)**를 통해, 국제 의학교육의 투명성 증가를 도모한다.

ECFMG 인증에 대하여 (About ECFMG Certification)

**ECFMG(외국의과대학졸업자교육위원회)**는 *국제 의과대학 졸업자(IMG; International Medical Graduate)*를 다음과 같이 정의한다:

미국과 캐나다 이외의 국가에 위치한 의과대학에서 기본 의학 학위(basic medical degree or qualification)를 받은 의사

ECFMG 인증을 받기 위해 IMG는 다음의 서류를 제출해야 한다:

  • 본인의 신원과 의과대학 재학을 증명하는 문서
  • 졸업 후에는 **최종 의학 학위 증서(medical diploma)**와 성적표(transcript)

ECFMG는 이러한 문서를 엄격하게 검토하며, 해당 학교와 직접적으로 접촉하여 **학력 증명을 1차 출처(primary-source verification)**로 수행한다. 또한, 지원자는 **미국의사면허시험(USMLE)**의 다음 단계들을 통과해야 한다:

  • Step 1 (기초 의학 지식, Basic Science)
  • Step 2 Clinical Knowledge (CK)
  • Step 2 Clinical Skills (CS)

이 세 가지를 모두 통과해야만 ECFMG 인증을 받을 수 있다.⁵ 

매년 약 20,000명이 ECFMG 인증에 지원하며, 이 중 약 10,000명의 IMG들이 인증을 취득한다.⁶ 흥미롭게도 최근 10년간, ECFMG 인증을 받으려는 미국 시민권자의 수가 크게 증가하였다. 

2018년에 ECFMG 인증을 받은 IMG들의 의과대학 입학 시 시민권 기준 상위 5개국은 다음과 같다:

  1. 미국
  2. 인도(India)
  3. 캐나다(Canada)
  4. 파키스탄(Pakistan)
  5. 중국(China)

이들 국가에서 인증을 받은 IMG 수의 변화 추이는 1994년 이후 표 1(Table 1)에서 확인할 수 있다.⁷


현재 의과대학에 대한 요건 (Current Medical School Requirements)

수년에 걸쳐 ECFMG는 지원자의 의과대학이 ECFMG의 최소 기준을 충족하는지를 판단하기 위해 다양한 자료를 활용해왔다.

  • 초기에 ECFMG는 **세계보건기구(WHO)**의 World Directory of Medical Schools를 참고하였다.
  • 2002년, ECFMG의 재단인 **국제의학교육 및 연구 진흥재단(FAIMER)***International Medical Education Directory (IMED)*를 창설하였다.

IMED에는 다음 기관에 의해 공식 인정된 의과대학이 포함되었다:

  • 보건부(Ministry of Health)
  • 교육부(Ministry of Education)
  • 기타 해당 국가의 적절한 정부기관

IMED에 등재된 학교의 졸업생은 ECFMG 인증 자격이 부여되었다.⁸

  • 2007년, WHO와 협력하여 **세계의학교육연맹(WFME)**Avicenna Directory를 출간하였다.
  • 2014년, WFME와 FAIMER는 IMED와 Avicenna를 통합하여, 현재 사용되는 **World Directory of Medical Schools (세계 의과대학 디렉토리)**를 출범시켰다.

World Directory에 대한 이해

World Directory는 **의학 학위를 수여하는 전일제 교육과정을 제공하는 기관을 ‘의과대학’**으로 정의한다.⁹
그러나 단순히 해당 디렉토리에 등재되었다는 사실만으로 학교의 우수성을 의미하지는 않는다.

"A listing in the World Directory in and of itself is not a marker of distinction."

 

이 디렉토리의 목적은 다음과 같다:

  • 과거와 현재에 ‘의과대학’으로 인정된 모든 기관을 등재하여,
  • 학생, 규제기관, 기타 이해관계자들이 전 세계 의학교육의 전반적인 상황을 파악할 수 있도록 돕는 것이다.⁶

World Directory에 등재된 학교 중 ECFMG 요건을 충족하는 학교**졸업생이 ECFMG 인증 자격이 있음을 나타내는 주석(note)**이 포함되어 있다.


현재의 학교 요건

현재 ECFMG가 인정하는 학교에 대한 요건은 다음과 같다:

  • 해당 학교는 소재 국가의 적절한 정부기관으로부터 공식 인정을 받아야 한다.
  • 학교의 졸업생은 해당 국가에서 의료 면허를 받을 자격이 있어야 한다.

_해외에 분교(branch campus)를 둔 경우에도 동일한 요건이 적용_된다.

그러나 현 시점에서 ECFMG는 국가가 요구하지 않는 한, 의과대학이 반드시 ‘인증(accreditation)’을 받아야 한다고 요구하지는 않는다.


2023년 인증 요건 (The 2023 Accreditation Requirement)

2023년 인증 요건은 기존의 자격 요건을 초월하여, 의과대학과 해당 인증기관들이 더 높은 기준을 충족하도록 독려하는 내용을 담고 있다. 2023년부터, 다음 조건을 충족한 사람만이 ECFMG 인증 지원 자격을 갖는다:

ECFMG에 지원하는 시점에, 지원자의 의과대학이 **WFME(World Federation for Medical Education)**가 **공식적으로 인정한 인증기관(accrediting agency)**으로부터 인증(accreditation)을 받은 경우

 

즉, 2023년 이후에는 WFME의 인정을 받은 인증기관이 인증한 의과대학의 졸업생만 ECFMG 인증 신청이 가능하다는 것이다.
(Figure 1에 요약된 내용 참고) 반면, 2023년 이전에 ECFMG 인증에 이미 지원한 경우에는, 기존의 ECFMG 정책에 따라 인증 절차가 계속 진행된다.¹⁰

 


인증(accreditation)이란 무엇인가?

인증은 다음과 같이 정의된다:

“지정된 기관이 명확하게 정의된 기준과 절차에 따라 교육기관을 검토하고 평가하는 과정”
(“the process by which a designated authority reviews and evaluates an educational institution using a set of clearly defined standards and procedures”)¹¹

 

WFME는 **의과대학 인증기관(accrediting agencies)**을 평가하기 위한 *공식 인정 기준(recognition criteria)*을 개발하였다. 이 기준은 **WHO와 WFME가 협력하여 개발한 ‘기초 의학교육 인증을 위한 가이드라인’**에 기초하며, 전문가 합의(expert consensus) 과정을 통해 만들어졌다.¹²

 

이러한 WFME의 인정 기준은 다음과 같은 목적을 가진다:

  • 각 국가의 의학교육 체계(context)에 적합한 인증 기준을 자율적으로 개발할 수 있는 *유연성(flexibility)*을 보장하면서도,
  • 그 인증기관이 인증하는 학교가 엄격한 교육 품질 기준을 충족하도록 한다.

결과적으로, 이는 전 세계적으로 통일된 기준을 적용하면서도 각국의 상황에 맞게 유연하게 운영될 수 있는 방식으로, 의과대학 학부 교육의 글로벌 표준을 구현하는 접근법이다.


중요한 점

WFME는 '인증기관(accrediting agencies)'만을 인정(recognize)하며, 직접 의학교육 프로그램을 인증하지 않는다.
("WFME only recognizes accrediting agencies; it does not accredit medical education programs.")¹³


요건 도입의 근거(Rationale for Requirement)

최근 여러 요인들이 복합적으로 작용하면서 ECFMG는 2023년 인증 요건(Accreditation Requirement)을 도입하게 되었다.

**규제 기관(regulatory authorities)**들이 관찰해온 바에 따르면, 의학교육은 매우 빠르게 변화하고 있으며, 이러한 변화에 효과적으로 대응하고, 안전하고 충분히 교육받은 의사를 바라는 대중의 기대에 부응하기 위해서는 새로운 접근 방식이 필요하다.


🔹 의과대학의 급격한 증가 (Rapid Growth of Medical Schools)

지난 20년간 전 세계적으로 의과대학 수가 급격히 증가하였다.
이러한 확장은 다음과 같은 집단에 **품질 보증 시스템(quality assurance systems)**의 부담을 가중시킨다:

  • 의과대학 진학을 희망하는 학생들
  • 전공의 수련 프로그램(GME programs) 책임자들
  • 규제 기관들

또한, 의과대학이 급속도로 증가하면서, 전 세계 모든 의과대학을 직접 평가할 수 있는 자원을 가진 단일 조직은 존재하지 않는다는 현실적인 문제가 발생한다. (“it is unlikely that one organization, or even a few, could have the resources needed to directly evaluate all medical schools worldwide.”)

 

📊 2002년~2018년 사이 의과대학 수 증가 추이는 *표 2 (Table 2)*에 제시되어 있다 (FAIMER, 미출판 자료, 2019).

  • 2010년, ECFMG가 2023 인증 요건을 발표할 당시, 2,711개 의과대학이 운영 중이었다.
  • 2018년 말, World Directory에는 3,203개 의과대학이 등재되어 있었다.
  • 2002년, 발표 8년 전에는 2,160개 학교였으며,
  • 따라서 2002년에서 2018년 사이 전체 의과대학 수는 약 48% 증가하였다.

특히 **미국 시민권자가 많이 진학하는 카리브해 지역(Caribbean)**에서는
동일한 기간(2002–2018) 동안 의과대학 수가 52개에서 91개로 약 75% 증가하였다 (FAIMER, 미출판 자료, 2019).

 


🛑 비윤리적 교육/경영 행태의 증가 (Questionable Business and Educational Practices)

다음과 같은 문제적인 행태를 보이는 의과대학들도 이러한 상황을 악화시키고 있다:

  • 정부의 공식 인가 없이 운영
  • 의료면허 취득에 인정되지 않는 학위 제공
  • 낙제 성적을 인정하여 편입 학점으로 처리
  • 학교의 상태와 자원을 과장하여 학생들을 기만

이러한 사례는 *ECFMG 특별조사(Special Investigations)*에서 보고된 바 있음 (미출판 자료, 2019)

 


🔸 국가별 품질보증 체계의 다양성 (Variation in Quality Assurance Systems)

현재 의과대학이 존재하는 국가 중 약 2/3는 어떠한 형태로든 품질 점검(quality review) 또는 **인증 체계(accreditation system)**를 갖추고 있다.¹⁴ ECFMG는 그동안 다음 조건만을 요구해왔다:

  • 의과대학이 소재 국가의 적절한 정부기관에 의해 공식적으로 인정되었을 것

그러나 이 “공식 인정(official recognition)”의 의미는 국가마다 매우 다양하다.
예를 들어, 일부 국가는 단순히 개교를 허가하는 일회성 승인만으로 학교를 ‘인정’하며, 이후 정기적인 점검이나 관리감독은 전혀 이루어지지 않기도 한다. 심지어 의과대학 인증 체계를 가진 국가/지역 내에서도, 그 **기준(standards), 절차(process), 투명성(transparency), 책임성(accountability)**에는 큰 차이가 존재한다. 게다가, 많은 국가에서는 정기적인 인증을 필수로 요구하지만, 다른 국가들에서는 인증이 자율(voluntary)이며, 기준을 충족하지 못했을 때도 거의 불이익이 없는 경우도 존재한다.¹⁵


📌 요약하자면,

  • 의과대학 수의 급증,
  • 문제적 교육 행태의 존재,
  • 그리고 국가 간 품질 보증 체계의 불균형
    👉 글로벌 인증 기준(Global Accreditation Standards)의 필요성을 강하게 뒷받침하고 있다.

의학교육 및 진료의 세계화 (Globalization of Medical Education and Practice)

전 세계 의료 인력의 이동성 증가새로운 진료 기회의 확산은, 기존의 **품질 보증 패러다임(quality assurance paradigm)**에 복잡성을 한층 더 추가하고 있다. 

📈 2006년부터 2016년까지, OECD(경제협력개발기구) 회원국에서 활동하는 외국 의과대학 출신 의사 수는 50% 증가하였다.¹⁶

"Between 2006 and 2016, the number of foreign-trained physicians working in OECD countries increased by 50%."

 

게다가 **의료 인력의 이동성(mobility)**은 단순히 증가하는 것에 그치지 않고, 이제는 **저자원국가(low-resource countries) → 고자원국가(high-resource countries)**로 향하던 전통적인 이동 양상을 넘어서, 단기적이고 지역 내(intra-regional) 이동경제적, 안전상의 이유로 점차 보편화되고 있다.¹⁷

 

이는 다음과 같은 새로운 기회들이 확장되었음을 보여준다:

  • **의료관광(medical tourism)**의 활성화 (예: 동남아시아, 라틴아메리카, 중동)
  • **원격의료(telemedicine)**의 확산 → 의사들이 물리적 거리를 두고도 진료를 지속하거나 보완할 수 있음¹⁸,¹⁹

🌍 글로벌화된 의학교육의 현실

오늘날 의학교육 자체도 국경을 초월한 국제적 현상이 되었다. 학생들은 다음과 같은 이유로 해외에서 의학 학위를 추구한다:

  • 자국 내 높은 학비
  • 의과대학 정원 부족

이러한 변화로 인해, **규제 기관(regulatory authorities)**은 다음과 같은 두 가지 문제를 모두 다뤄야 하는 상황에 직면한다:

  1. 자국으로 이주해오는 해외 의과대학 졸업생
  2. 자국민 중 해외에서 의학 교육을 받고 귀국하여 진료를 원하는 사람들

예를 들어, 인도 국적 학생들의 유학지로는 카리브해 지역, 러시아, 우크라이나 등이 선호되며,
나이지리아 출신 학생들도 유사한 양상을 보인다.²¹

중국 역시 국제 의대생들이 많이 진학하는 국가로 부상하고 있으며, 현재 영어로 운영되는 의과대학 프로그램이 45개 존재한다.²²

많은 국가들이 다음 두 가지 목적을 가지고 외국인 의대생 유치를 하나의 비즈니스 모델로 활용하고 있다:

  • 자국의 경제 발전 도모
  • 자국민의 의학교육 비용 보조

"Medical student and physician migration is a global phenomenon, with countries striving to balance the need for physicians with their duty to protect the public."

 

즉, 의대생 및 의사의 이동은 전 지구적 현상이며, 각국은 의료 인력 수요대중 보호의 책무 사이에서 균형을 찾기 위해 노력하고 있다.¹⁶,²³,²⁴


다른 글로벌 이니셔티브와의 정렬 (Alignment with Other Global Initiatives)

2023년 인증 요건은, 다음과 같은 국제 보건 기구들의 목표 및 입장과도 일치한다:


📌 WHO의 Workforce 2030 전략

**세계보건기구(WHO)**는 2016년에 Global Strategy on Human Resources for Health: Workforce 2030을 발표하였다.⁴
이 전략은 다음과 같은 보건·사회·경제적 성과 향상을 목표로 한다:

"건강 인력의 보편적 가용성, 접근성, 수용성, 보장성 및 품질을 확보함으로써 보건과 사회·경제 발전 성과를 개선하는 것"

 

📍 Milestone 1.1에 따르면:

**“2020년까지 모든 국가가 보건 인력 교육 기관에 대한 인증 체계를 구축해야 한다.”**⁴
("By 2020, all countries will have established accreditation mechanisms for health training institutions.")


📌 IAMRA의 선언 (2016)

**국제의료규제기관협회(IAMRA)**는 48개국의 116개 규제기관이 회원으로 가입된 국제 기구이다.²⁵
이들은 2016년, 다음과 같은 내용의 **의학교육 인증에 관한 공식 성명(statement)**을 발표하였다:²⁶

  • 인증 시스템의 활용을 장려하여
    • 고품질 의학교육 제공을 보장하고
    • 부실한 교육 프로그램을 식별하며
    • 교육 제공자들이 질을 개선하도록 지원
    • 궁극적으로는 환자를 보호한다

📌 세계의사회(WMA)의 권고 (2017)

**세계의사회(WMA)**는 전 세계 의사단체가 소속된 국제 기구로, 2017년에는 의학교육의 품질보증에 관한 선언문을 채택하였다.²⁷ 이 성명에서는 다음을 권고한다:

  • 각국 의과대학들이 국가 인증 체계에 반드시 참여하도록 유도
  • **국가 인증 체계 자체도 외부 검토(external reviews)**를 받도록 하며,
    _필요시 WFME의 공식 인정을 받을 것_을 제안

"...participation in external reviews of its own policies, practices and standards, which may include seeking recognition by the World Federation for Medical Education."

 


의과대학 인증 및 인증기관의 공인 (Medical School Accreditation and Recognition of Accrediting Agencies)

📊 인증의 효과성에 대한 근거 (Evidence for Accreditation)

의과대학 인증 제도를 도입하고 운영하는 데는 **상당한 자원(resources)**이 소요되므로, 그 효용성 자체에 의문을 제기할 수 있다.

현재 **기초 의학교육(basic medical education)**에 대한 인증과 관련된 연구는 제한적하지만, FAIMER를 포함한 여러 연구자들의 연구 결과에 따르면, 인증(accreditation)과 교육 성과 간에는 긍정적 연관성이 있음이 드러났다.²⁸

 

최근 메타분석에서 다양한 국가의 인증된 학교와 비인증 학교의 성과를 비교한 세 편의 연구가 소개되었다.

이들 모두에서 다음의 결론이 도출되었다:

인증을 받은 의과대학 출신 학생들이 표준화 시험(standardized exams)에서 더 우수한 성과를 보였다.

  • 이 중 두 연구는 미국의사면허시험(USMLE)의 일부 단계 성적을 비교하였고,
  • 다른 하나는 특정 국가의 전공의 입시시험(national residency entrance exam) 성적을 비교하였다.²⁸

🔍 정성적 연구(qualitative studies) 또한

인증과 교육의 질(perceived quality of education) 사이에 긍정적 관계를 보고하였다.

예:

  • 캐나다 의과대학을 대상으로 한 조사에서는, 인증이 학교의 구조화(structure), 감독(oversight), 질 관리에 긍정적 영향을 미쳤다고 응답자들이 진술하였다.
  • 이 과정에서 공식화된 프로세스와 데이터 수집 체계의 개발이 이루어졌고, 기준 준수를 위한 노력이 증가했다고 평가되었다.
    → 단, 운영상의 비용과 행정적 부담도 함께 지적되었다.

종합적으로 보면, 참여자들은 인증으로 인해 자원이 추가되고 질 향상에 대한 관심이 높아진 것을 환영하였다.²⁹


🧭 접근 전략 (Approach)

ECFMG는 2010년에 다음과 같은 결론에 도달했다:

전 세계 모든 의과대학(약 3,200개)을 직접 인증하는 것은 현실적으로 불가능하다.

 

따라서, 보다 실현 가능한 대안으로서 다음을 제안하였다:

의과대학을 인증하는 ‘기관(agency)’을 평가하고 공식적으로 ‘인정(recognize)’하는 모델

 

즉, 학교를 인증하는 대신, 인증 기관을 인증하는 방식으로 접근 범위를 축소한 것이다.
이렇게 하면, 대상 수가 3,200개 의과대학에서 약 150개 인증기관으로 감소한다.³⁰


🎯 ECFMG 인증과 인증기관 공인의 연계 목적

ECFMG는 다음과 같은 목표로 인증기관 공인을 ECFMG 인증 요건과 연결한다:

  • **전 세계 학부 의학교육(undergraduate medical education)**의 품질 기준 상향 유도
  • 자발적 인증 체계를 가진 국가의 학교들도 인증을 받도록 유도
  • 인증 기관들로 하여금 국제적으로 수용된 기준에 부합하는 프로세스를 갖추도록 요구

이러한 **글로벌 인증기관 공인 프로그램(global recognition program)**은, 비록 그 국가의 졸업생이 ECFMG 인증을 직접적으로 추구하지 않더라도, 그 자체로 ‘의과대학 교육의 질’을 상징하는 지표로 작용할 수 있다.


🌐 WFME의 역할 (Role of the World Federation for Medical Education)

현재 ECFMG가 공인을 인정하는 유일한 프로그램은 👉 WFME Recognition Programme이다.

**WFME(World Federation for Medical Education)**는 1972년에 여러 국제 보건 기구들이 모여 설립한 **비영리, 비정부기구(NGO)**로, 의학교육의 모든 단계에서 질 향상을 도모하는 것을 사명으로 한다.

WFME Recognition Programme의 목적:

전 세계 의과대학 인증이 국제적 수준에서 엄격하고 투명하게 수행되도록 보장하는 것

 

공인 과정은 다음의 단계를 포함한다:³¹

  1. 인증기관의 자체 평가(self-evaluation) – WFME의 기준에 기반
  2. WFME 평가자 팀의 현장 방문(site visit)

공인을 위한 필수 요건:

  • **공개적으로 이용 가능한 인증 기준(standards)**을 보유해야 하며,
  • 해당 기준은 정기적으로 검토 및 갱신되어야 한다.
  • 공정하고 투명한 인증 시스템 운영을 위한 정책, 절차, 조직 구조를 갖춰야 한다.
  • **이해 상충 방지(conflict of interest)**에 대한 명확한 규정 필요
  • 인증 받은 학교 목록을 웹사이트에 정확히 공개해야 함³¹

인정 기간 및 관리

  • WFME 공인은 일반적으로 10년간 유효하다.
  • 매년 **현황 보고서(status report)**를 제출해야 하며,
    여기에는 그 해에 인증되었거나 심사 중인 모든 학교 목록이 포함되어야 한다.³²

현재까지 다양한 국가의 20개 인증기관WFME의 공인을 획득하였다. 해당 기관들은 *표 3(Table 3)*에 수록되어 있다.³³

예: 중국, 아일랜드, 키프로스 등의 인증기관은 현재 WFME 심사 중에 있으며, 더 많은 국가들이 공인 절차 착수를 위한 논의 중이다.³³

 


📌 결론적으로,

  • 의과대학 인증은 단순 행정 절차가 아니라, 의학교육의 질을 유지하고 향상시키는 핵심 수단이며
  • WFME의 공인 체계는 그 신뢰성과 국제적 통용성을 보장하는 메커니즘으로 작동한다.

이행 계획 (Implementation Plan)

📖 투명성 증진을 위한 노력 (Increasing Transparency)

국제의료졸업생(IMGs)을 지원하고, 대중에게 의사의 자격에 대한 신뢰를 제공하는 역할을 수행해온 ECFMG는
**2023년 인증 요건(Accreditation Requirement)**의 도입을 다음과 같은 **4단계 계획(four phases)**으로 이행할 예정이다 (Figure 2 참조).³⁴ 이 4단계 계획은 다음을 목적으로 한다:

  • 국제 의학교육(international medical education)의 투명성을 증진하고
  • 학생들이 의과대학을 선택할 때 보다 정보에 입각한 결정을 내릴 수 있도록 지원하며
  • 규제기관, 수련 프로그램(GME), 환자 및 기타 이해관계자들이 후보자의 의과대학 교육 배경을 보다 깊이 이해할 수 있도록 한다.


결론 (Conclusion)

전 세계 모든 환자들은 안전하고 충분히 교육받은 의사(safe, well-educated physicians)를 만날 권리가 있다.

 

ECFMG는 그 역사적 배경과 역할의 범위를 바탕으로, 국제 의학교육의 질에 실질적인 영향을 미칠 수 있는 독보적인 위치에 있다.

📌 현재 전 세계적으로 의과대학 수는 빠르게 증가하고 있으며,
이에 따라 학생, 규제기관 및 기타 이해관계자들은 해당 학교의 교육이 충분한 품질을 갖추었는지 확인할 필요가 있다.

👉 이에 따라,

 

ECFMG는 개별 의과대학의 인증뿐만 아니라, 인증을 수행하는 인증기관 자체의 '공식 인정(recognition)'도 요구함으로써

  • 의학교육의 투명성 향상,
  • 지속적인 질 개선,
  • 그리고 **공공 신뢰(public trust)**를 도모하고자 한다.

📈 이미 나타나고 있는 변화

2023 요건의 영향은 이미 전 세계적으로 감지되고 있다:

  • 많은 인증기관들이 WFME의 인정 절차를 시작하거나 완료하였으며,
  • 의과대학들도 인증 획득을 점점 더 적극적으로 추구하고 있다.
  • 일부 국가는, 기존에 인증 체계가 없었음에도 불구하고 새로운 인증 시스템을 구축 중이다.

또한, 다음과 같은 국가들의 기관들도 WFME 인정을 획득하였다:

  • 인도네시아(Indonesia)
  • 네덜란드(Netherlands)
  • 조지아(Georgia)

이 국가들은 과거에는 ECFMG 인증을 신청하는 의대생이 거의 없던 지역이지만,
이제는 국제 기준을 충족하는 인증 체계를 갖추기 위해 WFME 인정을 추구하고 있다.

“Agencies are seeking recognition by WFME to demonstrate that they meet global standards for medical school accreditation.”

 

WFME 인정을 통해 기관의 위상(stature)이 제고되며, 이는 다시 국내에서의 교육 질 관리(quality standards enforcement)에 도움을 준다.


👩‍⚕️ 👨‍⚕️ 의과대학생, 수련기관, 규제기관에 미치는 영향

  • 학생들은 의과대학을 조사할 때 해당 학교의 인증 상태를 확인하는 것이 하나의 중요한 판단 기준이 될 것이다.
  • GME 프로그램IMG를 선발할 때 더욱 신뢰할 수 있는 정보를 확보하게 된다.
  • 규제기관최신의 인증기관 및 인증 의과대학 리스트를 기반으로
    • 품질보증 업무
    • 면허 심사 업무를 보다 효율적으로 수행할 수 있게 된다.

🧭 또한,
국제적 인증 기준 및 절차에 대한 상세 정보는 교육과정 개선(curricular improvement)을 위한 유용한 참고 자료가 될 수 있다.

예를 들어, 초기에 WFME 인정기관으로부터 인증을 받지 못했던 학교들 중 일부는, 과정을 개선하고 교육과정을 수정함으로써 결국 인증을 획득하였다.³⁵


🌍 의의

“Accreditation fosters quality improvement, transparency and, above all, public trust.”
인증은 질 향상, 투명성, 그리고 무엇보다 대중의 신뢰를 증진시킨다.

 

ECFMG 인증 요건은 의학의 환경 변화에 맞추어 지속적으로 진화해왔으며,

 

2023년 의과대학 인증 요건은,
📌 ECFMG의 사명—

"전 세계 의학교육과 보건의 질을 향상시키는 것"
—을 이어가는 **다음 단계(next evolution)**라고 할 수 있다.


 

Perspect Med Educ. 2024 Feb 6;13(1):75-84. doi: 10.5334/pme.963. eCollection 2024.

Enabling Implementation of Competency Based Medical Education through an Outcomes-Focused Accreditation System

\

📌 [논문 리뷰] 역량기반 의학교육(CBME)에서 인증(Accreditation)의 역할과 의미

의학교육에 관심 있는 여러분이라면 최근 자주 듣게 되는 용어가 있을 거예요. 바로 **역량기반 의학교육(Competency-Based Medical Education, CBME)**이죠. 캐나다는 이 CBME를 전공의 교육(Postgraduate Medical Education, PGME)에 도입하면서 상당히 큰 변화를 겪고 있는데요. 이번 글에서는 캐나다의 사례를 통해 CBME를 성공적으로 도입하는 데 있어 인증(Accreditation)이 어떤 역할을 하는지 알아볼게요. 😃


🎯 CBME, 왜 인증(Accreditation)과 연결해야 할까?

CBME는 졸업생이 실제로 환자와 사회가 요구하는 역량(competencies)을 갖추도록 돕는 교육 방식이에요. CBME를 잘 도입하려면 교육 내용뿐 아니라 교육을 인증하는 시스템도 이 교육 패러다임에 맞게 바뀌어야 하죠.

 

연구진은 이 점을 강조하면서 이렇게 설명해요.

"교육 패러다임(CBME)과 인증 체계 사이에 반드시 정렬(alignment)이 필요하다. 그렇지 않으면 변화를 성공적으로 구현하기 어렵게 된다."
(There must be alignment between both the educational paradigm and the accreditation system, or the implementation of transformational change will be hampered.)

 

즉, CBME가 효과적으로 자리 잡으려면 인증 시스템이 CBME의 특성을 잘 반영해야 한다는 거예요. 🔄


🔍 CBME 도입을 촉진하는 인증 시스템의 특징은?

연구자들은 CBME 구현을 돕는 인증 시스템이 다음과 같은 특징을 가져야 한다고 말합니다.

 

1️⃣ 교육 이론의 일치(Alignment of Educational Theory)

CBME는 "성과 기반(outcomes-based)" 방식으로, 기존처럼 시간만 채우는 게 아니라 실제 역량을 갖추었는지 확인하죠. 인증 시스템도 이를 반영하여 구조(structures)나 프로세스(processes)보다는 "성과(outcomes)" 중심으로 바뀌어야 해요.

"인증 시스템의 잠재적인 인증 결과(accreditation outcomes)는 인증 대상 기관의 교육적 행동과 의사결정을 이끄는 주요 요인이다."
(Potential accreditation outcomes drive the educational behaviour and decisions of those being accredited.)

 

2️⃣ 품질 보증과 품질 개선(Quality Assurance vs. Quality Improvement)의 균형

인증 시스템은 기본적으로 최소한의 교육 품질을 보증하는(Quality Assurance) 동시에, 지속적으로 교육 품질을 높이는(Quality Improvement) 역할도 해야 합니다. 캐나다의 인증 시스템인 CanERA는 이 두 가지를 모두 균형 있게 다루고 있어요.

"CanERA 시스템은 지속적인 품질개선(continuous quality improvement)에 대한 기대와 강조를 증가시키면서도 품질보증(quality assurance)에 중점을 둔 기존 설계 특징을 유지하는 방식으로 목표를 재구성하였다."

 

즉, 안정적인 교육 기준을 유지하면서도 끊임없이 발전할 수 있게 하는 거죠. ⚖️

 

3️⃣ 명확하고 유연한 인증 표준(Accreditation Standards)

CBME를 촉진하기 위해서는 명확하지만 지나치게 경직되지 않은 인증 표준이 필요해요. CanERA는 이 점을 잘 반영해서 명확한 표준을 제시하면서도 개별 프로그램이 혁신을 추구할 수 있도록 적절히 유연성을 부여하고 있답니다.


🚧 하지만 주의할 점도 있어요!

연구진은 인증 시스템이 오히려 CBME 도입의 장애물이 될 수도 있다고 경고해요.

  • 성과 중심(outcomes-based) 평가에만 의존하면 교육 과정의 중요한 부분(예: 교육적 과정과 환경)이 제대로 평가되지 않을 수 있어요.
  • 인증 표준이 너무 경직되거나 시대에 뒤떨어지면 오히려 CBME 혁신을 방해할 수 있어요.
  • 인증 개혁에는 많은 자원이 소모되므로 잘못 관리하면 교육 자체에 부정적인 영향을 미칠 수도 있습니다.

🚀 미래의 인증 시스템은 어떻게 달라질까요?

CBME가 발전하면 다음과 같은 변화도 기대할 수 있답니다.

  • 📊 빅데이터 활용: 교육 데이터를 이용해 프로그램 평가를 훨씬 더 객관적이고 세부적으로 할 수 있어요.
  • 💡 장기적 성과 평가: 졸업생들이 실제 진료에서 좋은 성과를 내고 있는지를 기준으로 교육 품질을 판단할 수 있게 됩니다.
  • 🛠 타당성(Validity) 강화: 인증 결정의 신뢰성을 높이는 방향으로 인증 시스템이 발전할 거예요.

📖 결론적으로…

연구자들은 CBME 도입을 고민하는 교육기관들에게 인증의 중요성을 강조하며 다음과 같이 말합니다.

"CBME로의 전환을 고려하거나 이미 시행 중인 교육 기관들은 새로운 교육 패러다임의 성공적인 전환을 촉진하는 데 있어 인증(accreditation)이 갖는 중요성을 반드시 고려해야 할 것이다."

 

의학교육을 혁신적으로 발전시키기 위해서는 단순히 교육과정만 바꾸는 게 아니라, 이를 평가하는 시스템까지 함께 변화해야 한다는 중요한 메시지를 전하고 있습니다. 💬 

이번 논문이 여러분의 의학교육 혁신 여정에 작은 도움이 되었으면 좋겠습니다. 😊

 

=====

 

서론 (Introduction)

캐나다의 전공의 교육(Postgraduate Medical Education, PGME) 전반에 걸쳐 역량기반 의학교육(Competency-based Medical Education, CBME) 이 도입됨으로써 전례 없는 개혁(unprecedented level of reform) 이 이루어졌다. 캐나다 가정의학회(CFPC, College of Family Physicians of Canada)는 Triple C 역량기반 교육과정(Triple C Competency-based Curriculum) 을 도입했고, 캐나다 왕립 내과외과학회(Royal College of Physicians and Surgeons of Canada, 이하 Royal College)는 역량기반 교육(Competence by Design, CBD) 으로 전환하였다. 이로 인해 전공의 교육과 평가 방식은 근본적으로 변화했다[1–3].

  • 역량기반 의학교육(CBME)의 도입 은 대규모이고 복잡한 변화 계획이다(large-scale, complex change initiative) [4].
  • 성공적인 도입이 이루어지지 않으면, 학습자는 CBME라는 교육 접근법이 약속한 이점을 충분히 누릴 수 없게 된다.

다른 연구에서는 CBME 도입 경험과 결과에 영향을 미친 요인들을 기술하였지만, 문헌에서는 인증(accreditation)이 이러한 전환을 가능하게 하는 데 수행하는 중요한 역할에 대해서는 논의하지 않았다 [5–7]. 캐나다 전공의 교육 시스템에서 일어난 근본적 변화는 성과기반(outcomes-based) 인증 프로세스로의 전환과 병행하여 이루어졌다. 따라서, 교육 패러다임(CBME)과 인증 체계 사이에 반드시 정렬(alignment)이 필요하다. 그렇지 않으면 변화를 성공적으로 구현하기 어렵게 된다.

 

본 논문에서는 독특하고 협력적으로 구축된(unique, collaboratively constructed) 인증 체계가 어떻게 CBME로의 전환과 구현을 가능하게 하였는지 기술한다. 여기서 얻은 교훈을 공유함으로써 지역적 차원의 지속적인 개선 프로세스를 촉진하고, 이러한 발전하는 교육 시스템 내에서 구현의 충실도(fidelity)와 무결성(integrity)을 극대화하기 위한 도구로써 인증(accreditation)의 역할에 대한 세계적 논의에 기여하고자 한다.


정의 (Definitions)

  • 역량기반 의학교육(CBME) 은 “졸업 후 성과(outcome)로서의 역량을 중심으로, 사회적 요구와 환자의 요구를 분석하여 도출한 역량에 따라 구성된 교육”이다 [8, p.636]. 개별 학습자의 역량은 지식, 기술, 태도를 통합한 관찰 가능한 능력(observable abilities)을 의미한다 [9].
  • CBD(Competence by Design) 는 Royal College가 2017년부터 시행한 CBME의 한 버전으로, 학습을 성과 기반으로 접근하는 동시에 시간(time)을 자원(resource)으로 활용하는 특징을 가지고 있다 [3].
  • CBME는 단순히 교육과정(curriculum)에 그치지 않는다. 교육 프로그램의 설계(design), 구현(implementation), 평가(assessment), 평가 및 피드백(evaluation), 그리고 관련 정책의 결정과 함의(policy decisions and implications)를 모두 포함한다 [9, 10].
  • CBME, 특히 여기에서의 CBD 도입은 근본적인 행동의 변화를 요구하는 변혁적 변화(transformational change) 로 특징지어진다 [11].

인증(accreditation) 은 "품질 보증과 향상을 목적으로 외부 기관이 정의된 표준(defined standards)에 따라 교육 프로그램, 기관 또는 시스템을 공식적으로 평가하는 프로세스"이다 [12, p.4].

  • 인증 시스템의 목적적합성 프레임워크(fit-for-purpose framework) 는 최상의 설계가 지역적 요구와 상황(local needs and contexts)을 우선적으로 고려하고, 관할 지역(jurisdiction)의 변화에 따라 맞춤화된 접근을 취하는 것이라 설명한다 [13].
  • 지역적 맥락을 우선함으로써 목적적합성 프레임워크는 지역 요인(local factors)과 인증 시스템이 품질 추구를 위한 상황적으로 의미 있는(situationally meaningful) 인증을 효과적으로 수행하는 능력 간의 중요한 연결을 구축한다. 인증 시스템 설계 시 반드시 고려해야 하는 지역적 맥락 중 하나가 바로 교육적 접근법(educational approach) 이며, 이 논문에서는 그것이 바로 CBME 이다 [13,14].

CanERA (Canadian Excellence in Residency Accreditation)

캐나다에서는 다음 세 기관이 전공의 교육(PGME) 인증을 담당한다:

  • 캐나다 가정의학회(CFPC)
  • 퀘벡의학회(Collège des Médecins du Québec, CMQ)
  • 캐나다 왕립 내과외과학회(Royal College)

이들의 인증 시스템은 약 1990년부터 2010년까지 수십 년간 큰 변화 없이 점진적 개선만 이루어져 왔다. 그러나 2000년대 후반(2008-2009년경)에 주요 이해관계자들은 현대적인 재설계의 필요성(the need for modern redesign) 을 지적하였다 [15]. 이 시기는 캐나다에서 CBME 모델이 초기 개발되던 시기와 맞물려 있다 [16,17].

 

이에 대응하여, 위 세 기관은 2013년에 캐나다 전공의 인증 컨소시엄(Canadian Residency Accreditation Consortium, CanRAC) 을 결성했다. CanRAC은 2013년부터 2018년까지 캐나다 전역의 PGME 및 인증 관련 이해관계자들이 참여한 일련의 회의를 개최하여, 인증 프로세스의 조정과 혁신적 접근을 추구하고, 변화하는 교육 패러다임에 적응하고자 했다 [18].

 

이러한 작업은 2019년 7월 1일 캐나다 우수 전공의 교육 인증(CanERA, Canadian Excellence in Residency Accreditation) 이라는 새로운 통합된 인증 시스템의 출시로 이어졌다.

 

 

CanERA의 목표는 다음과 같다:

  • 새로운 표준을 통해 인증 접근법을 현대화(modernize)
  • 표준 평가를 위한 새로운 프레임워크 제공
  • 지속적인 품질 개선(continuous quality improvement)을 강조
  • 8년의 더 긴 인증 주기(longer eight-year accreditation cycle)와 디지털 인증 관리 플랫폼으로 이해관계자의 업무량 감소
  • CBME의 원칙과 부합하는 표준, 정책, 프로세스를 통해 CBME 구현을 지원

 

어떤 인증 시스템의 특징이 CBME 구현을 촉진하는가?

(WHAT FEATURES OF AN ACCREDITATION SYSTEM ENABLE THE IMPLEMENTATION OF CBME?)


1. 교육이론의 정렬 (ALIGNMENT OF EDUCATIONAL THEORY)

기존 연구는 인증 시스템과 그 설계가 그것이 속한 환경의 영향을 받는다고 제안하였다[13]. 하지만 그 반대의 경우도 역시 성립한다. 즉, 교육 환경 역시 인증 시스템과 그 설계로부터 큰 영향을 받을 수 있다.

  • 인증 시스템은 규제적 권한(regulatory mandates)을 통해 상당한 영향력을 행사한다.
  • 따라서, 잠재적인 인증 결과(accreditation outcomes)는 인증 대상 기관의 교육적 행동과 의사결정을 이끄는 주요 요인이다.

새로운 교육 패러다임을 구현할 때, 해당 교육 패러다임의 특성과 구조를 촉진하고 우선시하는 인증 시스템을 갖추는 것이 중요하다. 따라서 새로운 패러다임의 이론적 기반(theoretical basis), 교육적 우선순위(educational priorities), 사회적 책임(societal responsibilities) 등 근본적인 특성을 정렬(alignment)하는 것이, 의도한 교육 변화를 이끄는 데 있어 매우 중요하다.

  • 기존의 인증 시스템(traditional accreditation systems) 은 주로 구조(structures)프로세스(processes) 에 초점을 맞추었다.
    이는 학습자가 필수적인 훈련을 받았는지 여부를 판단할 때 '시간(time)'을 중심으로 판단했던 기존 교육 시스템에 적합했다.
  • 반면 성과기반 교육 패러다임(outcomes-based educational paradigm) 인 CBME는, 교육 경험 전반에 걸쳐 역량(competencies) 형태의 결과(outcomes)를 평가, 기록, 해석하는 커리큘럼을 활용한다[9, 19, 20].

CanERA의 새로운 인증 시스템 설계는 기존의 평가하기 쉬웠던 구조와 프로세스 개념에서 벗어나, 인증 표준(accreditation standards)에서 성과(outcomes) 에 초점을 두는 방향으로 전환하였다[21].

  • 예를 들어, 기존의 인증 시스템에서는 단순히 특정 정책이 존재하는지 여부만 확인했던 것에 비해, 성과 기반 시스템에서는 그 정책이 실제로 어떻게 활용되고 있으며, 그 결과가 어떤지를 제시하여 표준 준수를 증명해야 한다.

이와 같은 성과 기반 인증 시스템 내에서는 전공의 교육 프로그램이 CBME 원칙에 부합하는 교육 혁신(educational innovations)을 보다 자유롭게 채택하고 우선시할 수 있게 된다.

  • 모든 학습자가 정해진 교육 경험을 반드시 거쳐야 하는 것이 아니라, 비전통적이거나 학습자 주도(learner-driven)의 경험을 활용하여도 역량을 달성할 수 있게 된다.
  • 이는 혁신의 핵심 요소가 시스템 내에서 얼마나 실제적으로 구현되고 있는가, 즉 구현 충실도(fidelity of implementation)를 높이는 데 중요하다[22].

나아가, 성과 기반 인증 시스템의 원칙은 CBME의 교육적 성과 우선순위와 더욱 근본적으로 일치한다.

  • 특히 졸업생과 프로그램의 성과를 강조하여, 궁극적으로 개인 및 인구집단의 건강 향상에 기여할 책임감 있는 유능한 의사를 양성한다는 점에서 일치한다[9, 23, 24].
  • 이러한 근본적 정렬(fundamental alignment) 은 인증 시스템과 과정의 타당성(validity)을 강화하고, 사회적 책무성(social accountability)에 대한 기대를 동시에 충족시킨다.
  • 이러한 수준의 정렬은 개별 프로그램과 기관들이 이러한 필수 원칙을 자체 맥락에 적용할 가능성을 높여 구현의 무결성(integrity of implementation)을 촉진한다[25].

2. 품질보증 vs 품질개선 중심 접근

(QUALITY ASSURANCE VERSUS QUALITY IMPROVEMENT FOCUS)

인증 시스템의 목적은 대체로 품질보증(quality assurance)품질개선(quality improvement) 두 가지를 모두 포함한다[12].

  • 품질보증 중심 접근(quality assurance focus) 은 프로그램이 최소한의 교육 품질 기준을 충족함으로써, 특히 커리큘럼이 크게 변화하는 시기에 공중과 규제자들이 안심할 수 있도록 하며, 궁극적으로 피해를 예방하는 기능을 한다[26].
    • 따라서 인증 기관은 기관 및 프로그램, 훈련생, 그리고 궁극적으로 환자에 대한 중요한 신탁 책임(fiduciary duty)을 가진다.
  • 반대로, 품질개선 중심 접근(quality improvement focus) 은 프로그램과 의학교육 시스템이 자기평가(self-evaluation)를 통해 시간이 흐름에 따라 품질을 높이고, 보다 높은 목표의 기준을 달성할 수 있도록 지원하는 데 중점을 둔다[27, 28].
    • 품질개선은 특히 CBME 도입 초기 단계에 매우 중요할 수 있다.
    • 품질개선 철학은 “차세대(next)” 및 모범 사례(best practices)를 식별하고 공유하여, CBME 구현 시기에 혁신이 확산(diffusion of innovation)되도록 촉진할 수 있다[27].

대부분의 인증 시스템은 이 두 가지 품질 목표 사이에서 균형을 맞추고 있다[13].

 

두 가지 목표를 모두 달성하기 위해, CanERA 시스템은 지속적인 품질개선(continuous quality improvement) 에 대한 기대와 강조를 증가시키면서도, 품질보증에 중점을 둔 기존 설계 특징을 유지하는 방식으로 그 목표를 재구성하였다.

  • 프로그램 수준에서는 인증 표준 내에 새로운 품질개선 영역(quality improvement domain) 을 신설하여, 전공의 교육 프로그램 내에서 품질개선 문화가 정착되도록 하였고, 모든 프로그램이 충족해야 할 기대를 명확히 하였다[29].
  • 이러한 새로운 시스템 설계는, 시스템 내에서 안전성을 유지하면서도 CBME의 구현을 촉진하는 균형을 성공적으로 이루었다[29].

 

3. 인증 표준

(ACCREDITATION STANDARDS)

 

인증 표준이란 “프로그램, 기관 또는 시스템의 품질에 대한 결정을 내릴 때 사용되는 일반적으로 수용된 척도나 벤치마크”로 정의된다[12, p.6].

  • 따라서 인증 표준은 프로그램과 기관이 충족해야 할 품질 기준(expectations)을 명확히 하며, 기준 충족을 위한 행동을 이끌어낸다[30, 31].
  • 인증 표준은 아마도 인증 시스템에서 가장 핵심적인 요소 중 하나일 것이다[32].

CBME 구현과 관련하여, 인증 표준의 내용이 역량기반 설계(competency-based design)의 핵심 구성 요소(core components) 에 기반하여 조정(aligned)될 때, CBME 구현을 효과적으로 촉진할 수 있다[11].

인증 표준은 상세성(detail), 요구사항의 유연성(flexibility), 그리고 구조(structures), 프로세스(processes), 성과(outcomes)에 대한 강조 정도에 따라 달라진다.

  • 매우 세부적(highly detailed)이고 처방적(prescriptive)이거나 구조와 프로세스에 중점을 둔 인증 표준은 프로그램 간의 표준화(standardization)를 촉진할 수 있다[33].
    • CBME에서는 이러한 접근이 프로그램의 기대치를 명확하게 하고 원하는 교육 설계 모델에 대한 충실도(fidelity)를 촉진할 수 있지만, 동시에 혁신의 확산(diffusion of innovation)을 저해할 수도 있다는 의견이 있다[34].
  • 반대로, 보다 유연성(flexibility)이 높거나, 교육적 성과(outcomes)에 강조를 두는 표준은 프로그램이 CBME의 현지 구현(local implementation) 과정에서 혁신을 도입할 수 있도록 촉진할 수 있다.
    • 특히 이러한 접근법을 구현 과정에서 발생한 혁신을 지속적으로 반영할 수 있도록 인증 표준을 개선할 수 있는 메커니즘과 결합하면, CBME 구현을 위한 지속적 반복(iteration) 및 개선(improvement)을 촉진하는 강력한 도구가 될 수 있다.
    • 그러나 지나치게 유연하거나 모호한 표준(overly flexible or vague standards)은 구현 초기 단계에서 프로그램이 필요로 하는 지침을 충분히 제공하지 못하여, 궁극적으로 구현 충실도를 떨어뜨릴 수 있다.

전체적으로, CanERA의 표준은 구조, 프로세스, 성과를 균형 있게 포함하여 작성되었다.

  • 특히, CanERA의 표준은 계층적으로(hierarchy) 구성되었다.
  • 즉, 가장 상위의 포괄적(overarching) 표준 하에 세부 요소(elements), 요구사항(requirements), 지표(indicators)가 포함되어 있으며, 이를 통해 프로그램이 구현한 사항과 개선이 필요한 영역에 대해 명확한 피드백을 제공한다[29].

예를 들어, 교육 프로그램에 관한 표준(표준 3)은 다음과 같은 포괄적 성과(overarching outcome)를 제시한다:

“레지던트는 독립적 진료를 할 수 있도록 준비되어 있어야 한다(Residents are prepared for independent practice)” (p.9) [29].

  • 이 포괄적 성과 하에 CBME 핵심 구성요소에 기반한 구체적 요소와 지표가 명시된다.
  • 예를 들어, 지표 3.1.1.2는 “해당 진료 분야에 맞는 CanMEDS/CanMEDS-FM 프레임워크의 각 역할(role)을 역량이나 학습목표에 포함해야 한다”고 명시하여 구체적인 가이드를 제공한다.
  • 반면, 지표 3.2.3.1은 “개별 레지던트의 학습 경험을 학습자의 요구와 미래의 커리어 목표에 맞게 조정할 수 있으며, 동시에 국가적 표준 및 사회적 요구를 충족해야 한다”고 하여 목표 달성을 위한 접근법에 유연성을 부여한다.

CanERA 표준의 이러한 내용과 구조는 CBME로의 전환을 강력히 촉진하는 역할을 한다.


4. 인증 프로세스

(ACCREDITATION PROCESSES)

“인증 프로세스(accreditation processes)”라는 용어는 인증 시스템에서 공통적으로 수행되는 핵심 활동들을 포괄적으로 지칭하는 개념이다.

 

인증 프로세스에는 다음과 같은 요소들이 포함된다[13]:

  • 표준을 어떻게 평가할 것인가? (예: 자기평가, 외부평가 모델)
  • 평가 정보를 어떻게 사용할 것인가?
  • 인증 결정을 어떤 범주와 절차로 내릴 것인가?
  • 누가 평가를 수행할 것인가? (예: 현장 방문 평가 모델)
  • 얼마나 자주 평가할 것인가? (인증 주기)

이러한 인증 프로세스는 시스템마다 상당히 다르지만, 가장 핵심적인 요소는 인증 대상 기관이나 프로그램이 원하는 행동을 촉진하고 보상(reward)하도록 설계되어야 한다는 점이다. CanERA 인증 시스템은 CBME 구현 촉진을 위해 다음과 같은 주요 특징을 도입했다.

첫째,

프로그램이 CBME를 구현하는 데 있어 초기 단계에는 인증 결과에 즉각적 영향을 미치지 않고 충분한 준비 시간을 부여하였다.

  • 예컨대, 특정 전문 분야의 역량을 기반으로 학습 목표를 설정하거나(지표 3.1.1.1), 특정 교육 경험(로테이션 등)을 필수화하는 표준 요구사항이 있지만, CBD 첫 해에는 이를 즉시 충족하지 않아도 되도록 정책이 마련되었다[35].

둘째,

지속적인 품질개선을 독려하는 인증 결정 방식을 새롭게 도입하였다.

  • 이전의 인증 모델에서는 표준의 작은 결함이라도 공식적인 약점으로 간주하고 인증 결정에 반영하였다.
  • 반면 CanERA에서는 프로그램이 적극적으로 인증자들에게 진행 중인 개선사항을 공유하는 경우, 최소 표준을 충족하고 지속적인 개선이 진행 중이라면 이를 처벌하지 않도록 인증 결정 원칙을 개정하였다[35].
  • 또한, 기관 수준에서도 전공의 교육 프로그램의 감독 및 품질 개선을 강조하는 추가 표준 요구사항을 도입하여, 기관 차원에서의 CBME 구현을 강화하는 것을 목표로 하였다.

셋째,

혁신과 실험적 접근을 촉진하기 위한 목적으로 우수 사례 및 혁신(LPI: Leading Practice and Innovation) 개념을 도입하였다.

  • LPI는 “해당 전문 분야 또는 전반적 전공의 교육에서 주목할 만하거나 독창적이고 혁신적인 실천 사례”를 의미한다[35].
  • 현장 평가자가 프로그램 및 기관의 새로운 사례를 인정하고, 이를 다른 기관과 프로그램이 활용할 수 있도록 데이터베이스에 공유하여 CBD 구현과 관련된 혁신의 확산을 촉진하도록 하였다.

인증이 어떻게 동시에 CBME 구현의 장애물이 될 수 있는가

(HOW ACCREDITATION CAN SIMULTANEOUSLY BE A BARRIER TO IMPLEMENTATION OF CBME)

인증(accreditation)은 CBME 구현의 촉진자(enabler) 역할을 하지만, 그 시스템(system), 표준(standards), 프로세스(processes)의 특징으로 인해 동시에 제한점(limitations)부정적 결과(consequences) 를 초래할 수 있다.


 

 

1. 성과 기반 접근법의 과도한 의존으로 인한 도전과제

인증과 CBME 모두 성과(outcomes) 에 초점을 맞추는 것이 구현을 촉진한다는 데 일반적으로 동의하지만[36, 37], 성과 중심의 인증 시스템이 가진 과도한 의존(over-reliance on outcomes)에는 몇 가지 도전과제가 존재한다[23].

  • 어떤 교육과정이든, 교육적 프로세스(educational processes)학습 환경(learning environment)의 특성 등은 성과(outcomes)의 형태로 효과적으로 평가될 수 없지만, 프로그램의 품질에는 본질적으로 매우 중요하다[24].
  • 이러한 요소들을 평가하기 어렵기 때문에, 인증 시스템이 지나치게 성과 기반의 구조(outcomes-based construct)에만 경직되게 고수하면, 결과적으로 인증 기관이 가지고 있는 중요한 신탁 책임(fiduciary responsibility)을 저버릴 위험이 있다.
  • 더 나아가 인증 시스템 설계에서 이러한 요소가 충분히 반영되지 않으면, 특히 초기 구현 단계에서 필요한 요소의 부실한 특성화(deficient characterization)로 인해 CBME 구현을 저해할 수 있다 (Table 1 참조).

 


2. 인증 표준의 유연성 부족과 시대착오적 특성

인증은 본질적으로 여러 해에 걸쳐 반복되는 주기적 과정(cyclical process)이기 때문에, 프로그램들은 인증 표준을 충족시키기 위해 수년간 준비를 해야 하는 경우가 많다.

  • 이는 인증 시스템이 민첩성(agility)을 발휘하여 표준이 항상 시대적으로 적합하도록 유지하는 데 있어 어려움을 초래한다[34].
  • 그러나 CBME 구현을 촉진하려면, 특정 인증 표준은 이상적(aspirational)이거나 최소한 유연(flexible) 하게 설계되어 원하는 변화를 지원할 수 있어야 한다.

반면, CBME가 추구하는 모델과 충돌하는 시대착오적(anachronistic) 표준 (예: 훈련 기간에 대한 처방적 요구사항(prescriptive requirements regarding time spent in training))은 CBME를 채택하는 프로그램을 불필요하게 처벌할 위험이 있고, 전체적인 CBME의 도입과 구현 속도를 저하시킬 수 있다.

  • 따라서 인증 기관은 의학교육의 주요 변화와 속도를 맞추기 위해 인증 표준을 지속적으로 업데이트해야 할 책임이 있다.

3. 자원 측면(resource implications)의 문제

CBME로의 전환과 함께 이루어지는 인증 개혁(accreditation reform)은 자원의 측면에서도 장벽(barrier)이 될 수 있다.

  • 기존 인증 시스템이 CBME 패러다임의 도입과 잘 맞도록 발전하려면, 인증 프로세스의 품질과 효과성을 유지하기 위해 많은 내부적 변화(internal changes)가 요구된다[36].
  • 이와 같은 대규모 변화의 정확한 자원 소요량(resource requirements)은 잘 기술되지 않았지만, 한 예로 호주에서 일반의학(general practice)에 대한 인증 표준을 개발하고 수정하는 작업은 상당히 어렵고 자원이 많이 요구되는 작업임이 보고된 바 있다[38].

CBME의 도입으로 인해 인증 프로세스 자체가 완전히 새로워지거나 크게 수정될 경우, 이러한 자원 부담은 훨씬 더 커질 수 있다.

  • 인증 시스템의 변화는 결국 프로그램에도 다시 자원 부담을 초래할 수 있다.
  • 인증 프로세스에 참여하는 것은 수개월에서 수년에 걸쳐 많은 자원을 소모하게 하며, 이로 인해 인증 프로세스가 평가하고자 하는 본래의 교육적 사명(educational mission) 에도 부정적 영향을 미칠 가능성이 있다.
  • 결과적으로 이는 CBME 구현 프로세스 자체에도 부정적 영향을 줄 수 있다.

미래 시스템 설계를 위한 고려사항

(CONSIDERATIONS FOR FUTURE SYSTEM DESIGN)

CBME는 의학교육 설계에서 졸업생이 획득한 역량(competencies) 이라는 성과(outcomes)를 중심으로 근본적인 변화를 의미한다. 향후 프로그램 활동 및 졸업생 성과를 기반으로 생성된 정보를 활용하는 새로운 방법과 기술이 인증(accreditation)의 모습을 변화시킬 수 있을 것이다.


1. 프로그램 평가 분석기법 (Program evaluation analytics)

CBME 프로그램은 학습자의 진전상황을 평가하는 것 외에도 방대한 평가 데이터를 생성한다[39, 40]. 이 데이터는 교수진의 교육 및 평가 활동(teaching and assessment practices of faculty) [41], 로테이션(rotations)의 효과성 [42] 등 인증 표준에서 중요시하는 프로그램의 여러 측면에 대한 통찰력을 제공할 수 있다.

  • 이 정보는 인증 프로세스를 통해 추진되는 품질 개선 노력(quality improvement efforts) 의 효과성을 평가하는 데 매우 유용할 수 있다[43].
  • 예컨대, 교수개발 활동(faculty development efforts)이 지도교수의 평가 피드백 향상 및 로테이션 일정의 최적화를 통해 평가의 이상적인 목표와 실제 수행 간 정렬(alignment)을 높이는지를 분석할 수 있다.
  • 결과적으로 이러한 데이터를 활용하면 인증 평가 프로세스의 특이성(specificity)객관성(objectivity) 을 크게 향상시킬 수 있다.

2. 프로그램 성과 표준 (Program outcomes standards)

단순한 평가 지표를 넘어서서, 장기적 교육 및 임상 성과(distal educational and clinical outcomes)를 추적하는 기회를 제공함으로써 인증의 관점에서 품질의 다양한 차원을 평가할 수 있다[4, 20, 44].

  • 예를 들어, 프로그램 졸업생들이 실제 진료를 시작한 후 적절한 임상 성과(clinical outcomes)를 달성하고 있음을 증명하는 것보다 더 나은 교육 품질의 근거가 무엇이 있을까?
  • 교육과 임상 데이터의 견고한 통합(robust integration)은 프로그램 수준에서는 레지던트 프로그램이 졸업생을 실제 진료를 위한 준비를 얼마나 잘 시키고 있는지를 나타낼 수 있으며[45], 시스템 수준에서는 더 좋은 임상 성과를 달성하는 졸업생을 배출하는 레지던트 훈련의 특징을 밝힐 수 있다.
  • 이러한 통찰력(insights)은 장기적으로 향후 인증 표준의 개발에도 유용하게 활용될 수 있다.

3. 변혁적 설계를 위한 타당도 근거 (Validity evidence for transformative designs)

인증 프로세스가 고부담적(high-stakes) 이고 높은 가치를 가지는 만큼, CBME와 함께 새로운 인증 설계(accreditation designs)가 도입될 때 인증 결정의 타당성(validity)을 강화하는 방법을 모색하는 것이 중요하다[46, 47].

  • 의학교육 인증(medical accreditation) 및 관련 결정의 타당성에 대한 탐색이 새로운 개념은 아니지만[48], 현재까지의 타당도 근거는 제한적이며 개별적인 설문도구(validity of unique survey tools)나 표면 타당도(face validity)에 주로 국한되어 있다[48, 49].
  • CanERA의 변혁적 설계(transformative design)는 CBME 구현 촉진뿐 아니라 인증 과정 내 결정의 질을 향상시키는 것을 목표로 이루어졌다.
  • 일화적(anecdotal)으로는 성공적이라 평가되지만, 향후 평가 데이터(assessment data), 프로그램 분석 결과(program analytics), 새로운 프로그램 성과 지표(new program outcome measures) 등을 활용해 보다 객관적으로 이를 탐구하고 인증 결정의 타당성(validity of accreditation decisions)에 기여할 수 있을 것이다.

결론

(CONCLUSION)

인증 시스템(accreditation systems)은 CBME로의 전환을 촉진하는 데 매우 중요한 역할(powerful role) 을 수행한다.

다음과 같은 인증 시스템의 특징은 모두 CBME로의 전환을 촉진하는 설계적 기회(design opportunities)를 제공한다:

  • 교육 이론의 정렬(alignment of educational theory)
  • 품질에 대한 접근(quality assurance vs quality improvement)
  • 인증 표준(accreditation standards)
  • 인증 프로세스(accreditation processes)

그러나 이러한 각 영역에도 일정한 제한점(limitations) 이 존재하며, 모든 설계 기회(design opportunities)는 특정한 결과(consequences)를 동반할 수 있음을 인정해야 한다.

 

본 논문에서는 캐나다의 CanERA 인증 시스템 사례를 통해 CBME 구현 과정에서 나타난 기회와 한계를 예시로 제시하였으며, 앞으로의 추가적인 발전 가능성(opportunities for the future)에 대해서도 살펴보았다. 따라서, CBME로의 전환을 고려하거나 이미 시행 중인 교육 기관들은 새로운 교육 패러다임의 성공적인 전환을 촉진하는 데 있어 인증(accreditation)이 갖는 중요성을 반드시 고려해야 할 것이다.

 

 

 

 
 

 

Med Teach2019 Jun;41(6):650-655.  doi: 10.1080/0142159X.2018.1536259. Epub 2019 Mar 20.

Quality assurance of medical education: Lessons learned from use and analysis of the WFME global standards

 

 

 

🌍 전 세계 의학교육의 기준, WFME 표준은 어떻게 활용되고 있을까?

의학교육의 질을 높이기 위해 세계적으로 활용되는 WFME 글로벌 표준(Global Standards),
도대체 어떤 기준이고, 실제로는 어떻게 사용되고 있을까요?
오늘은 최근 논문 한 편을 바탕으로 그 핵심 내용을 정리해보려고 해요.

👇 WFME 표준이 궁금하셨던 분들께 강력 추천!


📘 WFME 표준이란?

WFME는 World Federation for Medical Education의 약자로,
전 세계 의학교육의 질을 높이기 위해 2003년부터 기초의학교육(BME, Basic Medical Education),
전공의교육(PME, Postgraduate Medical Education), 지속 전문성 개발(CPD, Continuing Professional Development)
이렇게 세 영역을 중심으로 **글로벌 표준 트릴로지(trilogy of global standards)**를 발표했어요.

표준은 총 9개의 영역(Area)과 세부 영역(Sub-area)으로 구성되며,
각 항목은 **기본 수준(Basic standards)**과 **질 향상 수준(Standards for quality development)**의
두 단계로 제시돼요.

✅ 이 구조 덕분에 전 세계 각국이 자국 상황에 맞게 유연하게 적용할 수 있어요!


🧩 실제 활용은 어떻게?

1. **질 향상을 위한 지침(Guidelines for Quality Improvement)**으로

  • 일부 의과대학은 교육과정 개편 시 WFME 표준을 활용했고,
  • 일본에선 이 기준을 반영해 행동과학 과목을 필수화하기도 했습니다.
  • 이란은 전공의 수련 모델과 교육 기준을 WFME 표준으로부터 개발했어요.

“WFME standards can provide a framework and guidelines suited for planning program development at national and institutional level.”
→ WFME 표준은 국가 및 기관 차원의 교육과정 개발에 적합한 프레임워크와 지침을 제공할 수 있습니다.


2. **자체 평가(Self-evaluation)와 외부 평가(External Evaluation)**에서

  • 아일랜드, 사우디아라비아, 파푸아뉴기니 등 다양한 나라들이 **자체 감사(self-audit)**와
    외부 자문 패널 구성에 WFME 표준을 기준으로 삼았고,
  • 그 결과, 교육과정 개선이 뚜렷하게 이루어졌다고 해요.

“The process of institutional self-review can bring about decisive reform.”
→ 기관 차원의 자체 평가는 결정적인 변화를 일으킬 수 있습니다.


3. **의학교육 인증(Accreditation)**에서도

  • 말레이시아, 일본, 중국, 오만 등에서 WFME 표준을 기반으로 국가 인증 체계를 마련했고,
  • 일부 국가는 기존 인증 기준과 WFME 표준을 비교 분석하며 활용도를 높였어요.

“Accreditation has impact on the quality of programs.”
→ 인증은 교육 프로그램의 질에 실질적인 영향을 미칩니다.


💡 연구자들은 이렇게 말해요

WFME 표준의 가장 큰 강점은, 너무 구체적이거나 획일적이지 않아서 지역 맥락에 맞게 창의적으로 적용할 수 있다는 점이에요.

“The standards of WFME and LCME share the same fundamental characteristic that they are non-prescriptive and not detailed, allowing for innovation and adaptation to local needs.”
→ WFME와 LCME의 표준은 규범적이지 않고 구체적이지 않다는 공통점을 가지며, 이 덕분에 혁신과 지역 맞춤형 적용이 가능합니다.

 

또 하나, **사회적 책무성(social accountability)**에 대해 비판도 있었지만, 연구자들은 이렇게 설명합니다:

“The concept of social accountability [is] already being embedded in all parts of the WFME standards.”
→ WFME 표준의 전 영역에는 이미 사회적 책무성 개념이 내재되어 있습니다.


✅ 의학교육자들에게 전하는 실천 팁!

이 논문은 WFME 표준을 실제로 잘 활용하기 위한 다섯 가지 조언도 함께 제시하고 있어요:

🔹 지역 맥락에 맞게 표준을 수정하거나 구체화하세요
🔹 의과대학 내부에 ‘질 향상 문화’를 조성하세요
🔹 학교 리더십의 지지를 확보하세요
🔹 모든 이해관계자(stakeholders)의 참여를 유도하세요
🔹 질 향상을 공동의 목표로 삼아, 협력 분위기를 만들기 위해 노력하세요


📝 마무리하며

WFME 표준은 단순히 “글로벌 기준” 그 이상입니다.
자국 상황에 맞게 수정하고 활용할 수 있는, 열린 프레임워크이자 변화의 촉진자예요.
의학교육의 질을 고민하는 모든 분들께 이 기준은 **강력한 도구(tool)**가 될 수 있습니다.

“We are convinced that more medical schools and educational authorities in medicine could benefit from working with the standards.”
→ 더 많은 의과대학과 교육 당국이 WFME 표준을 통해 실질적인 혜택을 얻을 수 있다고 우리는 확신합니다.

 


서론 (Introduction)

이 연구의 목적은 **2003년 이후로 발표된 의학교육의 질 향상을 위한 세계의학교육연합(WFME, World Federation for Medical Education)의 글로벌 표준 삼부작(Trilogy of Global Standards)**의 실제 사용 및 분석 경험을 고찰하는 것이다. 이 연구의 구체적인 목표는 이 표준들이 일반적으로 수용되고 있는지, 어떻게 사용되고 있는지, 그리고 유용하다고 여겨지는지를 살펴보는 것이다.

 

WFME는 1998년에 *글로벌 표준 프로그램(Global Standards Programme)*을 시작하였다 (WFME Executive Council 1998). 이 프로그램의 목적은 의과대학 교육의 전 교육과정 전반에 대해 책임을 지는 기관, 조직, 국가 당국들이 질 향상을 위해 직접 활용할 수 있는 도구(tool)를 만드는 것이었다. 이 프로그램을 개발하기 위해 WFME는 전 세계 여섯 WHO/WFME 지역의 전문가들로 구성된 세 개의 국제 태스크포스(international taskforces)를 구성하였고, 이때 지역적 다양성을 확보하는 것도 중요한 고려사항이었다.

 

그 결과, 2003년에 글로벌 표준 삼부작이 발표되었으며, 그 내용은 다음 세 가지를 포함한다:

  • 기초(학부) 의학교육(BME, Basic Medical Education) (WFME 2003a)
  • 전공의(수련의) 교육(PME, Postgraduate Medical Education) (WFME 2003b)
  • 의사의 지속 전문성 개발(CPD, Continuing Professional Development) (WFME 2003c)

이 표준은 **9개 영역(areas)**으로 구성되며, **총 32~36개의 하위 영역(sub-areas)**을 포함한다.

  • *‘영역(area)’*은 교육과정의 과정(process), 구조(structure), 내용(content), 결과/역량(outcomes/competencies), 평가(assessment), 학습 환경(learning environment) 등 교육의 주요 구성 요소를 의미한다.
  • *‘하위 영역(sub-area)’*은 각 영역의 구체적인 측면이다. 각 하위 영역마다 **기본 표준(basic standards)**과 **질 향상 표준(standards for quality development)**의 두 가지 수준으로 표준이 제시되며, 표준에 대한 **주석(annotation)**이 함께 제공되어 개념을 명확히 해준다.

이 표준은 기관이나 프로그램 수준을 대상으로 하며, **지역적, 국가적, 기관 수준의 표준을 충분히 구체화하여 개발할 수 있는 템플릿(template)**로 고려되어야 한다. 즉, 국가 및 지역의 필요와 우선순위를 반영하고, 다양한 교육 모델을 허용하며, 기관의 자율성도 존중한다는 점을 강조한다.

 

이 프로그램은 __국제적 승인(international endorsement)__을 받았으며, 2003년 덴마크 코펜하겐에서 열린 *세계 의학교육 회의(World Conference in Medical Education)*에서 이를 공식화하였다 (van Niekerk 2003). 이 회의의 주제는 다음과 같았다:

 

“더 나은 건강 관리를 위한 의학교육의 글로벌 표준(Global Standards in Medical Education for Better Health Care)”

 

프로그램의 실행은 __2000년부터 시작__되었으며, 세계 각지의 다양한 기관에서의 **시범 연구(pilot studies)**가 포함되었다 (Grant et al. 2004; Hays and Baravilala 2004). 중요한 진전 중 하나는 WHO와 WFME 간의 **전략적 파트너십(Strategic Partnership)**을 통해 의학교육 개선을 위한 협력 체계가 수립된 것이었다 (WHO/WFME 2004). 이 국제 공동 태스크포스의 첫 실질적 성과는 기초 의학교육의 인증(accreditation)을 위한 WHO/WFME 가이드라인이었다 (WHO/WFME 2005).

 

2012년, WFME는 이 표준을 업데이트하기로 결정하였다. 새로운 국제 태스크포스가 구성되었고, 최종 개정안은 2015년에 발표되었다 (WFME 2015a, 2015b, 2015c). 이전인 2012년에는 BME 표준의 *예비 개정판(preliminary revision)*이 발표되기도 하였다. 최근에는 WFME가 **BME 표준의 활용에 관한 권고사항(recommendations)**을 발표하였다 (Karle et al. 2015).

 

 

연구 자료 (Material)

본 연구는 전반적으로 2003년부터 2018년 3월 1일까지의 PubMed 데이터베이스 문헌 검색을 바탕으로 수행되었다. 검색어는 “WFME” 또는 **“World Federation”**을 **“Medical Education”**과 결합하여 **논문 제목(title)이나 초록(abstract)**에 등장하는지를 기준으로 검색하였다. 단 하나의 예외(van Zanten et al., 2009)를 제외하고, 본 논문의 저자들이 작성한 논문들은 오직 ‘Discussion’에서만 언급되었으며, 결과 분석 대상에는 포함되지 않았다. 영문으로 작성되었거나 영문 초록이 포함된 논문들 중에서, WFME Trilogy(삼부작)의 사용이나 분석을 다룬 논문들만을 연구 대상으로 선정하였다. 이러한 언어적 제한은 의학교육 관련 저널 및 학회에서 영어가 지배적인 언어라는 점에서 보았을 때, 결과에 큰 영향을 주지는 않았을 것으로 판단된다.

 

최종적으로 29편의 논문결과 분석에 포함되었다. 주요 특징은 다음과 같다:

  • 2003년 판 WFME 표준과 관련된 논문: 20편
  • 2012년 개정판 관련: 3편
  • 2015년 개정판 관련: 4편
  • 2003년과 2012년 둘 다 다룬 논문: 1편
  • 2003년과 2015년 둘 다 다룬 논문: 1편

교육 단계별로 보면:

  • 기초 의학교육(BME, Basic Medical Education): 21편
  • 전공의 교육(PME, Postgraduate Medical Education): 6편
  • 지속 전문성 개발(CPD, Continuing Professional Development): 2편

이 문헌들은 다양한 대륙, 국가, 교육 문화의 경험을 포괄하고 있으며, 다음의 다섯 WHO/WFME 지역을 대표한다:

  • 아프리카(African)
  • 아메리카(American)
  • 유럽(European)
  • 동지중해(Eastern Mediterranean)
  • 서태평양(Western Pacific)

단, 동남아시아(South East Asia) 지역은 자료에서 제외되었다.

논문들은 다음과 같은 세 가지 주제에 따라 **모든 저자가 함께 범주화(categorization)**하였다:

  1. 질 향상(quality improvement)
  2. 교육 프로그램의 평가(evaluation of programs)
  3. 의과대학의 인증(accreditation of medical schools)

이와 더불어, WFME의 표준 설정 전략(standard setting strategy)에 대한 분석 요소와 견해들도 일부 문헌에서 다루어졌다.
전체적으로 볼 때, 본 연구에서 활용된 문헌 자료는 제한적이며, 체계적이고 상세한 분석 결과를 담고 있는 경우는 소수에 불과하다.

 

 

결과 (Results)

📌 WFME 표준을 ‘질 향상을 위한 지침(guidelines for quality improvement)’으로 활용한 사례

총 8편의 논문이 WFME 표준을 질 향상의 목적으로 활용한 경험을 보고하고 있으며, 이들 대부분은 표준의 일부 영역에 초점을 맞추고 있다.

🏫 교육과정 개발 (Curriculum development)

  • 동유럽의 한 신설 의과대학은 WFME 표준을 기반으로 교육과정을 전면 개편하였다 (Grković et al., 2012).
  • 북아일랜드의 한 논문은 WFME 프레임워크가 교육자들이 평가 기준을 설정하고 형성평가(formative assessment)와 총괄평가(summative assessment)의 균형을 잡는 데 유용한 도구로 작용함을 보여준다 (Tormey, 2015).
  • 일본에서는 국가 차원의 변화가 일어났다. *행동과학(behavioral science)*이 일본 의과대학에서 전통적으로 다뤄지지 않았음에도 불구하고, 기초 의학교육 필수과목으로 포함되었다. 이는 WFME 기준을 반영한 인증위원회의 결정이었다 (Inoue, 2016).
  • 이란에서는 WFME 기준에 기반하여 전공의 수련 프로그램과 교육 기준 모델이 개발되었다 (Ebrahimi and Rezaee, 2015).

📐 표준 개발 (Development of standards)

  • **유럽 내과학회(The European Board of Internal Medicine)**는 WFME 표준을 바탕으로, 기본 표준과 개발 표준으로 나누어진 내과 수련을 위한 표준 세트를 제안하였다 (Semple et al., 2010).
  • **세계 가정의학회(WONCA)**는 *가정의사의 지속 전문성 개발(CPD)을 위해 WFME 표준을 수정·적용(adapted)*하였다 (Ng et al., 2018).
  • 네덜란드의 8개 일반의(GP) 전문 기관에서는 WFME 프레임워크를 활용해 공동 품질 시스템(collective quality system)을 개발하였다는 보고가 있었다 (Buwalda et al., 2017).

📚 문헌고찰에의 활용 (Use in literature review)

  • WFME 기준은 의학교육의 질과 관련된 근거(evidence)를 탐색하기 위한 체계적 문헌 고찰의 기준틀로 사용되기도 했다.
  • 예를 들어 **Damen et al. (2011)**은 전공의 교육(PME)을 대상으로 한 문헌들을 WFME 기준에 따라 분석하였고, 결과적으로 “대부분의 문헌이 수련과정(training process), 수련의 평가(assessment of trainees), 수련의 본인 자체에만 집중하며, 다른 영역은 소홀히 다뤄진다”고 결론지었다.
    ⟶ 이에 따라 간과된 영역에 대한 추가 연구의 필요성이 제기되었다.

📌 WFME 표준을 ‘자체 평가(self-evaluation)’ 및 ‘외부 평가(external evaluation)’에 활용한 사례

총 7편의 논문이 WFME 표준을 프로그램 평가에 활용한 사례를 보고하고 있으며, 이들에서는 다양한 접근 방식이 제시된다.

  • **아일랜드 왕립 외과대학(RCSI)**은 Graduate Entry Medical Programme에 대한 **기관 내부 평가(self-evaluation)**를 시행하였다 (MacCarrick et al., 2010).
    • 2005년에는 외부 자문 패널이 **WFME 기준을 활용해 교육과정에 대한 외부 평가(external review)**를 수행하였으며,
    • 2008년에는 후속 평가에서 의미 있는 개선이 관찰되었다.
    • 이어지는 세 편의 논문(MacCarrick 2010a, 2010b, 2011)은 국제적인 프로그램 평가에는 기준에 대한 명확한 이해가 필수라고 주장한다.
    • 그러나 현재까지는 9개 WFME 영역 중 3개 영역만 평가되었으며,
    • “비판적 친구들(critical friends)”로 구성된 평가단이 교수진과 협력하며 활동하고, 포괄적인 커뮤니케이션 전략을 통해 철저한 준비를 하는 것이 성공적인 자기평가의 핵심이라 강조되었다.
  • 파푸아뉴기니의 안과 교육 프로그램에서는 **WFME 기준을 변형(adapted)하여 자체 감사(self-audit)**를 수행하였다 (Tousignant and Du Toit, 2011).
    ⟶ 그 결과, *“자체 감사는 간단하면서도 체계적이고, 대체로 객관적이며 유익한 평가 수단”*이라는 결론에 도달했다.
  • 사우디아라비아에서는 의학교육 석사 프로그램이 신설되었고 (Al-Subait and Elzubeir, 2012),
    교육 관리자들은 WFME 기준이 유용하다는 데 만장일치로 동의하였다.
    하지만 동시에 *“지역 맥락(local context)에 대한 명확성 및 적절성 확보”*의 필요성도 함께 제기되었다.
  • **산부인과 교육과정(curricula in obstetrics and gynecology)**을 강화하고자, Garofalo와 Aggarwal(2017)은 호주, 캐나다, 미국, 네덜란드, 영국의 교육과정을 비교 분석하였고, WFME 표준을 외부 평가 및 프로그램 간 비교의 기준틀로 사용하였다.

 

 

📌 WFME 표준을 **인증(accreditation)**에 활용한 사례

총 8편의 논문이 WFME 표준을 인증 과정에서 사용한 경험을 다루고 있다.

🌐 기존 인증기준과의 비교 사례 (3편)

  • **호주 의학교육위원회(Australian Medical Council, AMC)**는 자체 기준과 2003년판 WFME BME 표준을 비교하였다 (Simpson et al., 2005).
    ⟶ AMC는 **하나의 단일 필수 표준 세트(single mandatory set of standards)**만 사용한다는 점에서 큰 차이가 있었다.
    인증이 교육과정 검토를 촉진하고, 우수 사례를 다른 학교로 이전하는 기제로 작용함이 강조되었다.
  • **카리브해 의학교육 인증기관(CAAM-HP)**은 WFME BME 기준 및 WHO/WFME 가이드라인과 비교하여, 두 기준 모두 카리브해 지역 인증 시스템에 유용함을 보고하였다 (van Zanten et al., 2009).
  • 대만, 한국, 일본의 인증제도를 분석한 연구(Ho et al., 2017)는, 각 국가가 지역적 요구와 세계적 기준 사이의 균형을 추구했으며, LCME, GMC(영국 일반의료위원회), 또는 WFME의 기준을 템플릿으로 활용했음을 밝혔다.

🏥 인증 실행 사례 (5편)

  • 말레이시아에서는 WFME 기준에 부합하는 인증 기준이 도입되었고, 이를 준수하도록 정책적 장치가 마련되었다 (Shahabudin, 2005).
  • 우간다에서는 WFME 기준을 템플릿으로 사용하여 다양한 이해관계자의 참여와 합의 형성 기법을 통해 의견 일치(consensus)를 도출한 경험이 보고되었다 (Galukande et al., 2013).
    ⟶ 표준을 정의하는 것이 목표의 끝이 아니라, 의과대학이 지속적으로 개선해 나가도록 책임을 부여하는 도구로써 사용되어야 함을 강조하였다.
  • 중국의 BME 인증제도는 *WFME 서태평양 지역 의학교육 협회(AMEWPR)*의 협력으로 개발되었으며, **AMUCC(중국 의과대학 협회)**와 AMC(호주 의학교육위원회) 간 협력이 핵심이었다 (Geffen et al., 2014).
    호주 인증 프로토콜을 참고하였고, 중국의 상황에 맞게 WFME 기준을 약간 수정하여 기본 수준만을 채택하였다.
    ⟶ 인증 수행 방식에 있어 **신뢰 기반의 환경(milieu of mutual trust)**을 조성하는 것이 중요한 비형식적 요인으로 언급되었다.
  • 일본은 WFME 기준을 반영한 인증 기준 세트를 개발하여 도입하였다 (Yoshioka and Nara, 2013).
  • 오만의 술탄 카부스 대학교(Sultan Qaboos University) 의과대학은 2013년에 WFME BME 기준에 따라 인증을 받았으며,
    사전 준비, 자기 평가 보고서(self-studies), 학생·교직원·이해관계자의 적극적 참여 유도 등이 성공 요인으로 보고되었다 (Albarwani et al., 2014).

📌 WFME의 표준 설정 전략에 대한 분석 및 견해 (Analyses and views on standard setting strategy)

총 6편의 논문이 WFME의 표준 설정 접근 방식에 대한 분석과 견해를 담고 있다.

  • **Norcini & Banda (2011)**는 WFME와 LCME의 기준이 **구체적이지 않고(non-detailed), 규정 중심적이지 않다(non-prescriptive)**고 평가하였다.
    ⟶ 이러한 비규범적(non-prescriptive) 기준은 학교가 지역 사회의 건강 요구에 맞게 유연하게 적응할 수 있도록 도와준다고 주장하였다.
  • **van Zanten et al. (2012)**는 국제 전문가들에게 *전 세계 인증 기준의 중요도(필수, 중요하지만 필수는 아님, 중요하지 않음)*를 평가하도록 요청하였다.
    ⟶ 결과적으로 WFME 글로벌 표준에 포함된 14개 기준이 ‘필수(essential)’로 간주됨을 확인하였다.
  • **이란의 논문(Rezaeian et al., 2013)**은 WFME 기준이 전 세계 의료 전문가의 참여를 이끌어내어, 교육적 및 사회적 요구에 미치지 못하는 행정 중심 접근(administrative approaches)의 위험을 방지할 수 있다는 점에서 강력한 타당성을 가진다고 주장하였다.
  • **Tackett et al. (2015)**는 WFME 기준을 *투입(input), 과정(process), 산출(output), 성과(outcomes)*로 분류하고, 이를 **프로그램 논리 모형(programme logic model)**에 적용할 수 있다고 제안하였다.
    그러나 성과(Outcome) 기준이 상대적으로 부족하며, WFME 기준이 평가에 사용하기 어렵다는 점을 지적하였다.
    ⟶ 이는 *표현 방식(form)*의 문제 때문이라는 분석이다.
  • **Abdalla (2014)**는 WFME, LCME, AMC의 기준을 비교하여, 세 기관 모두 과정 기준(process standards) 중심이며, 성과 기준(outcome standards)은 거의 없고, 내용(content) 기준은 소수에 불과하다고 지적하였다.
    ⟶ 이는 **역량 기반 교육(competency-based education)**으로의 흐름과 상반되며, *사회적 책무성(social accountability)*도 충분히 반영되지 않았다는 비판을 제기하였다.
  • **Ebrahimi & Rezaee (2015)**는 WFME 기준 평가에 *지표(indicators)*를 도입하는 방식을 제안하였다.
  • **Hays (2014)**는 2003년판과 2012년 개정판 BME 기준을 비교 분석하였다.
    ⟶ 개정판에서는 기존의 질 향상 수준 기준이 기본 수준으로 강화되는 경향이 관찰되었다.
    ⟶ 그러나 더욱 상세해진 표준은 특히 개발도상국에서는 학교에 부담이 될 수 있다고 경고하였다. 또한, 주요 과목에서의 임상실습 시간 요구에 대해서도 우려를 표명하였다.

💬 논의 및 권고 사항 (Discussion and Recommendations)

발견된 논문의 수는 제한적이다. 그러나 이러한 수치는, 지난 수년간 전 세계 다양한 지역에서 WFME 표준이 실제로 활용되고 있으며 이에 대한 관심이 높다는 점을 충분히 반영하지 못한다. 따라서 WFME 표준의 사용에 대한 체계적인 분석(Systematic analyses)은 분명히 필요하다. 이번 연구는 WFME 글로벌 표준을 활용한 질 보장 및 질 향상 활동이 의미 있는 영향력을 발휘할 수 있다는 사실을 여러 사례를 통해 드러냈다. 전체적으로 보아, WFME 프로그램에 대한 관심은 널리 확산되고 있으며 점점 더 증가하고 있다.

 

표준의 유형, 내용, 표현 방식에 대해서는 다양한 견해가 존재하지만, 국제적으로 합의된 표준의 유용성 자체를 의심하는 논문은 전혀 없었다는 점은 주목할 만하다. WFME 표준은 주로 기초 의학교육(BME) 분야에서 의과대학 및 인증 기관에 의해 활용되었으며, 전공의 교육(PME) 및 **지속 전문성 개발(CPD)**에 대한 경험은 다소 제한적이다. 대부분의 논문은 모든 표준을 다루고 있으나, 일부는 교육과정(curriculum)이나 평가(assessment) 등 특정 주제에만 초점을 맞추고 있다. 또한 일부 연구에서는 **기본 표준(basic standards)**과 질 향상 표준(standards for quality development) 간의 구분이 관련성이 낮다고 판단되었다.

 

그러나 이러한 견해가 생긴 배경은 항상 명확하지는 않다. 이중 수준 구조는 본래 학교의 문화적, 자원적 배경과 관계없이 전 세계 모든 기관들이 표준을 활용하기 쉽도록 하기 위한 목적이었다. 또한 이는 __지속적인 질 향상(continuous quality development)__을 위한 **유인책(incentive)**으로 설계되었다. 예를 들어 Galukande et al. (2013)은 자원이 제한된 환경에서도 탁월함을 지향하는 데 있어 이러한 구분이 직관적으로 의미가 있다고 보고하였다.

 

WFME 표준의 9개 영역과 하위 영역으로 구성된 체계적 구조는 널리 받아들여졌으며, 실제로 교육 현장에서 유용하게 활용되고 있다. 또한 **주석(annotation)**의 존재는 국제적 해석의 일관성을 향상시키는 데 기여하였다.

 

초기부터 제기되었던 우려 중 하나는, 표준의 내용과 표현 방식에서 '서구적 편향(western bias)'이 있을 수 있다는 점이었다. 하지만 전 세계 전문가들과의 지속적인 소통을 통해 그러한 경향은 크지 않고, 어느 정도는 불가피하며, 받아들일 수 있는 수준이라는 인식이 자리잡고 있다.


📈 WFME 표준의 실질적 활용과 확장

WFME 표준은 국가 및 기관 수준에서의 프로그램 개발 기획에 적합한 프레임워크이자 지침으로 활용될 수 있음이 입증되었다. 이것은 새로운 프로그램의 구축뿐 아니라, 기존 프로그램의 개선 또는 특정 구성 요소(part of a program)의 개발에까지 적용될 수 있다. BME와 PME 모두에서 그 사례가 보고되었다.

 

WFME 표준은 타 보건의료 전문직의 교육 표준 개발에도 영향을 미쳤다.

  • 예를 들어, WHO는 2009년에 간호사 및 조산사 교육을 위한 표준을 발표했으며, 이는 WFME 모델에 영감을 받은 결과이다 (WHO, 2009).
  • Innes et al. (2016)은 카이로프랙틱 교육 위원회의 인증 기준과 WFME 기준을 비교하였다.
  • **ORPHEUS-AMSE-WFME(2012)**에서는 생의학 및 건강과학 분야의 박사과정(PhD) 교육을 위한 표준 개발에도 WFME 기준이 영향을 미쳤음을 보여준다.

🔍 평가와 인증에서의 WFME 기준의 역할

WFME 표준은 **자체 평가(institutional self-evaluation)**와 외부 평가(external evaluation) 모두에 활용되었으며, 여러 논문에서 이러한 평가 활동이 실제로 질 향상에 기여하고 있음이 입증되었다. 또한, 인증(accreditation) 과정에서 WFME 표준 또는 수정된 버전(adapted version)이 사용되었으며, 이는 교육 프로그램의 질에 긍정적 영향을 미침을 시사한다.


🌍 국제적으로 인정받는 인증이 의학교육의 품질 보장의 '골든 스탠다드(golden standard)'로 자리잡음

WFME 표준을 인증에 사용하는 것은 **WHO/WFME의 BME 인증 가이드라인(WHO/WFME 2005)**을 기반으로 하고 있다.
이 가이드라인은 WHO의 **인증 정책(WHO 2013, 2016)**의 기초가 되었으며, 이 정책은 다음과 같이 설명한다:

  • 국제적으로 인정받는 표준 제공기관으로 WFME, LCME(미국·캐나다), GMC(영국), AMC(호주)를 명시하고,
  • 모든 국가가 2020년까지 인증 체계를 구축해야 한다고 권고하였다.

이러한 인증의 필요성은 **세계의료규제기관협회(IAMRA, 2016)**와 **세계의사회(WMA, 2017)**에서도 지지하고 있다.

마지막으로, **미국의 ECFMG(Educational Commission for Foreign Medical Graduates)**에서 예고한 해외 의대 졸업생에 대한 인증 기준 강화 요구(ECFMG 2010) 역시 이러한 흐름의 일부로 주목할 필요가 있다.


📌 결론적으로, WFME 표준은 다양한 형태로 전 세계 의학교육 현장에 도입되고 실용화되고 있으며,
전문성과 유연성, 그리고 국제적 수용성은 앞으로도 지속적인 활용과 확산의 기반이 될 것으로 기대된다.


🌐 WFME 표준의 적용 확대를 위한 전략과 실천적 권고 (continued)

WFME는 국가 또는 지역의 적절하고 자율적인 인증(accreditation)을 촉진하기 위해, **FAIMER (Foundation for Advancement of International Medical Education and Research)**와 협력하여 **WFME 인정을 받을 수 있는 인증기관의 정책 및 절차(policy and procedure)**를 2014년에 개발하였다 (WFME, 2016).

📊 표준 설정 전략에 대한 분석

본 연구에 포함된 논문들은 WFME의 표준 설정 접근 방식을 분석하고 비교하며 성찰하였다.
단순한 기술적 언급부터 정교한 분석에 이르기까지 다양한 수준이 존재했으며, 다음과 같은 공통점을 보여주었다:

  • WFME와 LCME의 표준은 공통적으로 ‘비규정적(non-prescriptive)’이고 ‘비세부적(not detailed)’이라는 특징을 지닌다.
    ⟶ 이러한 특성은 지역적 요구에 따른 혁신과 적응을 가능하게 한다.

국제적으로 사용되는 표준은 일관되게 '과정 중심(process-oriented)'으로 작성되었으며, *결과(outcomes)*를 정의하거나 *최소 기준(minimum requirements)*을 제시하는 것을 목표로 하지 않았다. 따라서 **Abdalla(2014)**와 **Tackett et al.(2015)**가 지적한 성과 기준의 부족은 오히려 예상 가능한 결과이다.

 

이에 대해 Christensen et al. (2007)은 다음과 같이 주장하였다:

“의학교육과정 계획에서 결과(outcome)와 과정(content/process)을 분리하는 것은 인위적이다. 오히려 이 둘을 통합하는 포괄적 접근이 필요하다.”

 

정량적 요소(quantitative aspects)의 포함은 *선택 사항(option)*일 수는 있지만, 인증 평가에서는 현재 형태의 표준이 충족되는지를 분석하는 것만으로도 충분할 수 있다. ⟶ 즉, 대부분의 목적에서는 복잡한 평가 틀을 구축할 필요가 없다.

 

자원(resource)이 제한된 환경을 고려할 때, Tackett et al. (2015)이 제안한 *정교한 평가 방법(sophisticated evaluation methods)*이 항상 적절한 선택이라고 보기는 어렵다.

표준에는 '동등한 비중(equal weight)'이 존재하지 않는다는 것이 이 시스템의 기본 전제이며,
**지나치게 세분화(itemization)**되는 것도 경계해야 한다.


🧭 ‘사회적 책무성(social accountability)’의 문제에 대한 논쟁

Abdalla (2014)가 제기한 WFME 기준의 사회적 책무성 부족 주장에 대해, 일부에서는 이 개념이 너무 좁게 정의되었다는 반론이 있다. Lindgren & Karle (2011)는 다음과 같이 주장하였다:

WFME 표준의 전반에 걸쳐, 이미 사회적 대응성(social responsiveness)과 사회적 책무성의 개념은 내재되어 있다.

 

📌 __2015년 개정판 WFME 표준을 분석하면 이 점이 명확히 개선되었음__을 확인할 수 있다.


🔄 지역·국가·기관 수준의 적용과 수정 필요성

이번 연구에서 분석된 다양한 사례들에 기반하여, 다음과 같은 결론에 도달할 수 있다:

  • 의과대학 및 교육 당국은 WFME 표준을 활용하여 질 향상, 평가, 인증 활동에서 많은 혜택을 얻을 수 있다.
  • 2015년 개정판은 겉보기에는 더 복잡하고 시간 소모적으로 보일 수 있지만(Hays, 2014)
    실제로는 영역의 세분화, 명확한 주석(annotation), 구체적인 예시를 통해 활용 시 오히려 업무 부담을 줄여줄 수 있다.
  • Hays가 지적한 임상 실습 시간(clinical placement time) 요구에 대해서도,
    표준은 단지 ‘임상 훈련의 중요성’을 언급할 뿐이며 강제 규정이 아님을 명확히 해야 한다.
  • WFME 권고안(Karle et al., 2015)은 다음과 같은 점을 강조한다:
    “글로벌 표준은 지역, 국가, 기관의 필요와 우선순위에 따라 수정(modify)되거나 보완(supplement)되어야 한다.”
  • 일본의 인증 시스템은 WFME 표준의 철학을 채택했으며,
    중국의 새롭게 승인된 표준도 WFME 모델의 지역 맞춤형 수정(modification) 사례이다.
  • Ho et al. (2017)은 다음을 제안하였다:
    “글로벌 표준을 지역 맥락을 존중하면서도 국제적 기준에 부합하도록 개정하는 방법에 대한 더 많은 정보가 필요하다.”

✅ 최종 권고 (Recommendations)

본 연구에서 다룬 사례들은, WFME 표준이 어떻게 적용될 수 있는지에 대한 실제적인 경험을 제공하며,
그 성공적 활용에 대한 증거를 제시하고 있다.

다음은 전 세계 의과대학 및 교육기관을 위한 실천적 권고 사항이다:

  1. WFME 표준을 원래 의도대로 활용하라.
    ⟶ 현지 맥락에 민감하게 반응할 수 있도록 지역적 적응(local adaptations)과 구체화(specifications)를 병행하라.
  2. 의과대학 내부에 '질 문화(quality culture)'를 조성하라.
    ⟶ 교육기관이 질 향상 및 혁신에 대한 책임을 질 수 있어야 한다.
  3. 의과대학의 리더십 차원에서 정책적 지지와 지원을 확보하라.
  4. 모든 이해관계자(stakeholders)의 참여를 보장하라.
  5. 질 향상이 모든 활동의 공통된 목표임을 인식하고, 동료 간 연대(collegiality)와 상호 이해를 증진하라.

 

 

 

 

🧠 의학교육과 학습 분석(Learning Analytics), 어디까지 왔을까?

안녕하세요! 오늘은 제가 흥미롭게 읽은 논문 하나를 소개해보려고 해요.
바로 의학교육에서의 학습 분석(Learning Analytics)의 윤리적 고려사항에 관한 비판적 문헌고찰입니다.

이 글을 통해서,

  • 학습 분석이 의학교육에 어떤 방식으로 쓰이고 있는지,
  • 어떤 기대와 우려가 공존하고 있는지,
  • 우리가 앞으로 어떤 방향으로 나아가야 할지
    차분하게 함께 정리해보려고 해요.

🔍 학습 분석(Learning Analytics)이 뭐예요?

쉽게 말해, 학습 분석은 학습자의 활동 데이터를 수집하고 분석해서,
학습 성과를 향상시키거나 교육 프로그램을 개선하는 데 활용하는 방법이에요.

“Learning analytics is the measurement, collection, analysis and reporting of data about learners and their contexts, for purposes of understanding and optimizing learning and the environments in which it occurs.”
(The Society for Learning Analytics Research, 2023)

 

요즘은 빅데이터(Big Data) 기술과 접목되면서,
이런 학습 분석이 **의학교육(Medical Education)**에도 점점 더 많이 사용되고 있어요.


📈 의학교육에서 학습 분석이 어떻게 쓰이고 있을까?

논문에서는 학습 분석의 활용을 네 가지 큰 테마로 정리하고 있어요:

  1. 학습 과정과 교수법 분석 (Learning process and pedagogy)
    → 개별 학습자의 학습 패턴을 추적하고, 효과적인 학습 전략을 파악해요.
  2. 사후 평가 (Retrospective assessment)
    → 누가 어려움을 겪고 있는지, 누가 개입이 필요한지 확인할 수 있어요.
  3. 예측 평가 (Prospective assessment)
    → 학습자의 미래 성과나 졸업 시점까지 예측할 수 있어요.
  4. 교육 개선 (Educational improvement)
    → 교육 시스템 전체를 정밀하게 개선하는 데 도움을 줄 수 있어요.
    흔히 *정밀 교육(Precision Education)*이라고도 불려요!

⚖️ 그런데, 윤리적인 문제는 없을까?

있어요! 😥
연구진은 이 분야의 급속한 발전과 함께 **윤리적 함의(Ethical Implications)**를 반드시 짚고 넘어가야 한다고 강조해요.

논문에서 제시한 4가지 핵심 윤리 쟁점은 다음과 같아요:

1. 데이터의 신뢰성 (Trustworthiness of data)

  • 데이터에 편향이 들어갈 수 있어요.
  • 예: 설문 피로(survey fatigue), 평가자의 암묵적 편향 등

“Data collected through assessment systems often have implicit and hidden biases.”
(Cirigliano et al., 2017)

2. 방법론의 신뢰도 (Reliability of methodology)

  • 분석 도구나 알고리즘이 제대로 설계되지 않았다면, 엉뚱한 결론을 낼 수도 있어요.

“If the methodologies used to derive and evaluate learning algorithms are not sound, then the results generated from them may be inherently incorrect.”

3. 프라이버시와 데이터 관리 (Privacy, Confidentiality, and Management)

  • 학습자는 자신이 어떤 데이터를 제공하고 있는지, 누가 이 데이터를 보고 있는지 모르는 경우가 많아요.

“Learners are often not given autonomy over when and where they are assessed, how frequently they are assessed, or what results may occur as the consequences of assessment outcomes.”

4. 문제 학습자 낙인 (Labeling learners as “problematic”)

  • 알고리즘이 어떤 학습자를 ‘문제 있는 학습자’로 잘못 분류하면, 자기충족적 예언(self-fulfilling prophecy)이 될 수 있어요.

“Labeling learners as ‘problematic’... could lead to a feed-forward bias that negatively impact a student’s self-perceptions and hinder further development.”


🧭 우리가 지켜야 할 윤리 원칙들

연구진은 이 문제를 Beauchamp와 Childress의 생명윤리 4원칙에 따라 분석했어요:

  • Beneficence (선행) → 이익이 해를 넘어야 한다
  • Nonmaleficence (악행금지) → 해를 끼치지 말아야 한다
  • Autonomy (자율성) → 학습자의 자기결정권을 존중해야 한다
  • Justice (정의) → 혜택과 부담이 공정하게 분배되어야 한다

🌱 그럼에도 불구하고, 가능성은 충분해요!

학습 분석은 잘만 활용하면 의학교육을 정말 정밀하게 만들 수 있어요.

  • 도움이 필요한 학습자를 일찍 발견하고,
  • 우수 학습자에겐 더 많은 기회를 줄 수 있죠.

“That possibility, sometimes called precision education, could make medical education more effective and efficient.”
(Triola & Burk-Rafel, 2023)

 

또, 학습 분석을 통해 기존 시스템의 편향을 감지하고 수정하는 데도 활용할 수 있어요!

“Learning analytics and big data may provide mechanisms for identifying where biases exist in medical education.”


🧩 마무리하며…

이 논문은 우리에게 다음과 같은 메시지를 전해줘요:

“To successfully implement learning analytics in medical education, educators must use ethically informed decision-making processes as they craft new systems.”

👉 “윤리적으로 숙고된 의사결정”이 바로 핵심입니다.
앞으로 우리가 더 많은 데이터를 다룰수록, 이 원칙은 더욱 중요해질 거예요.

 


서론 (Introduction)

**학습 분석(Learning analytics)**은 학습자의 수행에 대한 교육 데이터를 *통계적 모델링(statistical modeling)*과 결합하여 의료교육(Medical Education) 분야에서 점점 더 많이 활용되고 있습니다 (ten Cate et al., 2020).

**학습 분석(Learning analytics)**이란 학습자 및 그들의 맥락에 관한 데이터를 측정(measurement), 수집(collection), 분석(analysis), *보고(reporting)*하는 것으로, 그 목적은 학습과 학습이 일어나는 환경을 이해하고 최적화하는 것입니다 (The Society for Learning Analytics Research, 2023).

 

_대용량의 복잡한 데이터(Big data)_는 학습 분석을 가능하게 하는 연료(fuel) 역할을 하며, 종종 학습자에게 제공되는 **개입(interventions)**과 **향상(improvements)**을 이끄는 데 사용됩니다 (Thoma et al., 2020). 이러한 접근 방식은 의학교육 시스템 전반을 개선할 수 있는 유망한 길을 제시하지만, 학습자에 대한 의사결정을 내릴 때 학습 분석이 가지는 윤리적 함의도 함께 고려해야 합니다 (ten Cate et al., 2020; Thoma et al., 2020).


대량의 학습자 데이터를 해석하는 개념은 새로운 것이 아닙니다. (Krumm et al., 2018) 지난 10년 동안, 교육자들은 의학교육 환경에서 데이터를 수집하고 분석하며 해석할 수 있는 가능성에 대해 지속적으로 언급해 왔습니다 (Chan et al., 2018; ten Cate et al., 2020). 데이터의 수집, 분석, 해석 활동을 통해 정보를 제공받을 수 있는 구체적인 교육 과정들은 다음과 같습니다:

  1. 학업 성취도 평가 (Assess academic progress),
  2. 미래 성과 예측 (Predict future performance),
  3. 피드백 및 개별 학습 계획으로 대응할 수 있는 잠재적 문제 파악 (Identify potential issues that could be addressed with feedback and individualized learning plans)
    (Consortium, 2011)

학습 분석이 기존의 교육 측정 혹은 데이터 마이닝(Data Mining)과 구별되는 점은, 개별 학습자의 진행 상황과 교육 시스템 전체에 대한 통찰을 제공하기 위해 학습자 데이터에 특별히 초점을 맞춘다는 것입니다.


학습 분석은 학습자의 경험과 성과를 향상시킬 수 있는 유망한 방법들을 제시합니다. 그러나 의학교육에서 더 많은 데이터가 수집되고 활용될수록, 우리는 그 사용 방식에 대해 비판적으로 사고하고 윤리적 고려를 강화할 필요가 있습니다. 예를 들어, 학습자에게서 수집된 데이터에는 *암묵적 편향(implicit biases)*이 포함될 수 있으며, 이러한 편향은 결과적으로 편향된 예측 알고리즘을 만들어낼 수 있습니다 (Baker & Hawn, 2021; Thoma et al., 2023). 또한 새로운 교육 개입을 설계하고 실행할 때에는, 그 개입의 결과가 어떻게 사용될 수 있는지에 대한 신중한 고려가 필요합니다.


예를 들어, 알고리즘이 특정 학습자가 일정 기준을 충족하지 못한다고 제안할 경우,

  • 그 학습자는 **보충 교육(remediation)**이 필요한 것인가?
  • 아니면 프로그램에서 퇴출되어야 하는가?
  • 학습자의 데이터가 다른 학습자와 비교되거나 교수자에게 시각화될 때, 그 학습자는 어떤 수준의 프라이버시 권리를 가질 수 있는가?

개별 학습자로부터 방대한 데이터를 수집하는 것이 표준이 되어가는 지금, 우리는 학습 분석을 윤리적이고 공정하게 사용하기 위한 고민을 반드시 해야 합니다.


이 논문에서는, 의학교육 내에서 학습 분석과 빅데이터의 활용을 비판적으로 고찰합니다.
특히, 이러한 방법들의 윤리적 사용에 대해 새롭게 제기되는 문제들을 다룬 문헌을 검토하고,
그 내용을 **Beauchamp와 Childress의 생명윤리 4원칙(Beauchamp & Childress, 2001)**을 기반으로 비판적으로 분석합니다.

 


방법 (Methods)

리뷰 프로토콜 (Review protocol)

이 비판적 문헌고찰(critical review)에 포함할 논문을 선정하기 위해, 우리는 PRISMA-ScR (Preferred Reporting Items for Systematic Reviews and Meta-analysis Extension for Scoping Reviews) 지침을 활용하였습니다 (Tricco et al., 2018).

PRISMA-ScR는 범위 고찰(scoping review)의 질과 투명성을 보장하기 위한 표준 가이드라인입니다.

 

이 리뷰에 포함되기 위해서는 다음 기준을 만족해야 했습니다:

  • 의학교육 내에서 학습 분석(learning analytics) 또는 **빅데이터(big data)**의 현재 혹은 제안된 활용을 다룰 것
  • 학습 분석 또는 빅데이터의 도입 및 구현 과정에서의 윤리적 고려사항 혹은 도전 과제를 언급할 것
  • 영어로 출판된 peer-reviewed 논문일 것

관련 문헌은 **MEDLINE (PubMed)**와 SocINDEX 데이터베이스를 통해 검색되었으며, 검색 시점은 데이터베이스 시작 시점부터 2021년 4월까지로 설정하였습니다.

 

검색어 (Search terms)

문헌 검색 전략은 미시간대학교(University of Michigan)의 전문 사서들과 협업하여 개발되었습니다. 초기 검색 전략은 한 명의 사서가 설계하였으며, 의학 주제어(MeSH, Medical Subject Headings) 및 관련 키워드를 활용하였습니다. 이후 팀 내 논의를 거쳐 반복적으로 개선되었고, 제2의 사서에 의해 peer review를 받았습니다. 최종 MEDLINE 검색 전략은 다음과 같습니다:

(“Education, Medical” [Mesh] OR “medical education” [tiab] OR “medical training” [tiab] OR “medical trainee” [tiab]
OR “medical trainees” [tiab] OR resident [tiab] OR residents [tiab] OR residency [tiab] OR
“medical students” [tiab] OR “medical student” [tiab] OR intern [tiab] OR interns [tiab]
OR fellow [tiab] OR fellows [tiab] OR fellowship [tiab] OR fellowships [tiab]
OR “Competency-Based Education“[Mesh] OR education [sh])
AND
(big data [mh] OR “big data” [tiab] OR “learning analytics” [tiab] OR “predictive analytics” [tiab])

 

동일한 키워드를 활용하여 **SocINDEX에서도 병렬 검색(parallel search)**이 수행되었습니다.


문헌 선정 기준 (Selection of sources of evidence)

다음 기준을 충족하는 논문을 포함시켰습니다:

  • 학부 또는 대학원 의학교육 내에서 학습 분석 또는 빅데이터를 언급
  • 활용 가능성, 구체적 도전 과제, 또는 의미 있는 시사점을 논의할 것

두 데이터베이스 간 중복 제거 후, 총 272편의 고유한 제목이 선별되었습니다. 제목과 초록을 기준으로 적합성 여부를 검토한 결과, 248편은 기준에 부합하지 않아 제외, 총 24편의 논문전문(full-text) 수준에서 검토하였습니다. 이 중 6편은 최종적으로 제외되었으며, 이는 Figure 1에 요약되어 있습니다.

 


데이터 차팅 과정 (Data charting process)

모든 저자와 함께 **데이터 추출 변수(data items)를 결정하기 위한 데이터 차팅 양식(data charting form)**을 개발하였습니다.

  • 두 명의 리뷰어(PY, MAM)가 독립적으로 데이터를 추출하고,
  • 그 결과를 **주연구자(BCG)**와 논의하였습니다.
  • 데이터 차팅 양식은 반복적(iterative) 과정에서 지속적으로 업데이트되었으며,
  • 의견 불일치는 합의(consensus)를 통해 해결하였습니다.

데이터 항목 (Data items)

두 명의 리뷰어가 각 논문으로부터 다음 항목을 독립적으로 추출하였습니다:

  • 출판 연도 (Publication year)
  • 제1저자와 교신저자의 소속 국가
  • 논문 유형 (예: 원저, 해설, 리뷰 등)
  • 의학교육에서 학습 분석 또는 빅데이터의 현재 및 제안된 활용 사례
  • 해당 활용에 대해 언급된 윤리적 함의(ethical implications)

결과 종합 (Synthesis of results)

  • **기초 통계(descriptive statistics)**를 이용하여 논문 특성을 요약하였습니다.
  • 이후, 논문들에서 학습 분석 및 빅데이터의 활용 방식과 윤리적 시사점에 관한 내용을 추출하였고,
  • 이를 분석하여 **공통된 패턴과 주제(theme)**를 도출하였습니다.

초기 분석 결과는 저자 전체에게 공유되어 피드백을 받고, 이를 바탕으로 두 번째 데이터 추출 및 코딩 과정을 수행, 그 결과 **더 정제된 주제 집합(smaller set of themes)**을 도출하였습니다. 최종적으로, 모든 저자들이 논의하여 주제를 반복적으로 수정 및 정제하였고, **합의(consensus)**에 도달하였습니다.

 


결과 (Results)

기술 통계 (Descriptive statistics)

검색을 통해 총 **272편의 고유한 논문 기록(unique records)**이 확인되었으며, 이 중 **18편의 전자본 논문(full-text articles)**이 최종 분석 대상으로 포함되었습니다.

  • 이 중 논평(commentary) 논문이 가장 많았으며 (n = 9, 50%),
  • 다음으로 원저(original research) 논문 (n = 7, 39%),
  • 리뷰(review) 논문 (n = 2, 11%) 순이었습니다. → 자세한 내용은 Table 1 참고

**제1저자(first author)**가 속한 국가는 다음과 같이 다양하였습니다:

  • 캐나다 (n = 7, 39%)
  • 사우디아라비아 (n = 3, 17%)
  • 미국 (n = 3, 17%)
  • 스웨덴 (n = 2, 11%)
  • 호주, 싱가포르, 영국 (각각 n = 1, 6%)

논문 출판 연도는 2013년 7월부터 2021년 4월까지이며, 가장 많은 논문이 출판된 연도는 2014년과 2018년으로 각각 **4편(22%)**이었습니다. 추출된 데이터는 의학교육에서의 학습 분석과 빅데이터의 활용 사례해당 활용에서의 윤리적 함의를 포함하며, _Table 2_에 요약되어 있습니다.

 


의학교육에서의 학습 분석 활용 (Use of learning analytics in medical education)

학습 분석과 빅데이터의 활용에 대해, 다음의 **4가지 주요 주제(theme)**가 도출되었습니다:

  1. 학습 과정 및 교수법 (Learning process and pedagogy)
  2. 사후 평가 (Retrospective assessment)
  3. 사전 평가 및 예측 (Prospective assessment, including prediction)
  4. 교육 개선 (Educational improvement)

1️⃣ 학습 과정 및 교수법

학습 분석과 빅데이터는 주로 개별 학습자의 학습 과정을 밝혀내는 데 활용되었습니다 (Chahine et al., 2018; Chan & Zary, 2019; 등). 또한, 다음과 같은 방식으로 활용됩니다:

  • 학습 패턴 분석 및 학습 참여도 추적 (Chan & Zary, 2019; Saqr, 2018 등)
  • 다양한 학습 방식의 효과성 이해
  • 학습자에게 적시의 피드백 제공

즉, 의학교육에서 학습 분석의 핵심적 용도→ 학습자의 수행을 추적하고, 학습 방법의 효과를 파악하며, 개인화된 피드백을 제공하는 것입니다.


2️⃣ 후향적 평가 (Retrospective assessment)

학습 분석은 또한 개별 학습자의 성과를 되돌아보는 데, 그리고 교육 프로그램의 질을 평가하는 데 활용됩니다 (Arora, 2018; Holmboe et al., 2020 등). 대표적인 활용 예는 다음과 같습니다:

  • 학습에 어려움을 겪는 학습자 식별 (struggling learners)
  • 조기 개입이 필요한 대상 파악
  • 개별 학습자의 역량 기반 데이터 제공, 이를 통해
    • 자동화된 점수 산정 (automated scoring)
    • 시간에 따른 학습자 발달 궤적 추적
    • 레지던트-환자 상호작용의 적절성 평가
    • 효과적인 학습 전략 분석 및 성과 통찰

3️⃣ 전향적 평가 및 예측 (Prospective assessment and prediction)

학습 분석은 학습자의 학업 및 임상 성과를 예측하는 데 유용하다고 여겨집니다 (Ellaway, 2013; Saqr, 2015, 2018 등).

주요 활용 방식은 다음과 같습니다:

  • 레지던트의 졸업 준비 상태 및 독립 진료 가능 시점 예측
  • 훈련 이후 실무(performance post training) 예측
    → 이는 교육 전반을 통합적으로 파악할 수 있게 해줍니다.

4️⃣ 교육 개선 (Educational improvement)

다수의 논문에서, 학습 분석과 빅데이터가 의학교육의 전반적인 개선에 중요한 역할을 한다고 언급했습니다 (Chan & Zary, 2019; Thoma et al., 2020 등). 특히 강조된 개념은 다음과 같습니다:

  • **정밀 교육(precision education)**의 실현 가능성
  • 개인화된 콘텐츠 제공
  • 학습자의 요구에 맞춘 지원 제공
  • 맞춤형 피드백 제공
  • 효율적인 개입을 통해 빠르게 대응하는 체계

다음 부분도 이어서 보내주시면 계속 번역해드리겠습니다.

 

네, 이어서 Ethical Considerations of Learning Analytics in Medical Education 섹션을 번역해 드리겠습니다. 학술성과 전문성을 유지하되, 중요한 윤리적 쟁점들을 강조해 명확하게 전달하겠습니다.


의학교육에서 학습 분석의 윤리적 고려사항

(Ethical Considerations of Learning Analytics in Medical Education)

의학교육에서 **학습 분석(learning analytics)**과 빅데이터(big data) 활용과 관련된 윤리적 고려사항을 검토한 결과, 다음과 같은 네 가지 핵심 주제가 도출되었습니다:

  1. 데이터의 신뢰성 (Trustworthiness of data)
  2. 방법론의 신뢰도 (Reliability of methodology)
  3. 프라이버시, 기밀성, 데이터 관리 (Privacy, confidentiality, and management of data)
  4. 학습자에 대한 문제 낙인(Labeling of learners as “problematic”)

1️⃣ 데이터의 신뢰성 (Trustworthiness of data)

의학교육에서 학습 분석을 적용할 때 가장 핵심적인 윤리적 우려 중 하나는, 학습자에 대해 수집된 데이터가 신뢰할 수 있는가에 관한 문제입니다 (Chan et al., 2018; Ellaway et al., 2014, 2019; Holmboe et al., 2020; Thoma et al., 2020).

  • 구체적으로는 데이터의 품질(quality), 대표성(representativeness), **정확성(precision)**이 주요 검토 대상이었습니다 (Ellaway et al., 2014).
  • 특히, **평가 시스템을 통해 수집된 데이터에는 암묵적 편향(implicit bias) 또는 숨겨진 편향(hidden bias)**이 포함될 수 있음이 지적되었습니다 (Cirigliano et al., 2017).
  • 학습자의 통제 밖에서 수집된 데이터그들의 실제 역량을 정확히 반영하지 못할 수 있다는 우려도 제기되었습니다 (Chahine et al., 2018).
  • 설문조사를 통한 데이터 수집은 종종 *응답 피로(survey fatigue)*로 인해 데이터의 강건성(robustness)이 약화될 수 있습니다 (Ellaway et al., 2019).
  • 일부 연구는 호손 효과(Hawthorne effect)—즉, 관찰되고 있다는 인식이 학습자의 행동을 변화시키는 현상—로 인해 데이터 신뢰성이 더 손상될 수 있다고 보고합니다 (Ellaway, 2013; Ellaway et al., 2014).

2️⃣ 방법론의 신뢰도 (Reliability of methodology)

두 번째 윤리적 고려사항은 데이터 분석에 사용되는 방법론의 신뢰성입니다 (Chan & Zary, 2019; Ellaway et al., 2014, 2019).

  • 여러 연구자들은 빅데이터 분석에서 '신호와 잡음'을 구분하는 어려움을 지적하였고, 이는 본질적인 한계로 작용할 수 있다고 우려했습니다 (Ellaway et al., 2019).
  • 특히 양적 분석을 통해 도출되는 상관관계나 패턴이 반드시 인과관계를 반영하지 않을 수 있음이 반복적으로 지적되었습니다 (Chan et al., 2018; Ellaway, 2013).

즉, 정교한 분석 기법을 적용하더라도, 그 결과를 맹신하는 것은 위험할 수 있으며 방법론적 타당성에 대한 지속적인 검토가 요구됩니다.


3️⃣ 프라이버시, 기밀성, 데이터 관리 (Privacy, Confidentiality, and Management of Data)

세 번째 주요 윤리 주제는 빅데이터의 수집 및 관리에서의 프라이버시와 기밀성 문제입니다 (Arora, 2018; Chan & Zary, 2019; Saqr, 2018 등).

  • 연구자들은 학습자에 대한 더 많은 정보를 추적하려는 시도가,
    예: 모바일 기기를 통한 위치 정보(geolocation) 수집
    학습자의 **자율성(autonomy)**과 프라이버시를 침해하는 것으로 간주될 수 있으며,
    그 결과 학습자와 기관 간의 신뢰 저하를 초래할 수 있다고 경고했습니다 (Arora, 2018; Ellaway et al., 2019).

데이터의 범위를 넓힐수록, 그 활용에 대한 정당성과 투명성을 확보하는 것이 더욱 중요해집니다.


4️⃣ 문제 낙인(Labeling of Learners as “Problematic”)

마지막으로, 많은 논문들이 학습 분석을 통해 학습자를 ‘문제 있는 학습자(problematic learner)’로 낙인찍는 위험성에 대해 우려를 표했습니다 (Chan et al., 2018; Ellaway, 2013; Holmboe et al., 2020).

  • 예를 들어, 어떤 학습자가 **“위험에 처한 훈련생(trainee-at-risk)”**으로 지정되면,
    이는 향후 교수자들의 기대와 행동에 영향을 주는 **피드포워드 편향(feed-forward bias)**을 일으킬 수 있습니다.
    → 결과적으로 학습자의 **자기 인식(self-perception)**을 훼손하고 개인 발달을 방해할 수 있습니다.

또한, 이러한 라벨이 잘못 부여되었을 경우,
그 이후에 어떤 일이 일어나는지에 대한 **경험적 근거(empirical evidence)**는 매우 부족하다는 점도 문제로 지적됩니다.

 


논의 (Discussion)

의학교육 내에서 **학습 분석(Learning Analytics)**은 다양한 유망한 응용 가능성을 가지고 있지만, 본 고찰은 학습자의 교육 경험을 더 잘 이해하고 개선하기 위한 목적으로 학습 분석을 적용할 때 발생할 수 있는 여러 가지 우려 사항들을 드러냅니다. 학습 분석은 개별화된 학습 계획과 맞춤형 경험을 제공함으로써 학습자의 의학교육을 증진시킬 잠재력이 있습니다. 그러나 이러한 도구를 학습자의 진전(progress)을 평가하거나 결정하는 데 사용할 경우, **의도치 않은 결과(unintended consequences)**가 초래될 수 있으며, 이는 빅데이터를 의학교육에 도입할 때 반드시 전면에 놓고 고민해야 할 요소입니다.


학습 분석의 윤리적 고려사항 요약

문헌 검색을 통해 다음과 같은 윤리적 고려사항이 학습 분석과 관련됨을 확인하였습니다:

  • 데이터의 신뢰성(trustworthiness)
  • 데이터를 수집·분석하는 방법론의 신뢰성(reliability of methodology)
  • 데이터 수집 및 공유와 관련된 프라이버시 문제(privacy concerns)
  • **학습 알고리즘 결과를 기반으로 학습자를 낙인(labeling)**하는 위험

이러한 고려사항은, 학습 분석이 의학교육을 변화시키고 개선할 수 있는 잠재력을 지니는 한편, 학습자에게 미칠 수 있는 결과를 신중하게 검토해야 함을 시사합니다. 특히, 학습자들은 보통 평가가 이루어지는 환경, 평가 도구의 선택, 평가 결과가 초래하는 결과에 대해 거의 통제권을 가지지 못하며, 이러한 맥락에서 학습 분석의 영향은 더욱 중요하게 다가옵니다.


🔎 Beauchamp & Childress의 생명윤리 원칙을 활용한 윤리적 분석

우리는 Beauchamp와 Childress의 의료 윤리 4원칙을 적용하여, 의학교육에서 학습 분석의 증가가 학습자에게 초래할 수 있는 윤리적 영향을 분석하였습니다 (Beauchamp, 2007; Beauchamp & Childress, 2001).
이 윤리적 틀은 환자 또는 연구 참여자와 같은 취약한 대상에 대한 생명윤리적 연구를 분석하는 데 기초를 제공하며,
이는 의학교육 시스템 내에서 학습자 및 그들의 환자에게 영향을 미치는 교육 개입의 평가에도 유용합니다.


선행의 원칙 (Beneficence)

“이익을 해보다 더 많이 제공하라”는 원칙

문헌에서는 학습 분석이 다음과 같은 긍정적 효과를 제공할 수 있음을 보여주고 있습니다:

  • 개별 학습자의 학습 패턴에 대한 통찰
  • 정밀하고 개인화된 학습 계획 수립
  • 교육 프로그램의 질 향상국가 단위 교육 시스템의 개선 가능성

이러한 이점들은 학습 분석을 옹호하는 데 있어 매우 강력한 근거가 됩니다.

하지만, 동시에 다음과 같은 **잠재적 해악(harms)**을 함께 고려해야 합니다:

  • 교육 데이터의 기밀성과 프라이버시 침해 가능성
  • 불완전하거나 잘못된 방법론에 기반한 개입
  • 오류 있는 알고리즘으로 인해 학습자를 잘못 분류하거나 낙인찍는 문제

따라서 이익과 위험 간의 균형을 신중히 평가해야 합니다.


악행 금지의 원칙 (Nonmaleficence)

“해를 끼치지 말라”는 원칙

본 고찰은 데이터 수집 방식, 분석 방법론, 내재된 편향 등과 관련된 다양한 우려를 보여주었습니다.
이러한 문제들은 교육 프로그램이나 시스템 수준의 결정뿐 아니라, 개별 학습자에게 직접적인 해악을 미칠 수 있습니다.

예를 들어:

  • 정량적 데이터 수집의 우선순위가 증가하면서,
    *근무 시간 준수(duty hour compliance)*처럼 측정 가능한 행동에만 집중될 수 있습니다.
    → 이는 의사소통(communication), 공감(compassion) 같은 정성적이고 측정 어려운 역량의 중요성을 희석시킬 수 있습니다.

또한,

  • 학습 분석을 통해 학습자를 ‘문제 있는 학습자’로 식별할 경우,
    이는 **자기충족적 예언(self-fulfilling prophecy)**을 불러올 수 있습니다.
    → 잘못된 예측에 의해 학습자는 자율성 감소, 환자 진료 기회 제한, 책임 부여 축소
    _임상 환경 내에서의 기회 상실_을 경험할 수 있습니다.

 

🤖 데이터와 알고리즘의 한계, 그리고 학습자에 대한 영향

학습자가 기대되는 진료 수준을 충족하지 못하는 경우 이를 식별하는 일은 중요하지만, 동시에 데이터셋과 알고리즘이 평가 결과에 영향을 주는 복잡한 맥락을 충분히 포착하지 못할 수도 있다는 사실을 인식하는 것도 매우 중요합니다.

예를 들어,

  • 한 번의 **저조한 수행(poor performance)**이 있었던 학습자가,
    그 단일한 결과가 포함된 데이터셋에 의해 향후 수련 평가에까지 부정적 영향을 받게 되는 것이 과연 정당한가?
  • 또는 **더 엄격한 평가자(strict rater)**에게 평가받은 학습자가,
    **관대한 평가자(lenient rater)**에게 평가받은 학습자보다 낮은 수행 능력을 가진 것으로 간주되는 것이 과연 타당한가?

이와 같은 질문은 의학교육에서 새로운 논점은 아니지만, 데이터 기반 알고리즘이 미래까지 학습자의 경로에 영향을 미치는 경우, 이러한 문제는 학습 분석을 본격 도입하기 전에 반드시 해결되어야 할 과제입니다.


🧭 자율성(Autonomy)과 학습 분석

학습 분석의 윤리적 고려사항은 누가 알고리즘의 결과를 해석하고 의사결정을 내리는가,
그리고 그 결정이 학습자에게 어떤 영향을 미치는가에 대한 문제와도 밀접하게 관련됩니다.

**자율성(Autonomy)**은 “스스로 결정할 수 있는 능력을 가진 사람의 선택을 존중해야 한다”는 윤리 원칙입니다 (Beauchamp & Childress, 2001).

 

본 비판적 문헌고찰에서는, 의학교육에서의 빅데이터 활용이 학습자의 프라이버시와 자율성을 위협할 수 있다는 우려가 강하게 제기되었습니다.

📌 학습자의 자율성이 위협받는 방식:

  • 학습자는 자신의 데이터가 언제, 어떻게 수집되고, 누가 접근 권한을 가지며, 어떻게 사용되는지조차 알지 못하는 경우가 많음
  • 평가가 이루어지는 시간, 장소, 빈도에 대한 통제권이 없음
  • 자신의 성과(performance data)에 누가 접근할 수 있는지, 어떤 데이터가 공유되고, 그 데이터가 어떤 방식으로 미래 의사결정에 사용되는지에 대해 거의 영향력을 행사하지 못함

예를 들어, 특정 평가에서 **불만족스러운 결과(unsatisfactory performance)**를 받은 학습자가,
그 한 번의 결과로 인해 향후 환자 진료나 기술 습득 기회를 배제당할 수 있습니다.

  • 이러한 상황에서, 학습자는 데이터 수집 시점, 사용 방식, 평가 기준 결정 과정에 대한 통제권이 거의 없으며,
  • 결과적으로 알고리즘의 출력 결과에 의해 부당하게 불이익을 받을 위험이 있습니다.
  • 즉, 학습자는 스스로의 오류를 설명하거나 정정할 기회를 갖지 못하는 취약한 입장에 놓이게 됩니다.

따라서, 학습 분석의 활용은 반드시 학습자와 함께(co-produce) **데이터 활용의 규칙과 거버넌스 구조(governance structure)**를 공동 설계해야 합니다 (Thoma et al., 2021).


⚖️ 정의(Justice)와 학습 분석

학습 분석의 또 다른 윤리적 논점은 **정의의 원칙(principle of justice)**과 관련되어 있습니다.

**정의(Justice)**는 “이익, 위험, 비용이 적절하고 공정하게 분배되어야 한다”는 윤리 원칙입니다 (Beauchamp & Childress, 2001).

 

그러나 **신뢰할 수 없는 데이터(untrustworthy data)**를 바탕으로 학습 분석을 수행할 경우, **의학교육 내에 이미 존재하는 편향(bias)**을 **오히려 영속화(perpetuate)**할 수 있습니다.

예시:

  • **성별이나 인종에 대한 암묵적 편향(implicit bias)**이 포함된 평가 데이터를 알고리즘에 학습시키는 경우,
    → 이 알고리즘은 **실제 역량을 반영하지 못하는 추천 결과(recommendations)**를 생성할 수 있음

따라서, 데이터에 포함된 편향의 원인을 식별하고, 이를 보정할 수 있는 메커니즘을 개발하는 것
의학교육에서 학습 분석의 윤리적 사용을 보장하기 위한 핵심 전제입니다.

 


🧪 학습 분석 결과의 타당성과 신뢰도 문제

학습 분석의 또 다른 문제는, 대규모 데이터셋으로부터 도출된 결과가 실제로 타당(valid)하고 신뢰할 수 있는(reliable) 것인가입니다.
→ 만약 학습 알고리즘을 도출하거나 평가하는 방법론이 견고하지 않다면, 그 알고리즘이 산출하는 결과 자체가 본질적으로 오류가 있을 수 있습니다.

이로 인해 특히 영향을 받을 수 있는 집단은 다음과 같습니다:

  • 사회적 소수자(marginalized) 또는 불리한 조건에 놓인(disadvantaged) 학습자
  • 규모가 작거나, 편향되거나 잘못된 방법론을 식별할 전문성이 부족한 교육 프로그램에 속한 학습자

이러한 집단은 부적절하게 설계된 알고리즘으로부터 더 큰 부담을 받을 가능성이 있습니다.


🌐 학습 분석의 잠재력과 교육 혁신

그럼에도 불구하고, 우리는 학습 분석과 빅데이터가 의학교육을 혁신할 수 있는 잠재력을 지닌다는 사실을 잊어서는 안 됩니다.

이러한 가능성은 때때로 **정밀 교육(precision education)**이라고 불리며, 의학교육을 보다 효율적이고 효과적으로 만들 수 있는 방향성을 제시합니다 (Triola & Burk-Rafel, 2023).

 

예를 들어,

  • 학습에 어려움을 겪는 학습자를 조기에 식별하고, 적시에 보충 교육(remediation) 기회를 제공
  • 우수 학습자에게는 보다 이른 시기에 자율적인 실습 기회를 제공 (Kuchera et al., 2023)

이러한 변화는

  • 의학교육의 질 향상,
  • 보다 잘 훈련된 의사 배출,
  • 궁극적으로는 **환자 치료 성과 향상(patient outcomes)**이라는 의학교육의 궁극적 목표로 이어질 수 있습니다.

🧩 학습 분석을 활용한 교육 격차 및 편향 분석

학습 분석은 또한 개별 학습자 수준과 교육 프로그램 수준의 훈련 격차를 식별하는 데 활용될 수 있습니다.
이를 통해 교육자와 정책 입안자 모두가 혁신적 방향성을 설계하고 평가할 수 있는 근거를 확보할 수 있습니다.

또한, 교육 프로그램의 성과를 시간에 따라 모니터링하고 책임성을 확보하는 도구로도 활용될 수 있습니다.

비록 본 고찰은 학습 분석이 기존 평가 시스템의 편향을 영속화할 수 있다는 우려를 드러냈지만,
반대로 그 편향의 근원을 식별하고 개선하는 도구로도 활용될 수 있음을 보여줍니다.

 

예를 들어:

  • 평가 데이터를 수집함으로써 어떤 시스템적 편향이 존재하는지 탐색하고,
  • **조정 전략(mitigation strategies)**을 개발하여 학습자를 보호할 수 있습니다.

이를 위해서는 편향을 탐지하고 감시할 수 있는 알고리즘 설계가 필요하며,
윤리적 관점에서 체계적으로 기획된 학습 분석은
→ **이미 존재하는 체계적 해악(systematic harms)**을 줄이고 학습을 향상시키는 잠재력을 지닙니다.


📊 학습 분석의 윤리적 구현을 위한 노력의 필요성

의학교육에서 학습자에 대한 교육 데이터 수집이 점차 증가함에 따라, 정교한 학습 분석 기법의 활용은 곧 표준이 될 것입니다.

본 고찰은 다음의 점을 강조합니다:

  • 학습 분석이 윤리적으로 개발되고 실행되도록 하기 위한 자원과 노력의 필요성
  • 학습자에게 가해질 수 있는 이익과 위험을 면밀히 평가할 수 있는 윤리적 판단 체계의 구축 필요성

이러한 윤리적 균형(ethical calculus)을 면밀히 고려하는 것은 연구자와 교육자 모두의 책임입니다.


📉 연구의 한계 (Limitations)

  • 본 고찰에 포함된 논문 수는 상대적으로 적었습니다.
    이는 의학교육에서의 학습 분석과 그 윤리적 함의라는 주제가 **아직 신생 분야(emerging field)**이기 때문입니다.
  • 일반적인 학습 분석에 대한 연구는 풍부하지만,
    의학교육 맥락에서 윤리적 함의를 명시적으로 다룬 논문은 극히 드뭅니다.
  • 이로 인해, 실제 존재하는 윤리적 문제들 중 본 고찰에서 다루지 못한 부분도 있을 수 있습니다.
  • 또한, 검토된 논문 중 다수가 동일한 저자나 연구 그룹에 의해 작성되었으며,
    → 이는 특정 관점이나 편향이 과도하게 반영되었을 가능성을 내포합니다.

향후 다양한 집단과 교육 환경을 반영한 연구가 이러한 한계를 극복하는 데 기여할 것입니다.


🔚 결론 (Conclusion)

의학교육에서 학습 분석의 활용이 증가함에 따라, 학습자에게 미칠 윤리적 함의를 신중하게 고려하는 것이 중요합니다.

  • 학습 분석은 의학교육에 여러 가지 유망한 이점을 제공할 수 있으나,
  • 동시에 학습자에게 해를 미칠 수 있는 가능성도 함께 내포하고 있습니다.

의학교육에서 학습 분석을 성공적으로 구현하기 위해서는, 윤리적 판단에 기반한 의사결정 과정을 통해 새로운 시스템을 설계해야 합니다.

 

 

 

Marcotte, K., Yang, P., Millis, M. A., Vercler, C. J., Sebok-Syer, S. S., Krumm, A. E., & George, B. C. (2025). Ethical considerations of using learning analytics in medical education: a critical review. Advances in Health Sciences Education, 1-15.


🎓 의대 어디 나왔냐고요? 면허시험 성적엔 큰 영향 없어요!

“어느 의과대학을 다녔느냐”가 의사 면허시험 성적에 얼마나 영향을 줄까요?
이 질문은 오랫동안 의학교육계에서 제기되어온 이슈인데요,
최근 캐나다 온타리오주의 6개 의대 데이터를 분석한 대규모 연구가 흥미로운 답을 내놨어요. 📊

 

연구진은 총 1,700여 명의 학생 데이터를 분석해 의대 소속, 입학 성적, 임상실습 성과, OSCE 점수, 그리고 가정의학 전공 여부까지 다양한 변수를 살펴봤어요.

 

결과는?
✅ **면허시험 성적(MCCQE1, MCCQE2)**에 가장 큰 영향을 준 건
👉 개인의 임상실습 성과와 기존 학업 성적이었어요.
어느 의대를 나왔는지(학교 소속)는 성적에 미치는 영향이 매우 작았고,
전체 점수 분산의 4% 미만만 설명했어요.
✅ MCCQE2에서는 가정의학 레지던시 여부가 성적에 의미 있는 영향을 줬다는 점도 흥미롭죠.

 

이 연구는 의학교육자들에게 이런 메시지를 줍니다:

“의대 교육은 서로 다를 수 있지만, 결과적으로 학생 개개인의 준비가 더 중요하다.”
“그러니 교육과정을 지역사회나 학생 맞춤형으로 자유롭게 구성해도 괜찮다!”

 

물론 이 결과가 의대 간의 모든 차이가 무의미하다는 뜻은 아니에요.
숨은 교육과정이나 문화적 차이는 아직 더 깊은 연구가 필요한 영역이니까요. 🤔

 

하지만 하나는 분명해요—
📌 학생 스스로의 노력과 성장이 결국 면허시험 성과를 만든다!


 

서론 (Introduction)

의학교육의 질을 이해하고 향상시키기 위해서는 교육 실천이 향후 학습 성과에 미치는 영향을 살펴보는 것이 도움이 될 수 있다. 예를 들어, **평가(assessment)**의 모범 사례(best practices)는 **어떤 형태의 학습자 평가(student appraisal)**가 **향후 중요한 성과(performance)**와 어떻게 연관되어 있는지를 연구함으로써 탐색된다. 이러한 연구는 **평가의 타당성(validity of assessments)**에 대한 근거를 제공하며, 의과대학이 **위험군 학습자(at-risk learners)**를 식별하고 **교육과정에 대한 정보에 기반한 결정(curriculum decisions)**을 내리는 데 도움을 준다.

 

대표적인 사례로는 **면허시험 결과(licensing outcomes)**에 관한 연구들이 있다. 캐나다(Canadian) 맥락에서, 의과대학 입학(admissions) 정보(Eva et al., 2012)와 평가 자료(assessment data) (예: Blake et al., 1996)는 캐나다의사자격시험(MCCQE1 및 MCCQE2) 성과긍정적인 상관관계를 보였으며, 이는 다시 **향후 의사로서의 진료 행태(physician practice behaviours)****환자 불만(patient complaints)**을 예측하는 데 유의미한 것으로 나타났다(De Champlain et al., 2021; Wenghofer & Boulet, 2022; Tamblyn et al., 2007).

 

의학교육에서 지속적으로 제기되는 질문 중 하나는 다음과 같다:

"향후 학습 성과(future learning outcomes)는 학습자 개인의 능력(trainee’s own abilities)과 교육 프로그램 및 학습 환경(training program and learning environment)의 영향 중 어느 것과 더 관련이 있는가?"

 

이 질문은, 자신의 **적성(aptitudes)**과 **교육 기회(educational opportunities)**가 어떻게 미래를 형성하는지를 알고자 하는 학습자들에게 매우 중요하다. 또한, 의학교육 리더와 교육자들에게는 이 질문이 교육과정 자원 배분(curriculum resourcing), 학습 지원(learning support), **선발 시스템(selection systems)**에 관한 정책 결정을 안내하는 데 중요한 역할을 한다. 리더들은 또한 더 나은 학습 성과를 보이는 학교나 프로그램의 특성을 벤치마킹하고자 할 수 있다.

 

그러나 이런 중요한 질문들은 쉽게 답할 수 없다. 왜냐하면 어느 의과대학에 진학하느냐에 따라 교육 경험이 크게 달라질 수 있으며, 그 폭은 측정하기 어렵기 때문이다.

  • 같은 인증(accreditation)규제 체계(regulatory regimes) 하에 운영되더라도, 학교 간 **교육 실천(educational practices)**은 상당히 다를 수 있다.
  • **공통 역량 프레임워크(competency frameworks)**훈련 기간(length of training), 입학 기준(admissions criteria), 기관의 사회적 책무(social accountability mandates)중요한 차이점들을 가릴 수 있다.
  • 더 나아가, 각 학교는 문제 중심 학습(problem-based learning)전통적 강의 중심 교수법(traditional didactic instruction), 프로그램 기반 평가(programmatic assessment)총괄 평가(summative assessment)**서로 다른 교육 패러다임(educational paradigms)**을 채택할 수 있다.

이러한 교육과정(curricula), 평가(assessment) 및 기타 실천의 차이는 지역 교육 문화(local educational culture), 이해관계자의 책무(stakeholder accountability), 이용 가능한 자원(available resources) 등에 따라 형성된다. 이와 같은 **다양성(variability)**은 분명히 학습자의 경험에 영향을 미치지만, 그 다양성이 향후 성과에 어떤 영향을 미치는지는 아직 명확하지 않다.


 

학부 교육기관의 영향에 대한 연구들

학부 수준의 의학교육 기관이 향후 성과에 미치는 영향을 개인의 성취와 비교하여 명시적으로 분석한 연구는 극히 드물다.
이는 무엇보다도 공통되면서도 엄밀한 비교 지표를 찾는 데 따르는 방법론적 어려움(methodological challenges) 때문이며, 또 하나는 이 질문이 정치적으로 민감한 성격을 띠고 있기(politically sensitive) 때문이다.

No dean or educational leader wants to be seen as graduating learners who perform worse than those from other institutions.
어느 학장이나 교육 리더도 자교 졸업생이 타 학교 출신보다 성과가 낮다고 평가받는 상황을 원치 않기 때문이다.

 

그럼에도 불구하고 몇 가지 주목할 만한 **참고 지점(reference points)**이 있다.

  • Hecker와 Violato는 2008년과 2009년, 미국 내 116개 의과대학의 9,000명 이상의 학생 데이터를 분석한 대규모 연구에서, **정규 교육과정 접근법(formal curricular approaches)**이 미국의사자격시험(USMLE) 성과에 어떤 영향을 미쳤는지를 조사했다.
  • 이들의 연구는 **교육과정 간의 차이가 시험 성과에 미치는 영향은 매우 미미하였으며, 설명력은 1% 미만(< 1% of the variance)**이었다고 결론지었다(Kumar et al., 2003도 같은 결론).

최근에는 교육과정 구조 이외의 요인들, 예를 들어

  • 교수-학생 비율(faculty-student ratios),
  • 연구비 수주(grant funding),
  • 졸업생 집단의 사전 학업 성과(prior academic performance) 등을 포함한 USMLE 데이터 분석이 수행되고 있다.

이러한 연구들은 다음과 같은 의미 있는 영향 요인을 확인하였다 (Burk-Rafel et al., 2019; Ghaffari et al., 2019):

  • 의과대학 그 자체(medical school),
  • 표준화된 입학시험 성과(standardized admissions tests),
  • 1인당 교수 연구비 수주(per capita faculty grant capture) 등.

영국의 경우, McManus 등(2020)은 다음과 같은 요소들이 학교마다 **미래의 진로 선택(future career choices)**에 크게 상이한 영향을 미친다는 점을 밝혔다:

  • 전문과목 교수법(specialist teaching),
  • 입학 기준(admissions),
  • 교육과정 구조(curriculum structure),
  • 학업 및 전문성 차원의 어려움(academic and professional difficulty)
    (관련 연구: Wakeford et al., 1993).

이와 같은 **학교별 차이(school-based differences)**는 영국 내 다른 연구들에서도 반복적으로 확인되었으며, 예를 들어:

  • **Ellis et al. (2021), Brennan et al. (2022)**는 의과대학의 평가 성과가 외과 분야의 *전문의 자격시험 성과(specialty certification examination performance)*를 예측함을 보고했다.
  • 입학시험 성과(admissions performance) 자체만으로도 전문과 시험 결과를 의미 있게 예측할 수 있음이 드러났다(Ellis et al., 2022).

의과대학 간 성과 차이의 원인

의과대학 간 성과 차이에 대한 원인은 여전히 논쟁의 대상이다. 다음과 같은 다양한 요인이 제시된다:

  • 교육과정의 차이(curricular differences) (Koh et al., 2008),
  • 입학 시스템의 질(quality of admissions processes) (Patterson et al., 2016, 2018),
  • 또는 각 학교가 끌어들이는 학생군의 특성(contextual factors, e.g., the nature of trainees attracted by different schools) 등.

이러한 **격차(disparity)**는 다음 사실을 부각시킨다:

"의과대학이 학습 성과에 미치는 영향을 다룰 때, 그 복잡성을 간과해서는 안 된다."

 

오직 하나의 독립 변수(예: 소속 의과대학, 또는 교육과정 유형)에만 초점을 맞추면, **면허시험 성과(licensing performance)**처럼 상대적으로 잘 알려진 결과가 어떻게 다양한 방식으로 영향을 받을 수 있는지를 가릴 수 있다.

  • 대규모 국가 연구조차도, 의과대학 내에서의 학생 성취(achievement) 및 **성과(performance)**에 대한 세부 자료 부족으로 인해 제한된다.

교육과정 선택이 면허시험 성과에 미치는 영향

면허시험 성과에 영향을 미치는 요인은 다양하나, 이는 대개 **학생 개인의 차이(individual student variance)**로 이해되며, 그럼에도 불구하고 **학교 차원의 교육과정 선택(curriculum choices at the school level)**에 의해 간접적으로 영향을 받을 수 있다(Jeyaraju et al., 2023).

예를 들어,

  • **평가 체계(program of assessment)**가 학습자를 어떻게 준비시키는지,
  • 해당 평가가 면허시험 기대치와 얼마나 정렬되어 있는지는 핵심 요인이다.

그러나 이전 연구들은 종종 다음과 같은 이유로 인해 이러한 요인을 드러내지 못했다:

  • **의과대학 내 평가 실천(assessment practices)**과
  • **평가 성과(performance)**에 대한 데이터 부족(lack of data) (Jeyaraju et al., 2023; Blake et al., 1996).

교육 선택(educational choices)이 면허시험에 어떤 영향을 미치는지를 철저히 검토하기 위해서는, 단순히 대규모 데이터뿐 아니라,

**학교 단위의 세부 변수(detailed school-level variables)**를 여러 기관 간에 비교 가능한 방식으로 확보해야 한다.

 


현재 연구 (The current study)

대부분의 의과대학 교육 실천을 다룬 연구는 단일 기관의 데이터를 기반으로 한다. 이러한 연구들은 강력한 내적 타당성을 지니지만, **여러 기관 간의 교육 연속선(training continuum)**을 아우르는 **데이터 공유(collaborative data sharing)**는

**일반화 가능성(generalizability)**과 **연구의 영향력(impact)**을 높이는 데 기여할 수 있다.

 

**다기관 분석(multi-institution analyses)**을 통해

  • **프로그램 내에서의 평가 도구와 학생 성과(student performance)**가
  • **면허시험 성과(licensing outcomes)**를 어떻게 예측하는지를 밝히는 연구는,
    **더 넓은 실천 영역을 안내할 수 있는 귀중한 통찰(insights)**을 제공할 수 있다.

이러한 접근은 최근 의학교육 분야에서 점점 더 중요해지고 있으며,

  • 데이터 공유의 필요성에 대한 요구 증가(data sharing calls) (Chahine et al., 2018; Ellaway et al., 2014; Grierson et al., 2023; Kulasegaram et al., 2024)
  • 그리고 그 적용 사례(application examples) (Jerant et al., 2019; Grierson et al., 2017)들이 등장하고 있다.

👉 이와 같은 연구 접근은 분석의 통계적 파워를 높이고,
**학교 간 차이 또는 유사성(school differences or similarities)**이 **모범 사례(best practices)**를 어떻게 형성하는지를 보다 깊이 이해할 수 있게 해준다.


이 연구는 **온타리오 주의 6개 의과대학에서 수집한 데이터를 분석한 다기관 연구(multi-institution study)**로,
의과대학 간 차이가 캐나다 온타리오 지역 의대생의 면허시험 성과에 어떤 영향을 미치는지를 규명하고자 하였다.

이 연구는 **Ontario Medical Schools Outcomes Research Consortium (OMSORC)**에서 수행한 또 다른 연구와 연계되어 있으며, OMSORC는 다음의 여섯 개 의대(MD 프로그램)가 참여하는 협업체이다:

  • McMaster University
  • Northern Ontario School of Medicine
  • Queen’s University
  • University of Ottawa
  • University of Toronto
  • Western University

그리고

  • Medical Council of Canada (MCC)
  • **Canadian Resident Matching Service (CaRMS)**도 파트너로 참여하였다 (Chahine et al., 2024).

이 다면적 연구는 다음을 규명하고자 하였다:

  • **세 개 학년(cohorts)**에 걸쳐
  • 여섯 학교의 학습자들을 대상으로
  • MCCQE1 및 MCCQE2 성과를 예측하는
  • **공통 및 고유 요인(common and unique predictors)**을 분석.

왜 면허시험(MCCQE1 & MCCQE2)이 중요한가?

  • 면허시험은 학습자가 독립적인 진료를 시작할 수 있는지를 결정짓는 핵심 자료이다.
  • 따라서, **의과대학의 교육과정(curriculum)**은 이 고위험(high-stakes) 시험을 충분히 준비시킬 수 있어야 한다.

또한, MCCQE1 및 MCCQE2 성과는 다음과 같은 **임상 현장 기반 결과(in-practice outcomes)**와도 상관관계가 있음이 입증되었다:

  • 처방 패턴(prescription patterns) (Tamblyn et al., 2007)
  • 환자 불만(patient complaints) (De Champlain et al., 2020; Wenghofer et al., 2022)
  • 입원율(hospitalization rates) (Norcini et al., 2023)
  • 예방의학 실천(preventive medicine practices) (Tamblyn et al., 2007)

👉 이 결과는 타 국가의 연구들과도 일치하며, **면허시험과 인증시험의 타당도(validity evidence)**를 뒷받침한다 (예: Norcini et al., 2014).


이 연구의 독창성

다른 나라(예: UKMED)에서는 오랫동안 훨씬 더 큰 규모의 데이터셋을 기반으로 유사한 질문을 다루어 왔다. 
그러나 이 연구는 다수의 캐나다 의학교육 기관에서 수집한 다양한 평가 지표와 성과 간의 연관성을 분석했다는 점에서 **독창적(novel)**이다.

"이 정도의 범위와 깊이(depth and breadth)로 데이터가 공유된 사례는 지금까지 없었다."

 

여러 기관의 데이터를 결합함으로써:

  • 훨씬 더 큰 데이터셋을 기반으로
  • 모범 사례(best practices) 도출,
  • 의학교육 프로그램에 대한 인사이트 제공이라는 목적을 달성할 수 있었다.

이 연구는 의과대학 입학부터 졸업, 그리고 그 이후까지의 정보를 포함한 캐나다형 다기관 데이터 공유 협업의 실현 사례로,

  • 빅데이터 기반 연구의 가능성을 제시하는 동시에,
  • 이 접근이 지닌 다양한 제약 요인도 부각시킨다.

예:

  • 학습자 개인 정보 보호(confidentiality),
  • 참여 기관의 평판 및 평가 보안 보호(reputation and assessment security) 등이 그것이다.

👉 그럼에도 불구하고, 이 연구는 상대적으로 작은 규모임에도 불구하고,
의학교육에서 "큰 질문(big questions)"에 답하기 위한 데이터 공유 문화 변화중요한 성취라고 할 수 있다.


이 논문의 위치

이 논문은 OMSORC의 첫 번째 연구(Chahine et al., 2024)를 기반으로 한다.
당시 연구는 여섯 개 MD 프로그램 전체에 걸쳐 MCCQE1 성과의 공통 및 고유 예측 요인을 규명했다.

이번 **2차 데이터 분석(secondary data analysis)**은 그 연구를 기반으로

**의과대학 소속(school membership)**이 면허시험 성과에 미치는 영향을 다른 예측 요인과 비교하여 정량적으로 분석하였다.


 

방법 (Methods)

연구 설계

본 연구는 **OMSORC의 주요 연구 프로젝트의 일환으로 수행된 2차 자료 분석 연구(secondary data analysis)**이다.


연구 대상 (Population)

이 연구의 대상은 다음 여섯 개 **온타리오 주 의과대학(Ontario medical schools)**의

  • **2015년, 2016년, 2017년 졸업 학년(cohorts)**으로서,
  • 그 해당 연도에 MCCQE1을 처음으로 응시한 졸업생들이다.

참여 대학:

  • McMaster University
  • Northern Ontario School of Medicine
  • Queen’s University
  • University of Ottawa
  • University of Toronto
  • Western University

이들 중 일부는 MCCQE2에도 응시하였으며, 해당 응시자들도 별도로 분석에 포함되었다.

데이터셋 구축을 위해 다음과 같은 절차가 적용되었다:

  • **학교 소속을 비식별화 및 블라인딩(blinding)**한 후,
  • **각 학교에서 무작위로 유사한 수의 학생들(equal random samples)**을 추출하여
  • 분석에 사용될 데이터셋을 구성하였다.

총 표본 수

  • MCCQE1: n = 1,112
  • MCCQE2: n = 616

 

👉 이렇게 무작위 하위 집단을 추출한 이유는 학교 간 졸업생 수 차이로 인해 학교 식별이 가능해지는 것을 방지하기 위해서였다.


예측 변수 (Predictors)

본 연구에서 사용된 **잠재적 예측 변수(potential predictors)**는 Table 1에 제시되어 있으며,
이들 변수는 모든 학교에서 공통적으로 확보 가능한 변수였다.

  • 일부 변수는 **학교 간 동일한 척도로 표현되도록 변환(transformed)**되었으며,
  • 변수 및 변환 과정에 대한 상세한 설명은 Chahine 외(2024)의 논문(동호 출간)에서 제공된다.

변수의 세 가지 범주 (Three classes of variables)

  1. 사회인구통계학적 변수 (Sociodemographic variables)
    • 예: 나이(age), 성별(sex), 고등학교 시기 거주지의 소득 분위수(neighbourhood income quintile)
  2. 입학 성과 (Admissions performance)
    • 예: 학부 GPA (undergraduate GPA)
  3. 평가 성과 (Assessment performance)
    • 예:
      • 기초의학 교육 기간 동안의 집계 성적(aggregated biomedical knowledge grades)
      • 객관적 구조화 임상평가(Objective Structured Clinical Examination, OSCE) 결과
      • 6개 공통 임상실습 과목에 대한 집계 성적(aggregated clerkship grades)

공통 임상실습 과목 6개:
외과(Surgery), 정신과(Psychiatry), 소아과(Pediatrics), 가정의학(Family Medicine), 산부인과(Obstetrics and Gynecology), 내과(Medicine)

  • 이미 **공통 척도에 기반하거나 범주형(categorical)**으로 되어 있는 변수는 변환하지 않음.
  • 하지만 다음과 같은 **성적 관련 지표(grade metrics)**는 **각 학교 내 분포 기준으로 Z 점수화(z-scored)**하였다:
    • 기초의학 성적,
    • 사전 임상(pre-clerkship) 성적,
    • OSCE 점수 등

 


임상실습 성적의 변환 (Clerkship Grade Transformation)

**임상실습 성적(clerkship grades)**은 학교마다 기록 및 보고 방식이 다르기 때문에 **집계와 변환에 있어 고유한 도전 과제(unique challenge)**를 제시했다. 이를 해결하기 위해,

**부분 점수 Rasch 모형(partial-credit Rasch model)**을 활용하여
**학습자의 능력 추정치(person ability estimates, theta scores)**를 산출하였다 (Mair & Hatzinger, 2007).

 

이 점수는 다음과 같은 특징을 가진다:

  • 여섯 개 공통 임상실습 과목 전체의 성과를 기반으로 하며,
  • 평균 수준의 학생에게는 theta = 0을 부여하고,
  • 이보다 높은 성과는 양의 theta로 나타난다.
  • 모든 변환은 각 학교 내에서 수행됨.

MCCQE2 분석을 위한 추가 예측 변수

MCCQE2 분석 시에는 두 가지 추가 예측 변수가 포함되었다:

  1. MCCQE1 총점(total score)
  2. 가정의학 레지던시에 매칭 여부(if matched to a family medicine residency)

후자는 MCCQE2가 전반적(generalist) 성격의 평가이기 때문에,
일반 진료(generalist training) 여부가 성과와 관련이 있을 수 있다는 가정 하에 포함되었다.


 

결과 지표 (Outcome Measures)

이 분석에서 설정한 **두 가지 주요 결과 지표(primary outcome measures)**는 다음과 같다:

  1. MCCQE1 성과 (MCCQE1 performance)
  2. MCCQE2 성과 (MCCQE2 performance)

▷ MCCQE1

  • MCCQE1은 **지식과 그 응용 능력의 전산화 평가(computerized assessment of knowledge and its application)**로,
    다음 두 파트로 구성된다:
    • 객관식 문항(Multiple Choice Questions, MCQs)
    • 임상 의사결정 문항(Clinical Decision Making, CDM questions)
  • 이 시험은 일반적으로 **의과대학 교육(MD training)**이 거의 끝나갈 무렵 응시하지만,
    경우에 따라 더 나중에 응시하는 것도 가능하다.

▷ MCCQE2

  • MCCQE2는 **레지던트 1년차(postgraduate year 1)**에 시행되는 **객관적 구조화 임상평가(OSCE)**로,
    **면허 취득의 마지막 단계(final stage of licensing)**이다.
  • 본 연구에서 모든 참여자가 MCCQE2를 완료한 것은 아니었기 때문에,
    분석 시 표본 수가 50% 이상 감소하였다.
  • 참고: MCCQE2는 **2020년 이후 폐지(discontinued)**되었다.

▷ 점수 기반 성과 분석 (Why analyze performance scores?)

본 연구에서는 합격/불합격(pass/fail) 여부가 아니라 **점수(performance score)**를 분석하였다.
그 이유는 다음과 같다:

  • (a) _점수의 선형 변화(linear score change)_는 향후 임상성과와의 관련성이 이미 입증되어 있음.
  • (b) _점수 기반 분석_은 **더 넓은 결과값 범위(range)**를 제공하여 통계적으로 유리함.

👉 이는 기존의 MCC 시험 성과를 결과 지표로 사용한 연구들과 일치하는 접근이다.


분석 방법 (Analytic Approach)

▷ 모델링 전략

  • MCCQE1MCCQE2 각각에 대해 **별도의 회귀 모델(separate models)**을 구축하였다.
  • 초기에는 **다층 모형(multi-level model)**을 적용하여
    학교 및 학년(cohort) 수준의 군집 효과(clustering)가 MCC 시험 성과를 예측하는 데 얼마나 영향을 주는지를 살펴보았다.

▷ 모형 선택 기준

  • **사전 결정(a priori)**된 기준:
    • **군내 상관계수(Intraclass Coefficient, ICC)**가 5% 미만인 경우,
      일반 선형 회귀(ordinary least squares, OLS) 회귀로 전환 가능.
    • 반대로, 학교나 학년의 효과가 유의미한 경우,
      → 해당 변수를 **랜덤 절편(random intercepts)**으로 포함한 다층 분석을 유지.

▷ 단계별 회귀 모델 구성 (Stepwise Model Building)

회귀 모형은 **변수의 세 가지 범주(classes)**를 순차적으로 추가하는 방식으로 구성하였다:

  1. 사회인구통계학적 변수 (Sociodemographic variables)
  2. 입학 성과 변수 (Admissions performance variables)
  3. 평가 성과 변수 (Assessment performance variables)
    • 학업 경험 순서에 따라 다음과 같이 순차적으로 포함됨:
      • 기초의학 성적(biomedical performance)
      • OSCE 점수 (preclinical 및 clinical OSCE scores, 함께 입력)
      • 임상실습 집계 점수(aggregate clerkship score)
  4. 학교 소속(school membership) 변수는 마지막 단계에 추가하였다.

▷ 모형 평가

각 단계마다 다음을 평가하였다:

  • 설명력 변화 (변화된 R² 값; R² change)
  • 개별 예측 변수의 통계적 유의성 (significance of individual predictors)
    → 유의수준 α = 0.05로 설정

 

결과 (Results)

최종 분석에서 사용된 표본은 다음과 같다:

  • MCCQE1: 1,097명
  • MCCQE2: 616명

각 의과대학은 **178명에서 186명 사이의 학생 관측값(student observations)**으로 대표되었으며,
결측값이 있는 예측 변수는 목록별 제외(listwise exclusion) 방식으로 처리되었다.

▷ 군집 효과에 대한 초기 분석

  • **학교 단위의 군집 효과(clustering by school)**를 검토한 다층 모형(multi-level model) 결과:
    • MCCQE1MCCQE2 모두에서 ICC < 3%
      → 이에 따라, OLS 회귀(ordinary least squares regression) 분석으로 전환.
  • Table 2: 모든 학교의 결과 변수 평균 및 표준편차
  • Table 3: 예측 변수에 대한 기술통계 및 빈도


MCCQE1 분석 결과

▷ Step 1: 사회인구통계학적 변수만 포함

  • 유의한 변수(significant predictors):
    • 입학 시 나이(Age at admissions)t = 4.47, B = -0.142, p < 0.0001
    • 성별(Sex)t = 2.34, B = 0.072, p < 0.019
  • 전체 모델:
    • F(4,1045) = 7.5, p < 0.0001
    • 설명력: R² = 2.8%

▷ Step 2: 입학 성과(admissions performance) 변수 추가

  • 설명력: R² = 3.1% (소폭 증가)
  • 모델 변화: F(4,1016) = 1.03, p < 0.39 → 유의하지 않음
  • 입학 성과 변수들은 유의한 예측 인자가 아님
  • Age와 Sex는 여전히 유의함

▷ Step 3: Biomedical Knowledge 변수 추가

  • 설명력 대폭 증가: R² = 22.8%
  • F 변화 유의함: F(1,1015) = 259.1, p < 0.001
  • Biomedical Knowledget = 16.16, B = 0.446, p < 0.0001

▷ Step 4: OSCE 점수 추가

  • 설명력 소폭 증가: R² = 23.3%
  • F 변화: F(2,1004) = 2.817, p < 0.06 → 유의하지 않음
  • OSCE2만 유의함t = 2.025, B = 0.06, p < 0.043

▷ Step 5: Clerkship Score 추가

  • 설명력 크게 증가: R² = 35% (12.4% 증가)
  • F 변화 유의함: F(1,1003) = 193.05, p < 0.001
  • 이 단계에서는 OSCE2는 유의하지 않게 되었고, Clerkship Score만 유의: t = 13.98, B = 0.386, p < 0.0001

▷ Step 6: 학교 소속(School membership) 추가

  • 설명력 3.8% 증가최종 R² = 38.5%
  • F 변화 유의함: F(5,998) = 13.68, p < 0.01

▷ 최종 모델

  • 유의한 변수들만 포함한 모델(Final model with significant variables only)
    • F(9,1087) = 75.74, p < 0.001
    • Adjusted R² = 35%
  • 가장 큰 예측 효과Biomedical Knowledge, Clerkship Score
  • 학교 소속도 유의한 예측 인자였지만,
    • 다른 요인들을 통제한 후에도 MCCQE1 점수의 분산 중 4% 미만만 설명함
    • 학교 간 점수 차이는 모두 유의하지 않았고, 차이의 크기 또한 작았음


MCCQE2 분석 결과

예측 변수가 MCCQE1보다 훨씬 적었음

  • 사회인구통계학적 변수입학 성과 변수: → 모두 MCCQE2와 유의한 상관 없음
  • 성과 변수 중 유의한 것OSCE2, Clerkship Score → 이 두 변수는 함께 8.7%의 분산 설명

▷ MCCQE1 점수 및 가정의학 레지던시 매칭 여부 추가

  • 설명력 14% 증가
  • F 변화 유의함: F(2,601) = 55.7, p < 0.0001
  • MCCQE1 점수: MCCQE2 점수 예측에 유의함
  • 가정의학 레지던시에 있는 경우: → MCCQE2 점수가 평균적으로 30점 더 높음

▷ 학교 소속 추가

  • 추가 설명력 2%
  • F 변화 유의함: F(5,596) = 3.67, p < 0.0001

▷ MCCQE2 최종 모델

  • F(9,596) = 22.4, p < 0.0001 → 전체 모델은 통계적으로 유의함

 


 

논의 (Discussion)

“교육기관(training institutions)이 학습자의 준비도와 성과에 어떤 영향을 미치는가” 하는 질문은 의학교육에서 오랜 역사를 지닌 주제이다. 이번 **다기관 연구(multi-institution study)**에서는 **면허시험에 응시한 학습자가 속한 학부 의과대학(MD Program)**이 성과에 어떤 영향을 미치는지를, 다른 **잠재적 예측 변수(predictors)**들을 통제한 상태에서 분석하였다.


▷ 주요 발견 요약

  • **학교 소속(school membership)**은 **MCCQE1 및 MCCQE2 모두에서 유의한 분산(variance)**을 설명했지만,
    → 그 기여도는 상대적으로 작았다.
  • 가장 중요한 예측 변수는 **임상실습 성과(clerkship performance)**였으며,
    → 이는 **캐나다 면허시험의 설계 의도 및 청사진(blueprint)**과 일치한다.

특히 MCCQE2에서는

  • 가정의학(Family Medicine) 레지던시 프로그램에 참여한 것이 점수에 긍정적인 영향을 미쳤다.
    → 이는 **가정의학의 전반적 성격(generalist nature)**이
    **MCCQE2의 전반적 평가 청사진(generalist blueprint)**과 잘 부합되기 때문일 수 있다.

👉 이 점은 졸업 1년 후 시행되는 평가인 MCCQE2에서
학교와 성과 간에 작지만 유의미한 관계가 존재하는 이유도 설명해준다.


▷ 연구 강점

  • 온타리오 주 6개 의과대학의 대표 표본(subsample)을 통합하였으며,
  • **다수의 공통 예측 변수(common predictors)**에 접근 가능했다.

👉 이러한 조건 속에서도 학교 소속의 효과가 작았다는 점은,

**개인 차원의 준비(performance preparation)**가 더욱 중요하며
학교 간 차이는 상대적으로 작은 역할을 한다는 점을 안심시켜주는 결과라고 할 수 있다.


해석 및 설명

1. 학생들의 철저한 시험 준비

  • 가장 단순하면서도 유력한 설명은,
    모든 학교의 학생들이 고위험(high-stakes) 시험을 철저히 준비한다는 점이다.
  • 이는 캐나다에서의 낮은 시험 실패율과도 일치한다 (MCC, 2017a; 2017b).

즉, 교육과정 간 차이가 존재하더라도,
**정규 교육 외의 준비 과정(outside of formal education)**이 핵심 요인이 될 수 있다는 것.


2. 캐나다 교육 시스템의 구조적 유사성

  • **모든 의과대학은 동일한 인증 기준(accreditation standards)**을 따르며,
  • 교육과정도 유사한 수준의 내용과 질을 갖추고 있다고 기대할 수 있다.
  • 공통 임상실습(clerkship rotations),
    역량 기반 교육(competency standards) 등은 학교 간 유사성을 뒷받침한다.
  • 실제로 많은 학교가 면허시험의 청사진을 기준으로
    **교육과정 및 평가 결정(curricular and assessment decisions)**을 내리고 있다.

3. 방법론적 고려사항

  • MCC 시험이 **학교 간 차이를 감지할 수 있을 만큼 민감(sensitive)**하지 않을 수도 있다.
  • 애초에 면허시험은 학교 평가를 위한 도구로 설계된 것이 아님.

그럼에도 불구하고, Tamblyn et al. (2007) 등의 연구에서 밝혔듯
→ *면허시험 점수의 선형 변화(linear score change)*임상성과와 입학 정책 변화에 민감하게 반응하기 때문에,

여전히 **이 연구 질문에 적절한 결과 변수(outcome measures)**로 간주될 수 있다.


의의 및 문헌과의 연계

  • 본 연구의 접근 및 결과는 의학교육 전반에 국한되지 않으며,
  • 캐나다 맥락에서 해당 주제를 다룬 최초의 연구 중 하나이며,
  • 북미(North America)에서 학부 의학교육이 면허시험에 미치는 영향을 다룬 최신 분석이다.

👉 우리의 결과는 다음과 일치한다:

  • 학교 및 교육과정 차이면허시험 예측에 미치는 영향을 평가한 기존 연구들
    → 특히 **Hecker & Violato (2008, 2009)**의 대규모 연구

“Postgraduate 교육 프로그램의 경우에는 다른 결과가 나올 수 있지만(Asch et al., 2012),
적어도 학부 수준에서는 면허시험에 미치는 영향이 크지 않을 수 있다.”

  • 본 연구 결과는 또한 **Chahine et al. (2024)**의 대규모 분석과도 일치하며,
    → **개인 성과(individual performance)**가 MCCQE1의 가장 강력한 예측 요인임을 확인했다.
  • 그 연구는 각 학교 내에서 MCCQE1 예측 요인의 패턴과 수가 다름을 보여주었고,
    → **학교별 고유한 예측 요인(unique predictors)**이 존재함도 시사했다.

논의 (계속)

이 연구 결과는 교육과정을 혁신하거나 변경하고자 하는 교육 프로그램에게 안도감을 줄 수 있는 메시지를 제공한다.
앞서 제시한 여러 이유들로 인해,

학생들은 자신의 능력과 준비도에 따라 면허시험에서 성공할 가능성이 높다.

 

즉, 학교는 개인의 준비 노력을 지속적으로 지원하는 동시에,

  • 학생교수진지역사회의 요구에 부응할 수 있는 **교육과정 접근법(curricular approaches)**을 자유롭게 모색할 수 있다.

이 연구에 포함된 학교들은 서로 **매우 다른 교육과정 구조와 교육 철학(curricular structures and philosophies)**을 가지고 있으며,

  • 언어(language),
  • 농촌 보건(rural health),
  • 건강 형평성(health equity)
    **사회적 책무(social accountability)**에 대응하는 방식에서도 차이를 보인다.

이러한 차이는 각 학교의 **선발 방식(selection)**과 **교육과정 운영(curricula operationalization)**에 영향을 주며,
학교 정체성의 일부로 기능한다 (Ellaway et al., 2018).

 

예를 들어,

  • **Northern Ontario School of Medicine (NOSM)**은
    북부 및 농촌 지역 보건에 특화된 사회적 책무를 가지며,
    선발 및 교육 전반에 이러한 목적이 반영된다 (NOSM, 2018).
  • 반면, University of Toronto
    → **지리적 책무(geographic mandate)**를 가지지 않는다.

그럼에도 불구하고,

이러한 차이들이 졸업생의 면허시험 성과에 미치는 실제 영향은 매우 작았다.


▷ 의대 진학을 준비하는 학생들에게 주는 시사점

이러한 결과는 의학교육 리더에게는 희망적인 소식이지만,

*“차이를 탐지하지 못했다(we failed to detect a difference)”*는 것이
*“차이가 존재하지 않는다(absence of a difference)”*는 뜻은 아니다.

실제로,

  • 학교마다 고유한 임상 교육기관 및 문화적 차이가 존재한다.
  • Ginsburg et al. (2016), Martimianakis et al. (2020) 등은
    → **특유의 하위문화(subcultures)**와 **숨은 교육과정(hidden curriculum)**이
    학습자의 인식과 실천에 영향을 준다는 점을 강조해왔다.

이러한 요소들은

  • 정량화하기 어려우며,
  • 본 연구와 같이 설정된 **결과 지표(outcome measures)**로는 탐지되기조차 어렵다.
    그러나 이들은 미래 의사의 형성과정에 있어 핵심적 요소이다 (Martimianakis & Muzzin, 2015).

따라서,

학교마다 고유한 교육과정이 존재하지만,
이번 연구는
*“학생 간 차이는 개별 요인(individual factors)에 기인하며, 소속 기관 자체에 의한 것은 아니다”*라는
**공통된 기준(common standard)**이 유지되고 있음을 시사한다.


제한점 (Limitations)

본 연구에는 다음과 같은 여러 제한점이 존재한다:

  1. 전체 학교의 전체 데이터를 분석할 수 없었다.
    • 그렇게 할 경우, 각 학교가 다시 식별될(re-identification) 위험이 존재하며,
    • 이는 학교 간 비교를 피하고 연구 참여를 독려하기 위한 협약을 위반하는 것이다 (Grierson et al., 2023).
  2. MCCQE2 분석 시, 표본 수가 50% 이상 감소했다.
    • 이는 **모수 추정(parameter estimates)**의 **안정성(stability)**에 영향을 줄 수 있다.
    • 그럼에도 불구하고, 분석은 일반적으로 수용 가능한 표본 크기 기준을 충족했으며,
      유의미한 예측 변수를 탐지할 수 있었다.
  3. 공통 예측 변수를 만들기 위한 데이터 변환 과정에서,
    • 학교 간 고유하고 중요한 차이점손실되었을 가능성이 있다.
    • 예: Biomedical Performance집계 및 변환된 변수로,
      • 어떤 내용을, 어떻게 평가하는지는 학교마다 다를 수 있다.
      • 이 차이는 학교의 특징을 반영하는 중요한 요인일 수 있음.
    → 이 문제는 **Chahine et al. (2024)**의 대규모 분석에서
    학교 소속과 관계없이 Biomedical 성과가 일관된 예측력을 보였다는 결과로 어느 정도 완화된다.
  4. 중요하다고 알려진 변수들이 누락되었다.
    • 예: 사회경제적 지위(SES)인종 및 민족(race and ethnicity)
    • 이 변수들은 **UKMED 분석(Eliss, 2022b)**에서 유의미한 예측 인자로 확인되었다.
    • 그러나 이러한 변수 수집은 제도적으로 어려운 과제이며 (Grierson et al., 2022),
      학교 수준의 차이를 정확히 이해하기 위해 필요할 수 있음.
  5. 본 연구는 캐나다의 한 지역 내 학부 의학교육 프로그램에 초점을 맞추었으며,
    • 다른 국가 또는 교육문화에서는 일반화에 신중을 기할 필요가 있다.

특히 전공의 교육 환경(postgraduate training environments) 간의 차이 비교에 대해서도 유사한 신중함이 요구된다.


결론 (Conclusions)

본 연구는 **다기관 데이터 공유 과정(multi-institution data sharing)**을 통해 수행되었으며,
→ **기관 차이(institutional differences)**를 탐색할 기회를 제공했다.

  • **적절한 보호 장치가 마련된 협력적 데이터 공유(collaborative data sharing with safeguards)**는
    중요한 질문들에 답할 수 있는 강력한 도구이다.

이번 연구는

**면허시험이라는 고위험 평가(high-stakes assessments)**에 있어
학교 소속이 성과에 어떤 영향을 미치는가라는
상대적으로 논쟁적이고 영향력 있는 주제를 다룬 것이다.


▷ 주요 결론 요약

  • 의과대학 소속은 성과 분산에 있어 작은 기여만 했다.
  • **가장 큰 예측 변수는 임상 교육 기간 중의 기존 성과(prior performance in clinical training)**였다.

👉 이는 다음을 시사한다:

  • 기관 간 차이는 면허시험 성과 예측에 있어 작은 역할만 하며,
  • 개인 수준의 학업 성과가 더 중요하다는 것.

▷ 향후 방향

  • 데이터 과학(data science) 기반의 접근과
  • 다기관 협업 데이터 공유 모델을 지속적으로 활용한다면,
    → 학부 의학교육 이후의 다양한 **하류 성과(outcomes downstream)**에 영향을 미치는
    다른 요인들에 대한 이해가 더욱 심화될 수 있다.
  • 또한, 빅데이터 방법론 및 기술의 혁신
    → 이러한 협업이 지속 가능하도록 만들 것이다.

 

 

 

Kulasegaram, K., Archibald, D., Bartman, I., Chahine, S., Kirpalani, A., Wilson, C., ... & Grierson, L. (2024). Can all roads lead to competency? School levels effects in Licensing examinations scores. Advances in Health Sciences Education, 1-16.

 

 

 

이 특별호는 *데이터 과학(data science)*이 보건의료 전문직 교육 연구 및 실제에서 이제 중요한 역할을 하고 있다는 전제에서 출발한다. 이는 사회과학 전반에서도 마찬가지 현상이다 (예: Foster & Stine, 2004; Jemilniak, 2020). 우리는 과장된 기대와 유행어 뒤에 숨어 있는 진실을 꿰뚫어보며, 보건의료 전문직 교육 연구자들이 데이터 과학 기법, 데이터 과학의 윤리, 그리고 이 신흥 영역에서 이론이 갖는 역할에 어떻게 효과적으로 관여할 수 있는지를 고찰해야 한다.

We need to look past the hype and inflated expectations to consider how health professions education scholars can effectively engage with data science techniques, the ethics of data science, and the role of theory in this emerging area.

 

여기서 '데이터 과학(data science)'이라는 용어는 빅데이터(Big Data), 분석 기법(analytics), 그리고 이와 연관된 신흥 주제 영역을 포괄하는 의미로 사용되었다.

 

데이터 과학과의 실제적 연계라는 측면에서, 이번 특별호에 실린 여러 논문들은 빅데이터를 활용한 연구들을 보고하고 있다 (예: Chahine et al., 2024; Johnston et al., 2025; Kulasegaram et al., 2024a, b). 그러나 흥미롭게도 유일한 문헌고찰 논문인 Marcotte et al. (2025)은 __보건의료 전문직 교육 분야에서 빅데이터 기법을 사용한 논문은 의외로 소수에 불과__하다는 점을 지적한다.

 

이러한 결과는, 보건의료 교육 분야에서 빅데이터의 가능성에 대해 __열정적으로 이야기하는 사람은 많지만, 실제로 이를 활용하는 사람은 훨씬 적다는 사실__을 보여준다 (Johnsson & Tolsgaard, 2024). 또한 Kitto et al. (2024), Constable et al. (2024)과 같은 연구자들은 데이터 과학의 특정 활용이 야기할 수 있는 함의에 대해 분명한 경계심을 드러낸다.

 

한편으로는 데이터 과학이 새로운 교육적 통찰과 아이디어를 지원할 수 있는 큰 잠재력을 가지고 있지만, 다른 한편으로는 __프라이버시, 감시(surveillance), 통제(control)__에 대한 중대한 우려가 존재한다 (Grierson et al., 2023; Kulasegaram et al., 2024a, b).

“Like other socio-technical phenomena, Big Data triggers both utopian and dystopian rhetoric.”
– Boyd & Crawford (2012, p.653)

즉, 빅데이터는 다른 사회기술적 현상들과 마찬가지로 유토피아적 담론과 디스토피아적 담론을 동시에 불러일으킨다.


우리는 데이터 과학의 교육 연구 적용에 대한 이러한 경계심의 한 가지 이유가 다음과 같은 구조적 부재에 있다고 본다: 즉, __데이터가 윤리적이고, 안전하며, 생산적인 방식으로 수집되고 활용되도록 보장해 줄 확립된 원칙, 기준, 인프라, 규제의 부족__이다.

 

이러한 정책 및 절차의 공백은 데이터 과학의 잠재력을 실현하는 데 중대한 장애물이 된다. 연구자들은 최선의 의도를 가지고 있음에도 불구하고 __"잘못된 일"을 저지를지도 모른다는 불확실성__에 직면하게 된다. 실제로 연구자들은 다음과 같은 여러 윤리적 문제에 대한 지침을 필요로 한다:

  • 연구 결과가 개인이나 집단에게 해가 되지 않도록 하려면 어떻게 해야 하는가?
  • 프라이버시와 기밀성을 어떻게 보호할 수 있는가?
  • informed consent (정보에 입각한 동의)와 같은 윤리 원칙을 어떻게 의미 있게 준수할 것인가?

이 문제들은 연구자뿐 아니라 데이터 관리자(data stewards) 및 다른 이해관계자들에게도 동일하게 적용된다.


이번 특별호에 실린 여러 논문에서 이와 같은 *윤리적 고려사항(ethical considerations)*은 반복적으로 등장한다. Postman (1992)은 *"우리는 기술을 연인의 눈으로 바라보며, 결점 없이 완벽하다고 여기고 미래에 대한 불안은 품지 않는다"*고 말한 바 있다 (p.5). 하지만 보건의료 전문직 교육 분야에서는, 적어도 지금까지는 그렇게 '사랑에 빠지진' 않았고, 오히려 데이터 과학의 잠재적 함의에 대해 신중하고 우려하는 경향이 더 강하다.

 

Mercuri and Emerson (2024)는 글로벌 보건 문맥에서의 데이터 주권(data sovereignty) 및 __관할권 간 협력(inter-jurisdictional work)__의 사례를 통해 이러한 윤리적 공백을 조명하고 있다. 이 분야에서는 수많은 데이터 기반 연구들이 눈에 띄는 윤리적 긴장과 우려를 일으켜왔다. Rowland et al. (2024)은 문서 분석(document analysis)을 통해, 데이터 과학에 대한 커다란 약속들이 존재함과 동시에 __블라인드 스팟과 위험 요소에 대한 불안__도 존재함을 보여준다.

 


흥미로운 점은, 이러한 윤리적 문제들을 다루는 속도가 __관할권(jurisdiction)__이나 __학문 영역__에 따라 매우 다르다는 것이다. 예를 들어, Johnston 외(2025)의 논문에서 사용된 **영국 의학교육 데이터베이스(UK Medical Education Database, UKMED)**는, 데이터 수집과 관리에 필요한 윤리적 연구 인프라와 규정을 수년에 걸쳐 검토한 후, 10여 년 전에 설립되었다 (Dowell et al., 2018). 반면, 다른 논문들은 이제 막 보건의료 전문직 교육에서 데이터 과학의 가능성을 탐색하기 시작한 국가 및 시스템 내에서의 활동을 보여주는 좋은 사례들이다 (Chahine et al., 2024; Kulasegaram et al., 2024a, b).


데이터 과학에 필요한 역량은 전반적으로 양적 연구에 필요한 역량과 유사하다:

  • 양질의 데이터 확보,
  • 체계적인 데이터 관리 및 거버넌스,
  • 전통적 통계 분석 능력 등이 그것이다.

하지만 데이터 과학은 또한 __기계 학습(machine learning)__이나 __자연어 처리(natural language processing)__와 같은 인공지능 기반 접근법과 기술을 활용할 수도 있다. 이는 전통적인 보건의료 교육 연구자들에게는 익숙하지 않은 기술이며, 따라서 연구자들은 이러한 기술을 새롭게 습득하거나, 관련 전문 지식을 가진 사람들과 협업해야 할 것이다.

 

또한 앞으로 연구자들은 사회과학 내의 새로운 하위 분야들과도 적극적으로 교류해야 할 것으로 보인다. 예를 들면:

  • 데이터 과학 방법론(data science methods) (Foster et al., 2020),
  • 계산 사회과학(computational social science) (McLevey, 2022),
  • 디지털 인문학(digital humanities) (Drucker, 2021) 등이 있다.

__학제 간 연구(interdisciplinary work)__는 도전적이지만 (예: Macleod, 2018), __이 분야를 발전시키기 위해 반드시 필요한 전략__이다.


세 번째로 지적할 점은, 데이터 과학에서 이론(theory)이 갖는 역할에 대한 질문이 우리의 참여를 방해하고 있을 가능성이다.

어떤 학자들은 이론이 필요 없다고 주장한다. 이들은 연구 질문과 답변이 "귀납적 과정과 통계 조작에 기반한 바텀업 접근 방식(bottom-up process based on inductive processes and statistical manipulation)"에서 나온다고 본다 (Mazzocchi, 2015, p.1250). 이러한 관점에서 보면, 데이터 과학은 패턴 인식과 통계 기법, 데이터베이스 시스템, 기계 학습을 통해 현상에 대한 새로운 통찰을 생성함으로써 이론 구축을 자극할 수 있다 (Luo et al., 2019).

 

반면, 이론이 데이터 과학에서 핵심적이다라고 믿는 학자들도 있다 (예: Tolsgaard et al., 2020).
가장 명확한 수준에서, 이론은 가설(hypothesis)의 형태로 데이터 과학을 지탱하며, 다음과 같은 지침을 제공한다:

  • 어떤 변수를 모델에 포함시킬 것인가?
  • 어떤 요인이 데이터를 영향을 미치는가?
  • 어떤 결과에 주목할 것인가?
  • 다른 맥락에 어떻게 일반화할 수 있는가?

“At its most obvious, theory underpins data science in the form of hypotheses, providing guidance about the variables to include in a model, what influences the data, to which results to attend, and how to generalize results to other settings.”
– Wise & Schaffer (2015)


가장 중요한 마지막 논점은 다음과 같다:
데이터 과학은 단순한 도구와 기법들의 모음(toolkit)이 아니다. 오히려, 데이터 과학은 새로운 실천(practice)을 생성해낸다 (Orlikowski & Scott, 2015a, b; Scott & Orlikowski, 2014).

“Data science is not a bag of tools and techniques. Rather, data science generates new practices.”
– Orlikowski & Scott

 

이러한 이유로, 데이터 과학의 '결과(outcomes)'를 탐구하는 연구는 반드시 다음을 동반해야 한다: 기술과 인간 행위자(human actors)가 어떻게 작용하고 상호작용하는지를 면밀히 검토하는 사려 깊은 질적 연구. 이러한 상호작용이 어떻게 새로운 행동을 생성하고, 새로운 실천의 가능성을 제시하는지를 탐구해야 한다 (Scott & Orlikowski, 2014).

“Change the instruments, and you will change the entire social theory that goes with them.”
– Latour (2009, p.155)

 

라투르(Latour)의 이 말처럼, 도구가 바뀌면 그것과 연계된 사회이론 전체가 변화하게 된다.


우리 분야가 여전히 데이터 과학과 관련해서 대부분 '논평(commentary)'과 '문헌고찰(review)' 수준의 학술 작업에 머물러 있는 이유 중 하나는, 어쩌면 우리 스스로의 한계 때문일 수 있다.

교육자이자 연구자인 우리는, 데이터 과학을 독립된 실체(entity)처럼 대하는 오류에서 벗어나야 한다.
데이터 과학은 도구 그 자체가 아니라, __인간과 기술이 상호작용하며 형성되는 새로운 실천의 장__이라는 사실을 인식해야 한다.

 

따라서, 보건의료 전문직 교육에서 데이터 과학의 윤리적이고 학문적인 기반을 튼튼히 구축하기 위해, 경험적(empirical) 연구를 수행하여 실증적 데이터를 수집해야 한다.

 

이제 데이터 과학은 사라지지 않을 것이며, 우리는 그 잠재력을 최대한 활용하기 위한 준비와 실천을 시작해야 할 시점에 있다.

“It is here to stay, so let us get on with the tasks needed to make the most of it.”

 

 

 

 

Cleland, J., Grierson, L., & Tolsgaard, M. (2025). Data science in health professions education: promises and challenges. Advances in Health Sciences Education, 1-4.

 

 

 

🧠 보건의료 교육에서 ‘데이터 과학’은 과학일까?

안녕하세요! 오늘은 최근 Advances in Health Sciences Education 저널에 실린 흥미로운 에디토리얼을 소개해보려고 해요.
제목부터 강렬하죠?

"Is data science in health professions education a ‘science’ as the term is generally understood?"

 

즉, "보건의료 전문직 교육에서 데이터 과학(data science)은 우리가 일반적으로 생각하는 의미의 과학(science)일까?" 라는 질문이에요. 이 글에서는 이 질문을 중심으로, 우리가 쉽게 간과할 수 있는 데이터 과학의 본질, 윤리, 책임, 정체성까지 폭넓게 다루고 있어요.


1️⃣ 데이터 과학은 ‘이론’을 사용하는가?

우리가 흔히 ‘과학’이라 부를 수 있으려면, 어떤 이론(theory) 기반이 있어야 해요. 그런데 데이터 과학은 어떤가요?

"Much data science would seem to have very little of its own theory (other than a tacet commitment to the principle of ‘truth is in the data’)."
"데이터 과학은 ‘데이터에 진실이 있다’는 암묵적인 전제 외에는, 자체적인 이론이 거의 없어 보인다."

 

게다가 대부분 데이터 안의 패턴을 찾는 것에 집중하고, 그 패턴에 대해 사후적으로(post hoc) 설명하려는 경우가 많다고 지적해요. 이건 흔히 우리가 생각하는 '이론 기반 과학'과는 좀 거리가 있죠.


2️⃣ 누가 데이터를 만들고 책임지는가?

🔍 두 번째 핵심 포인트는 **책임(responsibility)**이에요. 과학자라면 보통 자신의 데이터에 대해 전반적인 책임을 져요— 무엇을, 어떻게, 왜 수집하는지 설계하는 것까지 포함해서요. 하지만 교육 현장에서 데이터는 대부분

  • 학습자가 클릭하거나
  • 온라인 시스템에서 자동으로 수집되거나
  • 교육 플랫폼 로그에서 생성되는 등
    우연히 생성되는 경우가 많아요.

"Only some educational activity generates data for data science purposes (usually when learners and teachers interact with online systems) and the data generated are not always reliable, complete, or meaningful."
"일부 교육 활동만이 데이터 과학 목적에 맞는 데이터를 생성하고, 그마저도 신뢰할 수 있거나, 완전하거나, 의미 있는 경우는 드물다."

 

그리고 데이터를 누가 만들었고, 누가 해석하며, **그 결과에 책임을 지는가?**라는 문제는 여전히 복잡하죠.


3️⃣ 동료 평가(peer review)는 가능한가?

과학의 핵심 중 하나는 **동료 평가(peer review)**인데요, 데이터 과학에서 다루는 **수동적 데이터(passive data)**는 이게 거의 불가능하다고 해요. 왜냐면 수집 과정이나 방법이 명확하게 드러나지 않거나, 데이터가 비공개거나, 기업 자산이기 때문이죠.

"Peer review of passive data is nearly impossible... If there is no peer review or scrutiny, then data science is not science – it is more akin to in-house evaluations and secondary data analyses."
"수동적 데이터는 동료 평가가 거의 불가능하다... 동료 평가나 검토가 없다면, 데이터 과학은 과학이라기보단 사내 평가나 2차 데이터 분석에 가깝다."


4️⃣ 진짜 ‘과학자’는 누구인가?

여러분, 지금 데이터 과학자라고 불리는 사람들은 어떤 사람들이 많을까요?
대부분 프로그래머(programmers), 통계전문가(statisticians), 또는 시스템 전문가들이죠.

"They are generally not professionally-trained researchers or academics – which begs the question of whether they truly reflect the title of ‘scientist’."
"이들은 보통 전문 연구자나 학자는 아니며, 과연 ‘과학자’라는 호칭이 적절한지에 의문이 든다."

 

👩‍🏫 그런데 교육 연구는 **사회과학(social sciences)**의 복잡성을 다루는 분야잖아요?
데이터 과학이 진짜 'HPE 안의 과학'이 되려면, 교육학과 사회과학의 전문 연구자가 팀에 반드시 포함되어야 한다는 게 저자들의 주장입니다.


5️⃣ 결론: 데이터 과학은 과학일까?

이 모든 질문을 정리하며, 연구자들은 이렇게 말해요.

“It depends.”

그래요, 상황에 따라 다르죠. 
하지만 데이터 과학이 진정한 과학이 되려면,

  • 이론을 고민하고,
  • 데이터의 질과 윤리를 신중히 다루며,
  • 학제 간 팀 구성과 학술적 맥락을 갖추어야 한다는 게 핵심 메시지입니다.

"We urge education researchers to reflect on these challenges to ensure that the science of data science in health professions education is as robust and scientific as it can be."
"HPE에서 데이터 과학이 가능한 한 엄밀하고 과학적인 모습으로 자리잡을 수 있도록, 교육 연구자들이 이러한 도전 과제를 숙고해주기를 강력히 권고한다."


💬 마무리 생각

이 논문은 단순히 데이터 과학을 비판하려는 게 아니라, “과학적”이라는 말이 의미하는 바가 무엇인지 되돌아보게 해주는 글이에요.
데이터가 많다고, 기술이 뛰어나다고, 그것만으로 ‘과학’이라고 부를 수는 없다는 점, 우리 모두가 다시 생각해봐야 하지 않을까요?

 

 


이 특별호(Special Issue)에서는 **보건의료 전문직 교육(Health Professions Education) 분야에서 데이터 과학(data science)**이 어떻게 최첨단 사고와 실제(practice)로 자리잡고 있는지를 보여주는 일련의 논문들을 수록하였습니다. 이 에디토리얼에서는 다음과 같은 질문을 제기합니다:

 

👉 “보건의료 전문직 교육에서의 데이터 과학은 우리가 일반적으로 이해하는 의미에서 ‘과학’(science)인가?”

 

이 질문은 이 신흥 분야나 그 분야의 연구자들을 폄하하기 위함이 아니라, _보건의료 전문직 교육 학문 영역 내에서 이 분야의 위치를 명확히 하기 위한 목적_에서 제기한 것입니다. 유사한 질문은 이미 다른 연구자들에 의해 제기된 바 있으며 (예: Malik, 2022), 데이터 과학이 통계학(statistics)이나 컴퓨터 과학(computer science)의 리브랜딩(rebranding)인지, 확장(extension)인지, 아니면 완전히 새로운 학문인지에 대한 논의는 오랫동안 지속되어 왔습니다. (Donoho, 2017)

 

이 질문에 답하기 위해, 저자들은 세 가지 기준을 중심으로 논의를 전개합니다:

  • 과학의 본질(nature of science)
  • 데이터의 통제와 질(control and quality of data)
  • 그리고 누가 이 작업을 수행하는가(who does the work)

과학의 본질(nature of science)

이 저널이 이론 중심(theory-oriented)인 점을 고려할 때, 다음과 같은 질문을 던지는 것이 타당해 보입니다:

 

👉 “데이터 과학은 이론을 사용하는(theory-using) 학문인가? 그리고 그 정도는 어느 수준인가?”

 

많은 데이터 과학 연구는, **‘데이터 속에 진실이 있다’(truth is in the data)**는 암묵적 전제(tacit commitment) 외에는 자체적인 이론(theory)을 거의 갖고 있지 않은 듯 보입니다. 실제로 데이터 과학의 상당 부분은, 데이터 안에 숨겨져 있는 ‘패턴(pattern)’을 이론 없이(atheoretical) 탐색하고, 그 패턴을 사후적으로(rationalized post hoc) 설명하는 데 초점을 맞춥니다.

 

데이터 과학은 데이터를 가지고 무엇을 하느냐에 초점을 맞춘다는 점에서 통계학 및 컴퓨터 과학과 유사하며, 데이터가 무엇을 나타내는지 혹은 왜 분석되는지에 대한 특정한 관점을 제시하지는 않습니다.

 

이러한 경향은 인공지능(AI) 분야의 문헌에서도 관찰되는데, 이 분야에서는 **특정한 과업(task)에 초점을 맞추기보다는 여러 문제 범위에 걸쳐 수행 능력을 발휘할 수 있는 ‘근본 모델(fundamental models)’**의 개념이 등장하였습니다. (Eisenstein, 2024)

 

그렇다면 다시 질문할 수 있습니다:
👉 “데이터 과학은 이론을 생성하는(theory-building) 학문인가?”

 

이에 대한 대답도 대체로 부정적입니다. 데이터 과학은 개념적 설명보다는 실용적 응용(practical applications)에 더 중점을 두며, 이론 생성에는 제한적인 성향을 보입니다. 물론, 이러한 특징은 응용 학문(applied field)에서는 반드시 단점이 되는 것은 아니지만, 과학적 활동(scientific activity)의 맥락에서는 우려의 대상이 될 수 있습니다.


또 하나의 질문은 다음과 같습니다:

 

👉 “데이터 과학은 탐구(inquiry)에 있어 체계적인 접근(programmatic approach)을 반영하고 있는가?”

 

과학(science)은 개별 과학자의 연구뿐 아니라, 그 연구가 다른 이들의 연구 위에 구축되고, 다시 공동체에 환원되어야 한다는 점에서 누적적(cumulative)이자 집적적(aggregative)인 활동입니다. 이러한 점은 ‘교수-학습에 대한 학문적 접근(Scholarship of Teaching and Learning, SOTL)’과 ‘학문적 교수(scholarly teaching)’ 간의 긴장에서도 비슷하게 나타납니다. (Hutchings & Shulman, 1999)

👉 SOTL은 단순히 교육 시스템을 운영하거나 관리하는 사람들에게만 의미 있는 지역적 통찰(local insight)이 아니라, _공동체적 활동(community activity)_이 되기 위해서는 반드시 공유(sharing)되어야 합니다.

 

데이터 과학이 학문적으로 기반을 두지 못할 이유는 전혀 없습니다. 하지만 현재의 데이터 과학은 많은 경우 기업적 필요(corporate needs)와 이해관계(interests)에 맞춰져 있는 경향이 있습니다. 📌 (이는 많은 데이터 과학 관련 직무가 기업에 의해 자금 지원을 받기 때문이기도 합니다.) 또한 기업이 이론적 목표(theoretical ends)를 추구하거나, 학문적 엄밀성(rigour)의 기준을 충족시키지 못할 이유도 없습니다.

 

다만, 기업적 필요와 가용한 재원(available funding)에 부응하기 위해 연구 방향을 설정해야 할 경우, 데이터 과학 역시 과학자들이 자신이 진정으로 하고 싶은 연구를 수행할 수 없는 불안정한 위치에 처하게 됩니다. 국가의 연구지원(government funding)은 충분하지 않을 수 있으며, 이런 상황에서 기업과 협력하려면, 과학자는 _현실적이거나 인식되는 이해충돌(real or perceived conflicts of interest)_을 최소화해야 할 책임을 갖습니다.


과학에 있어 또 다른 핵심 관심사는 바로 **‘엄밀성(rigour)’**입니다.

이 엄밀성은 곧 **연구 방법의 철저함(thoroughness of methods)**과 **비판적 사고의 유무(critical thinking)**를 의미합니다.
이와 관련하여 우리는 **Glassick 외(1997)**가 제안한 학문적 활동(scholarly activity)의 기준을 참고할 수 있습니다.

 

📌 학문적 활동으로 인정되기 위해서는 다음의 요소들을 갖추어야 합니다:

  • 명확한 목표(clear goals)
  • 충분한 준비(adequate preparation)
  • 적절한 방법(appropriate methods)
  • 의미 있는 결과(significant results)
  • 효과적인 발표(effective presentation)
  • 성찰적 비판(reflective critique)

물론 연구마다 그 구체적인 내용은 달라지겠지만, **이번 특집호에 실린 논문들(papers in this special issue)**은 동료평가(peer review)를 거치며 정제되었고, 이로 미루어 보아 데이터 과학도 분명히 학문적(scholarly)일 수 있음을 시사합니다.

 


가장 핵심적인 문제는 다음과 같은 책임(responsibility)의 문제입니다:
👉 “데이터 과학에서 사용되는 데이터에 대해 누가 어떤 책임을 지는가?”

 

일반적으로 과학자들은 자신이 다루는 데이터에 대해 매우 큰 책임을 집니다. 이들은 데이터를 이론화(theorizing)하고, **무엇을, 어떻게 수집할 것인지 설계(designing)**하며, 데이터의 질(quality)에 대해 깊이 고민합니다.

그러나 교육 활동 중 오직 일부만이 데이터 과학 목적에 맞는 데이터를 생성하며, 대개는 학습자와 교사가 온라인 시스템을 통해 상호작용할 때만 그러합니다.


그런데 이렇게 생성된 데이터는 반드시 신뢰할 수 있거나(reliable), 완전하거나(complete), 의미 있는(meaningful) 것은 아닙니다.

 

예를 들어,
👉 “클릭(click)은 과연 무엇을 의미하는가?”
👉 “참여자가 자신이 추적되고 있다는 것을 인식하면서 발생하는 ‘호손 효과(Hawthorne effect)’—또는 ‘암묵적 사회적 존재감(implied social presence)’(Wong & Stephen, 2019)—는 데이터에 어떤 영향을 주는가?”
👉 “과제가 자발적인지, 강제적인지에 따라 반응이 어떻게 달라지는가?”
👉 “학습자의 작업이 전자건강기록(Electronic Health Record, EHR)과 통합될 때, 추적(tracking)은 어떻게 작동하는가?”
👉 “진정으로 의미 있는 데이터란 무엇이며, 그러한 데이터를 정말로 얻을 수 있는가?”

 

이와 같은 질문들은, 우리가 데이터를 진정으로 학습에 도움이 되도록 사용하고자 할 때, 오늘날의 데이터 과학자들이 직면하는 중대한 도전 과제입니다.


데이터 과학의 책임은 또한 **연구 윤리(research ethics)**와도 밀접한 관련이 있습니다.

_사람들의 데이터(data from or about people)_가 관련될 경우, 이 책임은 더욱 중요해집니다.

현재 많은 학술지들은 과학의 재현성(reproducibility)을 보장하기 위해, 연구에 사용된 데이터셋의 공유(data sharing)를 요구하고 있습니다. (Ellaway, 2024)
👉 “그렇다면 데이터 과학 연구팀은 데이터를 저장소(repository)에 올릴 때, 타인이 해당 연구를 재현할 수 있도록 분석에 사용된 **코드(code)**도 함께 제공해야 하는가?”


일반적으로 과학자라면 어떤 데이터를 수집할지, 어떻게 수집할지에 대해 일정 수준의 통제(control)를 가지고 있다고 기대됩니다.
이러한 데이터는 **‘능동적 데이터(active data)’**라고 부를 수 있습니다.
즉, 데이터 과학자가 실험을 설계하고 데이터를 생성하는 활동을 조작(manipulate)할 수 있는 경우입니다.

반면, 과학자가 단지 주어진 데이터만을 가지고 작업할 수 있는 경우, 우리는 이를 **‘수동적 데이터(passive data)’**라고 부릅니다.
👉 데이터 과학의 상당 부분은 이러한 ‘수동적 데이터’에 의존하며, 이로 인해 발생하는 도전 과제 역시 함께 따라옵니다.

 

**전자건강기록(EHR)을 사용하는 2차 데이터 분석(secondary data analysis)**에서도 마찬가지로 **편향(bias)**과 **데이터 품질 문제(data quality)**에 대한 우려가 제기되어 왔습니다. (Sarwar et al., 2022)


흥미롭게도, 데이터 과학은 **정량적 데이터(quantitative data)**에 편향되는 경향이 있지만, 정성적 데이터(qualitative data) 또한 이러한 데이터셋의 일부가 될 수 있습니다. 그러나 **정성적 데이터의 2차 분석(secondary analysis of qualitative data)**은 다음과 같은 이유로 별도의 지침(guidance)이 필요합니다:

  • 정성 데이터 보관(archiving)의 어려움
  • 메모, 노트 등의 보조 자료를 어디까지 포함시킬 것인가
  • 배경 정보의 범위

이에 대해 **Sherif(2018)**는 **정성적 데이터의 2차 분석을 위한 네 가지 기준(four criteria)**을 제안합니다:

  1. 현재의 연구와 데이터셋 간의 적합성 및 관련성 (fit and relevance)
  2. 데이터셋의 일반적인 질 (general quality)
  3. 데이터셋의 신뢰도 (trustworthiness)
  4. 데이터셋의 시의성 (timeliness)

👉 이러한 기준들은 데이터 과학자에게 훨씬 더 높은 수준의 책임감을 요구하게 됩니다.

 


과학(science)은 종종 **추적된 사건, 과정, 현상(tracked events, processes, or phenomena)**으로부터 **추적되지 않은(untracked) 혹은 추적 불가능한(untrackable) 현상에 대한 추론(inference)**을 이끌어냅니다.

그렇다면 데이터 과학에는 **잠재 모형화(latent modeling)**가 얼마나 존재할까요?
이 저널에서는 2012년에 **잠재 모형화 논문(latent modeling paper)**이 게재된 바 있으며 (Boscardin, 2012),
10여 년이 지난 2024년에야 다시 한번 인용되었습니다 (Ding & Homer, 2024).

👉 이러한 현상은 데이터 과학이 '비과학(nonscience)'임을 시사하는 것일까요?
아니면 단순히 이 분야가 아직 '초기 단계(infancy)'에 있다는 증거일까요?


데이터 과학과 **동료평가(peer review)**의 관계는 어디에 있을까요?

특히 **수동적 데이터(passive data)**의 경우, 동료평가는 거의 불가능에 가깝습니다.

  • 데이터 수집 및 분석에 사용된 방법(methods)의 세부사항을 확인하는 것은 어렵고,
  • **기밀성(confidentiality)**이나 소유권(proprietary) 문제로 인해 데이터셋 자체를 검토할 수 없는 경우도 많습니다.

👉 **검토(scrutiny)**와 **동료평가(peer review)**가 없다면, 데이터 과학은 과학(science)이 아니라 **기업 내 자체 평가(in-house evaluation)**나 **2차 데이터 분석(secondary data analysis)**에 가까운 활동이 됩니다.

 

Sherif(2018)이 제안한 것과 같은 **정량 및 정성 연구를 위한 평가 기준(criteria)**이 존재하지 않는다면, 논문 심사만으로는 핵심 우려들을 다룰 수 없습니다. 따라서 연구자는 **충분한 설명(description)**과 **세부사항(details)**을 직접 책임지고 제공해야 할 의무가 있습니다.


우리는 **데이터 과학에서 데이터를 어떻게 사용하는지에 관한 윤리적 기준(ethical criteria)**이 필요합니다.
동의(consent), 익명성 또는 식별 가능성(anonymity/identifiability), 조작 또는 강제(manipulation/coercion)와 같은 기본적인 윤리 문제는 데이터 과학에도 동일하게 적용되지만,
👉 “데이터 과학자들은 윤리적으로 누구에게, 어떤 방식으로 책임을 지는가?”
👉 “그리고 어떤 상황에서 책임을 요구받는가?”

 

이 문제는 특히 **학문적 자유(academic freedom)**의 맥락에서 두드러집니다.
👉 “지도자나 제도, 현상 유지(status quo)에 도전하며, 권력자에게 진실을 말할 수 있는 학문적 자유 위에 서 있는 데이터 과학 연구는 얼마나 되는가?”

현재는 중요한 데이터를 수집조차 허용되지 않는 경우도 존재합니다.
그렇다면, **윤리(ethics)**는 **무언가가 과학인가 아닌가를 구분하는 또 하나의 기준(marker)**입니다.

  • *학자(academic)*는 그에 맞는 **행동의 의무(obligation to act)**와 **보호 장치(protection)**를 갖지만,
  • 기업 지향적(corporate-oriented) 접근은 보통 **정책(policy)**을 따르며, **위험 회피 성향(risk-averse)**이 강합니다.

Ellaway(2024)의 질문처럼,
👉 “데이터 과학은 타인이 소비할 수 있도록 **신뢰할 수 있는 지식(reliable knowledge)**을 생성하는 것인가?”
👉 “아니면 정책과 과정의 의사결정(decision-making) 및 **방향 설정(directing)**까지 포함하는가?”

물론 보건의료 전문직 교육(Health Professions Education, HPE)처럼 **응용 분야(applied field)**에서는 이러한 **경계(perimeter or boundary)**가 원래 다소 모호할 수 있습니다. 하지만,

 

👉 “데이터 과학이 HPE의 과학(sciences of HPE)과 분리되어 있거나, 분리된 채 유지된다면, 그 모호함은 훨씬 더 커지지 않을까?”


데이터 과학의 현 상황은 **상업적 목적의 활동(commercial for-profit activity)**과 **제도적 활동(institutional or corporate activity)**이 병존하면서 더욱 혼란스러워지고 있습니다.

 

이러한 상황 속에서 **학문적 동기(academic motivation)**나 **학문적 기반(academic grounding)**은 상대적으로 현저히 덜 나타나고 있는 것처럼 보입니다. 실제로 많은 기관(예: 대학 등)은 **불확실성과 비용(uncertainty and expense)**을 감수하며 자체적으로 데이터 과학 활동을 수행하기보다는,
👉 **외부 서비스 제공업체(external service providers)와 계약(contract)**하는 것을 선호하는 경향이 있습니다.

물론 **최종 결정권자(decision makers)**는 여전히 교수진일 수 있지만, 👉 실제 **데이터 수집, 처리, 보고(data collection, processing, reporting)**는 **학문 밖의 영역(outside the academy)**에서 이루어질 수 있습니다.

 

이러한 상황에서는, 데이터 과학이 ‘과학(science)’이라 주장할 수 있는 근거조차 매우 미약해지는 것이죠.
📌 “The tenuous claim to be science is even more attenuated in these situations.”


여기서 우리는 잠시 멈추어 **“도대체 누가 데이터 과학자인가?”**라는 질문을 던져야 합니다.
👉 “Who is on the team?”

 

데이터 과학은 **팀 기반 활동(team-based activity)**이기 때문에, 팀 구성원에 대한 고민이 반드시 필요합니다.

이와 관련하여 Young과 Dubé(2024)는 다음과 같은 논의를 제시합니다:
👉 과학(science)의 또 하나의 기준은, **개인(individual)**에서 **팀(team)**으로 초점이 전환되면서 발생한다는 것.

 

현실적으로 데이터 과학에 투입되는 인력은 대부분

  • 프로그래머(programmers)
  • 통계전문가(statisticians)
  • 시스템 중심의 전문가(systems-focused professionals)

이들은 **전문 연구자(professionally-trained researchers)**나 **학자(academics)**가 아닌 경우가 많습니다.

그렇다면 우리는 이런 질문을 던질 수밖에 없습니다:
👉 “이들이 과연 진정한 의미의 '과학자(scientist)'라고 부를 수 있는가?”

 

물론 실험을 설계하고, 도구를 개발하며, 데이터를 수집하고 분석하여 결론을 도출하는 것은 외형상 분명 과학 활동처럼 보입니다.
그러나, **교육 분야(education)**에서는 **사회과학(social sciences)의 복잡성(complexities)**이 중심이 됩니다.
이는 **물리학이나 지질학처럼 선형적(linear)**인 자연과학의 접근과는 본질적으로 다릅니다.

👉 따라서 보건의료 전문직 교육(HPE)에서 데이터 과학이 진정한 ‘과학’이 되기 위해서는,
반드시 교육(education)과 사회과학(social sciences) 분야의 전문가가 팀에 포함되어야 합니다.


마지막으로 데이터 과학을 과학(science)으로 간주할 수 있는 또 하나의 기준은,

👉 _“정당하게 데이터 과학자(data scientist)로 인정받는 개인(individuals)의 양성과정이 존재하는가?”_입니다.

전 세계적으로 **데이터 과학을 위한 대학원 과정(graduate programs)**이 점점 늘어나고 있지만, 만약 이것이 기준이라면, 우리는 **Norman(2011)**이 제시한 **‘이민 학자(immigrant)’와 ‘정착 학자(settler)’의 유형 분류(typology)**를 떠올리게 됩니다.

즉, 보건의료 전문직 교육(HPE)에 뿌리를 두지 않고, 다른 분야에서 넘어온 연구자들을 말합니다.
이들은 물론 좋은 동료들일 수 있지만,
👉 “우리는 HPE 내부에서 데이터 과학자를 양성해야 하는 것이 아닐까?”
라는 질문을 진지하게 고려할 필요가 있습니다.


그렇다면, 이 글의 제목이 묻고 있는 질문,

👉 “데이터 과학은 HPE에서 과학인가?” 에 대한 대답은?

“그것은 상황에 따라 다르다(It depends).”

우리의 이 복잡하고 모호한 분야(HPE)에서 많은 일들이 그러하듯이 말입니다.


우리는 HPE 내에서 데이터 과학을 수행하는 이들에게 다음을 깊이 고민해볼 것을 제안합니다:

  • 이론 구축(theory building)의 여부와 수준
  • **데이터에 대한 통제력(control)**과 질적 수준(quality)
  • **연구팀의 구성(team composition)**과 전문성

이번 특별호에 실린 논문들을 보면,
👉 데이터 과학이 과학적 방식으로 수행될 수 있으며, 정당하게 학술지에 게재될 수 있는 연구 활동이 될 수 있음을 보여줍니다.

또한, 이와 동일한 기준을 적용하면,
프로그램 평가(program evaluation), 교육 혁신(innovation), 역사적 연구(historical scholarship) 등 다른 학문적 활동 영역들도 **과학으로서 주변적인 위치(marginal position)**에 있다는 점을 알 수 있습니다.

👉 “이들이 과학으로서 얼마나, 어떤 방식으로 정당성을 가질 수 있는가는
여러 요인과 연구자의 관점에 따라 달라집니다.”


사실, 데이터 과학은 과학적이지 않은 방식으로 접근, 수행, 보고되는 경우도 많습니다.
📌 Calling it a science — 즉, 이를 '과학'이라 부르는 것은
✔️ **더 많은 엄밀성(rigour)**과 **실질성(substance)**을 추구하는 *열망적 주장(aspirational drive)*일 수 있고,
✔️ 때로는 정당하지 않은 대상에 *권위를 부여하려는 수사적 전략(rhetorical play)*일 수도 있습니다.

반대로, 데이터 과학은 지금 **새로운 패러다임(new paradigm)**으로 자리를 잡아가는 과정일 수 있으며,
이 경우에는 **비판적 분석(critical analysis)**보다는
✅ *육성(nurture)*과 *지원(support)*이 더 적절할 수도 있습니다.


우리는 HPE 분야의 교육 연구자들에게 다음을 강력히 권고합니다:

👉 **데이터 과학이 진정한 의미에서 과학으로서 갖춰야 할 기준과 도전 과제를 숙고(reflect)**함으로써,
👉 보건의료 전문직 교육 내 데이터 과학이 가능한 한 엄밀하고 과학적이 될 수 있도록 만들어야 합니다.


 

Ellaway, R. H., & O’Sullivan, P. (2025). Is ‘data science’science?. Advances in Health Sciences Education, 1-5.

 

 

 

 

 

2021년, 필자 중 한 명은 의과대학 첫 강의에 들어가 보드에 쓰인 방정식을 마주했습니다:
“P = MD.”
(합격(Pass)이면 의사(MD)가 된다는 뜻입니다.)

강의실에 웃음이 퍼지며 집단적인 안도감이 느껴졌습니다. 교수는 우리에게 걱정을 멈추라고 말했습니다. 합격만 하면 된다고요.

“P = MD” — Passing was enough.

 

최근 수십 년 동안, 많은 의과대학들이 **Pre-clerkship(임상 전 교육과정)**에서 합/불(Pass/Fail) 평가의 사용을 확대해 왔습니다. 더 나아가 **Core Clerkship(핵심 임상실습)**에서도 이 같은 평가방식을 도입하려는 움직임이 점차 늘어나고 있습니다. 이러한 변화는 대부분 Pre-clerkship 교육을 중심으로 한 연구 결과에 기반하고 있으며, 이들 연구는 Pass/Fail 평가가 학생들의 단기적 웰빙(well-being)을 향상시킬 수 있지만, 학업 성취도에는 해가 없다고 제안합니다.

pass/fail grading may improve students’ short-term well-being without compromising academic performance.


🔹 Pass/Fail 평가를 지지하는 주장

Pass/Fail 평가 방식의 지지자들은 다음과 같은 주장을 펼칩니다:

  • 이 방식이 학생들로 하여금 **성장 마인드셋(growth mindset)**을 유지하도록 돕고,
  • 감독자에게 잘 보이려는 것보다 질문하고 배우는 것에 집중할 수 있게 한다고 봅니다.
  • 평가의 위험도를 낮추면, 학생들이 **평생 학습(lifelong learning)에 필요한 내재적 동기(intrinsic motivation)**를 개발할 수 있다고 봅니다.

이러한 주장은 성적 평가에 대한 논의의 초점을 '순위 매기기(ranking)'에서 '학습(learning)'으로 전환시키는 데 기여했으며, 이는 환영할 만한 변화입니다.


🔹 그러나: 임상 기술 저하에 대한 우려

하지만 최근 일부 연구에서는 **특정 임상 기술의 저하(decline in clinical skills)**가 보고되고 있으며, 이런 상황 속에서 너무 낮은 기준으로 합격선을 설정한 Pass/Fail 제도는 임상 역량의 탁월성을 약화시킬 수 있다는 우려가 제기되고 있습니다.

we worry that pass/fail grading systems that set a low bar for passing could undermine clinical excellence.

 

저자들은 다음과 같이 주장합니다:

  • 지금과 같은 Pass/Fail 방식 대신,
  • 의과대학은 학생들이 '임상적으로 탁월한(clinically outstanding)' 의사가 될 수 있도록 돕는 평가 체계를 구축해야 한다는 것입니다.

🔹 의과대학의 주된 사명과 평가 방식

의과대학과 수련 프로그램의 주된 사명은
➡️ 훌륭한 환자 진료(excellent patient care)를 제공할 수 있는 의사 양성입니다.

그러나 현재 형태의 Pass/Fail 시스템은 다음과 같은 이유로 그 목표를 위협할 수 있습니다:

  • 의과대학생은 모든 학습자와 마찬가지로, **활동의 가치(value)**에 따라 동기부여를 받습니다.
  • 학생들은 무엇이 실제 임상에서 필요한 지를 미리 알기 어렵습니다.
  • 따라서, 특히 임상적으로 중요한 내용을 다루는 필수 강의나 실습에서, **등급이 있는 평가(tiered grades)**는 학생들에게 학습 동기를 부여하는 역할을 합니다.
    • 이는 처음엔 중요해 보이지 않을 수 있지만, 훗날 의사로서의 역량(competence)을 갖추는 데 필수적인 주제들을 익히게 만듭니다.

👉 실제로, 의과대학 초기에 보인 학업 성취도는 이후 임상 역량과 관련이 있습니다.

Academic performance, even early in medical school, is associated with future clinical competence.

 


🔹 외재적 동기의 공백과 "그림자 경제(Shadow Economy)"

**등급이 있는 평가(tiered grades)**가 폐지되면, 그 자리를 **다른 외재적 동기(external motivators)**가 채우게 됩니다.
학생들은 레지던시 프로그램에 눈에 띄기 위해 압박감을 느끼게 되며,

Students feel pressure to distinguish themselves to residency programs.

 

등급이 없는 평가 체계 속에서, 학생들은 평가받지 않는(ungraded) 임상 기술을 향상시킬 것인지,
아니면 전략적 가치가 더 높은 활동들(e.g., 연구 활동)에 우선순위를 둘 것인지 사이에서 선택해야 합니다.

 

특히, **비임상 지표(nonclinical metrics)**를 중시하는 레지던시 프로그램에 지원할 계획인 학생들에게는 더욱 그렇습니다.

저자들은 이를 통해 다음과 같은 문제가 발생할 수 있다고 경고합니다:

  • 학생들이 점점 더 연구, 자원봉사, 아르바이트 등 다양한 활동을 쌓는 데 집중하게 되며,
  • 질보다는 양을 중시하는 경향이 생기고,
  • 그 결과, 임상 학습(clinical learning)이 희생될 수 있습니다.

We worry about the perpetuation of a “shadow economy”… at the expense of clinical learning.

 

나아가, **임상 학습과 돌봄(caregiving)에서 멀어지도록 만드는 유인(incentives)**은
➡️ 학생들의 **의학적 소명의식(sense of purpose)**을 약화시킬 수 있습니다.


🔹 평가 정보의 부재와 레지던시 선발의 왜곡

성적 정보가 사라진 상황에서는, 레지던시 프로그램 측도 지원자 간의 차이를 구별하는 데 어려움을 겪게 됩니다.

Without access to information on grades, residency programs may struggle to differentiate among applicants.

 

이 경우 가능한 두 가지 시나리오는 다음과 같습니다:

  1. 최선의 경우: 질적인 평가(qualitative evaluations)에 의존하겠지만,
    • 대부분의 코멘트는 너무 일반적이고 모호해서 실질적으로 쓸모가 없습니다.
  2. 최악의 경우:
    • **논문 수(publication count)**와 같은 **질 낮은 비임상 지표(low-quality, nonclinical metrics)**를 중시하거나,
    • **내부 인맥과 추천(back door endorsements)**에 의존하게 되어,
      연줄(connections)이 있는 학생들에게 유리하게 작용할 수 있습니다.

🔹 평가 방식에 대한 논쟁과 근거 부족

의과대학의 성적 평가 방식에 대한 논쟁은 학생들의 환멸(disillusionment) 증가와 교수들이 느끼는 학생들의 임상 실습 소홀 등의 인식 속에서 더욱 격화되고 있습니다.

Disagreements about medical school grading have intensified amid growing trainee disillusionment and a perception… that students have deprioritized clinical work.

 

이에 따라 성적 정책을 결정하는 데 있어 다음과 같은 고려가 필요합니다:

  • 학생 웰빙(well-being)
  • 동기부여(motivation)
  • 타당도(validity)
  • 형평성(equity)
  • 레지던시 선발(residency selection)

그러나, 이와 관련한 대부분의 주장은 의견(opinions)에 기반할 뿐이며,
정책 결정을 뒷받침할 만큼 충분한 근거(evidence)는 부족합니다.


🔹 Tiered Grading의 장단점

**등급 평가(tiered grading)**는 학생들에게 임상 활동에 더 많은 노력을 기울이도록 동기를 부여하지만,
다음과 같은 단점도 존재합니다:

  • 임상 평가 기준은 주관적이고 불명확할 수 있으며,
  • 학생들은 자신의 지식 부족을 감추기 위해 질문을 회피하거나 도전을 두려워하게 되고,

students may avoid asking questions and learn to fear challenges rather than welcome them.

  • 또한, **임상실습 평가(clerkship grading)**는
    인종, 민족, 성별에 따라 **불평등(disparities)**이 존재한다는 연구 결과도 있으며,
    이는 소수자 집단(marginalized groups)에게 불리하게 작용하고,
    **유능한 임상의(talented clinicians)**를 발굴하는 데 방해가 됩니다.

🔹 제안: 낮은 기준은 충분하지 않다

이처럼 상반된 **이점과 위험성(conflicting benefits and risks)**이 공존하면서, 의과대학 평가 방식, 특히 Clerkship 평가를 둘러싼 논란이 깊어지고 있습니다. 저자들은 주장합니다:

“Until there is a stronger evidence base… any system that involves setting low standards for clinical learning isn’t good enough.”
"임상 학습에 대해 낮은 기준을 설정하는 어떤 시스템도 충분하지 않다."


✅ 다섯 가지 핵심 제안 (표로 제시됨)

저자들은 Tiered vs. Pass/Fail 논쟁을 넘어설 수 있도록,
다음의 **5가지 평가 우선 영역(five priority areas for assessment)**을 제안합니다:

  1. 환자 진료(patient care)의 핵심 가치 강조
  2. 근거 기반의 평가 정책 결정
  3. 임상 학습 경험의 강화
  4. 형평성 있는 제도 운영(equitable institutional practices)
  5. 임상적 탁월성(clinical excellence) 문화를 조성

We believe medical school leaders should emphasize the core value of patient care… and support a culture of clinical excellence.

 


🔷 의학교육 평가를 위한 다섯 가지 우선 과제 (Five Priorities for Medical Education Assessment)


1️⃣ 평가 목표 설정: 학생뿐 아니라 미래의 환자를 고려해야 함

의과대학의 리더들은 **교수진과 학생 등 다양한 이해관계자(stakeholders)**와 협력하여
**학생뿐 아니라 학생의 미래 환자들을 위한 평가 목표(assessment goals)**를 설정해야 합니다.

"define assessment goals that take into account commitments not just to students but also to students’ future patients."

 

물론, 이상적으로는 학생의 웰빙(well-being), 과외 활동 참여(extracurricular engagement),
그리고 환자 진료 목표(patient care goals) 사이에서 win–win 해법을 찾을 수 있습니다.
하지만, 모든 목표를 동시에 만족시킬 수 없는 경우에는
➡️ 관리자들이 이러한 상충(trade-offs)에 대해 투명하게 소통해야 합니다.


2️⃣ 근거 기반의 정책 결정: 단기성과를 넘어서 장기성과까지 고려

신약이나 기술을 평가하듯이, 의과대학도 성적 제도를 단순한 의견(opinions)이 아니라, 데이터(data)에 기반해 설계해야 합니다.

  • 시험 성적이나 학생 만족도와 같은 **단기 지표(short-term outcomes)**만이 아니라,
  • **학습, 웰빙, 그리고 궁극적으로는 환자 진료 역량(patient care skills)**에 미치는 장기적 영향을 평가해야 합니다.

📌 **무작위 연구(randomized studies)**도 윤리적·실현 가능하며,
➡️ 학생들이 무작위 배정에 대해 사전 동의한 경우 의학교육에서도 충분히 활용 가능합니다.

또한 다음과 같은 체계를 구축해야 합니다:

  • 실시간 데이터를 모니터링하여 **지속적 질 향상(continuous quality improvement)**에 활용하고,
  • 졸업생들의 임상 역량 및 성장 가능성에 대한 피드백을 레지던시 프로그램으로부터 받아야 합니다.

3️⃣ 평가 외적 요소에 대한 주의: 임상 경험의 질과 피드백이 학습을 결정짓는다

성적 제도가 학습에 미치는 영향에만 집중해서는 안 됩니다.
의과대학은 다음과 같은 교육과정(curricular) 요소들도 함께 고려해야 합니다:

  • 임상실습의 횟수, 강도, 특성
  • 의미 있는 역할 부여 (e.g., graduated autonomy in clerkships)
  • 고품질의 피드백 제공(high-quality and timely feedback)
  • 사례 기반 학습(case-based learning), 표준화 환자 활동(standardized-patient experiences) 등으로
    Pre-clerkship 단계에서 임상 추론 능력을 키우는 활동

이러한 전략은 어떤 평가 제도를 사용하든 학습 향상에 기여할 수 있으며,
**학생–교수 간의 연속적인 상호작용(continuity)**은
➡️ 시간에 따른 객관적 및 주관적 데이터의 통합을 가능하게 하고,
➡️ **학생들의 장기적 성장(longitudinal development)**을 촉진할 수 있습니다.


4️⃣ 평가 형평성 확보: 차별(disparity)을 인지하고 시정하라

의과대학은 **성적 평가에서 나타나는 불평등(disparities)**을 철저히 감시(vigilant)하고,
제도적 정책이 이를 완화하거나 악화시키는 방식에 대해 숙고해야 합니다.

이를 위해 다음을 고려해야 합니다:

  • 상과(honors)나 수상(awards)의 기준이 편향되어 있는지 점검하고,
  • 필요 시 편향된 지표(biased metrics)의 사용을 피해야 하며,
  • 레지던시 프로그램과의 투명한 정보 공유를 통해
    ➡️ 학생 평가의 형평성 확보를 도모해야 합니다.

5️⃣ 임상적 탁월성(clinical excellence)을 일관되게 강조하라

성적 체계가 tiered든 pass/fail이든 상관없이, 의과대학은 의과 교육 전반에 걸쳐 임상적 탁월성을 강조해야 합니다:

  • 학생 선발(admissions)
  • 오리엔테이션
  • 재방문 프로그램(revisit)
  • 강의와 실습
  • 레지던시로의 전환 등 모든 교육의 순간에서

특히 Pass/Fail 제도를 도입한 학교는 다음 두 가지를 반드시 수행해야 합니다:

  1. 합격 기준(passing threshold)은 ‘의미 있고 높은 수준’이어야 하며,
  2. **기준을 충족하지 못한 학생에게는 충분한 보완(remediation)**이 이루어져야 합니다.

Administrators… must ensure that they set a meaningful passing threshold — in other words, a high bar for clinical excellence — and implement substantive remediation…

 

“P = MD”라는 개념은 더 이상 유효하지 않으며,
➡️ 학생들에게는 합격선을 넘는 성취가 헛된 노력(wasted effort)이 아니라는 메시지를 전달해야 합니다.


✅ 결론: “Good Enough”는 충분하지 않다

“When it comes to training physicians, we believe a grading system that supports the concept of just ‘good enough’ isn’t good enough.”

 

의사를 양성하는 데 있어, 단지 “충분히 괜찮은(good enough)” 정도로 만족시키는 성적 제도는 결코 충분하지 않습니다.

우리는 교육 프로그램이 **임상적 탁월성(clinical excellence)**을 중심 가치로 재확인하고,
이를 향해 나아가도록 체계를 조정할 때, 비로소 더 높은 수준의 교육과 평가를 실현할 수 있습니다.

“By reaffirming the centrality of clinical excellence and aligning educational programs to advance this goal, we can all earn a higher grade.”


 

 

 

🏫 의과대학 평가를 위한 우선 영역 (Priority Areas for Medical School Assessment)

 

우선 영역  예시
1. 환자 진료의 핵심 가치 강화 (Advance the core value of patient care) • 교수진, 학생 등 **이해관계자(stakeholders)**와 협력하여 학생의 현재뿐 아니라 미래 환자에 대한 책무를 포함하는 공유된 목표를 정의
• 학생의 임상적 탁월성을 의사의 다른 모든 역량의 기반으로 인식하면서도 학교의 고유한 목표와 정렬
• 모든 교육적 목표를 동시에 달성하기 어려운 경우, **불가피한 교육적 선택(trade-offs)**에 대해 투명하게 소통
2. 근거 기반의 평가 정책 수립 (Make evidence-based decisions about grading policies) • 평가 개입이 학습, 웰빙 등 학생의 교육 및 경력 전반의 성과에 어떤 영향을 주는지 고려
단기적 이득이 장기적 해악을 줄 수 있음(그 반대도 마찬가지)을 인식
실시간 교육 데이터를 모니터링하여 지속적 질 향상을 지원
레지던시 프로그램으로부터 졸업생의 역량과 성장 가능성에 대한 확장된 피드백 확보
3. 임상 학습 경험의 질 향상 (Enhance clinical learning experiences) 평가를 넘어서는 교육과정 설계 요소들(예: 임상 경험의 수, 강도, 성격)을 고려
성적 제도와 관계없이 임상 학습을 개선할 수 있는 요소들 고려 (예: 핵심 임상실습에서 점진적 자율성 명시 제공 등 의미 있는 역할 부여)
4. 제도적 형평성 확보 (Ensure equitable institutional practices) • 학교별 성적 평가의 격차를 모니터링
격차를 확대시킬 수 있는 상·포상 기준을 검토
• 학생 및 레지던시 프로그램과 성적 격차에 대한 정보 공유 (예: **의과대학생 수행 평가서(MSPE)**에 명시)
5. 임상적 탁월성의 문화 조성 (Support a culture of clinical excellence) 임상적 숙련(clinical mastery)의 중요성을 강조
임상적 탁월성을 전 교육과정에 걸쳐 추진 (예: 학생 선발, revisit 프로그램, 오리엔테이션, 강의 및 실습, 레지던시로의 이행 등)
Pass/Fail 제도 하에서도 의미 있는(즉, 높은) 합격 기준을 설정하고, 이를 충족하지 못할 경우 **실질적인 보완(remediation)**을 제공하며, 합격 기준 이상의 성취가 불필요한 노력이라는 인식을 방지

📝 이 표는 논문 본문에서 제시된 다섯 가지 평가 우선 영역을 구체적 실행 전략과 함께 요약한 것입니다. 블로그 포스트나 슬라이드 제작용으로 시각적 구조를 유지한 채 재구성하거나, 각 항목을 해설하는 교육자료 형식으로도 정리해드릴 수 있으니 원하시는 방향이 있다면 말씀해주세요!

 

Iyer, A. A., Hirsh, D. A., & Schwartzstein, R. M. (2025). Medical School Grading—Is “Good Enough” Good Enough?. New England Journal of Medicine.

 

🎓 협력학습(Collaborative Learning)의 본질을 파헤치다

– Marjan Laal의 논문을 바탕으로

안녕하세요! 오늘은 의학교육이나 다양한 교수 상황에서 자주 언급되는 ‘협력학습(Collaborative Learning)’이란 무엇인지, 그리고 진정한 협력학습으로 작동하기 위해 어떤 요소들이 필요한지를 탐구해보려고 해요. 소개해드릴 논문은 Marjan Laal 교수가 발표한 *“Collaborative Learning; Elements”*입니다.

 

이 글 하나만 읽어도, 해당 논문의 핵심 내용을 충분히 이해할 수 있도록 찬찬히 풀어볼게요. 😊


🧩 협력학습이란 무엇인가요?

논문에서는 협력학습을 이렇게 정의하고 있어요.

“협력학습은 다양한 수행 수준의 학습자들이 소그룹으로 함께 공통의 목표를 향해 나아가는 수업 방식이다.”
"Collaborative learning refers to an instruction method in which learners at various performance levels work together in small groups toward a common goal."

 

여기서 중요한 건, 단순히 모여 앉아 있는 게 협력학습이 아니라는 거예요. 서로 도움이 되는 방식으로 적극적으로 상호작용하고, 공통의 책임을 가지며, 학습 공동체로서 기능할 때 진정한 협력학습이 되는 겁니다.


🤝 왜 협력학습인가요?

Laal 교수는 협력(collaboration)을 이렇게 설명합니다.

“협력은 상호작용의 철학이자 삶의 태도다. 개인은 자신의 행동에 책임을 지며, 동료의 능력과 기여를 존중한다.”
"Collaboration is a philosophy of interaction and personal lifestyle where individuals are responsible for their actions, including learning and respect the abilities and contributions of their peers."

 

21세기에 들어서면서, 혼자 생각하고 일하는 방식에서 벗어나, 함께 고민하고 함께 해결하는 방식이 점점 더 중요해지고 있어요. 특히 교육현장에서는 토론, 협업, 다양한 시각의 교류를 통해 더 깊이 있는 이해가 가능해지죠.


⚙️ 협력학습을 구성하는 5가지 핵심 요소

논문은 Johnson & Johnson의 연구(1990, 1998)를 토대로, 협력학습의 핵심 요소 다섯 가지를 다음과 같이 제시하고 있어요.

1. ✅ 긍정적인 상호의존성 (Positive Interdependence)

팀원들은 서로에게 의존할 수밖에 없고, 누군가 제 역할을 하지 않으면 전체가 영향을 받는 구조여야 해요.

“각 팀원들은 성공을 위해 서로에게 의존해야 한다는 믿음을 가져야 한다.”
"Members need to believe that they are linked with others in a way that ensures that they all succeed together."

이런 구조가 제대로 만들어져야 협력학습이 작동해요. “너 없인 나도 없다”는 걸 모두가 이해해야 하죠. 🔗


2. 💬 상호작용 (Promotive Interaction)

팀원들은 서로를 도우며 배워야 해요. 단순한 정보 교환이 아니라, 문제 해결 방법을 설명하고, 개념을 논의하고, 서로의 이해를 확인하는 상호작용이 필요하죠.

“그룹 구성원들은 피드백을 주고받고, 결론을 도전하며, 가장 중요하게는 서로를 가르치고 격려해야 한다.”
"Group members must be done interactively providing one another with feedback, challenging one another's conclusions and reasoning, and perhaps most importantly, teaching and encouraging one another."


3. 🙋 개별 책무성 (Individual Accountability)

공동 작업이라 하더라도 모든 팀원이 각자의 책임을 져야 해요. ‘무임승차’는 협력학습을 망치는 지름길이에요.

“모든 팀원은 작업의 자신의 부분과 학습 내용 전체를 숙달할 책임이 있다.”
"All members in a group are held accountable for doing their share of the work and for mastery of all of the material to be learned."


4. 🗣️ 사회적 기술 (Social Skills)

단순히 앉아서 얘기만 하면 될까요? 아니요. 협력은 기술이에요. 특히 신뢰, 의사소통, 갈등관리, 리더십 같은 사회적 기술이 매우 중요하죠.

“구성원들은 신뢰 구축, 의사결정, 커뮤니케이션, 갈등관리 등의 기술을 개발하고 연습해야 한다.”
"Members are encouraged and helped to develop and practice trust-building, leadership, decision-making, communication, and conflict management skills."


5. 🔍 집단 자기 평가 (Group Processing)

그룹은 주기적으로 “우리가 잘하고 있는가?”, “무엇을 개선할까?”를 돌아봐야 해요. 이를 통해 집단의 기능을 지속적으로 향상시킬 수 있죠.

“협력적 노력을 통해 목표를 달성하는 데 있어 구성원들의 효과성을 명확히 하고 향상시키는 것, 그것이 집단 자기 평가의 목적이다.”
"The purpose of group processing is to clarify and improve the effectiveness of the members in contributing to the collaborative efforts to achieve the group’s goals."


💭 협력학습이 왜 중요한가요?

이 논문에서는 **공자(Confucius)**의 오래된 말을 인용하면서 협력학습의 철학을 이렇게 정리하고 있어요.

“나에게 말하면 잊어버릴 것이다. 나에게 보여주면 기억할지도 모른다. 나를 참여시키면 이해할 것이다.”
"Tell me and I will forget, Show me and I may remember, Involve me and I will understand."

 

그리고 Silberman은 이 말을 확장해서 이렇게 표현했죠.

“내가 듣는 것은 잊어버리고, 듣고 보는 것은 조금 기억하며, 듣고 보고 질문하거나 토론하는 것은 이해하기 시작한다.
듣고 보고 토론하고 행동하는 것은 지식과 기술을 익히고,
누군가에게 가르치는 것은 완전히 숙달하게 된다.”
"What I hear, I forget. What I hear and see, I remember a little. What I hear, see, and ask questions about or discuss with someone else, I begin to understand. What I hear, see, discuss and do, I acquire knowledge and skills. What I teach to another, I master."

 

결국 학습자는 수동적으로 듣는 존재가 아니라, 능동적으로 참여하고 가르칠 수 있을 때 진짜 학습이 이루어진다는 거예요. 🎯


🧠 마무리 정리: 협력학습의 핵심 키워드

핵심 요소 의미 요약

✅ Positive Interdependence 함께 살아남거나 함께 실패함
💬 Promotive Interaction 적극적인 상호 설명과 지지
🙋 Individual Accountability 책임은 각자에게 있음
🗣️ Social Skills 신뢰와 소통, 갈등관리 능력
🔍 Group Processing 정기적인 성찰과 개선 노력

 


🔶 1.1. 서론 (Introduction)


✅ 협력(Collaboration)의 철학적 의미

  • **협력(collaboration)**은 단지 작업 방식이 아니라,
  • 상호작용에 대한 철학이자, **개인의 삶의 태도(lifestyle)**이다.
  • 이 철학은 다음을 전제로 한다:
    • 개인은 자신의 행동(learning 포함)에 대해 책임을 지고,
    • 동료의 능력과 기여를 존중한다.
  • 사람들이 모여 집단을 이루는 모든 상황에서, 협력은 다음과 같은 상호작용 방식을 제안한다:
  • 구성원 각자의 역량과 기여를 존중하고 부각시키는 관계 설정
  • CL에서는 다음과 같은 집단 내 민주적 구조가 중요하게 작동한다:
    • 권한의 공유 (Sharing of authority)
    • 책임의 수용 (Acceptance of responsibility)

✅ 협력학습(Collaborative Learning, CL)의 근본 전제

  • 협력학습의 핵심은 경쟁이 아니라 협력이다.
  • 구성원 간의 협력을 통해 **합의(consensus)**를 이끌어내는 방식이며,
    이는 개인이 다른 구성원을 이기기 위해 경쟁하는 방식과는 대조적이다.
  • 이러한 협력적 철학은 단지 교실 수업에만 국한되지 않으며,
  • 위원회 회의, 지역사회 활동, 가정 내 상호작용 등 다양한 상황에서
    **삶의 방식(living and dealing with people)**으로 실천된다 (Panitz, 1996).

✅ 21세기의 협력 필요성

  • 협력은 **21세기의 대표적 인간 참여 방식(human engagement)**으로 주목받고 있다.
  • 복잡하고 비판적인 문제들을 해결하기 위해,
  • 함께 사고하고, 함께 일하는 능력의 필요성이 증가하고 있다 (Austin, 2000; Welch, 1998).
  • 이에 따라 교육에서도 다음과 같은 변화가 일어나고 있다:
    • 개인 중심 시도 → 팀워크 중심
    • 자율성 중심 → 공동체성 중심
      (Leonard & Leonard, 2001)

✅ CL의 오해들 (Klemm, 1994)

협력학습은 종종 잘못 이해되는데, 다음과 같은 활동은 CL이 아니다:

  1. 각자 개별 과제를 하며 서로 대화만 나누는 것 (직접 혹은 온라인)
  2. 개인별로 과제를 수행한 후, 먼저 끝낸 사람이 나중에 끝낸 사람을 도와주는 것
  3. 한두 명만 과제를 수행하고, 나머지는 결과물에 이름만 올리는 것

진정한 CL은 상호 의존적이며, 공동 책임을 기반으로 한 적극적 참여와 지적 상호작용을 포함해야 한다.


✅ 본 논문의 목적

  • 이 논문은 다음을 목적으로 한다:
    • 협력학습의 기본 개념을 제시하고,
    • CL을 구성하는 핵심 요소들정의하고 특성화하려는 시도이다.

📌 요약 정리

항목 내용

협력의 개념 상호 존중과 책임을 전제로 하는 삶의 철학
CL의 핵심 전제 경쟁이 아닌 합의, 권한 공유와 책임 수용
21세기 교육 흐름 개인 → 팀, 자율성 → 공동체성 중심으로 이동
잘못된 이해 단순 대화, 비대칭적 과제 분담은 CL이 아님
논문 목적 협력학습의 정의와 핵심 요소를 체계적으로 설명

 

🔶 1.3. 결과 (Results)


✅ 인간 상호작용 방식의 세 가지 유형 (Brown & Lara, 2011, 인용: Johnson, 2009)

개인이 타인의 행동과 관련하여 행동을 취하는 방식에는 세 가지가 있다:

  1. 타인의 성공을 촉진하는 방식 (협력적)
  2. 타인의 성공을 방해하는 방식 (경쟁적)
  3. 타인의 성공/실패와 무관한 방식 (개별적)

즉, 개인은 다음 세 가지 방식 중 하나로 행동할 수 있다:

  • ♻️ 협력적(cooperative):
    공동의 학습 목표 달성을 위해 함께 작업하는 방식
  • ⚔️ 경쟁적(competitive):
    소수만이 도달할 수 있는 목표를 두고 서로 경쟁하는 방식
  • 👤 개별적(individualistic):
    다른 사람의 목표와 무관하게 자신만의 목표를 위해 학습하는 방식

✅ 협력학습(CL)의 특징 (Srinivas, 2011)

  • CL은 학습자들이 집단을 이루어 문제를 해결하거나, 과제를 완수하거나, 산출물을 창출하는 교육적 접근이다.
  • CL 환경에서는 학습자가 사회적·정서적으로 도전을 받는다:
    • 다양한 관점을 듣고,
    • 자신의 생각을 표현하고 방어하며,
    • 자신만의 개념적 틀을 구축하게 된다.
  • 학습자들은 다음과 같은 경험을 하게 된다:
    • 동료와 의사소통
    • 아이디어 제시 및 방어
    • 다양한 신념 교환
    • 다른 개념 틀에 대한 질문 제기
    • 능동적 참여

✅ Johnson 외 (1990)의 협력학습 5대 핵심 요소

협력학습은 단순히 집단으로 학습하는 것과는 다르며,
다음의 5가지 구성 요소가 충족될 때에만 진정한 CL로 간주된다:


1️⃣ 명확히 인식된 긍정적 상호의존성 (Positive Interdependence)

  • 팀원은 목표 달성을 위해 서로에게 의존해야 하며,
  • 한 명이 역할을 다하지 않으면 모두가 손해를 본다.
  • 모든 구성원은 서로가 성공해야 나도 성공할 수 있다는 믿음을 공유해야 한다.
  • 핵심 개념:
  • “함께 하면 더 나은 학습과 산출물이 가능하다”는 믿음

2️⃣ 의미 있는 상호작용 (Considerable Interaction)

  • 구성원들은 서로를 돕고 격려하며 학습을 촉진한다:
    • 이해한 내용을 설명
    • 지식 공유 및 수집
    • 피드백 제공
    • 결론과 추론에 대한 도전
    • 서로에게 가르치고, 동기를 부여
  • 이러한 상호작용은 쌍방향적이고 능동적으로 이루어져야 한다.

3️⃣ 개별 책임과 개인적 책임 (Individual Accountability & Personal Responsibility)

  • 각 구성원은:
    • 자신의 역할을 성실히 수행할 책임
    • 학습할 모든 내용을 이해하고 숙달해야 할 책임이 있다.

4️⃣ 사회적 기술 (Social Skills)

  • CL은 인지적 활동뿐만 아니라, 사회적 역량 개발도 중요시한다.
  • 학습자들은 다음과 같은 기술을 배우고 연습한다:
    • 신뢰 형성
    • 리더십
    • 의사결정
    • 의사소통
    • 갈등 관리

5️⃣ 집단 자기평가 (Group Self-Evaluation / Group Processing)

  • 팀은 다음을 수행해야 한다:
    • 그룹 목표 설정
    • 현재 잘하고 있는 점 평가
    • 더 나은 작동을 위한 개선 방안 도출
  • 이는 팀의 지속적인 성장과 학습 효율성을 도모하는 핵심 절차이다.

✅ 핵심 요약표

요소 설명

상호의존성 함께 성공해야 한다는 믿음과 구조
상호작용 피드백, 설명, 도전 등 활발한 상호작용
개별 책임 각자의 역할과 학습에 대한 책임
사회적 기술 신뢰, 소통, 리더십, 갈등관리 등 협력에 필요한 역량
집단 평가 목표 설정, 진행 평가, 개선 전략 도출

 

🔶 1.4. 논의 (Discussion)


✅ 공자의 교육 철학: 참여를 통한 이해

2400여 년 전, **공자(Confucius)**는 다음과 같은 교육적 통찰을 남겼다:

  • 🗣️ “말해주면 잊어버린다
  • 👁️ “보여주면 기억할지도 모른다
  • 🤝 “참여하게 하면 이해한다

→ 공자는 이미 수천 년 전에, 학습자가 능동적으로 참여할 때 진정한 학습이 일어난다고 보았다.


✅ 21세기 학습자의 요청: “나를 참여시켜달라”

  • 오늘날 학습자들도 공자와 동일한 메시지를 외치고 있다:
  • “단순히 알려주지 말고, 내가 직접 참여하고 몰입할 수 있도록 해달라”
    (Hsu & Malkin, 2011)
  • 학습은 단순히 정보를 누군가의 머릿속에 붓는다고 해서 일어나는 것이 아니다.
  • 학습자는 스스로 **인지적 처리(mental processing)**를 수행해야 하며,
    수동적 강의만으로는 진정한 학습이 일어날 수 없다.

✅ Silberman의 ‘능동 학습 신조’ (The Active Learning Credo)

  • **Silberman (1996)**은 공자의 말을 현대적으로 재해석하여,
    학습의 깊이를 설명하는 **능동 학습 신조(Credo)**를 제시했다:

활동 수준 학습 수준

내가 들은 것 잊어버린다.
내가 듣고 본 것 약간 기억한다.
내가 듣고 보고 질문하거나 토론한 것 이해하기 시작한다.
내가 듣고 보고 토론하고 직접 해본 것 지식과 기술을 습득한다.
내가 다른 사람에게 가르친 것 완전히 숙달한다.
  • 이 Credo는 학습의 수준이 정보 수용 → 상호작용 → 수행 → 가르침으로 갈수록
    점점 더 깊이 있는 이해와 숙달로 나아간다는 점을 보여준다.

✅ 논의의 시사점

  • 참여와 몰입은 협력학습의 핵심 원리이자,
  • 고대의 교육 철학과 현대 학습과학이 일치하는 지점이다.
  • 협력학습은 학습자가:
    • 질문하고,
    • 토론하고,
    • 직접 해보고,
    • 타인과 상호작용하며,
    • 심지어 가르치는 ‘행위자(Agent)’로 전환되는 교육적 환경을 설계한다.

📌 요약 정리

항목 내용

공자의 통찰 말보다는 직접 참여가 학습의 핵심
현대의 반영 학습자는 수동적 대상이 아니라, 능동적 주체
Silberman의 Credo 듣기 → 보기 → 토론 → 실천 → 가르치기 = 학습의 심화
교육적 시사점 협력학습은 깊이 있는 참여와 몰입을 설계하는 접근

 


🔶 협력학습(CL)의 개념과 핵심 요소: 긍정적 상호의존성 중심


✅ 협력학습(CL)의 기본 개념 (Gokhale, 1995 인용)

  • 협력학습(CL)은 학습자들이 공동의 학습 목표를 달성하기 위해 짝을 이루거나 소그룹을 구성하는 교수법이다.
  • 이 교수법은 다음의 특징을 지닌다:
    • 수준이 다양한 학습자들이 함께 소그룹으로 작업함
    • 학습자는 자신뿐 아니라 동료의 학습에도 책임을 짐
    • 한 사람의 성공이 다른 사람의 성공으로 이어짐

✅ 핵심 구성 요소: 긍정적 상호의존성 (Positive Interdependence)

▶ 정의 및 설계 방법

  • 긍정적 상호의존성은 다음과 같이 구조화되어야 효과적이다:
  • 구성원들이 “나 혼자 성공할 수 없고, 모두가 함께 성공해야 한다”는 인식을 갖도록 하는 구조
  • 따라서 그룹의 목표와 과제는 다음의 방식으로 설계되어야 한다:
    • 함께 성공하거나 함께 실패한다는 메시지가 전달되어야 함 (sink or swim together)
    • 개별 구성원의 노력이 필수적이고, 대체 불가능한 것으로 인식되어야 함
    • 각 구성원이 자신만의 자원, 역할, 책임을 바탕으로 고유한 기여를 하도록 구조화되어야 함

▶ 핵심 효과

  • 이러한 구조는 다음과 같은 효과를 낳는다:
    • 학습자는 **자신뿐 아니라 동료의 성공에도 헌신(commitment)**하게 된다.
    • 긍정적 상호의존성이 없다면 협력학습도 성립하지 않는다.
  • 구성원들이 긍정적 상호의존성을 명확히 이해하게 되면, 다음을 인식하게 된다:
    • 모든 구성원의 노력이 필요하고 대체 불가능
    • 각자의 자원, 역할, 책임을 기반으로 한 고유한 기여가 존재함
      (Johnson, R.T., Johnson, D.W., & Holubec, E.J., 1998)

✅ 상호작용의 조건: 긍정적 상호의존성만으로는 부족하다

  • CL 활동에서 요구되는 충분한 수준의 상호작용을 생성하려면,
    긍정적 상호의존성만으로는 충분하지 않다.

▶ 더 강한 상호작용을 유도하기 위한 조건

  1. 구성원들은 팀의 성공이 각자의 기여에 달려 있다인지해야 한다.
  2. 성공을 위해서는 지속적인 상호작용, 특히 **대면 상호작용(face-to-face interaction)**이 필수적이라고 믿어야 한다.

✅ 핵심 정리

항목 설명

협력학습 정의 수준이 다양한 학습자들이 공동 목표를 위해 소그룹으로 작업
책임 구조 학습자는 자기 학습 + 동료 학습 모두에 책임
긍정적 상호의존성 구성원 간 “같이 성공해야 한다”는 인식 구조화
핵심 요소 개인의 기여는 필수이며 대체 불가능
상호작용 조건 긍정적 상호의존성 + 지속적, 대면적 상호작용 필요

 

🔶 협력학습의 구성 요소: 상호의존성, 상호작용, 개별 책무성


✅ 1. **긍정적 상호의존성 (Positive Interdependence)**의 한계와 조건

  • 보고서 작성, 프로그래밍 과제 등은 하나의 공동 산출물을 만들기 때문에
    겉보기에는 긍정적 상호의존성을 가진 과제로 보일 수 있다.
  • 하지만 이러한 과제가 지속적인 상호작용을 반드시 요구하지는 않는다.
  • 진정한 긍정적 상호의존성의 핵심은 다음에 있다:
  • 자기 자신의 성공뿐만 아니라, 팀의 모든 구성원이 성공하도록 헌신하는 것
    (istudy, 2004)

✅ 2. 촉진적 상호작용 (Promotive Interaction)

  • 촉진적 상호작용이란 학습 활동 또는 과제가 다음을 필요로 하는 경우를 말한다:
    • 지속적인 대화(conversation)
    • 의견 교환(exchange)
    • 상호 지원(support)
  • 구성원들은 실제로 함께 작업하면서,
  • 자원을 공유하고, 서로를 돕고, 격려하고, 성취를 축하하며
    → **상호 성공을 촉진(promote)**한다.

▶ 이때 발생하는 주요 인지 활동과 상호작용 역학:

  • 문제 해결 방법에 대한 구두 설명
  • 자신의 지식을 다른 사람에게 가르치기
  • 이해도 점검
  • 현재 학습 중인 개념에 대해 토론
  • 현재 학습과 과거 지식 간 연결짓기

➡️ 이러한 활동은 집단 과제 지시와 절차에 구조화하여 포함시킬 수 있다.

▶ 결과적으로 CL 그룹은 다음의 이중적인 지원 체계가 된다:

구분 설명

학업 지원 시스템 각 구성원이 서로의 학습을 도와주기 위해 헌신
개인 지원 시스템 각 구성원이 상대방 ‘그 자체’를 지지하고 존중

📌 대면 상호작용을 통한 학습 촉진 과정 속에서,
구성원들은 서로의 성공과 존재 모두에 헌신하게 된다 (Foundation Coalition, 2004)


✅ 3. 개별 책무성 (Individual Accountability)

▶ 정의와 필요성

  • 개별 책무성은 **무임승차(free riding)**나 **사회적 태만(social loafing)**을 방지하기 위한 구조적 장치이다.
  • 이는 학습자 각자가:
    • 자신의 수행과 학습에 책임을 져야 한다는 인식을 갖는 것

▶ 실제 구현 방법

  • 각 개인의 수행을 평가하고,
  • 그 결과를 개인과 그룹에 모두 피드백함으로써,
    • 누가 더 많은 지원이나 격려가 필요한지 파악할 수 있다.

▶ 무임승차가 발생하기 쉬운 상황 (Harkins & Petty, 1982; Kerr & Bruun, 1981; Williams et al., 1981):

  • 각자의 기여도를 식별하기 어려운 경우
  • 구성원들의 기여가 중복되는 경우
  • 구성원들이 최종 산출물에 대해 책임지지 않는 경우

➡️ 이럴 때 학습자는 책임감을 느끼지 않고, 학습에 소극적으로 참여하게 된다.


✅ CL의 목표와 개별 책무성의 의미

  • 협력학습의 목적은, 각 구성원이 독립적으로도 강한 학습자가 되도록 돕는 것이다.
  • 구성원은 함께 학습함으로써,
  • 나중에는 혼자서도 더 잘 수행할 수 있는 역량을 갖추게 된다.
  • 다시 말해, CL은 집단 속에서 학습한 내용을 개인의 내면화로 전환시키는 교수 전략이다.

📌 요약 정리

요소 핵심 내용

긍정적 상호의존성 개인과 집단 모두의 성공에 대한 헌신 구조 필요
촉진적 상호작용 상호 학습 촉진 활동(설명, 토론, 가르치기 등)을 통한 공동 몰입
개별 책무성 무임승차 방지, 각자의 기여도 명확화, 개인 역량 강화 목표

 

🔶 협력학습의 핵심 요소 ④⑤: 대인관계 기술 & 집단 과정


✅ ④ 대인관계 및 소집단 기술의 적절한 사용 (Appropriate Use of Interpersonal and Small-Group Skills)

▶ 협력적 목표 달성을 위한 필수 조건 (Johnson, 2005; 1991; Johnson & Johnson, 2008)

서로의 노력을 조율하고 공동의 목표를 달성하기 위해, 학습자들은 다음과 같은 사회적 기술을 활용할 수 있어야 한다:

  • 🤝 서로를 이해하고 신뢰하는 것
  • 🗣️ 정확하고 명확하게 소통하는 것
  • 💬 서로를 수용하고 지지하는 것
  • ⚖️ 갈등을 건설적으로 해결하는 것

📌 이 네 가지는 협력학습이 원활히 작동하기 위한 기초 역량이다.

▶ 사회적 기술 교육의 필요성

  • 학습자들이 협력학습 환경에서 **질 높은 협력(high-quality collaboration)**을 수행하기 위해서는,
    • 관련 사회적 기술을 명시적으로 가르쳐야 하며,
    • 그것을 적극적으로 사용하도록 동기를 부여해야 한다.
  • 집단 역학(group dynamics) 분야 전체는 다음의 전제를 기반으로 한다:
  • “사회적 기술은 집단의 생산성을 좌우하는 핵심 요인이다.”
    (Johnson & Johnson, 2008)

✅ ⑤ 집단 과정 (Group Processing)

▶ 정의 및 개념

  • 집단 과정이란, 그룹이 자신의 작동 방식을 **반성적으로 성찰(reflect)**하는 것을 의미한다.
  • 여기서 ‘과정(process)’이란:
  • 시간에 따라 일어나는 일련의 식별 가능한 사건들의 흐름
  • **결과 목표(outcome goals)**를 달성하는 데 있어서,
    → **과정 목표(process goals)**란 그러한 결과를 이끌어내는 일련의 행위들을 의미한다.

▶ 집단 과정의 구체적 활동

  • 집단 구성원들이 함께 모여 다음을 수행함:
    1. 서로의 행동 중 어떤 것이 유익했고, 어떤 것이 그렇지 않았는지 기술하기
    2. 계속 유지할 행동과 변경이 필요한 행동을 결정하기

➡️ 이를 통해 집단은 스스로의 작동 방식에 대한 통찰을 얻고,
→ 협력적 노력의 효율성과 효과성을 개선할 수 있게 된다.

▶ 집단 과정의 목적 (Johnson & Johnson, 2008)

  • 구성원들이 협력 목표 달성에 효과적으로 기여할 수 있도록
    역할 수행의 명료화집단 기능의 향상을 촉진하는 데 있다.

✅ 요약 정리

요소 핵심 내용

대인관계 및 소집단 기술 신뢰, 소통, 수용, 갈등 해결 등의 사회적 역량을 학습자에게 교육하고 활용하도록 유도해야 함
집단 과정 (Group Processing) 집단의 작동 방식을 성찰하고, 유익한 행동은 강화하고 비효과적 행동은 수정하여 협력의 질을 향상

 

🔶 1.5. 결론 (Conclusion)


✅ 협력학습의 정의와 학습 환경

  • **협력학습(Collaborative Learning, CL)**은
  • 학습자 간의 **공동 지적 노력(joint intellectual effort)**을 기반으로 한 **다양한 교육 접근 방식의 포괄적 개념(umbrella term)**이다.
  • CL 환경에서는 학습자들이 다음과 같은 **사회적·정서적 도전(social and emotional challenges)**을 경험한다:
    • 다양한 관점을 듣고,
    • 자신의 아이디어를 명확히 표현하고 방어해야 하며,
    • 능동적으로 참여하게 된다.
  • 이 과정에서 학습자는:
    • 동료들과 의견을 나누고,
    • 아이디어를 제시하고 토론하며,
    • 다양한 신념을 교환하고,
    • 서로의 개념 틀에 질문을 제기하는 기회를 갖게 된다.

✅ 협력학습을 구성하는 필수 요소들

협력학습으로 인정되기 위해서는 다음 5가지 핵심 요소가 반드시 포함되어야 한다:


긍정적 상호의존성 (Positive Interdependence)

  • 모든 팀 구성원이 서로에게 의존해야만 목표 달성이 가능함
  • 한 사람이 역할을 수행하지 않으면 전체가 영향을 받음
  • 구성원은 “우리는 함께 성공하거나 함께 실패한다 (sink or swim together)”는 믿음을 공유해야 한다.

촉진적 상호작용 (Promotive Interaction)

  • 구성원들은 서로 가르치고, 문제 해결과 개념 이해를 도와주며,
  • 학습을 지원하고, 격려하고, 성취를 함께 축하한다.

개별 책무성 (Individual Accountability)

  • 구성원 개개인이 자신의 학습과 과업에 책임을 져야 함
  • 무임승차를 방지하고, 질 낮은 작업이 집단에 의해 수용되지 않도록 방지한다.

사회적 기술 (Social Skills)

  • CL은 다음과 같은 사회적 역량 개발을 요구하고, 지원한다:
    • 리더십
    • 의사결정
    • 신뢰 형성
    • 의사소통
    • 갈등 해결

집단 자기평가 (Group Self-Evaluation)

  • 집단은 목표 달성 및 팀워크의 질에 대해 성찰하고,
    • 어떤 행동이 도움이 되었고, 그렇지 않았는지를 평가하며,
    • 지속하거나 변경해야 할 행동을 결정한다.

✅ 결론 요약 표

핵심 요소 설명

상호의존성 모든 구성원이 함께 성공해야 함을 인식
촉진적 상호작용 서로 가르치고 도우며 학습 성장을 촉진
개별 책무성 무임승차 방지 및 학습 질 향상 도모
사회적 기술 협력을 위한 리더십, 신뢰, 소통 등 훈련
집단 평가 팀 성과 성찰 및 행동 개선 전략 도출

 

Laal, M. (2013). Collaborative learning; elements. Procedia-Social and Behavioral Sciences83, 814-818.

 

 

🎓 함께 배우는 힘: 협력학습(Collaborative Learning)이란 무엇인가?

“혼자 가면 빨리 갈 수 있지만, 함께 가면 더 멀리 갈 수 있다.”

교육에서도 마찬가지입니다. 이제는 혼자 외우는 학습에서 벗어나, 함께 생각하고 만들어가는 학습이 강조되는 시대입니다. 이 포스팅에서는 Marjan Laal과 Mozhgan Laal이 발표한 논문 [Collaborative Learning: What is it?]을 바탕으로 협력학습(Collaborative Learning, 이하 CL)의 개념과 역사, 핵심 요소들, 협동학습(Cooperative Learning)과의 차이, 그리고 오늘날 교육에서의 함의를 정리해보려 합니다.


🧩 1. 협력학습(Collaborative Learning)의 개념과 등장 배경

❓ 협력학습이란?

협력학습(Collaborative Learning)은 학생들이 함께 문제를 해결하거나 과제를 수행하며 공동의 학습 목표를 추구하는 교육 방식입니다. 이 접근법은 단순히 함께 앉아 과제를 하는 것 이상을 뜻합니다.

“Collaborative learning (CL) is an educational approach to teaching and learning that involves groups of learners working together to solve a problem, complete a task, or create a product.”
👉 협력학습(Collaborative Learning)은 문제 해결, 과제 수행, 산출물 생성 등을 위해 학습자들이 함께 작업하는 교수-학습 접근법이다. 【본문】

 

CL은 단순한 집단 활동이 아니라, 학습자들이 서로의 관점에 도전하고 방어하며 자신의 사고 틀을 구성해가는 과정입니다. 따라서 학습자는 교사나 교재에 의존하기보다 자신만의 지식 구조를 형성하게 됩니다.

🕰️ 역사적 배경

CL은 1950~60년대 영국에서 의과 교육을 중심으로 시작되었습니다. 특히 의과대학생들이 함께 진단을 내리는 과정에서 더 나은 판단을 하게 된다는 연구 결과가 중요한 기점이 되었죠. Bruffee(1996)는 이를 다음과 같이 설명합니다:

“The idea of CL came into being thanks to the efforts of British teachers and researchers in the 1950s and 1960s.”
👉 협력학습의 개념은 1950~60년대 영국의 교사들과 연구자들의 노력에서 시작되었다. 【본문】


🔍 2. 협력학습의 핵심 요소들

Johnson & Johnson(1990)은 협력학습이 진정으로 작동하기 위한 **다섯 가지 핵심 요소(five key elements)**를 제시합니다. 이 다섯 가지가 모두 충족되어야 단순한 '그룹 활동'이 아닌 '협력학습'으로 간주될 수 있습니다.

✅ 1) 긍정적 상호의존성 (Positive Interdependence)

모든 팀원이 서로 의존하면서 공동 목표를 위해 노력해야 합니다.

“Team members are obliged to rely on one another to achieve the goal.”
👉 팀원들은 목표를 달성하기 위해 서로에게 의존해야 한다.

✅ 2) 상호작용 (Face-to-Face Promotive Interaction)

서로 도우며 지식을 설명하고, 피드백을 주고받고, 함께 사고하는 과정이 필요합니다.

“Group members must be done interactively providing one another with feedback, challenging one another's conclusions...”
👉 그룹 구성원은 서로 피드백을 제공하고, 상대방의 결론과 추론에 도전하며, 상호작용을 통해 학습해야 한다.

✅ 3) 개인 책임 (Individual Accountability)

모든 구성원이 학습 내용에 대한 책임을 개별적으로 져야 합니다.

“All students in a group are held accountable for doing their share of the work and for mastery of all of the material to be learned.”
👉 모든 학생은 자신의 몫을 수행하고 학습 내용을 숙지할 책임이 있다.

✅ 4) 사회적 기술 (Social Skills)

신뢰, 의사소통, 리더십, 갈등 해결 등의 사회적 기술이 강조됩니다.

✅ 5) 집단 성찰 (Group Processing)

팀은 자신들의 활동을 되돌아보고, 개선할 점을 찾는 과정을 가져야 합니다.


🧠 3. 협력학습 vs. 협동학습

협력학습(Collaborative Learning)과 협동학습(Cooperative Learning)은 자주 혼용되지만, 철학과 구조에서 분명한 차이가 있습니다.

 

     
항목  협동학습 (Cooperative Learning)  협력학습 (Collaborative Learning)
교사 역할 교사가 모든 과정을 통제 교사는 촉진자 역할
학생 역할 주어진 구조 안에서 역할 수행 구조 자체를 함께 만들어감
목표 과제 수행 중심 지식 공동 구성 중심

“Cooperation is a structure of interaction... Collaboration is a philosophy of interaction...”
👉 협동(Cooperation)은 특정 목표 달성을 위한 구조이며, 협력(Collaboration)은 상호작용에 대한 철학이다. (Panitz, 1999) 【본문】


💡 4. 협력학습이 왜 중요한가?

협력학습은 단순히 지식 전달 방식의 변화가 아니라, 배움에 대한 패러다임 전환을 의미합니다.

📍 Johnson & Johnson & Smith (1991)는 다음과 같은 교육 패러다임을 제시합니다:

  • 지식은 학생에 의해 구성되고 재구성된다.
  • 학습은 학습자가 주체적으로 수행하는 활동이다.
  • 교사는 의미 구성의 조건을 제공하는 조력자이다.
  • 교육은 학습자 간, 교사-학습자 간의 상호작용이다.

이러한 관점에서, 협력학습은 21세기 학습자의 기대에 부응하는 방식입니다. 예를 들어, 팀 프로젝트를 통한 멀티미디어 산출물 제작 등은 기존의 시험이나 보고서보다 더 실천적이고 의미 있는 학습 경험을 제공합니다.


🧭 5. 마무리하며 – 협력학습은 '방법'이 아니라 '문화'

논문은 협력학습을 다음과 같이 정리합니다:

“CL is an umbrella term for a variety of educational approaches involving the joint intellectual effort... The underlying premise of CL is based upon consensus building through cooperation...”
👉 협력학습은 다양한 교수법을 포괄하는 개념이며, 협력을 통해 합의(consensus)를 이끌어내는 데 그 기반이 있다. 【본문】

 

이 말은 CL이 단순한 ‘방법론’이 아니라, 서로의 다름을 존중하고 함께 의미를 만들어가는 문화라는 점을 보여줍니다.


🔖 정리하면

  • 협력학습(Collaborative Learning)은 지식의 공동 구성을 지향하는 교육 철학입니다.
  • 단순한 그룹 활동과는 다르게, 긍정적 상호의존성, 상호작용, 개인 책임, 사회적 기술, 집단 성찰이 모두 충족되어야 합니다.
  • 협동학습과는 철학과 구조가 다르며, 교사의 역할은 전달자에서 촉진자로 이동합니다.
  • 오늘날의 교육에서 CL은 비판적 사고, 실천 중심 학습, 사회적 역량을 키우는 데 핵심적인 역할을 합니다.

 


🔶 협력학습(Collaborative Learning, CL)의 개념과 본질

  • **협력학습(Collaborative Learning, CL)**이라는 용어는 다양한 학문 분야에서 폭넓게 사용되어 왔으나, 그 정의에 대해서는 합의된 견해가 부족하다 (Jenni & Mauriel, 2004).
  • 비록 명확한 정의는 없지만, CL에는 공통적으로 내재된 핵심적 특성들이 존재한다.

🔶 21세기의 교육 패러다임 변화와 협력의 중요성

  • 21세기는 협력의 시대라고 불릴 정도로, 사회적으로도 비판적 사안에 대해 함께 사고하고 행동하는 역량이 점점 중요해지고 있다 (Austin, 2000; Welch, 1998).
  • 이에 따라 교육에서는 개인의 노력에서 집단의 노력으로, 독립성에서 공동체성으로 중심축이 이동하고 있다 (Leonard & Leonard, 2001).

🔶 협력학습의 정의와 특징

  • 협력학습은 학생들이 그룹을 이루어 문제를 해결하거나 과제를 완수하거나 산출물을 창출하는 교육적 접근이다.
  • 이 과정에서 학습자들은 다양한 관점을 듣고, 자신의 생각을 표현하고 방어함으로써 사회적·정서적 도전을 경험하게 된다.
  • 학습자들은 이를 통해 단순히 전문가나 교재의 틀에 의존하지 않고, 자신만의 개념적 틀을 구축해 나간다 (Srinivas, 2011).
  • CL 환경에서는 학습자들끼리 서로 의견을 나누고, 방어하고, 질문하고, 다양한 믿음을 교환하며 능동적으로 참여하게 된다.

🔶 CL이 가져오는 교수법의 변화

  • CL은 기존의 교사 중심·강의 중심 수업 방식에서 벗어나, 학생 주도의 토론과 활동 중심 학습으로의 전환을 의미한다.
  • 물론 강의, 필기, 청취 등의 요소가 완전히 사라지는 것은 아니지만, 이제는 학생들의 활동과 토론 중심 학습과 병행하여 이루어진다.
  • CL을 활용하는 교사는 더 이상 지식의 전달자라기보다는, 학습자에게 지적 경험을 설계하는 전문가, 즉 **코치나 산파(midwife)**의 역할을 수행한다 (Smith & MacGregor, 1992).

🔶 협력학습의 오해와 실제

  • CL은 작은 그룹이 서로 학습을 도와주는 방식으로 정의된다. 하지만 흔히 몇 가지 방식이 CL로 오해되기도 한다 (Klemm, 1994).
    ❌ 각자 과제를 하며 옆 사람과 이야기하는 것
    ❌ 먼저 끝낸 학생이 아직 끝내지 못한 학생을 도와주는 것
    ❌ 일부 학생만이 과제를 수행하고 다른 학생은 이름만 올리는 것
    → 이러한 방식은 진정한 협력학습이 아니다.

🔶 협력학습의 효과와 근거

  • **협동 학습(cooperative learning)**을 실천하는 팀은 더 높은 수준의 사고를 수행하며, 정보의 장기 기억 유지 또한 뛰어난 것으로 나타났다.
  • Samuel 외 여러 학자들의 연구에 따르면, 학습자 간 지식의 공유와 토론은 학습자의 책임감과 비판적 사고력을 증진시킨다.
  • Gokhale (1995)는 소그룹 내 활발한 아이디어 교환이 참여자의 흥미를 증진시킬 뿐 아니라, 비판적 사고 촉진에도 기여한다고 강조하였다.

✅ 요약 정리

항목 내용

정의 부재 다양한 정의 존재, 학문 간 일관성 부족
핵심 특징 공동 문제 해결, 사고 방어, 개념 구성, 활발한 상호작용
교육적 전환 강의 중심 → 학생 중심 / 교사 → 코치 역할
오해된 예 단순한 대화, 불균형한 작업 분배는 CL 아님
효과 사고 수준 향상, 정보 기억 향상, 비판적 사고 증진

 


🔶 1.3. 연구 결과 (Results)

✅ 협력학습의 기원과 역사적 배경

  • 협력학습(Collaborative Learning, CL)의 개념은 1950~60년대 영국의 교사들과 연구자들의 노력에서 비롯되었다고 Bruffee(1996)는 설명한다.
  • 의과대학생들이 지도교수와의 상호작용을 통해 진단을 배우는 과정을 연구한 M.L.J. Abercrombie는,
  • "집단으로 진단을 학습한 의대생들이 개별 학습자보다 더 빠르고 정확한 의학적 판단에 도달한다"는 결론을 내렸다.
  • Bruffee는 처음 CL이라는 개념을 접하게 된 계기로,
  • "권위주의적 수업 방식에 대한 반발로부터 협력학습이 등장했다"고 보는 연구자들의 견해를 소개한다 (p.85).

✅ 고등교육에서의 CL 필요성 제기

  • 1970년대에 접어들면서, 대학 교수들은 학생들이 **대학 수준의 글쓰기(writing)**로 전환하는 데 큰 어려움을 겪고 있음을 인식하게 되었다.
  • 이에 대한 연구자들의 결론은,
  • 기존의 도움 방식은 너무 ‘수업 중심적’이며,
    학생들에게 필요한 것은 기존 수업의 연장이 아닌, 대안적 접근법이라는 점이었다 (p.86).

🔶 협력학습의 정의: 전문가들의 견해 정리

협력학습을 보다 잘 이해하기 위해, 분야 전문가들의 대표적 정의들을 아래와 같이 정리할 수 있다.


📘 MacGregor (1990)

“협력 교수 및 학습은 학생들이 문제를 해결하거나, 과제를 완수하거나, 산출물을 창출하는 데 함께 참여하는 교수법이다.”


📘 Smith & MacGregor (1992)

“협력학습은 학생들 또는 학생과 교사 간의 공동 지적 노력을 포함하는 다양한 교수-학습 접근의 상위 개념(umbrella term)이다.
대부분의 활동은 학생들이 함께 탐색하거나 적용하는 데 중점을 두며, 단순히 교사의 강의나 설명에 의존하지 않는다.”


📘 Gerlach (1994, p.12)

“협력학습은 학습이 본질적으로 사회적 행위라는 관점에 기반하며,
참여자들이 서로 이야기하는 과정에서 학습이 일어난다고 본다.”


📘 Golub et al. (1988)

“협력학습의 핵심은 학생 간의 대화를 촉진하는 구조에 있다.
학습은 이러한 상호 대화 속에서 이루어진다.”


📘 Dillenbourg (1999)

“협력학습은 두 명 이상이 함께 어떤 것을 배우거나 배우려고 시도하는 상황이다.

  • ‘두 명 이상’은 두 사람, 소집단(35명), 전체 학급(2030명) 모두 포함 가능
  • ‘무언가를 배운다’는 것은 강의를 듣거나 문제 해결과 같은 학습활동을 수행하는 것
  • ‘함께’는 대면 혹은 컴퓨터 매개 상호작용 등 다양한 형태의 상호작용을 포함”

✅ 요약 정리

구분 내용

기원 1950~60년대 영국, 집단 진단 학습 사례 (Abercrombie)
배경 권위주의적 교수법에 대한 반발 → 대안적 접근 필요성 제기
확산 계기 대학 글쓰기에서의 학습 전이 문제 → 전통적 수업의 한계 인식
핵심 정의 문제 해결, 과제 수행, 산출물 창출을 위한 공동 지적 노력
학습 기제 대화와 상호작용을 통한 의미 구성 및 비판적 사고 증진
구성 요소 2인 이상, 다양한 규모의 그룹, 대면 또는 비대면 상호작용 가능

 


🔶 협력학습의 교육적 목적 및 핵심 요소

✅ 협력의 교육적 의의

  • **교육에서 협력(collaboration)**은 가능한 많은 학생들에게 가장 효과적인 교수법을 제공하기 위한 방안으로 활용된다 (Pugach & Johnson, 1995).

✅ Johnson et al. (1990)의 협력학습 5대 핵심 요소

Johnson과 동료 연구자들(1990)은 협력학습(Collaborative Learning, CL)을 단순히 그룹 활동으로 오해해서는 안 된다고 강조하며,
다음의 5가지 요소가 갖추어져야만 CL로 간주될 수 있다고 설명한다:


1️⃣ 명확하게 인식되는 긍정적 상호의존성 (Positive Interdependence)

  • 팀 구성원들이 공동의 목표 달성을 위해 서로 의존해야만 하는 관계가 형성되어야 한다.
  • 한 명이 역할을 제대로 수행하지 못하면, 전체 팀이 불이익을 받는다.
  • 구성원들은 모두 함께 성공해야만 한다는 믿음을 공유해야 한다.

2️⃣ 의미 있는 상호작용 (Promotive Interaction)

  • 구성원들은 서로가 학습할 수 있도록 돕고 격려한다.
  • 이해한 내용을 설명하거나 지식을 수집 및 공유하면서 학습이 일어난다.
  • 이 과정은 다음과 같은 상호작용으로 구성된다:
    • 피드백 제공
    • 결론과 추론에 대한 도전
    • 서로에게 가르치고 동기 부여하기

3️⃣ 개별 책무성과 책임 (Individual Accountability)

  • 모든 구성원이 자신의 역할을 수행해야 할 책임이 있으며,
  • 학습해야 할 전체 내용에 대한 숙달도 각자의 책임이다.
  • 그룹이라는 틀에 숨어 무임승차(free-riding) 해서는 안 된다.

4️⃣ 사회적 기술 (Social Skills)

  • 협력학습은 단순한 인지적 활동이 아닌, 사회적 기술 발달도 함께 요구한다.
  • 학습자들은 다음과 같은 기술을 훈련하고 실천할 기회를 갖는다:
    • 신뢰 형성
    • 리더십
    • 의사결정
    • 의사소통
    • 갈등 관리

5️⃣ 집단 자기평가 (Group Processing)

  • 팀 구성원들은 다음을 수행해야 한다:
    • 집단의 목표 설정
    • 현재 잘하고 있는 부분에 대한 자기 평가
    • 향후 더 효과적인 작동을 위한 개선 사항 도출

✅ 정의 요약

  • 위의 5가지 요소를 포함하고 있어야만, 협력학습이라는 이름으로 제공되는 교수활동이 진정한 CL로 간주될 수 있다.
  • 다시 말해, 단순한 집단 활동이 아니라, 명확한 구조와 원칙을 바탕으로 설계된 교수법이어야 한다.

📌 표: 협력학습의 5가지 핵심 요소 요약

핵심 요소 설명

상호의존성 구성원 간에 서로 의존할 수밖에 없는 구조
상호작용 설명, 피드백, 도전 등을 통한 의미 있는 상호작용
개별 책무성 각자의 역할과 학습에 대한 책임
사회적 기술 신뢰, 리더십, 소통, 갈등 관리 등
자기평가 팀 단위로의 성찰과 개선

 


🔶 1.4. 논의 (Discussion)


✅ 협력학습에서의 상호 작용과 사고의 재개념화

  • **Bruffee (1996)**는 협력학습(Collaborative Learning, CL)이 전통적 교수 방식과 일부 유사한 특징(예: 튜터가 학생보다 글쓰기에 대한 지식이 더 많음)을 공유할 수는 있지만,
  • CL은 "학생과 튜터 모두가 수업에 기여하며, 수업으로부터 통찰을 얻는 과정"이라고 설명한다.
  • 전통적 교수법에서는 교사가 학생으로부터 무언가를 배울 것이라는 기대나 의무는 없다.
  • 반면, CL에서는 교사 또한 학습하는 주체가 되어야 하며, 이것이 CL의 핵심 요소 중 하나다.

✅ 사고(thinking)와 대화(conversation)의 관계

  • Bruffee는 대화의 작동 방식을 연구한 결과,
  • "사고(thought)는 내면화된 대화(internalized conversation)"라는 결론에 도달했다 (p. 87).
  • 따라서 효과적으로 사고하려면, 효과적으로 대화하는 법을 배워야 하며,
  • “개인적으로 잘 사고하기 위해서는, 집단적으로 잘 사고하는 법, 즉 잘 대화하는 법을 익혀야 한다”고 주장한다 (p. 88).

✅ 협력학습은 철학이자 삶의 방식

  • 전통적으로 협력학습은 정기적으로 모여 함께 작업하는 학습자 집단으로만 이해되곤 했다.
  • 하지만 협력은 단지 교수 전략이 아니라,
  • 상호작용에 대한 철학이며, 책임 있는 개인적 삶의 태도이다 (Panitz, 1996).
  • 진정한 협력은 다음을 포함한다:
    • 각자의 책임 있는 행동과 학습
    • 동료의 능력과 기여에 대한 존중
    • 집단 내 권한의 공유와 책임의 분담
    • 경쟁보다는 협력을 통한 합의(consensus building)의 추구
  • CL은 단지 교실에서만 실현되는 것이 아니라,
  • 회의, 지역사회 활동, 가정생활 등 모든 집단 상황에서의 대인관계 방식으로 적용될 수 있다.

✅ Johnson, Johnson & Smith (1991)의 새로운 교수 패러다임

이들은 협력학습을 통해 제안되는 새로운 교수-학습 패러다임을 다음과 같이 정리하였다:


1️⃣ 지식은 학생에 의해 구성되고 재구성된다.

  • 지식은 발견(discovery), 구성(construction), **변형(transformation)**의 과정을 거친다.
  • 교수자의 역할은 학생이 자신의 인지 구조를 통해 학습 내용을 해석하고,
    이를 장기기억에 저장할 수 있도록 조건을 조성하는 것이다.

2️⃣ 학습은 학습자가 능동적으로 수행하는 활동이다.

  • 학습은 **학습자에게 가해지는 것(to the learner)**이 아니라,
    **학습자가 스스로 해내는 것(by the learner)**이다.
  • 학습자는 기존의 인지 구조를 활성화하거나 새로운 구조를 구성함으로써 새로운 지식을 통합한다.

3️⃣ 교수자의 노력은 학생의 역량과 재능 개발에 집중된다.


4️⃣ 교육은 학생 간, 교수자-학생 간의 개인적 상호작용이다.

  • 교육은 지식의 일방적 전달이 아니라,
    함께 작동하는 상호작용의 과정이다.

5️⃣ 이 모든 것은 협력적 맥락 안에서만 가능하다.

  • **협동적 분위기(cooperative context)**가 전제되어야 학습이 효과적으로 일어난다.

6️⃣ 교수는 이론과 연구의 복합적 적용으로서 고도의 전문성을 요한다.

  • 효과적인 교수는 단순한 기술이 아니며,
    지속적인 연습과 전문적 훈련이 필요한 복잡한 실천이다.

✅ 핵심 정리

핵심 개념 설명

CL의 본질 교수자와 학습자 모두가 배우는 상호적 과정
사고와 대화 사고는 내면화된 대화, 잘 생각하려면 잘 대화해야 함
CL의 확장된 개념 단순한 교수 전략이 아닌 철학이자 생활양식
새 교수 패러다임 지식의 구성, 학습자의 능동성, 상호작용 중심의 교육
교수 전문성 협력학습을 이끄는 교수는 지속적인 훈련이 필요한 전문가

 

🔶 협력학습의 확장된 정의와 협동학습과의 구분


✅ 협력학습의 보다 포괄적인 형태 (Dalziel & Peat, 1998)

  • **Dalziel과 Peat(1998)**은 협력학습(Collaborative Learning, CL)을 보다 넓은 의미에서 정의하며,
    다음과 같은 강도가 낮은 활동들도 CL의 범주에 포함될 수 있다고 주장하였다:
    • 선배 학생에게 도움을 요청하기
    • 강의 노트 교환
    • 자유로운 분위기의 수업 외 학습 공간 활용
  • 이러한 넓은 의미의 CL은 대학이 공식적으로 이러한 활동을 장려하지 않더라도,
  • 많은 학생들이 자연스럽게 경험하는 보편적 학습 형태일 수 있다.
  • 그러나 대학 차원에서도 이러한 자발적 협력 활동의 가능성을 높이고,
  • 이를 구조적으로 지원할 수 있는 프로그램을 개발할 여지가 존재한다.

✅ CL과 Cooperative Learning의 구분 (Paulson & Faust, 2002)

  • **협동학습(Cooperative Learning)**과 **협력학습(Collaborative Learning)**은 유사해 보일 수 있으나,
    이 둘은 분명히 구별되는 교육적 개념이다.
  • Cooperative Learning은 다음과 같은 특징을 갖는다:
    • 구조화된 상호작용 구조를 통해 특정 목표나 산출물을 공동으로 달성하도록 설계됨
    • 주로 교사 중심, 과제 중심으로 설계되며, 명확한 역할 분담과 절차가 존재
  • 반면 Collaborative Learning은 훨씬 급진적이고 철학적 기반을 가진 접근으로,
    • 과제 설계
    • 교재 선택
    • 수업 내용의 구성 및 발표
  • 교수자와 학생이 동등한 입장에서, 함께 다음과 같은 활동에 참여함:
  • 따라서 CL은 단순히 교수자가 제시한 내용을 효과적으로 기억하도록 도와주는 전략을 넘어서,
  • 기존 교수 방식 자체에 대한 근본적 전환을 요구하는 방식이다.

✅ 협동 vs. 협력: Ted Panitz (1999)의 정의

**Ted Panitz (1999)**는 다음과 같이 **협동(cooperation)**과 **협력(collaboration)**을 구분하여 정의하였다:


📘 Cooperation (협동학습)

협동구체적인 목표나 산출물을 달성하기 위해,
사람들이 구성된 구조 안에서 함께 작업하도록 설계된 상호작용 방식이다.”

  • 명확한 목표, 과제 중심
  • 그룹 활동을 위한 체계적인 절차와 역할 분담

📘 Collaboration (협력학습)

협력상호작용에 대한 철학이자 개인의 삶의 태도로,
개인이 자신의 행동(학습 포함)에 책임을 지고,
동료의 능력과 기여를 존중하는 태도에 기반한다.”

  • 수평적 관계, 공동 책임
  • 상호 존중, 자율성, 집단적 의미 형성

✅ 핵심 요약 비교표

구분 협동학습 (Cooperative Learning) 협력학습 (Collaborative Learning)

정의 특정 목표를 위한 구조화된 집단 학습 상호작용에 대한 철학, 삶의 방식
역할 분담 명확히 구분 유동적, 동등한 참여
교사 역할 과제 설계자, 진행자 공동 설계자, 동반자
상호작용 구조화된 도움 주고받기 의미 구성 중심 대화
목표 결과물 완성, 과제 해결 의미 형성, 비판적 사고 촉진

 

🔶 협동학습과 협력학습의 실질적 차이 (Panitz, 1999)

✅ 협동(Cooperative) 모델의 특징

  • 교사는 여전히 수업의 전 과정에 대한 통제권을 유지한다.
  • 수업의 진행 방식:
    1. 교사가 질문을 제시하고,
    2. 교과서 외의 보조 자료(논문, 기사 등)를 제공하며,
    3. 학생들은 소그룹으로 질문에 대한 답을 탐색하고,
    4. 결과를 전체 수업에서 발표하고 토론한다.
  • 이 과정에서 학생들이 수행하는 학습 활동은 많지만,
  • 학습의 절차와 방향은 교사가 설정하고 있으며, 학생은 그 틀 안에서 활동하는 구조이다.

✅ 협력(Collaborative) 모델의 특징

  • 학습의 거의 전적인 책임이 학습자에게 부여된다.
  • 수업의 전개 방식:
    1. 학생들은 자신들이 가지고 있는 정보가 충분한지 스스로 판단한다.
    2. 부족하다면, **추가 자료(논문, 책, 영상, 인터넷 등)**를 스스로 탐색한다.
    3. 필요한 자료는 팀원들이 나누어 수집하고,
    4. 분석할 항목과 근거의 개수도 스스로 결정한다.
    5. 교사는 진행 상황에 대해 조언하거나, 그룹 내 갈등 해결을 돕고, 집단 역학에 대해 대화를 유도하는 **촉진자(facilitator)**로서 기능한다.
  • 이러한 과정에서 학생들은 학습과정에 대한 **높은 주인의식(ownership)**을 가지게 되며,
  • 자신의 학습에 대해 책임감을 갖고 적극적으로 참여하게 된다.

✅ Gokhale (1995): 협력학습의 개념 정리

협력학습이란 학습자들이 소그룹으로 구성되어 공통의 학습 목표를 향해 함께 학습하는 교수 방법이다.
이때 학습자는 자신의 학습뿐 아니라, 동료의 학습에도 책임을 지며,
한 사람의 성공이 다른 학습자의 성공에도 긍정적으로 작용한다.


✅ 협력학습의 인지적 효과

  • 고차 사고력(higher-order thinking skills) 개발에 탁월한 효과:
    • 단순한 사실 암기를 넘어서서
    • 정보의 의미를 파악하고,
      분석, 평가, 종합, 적용할 수 있도록 도와준다 (Klemm, 1994).
  • 전통적인 교육 방식(정보 전달 중심)과는 대조적으로,
  • 비판적 사고와 깊이 있는 이해를 촉진한다.

✅ 협력학습 vs. 경쟁/개별 학습

  • 협력학습은 경쟁적 또는 개별 학습 환경에 비해,
    • Gabbert et al. (1986)
    • Johnson & Johnson (1981, 1980)
  • 비판적 사고력, 문제해결력을 더 효과적으로 개발한다는 다수의 연구 결과가 있다.

✅ 21세기형 학습자와 협력학습의 연결성 (Rodgers et al., 2006)

  • 기술 발달에 힘입어, CL은 현대 학습자가 기대하는 교수 방식으로 자리잡고 있다.
  • 팀 기반 프로젝트는:
    • 멀티미디어 기반으로 구성 가능하고,
    • 전통적인 term paper보다 더 실제적이고 강력한 학습 경험을 제공한다.
  • 학습자는 현실 세계에 적용 가능한 실용적 지식을 원하며,
  • 교육 과정은 수업 내용을 실제 문제, 조직, 기관 등과 연결시켜야 한다.
  • 이를 통해 학습자는 자신의 학습 스타일 강점을 살릴 수 있는 기회를 얻는다.

✅ 정리 요약

구분 협동학습 (Cooperative Learning) 협력학습 (Collaborative Learning)

교사 역할 절차 통제자, 지시자 촉진자, 조언자
학습자 역할 정해진 절차에 따라 작업 과정 설계 및 결정에 주도적 참여
자료 탐색 교사가 제공 학생이 필요성 판단 후 자율 탐색
과제 형식 구조화된 과제 열려 있고 자율적인 문제 탐색
책임 구조 개별 수행 책임 강조 상호 책임과 공동 소유 의식 강조
학습 효과 지식 전달, 내용 이해 중심 비판적 사고, 종합적 적용 중심
21세기 적용성 제한적 실제 문제 기반 학습(PBL), 팀 프로젝트에 최적

 

🔶 1.5. 결론 (Conclusion)


✅ 협력학습의 포괄적 개념

  • **협력학습(Collaborative Learning, CL)**은 **공동의 지적 노력(joint intellectual effort)**을 포함하는 **다양한 교수-학습 접근 방식의 상위 개념(umbrella term)**이다.
    • 그 범위는 소규모 프로젝트부터,
    • 보다 구조화된 집단 학습 형태인 **협동학습(Cooperative Learning)**에 이르기까지 포함된다.

✅ 협력학습의 철학적 기반

  • CL은 사람들과 상호작용하는 방식에 대한 철학적 접근을 제안한다.
  • 학습자는 개별 구성원의 능력과 기여를 존중하고 강조하는 태도를 지녀야 하며,
    집단 내에서는 권한(authority)의 공유책임(responsibility)의 수용이 동시에 이루어진다.

✅ 경쟁이 아닌 협력에 기반한 학습

  • CL의 핵심 전제는,
  • 개인의 성취가 타인을 이기는 경쟁이 아니라,
    **구성원 간 협력을 통한 합의(consensus building)**로 이루어진다는 점이다.

✅ CL의 다섯 가지 핵심 요소 요약

CL을 효과적으로 실행하기 위해 반드시 포함되어야 하는 다섯 가지 핵심 구성 요소는 다음과 같다:

  1. 긍정적 상호의존성 (Positive Interdependence)
    • 팀원들이 서로에게 의존하지 않으면 목표 달성이 불가능한 구조
  2. 의미 있는 상호작용 (Considerable Interaction)
    • 설명, 피드백, 논의 등을 통한 깊이 있는 상호작용
  3. 개별 책임감 (Individual Accountability)
    • 각자의 역할과 학습 내용에 대한 책임
  4. 사회적 기술 (Social Skills)
    • 협력에 필요한 신뢰, 의사소통, 갈등 해결 능력 등
  5. 집단 자기평가 (Group Processing)
    • 집단 목표 설정, 과정 성찰, 향후 개선 전략 수립

✅ 결론 요약 표

항목 내용

CL의 정의 공동 지적 노력에 기반한 교수-학습 접근의 포괄적 용어
포함 범위 소규모 프로젝트에서 협동학습까지
철학적 태도 개인 기여 존중, 권한 공유, 책임 수용
핵심 기제 경쟁 → 협력으로의 전환
핵심 요소 상호의존성, 상호작용, 개별 책임, 사회적 기술, 자기평가

 

Laal, M., & Laal, M. (2012). Collaborative learning: what is it?. Procedia-Social and Behavioral Sciences31, 491-495.

 

 

 

 

 

 

 

 


🩺 학생 피드백, 그냥 WBA 채우는 걸까?

– CHAT 이론으로 들여다본 WBA 시스템의 긴장과 변화 이야기

 

요즘 의학교육에서 빠지지 않고 나오는 단어 하나, 바로 WBA (Workplace-Based Assessment) 입니다. 학생이 임상 현장에서 관찰을 받고 피드백을 받는 과정이죠. 이건 분명 좋은 의도를 가진 도구예요. 하지만 막상 현장에서 써보면 "이게 정말 나를 위한 피드백이 맞나?" 싶은 생각이 들 때가 있지 않으셨나요?

 

오늘 소개할 논문은 UCSF(University of California, San Francisco)의 연구팀이 **WBA 도구를 두 해(2019~2020년)에 걸쳐 도입하면서 어떤 긴장(tension)이 생기고, 그게 어떻게 변화했는지를 CHAT(Cultural Historical Activity Theory, 문화역사활동이론)**의 틀로 분석한 연구입니다.

 

"형식은 체크리스트인데, 내용은 형성적 피드백이길 바라는 이 모순!"

 

그 고민을 깊이 파고든 이 연구, 함께 들여다보시죠 🔍


1️⃣ 시작은 좋았지만, 현실은 시큰둥 – 배경과 문제의식

CBME (Competency-Based Medical Education) 에선 피드백이 핵심입니다. 단순한 평가가 아니라, 학생의 성장과 학습을 돕는 도구로서의 피드백이죠. 그래서 많은 학교에서 WBA를 활용합니다. 

 

하지만 현실은 이상과 다릅니다.

"Many learners fail to find value in WBAs and interpret feedback differently from how it is intended."
많은 학습자들이 WBA의 가치를 느끼지 못하고, 피드백을 의도와 다르게 해석한다.

 

👩‍⚕️👨‍⚕️ 학생들은 WBA가 피드백이 아닌 평가, 즉 summative assessment로 여겨질 때가 많았고,

👨‍🏫 교수들은 바빠서 형식적인 서술 몇 줄만 쓰고 끝내기 일쑤였죠.

 

그래서 연구팀은 "WBA 도구 자체만 보지 말고, 이걸 사용하는 전체 시스템을 보자!"는 생각을 하게 됩니다. 여기서 등장하는 게 바로 CHAT 이론이에요.


2️⃣ CHAT로 보는 피드백 시스템 – 그림 한 장으로 보는 구조 🧩

CHAT는 활동(activity)이 어떤 요소들로 구성되는지를 설명하는 이론이에요. 핵심 구성 요소는 다음과 같습니다:

 

구성 요소  의미
Subject 활동에 참여하는 주체 – 여기선 학생
Tool 활동을 매개하는 도구 – 여기선 WBA 양식
Object 활동의 목적 – 학생의 피드백 받기
Outcome 활동 결과 – 학습, 성장
Rules 규범, 규칙 – WBA는 주 2회 이상 작성해야 함
Community 활동이 일어나는 공동체 – 교수, 전공의, 동료 학생 등
Division of Labor 역할 분담 – 누가 WBA를 작성하는가 (감독자만? 학생도?)

 

연구팀은 이 CHAT 구조를 바탕으로, WBA 시스템에서 어떤 요소들 간의 긴장이 있는지, 그리고 시간이 지나면서 그 긴장이 어떻게 바뀌었는지를 살펴봅니다.


3️⃣ 시스템은 이렇게 달라졌어요 – 1년 차 vs. 2년 차 비교 ⚖️

🔹 1년 차 (2019년):

  • 도구: 컴퓨터 기반 MedHub
  • 작성: 감독자가 직접 작성해야 함
  • 긴장: 작성 지연, 내용 부실, 학생은 부담스러움

🔹 2년 차 (2020년):

  • 도구: 모바일 기반 Qualtrics, QR 코드로 바로 접근 가능
  • 작성: 학생도 직접 작성 가능!
  • 변화: 실시간 작성 가능, 부담 분산, 자율성 증가

💡 연구팀은 이렇게 말합니다:

"Shifts in tensions reflected greater coordination among the year 2 system elements to support the intended purpose of WBAs being for formative feedback for learning."
2년 차에는 시스템 요소들 간의 조정이 이루어져, 학습을 위한 형성적 피드백이라는 본래 목적을 더 잘 지원하게 되었다.


4️⃣ 어디서 긴장이 생겼을까? 5가지 포인트로 요약 👇

CHAT 요소 간 관계  1년 차의 긴장  2년 차의 개선
Object vs. Object 피드백 목적이 아니라 성적 평가로 오해 형성평가 목적에 대한 이해가 향상됨
Tool vs. Object 도구가 복잡해서 피드백 지연 발생 모바일 도구로 실시간 피드백 가능해짐
Division of Labor vs. Object 감독자에게 모든 책임이 집중되어 학생이 부담 느낌 학생도 작성 가능해지며 부담 분산
Rules vs. Object 주당 2회 규정이 체크리스트화, 학습 기회가 아님 학생의 자율성 증가로 규정 인식 개선
Community vs. Object 실습별 피드백 문화 차이로 WBA 활용 어려움 공동체의 참여도 향상, 특히 2년 차에 개선됨

5️⃣ 연구팀의 핵심 메시지 💬

이 논문이 가장 강조하는 건 이거예요:

"WBA as a systems-level intervention that must consider interactions among people, technology, and context."
WBA는 사람, 기술, 맥락 간의 상호작용을 함께 고려해야 하는 시스템 수준의 개입이다.

 

즉, 그냥 도구 하나 바꾸는 문제가 아니라,
✔ 누가 쓰는지,
✔ 어떻게 쓰는지,
✔ 그걸 둘러싼 문화는 어떤지…

이 모든 걸 시스템 전체로 봐야 한다는 거죠.


6️⃣ 그럼 앞으로 뭘 해야 할까? 🔧

논문은 몇 가지 제안을 해요:

  • 도구는 사용자 친화적이고 시간 효율적이어야 해요.
  • 학생이 피드백에 적극적으로 참여할 수 있게 설계해야 해요.
  • 평가보다는 성장에 초점 맞춘 대화가 이루어지게 문화도 바뀌어야 해요.
  • 학생과 감독자 모두에게 피드백의 목적을 교육해야 해요.

그리고 이런 변화를 위해선 단발적 개입이 아니라, 지속적인 시스템 모니터링과 다각도의 시도가 필요하다고 강조하죠.


📝 마무리하며

피드백이란 단어는 쉽지만, 그걸 제대로 받고, 주고, 배우는 건 어렵습니다.

이 논문은 우리에게 묻습니다.

"너희 학교의 WBA 시스템은 정말 학생의 학습을 위한 구조로 설계되어 있나요?"

 

우리 학교의 WBA는 어떤가요?
피드백은 살아있는가요, 아니면 형식에 그치고 있나요?

이 논문은 단지 UCSF의 사례를 넘어서,
우리 교육 시스템을 성찰할 거울이 될 수 있습니다.


✍ 포스팅이 도움이 되셨다면, 좋아요💗와 댓글💬 부탁드려요!
궁금하신 점이나 함께 토론하고 싶은 주제는 언제든 환영입니다 😊

 


역량중심 의학교육(Competency-based medical education, CBME) 에서는 학습자의 성장을 촉진하기 위해 효과적인 피드백 시스템이 필수적이다.¹,² 특히, 저부담(low-stakes) 환경에서 직장 내 직접 관찰(direct observation)을 기반으로 수행되는 직장기반평가(Workplace-based assessment, WBA) 도구는 학습자 개개인에게 시의적절한(individualized, timely) 피드백을 제공할 수 있다.³–⁷ 하지만 많은 의학 학습자들이 실제 임상 환경(clinical learning environment)에서 받는 피드백의 유용성에 대해 만족하지 못하는 것으로 보고되고 있다.⁸,⁹ 다수의 학습자들이 WBA의 가치(value) 를 제대로 이해하지 못하거나, 제공된 피드백을 원래의 의도와 다르게 해석(interpret feedback differently)하는 경우가 많다.¹⁰ 따라서 성공적인 WBA 도구 구현(implementation)과 지속적인 활용을 위한 전략 이 반드시 필요하다.

 

이전 연구들에 따르면 학습자와 지도교수는 WBA에 대해 부정적인 인식을 가지고 있다(negative learner and teacher perceptions).¹⁰–¹⁶ 효과적인 WBA 활용을 방해하는 요인으로는, 

  • 도구 사용 목적에 대한 사용자들의 불확실성(user uncertainty)
  • 평가 수행을 위한 충분한 시간 부족(insufficient time)
  • 평가도구 사용법에 대한 미흡한 훈련(inadequate training)

등이 있다.¹⁰ 더 나아가, 학습자와 지도교수가 WBA를 통해 제공되는 피드백의 목적이 형성평가(formative)인지 총괄평가(summative)인지에 대해 서로 다른 인식을 가지고 있는 경우도 많다(contradicting perceptions).¹¹ 특히, WBA가 형성평가의 목적으로 사용되더라도, 학생들은 피드백이 궁극적으로는 성적이나 평가 결과에 영향을 줄 수 있다고 인식하기도 한다.¹²–¹⁵ 학습자들은 피드백 자체의 중요성을 인식하고 있지만, 실제로 WBA 도구를 사용해 피드백을 받는 행위는 임상 업무(clinical workflows)를 방해하고 부담스럽게 느껴질 수 있다.¹⁶ 이러한 장벽들은 WBA의 유용성(usefulness)에 대한 사용자들의 인식이 교육 환경(educational context)에서의 구체적인 설계와 구현 방식(design and implementation features) 에서 비롯된다는 점을 시사한다.

 

기존 연구에서는 성공적인 WBA 구현에 기여하는 시스템 내의 요소들로서 학습자(subjects), 문화(culture), 도구 설계(tool design) 를 강조했으나, 이 요소들 간의 상호작용(interactions)에 대해서는 거의 고려하지 않았다.¹⁷–¹⁹ 구체적으로는,

  • 학습자 중심 연구(learner-centered studies) 에 따르면, 학습자의 개인적인 학습 목표와 연계된 직접 관찰을 통해 WBA 피드백의 효능(efficacy)이 높아진다.¹⁷
  • 문화 관련 연구(culture studies) 는 교수진이 자주 피드백을 주고받는 문화를 정상화(normalize frequent feedback)하는 메시지를 줄 때 WBA 도구가 성공적으로 정착할 가능성이 높아지며, 그 결과 실시간 직접 관찰(real-time direct observation)을 통한 피드백의 수용도(acceptance)도 증진된다고 보고한다.⁹,¹²,¹⁸
  • 도구 설계 및 구현(tool design and implementation) 연구에서는 평가도구가 서술적 의견(narrative comments)을 생성할 때 수치 점수(numerical scores)를 부여할 때보다 사용자의 수용도가 높고 더 유익한 정보를 제공한다는 점을 확인하였다.¹⁹,²⁰

이러한 요소들을 독립적으로 보는 것이 아니라 하나의 통합적 시스템(system) 으로 보는 것이 평가 프로세스를 개념화(conceptualize)하고 WBA의 구현과 관련된 사람들, 문화, 도구의 복잡한 관계(complex array)를 이해하는 데 더 유용할 수 있다.

이러한 시스템적 관점에서 볼 때, 문화역사활동이론(Cultural Historical Activity Theory, CHAT)은 학습자들에게 피드백을 제공하는 것과 같은 활동(activity)을 도구(tool)가 어떻게 매개(mediate)하는지 살펴보는 시스템 수준(systems-level)의 시각을 제공할 수 있다. CHAT에 따르면 활동 시스템(activity system)은 주체(subjects, 학습자), 도구(tools), 그리고 사회적 맥락(social contexts) 내의 규칙(rules), 역할 분담(division of labor), 공동체(community)가 상호작용하여 특정 목표(object, 목적)와 결과(outcome)를 이루어내는 것으로 정의된다(그림 1 참고).²¹,²²

 

이 요소들 간의 긴장(tensions)은 시스템 내 모순(contradictions)을 유발하고, 변화를 촉진하거나 새로운 지식을 창출(new activity patterns)할 수 있다.²³,²⁴ CHAT는 의학교육 분야에서 서비스와 교육 간의 긴장(service-education tensions)²⁵,²⁶이나 복잡한 전문직 간 상호작용(interprofessional dynamics)을 탐구할 때 활용된 바 있다.²⁷ 이전 CHAT 연구에서는 활동 시스템의 도구가 물리적 도구(physical tools, 예: 봉합재료, EMR 등)와 상징적 도구(symbolic tools, 예: 학습목표, 체크박스 등)로 구분되며, 이들이 상호작용을 통해 특정 결과를 도출한다고 보았다.²⁵,²⁷–²⁹ 따라서 CHAT를 통해 학습자와 감독자가 WBA 도구를 활용하여 피드백과 학생 학습이라는 목적을 공동으로 달성하는 활동 시스템에서의 긴장을 조명하고, WBA 구현의 장애물(barriers)과 촉진요인(facilitators)을 밝힐 수 있다.

 

예컨대, 학습자와 감독자가 피드백 활동의 목적(object)을 서로 다르게 이해하면(supervisors는 학습자의 성장을 위한 목적으로 이해하지만, 학습자는 평가 결과와 관련된 목적으로 이해할 경우), 이는 원래 의도하지 않은 결과(unintended outcome)를 초래할 수 있다.³⁰

 

결론적으로, 성공적인 WBA 구현은 도구(tool)구현 환경(context) 및 학습자와 감독자의 사용자 경험(user experience) 에 대한 포괄적 이해를 필요로 한다.¹⁹,³¹ CHAT를 통해 임상 실습 학생과 감독자가 WBA 도구를 이용하여 직접 관찰과 피드백에 참여하는 방식을 분석할 수 있다.³² 본 연구는 2년에 걸친 WBA 도구 구현 기간 동안, CHAT의 시각을 통해 의과대학 임상실습(clerkship)의 피드백 활동 시스템에서 일어난 변화(changes)와 긴장(tensions)을 탐색하고자 한다.

 


연구 방법(Methods)

설계(Design)

본 연구는 질적 연구 방법(qualitative approach) 을 사용하여, 문화역사활동이론(CHAT) 의 민감화 개념(sensitizing concepts)²¹–²⁴을 활용하여 의과대학 임상실습(clerkship)에서의 직장기반평가(WBA) 의 활용 방식을 탐색하였다. 구체적으로, 피드백 활동 시스템(feedback activity system)의 구성 요소(예: 공동체(community), 도구(tools), 규칙(rules), 목표(objects) 등)를 확인하고 이 요소들 간의 긴장(tensions)을 분석하였다. 본 연구는 UCSF(University of California, San Francisco) 기관생명윤리위원회(IRB)로부터 면제 판정(exempt)을 받았다.

연구 환경(Context)

  • UCSF 의과대학생들은 12개월에 걸쳐 8개의 필수 임상실습(core clerkships; 마취과, 가정의학과, 내과, 신경과, 산부인과, 소아과, 정신과, 외과)을 수행한다.
  • 2019년, 학교는 임상실습 평가 시스템을 통과/낙제(pass/fail) 로 변경하고, 학습을 위한 평가(assessment for learning)를 강조하기 시작하였다.³⁵
  • 직접 관찰(direct observation)과 피드백을 강화하기 위해, 학교는 2019년 1월부터 형성적 피드백(formative feedback)을 위한 WBA 도구 를 도입하였다.
  • 온라인 WBA 양식(form)은 ▲임상실습 분야(clerkship specialty), ▲관찰한 기술(skill observed), ▲Ottawa scale을 적용한 신뢰 평가(entrustment rating adapted from Ottawa scale)³⁶, ▲서술적 의견(narrative comments)을 기입하는 공간으로 구성되었다.
  • 평가자가 WBA 양식을 제출하면 감독자(supervisor)에게 자동 이메일 알림이 발송된다. 작성된 양식은 해당 학생과 그 학생의 코치(coach), 임상실습 책임자(clerkship director)만 접근할 수 있는 개인 온라인 대시보드(student dashboard)에 저장된다.³⁷,³⁸
  • 모든 학생은 의대 전 과정에서 지속적으로 지도와 피드백을 제공하는 장기 멘토(longitudinal physician coach)를 갖는다.³⁹
  • WBA 자료는 학생의 임상실습 성적(clerkship grades)이나 MSPE(Medical Student Performance Evaluation) 작성 시 사용되지 않는다.
  • 학생들은 평균적으로 매주 2개의 WBA 양식을 작성하도록 요구된다.

연구 기간 2년 동안 UCSF는 서로 다른 형태의 WBA 도구를 사용했다.

  • 1년 차(2019년):
    • 평가자는 학교의 평가 시스템(MedHub)을 통해 컴퓨터로 양식을 작성하였다(부록1 참고).
    • 학생들이 직접 관찰 후 온라인 포털을 통해 감독자에게 양식 링크를 보냈으며, 총 6,919개의 양식이 모두 감독자에 의해 작성 되었다.
  • 2년 차(2020년):
    • 학생 ID 배지의 QR코드를 스마트폰으로 스캔하여 접근 가능한 모바일 양식(Qualtrics 플랫폼 사용)을 활용하였다(부록2 참고).
    • 2년 차부터는 감독자뿐 아니라 학생 본인도 WBA 양식을 작성할 수 있는 선택권이 주어졌다.
    • 9,039개의 양식이 작성 되었으며, 이 중 1,636건(18.1%)은 감독자가, 7,403건(81.9%)은 학생 본인이 작성하였다.

COVID-19로 인한 임상실습 중단으로 인해, 연구는 2년 차(2020년)에 두 시점(timepoints)에서 이루어졌다:

  • 첫 번째 시점(timepoint 1): 임상실습 개시 후 첫 10주 이후
  • 두 번째 시점(timepoint 2): COVID-19로 인한 4개월 중단 이후 임상실습 재개 및 종료 시점(그림2 참고).

중단 후 재개된 임상실습은 기간이 3~6주 단위로 축소되었다(상세 자료는 부록3 참고).

 

연구 참여자(Participants)

본 연구는 WBA 도구의 주요 사용자이자 수혜자인 임상실습 학생(core clerkship students) 을 주요 대상(subjects)으로 선정하였다. 또한, 2년간(2019-2020년)의 피드백 활동을 분석하면서, 도구 설계(tool design)의 변화와 역할 분담(division of labor; 감독자 또는 학생이 작성)의 변화에 주목하였다.

  • 1년 차 학생(2019년) 은 이전 연구(임상실습 평가 연구)에서 WBA 관련 질문을 포함한 인터뷰에 참여한 바 있으며,⁴⁰ 이 연구에서 도출된 초기 결과가 현 연구를 심화시키는 데 기여하였다.
  • 연구자는 이메일을 통해 임상실습 학생들에게 반구조화된 인터뷰(semistructured interviews) 참여를 요청하였고, 응답한 순서대로 인터뷰를 진행하였다.
  • 1년 차 데이터를 분석하는 과정에서, 전통적 블록 실습(traditional block) 학생과 종단적 통합 임상실습(Longitudinal Integrated Clerkship, LIC) 학생 간에 패턴의 차이가 나타나, 이를 더 심도있게 탐구하고자 하였다. 이에 따라 2년 차 연구에서는 두 가지 임상실습 유형의 학생들을 모두 포함하는 목적적 표집(purposive sampling)을 시행하였다.
  • 또한 COVID-19 중단 전후의 피드백 활동 시스템에서 학생들의 초기 경험(early learning)과 이후 다양한 전공 간 경험을 모두 분석하기 위해 앞서 설명한 두 가지 시점(timepoints)을 설정하였다.
  • 인터뷰에 참여한 학생에게는 전자 기프트카드(electronic gift card) 20달러를 제공하였다.

 


인터뷰 가이드(Interview guide)

피드백 및 WBA에 대한 문헌 검토(literature review)⁴,⁶,¹⁰ 를 기반으로 인터뷰 가이드를 개발했다. 1년 차와 2년 차의 인터뷰 가이드는 서로 달랐다.

  • 1년 차 인터뷰 자료 는 앞서 진행된 임상실습 평가(clerkship grading)에 관한 보다 광범위한 연구의 일부로서 개별 질적 인터뷰(individual qualitative interviews)를 통해 수집되었고, WBA에 대한 질문을 포함했다.⁴⁰
  • 이 1년 차 자료의 샘플 분석을 통해 CHAT의 관점에서 활동 시스템(activity system)의 요소들을 확인하였으며, 이는 2년 차 인터뷰 가이드 개발 의 토대가 되었다. 확인된 활동 시스템의 주요 요소는 다음과 같다:
  • 주체(subjects) : 학생
  • 도구(tools) : WBA 도구 버전
  • 규칙(rules) : 학교의 요구사항, 피드백 제공의 규범(norms of feedback)
  • 공동체(community) : 교수진(attendings), 전공의(residents), 동료(peers) 등 전체 학습문화(overall learning culture)
  • 역할 분담(division of labor) : WBA 양식의 작성 및 요청 주체
  • 목표(object) : 활동에 대한 학생들의 인식된 혹은 실제 목적(perceived or actualized purpose)
  • 결과(outcome) : 이 요소들 간 상호작용의 결과(results from interactions)
  • 2년 차 인터뷰에서는 이러한 임상실습 피드백 활동 시스템 요소들에 대한 학생들의 생각(ideas), 태도(attitudes), 행동(behaviors)을 탐색하였다(그림 1; 부록4 참고).²¹
  • 피드백 및 평가의 민감한 특성을 고려하여 반구조화된 개별 인터뷰(semistructured individual interviews) 를 진행하여 학생들의 익명성을 보장하였으며, 인구통계학적 정보(demographic information)는 학생들의 자가보고(self-reported) 방식으로 수집했다.

자료 수집(Data collection)

  • 두 명의 훈련받은 연구자(L.S., Abdikarin Abdullahi⁴⁰ 및 L.B.P., A.F.)가 매년 인터뷰를 수행했다.
  • 인터뷰 가이드는 연구 대상이 아닌 학생(예: 실습이 끝난 postclerkship students)을 대상으로 파일럿 인터뷰(pilot interview) 를 진행하여 사전 검증하였다.
  • 선임 연구자(B.C.O., K.E.H.)의 피드백을 받아 질문의 흐름(flow), 명확성(clarity), 적합성(relevance)을 향상시켰다.

인터뷰는 다음과 같은 일정으로 진행되었다(그림2 참고):

  • 1년 차 인터뷰 : 2019년 6월부터 8월까지, 전화 또는 대면으로 진행.
  • 2년 차 인터뷰 :
    • 첫 번째 시점(Timepoint 1): 2020년 5월 (Zoom 활용)
    • 두 번째 시점(Timepoint 2): 2020년 10월부터 11월 (Zoom 활용)

모든 인터뷰는 전문적으로 음성 녹음(audio recording)되었으며, 분석 전에 필사(transcription) 및 익명화(deidentification) 처리되었다.


자료 분석(Data analysis)

  • 분석은 인터뷰 녹취록(transcripts)을 CHAT의 맥락에서 읽으면서 코딩 프레임워크(coding framework)를 구축하는 것으로 시작했다.
  • 1년 차 인터뷰 및 2년 차 첫 번째 시점 인터뷰에서 얻은 5개의 녹취록을 이용하여, 3명의 연구자(L.B.P., B.C.O., K.E.H.)가 CHAT 활동 시스템 요소들과 일치하는 코드를 도출하였다.
  • 토론을 통해 분석 과정에서 지속적으로 코드북(codebook)을 수정하고 개선하였다. 완성된 코드북을 사용하여 2명의 연구자(L.B.P. 및 A.F., B.C.O., 또는 K.E.H.)가 이전 연구에서 수집된 모든 1년 차 인터뷰 자료를 코딩했다.⁴⁰
  • 2년 차 자료는 수집과 분석을 동시에 진행하였다.
  • 각 녹취록은 2명의 연구자(L.B.P.와 A.F., B.C.O., 또는 K.E.H.)가 독립적으로 코딩한 뒤 토론을 통해 의견 불일치를 조정하였다.
  • 첫 번째 시점과 두 번째 시점에서 각각 9건씩의 인터뷰가 완료된 후, 새로운 아이디어가 더 이상 도출되지 않고 CHAT 활동 시스템 각 요소에 대한 풍부한 사례(rich examples)가 확보되어, 이론적 충분성(theoretical sufficiency)이 달성된 것으로 판단하였다.⁴¹
  • 코드로 분류된 발췌본(excerpts)을 분석하여 활동 시스템 내 긴장(tensions)을 확인하고, CHAT 도표(diagrams)를 이용한 개념적 논의(conceptual discussion) 및 데이터 시각화(data visualization)를 통해 긴장을 요약하고 세분화하였다.
  • 자료의 코딩 및 관리는 Dedoose 프로그램(버전 8.3.47)을 활용하였다.

성찰성(Reflexivity)

  • 연구팀은 코드 개발 및 조정 과정에서 성찰성에 대한 지속적인 논의를 진행하였다.
  • 연구팀 구성원들은 다양한 관점(varied perspectives)을 가지고 있었다:
    • 1년 차 WBA 구현을 경험한 선임 의과대학생(L.B.P.)
    • WBA 경험이 없는 임상실습 이전(preclerkship)의 의과대학생(A.F.)
    • 관련 문헌에 정통한 교수이자 교육과학자(B.C.O.)
    • 1년 차 연구에 참여했던 전공의(L.S.)⁴⁰
    • 두 해에 걸쳐 WBA 설계와 구현을 감독한 부학장(associate dean, K.E.H.)
  • 자료 분석 전반에서 자기 성찰적 저널링(self-reflective journaling) 및 메모(memos)를 활용하여 연구진의 가정과 해석(assumptions and interpretations)을 투명하게 관리하였다.
  • 이를 통해 서로의 해석을 비판적으로 검토하고, 토론을 거쳐 합의(consensus)로 연구 결론을 도출하였다.

 


결과(Results)

  • 1년 차: 총 168명의 임상실습(clerkship) 학생들이 이메일 초청을 받았고, 이 중 18명이 인터뷰에 참여하였다.⁴⁰ 단, 연구팀 저자였던 인터뷰 참여자 L.B.P.의 자료는 제외하였으며, 최종적으로 17명의 학생 데이터가 분석에 포함되었다.
  • 2년 차: 총 167명의 학생이 이메일 초청을 받았으며, 25명이 응답하였다. 이 중 18명이 실제로 인터뷰에 참여하였으며, 첫 번째 시점(timepoint 1)에 9명, 두 번째 시점(timepoint 2)에 9명이 참여하였다.
  • 참가자의 자가보고 인구통계 정보(self-reported demographic data)는 표 1에 제시되어 있다.


우리는 CHAT 관점에서 다음의 5가지 주요 활동 시스템 내 긴장(tensions) 을 확인하였으며, 이들은 시간 경과 및 도구의 변화에 따라 달라졌다:

  1. WBA 피드백이 총괄평가(summative assessment)로 오해되는 현상
  2. 피드백을 지연시키는 번거로운 도구 설계(cumbersome tool design)
  3. 감독자에게 WBA 요청이 부담이 될까 우려하는 심리
  4. WBA가 단순한 체크리스트 활동인지, 학습 기회로 여겨지는지에 대한 인식의 차이
  5. 각 임상실습 특유의 학습 문화 안에서 WBA가 수행되는 방식

→ 그림 3 참조.

 

2년 차에는 특히 학생이 WBA 양식을 직접 작성할 수 있는 기능(self-completion capabilities) 이 추가됨에 따라 새로운 긴장 요소들이 발생하였다:

  • 자율성(autonomy)과 감독(supervision) 간의 균형 문제
  • WBA 내용의 일관성 부족
  • 여전히 WBA가 단순한 체크리스트 활동 으로 인식되는 현상

→ 부록 5 참고: http://links.lww.com/ACADMED/B292

 

이하의 결과에서는 이러한 긴장의 진화 과정, 긴장을 매개한 시스템 요소들, 학생들이 이를 극복하기 위해 사용한 전략들을 기술하였다. 인용문에는 인터뷰 연도(I 또는 II)와 참여자 번호(1–18)를 병기하였다. 2년 차 참여자는 II-1~II-9(첫 번째 시점), II-10~II-18(두 번째 시점)으로 표기하며, LIC 학생은 별도 표기하였다.


🔹 WBA 피드백이 총괄평가로 오해됨

비록 WBA는 형성평가(formative assessment) 를 위해 설계되었지만, 1년 차 학생들은 이를 총괄평가(summative assessment)로 인식하였다(object의 오해). 학생들은 감독자들이 동일한 온라인 플랫폼에서 사용되는 총괄평가 양식과 WBA 도구를 혼동하는 것을 관찰했다. 이로 인해 형성적 피드백 시스템에 대한 신뢰(trust) 가 약화되었다:

"저는 [WBA]를 보내는 걸 망설여요. 예전에도 그랬는데, 감독자가 제 총괄평가 양식 대신 그것만 작성하는 경우가 있었거든요." (I-2)

 

2년 차에서는 WBA 전용 플랫폼(도구)이 도입되면서 형성/총괄평가 간의 구분이 명확해졌고, 이러한 긴장은 완화되었다:

"한 한 달쯤 실습 돌고 나서야 깨달았어요. '아, 이거는 그냥 나를 위한 거구나. 다른 사람을 위한 게 아니구나'라는 걸요." (II-1)

 

하지만 도구의 의도를 이해하면서도 여전히 “총괄평가에 반영될지도 모른다” 는 우려는 남아 있었다:

"그날 있었던 일이 잘 안 풀렸을 때, ‘이거는 평가가 아닌 건 알지만, 그래도 이걸 언급하면 이 감독자가 그 주에 기억하는 건 결국 그 나쁜 경험일 수도 있잖아’ 하고 걱정됐어요." (II-3)

 

해당 학생은 새로운 감독자에게 도구의 목적을 사전에 설명함으로써 긴장을 완화하고자 하였다:

"우리는 항상 이렇게 말해야 해요. ‘WBA를 주 2개씩 받아야 하고, 이건 형성적 피드백이지 평가 목적이 아니에요. MSPE에 포함되지 않아요.’” (II-3)

 

또한 일부 학생들은 긍정적인 피드백을 받을 수 있는 관찰자나 기술을 전략적으로 선택 하기도 했다. 더불어, 학생이 WBA를 직접 작성할 수 있는 기능(self-completion) 이 추가되면서 형성 대 총괄 평가(object)의 긴장 완화에 도움이 되었다. 이 기능은 학생들이 WBA를 자신이 이해하는 목적에 맞게 활용할 수 있도록 하였다.


🔹 피드백 지연을 유발한 번거로운 도구 설계

1년 차 도구에서는 실시간 피드백(object)을 지향하면서도, 컴퓨터에서 WBA 양식을 작성해야 하는 제약(tool) 이 있어 모순이 발생했다. 학생들은 관찰 후 수 시간 뒤에 WBA 요청 링크를 감독자에게 전송하였고, 감독자는 늦게 작성하거나, 형식적인(generic) 피드백만 제공하였다:

"가끔은 너무 일반적인 피드백만 받아서, 도대체 뭘 보고 그런 말을 하는 건지 알 수가 없어요. 때로는 제가 그 감독자랑 일했던 시점보다 몇 주가 지나서야 [WBA]가 돌아오기도 해요." (I-5)

 

학생들은 형식적이고 지연된 피드백이 학습자와 감독자 모두의 참여도(buy-in)를 저해한다고 인식했다(community의 문제). 단, 마취과(anesthesia) 실습에서는 모바일 QR 코드 방식 을 시범 도입하여 실시간 피드백이 활발히 이루어졌다. 2년 차 도구는 QR 코드를 통한 모바일 기반 설계로, 직접 관찰과 동시에 WBA를 완료할 수 있게 되어 지연 문제를 해소하였다:

"저는 QR 코드의 열렬한 팬이에요. 우리 학년부터 생긴 기능인데, 누군가에게 링크를 문자나 이메일로 보내는 것보다 훨씬 간편하거든요. 바로 그 자리에서 할 수 있어요." (II-1)

 

감독자 역시 이 기술 변화로 인해 WBA 참여도가 향상되었다고 느꼈다:

"감독자들이 새 시스템이 훨씬 더 낫고 쉽다는 걸 깨달은 이후에는 반감 같은 건 거의 없었어요. 다들 잘 따라오시는 것 같아요." (II-9, LIC)

 

하지만 2년 차에도 일부 기술적 장애물은 남아 있었으며, 예컨대 학생들이 자신의 대시보드에서 피드백 내용을 제대로 확인하지 못하는 문제가 있었다. 그럼에도 불구하고, 도구 기술의 전반적인 개선학생과 감독자 공동체(community) 의 WBA 도구 지지를 강화하였고, 실시간 피드백이라는 원래의 목적(object) 과도 더욱 잘 일치하게 되었다.

 


🔹 WBA 요청이 감독자에게 부담이 될까 걱정됨

1년 차와 2년 차 모두에서 학생들은 자신이 감독자에게 부담을 주는 것이 아닐까 하는 우려를 표현했다. 학생들은 WBA 요청이 환자 진료나 팀의 바쁜 일정에 방해될까 걱정했다. 비록 임상실습 책임자들이 피드백 요청을 장려했지만, 피드백 대화를 문서화해야 한다는 규칙(rule) 이 노동집약적이고 불필요하게 느껴졌으며, 특히 1년 차에서는 도구 작성 책임이 전적으로 감독자에게 있었기 때문에 그 부담감이 더 컸다:

“[WBA]는 모든 사람에게 짜증나는 일이에요. 전공의들은 양식 하나 더 작성하고 싶지 않고, 의대생들도 바쁜 전공의들에게 또 양식을 부탁하는 게 싫죠.” (I-5)

 

하지만 지도교수와의 장기적 관계(longitudinal relationships) 가 이 긴장을 완화시키는 데 도움이 되었다:

“저는 오히려 [WBA] 요청이 더 수월해요. 제가 담당 교수님들과 장기적으로 관계를 맺고 있고, 그분들은 제 교육을 위해 존재하는 분들이니까요.” (II-10, LIC)

 

또 다른 학생들은 감독자의 부담을 줄이기 위해 책임을 스스로 떠맡으려는 태도(division of labor) 를 보였다. 예컨대, 1년 차 학생들은 감독자가 기억하지 못할 것을 고려하여 사전에 내용을 기록해 주기도 했다:

“감독자가 말했던 피드백을 제가 미리 메모해 두고, 그걸 토대로 WBA를 작성하도록 도왔어요. 보통 감독자들이 뭘 피드백했는지 기억도 못 하시거든요.” (I-4)

 

2년 차에서는 학생이 직접 WBA를 작성할 수 있는 기능(self-completion)이 생기면서 역할 분담 구조가 바뀌었다. 처음에는 여전히 감독자에게 WBA 작성을 요청했지만, 점차적으로 학생 스스로 양식을 작성하는 경우가 많아졌다. 이로 인해 학생들은 자신의 필요에 따라 도구를 활용하여 규정을 충족하거나 피드백을 수집했다. 어떤 경우에는 사후 작성(retroactive completion) 을 하거나, 감독자에게 알리지 않고 조용히 작성하기도 했다.

“제가 직접 작성하는 게 훨씬 쉽기는 해요. 하지만 솔직히 감독자가 직접 쓰셨을 때보다 피드백의 질은 떨어지는 것 같아요. 좀 더 깊이 생각해주시는 게 어렵죠.” (II-8)

 

몇몇 학생에게는 WBA 직접 작성이 감독자에게 미안한 감정을 덜어주는 동시에 학습에도 긍정적인 영향을 주었다. 피드백 내용을 기록하면서 자기 성찰(self-reflection) 을 강화하는 계기가 되었다:

“우리가 얘기한 내용을 제가 적어놓는 게 도움이 됐어요. 뭔가 빠뜨리지 않게 정리하고, 피드백 내용을 요약하고 재진술하는 것도 제게는 좋은 훈련이었어요.” (II-3)


🔹 WBA가 체크리스트인가, 학습 기회인가

학생들은 WBA의 피드백 목적(object) 에는 공감했지만, 주당 2개의 WBA 작성 규칙(rule) 이 이 목적을 가리는 경우가 많았다. 많은 학생들이 이 규칙을 스트레스로 인식했으며, 규정이 없거나 더 적은 횟수가 더 낫다고 느꼈다. 하지만 일부 학생들은 피드백을 꾸준히 요청하도록 유도하는 기능이 있다는 점에서 규정의 가치를 인정했다:

“이런 규정은 있어야 해요. 스스로 어떤 걸 해야 한다는 걸 강제하지 않으면, 지키는 게 어렵다는 걸 깨달았거든요.” (II-8)

 

대부분의 경우, 학생들은 WBA의 진정한 목적보다는 '규정 충족' 자체를 활동의 목표(object)로 인식하게 되었다. 다만, 2년 차에서는 감독자에게 의존하지 않고 WBA를 작성할 수 있게 되면서 이 긴장은 어느 정도 해소되었다. 하지만 규칙이 너무 경직되어 있다고 느낀 학생들은 유용한 피드백보다는 작성 편의성에 초점을 두게 되었다:

“이 숫자를 채워야 한다는 생각에, 누가 피드백을 주자마자 ‘이걸 [WBA]로 바로 만들 수 있을까?’만 생각하고, 정작 피드백에 집중을 못했어요.” (II-14)

 

감독자 역시 규칙 충족에만 집중하면, 피드백의 진정성(authenticity)유용성(usefulness) 이 떨어진다고 학생들은 지적했다:

“이건 그냥 또 하나의 체크리스트처럼 느껴져요. 너무 실망스러워요. 저는 제 의학교육이 그냥 ‘체크만 하는 것’이 되는 걸 원하지 않거든요. 감독자들도 좀 더 진심으로 참여하셨으면 해요.” (II-15)

 

반대로, 규칙에 덜 압박을 느낀 학생들WBAs를 학습 중심으로 더 자유롭게 활용할 수 있었으며, 발전이 필요한 영역에 피드백을 요청하기도 했다:

“제가 어떤 기술을 잘 하고 있는지, 다음에는 뭘 더 해야 하는지, 어떤 부분에서 피드백을 받아야 할지를 돌아보게 돼요. 1년 동안 제 성장을 추적하는 데 도움이 돼요.” (II-9, LIC)

 

특히 자발적 피드백을 주지 않는 감독자들과 함께한 학생들은, 규정을 피드백 대화를 주도하는 근거로 활용했다. 많은 학생들이 작성된 피드백보다, 그 대화 자체가 더 가치 있었다고 평가했다:

“이게 저희에게 ‘저에 대해 자주 피드백 주세요’라고 말할 수 있는 기회를 줘서 정말 좋아요. 이게 규정이니까요.” (II-11)


🔹 임상실습별 학습 문화와 WBA

WBA의 유용성은 각 임상실습(clerkship) 환경과 문화(culture) 에 따라 달라졌다. 학생들은 감독자와 임상실습 책임자(clerkship directors)가 분위기를 좌우한다고 느꼈다. 도구 활용을 장려하는 교수진 은 WBA의 가치를 높이는 반면, 도구 활용을 회피하는 교수진은 WBA 수행을 어렵게 만들었다. 앞서 언급한 긴장의 변화에 따라, 2년 차 학생들은 1년 차보다 감독자들이 WBA에 더 적극적인 태도를 보였다고 평가했다.

 

전공과 실습 장소에 따라 WBA에 대한 지원 정도가 상이했으며, 이는 WBA 요청 시 학생들의 심리적 안정감에도 영향을 미쳤다.

  • 내과(internal medicine) 는 피드백을 중시하는 문화가 뚜렷하여, 감독자가 WBA 작성을 제안하는 경우가 많았다.
  • 소아과(pediatrics) 처럼 직접 관찰과 피드백이 일상 업무에 포함된 전공은 자연스럽게 WBA 수행이 용이했다.
  • LIC 학생들 은 장기적인 관계 덕분에 WBA를 요청하는 것이 더 편하다고 느꼈다.
  • 반면, 지속적인 피드백 문화가 이미 정착된 환경에서는 WBA가 불필요하다고 느끼는 경우도 있었다.

WBA 수행이 어려운 환경에서는, 감독자가 지나치게 바쁘고, 피드백의 질도 떨어지는 경우가 많았다:

“외과니까 바쁜 거 이해해요. 전공의들 절반은 WBA가 뭔지도 모르는 것 같았어요. WBA 작성해 달라고 부탁하는 게 정말 고역이었어요.” (II-9, LIC)

 

학생들은 비협조적인 문화 속에서도 WBA를 받기 위한 전략을 개발했다. 예컨대,

  • 구두 발표(oral presentation)처럼 관찰이 쉬운 상황을 포착하거나,
  • 피드백을 사후에 기록(log)하거나,
  • WBA가 무엇인지 자세히 설명하지 않고 피드백 요청만 간단히 하는 방식 등을 활용하였다:

“흉부외과 실습할 때는 그냥 이렇게 말했어요. ‘피드백을 기록해도 될까요?’ ... [WBA]가 뭔지에 대해 길게 설명하진 않았어요. 그냥 피드백만 요청했죠.” (II-13)

 


논의(Discussion)

본 연구에서는 피드백 활동 시스템(feedback activity system) 내 구성요소로 작동하는 WBA 도구를 중심으로 시간의 흐름과 도구의 변화에 따라 달라지는 여러 가지 긴장(tensions) 을 확인하였다.

  • WBA가 형성평가(formative assessment) 를 위한 수단으로 제도적으로 장려되고 있음에도 불구하고, 학생들은 여전히 WBA가 총괄평가(summative assessment)로 오용될 가능성에 대한 우려를 나타냈으며, 이는 피드백 시스템 내 지속적인 긴장 요소였다.
  • 초기 WBA 도구의 비효율적인 설계(tool design) 는 WBA 작성 지연과 피드백 전달의 저하로 이어졌고, 결과적으로 학생과 감독자 모두의 참여도(buy-in) 를 떨어뜨렸다.
  • 학생들은 감독자에게 부담을 주고 싶지 않다는 이유로 WBA 요청을 꺼렸고, WBA를 규정상의 '체크리스트'로만 인식할 경우, 그 본래 목적이었던 유용한 피드백 제공이 약화되었다.
  • 또한, 감독자의 태도와 도구에 대한 인식맥락(context)과 문화(culture) 는 학생들의 도구 사용에 영향을 미쳤다.

이러한 긴장들은 정적인 것이 아니라 동적으로 변화하였으며, 기존 긴장이 완화되는 동시에 새로운 긴장이 나타났고, 결과적으로 학생들이 인식한 WBA에 대한 수용도(acceptance)는 2년 동안 전반적으로 향상되었다(보충 부록 5 참조: http://links.lww.com/ACADMED/B292).


🔹 CHAT 이론의 통합적 관점

CHAT(Cultural Historical Activity Theory)이론적 틀(theoretical framework) 로 채택함으로써, 피드백과 WBA를 단일 행위가 아닌 더 넓은 활동 시스템(activity system)의 일부로 분석할 수 있었다.

  • 대부분의 WBA 관련 연구는 사용자(user)도구(tool) 자체에 초점을 맞추지만, 실제 임상 교육환경에서의 직접 관찰과 피드백다양한 요소들이 상호작용하는 복합 시스템 안에서 이루어진다.⁴²
  • CHAT는 주체나 도구만이 아니라, 활동 시스템을 구성하는 모든 요소 간의 관계에 주목하도록 시야를 전환시킨다.⁴³,⁴⁴

도구의 두 가지 버전(2019년과 2020년)을 분석하면서, 활동 시스템 내 요소들이 서로 어떻게 영향을 미치는지 이해할 수 있었다.

  • 예컨대, 1년 차에는 다양한 긴장이 시스템 내 단절(fragmentation)을 드러냈으나, 2년 차로 넘어가면서 형성평가 목적을 지지하는 방향으로 시스템 요소 간 조정(coordination)이 이루어졌다.

이는 WBA의 구현을 이해하는 데 있어 단순한 도구 사용 분석을 넘어 활동 패턴 자체에 대한 심층적 고찰을 가능하게 하였으며, CHAT는 그러한 해석을 이끌어내는 데 탁월한 이론적 도구였다.

 

또한, Engeström의 확장적 학습 이론(expansive learning theory) 에 따르면, 시스템 내 모순(contradictions)은 변화와 성장을 촉진할 수 있다.²³,²⁴ 본 연구에서의 피드백 활동 시스템의 변화는 이러한 확장 학습의 사례로 이해할 수 있다. 더 나아가 Engeström은 변화 실험실(Change Laboratory) 접근법을 제안하며, 시스템 내 이해관계자 간 협력을 통해 긴장을 분석하고 활동 시스템을 재설계하여 도구 구현을 개선할 수 있다고 보았다.⁴⁵ 이는 교육 맥락에 특화된 WBA 설계 전략을 마련하는 데 유익한 접근이 될 수 있다.


🔹 기존 문헌과의 연계

본 연구 결과는 형성평가를 위한 WBA에 대한 기존 문헌과 잘 일치한다.⁴,¹³,¹⁶,⁴⁶

  • 경쟁이 심한 의학교육 문화 속에서 형성적 평가를 정착시키는 것은 어려운 과제이며,
  • 본 연구는 WBA 피드백 활동 시스템의 여러 요소를 의도적으로 조정함으로써 도구에 대한 인식을 변화시킬 수 있음을 보여주었다.

예컨대,

  • 학생에게 도구 작성 권한을 부여하고(division of labor),
  • 기존 평가 시스템과 분리된 새로운 플랫폼(tool) 을 제공함으로써,
  • 학생들이 WBA를 저부담(low-stakes)의 피드백 도구로 인식하게 되었으며, 피드백 과정에 더 적극적으로 참여하게 되었다.⁴⁷,⁴⁸

하지만 학생들은 여전히 감독자가 기억하는 내용이나 부정적인 피드백 요청의 위험성에 대한 우려를 보였다. 향후에는 피드백의 목적에 대한 학생 및 감독자 교육성장 지향적 대화를 위한 전략 교육을 강화하여, 학습자들이 피드백 활동 시스템에서 자신의 역할을 명확히 이해하도록 해야 한다.⁴⁷


🔹 WBA 설계 및 구현에 대한 시사점

다른 연구들과 마찬가지로, 본 연구에서도 다음과 같은 긴장이 반복적으로 나타났다:

  • WBA가 학습 가치를 가지도록 설계되면서도, 과도한 부담은 주지 않아야 하며
  • **학생과 감독자 간의 역할 분담이 이루어져야 하되, 피드백의 질을 저해하지 않아야 한다.**¹⁰

이에 따라, 본 연구는 피드백 활동 시스템 요소별로 구체적인 권고사항(Table 2 참고) 을 제시하며, 성공적인 WBA 사용을 위한 전략을 다음과 같이 정리하였다:

  • 형성평가를 위한 기술 설계는 사용자 친화적이며 시간 효율적이어야 한다.
  • 학생의 개별 학습 필요에 맞춤화되면서도, 교수자의 일상 업무 흐름을 방해하지 않는 방향으로 설계되어야 한다.⁴⁹
  • WBA 규정이 단순한 체크리스트로 인식되는 현상을 완화하기 위해, 학생 중심의 WBA 도구 개발이 필요하다.
  • 도구 작성 시간에 대한 고려 역시 중요하다. 이는 피드백의 학습 효과를 극대화하는 동시에, 학습자 평가 시스템에서 흔히 발생하는 데이터 수집 및 관리의 부담을 줄이기 위한 전략이다.⁴⁷

궁극적으로, 의과대학은 직접 관찰과 의미 있는 피드백 대화가 장려되는 문화를 조성해야 한다.⁴⁰ 이러한 시스템 수준의 변화(system-level change) 는 시간이 지나면서 피드백과 WBA가 임상실습 학습 문화의 일부로 자연스럽게 통합되도록 유도할 수 있을 것이다.

 


연구의 한계 (Limitations)

본 연구에는 여러 가지 제한점이 존재한다.

  • 자료 수집은 단일 기관(one institution)에서만 진행되었고, 이는 WBA 도구의 초기 2년간의 도입 경험에 국한된다.
    → 다른 기관들의 피드백 활동 시스템은 상이할 가능성이 높으며, 본 연구 결과와의 유사점 및 차이점에 대해 별도의 고려가 필요하다.
  • 본 연구에서의 피드백 활동 시스템에 대한 이해는 자발적으로 참여한 학생들의 관점에 기반하였다.
    → 연구진은 응답 순서대로 학생들을 인터뷰하였으며, 후속 응답자들의 관점이 다를 경우 결과에 영향을 미쳤을 가능성이 있다.
  • 2년 차에는 LIC 학생 비율이 1년 차보다 높아졌는데, 이는 블록형 임상실습 학생들과는 다른 경험 차이를 더 잘 조명하는 데 기여했을 수 있다.
  • 본 연구는 교수진, 전공의, 행정 담당자의 관점은 포함하지 않았으며, 이들의 WBA 구현 경험은 연구 범위를 넘어선다.
    → 그러나 이들의 시각은 활동 시스템 내 상호작용을 더욱 풍부하게 이해하는 데, 특히 업무 부담(perceived workload)고품질 피드백 제공 능력에 대한 인식을 이해하는 데 도움이 될 수 있다.
  • WBA에 대한 수용도 증가는 시간이 지남에 따라 학생들의 익숙함(familiarity)이 높아졌기 때문일 수도 있으며, 이는 1년 차와 2년 차 간 시스템 변화와 무관하게 발생했을 가능성이 있다.
  • Pass/Fail 평가 체제로의 전환도 학생들의 평가 인식에 영향을 주었을 수 있다.
    → 이와 같은 성적 제도의 차이에 따라 활동 시스템은 달라질 수 있으며, 이는 다른 평가 시스템을 운영하는 기관에 적용 시 주의가 필요하다.⁴⁰,⁵⁰
  • COVID-19로 인한 교육과정 중단(curricular interruptions) 은 2년 차에 영향을 미쳤다.
    → 연구진은 임상실습 중단 전후 모두에서 학생들을 인터뷰하였지만, 팬데믹으로 인한 모든 영향을 충분히 포착하지 못했을 수 있다.
    → 그러나, 2년 차의 두 시점(timepoints) 간 WBA 인식이나 사용 방식에는 큰 차이가 없었다.

결론 (Conclusions)

본 연구는 WBA를 시스템 수준의 개입(systems-level intervention) 으로 개념화하는 데 있어 다음과 같은 통찰을 제공한다:

  • 의도된 피드백 목적(learning을 위한 formative feedback) 을 달성하기 위해서는
    사람(people), 기술(technology), 맥락(context) 간의 상호작용을 고려해야 한다.
  • 피드백 활동 시스템을 다양한 관점에서 탐색하고,
    지속적인 시스템 모니터링 및 개선을 수행하는 것은,
    임상실습 환경에서 학습 중심 형성평가 문화를 정착시키기 위한 목표를 달성하는 데 핵심적이다.

필요하시면, 전체 내용을 요약하거나 PPT 슬라이드용으로 정리해 드릴 수도 있습니다. 또는 보충자료(Appendix)와 표(Table 1 & 2)도 요청해 주시면 번역해 드릴게요.

 

 

이 그림은 문화역사활동이론(Cultural Historical Activity Theory, CHAT) 을 기반으로 한 피드백 활동 시스템(feedback activity system) 을 시각적으로 설명한 모형입니다. 특히 이 모형은 WBA(Workplace-Based Assessment, 직장기반평가) 가 의과대학 임상실습 교육 환경에서 어떻게 피드백 활동을 매개(mediate)하고, 그 과정에서 어떤 구성 요소 간 상호작용과 긴장(tension)이 발생하는지를 설명**합니다.


🔷 구성 요소 설명 (CHAT의 6요소 + 결과)

1. Subject (주체)

  • 설명: 활동에 참여하고 있는 학생(student).
  • 역할: 피드백 활동의 중심 참여자이며, 학습 및 자기 성장의 주요 수혜자.

2. Tools (도구)

  • 설명: 활동을 매개하는 도구, 여기서는 WBA 도구가 해당.
  • 예시: WBA 양식, 플랫폼(예: MedHub, Qualtrics), QR 코드 접근 등.

3. Object (목표)

  • 설명: 활동의 목적. 이 그림에서는 피드백(feedback) 이 명시됨.
  • 핵심: 단순히 WBA를 작성하는 것이 아니라, 학습을 위한 피드백 제공이 목적임.

4. Outcome (결과)

  • 설명: 활동의 결과물. 여기서는 학습(learning) 으로 설정됨.
  • 강조점: Object → Outcome으로의 전환은 시스템 요소들이 잘 정렬될 때 이루어짐.

5. Rules (규칙)

  • 설명: 활동과 관련된 규범과 지침(norms and guidelines).
  • 예시: 학교의 WBA 작성 규정, 피드백 횟수 요구(예: 주 2회), 성적 평가 방식 등.

6. Community (공동체)

  • 설명: 활동이 수행되는 맥락에서의 구성원들.
  • 예시: 지도 교수(attendings), 전공의(residents), 동료 학생(peers) 등.

7. Division of Labor (노동의 분업)

  • 설명: WBA 작성을 누가 어떻게 수행하는지를 포함한 역할 분담.
  • 예시: 감독자가 작성 vs. 학생이 자가 작성, 피드백 요청의 주도권 등.

🔷 주요 특징 및 해석

✅ 굵은 선

  • 각 요소들이 서로 상호작용(interaction) 하며 연결되어 있음을 의미합니다.
  • 이 상호작용이 조화를 이루면 효과적인 피드백과 학습으로 이어지고, 불균형이 발생하면 긴장(tension)이 생김.

✅ 회색 점선 화살표 & 주석

  • Tensions (긴장) 은 활동 시스템 요소들 간의 상호작용에서 발생할 수 있으며, 이는 학습과 변화(learning and transformation) 로 이어질 수 있음.
  • 예: 도구(WBA)의 목적이 '형성평가'임에도 불구하고 '총괄평가'로 오해될 경우 Object와 Tool 사이에서 긴장이 발생.

🔷 전체 구조 요약

이 그림은 학생(student) 이라는 주체가, WBA 도구(tool) 를 사용하여, 피드백(object) 을 받기 위한 활동을 수행하고, 그 결과로 학습(outcome) 을 달성하는 이상적인 시스템을 보여줍니다. 그러나 이 모든 과정은 규칙, 공동체, 역할 분담 등 다양한 요소들과의 상호작용에 따라 지원되거나 방해받을 수 있으며, 때로는 긴장과 갈등을 낳기도 한다는 점을 강조합니다.


📌 활용 포인트 (교육적 적용 시)

  • 이 모델은 단순한 평가 도구(WBA) 사용을 넘어, 전체 교육 시스템의 맥락에서 도구가 어떻게 기능하는지 분석하는 데 유용합니다.
  • 또한 시스템 내 긴장 요소를 식별하고 변화 전략을 설계하는 데 이론적 틀로 활용될 수 있습니다 (예: Engeström의 확장학습 모형 및 Change Laboratory 접근).

필요하시다면 이 그림을 활용하여 슬라이드용 요약, 학생 강의 자료, 혹은 연구 프레임워크 구성에 맞춘 분석도 도와드릴 수 있습니다.

 

 

이 그림은 Figure 3으로, **2019년(1년 차)**과 **2020년(2년 차)**에 걸쳐 **임상실습 피드백 시스템의 변화와 그에 따른 긴장(tensions)**을 **CHAT(Cultural Historical Activity Theory)**의 틀을 활용하여 시각화한 것입니다.
특히, 그림은 WBA(Workplace-Based Assessment) 도구의 변화와 함께 시스템 내 요소들 간 긴장이 어떻게 진화했는지를 비교하고 있습니다.


🔷 전체 구조 개요

그림은 두 개의 삼각형 모형을 통해 두 해의 시스템을 각각 시각화하고 있으며, 아래 표에서는 CHAT 요소 간 긴장을 요약하고 비교하고 있습니다.


🔹 Feedback System in Year 1 (2019)

🧩 Tool

  • New MedHub 도구, 컴퓨터 기반, 기술적 문제 있음
  • 도구의 설계가 불편하고 시간 소모적(cumbersome)

🎯 Object

  • 표면적으로는 피드백이 목적이지만, 실제로는 *코스 요건 충족(meet course requirements)*에 치우침

🧑 Subject

  • 임상실습 학생들(clerkship students)

⚖ Rules

  • 주 2회의 WBA 요구가 강제됨

👥 Community

  • 교수, 전공의, 동료 학생들 등 8개의 필수 임상실습 환경의 공동체

🛠 Division of Labor

  • WBA는 전적으로 감독자가 작성

🎯 Outcome

  • 지연된 피드백, 피드백의 질 저하, 도구와 무관한 구두 피드백 발생

🔹 Feedback System in Year 2 (2020)

🧩 Tool

  • Qualtrics 도구, 모바일 기반, QR 코드 접근
  • 실시간 피드백 가능해짐

🎯 Object

  • 형성적 피드백(formative feedback), 감독자와의 상호작용, 코스 요건 충족

🧑 Subject

  • 동일하게 임상실습 학생들

⚖ Rules

  • 주 2회의 WBA 규정은 유지

👥 Community

  • 동일한 8개 실습 환경

🛠 Division of Labor

  • 학생 또는 감독자가 작성 가능(자가작성 허용됨)

🎯 Outcome

  • 실시간 피드백 증가, 학습과 성찰 중심 피드백, 구두/서면 피드백 병행

📊 하단 표 요약: CHAT 요소별 주요 긴장 비교

 

CHAT 요소 간 관계  2019년(Year 1)의 긴장  2020년(Year 2)의 변화
Object vs. Object WBA 피드백이 총괄평가로 오해됨 형성평가 목적에 대한 이해 향상
Tool vs. Object 복잡한 도구 설계로 인해 피드백 지연 발생 모바일 기반 도구로 실시간 피드백 가능
Division of Labor vs. Object 감독자에게 WBA 작성 부담 집중 학생의 자가작성 기능으로 긴장 완화
Rules vs. Object WBA가 체크리스트처럼 수행, 학습 기회로 인식되지 않음 학생 자율성 증가로 규정에 대한 인식 개선
Community vs. Object 임상실습별 문화 차이로 WBA 사용에 차이 발생 문화적 긴장 일부 해소됨 (도구 개선 및 참여 확대 영향)

✅ 핵심 해석

  • 이 그림은 도구의 단순한 업그레이드가 아니라, 역할 분담, 문화, 규칙, 인식 등 활동 시스템 전반의 상호작용이 함께 진화하면서 피드백의 질과 학습 효과가 향상됨을 보여줍니다.
  • 특히 학생이 주체가 되어 도구를 활용하고 피드백을 이끌어내는 방향으로의 전환은, 형식적 ‘과제’에서 실제 ‘학습 기회’로의 전환을 가능하게 했습니다.
  • CHAT은 이러한 복잡하고 다층적인 변화를 분석하고 해석하는 데 매우 강력한 이론적 렌즈로 작동했습니다.

필요하시면 이 도표를 기반으로 슬라이드 요약, 강의 자료, 논문 발표 시 설명용 해석 문구도 제공해드릴 수 있습니다.

 

 

Acad Med. 2022 Oct 1;97(10):1511-1520. doi: 10.1097/ACM.0000000000004774. Epub 2022 Sep 23.

Beyond Checking Boxes: Exploring Tensions With Use of a Workplace-Based Assessment Tool for Formative Assessment in Clerkships

 

 

 

 


🩺 전공의 임상교육에서 효과적인 피드백이란?

― 최근 체계적 문헌고찰을 통해 본 핵심 원칙과 모델들

안녕하세요!
오늘은 전공의 임상교육(Postgraduate Medical Education)에서 ‘피드백(feedback)’을 어떻게 주는 것이 가장 효과적인 방식인지에 대해 다룬 최근 논문 하나를 소개드릴게요. 이 논문은 단순한 제언 수준이 아니라, 관련 문헌을 전반적으로 정리하고 분석한 **체계적 문헌고찰(Systematic Review)**이에요. 덕분에 피드백에 대해 갖고 있던 여러 궁금증들을 명확하게 정리해주는 느낌이었습니다.

🔍 논문 개요

이 논문은 임상 현장에서 감독자(supervisor)가 피감독자(supervisee, 주로 전공의)에게 피드백을 제공할 때, 과연 어떤 방식이 가장 효과적일지를 파악하기 위해 다양한 모델과 원칙들을 분석한 체계적 고찰이에요. 연구진은 이렇게 말합니다:

“We aimed to systematically and critically review the empirical evidence focusing on the provision of effective feedback in clinical supervision in postgraduate medical education.”
→ 우리는 전공의 임상 교육에서 효과적인 피드백 제공에 관한 경험적 근거를 체계적이고 비판적으로 고찰하고자 했다.

 

그리고 부차적인 목적은 이렇습니다:

“Our secondary aim was to identify the common and differentiating components of models and guidance relating to the provision of effective feedback in this context.”
→ 이 맥락에서 모델들과 가이드라인의 공통점과 차이점을 규명하는 것이었다.


1️⃣ 도입: 피드백에 대한 새로운 관점

예전에는 피드백을 단순히 "감독자가 피감독자에게 정보를 전달하는 것"으로 생각했어요. 하지만 요즘은 피드백을 ‘대화’로 바라보는 시선이 늘고 있습니다. 즉, 피감독자가 수용하고 활용할 수 있도록 **공동 성찰(joint reflection)**을 이끄는 방식이죠.

“There is a growing trend towards thinking about feedback as a conversation… with the supervisor facilitating joint reflection on the supervisee’s performance and ways to improve it.”
→ 피드백을 대화로 인식하려는 경향이 증가하고 있으며, 이때 감독자는 피감독자와 함께 수행을 돌아보고 개선 방안을 모색하는 역할을 한다.

 

하지만 실제 현장에서의 간극은 존재합니다. 감독자는 보통 “충분히 피드백을 준다”고 느끼는 반면, 피감독자는 “양도 적고 질도 떨어진다”고 느끼는 경우가 많아요. 이를 해결하기 위해 여러 피드백 모델과 가이드라인이 소개되어 왔지만, **경험적 근거(empirical evidence)**가 얼마나 탄탄한지에 대한 질문은 여전히 남아 있었죠.


2️⃣ 본론: 문헌고찰을 통해 발견한 주요 결과들

📚 포함된 연구 개요

  • 4745개의 문헌을 검색했고, 이 중 51편이 포함 기준을 충족했어요.
  • 그 중 **12편은 경험적 연구(empirical studies)**였고, 나머지는 이론 기반 논문이었습니다.

경험적 연구들은 대부분 질적으로 fair한 수준으로 평가되었고, **피드백의 효과성(effectiveness)**은 주로 **감독자와 피감독자의 인식(perceptions)**에 근거해서 평가되었어요. 단 한 편만이 행동 변화를 직접 측정했다고 하니, 이 부분은 좀 아쉬운 지점이었죠.


🧱 주요 피드백 모델들과 그 공통 요소

총 21개의 피드백 모델을 분석했는데, 이 중 10개 이상(50% 이상)에서 공통으로 포함된 ‘핵심 구성 요소(core components)’는 다음과 같아요:

  • 피감독자의 자기평가(self-assessment) 유도
  • 개선이 필요한 영역 언급
  • 개선 제안 제공
  • 개선 계획(improvement plan) 수립

이 외에도 20~50%의 모델에서 나타난 ‘공통 구성 요소(common components)’는 다음과 같아요:

  • 교육적 동맹(educational alliance) 형성
  • 목표 검토와 초점 설정
  • 구체적이고 행동 중심적인 내용
  • 직접 관찰 기반 피드백
  • 잘한 점 강조
  • 피감독자의 피드백 인식 탐색

📌 재밌는 점은, 다양한 모델들이 이들 구성 요소를 중심으로 서로 큰 충돌 없이 일관된 원칙을 공유하고 있다는 점이었어요.


🧠 효과적인 피드백의 공통 원칙들

문헌에서 공통적으로 등장한 ‘효과적인 피드백의 원칙들’ 중 일부는 다음과 같아요:

  • 구체성(Specificity)
  • 시기적절함(Timeliness)
  • 비판단적 언어 사용(Descriptive, non-judgemental language)
  • 정기적인 피드백(Regularity)
  • 대면(face-to-face) 피드백

이 중 일부는 기존 모델에 반영되지 않았다는 점이 흥미롭죠. 예를 들어 정기적인 피드백 제공이나 비판단적 언어 사용은 모델보다는 문헌에서 더 많이 강조된 원칙이에요.


3️⃣ 후반부: 감독자의 태도와 피드백의 관계, 그리고 현실의 복잡성

연구진은 이렇게 말합니다:

“Effective feedback is not about just delivering a message; it involves facilitating a conversation to collaboratively understand the supervisee’s performance and find ways to enhance it.”
효과적인 피드백은 단순한 전달이 아니라, 피감독자의 수행을 함께 이해하고 개선 방법을 찾기 위한 대화를 이끄는 것이다.

 

그리고 감독자가 단지 지식을 아는 것만으로는 부족하고, 다음과 같은 개인적 자질이 매우 중요하다고 강조해요:

  • 태도(attitudes)
  • 가치관(values)
  • 동기(motivation)
  • 헌신(commitment)

또한, **감독자의 이중 역할(conflicting roles)**이 피드백에 부정적 영향을 줄 수 있다는 점도 짚고 넘어갑니다.

“When conflicting roles are unaddressed, it can lead to a rupture in the educational alliance and limit a supervisee’s openness to disclosing areas they would benefit from improvement in.”
상충되는 역할이 명확히 다뤄지지 않으면 교육적 동맹이 깨지고, 피감독자는 자신의 개선이 필요한 영역을 드러내는 데 주저하게 된다.


🧭 결론: 통합 모델의 의미와 향후 연구 방향

결론적으로, 모델 자체를 뒷받침하는 경험적 근거는 아직 제한적이지만, 피드백 원칙 자체에 대해서는 문헌 전반에서 상당한 합의가 이루어졌다는 점이 위안이 됩니다.

 

연구진은 다음과 같이 마무리합니다:

“We envisage that the principles outlined in our composite model emerging from this review will be of practical assistance to supervisors in working collaboratively with supervisees to deliver feedback effectively.”
→ 우리는 이번 고찰을 통해 도출된 통합 모델의 원칙들이, 감독자가 피감독자와 협력적으로 효과적인 피드백을 제공하는 데 실질적인 도움이 될 것이라 기대한다.


🩺 도입(Introduction)

Clinical supervision은 **전공의 교육(postgraduate medical education)**의 핵심 요소입니다.¹–³ 감독자가 피감독자에게 그들의 수행(performance)에 대해 제공하는 *피드백(feedback)*은, **효과적인 임상 지도(clinical supervision)**의 핵심 구성 요소로 간주되며,⁴–⁶ 피감독자의 학습과⁴ 수행 향상⁴ ⁷–⁹을 촉진합니다. 전통적으로 피드백은 감독자가 피감독자의 수행의 어떤 측면에 대해 **일방향적(one-way)**으로 정보를 전달하는 것으로 개념화되었습니다.¹⁰ 하지만 최근에는 피드백을 **대화(conversation)**로 간주하려는 경향이 증가하고 있습니다. 이때 감독자는 피감독자의 수행에 대해 **함께 성찰(joint reflection)**하고, 이를 어떻게 향상시킬 수 있을지에 대해 함께 논의하는 역할을 수행합니다.⁴ ¹¹ ¹²

 

이러한 *현대적인 개념화(contemporary conceptualisation)*에서 핵심은, 학습자(피감독자)를 적극적으로 참여시키는 것이며, 이는 피드백을 **수용(acceptance)**하고 **개선에 활용(use)**할 수 있도록 하기 위한 목적입니다.⁴ ¹¹ ¹²

 

감독자들은 일반적으로 충분하고 빈번하게 피드백을 제공한다고 믿고 있습니다.⁴ ⁸ ¹⁰ ¹³ ¹⁴ 하지만, 피감독자들은 자신이 받은 피드백이 양과 질 모두에서 부족하다고 인식하는 경향이 있습니다.⁴ ⁷ ⁸ ¹⁰ ¹³ ¹⁴ 효과적인 피드백을 제공하기 위한 가이드라인은 문헌상 존재하며, 대표적으로는

  • Feedback Sandwich 모델,⁷ ⁸
  • Pendleton’s rules,⁶–⁸
  • ALOBA principles⁶ 등이 있습니다.

하지만 **이러한 가이드라인이 실제 경험적 근거(empirical evidence)**에 의해 얼마나 뒷받침되는지는 명확하지 않습니다.

본 연구의 목적전공의 임상 교육 상황에서 효과적인 피드백 제공에 대한 경험적 근거를 체계적이고 비판적으로 고찰하는 것이며, 부차적 목적으로는, 해당 문맥에서 사용되는 피드백 모델들과 가이드라인의 공통 요소와 차별 요소를 규명하고자 하였습니다.


🔍 연구 방법(Method)

본 연구는 **체계적 문헌고찰(Systematic Review)**로, **PRISMA 가이드라인(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)**¹⁵을 따랐으며, 연구 프로토콜은 PROSPERO에 등록하였습니다.¹⁶

📌 포함 기준 (Eligibility Criteria)

우리는 다음과 같은 조건을 만족하는 경험적(정성적 또는 정량적)이론적 문헌을 찾고자 하였습니다:

  • Population (대상): 전공의 의학 교육 맥락에서 임상 지도를 받는 의료 종사자(medical practitioners)
  • Intervention (중재): 효과적인 피드백 제공을 목적으로 하는 모델 또는 가이드라인
  • Outcome (결과): 피드백이 *효과적(effective)*이었는지를 중심으로 평가
    → 예: 피감독자의 행동 변화, 감독자 및 피감독자의 태도나 인식
  • Comparator (비교군): 대부분의 문헌이 비통제(uncontrolled)일 것이라 예상되어 비교군 기준은 정의하지 않았음
  • 제외 기준: 언어 및 출판연도에 제한을 두지 않음

🗂 정보 출처 (Information Sources)

예비 검색 후, JW가 아래 데이터베이스에서 정식 검색을 수행하였습니다:

  • PubMed
  • EMBASE
  • PsycINFO
  • CINAHL
  • The Cochrane Library

최종 데이터 추출일은 2019년 8월 25일입니다. 또한, 선별된 경험적 문헌의 참고문헌 목록을 통해 추가 자료를 찾았으며, **해당 문헌의 교신저자들(corresponding authors)**에게 이메일을 통해 추가 연구 및 미출간 자료도 요청하였습니다.


🔍 검색 전략 (Search Strategy)

전체 검색 전략은 **보조 파일 1 (online supplemental file 1)**에 제공되어 있으며, PubMed에서 사용된 최종 검색어는 다음과 같았습니다:

‘(postgrad* OR trainee* OR doctor* OR physician* OR medical practitioner*) AND feedback AND (supervis* OR clinical teach*)’


연구 선정 (Study Selection)

문헌 선정 절차는 **도표(Figure 1)**에 요약되어 있습니다.

  • JW가 모든 검색 결과를 EndNote X9에 불러온 후, 중복 문헌을 제거하고, 제목과 초록(Title and Abstract) 수준에서 1차 선별을 실시하였습니다.
  • 전문(full-text) 수준에서의 포함 여부는 두 명의 저자(CR, JW)가 독립적으로 평가하였고, 논의와 합의를 통해 결정하였습니다.

🧪 질 평가 (Quality Appraisal of Empirical Studies)

포함된 경험적 연구들은 Critical Appraisal Skills Programme (CASP) 체크리스트¹⁷를 사용하여 평가했습니다. 단, **설문조사(survey methodology)**를 사용한 연구에는 Center for Evidence-Based Management tool¹⁸을 사용했습니다.

  • 두 명의 저자(CR, JW)가 독립적으로 체크리스트를 완료하고, 연구들을 poor / fair / good로 평가하였습니다.
  • 이후 **제3의 저자(SP)**가 이 평가를 검토하고, 직접 체크리스트를 작성한 후, CR, JW와의 논의를 통해 최종 합의에 도달했습니다.

전체 체크리스트 및 평점보조 파일 2에 수록되어 있습니다.

 


📊 자료 수집 및 분석 (Data Collection and Synthesis)

📌 1. 경험적 연구 (Empirical Studies)

두 명의 연구자(CR, JW)가 각각 독립적으로 경험적 논문에서 자료를 추출하였고, 불일치는 **제3의 연구자(SP)**와의 논의를 통해 **합의(consensus)**에 도달하였습니다.

  • 메타분석(meta-analysis), 출판 바이어스에 대한 통계적 평가, **민감도 분석(sensitivity analysis)**은 **비교 가능한 연구가 충분하지 않아 수행되지 않았습니다.**¹⁹
  • 데이터는 **표 형식(tables)**과 **서술적 종합(narrative synthesis)**을 통해 요약되었으며, 특히 포함된 연구의 질에 초점을 맞추었습니다.

📌 2. 피드백 모델 및 가이드라인 (Feedback Models and Guidance)

  • JW는 이론적 및 경험적 논문에서 효과적인(effective), 비효과적인(ineffective) 피드백에 관한 모델과 가이드라인의 내용을 추출하였습니다.
  • 정성적 내용 분석(qualitative content analysis) 방법론²⁰ ²¹을 사용하여 피드백과 관련된 핵심 주제(theme), 원칙(principle), **구성 요소(component)**를 식별하고, 각각이 얼마나 널리 인용되었는지경험적 근거의 유무를 확인하였습니다 → ⬅ 보조 파일 3(online supplemental file 3) 참조
  • CR은 이 데이터를 독립적으로 검토 및 검증하였습니다.
  • 이후, 효과적인 피드백비효과적인 피드백의 원칙들을 요약표(summative table) 형태로 정리하였습니다
    → ⬅ 보조 파일 4
  • 또한 JW는 개별 피드백 모델들이 해당 핵심 원칙들을 포함하고 있는지를 분석하였습니다
    → ⬅ 보조 파일 5
  • **핵심 구성 요소(core components)**는 전체 모델 중 50% 이상에 포함된 요소,
    **공통 구성 요소(common components)**는 20% 이상에서 나타난 요소로 정의되었습니다.
  • 이러한 기준에 따라, 효과적 vs 비효과적 피드백의 공통 원칙표 형식으로 정리하고,
    전체 문헌에서 도출된 효과적인 피드백 제공을 위한 가이드라인도식화된 형태로 시각화하였습니다.

🧾 결과 (Results)

🔎 검색 결과 요약

4745개의 문헌이 검색되었으며, 이 중 51개 문헌이 본 고찰에 포함되었습니다. 이 중 **12개는 경험적 데이터(empirical data)**를 보고하고 있었습니다. 검색, 스크리닝, 제외, 포함 과정을 요약한 PRISMA 흐름도는 Figure 1에 제시되어 있습니다.


📚 경험적 연구 개요 (Empirical Studies)

  • 포함된 12개의 경험적 연구 중:
    • 7편은 정성적 연구(qualitative)
    • 4편은 정량적 연구(quantitative)
    • 1편은 *혼합 방법 연구(mixed-methods)*였습니다.

→ 정성적 연구와 정량적 연구는 각각 표 1, 표 2에 요약되어 있으며, 혼합 방법 연구는 두 표에 분할 포함되어 있습니다.

  • **무작위 대조 연구(Randomised Controlled Trial, RCT)**는 1편뿐이었으며, 나머지 연구들은 **비통제 설계(uncontrolled design)**로 근거 중심 의학의 근거 수준에서 낮은 수준으로 평가되었습니다.²²–²⁴
  • 피드백의 **효과성(effectiveness)**은 주로 다음의 인식(perceptions)을 통해 평가되었습니다:
    • 피감독자(supervisees): ⁵ ²⁵–³²
    • 감독자(supervisors): ²⁹–³²
    • 동료들(colleagues): ²⁹
  • 1편의 연구만이 **피감독자의 수행(performance)**에 대한 직접적인 영향을 탐구하였습니다.³⁴

🧠 정성적 연구 (Qualitative Studies)

  • 정성 연구 8편(혼합 연구 포함) 중:
    • 4편: ‘낮은(‘poor’) 질’로 평가됨
    • 3편: ‘보통(‘fair’) 질’
    • 1편: ‘높은(‘good’) 질’
  • ‘poor’ 평가를 받은 연구:
    • 피감독자 인터뷰 연구 2편²⁵ ²⁷
    • 피드백 경험에 대한 내러티브 탐구 1편⁵
    • 훈련생 및 감독자의 인식을 탐색한 탐색적 연구 1편²⁶
  • ‘fair’ 평가 연구:
    • 특정 피드백 모델을 적용하고, 피드백 회의 녹취록을 분석하거나 감독자 및 피감독자와 디브리핑 회의를 진행함³⁰–³²
  • ‘good’ 평가 연구:
    • 피드백 대화의 녹취록을 분석하여 **상호작용 유형(one-way vs two-way)**을 포함한 상호작용 형태를 식별³³

📌 특정 피드백 모델을 탐구한 3개의 연구

✅ R2C2 모델 (fair-quality 2편)³⁰ ³¹

  • 구성 단계:
    1. 관계 형성(Rapport and Relationship)
    2. 피드백에 대한 반응 탐색(Reaction)
    3. 피드백 내용(Content) 이해 확인
    4. 수행 변화(Coaching) 계획
  • 피드백 대화에 피감독자가 적극 참여하도록 돕는 데 효과적이며, 수행 개선 계획 수립 및 행동 변화로 이어졌다고 보고됨

✅ ECO 모델 (fair-quality 1편)³²

  • 구성: 감정(Emotion)내용(Content)결과(Outcome) 순으로 다룸
  • 감독자 및 피감독자 모두 긍정적으로 평가하며, 피감독자는 개선 영역에 따라 실제 행동 변화가 있었고, 감독자는 실제 실무 변화를 목격하였다고 보고

🔍 구체적 모델이 아닌 원칙 중심 연구 (5편)

효과적인 피드백의 공통 구성 요소로 다음이 보고됨:

  • 존중적이고 우호적인 교육 분위기 조성
  • 정기적이고 시기적절한 피드백 제공
  • 구체적이고 명확한 피드백
  • 직접 관찰에 기반한 피드백
  • 비판단적(non-judgemental) 접근
  • 개선 계획 수립

이러한 원칙들은 대부분 **피감독자의 인식(perception)**을 통해 도출되었으며,
피감독자가 유익하다고 느낀 피드백 사건과 연관됨


📈 정량적 연구 (Quantitative Studies)

  • 정량 연구 5편(혼합 연구 포함) 중:
    • 4편: ‘보통(fair)’ 질
    • 1편: ‘낮은(poor)’ 질 (회의 초록만 존재)²⁸
  • RCT 연구(fair-quality):
    • metrics-based vs non-metrics feedback 비교: 초음파 시술에서 단계 수행 증가, 오류 감소³⁴
  • 문서화된 실행 계획과 피드백 간 연관성을 분석한 연구 1편: 피드백 상호작용이 아닌 문서 양식 분석에 국한³⁵
  • 다중 출처 피드백(multi-source feedback) 도구를 평가한 연구 1편: 전반적으로는 긍정적 평가, 그러나 감독자와 피감독자의 인식 차이 존재²⁹
  • 도움이 된(helpful) vs 도움이 안 된(unhelpful) 피드백을 비교한 연구 1편⁵:
    • 도움이 된 피드백의 9가지 기법:
      예: 친근하고 존중하는 분위기 조성, 비판단적 접근
    • 도움이 안 된 피드백의 5가지 기법:
      • 피드백 전에 피감독자의 생각/감정을 묻지 않음
      • 개선 제안 없음
      • 목표 기반 아님
      • 양이 너무 많거나 적음
      • 판단적인 태도

🧱 문헌에 나타난 피드백 모델 (Feedback Models in the Literature)

21개의 피드백 모델이 임상 감독(clinical supervision)에서 효과적인 피드백을 다루는 것으로 확인되었습니다
→ ⬅ 보조 파일 5(online supplemental file 5) 참조

📌 핵심 구성 요소(Core Components)

전체 모델의 ≥50% (n≥10) 이상에서 공통적으로 나타난 핵심 요소는 다음과 같습니다:

  • 피감독자의 자기평가(self-assessment)를 유도
  • 개선이 필요한 영역을 언급
  • 개선 제안(suggestions for improvement)을 제공
  • 개선 계획(improvement plan)을 수립

📌 공통 구성 요소(Common Components)

*전체 모델의 ≥20%~50% (n≥5)*에서 발견된 공통 요소는 다음과 같습니다:

  • 교육적 동맹(educational alliance) 구축
  • 피감독자의 목표를 검토하여 피드백의 초점을 설정
  • 피감독자의 자기평가를 다룸
  • 피드백 내용은 구체적이고(specific), **행동 중심적(behaviourally focused)**이며,
    가능하다면 직접 관찰(first-hand observations)에 기반하고, 잘 수행된 점에 대한 긍정적 언급을 포함함
  • **피감독자의 피드백에 대한 인식(view)**을 탐색함

💡 중요한 점: 모델 간에 상충되는 원칙이나 구성 요소는 발견되지 않았습니다.


📂 모델의 유형 분류 (Types of Feedback Models)

각 모델은 강조하는 측면에 따라 다음의 세 가지로 분류되었습니다:

유형 비율(n)  예시 모델
구조 중심(structure-focused) 76% (n=16) Feedback Sandwich, Pendleton’s Rules
내용 중심(content-focused) 33% (n=7) Chicago Model, A Feedback Model (단, 후자는 구조 중심에 포함되지 않음)
지원 중심(supportive-focused) 14% (n=3) R2C2, COACH
기타 분류 불가 1개 모델 Student/trainee-centred model (세부 정보 부족으로 분류 어려움)

🔬 경험적 검증이 이루어진 모델

  • **21개 모델 중 단 2개(10%)**만이 경험적 연구에 의해 뒷받침됨:
    • R2C2 model
    • ECO model
  • 핵심 원칙(core principles) 포함 비율:
    • R2C2 모델: 75% (n=3)
    • ECO 모델: 50% (n=2)
  • 공통 요소(common features) 포함 비율:
    • 각 모델 모두 37.5% (n=3)를 포함

📜 효과적/비효과적 피드백의 원칙 (Principles of Effective and Ineffective Feedback)

전공의 임상 교육 문헌에서 다양한 효과적 및 비효과적 피드백의 원칙이 확인되었습니다.

  • 20% 이상(n≥10)의 문헌에서 반복적으로 언급된 **공통 원칙(common principles)**은 표 3에 정리됨
    → ⬅ 보조 파일 4 참조
  • 각 원칙은 경험적 연구에 의해 어느 정도 지지되며, 대부분은 ‘보통(fair)’ 수준의 연구에서 도출
  • 가장 많이 언급된 효과적 피드백의 원칙:
  • ‘구체적으로 제공하기(being specific)’


⚠️ 모델과 불일치하는 원칙들

다음 두 가지 원칙은 많이 언급되었음에도, 피드백 모델 내 공통 구성 요소로 포함되지 않았습니다:

  1. 시기적절한 피드백 제공(timely feedback)
  2. 판단적이지 않은 언어 사용(descriptive rather than judgemental language)

또한, 아래 두 원칙은 어떠한 모델에서도 나타나지 않았지만, 문헌상에서 자주 언급된 효과적인 피드백의 원칙입니다:

  • 정기적인 피드백 제공(regular feedback)
  • 대면 피드백(face-to-face feedback)

⚖️ ‘평가적 진술(evaluative statements)’에 대한 문헌 내 상반된 입장

  • 다수의 문헌에서는 비판단적 언어(non-evaluative language) 사용의 중요성을 강조함⁶ ⁷ ³⁶ ³⁷ ⁴⁰ ⁴¹
    → 감독자의 **평가적 언급은 피감독자의 방어적 태도(defensiveness)**를 유발할 수 있어 학습에 방해됨
  • 반면, **일부 문헌에서는 수행 기준(performance standards)**과의 비교를 권고함⁴ ⁴²
    → 피감독자가 격차(gaps)를 명확히 인식할 수 있도록 하기 위함
  • 한 연구는 동기 유발에 도움이 된다면 평가 기준과의 연결이 바람직하다고 하며,
    **비교가 좌절감을 유발할 경우에는 자가 향상(personal excellence)**에 초점을 둘 것을 제안함¹⁰

🧩 효과적인 피드백 제공을 위한 통합 모델 (Composite Model)

문헌에 나타난 다양한 가이드라인을 종합하여
__임상 감독 상황에서 효과적인 피드백 제공을 위한 ‘통합 모델(composite model)’__을 제시함
→ ⬅ Figure 2 참고

이 모델은 다음을 포함합니다:

  • 모든 핵심 및 공통 구성 요소와 원칙
  • 모델 외 문헌에서 제안된 공통 원칙들

📌 통합 모델의 주요 강조점

  • 교육적 동맹(educational alliance) 형성의 중요성
  • 여러 단계에서 피감독자의 의견을 수렴하고 그에 따라 피드백을 **유연하게 조정(adapt)**할 것
  • **직접 관찰(first-hand observation)**의 중요성 강조
  • **구체성(specificity)**과 개선 계획 수립(improvement planning) 강조

✅ 이 모델은 기존의 개별 모델들보다 구조적(structural), 내용 기반(content-based), 지원 중심(supportive) 측면 모두를 아우르는 보다 포괄적인 접근을 제시합니다.


💬 논의 (Discussion)

임상 감독 상황에서 효과적인 피드백을 제공하기 위한 다양한 모델들이 존재합니다. 그러나, 이러한 모델 중 경험적 검증을 받은 것은 전체의 10%에 불과하며, **모델 간 비교 효과성(comparative effectiveness)**에 대한 근거는 존재하지 않습니다.

그나마 다행인 점은, 다양한 피드백 모델들 간에 **핵심 및 공통 구성 요소들(core and common components)**이 일관되게 공유되고 있다는 것입니다. 또한, 이 구성 요소들은 **보다 광범위한 문헌에서 제시된 효과적인 피드백 원칙들과도 잘 정렬(alignment)**되어 있었습니다.

 

문헌에서 자주 언급되는 피드백 원칙들은 **일정 수준의 경험적 근거(empirical support)**를 가지며, 그 근거의 대부분은 ‘보통(fair)’ 수준으로 평가된 경험적 연구들에서 도출되었습니다. 이처럼 피드백 모델들의 공통 요소와 효과적 피드백의 원칙들을 식별함으로써, 우리는 **임상 감독 상황에서 효과적인 피드백을 제공하기 위한 통합 모델(composite model)**을 제안하였습니다. 이 모델은 의학교육뿐 아니라 다양한 임상 훈련 분야에서 감독자와 기관 모두에게 실질적으로 유용할 것으로 기대됩니다.


🤝 피드백 제공에서 감독자-피감독자 관계의 중요성

임상 감독 상황에서 효과적인 피드백을 제공하는 데 있어, 가장 핵심적인 요소 중 하나는 감독자(supervisor)와 피감독자(supervisee) 간의 관계입니다.

  • 감독자가 **교육적 동맹(educational alliance)**을 형성하기 위한 사전 노력을 기울이고,
  • 이 동맹을 유지할 수 있도록 개별화된 맞춤형 피드백을 제공하는 것이 중요합니다.

__지원적이고 협력적인 접근 방식(supportive and collaborative approach)__은 피감독자가 피드백을 유효하고 관련성 있는 것으로 인식하고, 실제로 행동으로 옮길 가능성을 높여줍니다.

효과적인 피드백은 단순한 정보 전달이 아니라,
피감독자의 수행을 함께 이해하고 이를 향상시키기 위한 대화(conversation)의 촉진입니다.


형식(formal) vs 비형식(informal), 형성(formative) vs 총괄(summative) 피드백 구분의 모호함

본 고찰에 포함된 많은 논문들이 자신들이 다루는 피드백이 형식적 또는 비형식적인 것인지,
그리고 형성적 또는 총괄적 목적 중 어느 것인지
를 명확히 기술하지 않았습니다.⁵ ²⁷ ³⁷ ³⁸

  • 일부 문헌은 피드백이 형식적/비형식적 모두에 해당한다고 명시하였고,⁴ ⁶ ⁴¹
  • 또 다른 문헌은 형성적/총괄적 목적 모두를 언급했습니다.¹³ ³⁰ ⁴²
  • 몇몇은 **형성적 피드백(formative feedback)**에 초점을 두었으며,⁷ ²⁶ ³⁵
  • 일부는 **형식적 형성 평가(formal formative assessment)**에 집중했습니다.³⁶

한편, 어떤 논문은 피드백을 **항상 형성적인 것(formative)**으로 간주하며, **총괄적 평가(summative evaluation)**와는 구분된다고 보았습니다.⁴⁰ ⁴³

실제 교육 현장에서는 **형식-비형식, 형성-총괄의 이분법적 구분보다는 연속선(continuum)**으로 존재하며,
이 피드백은 평가와도 통합되어 작동하고 있습니다.⁸ ³⁰

 

본 고찰에서 제시한 원칙들과 통합 모델은,

  • 짧고 비공식적인 형성 피드백,
  • 직장 기반 평가(workplace-based assessment)를 포함한 형식적 형성 피드백,
  • 총괄적 평가 후 제공되는 피드백 등
    __임상 감독 상황에서 이루어지는 모든 형태의 피드백 상호작용에 적용 가능__합니다.

⏩ 따라서, **개인과 관계, 그리고 맥락에 따라 요소들을 조정할 수 있는 유연한 접근(flexible approach)**이 권장됩니다.


🚧 기존 문헌의 한계 (Limitations of the Existing Literature)

효과적인 피드백에 관한 가이드라인과 원칙에 대한 신뢰도는 경험적 근거의 수량과 질이 제한적이라는 점에서 영향을 받습니다.

❗ ‘효과적인 피드백’ 정의 및 측정의 문제

  • 피드백의 **효과성(effectiveness)**은 주로 감독자와 피감독자의 **주관적 인식(subjective perception)**을 통해 측정됨
  • 이는 중요하지만, 피드백의 **주된 목표인 수행 향상(professional development)**을 직접적으로 측정하지는 않음⁴ ¹⁰

🧠 보다 직접적인 측정 지표는 피감독자의 행동 변화, 태도, 지식의 변화일 수 있습니다.

 

하지만 행동 변화를 주요 결과 지표로 삼는 것에는 도전과제와 문제가 존재합니다:

  • 감독자가 피감독자의 관점을 탐색하지 않을 경우, 학습 필요를 **오인(misidentify)**할 수 있음⁴⁴
  • 관련성이 낮은 피드백은 피감독자의 신뢰감과 자신감 저하를 초래할 수 있음⁴⁴

📉 해로운 피드백의 결과:

  • **동기 저하(demotivation)**⁸
  • **수행 저하(performance deterioration)**⁸ ¹¹
  • **학습과 평가에 대한 소외(disengagement)**⁴⁵
  • 자기평가 공유에 대한 회피⁴³

✅ 따라서, 행동 변화 하나만으로 피드백의 효과를 판단하는 것은 충분하지 않음
대신, **피드백에 대한 만족도(satisfaction)**는 보다 실용적인 측정 지표가 될 수 있습니다.⁴⁶


👁️ 지각(perception)의 역할

감독자와 피감독자의 피드백에 대한 지각은 피드백이 의미 있는 학습으로 이어지는 정도에 매우 큰 영향을 미칩니다.⁴⁷

  • 피감독자가 피드백을 관련 있고 의미 있는 것으로 인식할 경우, 수용하고 행동으로 옮길 가능성이 커집니다.
  • 이는 **치료적 동맹(therapeutic alliance)**이 치료 결과에 영향을 미치듯, **교육적 동맹(educational alliance)**이 피드백의 효과성에도 중요한 영향을 미친다는 점을 시사합니다.¹¹

따라서, 임상 감독 하에서의 효과적인 피드백은 개별 맞춤형으로 제공되며, 교육적 동맹을 유지하는 방식이어야 합니다.


🔍 향후 연구 방향 (Future Research)

앞으로의 연구는 다음과 같은 한계를 극복해야 합니다:

  • 피드백 효과성의 최적 측정 방법
    • 행동, 태도, 지식 변화라는 객관적 개선 지표
    • 피드백에 대한 만족도라는 주관적 지표의 **이중 고려(dual consideration)**가 필요
  • **평가적 언어(evaluative language)**의 영향은 현재 문헌에서 상반된 결과가 존재하므로,
    더 정교하게 **하위 유형별(subcategories)**로 구분하고 연구될 필요가 있음⁴ ⁶ ⁷ ³⁶ ³⁷ ⁴⁰–⁴² ⁴⁴
  • 많은 감독자가 **이중 역할(dual role)**을 가지므로 평가적 언어를 피하기 어려운 구조적 한계도 고려되어야 함⁴⁸ ⁴⁹
  • 다른 교육 맥락에서의 피드백 문헌도 비교 검토하여, 의학교육 문헌과의 차이점이나 보완 요소를 규명할 수 있음

🧩 보완적 프레임워크의 고려 (Supplementing Feedback Guidance with Broader Supervision Frameworks)

이번 고찰에서 제시된 효과적인 피드백 제공을 위한 가이드라인은 더 넓은 감독(supervision) 프레임워크를 고려함으로써 보완될 수 있습니다. 예를 들어, 심리학 분야에서는 감독의 효과성을 높이기 위해 **역량 기반 임상 감독 모델(competency-based clinical supervision model)**이 개발되었습니다.⁵⁰ 이 모델은 감독자가 **임상 감독 능력(clinical supervision competence)**을 개발하고 이를 명확히 입증할 수 있어야 함을 강조합니다.⁵⁰

  • **교육적 동맹(educational alliance)**에 대한 피감독자의 평가와⁵¹
  • **감독자의 역량(supervisory competence)**에 대한 평가는⁵² 심리측정 도구(psychometric tools)를 통해 가능하며,
  • 피감독자의 평가 외에도, 동료나 ‘감독 전문가’에 의한 감독 역량 평가도 수행될 수 있습니다.⁵²
    예: 감독 세션 녹화 영상을 리뷰하는 방식 등

이러한 감독자 역량 기반 프레임워크
임상 감독자가 효과적인 피드백을 제공하는 능력
달성, 유지, 최적화, 평가하는 데에 도움이 될 수 있습니다.

 

이와 같이 피드백 제공에 관한 가이드라인은 다른 프레임워크들과 병행하여 유용하게 활용될 수 있습니다.
하지만 궁극적으로는,

  • 감독자의 태도(attitudes),
  • 가치관(values),
  • 동기(motivation),
  • **고품질 감독에 대한 헌신(commitment)**에
    의존하게 됩니다.⁵⁰

⚠️ 한계 (Limitations)

본 체계적 문헌고찰은 **전공의 의학교육(postgraduate medical education)**과 **임상 중심 데이터베이스(clinically oriented databases)**에 국한되었습니다.

  • 학부 수준 의학교육(undergraduate medical education),
  • 비의학 임상 분야(non-medical clinical disciplines),
  • **비임상 분야(non-clinical professions)**에서의 감독 및 피드백에 관한 근거는 포함하지 않았습니다.

이러한 명확한 초점 설정은 해당 맥락 내에서의 심층적 이해를 가능하게 해주었지만, 동시에 다른 분야의 감독 효과성에 관한 통찰을 일반화하기에는 한계가 있습니다.


🧱 분석 상의 개념적 중복 (Conceptual Overlap in Coding)

본 고찰에서 도출된 모델 구성 요소와 피드백 원칙은 다양한 문헌에서의 **정성적 내용 분석(qualitative content analysis)**을 기반으로 하였습니다. 이 과정에서 **개념 간 중복(semantic overlap)**이 일부 발생하였습니다. 예를 들어,

  • *‘개선 제안 제공(providing suggestions for improvement)’*이라는 원칙은,
    • ‘개선 영역 언급(commenting on area for improvement)’
    • *‘개선 계획 수립(developing an action plan)’*과 중복될 수 있습니다.

우리는 이러한 중복을 특정 원칙에 대한 근거를 과대평가하거나,
피드백 제공을 지나치게 단순화하지 않기 위해 허용하였습니다.


🧑‍🤝‍🧑 감독자 중심 접근의 한계 (Supervisor-Focused Perspective)

본 고찰은 피드백 제공 시 **감독자의 행동(actions)**에 초점을 맞추고 있으며,

  • 피감독자의 역할이나³
  • 피드백 수용의 과정은 상대적으로 덜 고려되었습니다.⁴⁸

피감독자의 참여도, 수용성, 반응성은 피드백의 효과성에 직접적인 영향을 미칠 수 있습니다. 또한, **병원 및 보건 조직의 문화(cultural factors)**도 감독 및 피드백의 효과성에 영향을 줄 수 있습니다.³ ⁴³ ⁴⁸


🧩 이중 역할(conflicting roles) 문제

일부 전공의 교육 환경에서는 감독자가

  • 직속 관리자(line manager) 또는
  • 공식 평가자(assessor)
    __복수의 상충되는 역할(conflicting roles)__을 수행합니다.⁴⁸ ⁴⁹

이로 인해 감독자는 피드백 제공 시 다음과 같은 복잡성을 경험하게 됩니다:

  • 비평가적 언어(non-evaluative language) 사용의 어려움
  • **수행 기준(performance standards)**과 연결하지 않기 위한 노력의 어려움

🎯 피감독자는 이 피드백이 진심에서 비롯된 것인지, 아니면 기관의 요구사항을 만족시키기 위한 것인지
의심하게 될 수 있습니다.¹¹

😔 상충되는 역할이 명확히 다루어지지 않을 경우, **교육적 동맹의 파열(rupture)**을 초래할 수 있으며,
피감독자는 자신의 개선이 필요한 영역을 솔직하게 공유하기 꺼리게 됩니다.⁴⁹


결론 (Conclusion)

전공의 의학교육 맥락에서 임상 감독 시 효과적인 피드백 제공을 위한 특정 모델과 가이드라인을 지지하는 경험적 근거는 제한적입니다. 그러나, 본 고찰을 통해 널리 공유되는 피드백 원칙들에 대해서는 일정 수준의 근거가 확인되었습니다. 피드백이라는 복합적이며 다면적인 영역에 대해 향후에는 다음과 같은 연구가 요구됩니다:

  • **행동 변화(behavioural change)**와
  • **피감독자의 관점 평가(perceptions of supervisees)**를
    통합적으로 고려하는 최적의 피드백 효과 측정 방법 개발

현재 문헌에서는 효과적인 피드백과 그렇지 않은 피드백에 대해 전반적으로 일관된 관점이 제시되고 있다는 점은 고무적입니다.

📌 본 고찰에서 도출된 통합 모델에 포함된 원칙들
감독자들이 피감독자와 협력적으로(cooperatively) 피드백을 제공하는 데 실질적인 도움이 될 것으로 기대됩니다.


 

 

 

Postgrad Med J. 2022 Feb;98(1156):138-149.
 doi: 10.1136/postgradmedj-2020-139566. Epub 2021 Feb 9.

Guidance for providing effective feedback in clinical supervision in postgraduate medical education: a systematic review

 

👥 의사의 피어 리뷰(peer review), 정말 배움의 기회가 되나요?

의사들의 **지속적인 전문성 개발(Continuing Professional Development, CPD)**은 이제 너무도 당연한 전제가 되었습니다. 그런데 우리가 정말 주목해야 할 건, 과연 어떤 방식의 피드백(feedback)이 실제로 도움이 되는가? 하는 문제예요.

이번 포스팅에서는 의사들이 실제로 경험하는 피어 리뷰가 어떤 식으로 피드백을 주고받게 되는지, 그 과정이 진짜 학습이 일어나는 순간이 되기는 하는지에 대해 아주 자세히 알아보려 해요.


📌 1. 이 연구는 왜 시작되었을까?

CPD에서 피드백은 빠질 수 없는 핵심 요소예요. 예전에는 주로 **자기 주도적 학습(self-regulated learning)**에 기대는 구조였다면, 요즘은 객관적인 외부 피드백이 훨씬 더 중요하게 여겨지고 있죠. 하지만 문제가 있어요. 의사들이 스스로 학습의 필요를 인식하고, 그것을 실제로 개선으로 연결하는 데에는 한계가 있다는 연구 결과들이 점점 많아지고 있어요. 그래서 **북미의 규제기관들(regulatory bodies)**은 단순히 문제 있는 의사를 관리하는 것에서 벗어나, 의사들의 전반적인 진료 향상을 지원하기 위해 의무적 피어 리뷰를 도입하기 시작했어요.

 

하지만!
의사들은 이 피어 리뷰를 환영할까요?
정말 효과적인 피드백 기회로 받아들이고 있을까요?

👉 이 질문에 답하기 위해, 연구팀은 **피어 평가자(peer evaluators, PE)**와 리뷰 대상자(reviewees) 모두의 이야기를 들어보았답니다.


🔍 2. 연구는 어떻게 진행됐을까?

✏️ 연구 방법

  • 질적 연구(qualitative research) 중에서도 **구성주의 근거이론(constructivist grounded theory, CGT)**을 사용했어요.
  • 즉, 특정 가설 없이 인터뷰를 통해 피드백 상호작용의 의미를 참여자의 관점에서 탐색한 거예요.

🏥 연구 맥락

  • 캐나다의 두 규제기관에서 운영하는 의무적 피어 리뷰 프로그램을 중심으로 연구를 했어요.
  • 리뷰는 동료 의사가 병원이나 진료소를 방문해서 차트 검토와 대화를 나누는 방식으로 진행돼요. 어떤 경우에는 **다면 피드백(multisource feedback)**도 포함돼요.
  • 30명의 의사가 인터뷰에 참여했고, 이 중 다수는 과거에 PE로도 활동한 경험이 있었어요.

📈 3. 리뷰 대상자들은 피드백을 어떻게 받아들였을까?

👍 처음엔 불안하지만… 막상 받아보면 괜찮다?

많은 리뷰 대상자들은 처음엔 굉장한 불안감을 느꼈어요. 규제기관이 나를 평가하러 오는 거니까요.

"Oh my gosh, are they going to pick up on all the things I’m doing wrong?" (P13-PE)

하지만 막상 피드백을 받고 나면, 대부분은 유쾌하고 무난한 경험이었다고 회상해요.

"It actually made me feel good … it was nice to have a peer, you know, point out some positive things." (P08-PE)

특히 **자신감이 부족하거나, '내가 진짜 좋은 의사일까?'라는 의심(imposter syndrome)**을 느끼는 사람에게는 이런 긍정적인 피드백이 꽤 위로가 되었다고 해요.


❗그런데 문제는… 학습 효과는 별로?

하지만 많은 참여자들이 공통적으로 말한 건 바로 이거예요:

"칭찬은 많았지만, 구체적이지 않았다."

"Really it was very positive and nothing negative and really not even that much constructive." — P22-R

즉, 기분은 좋았지만 실질적인 학습이나 진료 변화(practice change)로 이어지지는 않았다는 거죠.

또, 리뷰가 주로 **문서화(documentation)**나 행정 절차에 집중되다 보니 진짜 임상 능력을 평가한다고 느껴지지도 않았어요.

"You could be a very good physician and a very bad documenter […] I’m not sure one is correlated with the other to be honest, but that’s what you’re left with."
— P18-R


🙄 그래서 전체적인 평가는?

많은 의사들이 이렇게 느꼈어요:

"이거 그냥 '일'이었어. 그것도 무급 노동처럼 느껴지는..."

"It felt like unpaid work. It was a lot of work and definitely for what I got out of it, it wasn’t worth the value."
— P27-R


👥 그럼 PE들은 어떻게 느꼈을까?

흥미로운 사실은, PE들 대부분은 리뷰 대상자일 때보다 PE로 활동하면서 더 많이 배웠다고 느꼈다는 거예요.

"I learn a lot of new things, just other people’s techniques … different protocols and stuff that I hadn’t considered."
— P13-PE

 

즉, 다양한 의사들의 진료 스타일을 관찰하고, 피드백을 주고받는 과정이 실제 자기 개발로 이어졌다는 것이죠.

"I learn far more than I impart."
— P01-PE


🧠 4. 연구팀의 해석: 피드백은 왜 효과 없다고 느껴질까?

연구팀은 이렇게 말합니다:

"Feedback must shoulder the heavy weight of expectations."
“피드백은 지나치게 큰 기대의 무게를 짊어지고 있다.”

 

즉, 요즘은 피드백이 당연히 나를 '변화시키는(transformative)' 경험이어야 한다고 여겨지기 때문에, 그게 아니면 별로 쓸모 없다고 느껴진다는 거예요. 그런데 현실적으로, 무작위로 선정된 대부분의 의사는 이미 잘하고 있는(safe and competent) 사람이에요. 당연히 큰 변화보다는 **작은 강화(reinforcement)**나 **미세한 조정(tweaking)**이 더 많을 수밖에 없죠. 하지만 그런 피드백은 “별거 아니네” 하고 가볍게 흘려버릴 위험이 크다는 거예요.


🔄 5. 대안은? 피드백에서 피드포워드(feedforward)로!

연구팀은 마지막에 이렇게 제안합니다:

"Perhaps it is time for our CPD models to think more in terms of feedforward."

 

📌 **피드포워드(feedforward)**란?

  • 평가 전에 무엇이 평가될지, 기준이 무엇인지, 왜 중요한지를 명확히 알려주고
  • 리뷰 대상자가 더 적극적으로 자기 평가에 참여할 수 있도록 만드는 접근이에요.

이렇게 하면, 피드백이 비난도, 칭찬도 아닌 ‘학습의 순간’으로 수용될 수 있을 거라는 제안이죠.


📚 마무리하며

의무적 피어 리뷰는 어쩌면 의사들에게 학습 기회보다는 행정적 부담처럼 다가오고 있는지도 몰라요. 하지만 우리가 이 과정을 어떻게 설계하고 안내하고 설명하느냐에 따라, 더 의미 있는 학습 기회로 전환할 수 있는 여지는 분명 존재합니다. 그 시작은 기대치를 조정하는 것, 그리고 변화를 강요하지 않아도 괜찮다는 인식을 넓히는 데서 출발할 수 있어요. 🌱


 

 

 

지속적인 전문성 개발과 피드백의 역할

지속적인 전문성 개발(Continuing Professional Development, CPD)은 이제 전 세계 대부분의 관할구역에서 활동하는 의사들에게 필수적인 것으로 받아들여지고 있다.¹ 사실상, **안전하고 효과적인 환자 진료(safe and effective patient care)를 보장하는 것은 지속적으로 진료 개선(practice improvement)에 참여하는 것에 달려있다는 점이 당연한 것으로 여겨지고 있다.**²

 

과거 CPD의 전통적 모델에서는 책임의 대부분이 개인 전문가에게 부여되었다(즉, 자율규제(self-regulation)에서 ‘자신(self)’에 초점이 맞추어졌다).³ 그러나 최근의 연구는 의사가 스스로 자신의 지식이나 수행의 부족한 부분을 정확히 파악하고, 이를 학습을 통해 보완할 수 있을지에 대해 의문을 제기하고 있다.⁴

 

자기평가(self-assessment)의 한계에서 오는 어려움을 인식하면서,⁵,⁶ **의료계는 의사가 자신의 수행(performance)에 대한 유효한 통찰(insight)을 얻기 위해서는 신뢰할 수 있는 외부의 명시적 피드백(explicit feedback from credible external sources)이 필요하다는 점을 이해하게 되었다.**⁷

 

이러한 문제의식에 대응하기 위해, 북미의 규제기관(regulators)은 의사의 수행이 기준 이하일 경우에만 제한하거나 개선 조치를 취하는 소극적(reactive) 규제 모델에서, **모든 의사의 진료 개선을 촉진하고 지원하려는 적극적(proactive) 모델로 전환하기 시작하였다.**⁸,⁹ 이러한 변화는 종종 규제기관이 의사를 대신하여 마련하는, **의무적으로 진행되는 동료 심사(peer review)**를 통한 피드백 제공을 포함하게 된다. 하지만 이 같은 노력은 엇갈린 반응을 받아왔다. 예를 들어, 외과의사들은 이론적으로는 동료 코칭(peer coaching)의 가치를 인정하면서도, 실제 실행에 대해서는 여러 가지 의구심과 우려를 표한 바 있다.¹⁰ 유사하게, Lockyer 등(2018)은 5년간 진행된 다면평가(multisource feedback, MSF) 프로그램의 종단적 연구를 평가한 결과, 의사들은 동료, 직장 동료 또는 환자들로부터 받은 데이터를 자기평가에 잘 반영하지 않는 것으로 보인다.”¹¹(pS78,S79)는 결론을 내렸다.

 

관계중심적 코칭(Relationship-centered coaching)은 도움이 되는 것으로 보이지만,⁸ 이것만으로 모든 문제가 해결되는 것은 아니다. 사실 피드백 자체가 점점 더 **복잡한 상호작용 활동(complex interactive activity)**으로 이해되고 있으며,⁷,¹² 여기서 문화(culture),¹³ 개인의 자신감(confidence),¹⁴ 그리고 피드백을 제공하는 사람에 대한 신뢰도(credibility of the feedback source)¹⁵-¹⁸ 등이 피드백이 행동 변화로 유의미하게 이어질 가능성에 영향을 줄 수 있다.

 

그러나 이 영역에서 수행된 연구의 대다수는 학부 및 대학원 수준에서 이루어졌으며, 이 수준에서는 학습자가 자신의 능력을 입증하는 동시에 전문성을 갖추기 위해 노력하는 과정에서 피드백을 원하는 동시에 두려워하는 긴장(tension)이 흔히 나타난다.¹⁹-²² 의사들이 실제 임상 업무에 정착하면서 이러한 긴장이 어떻게 해소되는지, 아니면 지속되는지에 대해서는 명확하지 않다. 한편으로, 임상에서 활동하는 의사들은 학생 시절처럼 임상 감독자에게 자신의 능력을 보여줘야 하는 압박이나 공식적 평가에서 벗어나, 좀 더 안전하고 진정성 있게 학습 기회에 참여할 수 있게 된다. 반면에, 의학은 독립적인 진료(independent practice)를 매우 중시하는 문화가 있으며, 이를 전문가로서의 정체성의 핵심 요소로 간주하는 경우가 많아, 의무적인 동료 심사(peer review)가 오히려 자율성에 대한 위협(high-stakes impingement on autonomy)으로 여겨질 위험이 있다.²³

 

따라서, 임상에서 의사들의 진료 개선(practice improvement)을 지원하려는 노력을 극대화하기 위해서는 다음 두 가지 측면에 대해 더 잘 이해할 필요가 있다.

  • 어떤 종류의 평가와 피드백이 전문성 개발을 유의미하게 도울 수 있는지
  • 피드백의 신뢰도를 저해하는 것으로 인식되는 요소들을 학습을 촉진하는 긍정적인 요소로 전환할 수 있는지

규제기관이 주관하는 동료 심사(peer review)는 총괄평가(summative)와 형성평가(formative)의 목표를 모두 지닌 복합적(hybrid) 평가이기 때문에, 이 연구를 수행하기 위한 유용한 맥락(context)을 제공한다. 이에 본 연구의 목적은 다음과 같다:

“이러한 맥락에서 의사들이 피드백에 어떻게 참여(engage)하는지 탐구하는 것이다.”


 

방법(Method)

연구 설계

우리는 *사회적 과정(social processes)*을 탐구하는 **질적 연구 방법론(qualitative research methodology)**인 **구성주의 근거이론(Constructivist Grounded Theory, CGT)**을 활용하였다.²⁴ 이 방법론을 통해, **형성적 목적을 가지고 설계되었지만 결과적으로 총괄적 영향(summative influence)을 가질 수 있는 피어 피드백 상호작용(peer feedback interactions)**이 어떻게 구성되고 인식되는지를 귀납적으로(inductively) 이해하고자 하였다.


맥락(Context)

캐나다에서 **의사의 진료(practice)는 각 주(province)의 규제 기관인 “College”를 통해 규제(regulation)**된다. 이들 College는 공공의 안전을 보호해야 할 법적 의무를 지니고 있다. 진료 기준(practice standards)의 준수를 보장하기 위해, 다수의 College들은 정기적으로 의사를 선정하여 **의무적 진료 평가(mandatory practice review)**를 시행한다.

 

이러한 선정 과정은 *무작위(random)*일 수도 있고, *위험 요소(risk factors)*에 기반한 **표적 선정(targeted)**일 수도 있다. 선정 및 평가 과정의 세부 사항은 기관마다 다르며, 연구에 포함된 프로그램의 익명성 보장을 위해 더 자세한 내용은 공개하지 않았다.

 

일반적으로 프로그램은 **피어 평가자(Peer Evaluators, PEs)**를 지정하여 의사의 진료소 및 차트 검토(chart review)를 수행하게 한다. 이와 함께 **피어 간의 토론(peer discussion)**도 일상적으로 포함되며, 이는 의사의 진료 패턴을 더 잘 이해하기 위한 목적이다. 일부 프로그램에는 다면평가(multisource feedback, MSF) 요소도 포함되어 있으며,²⁵ 작성된 보고서 형태의 피드백이 제공되고, College의 정책에 따라 피어 토론 과정에서 코칭이 추가될 수도 있고, 아닐 수도 있다.


피어 평가자(PE)의 역할과 훈련

PE는 일반적으로 과거에 피어 리뷰를 성공적으로 받은 경험이 있는 의사 중에서 지원 또는 초청을 통해 선발된다. 이들은 R2C2 모델(관계 Relationship, 반응 Reaction, 내용 Content, 코칭 Coaching)을 사용하여 피드백을 제공하도록 훈련받는다.²⁶

 

이 모델은 일대일(one-on-one) 코칭 접근법으로, **신뢰 관계 구축(rapport)**과 **성찰 유도(reflection)**를 통해 **피드백 대화(feedback conversation)**를 이끌어내는 데 중점을 둔다. PE는 연중 추가 교육(training sessions)에 참여할 것으로 기대된다.


참여자 모집(Recruitment)

본 연구는 **규제기관이 주관하는 전문성 향상 프로그램(professional enhancement programs)**을 통해 **피어 평가자(PE)**와 **피어 평가를 받은 의사(reviewees)**를 **목적적 표집(purposeful sampling)**하여 모집하였다. 모집 대상은 2개 College의 피어 리뷰 프로그램 참여자였다.

 

각 College는 연구진을 대신하여 피어 리뷰를 받은 지 6개월 이내의 의사 전원에게 모집 이메일을 보냈다. 이메일에는 연구 설명과 함께 연구에 관심 있는 경우 연구보조원(research assistant, RA)에게 연락하도록 안내되어 있었다. 15개월 동안 총 4차례에 걸쳐 500건 이상의 이메일이 발송되었으며, 인터뷰 자료와 코딩 체계가 연구 목적을 충족하고 다양한 관점을 충분히 포괄하게 되었을 때 모집을 종료하였다.²⁷,²⁸

 

63명의 PE 및 reviewee가 RA에게 연락하였고, 이 중 **30명이 동의서를 제출하고 개별 반구조화 인터뷰(semi-structured individual interview)**에 참여하였다. 연구팀은 이 시점에서 **이론적 충분성(theoretical sufficiency)**에 도달했다고 판단하였다.


참여자 특성(Participant characteristics)

참여자 특성은 표 1에 요약되어 있다. 연구 참여 요청 이메일을 받은 전체 집단에 대한 인구통계학적 정보는 제한적으로만 제공되었으나, 한 College가 제공한 데이터에 따르면, 본 연구 참여자들은 진료과(specialty) 면에서 더 다양했으며(가정의학과 의사 비율: 46.6% vs 77.2%), 그 외 성비(여성: 46.6% vs 39.7%), 진료 경력 20년 이상(66.7% vs 63.8%) 비율은 유사한 수준이었다.


자료 수집 및 분석(Data Collection and Analysis)

자료 수집과 분석은 **순환적이고 반복적인 과정(iterative and recursive process)**으로 이루어졌다. 개별 인터뷰는 2018년 10월부터 2020년 5월 사이에 진행되었으며, 각 인터뷰는 30~70분 동안 지속되었다. 모든 인터뷰는 RA가 진행하였으며, 피어 리뷰 과정에 대한 참여자의 전반적인 인식, 받은 또는 제공한 피드백의 신뢰도 및 가치, 이로부터 도출된 학습 또는 진료 변화에 대한 통찰을 탐색하였다. 인터뷰는 모두 오디오 녹음되었고, 전문 속기사에 의해 전사(transcribed)된 후, 분석 전에 비식별화(de-identified)되었다. 전사본은 **점진적 분석(progressive analysis)**을 통해 분석이 진행되었다.

 


자료 분석 (Data Analysis)

전사된 인터뷰 자료는 **근거이론(Constructivist Grounded Theory, CGT)**에서 일반적으로 사용하는 3단계 코딩 과정(three-stage coding process)초기 코딩(initial coding), 집중 코딩(focused coding), 이론적 코딩(theoretical coding)—을 통해 점진적으로 분석되었다.²⁴

  • 초기 코딩 단계에서, 연구자 K.A.L.과 L.A.는 각각 3개의 전사본을 **줄 단위로 검토(line-by-line review)**하였다.
    이때 **동명사(gerunds)**나 **참여자의 실제 언어(in vivo codes)**를 사용하여, 참여자들이 묘사한 의미와 행동을 포착하였다.
  • 그 후 두 연구자는 논의를 통해 초기 코딩 결과를 검토하고, **초기 관찰 결과를 예비 범주(preliminary categories)**로 정의하고 통합하여 **코드북(codebook)**을 작성하였다.
  • 이어서 L.A.와 L.C.는 이 예비 범주를 적용하여 추가로 5개의 전사본을 코딩하고, 이 범주들이 자료와 얼마나 잘 부합하는지(resonance and relevance)를 판단하였다.

연구팀 전체는 일련의 회의(series of meetings)에 참여하여 분석 결과가 자료에 근거를 두고 있으며(data-grounded), 다양한 경험과 관점을 포괄하고 있는지를 점검하였다. 이 회의들에서는 다음과 같은 논의가 이루어졌다.

  • 예비 연구 결과(preliminary findings)
  • 데이터셋 내에서의 패턴 인식(perceptions of patterns)
  • 도출된 코드 및 범주 결과

이러한 과정을 통해 전체 데이터셋에 적용할 최종 범주(categories)를 확정하였으며, 이는 다음과 같은 **순환적 분석 과정(iterative cycles)**을 통해 정제되었다:

  • 개별 연구자의 코딩
  • 팀 간 협업을 통한 논의
  • 전체 전사본 및 데이터 발췌문(excerpts)의 반복적 재검토

이 모든 과정은 **해석의 일관성(coherence of interpretation)**을 점검하기 위해 수행되었다.²⁴


자료 분석 전반에 걸쳐, **자료 간 및 전사본 간의 지속적인 비교(constant comparison)**가 이루어졌으며, **메모 작성(memoing)**을 통해 점점 더 추상화되는 아이디어를 포착하고 확장하였다. 이러한 메모는 또한 **이론적 표집(theoretical sampling)**의 필요성을 판단하는 데에도 사용되었다.²⁴

 

예를 들어, 연구 초기에는 PE의 관점이 과도하게 반영되었으므로, PE 역할을 수행한 경험이 없는 reviewee들을 의도적으로 추가 표집하였다. 또한 몇몇 참여자들이 **임포스터 증후군(imposter syndrome)**이 피어 평가에 대한 인식에 영향을 미쳤다고 자발적으로 보고함에 따라, 이후 인터뷰에서는 이에 대해 의도적으로 질문을 추가하였다.


연구자의 위치성과 신뢰도 확보 (Reflexivity and Trustworthiness)

모든 **CGT 연구에는 연구자의 주관적 역할(subjective role)**이 자료 수집 및 분석 과정에 내재되어 있다. 이에 따라 **신뢰도(trustworthiness)**를 확보하기 위해, 연구팀은 **지속적인 자기 성찰 과정(reflexivity)**에 참여하였다. 자세한 내용은 **보조 디지털 부록(Supplemental Digital Appendix 1)**에서 확인할 수 있다:
[http://links.lww.com/ACADMED/B463].²⁹


윤리적 승인 (Ethics Review)

본 연구의 연구계획은 다음의 두 기관에서 윤리적 검토 및 승인을 받았다:

  • 오타와 건강과학 네트워크 연구윤리위원회(Ottawa Health Science Network Research Ethics Board, OHSNREB):
    Protocol #20180257-01H
  • 브리티시컬럼비아 대학교 행동과학 윤리위원회(University of British Columbia’s Behavioural Research Ethics Board):
    Protocol #H13-01542

연구 내 인용된 **참여자 발언(quote)**은 다음과 같이 표기된다:
참여자 번호 + PE 또는 R — 여기서 PE는 피어 평가자(peer evaluator), R은 피어 평가 대상자(reviewee)를 의미한다.


결과 (Results)

참여자들은 피어 리뷰(peer review) 개념에 대해 일반적으로 이야기하면서, 자신의 진료를 ‘신선한 눈(fresh set of eyes)’으로 들여다볼 수 있는 기회의 가치를 인정하였다 (P08-PE). 이는 자신의 진료가 건전하고 최신인지 확인할 수 있으며, 동시에 바쁜 임상의들에게 자신의 수행(performance)에 대해 멈추어 돌아볼 수 있는 드문 기회를 “강제로”(P15-PE) 제공해준다는 점에서 의미가 있었다.

 

이러한 응답은 다음과 같은 점을 시사한다: 참여자들은 원칙적으로 피어 리뷰를 받거나, 동료로부터 진료 개선에 도움이 되는 피드백을 받는 것 자체에 반대하지 않았다.

"I think it is because there’s really no exam after you finish med school. So you kind of practice in a silo, you know, 20 years, 30 years out and [peer review] kind of allows for some quality to be maintained, as well as standardization and, you know, kind of interact with your peers." (P03-PE)

"의대 졸업 이후엔 시험이 없잖아요. 그러다 보니 20년, 30년을 좀 고립된 방식으로 진료하게 되고요. 피어 리뷰는 그런 상황에서 일정 수준의 질을 유지하게 하고, 표준화도 가능하게 해주며, 동료들과 상호작용할 기회도 되는 거죠." (P03-PE)


그러나 실제로 **규제기관(regulatory body)**이 의무적으로 실시하는 피어 리뷰 상황에서는, 이러한 “신선한 눈”이 **적대적 기관(adversarial institution)**의 대표자로 여겨져, 드문 피드백 기회를 **위협(threat)**으로 인식하게 되는 경우가 많았다. 모든 참여자들은 **규제기관에 대한 깊은 불신(deep mistrust)**을 공통적으로 언급하였다. 이는 다음 두 가지 요인에서 기인했다:

  • 규제기관이 의사의 면허와 생계(livelihood)에 대해 갖는 막대한 권력(immense power)
  • 의학교육 초기에 **“College는 항상 당신을 잡으려 한다”(“the College is always out to get you”)**는 식의 **오랜 불신감(long-standing suspicion)**이 주입되었기 때문 (P30-R)

대부분의 참여자는 자신의 진료에 큰 문제가 없을 것이라 생각했음에도 불구하고, 거의 모두가 처음에는 다음과 같은 불안감을 느꼈다: “혹시 evaluator가 내가 저지른 실수나 미처 인식하지 못한 결함을 찾아내는 건 아닐까?” 예를 들어, P13-PE는 다음과 같은 생각을 했다고 한다:

"Oh my gosh, are they going to pick up on all the things I’m doing wrong?"
"이런, 혹시 내가 잘못하고 있는 모든 걸 다 들춰내는 건 아닐까?"


이중적 압박: 피드백 수용 vs 방어

리뷰 대상자(reviewee)들은 피어 평가자가 제공하는 피드백에 어떻게 반응하는지도 주의 깊게 관찰될 것임을 인지하고 있었으며, 이에 따라 다음과 같은 복잡한 압박 상황을 경험했다:

  • 성찰적으로 피드백을 수용하며 진료 개선을 도모하려는 태도를 보이되,
  • 부당하거나 부적절하다고 느껴지는 피드백에 대해서는 반박해야 하는 이중적 과제를 수행해야 했다.

한 참여자는 이런 상황을 “줄타기(tightrope walk)”에 비유하며, 이 두 태도를 구분할 수 있는 고도의 역량을 지닌 PE는 드물다고 지적했다.

"The problem is always that every time you get into discourse with a regulator it is easy for the regulator to fall back on, ‘well you just don’t have insight,’ which really just means ‘you’re not listening to what I’m saying.’ But it’s not that you’re not listening, you want the give and take. It’s hard to have a wholesome give and take with somebody whose ultimate responsibility is to regulate you and to bring you to standard." (P15-PE)

"문제는, 규제자와 대화에 들어가면 항상 ‘너는 통찰력이 부족하구나’라고 말하기 쉽다는 겁니다. 사실 그건 ‘내 말을 안 듣고 있네’라는 뜻이죠. 그런데 문제는 우리가 정말 듣지 않는 게 아니라 ‘쌍방의 대화(give and take)’를 원하는 거예요. 그런데 궁극적으로 내 진료를 규제하고 표준에 맞추려는 사람이랑 그런 대화를 하기란 정말 어렵죠." (P15-PE)


PE의 시선: 불신과 불안을 인식하다

PE 참여자들도 이와 같은 역동성을 인지하고 있었고, **신뢰받는 피드백 제공자(trusted feedback provider)**로서의 역할 수행이 어렵다는 점을 인정하였다. PE들은 자신이 불신의 대상인 기관을 대표하여 다른 의사의 클리닉에 방문한다는 사실 자체가 불안감을 유발하며, 학습의 장애물이 될 수 있음을 잘 알고 있었다:

"I understand what a stomach-clenching process this is when somebody goes in who’s external, to look at your personal material." (P17-PE)
"외부인이 와서 당신의 개인적인 진료 내용을 들여다보는 게 얼마나 속이 뒤틀리는 경험인지 저도 잘 압니다." (P17-PE)


PE의 전략 vs Reviewee의 반응

이처럼 복잡한 상황 속에서, PE들은 진료 개선을 유도하기 위해 다양한 전략을 활용하려 하였다. 하지만, 이러한 시도에 대해 reviewee들이 문제점을 지적하거나 무가치하게 느끼는 경우도 많았고, 그 결과 피어 리뷰 자체에 큰 가치를 느끼지 못하게 되는 경우도 있었다. 

 

이후의 결과 파트에서는,

  • PE들이 사용한 여러 전략들,
  • 그리고 이에 대한 reviewee들의 반응이 구체적으로 제시된다.

위협성을 줄이려는 PE의 노력 (Efforts by PEs to Reduce the Stakes)

**피어 평가자(PE)들에게 있어 가장 중요한 것은 *동료성(collegiality)*과 심리적 안전성(safety)이었다. 이들은 **리뷰 대상자(reviewee)를 의도적으로 평가 과정에 공동 참여(co-directing)**시키는 방식으로, 평가의 ‘기울어진 운동장’을 평탄하게 만들고자 했다. 그 방식은 검토 날짜를 reviewee가 직접 고르게 하는 것처럼 사소해 보이는 요소부터 다양했으며, 이를 통해 권력의 비대칭성을 완화하려 했다.


사전 안내와 기대치 설정의 중요성

PE들은 **사전에 명확한 안내(clear guidance)**를 제공하는 것이 핵심 전략이라고 강조했다. 이들은 다음과 같은 요소를 리뷰 대상자에게 분명히 설명하였다:

  • 검토 절차 전반에 대한 세부 설명
  • 리뷰 대상자가 사전에 준비해야 할 사항
  • 리뷰 당일 해야 할 일에 대한 안내

그들은 이 프로세스가 동료적 학습(collegial learning)의 기회이며, 상호 간의 의미 있는 배움(mutual learning)을 위한 것임을 지속적으로 강조하려고 노력했다.

"I’m speaking on behalf of the College, but don’t be alarmed, it’s just an effective enhancement process not an assessment or a punitive thing and we learn from each other." (P05-PE)
"제가 College를 대표해 말하고 있지만, 걱정하지 마세요. 이건 평가나 처벌을 위한 게 아니라 효과적인 개선(enhancement)을 위한 과정이에요. 서로에게서 배우는 거죠." (P05-PE)


"좋은 의사를 더 좋은 의사로"라는 메시지 강화

PE들은 자신들의 역할이 문제 있는 의사를 찾아내는 데 있는 것이 아니라,

“좋은 의사를 더 좋은, 그리고 최고의 의사로 성장시키는 것”(to take doctors from good to better to best)
라고 설명하였다. (P12-PE)

 

실제로 한 PE는 인터뷰를 시작할 때 의사의 탁월함(clinician excellence)을 인정하고 축하하려는 질문들로 대화를 시작했다:

“What would you like to brag about? What do you do really well that I can make a note of and report back?”
"스스로 자랑하고 싶은 건 무엇인가요? 정말 잘하고 계신 건 어떤 건가요? 제가 그것도 적어가서 보고서에 반영하고 싶거든요."
"So I get them, sort of, to tell me about the really good stuff that they do, and then just go through things and try and be supportive in it." (P12-PE)

 

이처럼 대화를 긍정적 분위기 속에서 시작하는 전략은 리뷰 대상자의 불안을 낮추고, 학습을 촉진하려는 의도였다.


피드백의 성격: 긍정적, 문서 중심, 점진적

전반적으로 PE들이 제공한 피드백은 다음과 같은 경향을 보였다:

  • 긍정적이고 강화적인 메시지(positive and reinforcing) 중심
  • 주된 개선사항은 문서화(documentation)나 행정적 이슈(administrative issues)에 집중
  • 임상적 판단(clinical judgment)에 대한 직접적 비판은 최소화

더 비판적인 피드백이 필요할 경우에도, PE들은 직접적인 비난보다는 질문 방식으로 표현함으로써 위협을 약화시키려 하였다.

"But if there are different ways of doing it I would say, ‘Well, have you thought about doing it this way?’ [...] ‘This is how some people do it. What do you think about that?’"
"다른 방식도 있다면 이렇게 물어봐요. ‘이런 식으로 해보신 적 있으세요?’ 혹은 ‘이런 방식으로 하는 분들도 계시던데요. 어떻게 생각하세요?’"

 

그는 이어서 설명한다:

"그리고 그들은 저에게 근거를 제시합니다... 때로는 그럴듯한 이유를 대기도 하고, 때로는 검토해 보겠다고 말하기도 합니다. 그렇게 하면 변화를 이끌어낼 수 있습니다."
"And they will give me their rationale… sometimes good reasons, sometimes they’ll say they’ll look at it. And that’s how you bring about change."

 

즉, 이처럼 ‘무장 해제된 피드백(disarming feedback)’, 즉 받는 사람의 기존 신념과는 다를지라도 일정한 어조로 전달되면 수용성이 높아지는 피드백 방식이 변화를 유도할 수 있다고 보았다.

"무장 해제 피드백이라고 부르는데... 특정 어조로 전달되면 바이 인을 얻지 못합니다." (P04-PE)
"It’s what they call disarming feedback… If it’s delivered in a certain tone, it doesn’t achieve buy-in." (P04-PE)


이처럼 PE들은 긴장을 완화하고, 신뢰를 확보하며, 학습을 유도하기 위한 세심한 전략들을 구사하고 있었다.
그러나, 이러한 전략이 reviewee 입장에서 어떻게 수용되고 해석되었는지는 다음 부분에서 이어지며, 여전히 한계와 긴장이 존재했음을 보여줄 것이다.


리뷰 대상자의 반응 (Responses of Reviewees)

PE들이 취한 **긴장 완화 전략(anxiety reduction efforts)**은 전반적으로 효과적이었다. 대부분의 reviewee는 피어 간 토론(peer discussion)이 상대적으로 무해하고(innocuous), 심지어 **“유쾌했다(pleasant)”**고 회상하였다 (P25-R). 실제로 몇몇 참여자들은 이번 리뷰의 가장 큰 수확으로 **“나는 이미 좋은 의사다”라는 점을 확인(validation)**한 것을 꼽았고, 이는 **실제 진료 개선에는 영향을 주지 않더라도 자기 확신을 제공하는 피드백(validating feedback)**으로 받아들여졌다. 이러한 유형의 피드백은 자신을 “임포스터(imposter)”라고 느끼는 의사들에게 특히 유익했다. 예를 들어, Participant 19-PE는 다음과 같이 언급하였다:

“Imposter syndrome is a very common theme with physicians.”

 

임포스터 감정을 가진 참여자들은 리뷰 통보 자체가 오래된 자기 의심(self-doubt)을 악화시키는 계기가 되기도 했다. 반면 자신을 임포스터로 인식하지 않는 참여자들도, 긍정적인 피드백이 “안도감(reassurance)”과 “자신감 향상(confidence boosting)”을 주었다는 반응을 보였다.

“It actually made me feel good … it was nice to have a peer, you know, point out some positive things.” (P08-PE)


긍정적이지만 모호한 피드백에 대한 혼재된 평가

많은 참여자들은 “유쾌한 경험”이 반드시 학습적 가치가 크다고 느껴지진 않았다고 밝혔다. 피드백이 대체로 긍정적일수록 내용이 두루뭉술하고(tepid), 구체성이 부족하다는 인식이 많았다:

“Really it was very positive and nothing negative and really not even that much constructive… just ‘this is very thorough, this is really good, it was interesting, your patients are interesting.’” (P22-R)

 

**차트 작성(charting)**을 더 명확히 하거나, 진료의 효율성(efficiency)을 높이기 위한 구체적 조언을 받은 경우에는 감사의 뜻을 표현하기도 했다:

“To get specific feedback on ‘you could do this and you could do that a bit better’ was really, really helpful.” (P25-R)

 

그러나 대부분의 참여자들은 이를 **“지엽적인 문제 지적(nit-picky)”**으로 인식했으며 (P13-PE), P25-R처럼 실질적인 도움을 느낀 경우는 드물었다.


진료 역량 평가로서의 한계

많은 리뷰 대상자들은, 실제 환자 진료에 대한 관찰이 없고, 입원/외래 전반에 걸친 총체적 접근이 부족한 상황에서,
이번 리뷰가 진료 역량을 측정하지 못한다(doesn’t measure competency)”, **“의사를 있는 그대로 반영하지 않는다(doesn’t necessarily reflect the physician)”**는 점을 지적하였다 (P24-R, P29-R).

“You could be a very good physician and a very bad documenter, right? So if you’re not a good documenter then obviously you look like you’re a bad physician… I’m not sure one is correlated with the other to be honest, but that’s what you’re left with.” (P18-R)
"진짜 좋은 의사라도 서류 작업을 못하면 안 좋게 보일 수 있어요. 실제로는 별로 상관없을 수도 있지만, 그런 인상만 남는 거죠."


피드백에 대한 평가: 인공적이고 임상과 무관

이러한 배경에서, 피어 리뷰를 통해 생성된 피드백은 **“인공적(artificial)”(P29-R)**이고 **“임상과 무관(clinically irrelevant)”(P11-PE)**하다고 느껴졌으며, 따라서 학습 촉진 효과도 제한적이었다. 많은 참여자들은 이 과정이 의사의 자율 규제(self-regulation)를 위해 필요한 절차라는 점에는 (때로는 마지못해) 동의했지만, 실제 경험은 처벌적(punitive)이고 교육적이지 않았다고 느꼈다:

“… the whole process was more punitive rather than wanting to be instructively helpful.” (P30-R)


“가성비” 낮은 의무적 절차라는 인식

대다수의 리뷰 대상자에게 있어, 규제기관이 요구하는 피어 리뷰는 ‘가성비 낮은(make-work)’ 활동이었다. 시간과 감정적 에너지를 투자한 것에 비해 얻는 것이 거의 없었다는 인식이 강했다:

"[PE들은] 계속 '이것은 여러분을 위한 것이고 많은 사람들이 정말 유익하다고 생각합니다'라고 말했고, 내내 일처럼 느껴졌습니다... 무급 노동처럼 느껴졌고... 그만한 가치가 없었습니다." (P27-R)
“[PEs] kept saying ‘this is for your benefit and lots of people find that it’s really beneficial’ and the whole time it kind of felt like work… it felt like unpaid work… it wasn’t worth the value.” (P27-R)


아이러니: PE가 되어야 비로소 배우는 경험

흥미롭게도, PE 자신들조차 리뷰 대상자로서보다는 PE 역할을 수행하면서 더 많은 학습을 얻었다고 언급하였다.
다양한 의사들의 진료 스타일을 관찰하는 경험이 큰 도움이 되었던 것이다:

“I learn a lot of new things, just other people’s techniques … different protocols and stuff that I hadn’t considered.” (P13-PE)

 

또한, 피드백을 제공하고 상대방의 수용 반응을 관찰하는 과정 자체가 자기 역량 향상으로 이어졌다:

“I think doing assessments has made me a better communicator… I’m a much better writer because of this… I’ve learned to pick up cues about who I’m about to talk to.” (P20-PE)


요약: 리뷰 대상자에게는 제한된 교육 효과

종합적으로, 양쪽 입장을 경험한 PE들조차도 피어 리뷰가 reviewee에게는 학습 효과가 제한적이라는 점을 인정하였다:

“I learn far more than I impart.” (P01-PE)


논의 (Discussion)

의료인의 역량을 개발하고 유지해야 한다는 필요성은 잘 알려져 있으며, 이를 바탕으로 특히 **높은 위험(high-stakes)**으로 인식되는 상황에서 피드백 제공과 수용을 어떻게 개선할 것인가에 대한 관심은 매우 크다. 하지만 현재까지의 의학교육 연구는 **대부분 정규 교육과정(formal training environments)**에 초점을 맞추고 있다.⁷ 이에 본 연구는 **임상의들에게 제공되는 피드백의 학습 가치(perceived learning value)에 대한 다각적 이해(multiperspective understanding)**를 생성하고자 하였다. **피어 평가자(PE)**와 리뷰 대상자(reviewee) 양측의 관점을 탐색함으로써, 본 연구는 다음 두 가지에 기여한다:

  • 최근 강조되고 있는 풍부하고 사회문화적이며 관계 중심적인 피드백 상호작용에 대한 탐색 요구에 응답하였다.³⁰
  • 동시에, 왜 의무적 피어 리뷰 프로그램이 교육적 효과 측면에서 미흡하게 인식되는지를 정교하게 설명하였다.

기대에 미치지 못하는 피드백의 이유: 기존 해석

우선, 본 연구는 다음과 같은 기존 설명을 확장하고 뒷받침한다:

  • PEs는 R2C2 모델과 같이 근거 기반 피드백 전략을 충실히 따랐으며,²⁶
  • 규제기관이 주도하는 피어 리뷰라는 근본적으로 위협적인(highly threatening) 상황을 완화하기 위해 상당한 노력을 기울였다.

그러나 그럼에도 불구하고, reviewee들은 피드백을 학습적으로 유의미하거나 가치 있다고 인식하지 못하는 경우가 많았다기존 문헌에서는 다음과 같은 설명을 제시한다:

  • **신뢰할 수 있는 피드백(credible feedback)**은 신뢰(trust)와 직접 관찰(direct observation)에 기반해야 하며,¹⁸,³¹
  • 이는 규제기관이 주도하는 프로그램에서는 달성하기 어렵다.

또한, 피어 리뷰와 같은 **고위험(high-stakes) 상황에서는 피드백의 감정적 수용 자체가 방해받을 수 있다.**⁹ 이러한 환경에서 **형성적 학습기회(formative learning opportunity)**를 기대하는 것 자체가 과도할 수 있다는 주장도 제기되어 왔다.³²


새로운 통찰: ‘기대’가 만들어내는 역설

하지만 본 연구는 한 걸음 더 나아가, 왜 피드백이 가치 없다고 인식되는가에 대한 또 다른 설명을 제시한다:

피드백에 부여된 ‘기대의 무게(the heavy weight of expectations)’ 때문이다.

 

의학교육에서는 피드백이 **수행 향상(performance improvement)을 위한 필수 조정(course correction)**으로 간주된다.⁷ 따라서 학습자와 임상의들은 피드백을 다음과 같이 **사회화(socialized)**되어 인식한다:

  • 피드백은 변화를 유도하는(transformative) 경험이다.
  • 피드백은 학습을 근본적으로 변화시키고(practice-changing),
  • 의료 실천을 향상시켜야 한다.

하지만 본 연구에 참여한 대부분의 의사들은 무작위로 선정되었고, 이미 ‘안전하고 유능한(safe and competent)’ 의사였다. 따라서 생성된 피드백은 대부분 다음 중 하나였다:

  • **기존 수행을 ‘인정’(validation)**하거나
  • **작은 수정(fine-tuning)**을 제안하는 것

이러한 피드백은 그 자체로 신뢰성이 부족해서가 아니라,

학습자들이 기대하는 ‘피드백의 이상적인 모습’과 괴리되어 있었기 때문에 의미 없는 것으로 간주되었다.

 

즉, 유의미하고 신뢰받는 피드백이 되기 위해서는,

  • 적시에 제공되고(timely),
  • 관찰에 기반하며(based on observed performance),
  • 구체적이고 상세해야(detailed) 하는 것은 물론,³¹
  • 무엇보다도 ‘개선을 위한 비판(constructive criticism)’의 형식을 띠어야 한다.

반대로, 칭찬 위주의 피드백은 ‘이미 잘하고 있다는 사실’만을 확인해줄 뿐, reviewee의 학습 기대를 충족시키지 못한다.


피드백의 역설: 기대와 두려움 사이에서

흥미롭게도, 리뷰 대상자들은 초기 통보를 받았을 때, 학습 기회보다 ‘비판’에 대한 두려움이 컸다.

“혹시 내가 못하고 있는 부분을 들춰낼까?”
“전문가로서의 정체성에 위협이 되지 않을까?”

 

그러나 실제로는 피드백이 비판적이지 않았고, **실질적인 변화도 유도하지 못했다는 점에서 ‘안도감’과 동시에 ‘실망감’**을 느끼는 이중적 반응을 보였다.

✅ 안도: 다행히 큰 결점은 없었다.
❌ 실망: 그런데 학습적으로도 남는 게 없었다.

 

이러한 반응은 다음과 같은 *정체성의 긴장(identity tension)*을 보여준다:

  • 한편으로는 자신의 역량을 인정받고자(affirmation of competence) 하면서도,
  • 다른 한편으로는 피드백이 자신의 실천을 변화시킬(transformative) 것을 기대하는 것

이러한 긴장은 지도자는 피드백을 제공한다고 느끼지만, 학습자는 피드백을 ‘받지 못했다’고 인식하는 현상—즉, 피드백 인식의 불일치(disconnect)를 설명해준다.³³


결론적 메시지: 피드백의 가치는 ‘위협’에 달려 있는가?

만약 피드백이 ‘자기(self)’를 위협할 때에만 학습자가 그것을 진정한 피드백으로 인식한다면, 우리는 다음과 같은 **패러독스(paradox)**에 직면하게 된다:

가장 신뢰받고 유의미하다고 인식되는 피드백은,
**학습자에게 가장 큰 저항(resistance)을 불러일으킬 수 있는 유형일 수 있다.**³⁴


논의(계속): ‘자기(Self)’를 위협하지 않으면서도 도전감을 제공하는 피드백이 가능한가?

피드백 제공자가 학습자의 자기감(sense of self)을 위협하지 않으면서도 실질적인 성장을 이끌어내는 방식으로 도전감을 줄 수 있는 방법은 무엇일까? 이미 교육자들이 알고 있는 다음의 요소들은 물론 중요하다:

  • **심리적 안정감(psychological safety)**의 보장³⁵
  • **관계중심 교육(relationship-centered education)**의 실천¹⁸
  • **신뢰성(credibility)**의 구축¹⁵,³⁶

하지만 지금의 교육 커뮤니티는 더 근본적인 질문에 직면하고 있다:

우리는 “피드백”이라는 단어를 너무 쉽게, 모든 수행 향상(performance improvement) 노력에 적용하고 있는 것은 아닐까?

 

만약 ‘피드백’이라는 말 자체가 ‘변화를 일으킬 수 있는 경험’이라는 기대치를 과도하게 설정한다면, **소소한 강화(reinforcement)**나 **작은 조정(minor tweaks)**은 실제로는 중요한 역할을 하더라도 학습 가치가 없는 것으로 간주될 수 있다.


기대치를 ‘설정’하는 것이 핵심일 수 있다

이러한 문제에 대응하기 위해, 피드백 제공이 이루어지는 과정에서 **명확한 기대관리(expectation management)**가 필요하다. 예를 들어,

  • 어떤 기준이 평가될 것인지
  • 왜 그것이 중요한지,
  • 해당 상황에서 어떤 실천의 측면이 검토 대상이 될 것인지 등을 사전에 명시하면,
    피드백의 학습 가치에 대한 인식이 달라질 수 있다.

이 맥락에서, 이제는 CPD(지속적 전문성 개발) 모델이

단순한 피드백(feedback)에서 벗어나 "피드포워드(feedforward)", 즉, 사전에 기대성과를 명확히 제시하고 학습자가 스스로 이를 평가에 참여하게 하는 방식으로 전환할 때가 된 것인지도 모른다.³⁴


향후 연구와 실천적 제언

앞으로의 연구는 다음과 같은 점을 탐색할 필요가 있다:

  • **진료 향상 프로그램(performance enhancement programs)**의 본질적 의미를 학습적으로 강화하는 방법
  • 단순한 강화(reinforcement) 전략이 **의사의 웰빙(wellness)**에도 기여할 수 있는가 여부

특히, 이번 연구에서 예상치 못하게 발견된 다음의 결과는 매우 흥미로운 후속 연구 주제다:

피어 평가는 고기능(high-functioning) 의사들의 임포스터 증후군(imposter syndrome)을 완화하는 데 도움이 될 수 있다.


한계 (Limitations)

이번 연구는 **비밀 보장(confidentiality)**을 우선했기 때문에, 각 참여자가 왜 규제기관의 피어 리뷰 대상자로 선정되었는지는 알 수 없었다. 참여자가 리스크 기반(risk-based)으로 선정되어 실제 위협을 경험했는지, 혹은 **단순 무작위(random)로 선정되었지만 위협을 ‘느꼈는지’**는 연구에서 명확히 구분되지 않았다. 또한:

  • 참여자의 다수가 리뷰 대상자이자 PE로 활동한 경험이 있는 의사였다.
    → 이로 인해 프로그램에 호의적인 시각을 가진 이들이 과대표집 되었을 가능성이 있다.
  • 각 피어 리뷰 상호작용은 **단측적 관점(one-sided perspective)**에서만 자료를 수집하였다.
    → 향후 연구는 리뷰어–리뷰이 쌍(pair)을 모두 포함하는 연구가 필요하다.
  • 참여자들이 인식한 피드백의 교육 효과는 실제 효과보다 과소/과대 평가되었을 가능성이 있으며,
    → 향후 연구는 실제 피드백이 어떻게 실행되었는가(implementation)를 추적하는 연구가 요구된다.
  • 마지막으로, 본 연구는 질적 연구이므로 일반화(generalization)를 목적으로 하지 않지만,
    규제기관마다 피어 리뷰 방식이 매우 다를 수 있다는 점에서 타 지역에서의 재현 및 확장이 필요하다.

결론 (Conclusions)

고위험(high-stakes) 평가 상황은 학습을 유도할 수 있다. 그것이 준비 과정이든, 평가 자체로부터의 인식이든 간에 말이다.³⁷,³⁸ 하지만 이번 연구에서 나타난 의무적 피어 리뷰의 학습 효과에 대한 실망감은,

실제 위험(stakes)보다는 **기대치(expectations)**가 잘못 맞춰졌기 때문일 수 있다.

 

피드백 제공과 수용의 어려움을 해결하려는 기존의 노력들은, 의료계 내에서 공유되는 **“피드백은 근본적 변화를 가져와야 가치 있다”는 문화적 전제(sociocultural assumption)**를 충분히 고려하지 못했다. 

 

이번 연구는 다음과 같은 점을 경고한다:

  • 대부분의 의사들이 이미 양호한 수행을 보이고 있다면,
  • **작은 조정(tweaks)**이나 **안심(reassurance)**을 통해 얻을 수 있는 지식적/심리적 효과가 존재하지만,
  • 이것이 "변화를 유도하지 않으면 가치 없다"는 인식에 의해 **무시될 수 있다.**³⁹

패러독스를 넘어: 피드포워드와 기대의 재설계

이러한 상황에서,

  • **강한 수행을 인정하는 메시지(affirmation)**는 학습자가 **내면화(internalize)**하기보다 버리는(discard) 경향이 강하고, 
  • 그 결과 의미 있는 피드백이 드물다고 느끼게 되며,
  • 동시에 임포스터 증후군과 **번아웃(burnout)**이 만연한 상태가 지속되는 것이다.⁴⁰,⁴¹

이러한 피드백의 역설—받는 사람이 저항해야만 피드백으로 인식되는—을 해결하기 위해서는,

전통적인 피어 리뷰를 넘어서,

“피드포워드(feedforward)” 방식으로의 전환이 필요하다.

  • 검토 기준을 사전에 명확히 공유하고,
  • 리뷰 대상자를 보다 능동적으로 평가 과정에 참여시키는 방식이 되어야 한다.

우리는 다음과 같이 기대한다:

CPD 전반에서의 피드포워드 대화는 덜 불안을 유발하고, 보다 신뢰받는 방식으로, *강한 수행을 더욱 세련되게 다듬는 작업(tuning of strong performance)*도 학습적으로 유익한 과정으로 인식되게 만들 수 있다.

 

Acad Med 2023 Nov 1;98(11S):S72-S78.  doi: 10.1097/ACM.0000000000005362. Epub 2023 Aug 2.

When Feedback is Not Perceived as Feedback: Challenges for Regulatory Body-Mandated Peer Review

 

 

 

📌 리더십과 팔로워십의 새로운 이해: LEADS+ Developmental Model📚

안녕하세요! 오늘은 복잡한 의료 조직 내에서 효과적인 리더십을 발휘할 수 있도록 도와주는 혁신적인 리더십 모델에 대한 논문을 소개해드리려고 합니다. 최근 의료 환경이 점점 더 복잡해지면서, 특히 학술의료센터(Academic Health Centres; AHCs)와 같은 조직에서는 기존 리더십 개념만으로는 한계가 있었어요. 이를 극복하고자 캐나다의 의료 리더십에서 널리 쓰이는 LEADS 프레임워크와 Kegan의 인간 발달 이론(Human Development Model)을 결합한 새로운 리더십 모델인 **『LEADS+ Developmental Model』**을 연구진이 제안했습니다.


💡 연구 배경 및 문제의식

21세기 의료 시스템은 엄청난 복잡성(complexity)에 직면하고 있습니다. 기술 발전, 환자의 요구 증가, 재정 압박 등 여러 가지 문제가 겹쳐 더욱 복잡해졌는데요. 특히 최근 팬데믹으로 인해 의료계 리더들이 "사악한 문제(wicked problems)"라는 새로운 도전에 직면했습니다.

이 문제들은 다양한 이해관계가 얽혀 기존의 리더십으로는 해결하기 어려워요. 그래서 학술 의료센터(AHC)처럼 병원과 대학이 함께 운영되는 매트릭스 조직(matrix organisations)에서는 리더들이 서로 다른 조직의 목표와 가치 사이에서 고민하게 됩니다.🤔

이런 상황에서 연구진은 리더들이 여러 역할(multiple roles)과 정체성(multiple identities)을 효과적으로 관리할 수 있도록 돕는 모델이 필요하다고 판단했습니다.


🔎 연구 목적과 접근 방법

연구진은 기존의 LEADS 프레임워크와 Kegan의 인간 발달 이론을 결합하여 리더들이 조직 내에서 다양한 역할을 효과적으로 수행할 수 있도록 하는 모델을 개발하고자 했어요.

 

이 과정에서 연구진은 다양한 리더십 이론과 프레임워크를 탐색했고, 그 중 LEADS 프레임워크와 Kegan의 인간 발달 모델을 선택했습니다. 이 두 모델은 서로의 부족한 부분을 상호 보완할 수 있었기 때문이에요. 특히 LEADS 프레임워크는 구체적인 리더십 역량을 제시했지만 다중 역할을 가진 리더의 상황적 맥락(context)은 부족했고, Kegan의 모델은 인간의 인지 발달을 다루었지만 리더십 역량에 대한 설명이 부족했습니다. 그래서 이 두 가지를 결합해 효과적인 모델을 만들었어요.

 

연구진은 이를 위해 집중적인 문헌 리뷰와 전문가 협의(knowledge user consultations)를 수행했고, 다양한 전문가와 실제 리더들의 피드백을 받았습니다.


📖 LEADS+ Developmental Model의 핵심 구성 요소

이 모델은 크게 두 가지 팔로워십 스타일과 두 가지 리더십 스타일을 제안하고 있습니다.

🔸 팔로워십 스타일(Followership)

  • 필수적 팔로워십(Essential Followership): 신입 직원처럼 아직 리더 역할을 맡기 어려운 단계에서, 조직 내 암묵적 정보를 배우고 팀원들과 관계를 맺으며 업무를 수행하는 단계입니다.
  • 전략적 팔로워십(Strategic Followership): 조직의 전략과 목표를 이해하고 창의적으로 행동하여 자신의 리더십 역량을 발전시키는 단계입니다.

🔹 리더십 스타일(Leadership)

  • 역할 기반 리더십(Role-based Leadership): 공식적인 직함을 가진 리더가 자신의 역할 범위 내에서 업무를 수행하는 단계로, 다른 부서와의 협력이 필요하지만 때로는 계층적 구조로 인해 한계를 겪을 수 있습니다.
  • 복잡성 기반 리더십(Complexity-based Leadership): 여러 역할을 통합하여 조직 전반에서 문제를 해결하고 협력적이며 창의적인 방법으로 리더십을 발휘하는 단계로, 분산적 리더십(distributed leadership)과 유사한 개념입니다.

연구진은 "고급 리더십은 LEADS 프레임워크의 '자기 주도(Leading Self)' 영역에서 유연한 변화(fluid shifts)를 필요로 하며, 리더들은 각 역할과 조직, 맥락에 따라 자신을 리더 또는 팔로워로 재개념화해야 한다(Advanced leadership requires fluid shifts for the Leading Self domain of LEADS, as leaders must reconceptualize themselves from a leadership/followership perspective as appropriate for given roles, organisations and context)"고 강조합니다.

 

또한 리더는 상황에 따라 리더십과 팔로워십 역할을 유연하게 전환하는 다재다능성(versatility)이 필요하다고 설명하고 있습니다.


💬 모델의 평가 및 실제 적용 가능성

연구진은 북미 전역의 다양한 리더들과 교육자들을 대상으로 설문 조사와 인터뷰를 진행했는데요, 이 모델에 대한 지지율이 10점 만점 중 평균 7.93점으로 매우 높았습니다. 참여자들은 이 모델이 "포괄적이고(comprehensive), 발달적(developmental)이며, 지향적(aspirational)"이라고 평가했습니다. 다만 연구진은 이 모델이 아직 실증적 근거(empirical evidence)가 부족하고, 추가 연구가 필요하다는 한계를 인정했습니다.


🎯 연구의 의의 및 결론

이 연구의 가장 큰 의의는 기존 리더십 프레임워크와 심리적 발달 이론을 결합하여, 실제로 복잡한 의료 조직 내 리더들에게 적용 가능한 모델을 제시했다는 점입니다. 연구진은 이 모델이 실제 현장에서 리더들이 다양한 역할과 정체성을 통합하여 더욱 효과적인 리더십을 발휘하는 데 큰 도움을 줄 수 있다고 결론지었습니다.

이 모델은 앞으로 다양한 의료 조직의 리더십 프로그램 개발이나 리더 개인의 자기 성찰(reflection) 도구로 유용하게 활용될 것으로 기대됩니다.

복잡한 시대에 꼭 필요한 리더십 역량을 잘 보여준 『LEADS+ Developmental Model』 논문 소개였습니다. 이 모델이 현장에서 널리 활용되기를 기대하며, 오늘 포스팅을 마칩니다.😊✨

 

 

 


1. 서론(INTRODUCTION)

21세기 보건의료 체계는 점점 더 복잡성(complexity)이 증가하고 있다. 기술 발전, 환자 인구 구조 및 기대치의 변화, 재정 압박, 빠른 정보 흐름, 보건 인력 자원의 문제 등이 이러한 복잡성을 더욱 심화시키고 있다.¹ 특히 코로나19 팬데믹은 이전까지 의료계 리더들이 경험하지 못한 수준의 **상호 연결성(interconnectedness)**을 더했다. 동시에, 팬데믹은 이른바 ‘사악한 문제(wicked problems)’²—즉, 매우 복잡하고 폭넓어서 현재의 리더십 관행으로는 대처하기 어려운 문제—를 발생시켰으며, 이는 학술 의료센터(Academic Health Centres; AHCs)의 리더십 역량 부족을 드러냈다.

💡 Wicked problems
“구성원과 조직의 다양한 이해관계와 관점들이 얽혀 있어 기존의 리더십과 문제해결 접근방식으로는 해결하기 어려운 문제들”

 

이러한 문제를 다루기 위해서는 **다양한 전문적 정체성(professional identities)**을 오가며 활동해야 하는 신규 및 현직 리더들을 지원할 수 있는 모델이 필요하다. 새로운 리더들은 학술적 영역과 의료 현장 모두에서 직면하는 복잡성을 더 잘 이해해야 한다. 이는 의료 리더들이 다음과 같은 사항을 보다 잘 관리하도록 도울 것이다.

  • 경쟁적 우선순위(competing priorities)
  • 대인 관계 역학(inter-personal dynamics)의 미묘한 차이
  • 조직 내 정치(organisational politics)

이를 통해 이들의 경력이 학술적 및 의료적 맥락에서 모두 발전할 수 있다.

 

본 논문은 학술 의료센터(AHCs)—즉, 병원과 대학(학술기관)이 연계된 임상기관—에서 보건의료 시스템 리더들의 미묘한 역할과 경력 경로를 탐색한다. AHCs는 매트릭스 조직(matrix organisation)³으로서, 최소한 병원과 대학이라는 두 개의 개별 조직이 함께 작동한다. 매트릭스 조직은 독립된 문화와 시스템을 가진 조직들이 특정한 공동 목표를 달성하기 위해 개인들을 통해 서로 연결되어 있는 형태이다. AHC 내부 각 조직은 자신만의 고유한 목표, 가치, 우선순위, 도전 과제와 지식 사용자(knowledge users)를 가지고 있다.

  • 병원 시스템과 학술 기관이 서로 연결되어 있기 때문에, 개인들은 여러 역할과 그에 따른 **다중 정체성(multiple identities)**을 갖게 된다.
  • 각 조직에서 일하는 리더들은 종종 상충되는 요구, 목표, 가치, 관점을 조율(navigate)해야 한다.⁴
  • 조직 간의 이해관계와 관점이 복잡하게 얽힌 wicked problems는 리더의 정체성을 더욱 혼란스럽게 한다.

경력이 발전하면서 개인은 전문적, 개인적 성장을 요구받게 되지만, 각 개인마다 이러한 성장 능력(capacity)에는 차이가 있다. 리더 역할에는 임상가(clinician), 관리자(administrator), 연구자(researcher), 교육자(educator), 오피니언 리더(opinion leader) 등 다양한 정체성이 포함될 수 있다.

 

이러한 전문적 정체성과 무관하게, 각 개인은 반드시 리더십뿐만 아니라 **팔로워십(followership)**에도 참여해야 한다고 주장한다.

💡 **팔로워십(Followership)**⁵⁻⁶
“리더가 제시한 목표를 위해 책임감을 가지고 이를 지원하고, 필요시 리더의 결정에 도전하고 논쟁하며, 조직의 변화에 적극적으로 참여하고, 도덕적 행동을 실천하는 현상”

 

리더의 역할이 발전할수록 리더십과 팔로워십 사이를 오가는 미묘한 균형이 요구된다.


LEADS 프레임워크와 그 한계

**LEADS in a Caring Environment 프레임워크(LEADS framework)**는 2006년에 개발된 것으로, 보건의료 리더들이 갖추어야 할 핵심 역량을 정의하고 장려하기 위한 목적에서 시작되었다.⁷⁻⁸ 오늘날 LEADS 프레임워크는 캐나다의 보건의료 시스템에서 가장 널리 사용되는 리더십 프레임워크 중 하나로,⁹⁻¹⁰ 호주,¹¹ 벨기에,¹² 인도,¹³ 이스라엘⁸,¹⁴ 등으로 확산되었으며, 영국의 Faculty of Medical Leadership and Management의 인증 표준(certification standards)에도 큰 영향을 미쳤다.

 

그러나 여러 역할을 동시에 맡고 있는 리더는 LEADS 프레임워크를 자신들의 다양한 역할과 경력 수준(seniority)에 적용하는 데 어려움을 겪을 수 있다. 예컨대, LEADS 프레임워크의 ‘L’(Leading Self)은 **단일한 정체성(singular identity)**을 전제로 하므로, 여러 가지 정체성을 통합해야 하는 경우 도전과제가 될 수 있다. 또한, 서로 통합된 시스템(integrated system) 내에서 리더가 다양한 역할과 복잡성을 마주할 때, LEADS 프레임워크는 이를 명시적으로 안내하지 않는다.

예를 들어 한 개인은 다음과 같은 역할을 동시에 맡을 수 있다.

  • 병원 행정의 중역(executive role)
  • 임상 감독자(clinical supervisor)
  • 대학 학과의 중견 교수(mid-career faculty member)

동일한 wicked problem (예: 병원 직원의 복지 문제)을 놓고 각 역할의 관점에 따라 전혀 다르게 인식할 수 있다. LEADS 프레임워크는 정해진 시스템 내에서 리더십을 발휘하도록 돕지만, 여러 역할 간의 리더십과 팔로워십의 유연한 전환(fluidity)에 대해 명확한 지침을 제시하지 못하고 있다.


본 논문의 제안: LEADS+ Developmental Model

기존 LEADS 프레임워크의 강점과 리더-팔로워 역할을 포괄할 필요성을 고려하여, 본 논문은 기존의 작업을 확장하여 새로운 모델인 LEADS+ Developmental Model을 제안한다.¹⁵⁻¹⁶ 이 모델은 학술 의료센터(AHCs) 내에서 여러 리더십 역할을 맡을 때 나타나는 리더십과 팔로워십의 실천 방식을 제시하며, 다음의 네 가지 참여 스타일을 정의한다.

  • 팔로워십 스타일(Followership Styles): 필수적(essential), 전략적(strategic)
  • 리더십 스타일(Leadership Styles): 역할 기반(role-based), 복잡성 기반(complexity-based)

본 논문의 핵심 주장은 다음과 같다:

고급(advanced) 리더십은 LEADS 프레임워크의 'Leading Self' 영역에서 유연한 변화(fluid shifts)를 필요로 하며, 리더들은 각 역할과 조직, 맥락에 따라 자신을 리더 또는 팔로워로 재개념화(reconceptualize)해야 한다.

 


2. 연구 방법(METHODS)

본 연구는 의료 리더십 개발이 기존의 주요 의료 리더십 프레임워크인 **LEADS in a Caring Environment 프레임워크(LEADS framework)**와 어떻게 연결되는지를 탐구하기 위해 통합적 개념 리뷰(integrative conceptual review)¹⁷를 수행했다.
Gottlieb과 동료들이 사용한 프로세스와 유사하게, 문헌 속 다양한 관점과 이론을 탐색하며 확산적(divergent) 및 수렴적(convergent) 사고의 반복적 순환(iterative cycles)을 활용했다.¹⁸ 궁극적으로, 연구자들의 관점을 통합하여 하나의 개념적 프레임워크로 구체화했다. 이러한 연구의 작업 흐름(workflow)은 **그림 1(Figure 1)**에 나타나 있다.

 


2.1 연구팀(The team)

본 연구팀은 다음의 인원들로 구성되었다.

  • 교육적 리더십 분야에서 학장급(decanal) 직위를 가진 두 명의 임상 교육자(clinician-educators) (JS, TMC)
  • 의료 행정 리더이자 동시에 교수직을 맡고 있는 전문가 (SR)
  • 리더십 및 의료 창업(health entrepreneurship) 교육자로서 창업보육기관(incubator) 및 여러 스타트업의 리더 역할을 수행 중인 전문가 (SL)
  • 리더십 연구 분야의 박사급 교수로서 LEADS 프레임워크의 공동 창시자이자 비영리 단체 대표 (GD)⁷⁻⁸

연구 과정 전반에 걸쳐 팀 구성원들은 각자의 개인적인 가정(assumptions)을 서로 적극적으로 비판하고, 선택한 이론들의 타당성을 면밀히 검토하여, 리뷰된 문헌에 대해 지속적으로 반성적(reflexive) 태도를 유지하도록 했다.


2.2 분석팀 내 논의(Discussions within the analysis team)

첫 번째 단계로, 다양한 리더십 프레임워크와 이론들에 대한 시범적 검토(pilot review)를 수행하였다. (이 과정은 SR, SL 및 TMC가 진행함). 이 단계는 초기 논의의 기반이 되었다.

  • **캐나다 보건의료 체계에서 두드러진 역할을 하고 있다는 점에서 LEADS 프레임워크가 가장 중요한(salient) 것으로 평가되었다.**⁷⁻⁸
  • 그러나 **LEADS 프레임워크에 결여되어 있다고 판단된 발달적 관점(developmental framing)을 보완하기 위해 Kegan의 인간 발달 모형(human development model)이 추가로 선택되었다.**¹⁹

이 두 가지 프레임워크는 마치 질적 연구에서 감수성 개념(sensitising concepts)을 활용하는 것처럼, 연구팀의 지속적인 논의를 안내하는 데 중요한 역할을 했다.²⁰

  • **상황적 리더십(Situational leadership)**²¹과 Cynefin 프레임워크²²는 리더십의 적응적 특성(adaptive nature)과 특정 맥락(context)에 따라 적절한 리더십 스타일을 구분하는 고급 능력(advanced proficiencies)에 대한 사고를 촉진했다.

연구팀은 영상회의(videoconferencing)를 통해 여러 차례 논의를 진행했으며, 실시간 공동 작업이 가능한 클라우드 기반의 문서 도구를 활용하여 개념 정리 및 메모를 공유했다. 각 회의는 약 1시간씩 진행되었다.


2.3 문헌 통합 및 초기 모델 테스트(Literature synthesis & initial testing)

초기 모델을 정교화(refining)한 후, 집중적 문헌 리뷰(focused literature review)를 실시했다. 연구팀은 보건의료 시스템 리더십, 팔로워십(followership), 조직개발(organisational development) 분야의 기존 문헌을 참조하여, 새롭게 도출한 개념 모델(conceptualization)을 기존의 다른 모델들과 대조했다.

  • 반복적(iterative) 개정을 거쳐 하나의 개념 모델로 결정하였다.
  • 이후 페르소나 중심 테스트(persona-driven testing)—다양한 상황에서 각 역할을 명확히 하기 위해 가상 캐릭터를 활용한 인지적 시뮬레이션(cognitive simulations)—와 지식 사용자(knowledge user)들과의 협의를 통해 개념 모델을 정교화했다.²³⁻²⁴
  • 페르소나(persona)는 연구팀 구성원들이 실제로 경험했던 사례들(exemplars)을 기반으로 개발했다.²³⁻²⁵ (구체적인 페르소나 관련 삽화(vignettes)는 온라인 부록(Appendix S1)에서 확인 가능하다.)

2.4 지식 사용자 협의(Knowledge user consultations)

스코핑 리뷰(scoping reviews)²⁶ 및 캐나다 보건연구소(CIHR)의 지식 교류 프로세스(Knowledge Exchange process)²⁷에서 권장하는 지식 사용자 협의 방식에 따라, 이전에 출판된 프로세스를 기반으로 북미 전역의 다양한 교육자, 전문가 및 현장 실무자들로부터 피드백을 수집했다. 연구팀 내 숙련된 리더십 개발자(GD, TC, JS)의 추천을 기반으로 **눈덩이 표본추출법(snowball sampling)**을 활용하여 피드백을 제공할 지식 사용자들을 모집했다.

다음 중 최소 하나를 충족하는 사람을 포함하였다.

  1. 두 개 이상의 조직 또는 부서에서 복합적 리더십 역할(blended leadership roles)을 경험한 사람
  2. 복수의 역할을 수행하는 타인을 감독하거나 이끄는 사람
  3. 리더십 훈련과 개발에 대한 교육 또는 학술 활동에 적극적으로 참여한 사람

북미 보건의료 맥락에서의 경험이 없는 사람들은 제외했다. 연구팀은 간단한 설문 도구(https://bit.ly/BridgeLEADsurvey)를 개발하여, 각 지식 사용자들이 자신의 리더십 실무와 관련하여 개념 모델의 강점, 약점, 적합성(relevance)을 평가하도록 요청했다. 정량적 데이터는 기술 통계(descriptive statistics)로 분석했으며, 정성적 데이터는 우선 선임저자(senior author; TMC)가 주제 분석(thematic analysis)을 실시한 후, 제1저자들(SR, SL)이 이를 확인하였다.²⁸ 추가적 피드백 제공을 희망한 사용자들과는 선임저자(TMC)가 주도하여 30분 간의 1:1 줌 인터뷰(Zoom communications, Inc.)를 진행했으며, 이 과정은 한 달 내 완료되었다. 인터뷰에서 얻은 피드백은 논문 작성 과정에서 본문의 내용에 지속적으로 반영되었다.

 


📌 Box 1: LEADS in a Caring Environment 프레임워크란 무엇인가?

『LEADS in a Caring Environment Capabilities Framework』 는 캐나다 보건의료 환경에서 효과적인 리더십과 관리를 수행하는 데 필요한 리더십 역량(capabilities)을 정의하는 프레임워크이다.

이 프레임워크가 다른 역량/능력 프레임워크와 구별되는 특징은 "돌봄(CARING)"을 핵심 가치로 삼는다는 점이다. 여기서 돌봄이란 다음을 포함한다:

  • 환자(patients)에 대한 돌봄
  • 직원(staff)에 대한 돌봄
  • 의료 제공자(providers)에 대한 돌봄
  • 인구 집단(population)의 건강에 대한 돌봄

LEADS 프레임워크는 모든 보건의료 분야 및 시스템의 모든 수준에서 필요한 주요한 기술, 행동, 능력, 지식을 나타낸다. 이 프레임워크는 다섯 가지 핵심 영역(domain)으로 구성되어 있다:

  1. 자기 주도(Lead Self)
  2. 타인 참여(Engage Others)
  3. 성과 달성(Achieve Results)
  4. 연합체 구축(Develop Coalitions)
  5. 시스템 전환(Systems Transformation)

각각의 영역은 효과적인 리더십의 모습을 나타내는 4가지 핵심 역량(capabilities)을 포함한다.

이 프레임워크는 리더십(leadership)과 관리(management) 사이의 상호작용(interplay)을 강조한다. 두 요소 모두 보건의료 분야에서 효과적 리더십을 발휘하는 데 필수적이며, 이는 학술적(academic), 임상적(clinical), 행정적(administrative) 역할 모두에 적용 가능하도록 설계되었다.

LEADS 프레임워크는 또한 "분산적 리더십(distributed leadership)" 접근법을 나타낸다. 즉, 의료 시스템 내 개인의 위치(role/title)에 관계없이 누구나 자신이 있는 곳에서 리더가 될 수 있으며, 모든 사람이 보건의료를 변화시키는 데 참여할 수 있다는 것이다.

이 프레임워크는 약 5년 주기로 창안자들에 의해 개정된다. 본 논문의 개념적 작업(conceptual work)은 이러한 개정 과정과 연계되어 있으며, LEADS 프레임워크의 발전(evolution)에 기여하기 위한 목적을 가지고 있다.


📌 Box 2: Kegan의 인간 발달 모형(Human Development Model, 의식 수준 Orders of Consciousness 포함)

**Kegan의 인간 발달 모형(Human Development Model)**은 개인의 정체성 형성(identity formation)을 **다양한 경험을 통해 형성되는 복합적 현상(complex phenomenon)**으로 설명하는 프레임워크이다.

 

경험의 수(number)와 범위(breadth)가 개인이 가질 수 있는 관점(perspectives)을 늘리고, 이를 객관적으로 활용하는 방법을 학습하게 한다. 다양한 도전(challenges)은 개인이 가진 관점을 변화시키며, 이러한 관점들을 결합하여 주변 세계를 탐색(navigate)하는 능력에 영향을 준다.

 

Kegan의 모형은 다섯 가지 의식 수준(Orders of Consciousness)을 제시한다:

  • 1차 및 2차 수준(First-order and Second-order: imperial, incorporative, impulsive)
    → 자기 중심적(self-focused)으로, 타인의 욕구나 필요에 대한 인지가 거의 없다.
  • 3차 수준(Third-order: interpersonal)
    → 자기 자신과 타인의 욕구(needs)에 대한 인식이 발달한다.
  • 4차 수준(Fourth-order: institutional)
    → 이전에 거부되었던 자기 자신, 타인, 시스템의 여러 측면을 수용(acceptance)하게 되며, 자기 주도적 정체성(self-authorship)이 형성된다.
  • 5차 수준(Fifth-order: inter-individual)
    → 시스템 수준의 사고(systems-level thinking)가 가능해지며, 자신과 타인의 관점이 복수적(multiplicity)이라는 것을 인정하게 된다.

이 프레임워크는 인간의 발달(human development)을 자기 자신(self), 타인(others), 그리고 시스템(systems)에 대한 점점 더 복잡하고 심화된 이해로 이어지는 점진적 발전(incremental progression)으로 개념화한다.

🔖 중요한 주의점
모든 사람이 위의 모든 의식 수준을 성취하지는 않는다.

 


3. 결과(RESULTS)

본 연구에서 제안하는 『LEADS+ Developmental Model』 은 의료 분야 전문가들이 리더십 역량을 습득해가는 과정을 명확한 단계적 이정표(milestones)로 제시함으로써, 이들이 리더십 여정을 효과적으로 시작할 수 있도록 돕는다.


3.1 기존 리더십 프레임워크 및 모델과의 비교(Contrasting to prior leadership frameworks and models)

문헌 리뷰를 진행하면서, 기존의 리더십 문헌(보건의료 분야 및 타 분야 포함)에는 리더의 발달 여정(developmental journey)을 체계적으로 묘사한 프레임워크가 부족하다는 것을 발견했다. 기존 문헌의 대부분은 다음과 같은 내용을 다루고 있었다.

  • 개별 리더의 개인적 리더십 이야기(individual leaders’ stories) ²⁹⁻³²
  • 선배 리더가 후배 리더를 멘토링하는 방법 ³³
  • 보건의료 시스템 내 개인이 경력(career)을 거치며 경험하는 리더십 발달 경로(pathways) ³⁴⁻³⁶

하지만 대부분의 기존 프레임워크는 다음의 측면을 명확히 제시하지 않고 있다.

  • 리더가 여러 역할(multiple roles) 사이에서 경험하는 비대칭적(asymmetric) 성장
  • 보다 복잡한 리더십 역량(complex leadership capabilities)을 획득하면서 단계적으로 발전(stratify)해 나가는 과정
    (예: 개인 내적 발달, 소규모 팀과의 관계 형성, 타 조직과의 관계 형성, 시스템 변화나 성과 달성 등)

예를 들어, Heifetz의 ‘적응적 리더십(adaptive leadership)’ 접근법은 리더가 상황(context)에 따라 변화하고 적응해야 한다고 제안하지만, 리더가 시간이 지남에 따라 역할이 어떻게 변화하는지에 대해서는 명확한 통찰(insight)을 제공하지 않는다.³⁷

 

한편, 하버드의 McNulty, Marcus 등이 개발한 메타 리더십(meta-leadership) 프레임워크³⁸⁻⁴⁰는 위기 상황에서 여러 조직 간 가교 역할을 하는 리더의 필요성을 강조한다. 예컨대, 이 프레임워크는 비상 상황(예: 보스턴 마라톤 폭탄 테러) 연구를 통해 개발되었으며, 본 연구의 복잡성 기반 리더십(complexity-based leadership)과 유사점(resonant)이 많다. 하지만 메타 리더십 프레임워크는 개인이 다양한 맥락에서 리더십과 팔로워십의 다양한 참여 방식(styles of engagement)을 유연하게 전환(versatility)하는 능력에 대해서는 충분히 다루지 않으며, 또한 리더가 성장 과정에서 경험할 수 있는 다양한 발달 단계(stages of development)와의 비교도 제시하지 않는다.

 

이외에도 다양한 리더십 프레임워크들은 여러 단계를 제시하거나(Collins의 ‘좋은 기업을 넘어 위대한 기업으로’(Good to Great)의 다섯 단계 리더십 수준⁴¹), 리더가 삶의 과정에서 경험하는 단계를 포괄적으로 설명(Joiner & Joseph의 ‘리더십 민첩성’(Leadership Agility) 모델⁴²)하기도 한다. 그러나 대체로 의료 분야의 리더가 서로 다른 맥락에서 다양한 역량을 유동적으로 발휘할 수 있도록 개발의 여러 측면(aspects of development)을 통합적으로 제시하는 모델은 거의 없다.


3.2 통합할 프레임워크 선정(Selecting the frameworks for integration)

캐나다 보건의료 분야에서 LEADS 프레임워크는 널리 알려져 있으며 다양한 리더십 개발 프로그램의 토대가 되고 있다. LEADS는 2015년 CanMEDS 의사 역량 프레임워크의 리더 역할(Leader Role)⁴³⁻⁴⁴보다 더욱 구체적이다. 그러나 기존 모델을 검토한 결과, LEADS 프레임워크는 의료 리더의 역량(capabilities)을 체계적으로 보여주지만, 한 개인이 여러 조직적 역할(multiple organisational roles)을 동시에 수행하는 상황에는 명확히 적응할 수 없다는 한계가 있다. 즉, LEADS 프레임워크는 다양한 직급(seniority)을 동시에 가진 AHC 리더가 경험하는 맥락(context)이나 경험(experience)을 명확히 설명하지 않는다.

 

반면 Kegan의 **성인 발달 모형(adult development model)**은 LEADS 프레임워크와 상호 보완적이다. Kegan의 모형은 개인의 인지적 발달(cognitive development)에 집중하지만, 리더십 역량(capabilities)을 직접적으로 다루지는 않는다. Kegan과 동료들의 연구는 다음의 내용을 강조한다.

  • 개인이 의식 수준(orders of consciousness)을 발전시키고 다양한 방식으로 발달적 구성을 만들어가는 과정⁴⁵
  • 변화에 대한 타고난 저항(innate resistance to change)을 극복하며 조직 구성원 모두를 지원하는 문화를 형성하는 방법⁴⁶

이에 따라 본 연구팀은 이 두 프레임워크를 결합(remix) 하는 것이 AHC 리더들에게 더욱 유익하다고 판단했다.


3.3 통합된 프레임워크의 종합: LEADS와 Kegan의 결합(Synthesis of selected frameworks: LEADS meets Kegan)

『LEADS+ Developmental Model』 은 매트릭스 조직(matrix organisations) 내 리더십 발달 단계를 강조하며, 리더가 여러 리더십 정체성(multiple leadership identities)을 관리하도록 자기 성찰(self-reflection)을 촉진한다. (구체적인 모델의 단계별 사례는 **표 1(Table 1)**과 디지털 부록(Supplemental Digital Content, Appendix S1)에서 확인할 수 있다.)

 

 

이 모델은 다음과 같은 측면에서 활용될 수 있다:

  • 팀 내에서 리더들이 다양한 맥락에서 수행하는 역할을 이해할 수 있도록 지원
  • 대학 소속 교수개발팀(faculty development teams)이나 병원 관련 조직개발 부서에서 교육과정 설계(curricular design)에 이론적 기반(theoretical underpinnings)을 추가하는 데 사용
  • 개별 리더를 지원하는 코치와 멘토가 자기 성찰 도구(reflective tool)로 사용 가능

무엇보다 중요한 것은, 본 모델이 AHC 조직 내에서 리더가 리더십 효과성(effectiveness)을 높일 수 있는 기회를 강조한다는 점이다. 동시에 이 모델은 보건의료 리더십 개발 프로그램(health leadership development programmes)의 안내서로도 활용될 수 있다.¹

 


3.4 LEADS+ Developmental Model에서의 팔로워십(Followership)

『LEADS+ Developmental Model』의 기초(base)는 우리가 제안하는 **필수적 팔로워십(essential followership)**과 전략적 팔로워십(strategic followership) 개념으로 구성되어 있다. 학술 의료센터(AHCs)에서 많은 사람은 조직의 업무와 사명에 참여하지만, 리더십 역량을 발휘할 준비가 되지 않은 경우도 많다. 분산적 리더십(distributed leadership)의 개념에 따라 Dickson 등은 누구나 비공식적 리더십 역량을 발휘할 수 있으며, 리더가 되는 법을 배우는 것은 곧 팔로워가 되는 법을 배우는 것임을 강조했다.⁴⁷ 즉, 누구나 리더가 될 수 있지만, 반드시 모든 상황이나 팀, 맥락에서 모두 리더가 될 필요는 없다는 것이다. 더 적합한 사람이 리더 역할을 맡거나, 개인의 에너지나 역량이 부족할 때 개인은 **효과적인 팔로워(effective followers)**가 되어야 한다. 최근 팔로워십은 리더와 팀을 지원하는 역량으로 주목받고 있다. 일부 학자들은 수평적 조직 구조(flattened hierarchies)에서 팔로워십이라는 용어가 시대착오적이라고 비판하지만⁴⁸⁻⁴⁹, 실제로는 전략적 목표를 달성하기 위해 의도적으로 리더를 따르는 상황이 분명히 존재한다.

3.4.1 필수적 팔로워십(Essential followership)

이 단계에서 개인은 조직 내 자신의 위치를 찾고 있으며, 일상 업무를 수행하기 위해 명확한 지침(guidance)이 필요하다.
예를 들어, 심장 재활(clinical cardiac rehabilitation) 부서에 처음으로 취업하여 임상 업무를 시작한 신입 의료진(의사, 간호사)은 초기 단계에서 팀 내 다른 구성원들이 회의를 주도하고 일정 관리를 하며, 새로운 질 향상 프로젝트나 업무 프로세스를 제시하고 우선순위를 정해주기를 기대한다. 이 맥락에서 필수적 팔로워십은 매우 자연스럽고 필수적이다.
이 단계의 개인은 다음과 같은 역량을 점차 습득하게 된다:

  • 팀 내 암묵적 정보(tacit information)의 습득
  • 팀원들과의 관계 형성 및 사회적 자본(social capital)의 구축
  • 팀이 중시하는 업무를 수행하며 리더십이 필요한 영역(leadership gaps)을 발견
    그러나 초기에는 특정 업무를 명확히 부여받는 것(예: 초기 직무 기술서)이 중요하다.

3.4.2 전략적 팔로워십(Strategic followership)

많은 사람은 필수적 팔로워십 단계를 넘어, AHC 내에서 자신의 입지를 넓히고자 한다. 이 단계에서는 조직의 문화적 특성과 포용적 관행에 영향을 받기도 하지만, 개인의 리더십 열망은 조직 전략과 목표(strategy, aims and goals)에 얼마나 정렬(alignment)되는지에 따라 발전할 수 있다.

 

예를 들어, 큰 학술 부서의 책임자에게 직접 보고하는 재무 관리자(finance manager)는 조직 문화를 이해하고 고위 리더로부터 전략적 방향성을 받아, 더 적은 감독(oversight)을 받고 창의적으로 행동한다. 조직의 목표와 문화에 따라 전략적으로 행동을 조정(morph their actions)하게 된다. 예를 들면, 부서의 재무 관리자는 부서 내 비용을 전략적으로 재분배하여 조직 전략에 기여할 수 있는 영역으로 자원을 옮길 수 있다. 이를 “어느 자리에서나 리드하기(leading from any seat)” 또는 **분산적 리더십 원칙(distributed leadership principles)**의 실현으로 설명하기도 한다.⁵⁰


3.5 LEADS+ Developmental Model에서의 리더십(Leadership)

AHC 내에서 개인의 경력이 발전하면서 공식적(formal) 리더십 역할을 맡게 되는 단계로 진입할 수 있다. 본 모델에서는 이러한 공식적 리더십을 두 가지 유형으로 나눈다:

  • 역할 기반 리더십(Role-based leadership)
  • 복잡성 기반 리더십(Complexity-based leadership)

모델의 구성 요소들이 상호작용하는 모습은 그림 2(Figure 2)에 제시되어 있다.

 

3.5.1 역할 기반 리더십(Role-based leadership)

역할 기반 리더는 자신의 직함(title)의 범위와 역할의 경계(boundaries and mandate) 내에서 행동한다. 공식적 리더십(formal leadership)이라고도 불리는 이 유형의 리더는 자신의 역할에 따라 타 집단과의 관계를 정의한다.

 

예를 들어, 학과장(department chair)은 높은 **상호적 상호성(interpersonal mutuality, Kegan)**을 나타낸다. 이 용어는 개인이 자신의 인식(perceptions of themselves)에 따라 타인과의 관계에서 상호작용하는 방식을 의미한다. 역할 기반 리더는 자신의 위치를 정체성(identity)으로 삼고 타 집단과 상호 이익(mutually beneficial)을 추구하게 된다. 예를 들어 학과장은 학과 구성원의 시간을 보호하기 위해 타 부서의 비합리적인 요구를 방어할 수 있다.

 

역할 기반 리더는 자기 팀의 성취를 통한 성공(achievement orientation)을 추구하지만, 다른 부서와의 협력이 자신의 위상을 낮추는 상황에서 어려움을 겪을 수 있다. 직선적(linear), 계층적(hierarchical) 구조를 강조하는 조직은 개인을 역할 기반 리더십의 경직된 자세로 몰아갈 수 있으며, 창의성과 반응성을 억압(stifle)할 위험이 있다.

3.5.2 복잡성 기반 리더십(Complexity-based leadership)

LEADS+ 프레임워크에서 복잡성 기반 리더는 **하나의 정체성을 넘어 여러 역할을 통합적으로 조정하고 관리(reconcile)**한다. 이는 "모든 자리에서 리드하기(leading from every seat)"⁴⁷와도 연결되며, 특히 복잡한 환경에서 집합적 리더십(collective leadership), 분산적 리더십(distributed leadership)이 더 효과적임을 인정한다.⁵¹

 

이들은 **자신의 리더십 역할을 스스로 창조(self-author)**하며, AHC 내의 다양한 사람들을 연결하고, 조직을 넘나드는 문제를 해결하며, 여러 그룹이 경쟁 없이(non-competitive) 공동으로 성공하도록 돕는다. 예컨대 혁신과 연구 담당 부사장(vice-president of innovation and research)은 임상가, 병원 행정가, 교수로서의 역할을 통합하여 정부 지원금을 확보하기 위한 다양한 이해당사자(knowledge users) 간의 연합(coalition)을 구성할 수 있다.

 

복잡성 기반 리더는 공통된 가치(commonalities)를 기반으로 전통적으로 분리된 집단(silos) 간의 벽을 허물고 효과적인 연합(coalitions)을 만든다. 이들은 주로 이전에 공식적인 역할 기반 리더십을 경험했으나, 공식적 직함에 한정되지 않는다. 조직 구조와 과정을 잘 이해함으로써 복잡한 비선형(non-linear) 시스템을 활용하여 AHC가 보다 탄력적(resilient)이 되도록 돕는다.

 


3.6 다재다능함(Versatility): 리더십과 팔로워십의 통합

다재다능한(versatile) 리더는 상황이나 필요에 따라 리더십과 팔로워십 특성을 유연하게 조정한다. 이들에게는 이미 역량이 갖추어져 있을 수 있지만, 적절한 맥락에서 그것을 드러내는 것이 중요하다. 예를 들어, 임상과 학술 업무가 동시에 중단된 글로벌 팬데믹 상황에서 학과장(department chair)은 학술 부서 리더로서 주도적으로 행동하는 동시에, 임상 팀의 일원으로서 팔로워 역할도 수행하면서 여러 부서를 넘나들 수 있다.

 

이러한 유연한 역할 전환(versatility to transition) 능력은 개인이 다른 사람들과 협력하고, 더 큰 목표와 과정(process)을 위해 꼭 필요한 역할을 할 수 있게 돕는다. 개인이 발달 과정에서 각종 이정표(milestones)를 통과하면서 과거에 습득한 역량을 잃지 않는 것처럼, 본 논문에서는 다재다능성(versatility)을 동일하게 개념화한다.


즉, 리더십과 팔로워십 역량이 한 번 습득되면 개인은 자신이 처한 맥락에 따라 이 역량을 자유롭게 발휘할 수 있다(상황적 리더십 이론(situational leadership)과 연관됨).²¹


3.7 지식 사용자 협의 결과(Knowledge user consultation findings)

지식 사용자 협의 과정에서 모집된 65명 중 29명(응답률 44.6%)으로부터 본 개념 모델에 대한 피드백을 받았다. 응답자의 약 1/3(10명, 34%)은 선임저자와 1대1 인터뷰를 통해 구술 피드백을 제공하였다.

  • 대다수 응답자는 학술 및 의료 현장에서 복수의 리더십 역할(multiple leadership roles)을 수행 중이었다(48.3%, n=14).
  • 응답자의 1/4 이상이 의료 네트워크나 국가 학회에서 고위 리더십 역할을 맡고 있었다(27.5%, n=8).

응답자의 모델 지지 수준은 10점 만점에서 평균 **7.93점(SD 1.7)**으로 높았다(1=매우 싫어함, 10=매우 좋아함). 많은 응답자가 이 프레임워크가 자신들과 **공명(resonate)**한다고 느꼈다.
한 응답자는 이 모델을 다음과 같이 표현했다:

📌 “포괄적이고(comprehensive), 발달적(developmental)이며, 지향적(aspirational)이다.”

 

인터뷰에 참여한 모든 응답자는 본 모델이 리더십 개발자(leadership developer) 또는 현장 리더(practicing leader)로서 매우 유용하다고 평가했다. 큰 변경 제안은 없었으나, 다수는 본 프레임워크를 자신들의 리더십 프로그램이나 실무에서 어떻게 활용할지에 대한 다음 단계의 아이디어를 제시했다.

 

 

 


4. 논의(DISCUSSION)

본 논문은 학술 의료센터(AHC)의 복잡성(complexities)에 적합한 개념적 리더십 모델을 제안하며, 지배적인 리더십 프레임워크(LEADS)와 심리적 발달 이론(Kegan의 발달 이론)을 통합했다. 이를 **『LEADS+ Developmental Model』**이라 명명하였다.

 

이 모델은 많은 조직이 구성원들에게 가지고 있지만 명확히 표현하지 않았던 문화적 기대(cultural expectations)와 행동 규범(codes)을 투명하게 드러낸다. 지식 사용자 협의 결과, 많은 응답자는 이 모델이 자신들의 경험과 공명하고, 리더십 경로를 지도하거나 코칭하는 데 유용할 것이라고 평가했다. 특히 **리더십 개발 및 훈련을 강화함으로써, 소수집단(underrepresented groups)의 리더십 성취와 가시성을 높일 수 있다.**⁵²⁻⁵⁴


4.1 현장 적용을 위한 함의(Implications for the field)

본 모델은 교육 프로그램을 위한 안내서 또는 진단 도구(diagnostic tool)로서 리더십 발달의 각 단계에 필요한 역량(capabilities)을 맞춤형(tailored)으로 제시한다. 또한, AHC의 인적자원 측면에서는 조직의 부서나 프로그램에서 필요한 팔로워 및 리더의 표현형(phenotypes)을 식별(mapping)하는 데 활용할 수 있다.

 

즉, 단일 리더 구조(singular leader construct)를 가정하고 팀원의 기술적 전문성만으로 팀을 구성하는 대신, 조직은 각 리더십 역할에서 요구되는 구체적인 역량에 더욱 주의를 기울일 수 있다.


5. 연구의 한계(LIMITATIONS)

본 연구는 통합적 개념 리뷰(integrative conceptual review) 방식으로 진행되었다. 따라서 『LEADS+ Developmental Model』은 향후 연구 및 개발 과정에서 계속 진화할 것이다.

본 모델은 지식 사용자들의 피드백을 반영했지만, 많은 기본 가정(assumptions)에 대한 경험적 근거(empirical evidence)는 부족하다. 따라서 향후 다양한 환경에서 모델의 타당성(validity)을 입증하는 연구가 필요하다. 또한, 협의 과정에서 북미의 학술의료센터(AHC)의 리더십 맥락만을 반영하여 충분한 이론적 포화(theoretical sufficiency)를 달성했는지 확실하지 않으며, 의견의 균형(balance)과 완전성(completeness)을 모두 확보했다고 보기 어렵다.

협의 과정에서 지적된 본 모델의 구체적인 한계는 다음과 같다:

  1. 모델의 높은 복잡성(high complexity)
  2. 다른 기존 리더십 모델과의 유사성(similarity)
  3. 모델을 지원하는 평가 도구(assessment tools)의 부재
  4. 개인이 의도하는 리더십 역량과 모델의 함의된 궤적(implied trajectory)이 반드시 일치하지 않을 수 있음
  5. 모델 내에서 역량 강화(capacity-building)에 대한 명확한 언급 부재
  6. 의사 중심적(physician-centric) 모델이라는 인식

6. 결론(CONCLUSION)

본 논문에서 제안한 『LEADS+ Developmental Model』 은 지배적인 리더십 모델인 LEADS 프레임워크와 **Kegan의 심리적 발달 단계(psychological development stages)**를 통합한 것이다.

지식 사용자들의 협의 결과를 바탕으로 볼 때, 본 모델은 복잡한 학술의료 시스템(complex academic health systems) 내 리더들에게 필요한 팔로워십(followership)과 리더십(leadership) 역량을 효과적으로 설명하고 진단하는 데 도움을 줄 수 있다.

 

 

Med Educ. 2023 Sep;57(9):857-869. doi: 10.1111/medu.15062. Epub 2023 Mar 14.

LEADS+ Developmental Model: Proposing a new model based on an integrative conceptual review

 

+ Recent posts