Perspect Med Educ. 2024 Feb 6;13(1):95-107. doi: 10.5334/pme.962. eCollection 2024.

Evaluating Competence by Design as a Large System Change Initiative: Readiness, Fidelity, and Outcomes

 

캐나다의 거대한 실험: 역량 바탕 의학 교육(CBD)은 과연 성공했을까?

안녕하세요! 오늘은 의학교육 분야에서 가장 큰 규모의 변화 중 하나로 꼽히는 캐나다의 Competence by Design (CBD), 그리고 그 거대한 변화를 어떻게 평가하고 있는지 다룬 따끈따끈한 논문을 소개해 드리려고 합니다.

캐나다 왕립 내과 및 외과 대학(Royal College)이 주도한 CBD는 전공의 교육을 시간 중심에서 역량 바탕 의학 교육(Competency-Based Medical Education, CBME)으로 완전히 뜯어고치는 대규모 프로젝트였죠.

하지만, 시스템을 바꾸는 것만큼이나 중요한 게 바로 "제대로 바뀌고 있는지 확인하는 것" 아니겠어요? 🤔 이 논문은 바로 그 평가 전략과 초기 결과에 대한 아주 솔직한 보고서입니다.


1️⃣ 거대한 변화, 어떻게 평가할까? (The 3 Pillars)

연구진은 이 복잡한 변화를 평가하기 위해 세 가지 기둥(Three Pillars)을 세웠습니다. 무작정 결과만 보는 게 아니라, 단계별로 꼼꼼히 뜯어보겠다는 거죠.

🏛️ 첫 번째 기둥: 실행 준비도 (Readiness to Implement)

가장 먼저, 수련 프로그램들이 이 새로운 제도를 받아들일 마음의 준비(의지)와 능력(행동)이 되었는지 평가했습니다. 준비가 안 된 상태에서의 변화는 실패할 확률이 높으니까요.

🏛️ 두 번째 기둥: 실행의 충실도와 진정성 (Fidelity and Integrity)

이 부분이 이 논문의 핵심 포인트 중 하나입니다! 단순히 매뉴얼대로 했느냐(Fidelity, 충실도)를 넘어, 제도의 취지를 제대로 살리고 있느냐(Integrity, 진정성)를 구분해서 봤다는 점이에요.

연구진은 이렇게 말합니다.

"프로그램이 CBD의 모든 필수 구성요소를 실행했을 수 있지만(즉, 충실도를 달성함), CBD의 진정한 의도를 실현하지 못했을(즉, 진정성을 달성하지 못함) 가능성이 예상되었습니다."

"In implementing CBD, therefore, it was anticipated that a program could have implemented all required components of CBD (i.e., achieved fidelity) but without having realized the true intention of CBD (i.e., achieved integrity)."

즉, 겉모양만 갖추고 속은 그대로인 경우를 경계한 것이죠.

🏛️ 세 번째 기둥: 성과 (Outcomes)

마지막으로, 정말로 전공의들이 진료할 준비가 더 잘 되었는지, 그리고 궁극적으로 환자 진료에 도움이 되는지를 봅니다. 물론, 환자 결과까지 연결하는 건 장기적인 과제겠죠? ⏳


2️⃣ 솔직한 중간 성적표: 이상과 현실 사이 📉

2017년부터 2023년까지의 데이터를 분석한 결과는 어땠을까요? 긍정적인 변화도 있었지만, 뼈아픈 현실도 드러났습니다.

✅ 긍정적인 신호

많은 프로그램 리더들이 "교육과정이 더 유연해지고, 피드백이 많아졌다"고 평가했습니다. 특히 역량 위원회(Competence Committee)를 통해 더 객관적인 승급 결정이 내려지고 있다는 점은 고무적입니다.

⚠️ 우려되는 신호: "Bolt-on" 현상

하지만 연구진은 꽤 충격적인(혹은 우리 모두 공감할만한) 현상을 발견했습니다. 바로 "Bolt-on(억지로 덧붙이기)" 현상입니다. 기존 교육과정은 그대로 둔 채, CBD가 요구하는 평가 절차만 억지로 끼워 넣은 곳들이 많았다는 거죠.

연구진의 날카로운 지적을 보시죠.

"일부 프로그램에서 실행이 전환이라기보다는 필수 절차들의 내키지 않는 '억지로 덧붙인 것(bolt-on)'을 더 닮았음을 시사합니다."

"Implementation has resembled less of a transformation and more of a reluctant 'bolt-on' of required processes in some programs."

😫 현장의 고충: EPA와 포트폴리오

특히 위임 가능 전문 활동(Entrustable Professional Activities, EPA) 평가가 "체크박스 채우기"로 전락하거나, 전공의들이 교수님을 쫓아다니며(chasing) 서명을 받아야 하는 행정적 부담이 되었다는 지적도 있었습니다. 이는 오히려 전공의들의 웰니스(Wellness)를 해치는 결과로 이어지기도 했고요.


3️⃣ 앞으로 나아갈 길 🚀

결국, 제도를 도입한다고 해서 문화가 하루아침에 바뀌지는 않는다는 것이 이 논문의 결론입니다.

연구진은 이렇게 강조합니다.

"복잡하고 시스템 전반에 걸친 전환은 하룻밤 사이에 일어나지 않으며, 오히려 시간이 지남에 따라 전개되는 발달 궤적을 따릅니다."

"Complex, system-wide transformations do not happen overnight but rather follow a developmental trajectory that unfolds over time."

 

그리고 문화 변화를 위해서는 끈기가 필요하다고 덧붙입니다.

"문화 변화는 시간이 걸리고 전환 과정을 통한 지속적인 집단적 노력이 필요할 것으로 보입니다."

"It seems that culture change will take time and a sustained collective effort through the transformation process."


📝 요약하며

이 논문은 단순히 캐나다의 사례를 넘어, 의학교육 혁신을 꿈꾸는 모든 이들에게 중요한 메시지를 던집니다.

  1. 준비도(Readiness)를 꼼꼼히 챙겨라.
  2. 형식(Fidelity)보다 본질(Integrity)을 추구해라.
  3. 변화는 긴 여정(Journey)임을 받아들여라.

우리나라 의학교육 현장에서도 새로운 제도를 도입할 때, 그것이 혹시 'Bolt-on'에 그치고 있지는 않은지 되돌아볼 수 있는 좋은 거울이 되는 논문이었습니다. 🪞

더 자세한 내용이 궁금하신 분들은 원문을 꼭 읽어보시길 추천드립니다!


서론 (Introduction)

Competence by Design (CBD)는 캐나다 전역의 전문의 의학 교육(specialty medical education)에 역량 바탕 의학 교육(competency based medical education, CBME)을 도입하는 것을 목표로 하는(aimed at) 주요한 변화 이니셔티브(major change initiative)입니다 [1]. CBME는 의료 제공의 질(quality of health care provision)과 전통적인 전공의 수련 구조의 부적절성(inadequacies of traditional postgraduate training structures)에 대한 광범위한 우려(broad concerns)에서 탄생했습니다 [2, 3, 4]. CBME에서, 수련 중인 보건 의료 전문가(health professionals in training)의 역량의 발전(progression of competence)은 환자와 대중의 요구를 충족시키기 위해(to meet the needs of patients and the public) 명시적으로 기술되고 설명됩니다(explicitly described and accounted for) [5, 6]. CBD는 캐나다 왕립 내과 및 외과 대학(Royal College of Physicians and Surgeons of Canada, 이하 Royal College)의 CBME 모델(Royal College’s model of CBME) [7]이며, 졸업하는 의사들의 역량과 기술(competencies and skills of graduating physicians)이 사회의 진화하는 요구(evolving needs of society)와 일치하도록 보장함으로써(by ensuring that... match) 캐나다인의 건강과 의료를 개선하는 것(improving the health and health care of Canadians)을 전체적인 목표(overall goal)로 삼고 있습니다.

 

Royal College67개 모든 내과, 진단검사의학과, 외과 전문 과목(가정의학과 제외)에 걸쳐 캐나다 수련 프로그램의 표준 설정(standard setting) 및 인증(accreditation), 그리고 의사 수련생(physician trainees)의 자격 인증(certification)을 담당합니다(responsible for). CBD가 출범할 당시(At the time of CBD’s launch), 캐나다 전역에서 약 13,000명의 수련생이 등록되어 있었습니다 [8]. 시간 기반 모델(time-based model)에서 벗어나 학습자의 성장과 발달을 의도적으로 촉진하도록 설계된(designed to deliberately foster learner growth and development) 모델로 이동하는 것을 수반한(entailed) CBD의 실행(implementation of CBD)은 캐나다 설립 이래 대학원 의학 교육(postgraduate medical education)에서 가장 큰 변화(largest change)였습니다 [9]. 이러한 실행은 Royal College, 전공의 수련 기관(postgraduate training institutions), 그리고 개별 전공의 수련 프로그램(individual postgraduate training programs)으로부터 상당한 자원 투자(significant investment of resources)를 요구했습니다. 따라서 CBD의 실행에 관련된 모든 사람들(all those involved)이 프로그램 평가에 대한 견고하고 체계적인 접근(robust and systematic approach to program evaluation)에 참여하는 것은 의무였습니다(incumbent upon). Royal College는 Yarborough 등이 제시한 프로그램 평가의 정의를 활용했습니다:

"의사결정(decision-making), 판단(judgments), 결론(conclusions), 발견(findings), 새로운 지식(new knowledge), 조직 개발(organizational development), 그리고 확인된 파트너들의 요구에 대응한 역량 강화(capacity building in response to the needs of identified partners)를 목적으로,
프로그램 및/또는 그 구성요소의 (quality of programs and/or their components)을 체계적으로 조사(systematic investigation)하는 것이며,
이는 사용자들의 프로그램과 시스템 내에서의 개선(improvement) 및/또는 책무성(accountability)으로 이어지고,
궁극적으로 조직적 또는 사회적 가치(organizational or social value)에 기여한다" [10].

 

이 평가에는 프로그램의 질이 시스템 내의 서로 다른 사람들에게 서로 다른 것을 의미하며(means different things to different people), 과정과 결과(process and outcomes) 모두에 상대적이라는 이해가 내재되어 있습니다(embedded in) [11]. 이 정의는 다양한 렌즈를 통해(through multiple lenses) 프로그램의 질을 이해하고, 향후 프로그램의 수정과 개선(program adaptation and improvement moving forward)에 정보를 제공하는 데 초점을 맞추고 있어 선택되었습니다.

 

Karpinski 등 [12]이 설명한 바와 같이, 국가적 차원의 CBD 전환의 규모와 복잡성(size and complexity of the national CBD transformation)은 과소평가될 수 없으며(cannot be understated), 실행은 수년에 걸쳐 반복적으로(iteratively over many years) 발생하고 수많은 파트너 그룹과 수천 명의 수련생 및 임상의사들이 관여합니다. 복잡하고 시스템 전반에 걸친 전환(Complex, system-wide transformations)은 하룻밤 사이에 일어나지 않으며(do not happen overnight), 오히려 시간이 지남에 따라 전개되는(unfolds over time) 발달 궤적(developmental trajectory)을 따릅니다 [13]. 또한 이는 정책과 절차(policies and procedures)를 실행하는 것뿐만 아니라 일선 교수진(front-line faculty)과 수련생들의 활동, 역량, 사고방식(mindsets) 수준에서 풀뿌리 차원의 변화(grassroots change)를 이끌어내려는 교육 리더들의 노력에 달려 있습니다(dependent on) [14]. 평가의 과제(evaluation challenge)는 현장에서 일어나고 있는 변화의 본질(nature of the change as it was happening on the ground)을, 원하는 전환(desired transformation)을 향한 깊은 통찰력(deep insights)과 시의적절한 경로 수정(timely course corrections)을 가능하게 하는 방식(in a fashion that allowed for)으로 포착하는 것이었습니다. 이러한 과제를 충족하고 CBD 평가를 가이드하기 위해, CBD 프로그램 평가 전략(CBD Program Evaluation Strategy, PES)이 개발되었으며, 세 가지 주요 목표가 확인되었습니다:

  1. CBD의 성공적인 실행을 지원하기 위해(To support successful implementation of CBD): 목표는 성공적인 실행을 지원하거나 저해하는 전략(strategies that support or hinder)에 대한 이해를 발전시키는 한편, 의도한 대로(as intended) 성공적으로 전환을 달성하고 CBD를 실행하는 역량(capacity)에 지역 및 전문과목 특이적인 맥락적·문화적 요인(local specialty-specific contextual and cultural factors)이 미치는 영향을 조사하는 것이었습니다.
  2. 시간에 따른 CBD 영향의 근거 기반을 구축하기 위해(To build an evidence base of the impact of CBD over time): 목표는 CBD 실행의 의도된 결과와 의도하지 않은 결과(intended and unintended outcomes) 모두를 측정하고 모니터링하여 Royal College의 이론적 이해(theoretical understanding)를 향상시키는 것이었습니다. 구체적으로
    1. a) CBD가 어떻게 영향을 미쳤는지(how CBD has had impact),
    2. b) 어떻게 하면 가장 효과적으로 작동하게 만들 수 있는지(how it could be made to work most effectively),
    3. c) 난관에 대응하여(in response to challenges) 이 모델과 다른 CBME 모델들의 반복적인 수정(iterative adaptation)에 정보를 제공하는 것입니다.
  3. CBD 평가에 초점을 맞춘 실천 공동체를 육성하기 위해(To foster a community of practice focused on evaluating CBD): CBD 실행이 국가, 기관, 전문과목, 개별 프로그램 수준(national, institutional, specialty, and individual program levels)에서 수많은 파트너를 포함할 것임을 인식하고, 목표는 프로그램 평가에 대한 다양한 노력(diverse efforts)을 하나로 모아 그것들이 서로를 지원하고 그 위에 구축될 수 있도록 보장하는 것이었습니다.

이러한 대규모 전환(such a large-scale transformation)을 위한 프로그램 평가에 가장 잘 접근하는 방법에 대한 구체적인 청사진(specific blueprint)은 없습니다 [15, 16, 17]. 오히려, 교훈(lessons learned)이 모든 전문과목에 걸친 CBD의 지속적인 전개(ongoing rollout)에 체계적으로 통합될 수 있도록(systematically incorporated) 보장하기 위해 프로그램 평가 전략과 장기 계획(long-term plan)이 필요했습니다. 본 논문은 전반적인 프로그램 평가 설계 및 전략(overall program evaluation design and strategy)을 설명합니다. 예비 결과(Preliminary findings)는 예상된 이점과 예상치 못한 결과(anticipated benefits and unanticipated consequences)를 모두 포함하여 상당한 수준의 변화가 진행 중(significant degree of change is underway)임을 시사합니다. 그러나 원하는 시스템 전환(desired system transformation)을 달성하는 것은 잠재적인 과제(potential challenge)로 떠오르고 있습니다. 우리는 Royal College의 지속적인 프로그램 평가 전략이 실행을 향한 여정(journey to implementation)에 대해 어떻게 통찰력을 제공해왔는지 설명합니다.

CBD 프로그램 평가 로직 모델 (CBD program evaluation logic model)

CBD 프로그램 평가 설계를 위한 정보를 제공하고(To inform the design) 이니셔티브의 규모를 포착하기 위해(capture the scale of the initiative), 2017년에 로직 모델이 생성되었습니다 (그림 1 참조) [18]. 로직 모델은 투입(inputs), 프로그램 활동(program activities), 결과(outcomes) 사이의 연결(linkages)을 나타내며 프로그램이 어떻게 작동해야 하는지(how a program is supposed to work)를 보여주는 다이어그램입니다 [19, 20, 21]. 이는 프로그램 모델에 대한 공유된 이해(shared understanding)를 형성하기 위해 프로그램 평가에서 흔히 사용됩니다.

 

[그림 1 Competence By Design Program Evaluation Logic Model (CBD-PELM) ]


[테두리 및 배경 요소: 외부 환경]

  • 상단: 전공의 교육의 변화하는 맥락 (Changing Context of Residency Education)
  • 좌측: 변화하는 환자 진료 요구와 의료 시스템 (Changing patient care needs and healthcare system)
  • 우측: 교육 이론과 실제의 발전 (Advances in educational theories and practice)

[상단 및 중앙: 목표와 성과 (Goals and Outcomes)]

*(점선 박스 상단 표시: Royal College는 기여적 영향력(CONTRIBUTING INFLUENCE)*을 가짐)

전략적 목표 (STRATEGIC GOAL) 캐나다인의 건강과 의료를 개선하는 것 (To improve the health and healthcare of Canadians)

주요 성과 (KEY OUTCOMES)

  • 장기 (Long-term, 7-10년)
    • 향상된 환자 진료 성과 (Enhanced patient care outcomes)
  • 중기 (Medium-term, 4-6년)
    • 향상된 진료 준비도 (Enhanced readiness for practice)
    • 프로그램 변화의 지속가능성 (Sustainability of program changes)
  • 단기 (Short-term, 1-3년)
    • 역량의 점진적 발달(progressive development of competence)을 촉진하는 평가 시스템과 관행
    • 학습자의 요구에 개별화된 교육(Teaching that is individualized)
    • 자기조절 학습(self-regulated learning)과 평생 학습(life long learning) 역량을 보여주는 학습자

[하단: 투입, 활동, 산출 (Inputs, Activity, Output)]

1. 투입 (INPUTS) *(하단 표시: Royal College는 감독 권한(OVERSIGHT)*을 가짐)

  • Royal College – 주요 이니셔티브 (Key Initiatives)
    • 전문과목 교육 설계 과정 (Specialty education design process)
    • 평가 전략 (Assessment strategies)
    • 변화 관리 전략 (Change management strategy)
    • 교수 개발 (Faculty development)
    • 인증 개혁 (Accreditation reform)
    • CanMEDS 2015 프레임워크 (CanMEDS 2015 framework)

2. 활동 (ACTIVITY)

  • Competence by Design
    • 캐나다 전역의 전공의 수련(residency training)에 역량 바탕 의학 교육(competency-based medical education) 접근법을 실행하는 것을 목표로 하는 다년 간의 변화 과정(Multi-year change process).

3. 산출 (OUTPUT) *(하단 표시: Royal College는 직접적 영향력(DIRECT INFLUENCE)*을 가짐)

  • 역량 바탕 – 전공의 교육 (Competency based – Residency Education)
    • 모든 교육과정 요소(교육, 학습 및 평가 관행)가 진료에 필요한 역량의 발달적 습득(developmental acquisition of competencies)을 촉진하기 위해 명시적이고 체계적으로 순서화된(explicitly and systematically sequenced) 전문과목 수련 프로그램.

 

 

CBD 프로그램 평가 로직 모델(CBD-PELM)(그림 1)은 투입(inputs)으로 분류된 주요 이니셔티브들이 어떻게 CBD의 채택과 실행(adoption and implementation)을 촉진하는지를 보여줍니다. 결과적으로(In turn),

  • CBD의 실행은 모든 전문과목 프로그램의 모든 교육과정 요소(all curricular elements)가 역량의 점진적 발달(progressive development of competencies)을 지원하도록 정렬되는(aligned) 산출물(output)로 이어지도록 의도되었습니다.
  • 시간이 지남에 따라, 이러한 정렬은 "변화하는 환자 진료와 다양한 인구 집단의 건강 요구를 더 잘 충족시킨다(to better meet changing patient care and the health needs of diverse populations)"전략적 목표(strategic goal)와 연결되는 주요 단기, 중기, 장기 성과(key short-, medium-, and long-term outcomes)의 생산으로 이어져야 합니다. 이 진술은 CBD 실행의 전반적인 의도된 영향(overall intended impact)을 반영했습니다.

이니셔티브의 범위를 고려할 때, CBD-PELM은 또한 경계(boundaries)를 묘사하여, 변화를 시작하는 데 있어(initiating the change) Royal College가 직접적인 감독 권한(direct oversight)을 가진 곳과 실제 CBD 채택에 있어 영향력(influence)을 가진 곳을 표시했습니다. 이러한 경계는 Royal College의 이니셔티브가 성과에 어떻게 기여할 것으로 예상되는지(expected to contribute to outcomes)를 묘사하는 데 도움을 주었으며, 프로그램 평가를 수행하는 데 파트너들 간의 광범위한 협력(extensive collaboration among partners)이 필요함을 보여주는 데 도움이 되었습니다. 또한, CBD-PELM은 CBD의 실제 실행에 결정적인(critical to the actual implementation) 수많은 파트너들과, 장기적인 성과의 실현(realization of longer-term outcomes)이 의료 시스템 수준에서의 시너지(synergy at the level of the health care system)를 필요로 한다는 점을 강조합니다(underscores). 더 나아가, CBD-PELM은 평가 전략의 진화(evolution of the evaluation strategy) 과정에서 반드시 고려되어야 할(must be accounted for) 3가지 주요한 더 넓은 요인들의 영향력을 인정합니다:

  • 변화하는 환자 진료 요구(changing patient care needs),
  • 전공의 교육의 변화하는 영향과 트렌드(changing influences and trends in residency education), 그리고
  • 교육 이론과 실제의 전반적인 발전(overall advances in educational theory and practice).

이것들은 모델 내에서 CBD의 실행과 평가 전략 모두를 형성하는 힘(forces shaping both)으로서 경계(borders)로 존재합니다.

 

이 로직 모델을 바탕으로(On the basis of), Royal College는 전반적인 "작동 이론(theory of action)", 즉 CBD 프로그램 모델이 어떻게 원하는 변화를 가져오도록 의도되었는지(how... was intended to bring about the desired change)를 명시적으로 진술했습니다 [22]:

  • 명시적인 일련의 학습 경험(explicit sequence of learning experiences), 교수 방법(instructional methods), 평가 관행(assessment practices)을 진료에 필요한 역량(competencies required for practice)과 체계적으로 정렬함(systematically aligning)으로써, CBD는 진료 현장에 진입(enter into practice)하고 양질의 환자 진료를 제공할 준비가 더 잘 된 학습자의 발달을 가능하게 합니다.

로직 모델을 사용하는 것은 Royal College가 시간에 따른 CBD의 의도(intention of CBD over time)를 보여줄 수 있게 했습니다. 또한 이는 국가 기관(national organization)으로서 Royal College가 국가 수준의 데이터를 수집(collecting national-level data)하는 동시에, 시간이 지남에 따라 캐나다 수련 프로그램과 기관들의 변화를 시작하고, 지원하며, 모니터링할 수 있는 고유한 역할(unique role)을 가지고 있음을 확인하는 데 도움이 되었습니다. 하지만, 실질적인 실행에 대한 책임(responsibility for actual implementation)은 개별 기관과 전공의 교육 프로그램에 있었습니다(lay with).

 

CBD-PELM에 정보를 얻어(Informed by), 평가 전략은 다음 섹션에서 설명되는 바와 같이 세 가지 기둥(three pillars)에 걸쳐 개념화되었습니다.

CBD 평가의 세 가지 기둥 (The three pillars of CBD evaluation)

전체적인 프로그램 평가 전략(overall program evaluation strategy)은 의사결정의 목적을 위해(for the purposes of decision-making) CBD에 관한 구체적인 질문에 답하는 데 도움을 주도록 의도되었습니다(intended to help answer specific questions):

  • 실행 전략(implementation strategy)에 변화가 필요한가?
  • 실행 후 어떤 수정(adaptations)이 필요한가?

CBD-PELM에 정보를 얻어(Informed by), CBD의 채택(adoption of CBD)은 세 가지 중복되지만 뚜렷하게 중요한 단계들(three overlapping but distinctly important phases)을 포함하는 것으로 구상되었습니다(envisioned to encompass).

  • 프로그램 전개(program rollout)가 시작됨에 따라, 프로그램 평가 전략(PES)은 프로그램과 조직이 실행할 준비가 되었는지의 정도(extent to which... were ready to implement)에 초점을 맞추었습니다.
  • 전개가 계속됨에 따라, 프로그램들이 CBD를 의도된 대로 실행하고 있는지의 정도(extent to which... were implementing CBD as intended)가 다음 관심의 중심(next center of attention)이 되었습니다.
  • 시스템 전반에 걸쳐 실행이 추진력을 얻으면서(gathered momentum), 의도된 것과 의도하지 않은 것(both intended and unintended) 모두를 포함한 성과를 포착하는 것(capturing outcomes)이 평가의 마지막 영역으로 확인되었습니다.

결과적으로, 평가는 실행 준비도(readiness to implement), 실행의 충실도와 진정성(fidelity and integrity of implementation), 그리고 CBD의 성과(outcomes of CBD)라는 세 가지 기둥으로 조직되었습니다. 이 세 가지 기둥은 실행 준비(preparing to implement)에서부터 결과적인 영향(resultant impacts)으로 이동하는 뚜렷하게 상호 관련된 단계(distinctly interrelated phases)로서, 이 각각의 핵심 영역에 초점을 맞춘 우선순위 평가 프로젝트(priority evaluation projects)를 가이드하는 데 도움을 주기 위해 선택되었습니다.

 

각 기둥에 대해, 단일한 방법이나 접근법(no single method or approach)이 사용되지 않았습니다; 오히려, 수정과 개선을 위한 영역을 식별(identify areas for adaptation and improvement)하고, 시간이 지남에 따라 CBD의 영향을 이해(understand the impact of CBD over time)하는 데 도움을 주기 위해 일련의 전략들(a set of strategies)이 의도적으로 선택되었습니다. 그 핵심에서(At its core), PES는 활용 중심 평가(utilization-focused evaluation) [23]로 설계되었는데, 이는 CBD의 실행과 반응적 수정(responsive adaptation)에 있어 의사결정에 정보를 제공하고 성과를 개선(inform decisions and improve performance)하기 위해 계획되고 제정되었다는 점에서 그렇습니다.

실행 준비도 (Readiness to implement)

실행 준비도(Readiness to implement)조직(이 경우에는 수련 프로그램)이 혁신을 채택할 의지가 있고(willing [심리적으로 준비된, psychologically prepared]) 능력이 되는(able [행동적으로 준비된, behaviourally prepared]) 정도(extent)입니다 [24].

  • 조직적 준비도(organizational readiness)가 높을 때, 파트너들과 투자된 다른 사람들(partners and invested others)은 노력을 기울이고(exert effort), 변화를 시작하며(initiate change), 도전에 직면하여 끈기 있게 지속할(persist in the face of challenges) 가능성이 더 높으며, 이는 궁극적으로 성공적인 실행의 가능성을 높입니다(increases the likelihood of successful implementation) [25].
  • 변화에 대한 충분한 조직적 준비도가 확립되지 않았을 때, 주요 변화 이니셔티브(major change initiatives)는 실패할 가능성이 더 높습니다 [26].
  • 조직적 준비도는 혁신의 성공적인 실행에 필수적이며 하류 성과의 핵심 매개변수(key mediator of downstream outcomes)이므로 [27], Royal College는 또한 CBD 실행과 성과 사이의 연결고리(link between CBD implementation and outcomes)를 명확히 하기를 희망했습니다.

수련 프로그램들이 CBD를 효과적으로 실행할 준비가 되도록 보장하기 위해(to ensure that training programs were ready) 상당한 시간과 자원이 투자되었습니다 [28]. 그러나 프로그램 수준에서 CBD의 성공적인 실행에 기여할 요인(factors that would contribute to successful implementation)이나 수련 프로그램들이 CBD를 시작할 준비가 되었는지에 대해 어떻게 인식하는지(how training programs perceived their readiness)에 대해서는 거의 알려진 바가 없었습니다(little was known). 프로그램 준비도에 대한 평가는 프로그램의 구체적인 역량 강화 전략(specific capacity-building strategies)과 구체적인 자원 및 인프라 요구(specific resource and infrastructure needs)를 식별하는 데 도움을 주기 위해 우선순위가 지정되었습니다.

 

프로그램 준비도를 조사하기 위해(To examine program readiness), Royal College는 Scaccia 등의 연구 [29]를 참고하여 그들의 R = MC2 프레임워크를 활용했습니다 [30]. 이 개념적 모델에서, 준비도는

  • 혁신을 실행하려는 조직의 동기(organization’s motivation),
  • 변화에 대한 조직의 일반적인 역량(general capacities of the organization for change), 그리고
  • 특정 혁신에 요구되는 혁신 특이적 역량(innovation-specific capacities)의 산물(product)입니다.

각 구성요소는 체계적으로 평가될 수 있는 준비도의 매개변수 세트(set of mediators of readiness)를 나타냅니다. 이 프레임워크를 사용하여, 우리는 주로 설문조사를 통해(primarily via surveys) 프로그램 간의 자가 보고된 준비도(self-reported readiness)를 평가했습니다. CBD 실행 전 2년 이내의 모든 프로그램의 책임자(Program directors)들이 연례 설문조사에 참여하여 프로그램의 동기, 변화에 대한 일반적 역량, 그리고 혁신 특이적 역량을 파악하고자 했습니다. 더 나아가, 전체적인 준비도 점수(overall readiness score)가 계산되었습니다. 다른 곳에서 보고된 [30] 이 발견들은 실행 전략에 반복적으로 정보를 제공했습니다(informed implementation strategies iteratively).

실행의 충실도와 진정성 (Fidelity and integrity of implementation)

실행의 충실도(Fidelity of implementation)CBD가 의도된 대로 실행되고 있는 정도(degree to which CBD was being implemented as intended)로 정의되었습니다 [31]. 이 개념은 실행의 진정성(integrity of implementation) [32]과 밀접하게 관련되어 있는데, 진정성충실도를 넘어 실행에 있어 CBD의 원칙들이 존재하는 정도(degree to which the principles of CBD were present)를 식별하는 것입니다. 이 구분의 중요성은 임상 역량 위원회(clinical competence committees, CCs)의 채택을 조사한 Hauer 등의 연구에서 잘 묘사되어 있습니다 [33].

  • 연구에 포함된 모든 프로그램은 역량 위원회(CCs)를 설립했으므로 시스템 전반에 걸쳐 실행의 충실도는 달성되었습니다.
  • 그러나 CC가 수련생을 평가하는 방식(How the CCs went about assessing trainees)은 다양했습니다.
    • 일부는 발달적 접근(developmental approach)을 채택하여, 수련생에게 개인의 강점과 약점 영역을 지적하는 정기적인 피드백(regular feedback)을 제공하고, 이를 구체적인 벤치마크나 이정표(milestones)의 성취와 명확하게 연결했습니다. 발달적 접근은 원하는 전환(desired transformation)과 일치하므로, 이러한 경우 실행의 진정성은 건전했습니다(sound).
    • 그러나 대다수는 모든 수련생의 발달을 지원하기보다는 주로 고전하는 수련생(struggling trainees)을 향한 논의에 초점을 맞춘 문제 확인 접근(problem identification approach)을 사용했습니다. 다시 말해, 그들은 새로운 위원회 구조를 실행했지만 실제 수련생 평가 과정(actual process of trainee assessment)은 새로운 목표와 일치하지 않았습니다. 따라서 CBD를 실행함에 있어, 프로그램이 CBD의 모든 필수 구성요소를 실행했을 수 있지만(즉, 충실도를 달성함), CBD의 진정한 의도를 실현하지 못했을(즉, 진정성을 달성하지 못함) 가능성이 예상되었습니다(it was anticipated).

충실도에 초점을 맞춘 평가 전략(Fidelity-focused evaluation strategies)은 지역적 맥락(local contexts)에서의 실행에 있어 혁신의 기계적 또는 구조적 요소(mechanistic or structural elements)에 대한 단순한 모니터링이 될 위험이 있습니다. 이는 평가가 프로그램 수준에서 실행하는 사람들에 대한 비판(critique of the those implementing)이 되는 것으로 잘못 해석될 결과(resultant misinterpretation)를 초래할 수 있습니다; "당신은 이것을 하기로 되어 있는 대로 했습니까?" 평가 전략이 CBD의 중요한 구성요소의 실행에 대한 정보를 포착할 필요가 있었지만, 그 전체적인 평가 목표(overall evaluation aim)는 우리가 CBD를 의도된 원칙과 전체 목표에 충실한 방식(way that was true to its intended principles and overall goals)으로 실행했는지 이해하기 위해, 실행의 진정성(integrity of implementation)을 이해하는 것을 선호했습니다. 여기서 '우리'는 혁신의 설계자를 포함하여 시스템 내의 모든 파트너와 투자된 다른 사람들을 집합적으로 포함합니다.

 

CBD 펄스 체크 연구(CBD Pulse Check study)는 캐나다 전문의학 시스템 전반에 걸쳐 CBD 실행의 충실도와 진정성을 특성화(characterize)하는 동시에, 개선을 위한 도전과 기회(challenges and opportunities for improvement)를 설명하기 위해 개발되었습니다.

  • 충실도를 포착하기 위해 CBME 핵심 구성요소 프레임워크(CBME Core Components Framework, CCF)가 활용되었습니다 [34].
    • 이 프레임워크는 수정된 델파이 기법(modified Delphi)을 통해 도출되어 CBME의 핵심 구성요소를 결과 역량(outcome competencies), 순차적 진행(sequenced progression), 맞춤형 학습 경험(tailored learning experiences), 역량 중심 수업(competency-focused instruction), 그리고 프로그램적 평가(programmatic assessment)로 식별했습니다.
    • 이 전 세계적으로 관련성 있는 프레임워크(globally relevant framework)는 실행의 충실도를 달성하기 위해 필요한 프로그램 요소를 식별하는 데 사용되었습니다.
  • 실행의 진정성혁신 구성 매핑(innovation configuration [IC] mapping)을 사용하여 다루어졌습니다 [34, 35]. IC 매핑새로운 혁신(이 경우, CBD)이 무엇이고 무엇이 아닌지(what... is and what it is not)를 입증하는 유용한 방법입니다.
    • 혁신의 주요 구성요소를 식별한 후, IC 맵은 각 주요 구성요소에 대해 미실행(non-implementation)에서 이상적 실행(ideal implementation)까지의 범위에 있는 척도(scale)로 실행을 묘사합니다. 따라서, 이것은 충실도뿐만 아니라 실행의 진정성도 모니터링합니다.
    • 광범위한 자문 과정을 통해 생성된 CBD IC 맵은 CBD 펄스 체크 설문조사의 기초를 형성했으며, 전자 포트폴리오(electronic portfolios), 직장 기반 위임 가능 전문 활동 평가(workplace-based entrustable professional ability assessment), 그리고 즉각적인 코칭(coaching in-the-moment)과 같은 주요 구성요소를 포함했습니다.
    • 전국의 프로그램 책임자들은 그들의 프로그램이 CBD를 시작한 지 6개월 후에 이 설문지를 받았고 그 후 매년 받았습니다. 또한, 각 설문조사 반복(iteration) 후, 응답자의 하위 집단(subset of respondents)이 프로그램 책임자들의 CBD 경험에 대한 더 깊은 탐구를 촉진하는 반구조화된 인터뷰(semi-structured interview)에 참여했습니다.

CC(역량 위원회)가 CBD 평가 프로그램의 초석(cornerstone)이므로, CBD 펄스 체크를 확장하고 CC에 대한 실행의 진정성을 탐구하기 위해 후속 질적 인터뷰 연구(follow-up qualitative interview study)가 설계되었습니다. 2020년 이전에 시작한 프로그램의 모든 CC 위원장들에게 이메일을 통해 연락하여 CC 실행 테마(CC-implementation themes)를 식별하기 위한 반구조화된 인터뷰에 참여하도록 초대했습니다.

 

프로그램 책임자들에게 초점을 맞춘 CBD 펄스 체크 연구의 개발 이후, 수련생의 관점(trainee perspective)이 과소대변되었다는(under-represented) 점이 인식되었습니다. 캐나다 전공의 협회(Resident Doctors of Canada)와의 의도적인 파트너십이 형성되었고 [36], 수련생을 위해 특별히 설계된 CBD 펄스 체크 설문조사 버전이 설계되었습니다. 이 설문조사는 CBD 실행에 대한 그들의 인식을 조사하고, 실행의 충실도와 진정성을 더 깊이 이해하며, 초기 성과(early outcomes)를 포착하는 것을 목표로 했습니다. 특히 다른 수련생 중심 평가 노력 [37]에서 우려 영역으로 확인되었던 수련생의 웰니스(trainee wellness)에 미치는 영향과 관련된 성과를 포착하고자 했습니다.

 

CBD 펄스 체크 설문조사와 CC 인터뷰 연구의 시스템 수준 관점(system-level perspective)을 보완하기 위해, CBD의 현장 경험(on-the-ground experience)에 대한 심층적인 이해를 생성하는 것을 목표로 하는 연구도 수행되었습니다. 신속 평가 방법론(rapid evaluation methodology) [38]을 사용하여, 이 연구는 여러 분야와 파트너에 걸친 개별 수련 프로그램들의 실행 경험과 초기 성과를 비교하고 대조했습니다. 세 개의 구체적이고 모범적인 전문 분야(exemplar disciplines)(내과, 응급의학과, 비뇨의학과)가 모집되어 Royal College와 파트너십을 맺고 초기 CBD 실행자 풀(pool)에서 개별 전공의 수련 프로그램의 대표 표본을 형성했습니다.

 

신속 평가(Rapid evaluation)는 시스템 변화를 향한 진화적 적응의 과정(process of evolutionary adaptation)에 참여하기 위해 시의적절한 증거를 포착하고 피드백하는 것(capturing and feeding-back timely evidence)에 초점을 맞춘 접근법입니다 [39]. 핵심 구성요소 프레임워크(Core Components Framework) [34]를 바탕으로, 계획된 실행의 맥락과 세부 특징, 그리고 기대되는 성과를 포함한 변화의 본질(nature of the change)에 대한 명시적인 설명이 각 참여 프로그램의 지역 CBD 리더들과의 파트너십을 통해 생성되었습니다. 평가는 각 프로그램에서 실행된 CBD의 경험을 더 잘 이해하기 위해 수련생, 일선 교수진(front-line faculty), 프로그램 리더들과의 일련의 인터뷰 및 포커스 그룹을 통해 정보를 수집하는 데 초점을 맞추었습니다. 이 데이터는 그 후 CBD가 의도된 대로 실행되고 있는지 판단하고 경로 수정(course correction)이 필요한 영역을 식별하기 위해 의도된 지역적 변화(intended local change)에 대한 설명과 비교되었습니다. 피드백은 파트너들과 투자된 그룹들에게 제공되었고, 다른 사람들의 경험이나 감독 기관의 지침과 같은 영향을 미치는 외부 요인(influencing external factors)을 고려하여 경로 수정이 실행되었습니다. 참여 프로그램에 피드백이 제공된 후, CBD 실행의 국가적 그림(national picture)을 알리고 의도된 것과 의도하지 않은 것 모두를 포함한 실행의 떠오르는 성과(emerging outcomes)를 식별하기 위해 전문과목 전반에 걸친 2차 분석(secondary analysis)이 수행되었습니다.

 

위에서 설명한 바와 같이, 프로그램들이 충실도와 진정성을 모두 갖추고 실행에 착수했음을 보장하지 않고서는, 성과나 영향(outcomes or impacts)을 CBD 실행 자체나 CBD 모델의 특정 특징 탓으로 돌리는 것(attribute... to)이 불가능할 것입니다. 따라서 이 두 번째 기둥은 CBD와 관련된 성과의 견고한 조사를 위한 토대(foundation for a robust examination)를 제공합니다.

CBD의 성과 (Outcomes of CBD)

CBME는 교육 이론의 발전(advances in education theory)을 활용하고 전공의 과정 환경(postgraduate setting)에서 최선의 교육 원칙이라고 생각되는 것들을 엮은 근거에 정보를 얻은 혁신(evidence-informed innovation)입니다 [40]. 그러나 우리는 전 세계적으로 CBME의 영향을 이해하기 위한 실제 근거 기반(actual evidence base)을 개발하는 매우 초기 단계에 있습니다 [41]. 결과적으로, 세 번째 기둥으로서, Royal College는 시간이 지남에 따라 CBD의 영향에 대한 증거를 수집하기 위해 종단적 성과 평가(longitudinal outcome evaluation)에 참여할 필요성을 인식했습니다. 이 섹션에서는 집필 당시 구체적인 성과 연구가 완료되지 않았으므로 예상되는 도전과제(anticipated challenges)와 이 기둥을 다루는 접근방식을 설명합니다.

 

CBD가 많은 변수(실행의 충실도, 지역적 맥락 등)의 역동적 상호작용(dynamic interaction)을 포함하는 복잡한 전환적 개입(complex transformative intervention)임을 감안할 때, 이는 다중 성과(multiple outcomes)의 생산을 초래할 것입니다. 예를 들어, 로직 모델(그림 1 참조)에 묘사된 바와 같이, 서로 다른 성과들이 시간이 지남에 따라 전개될 것(unfold over time)으로 예상됩니다. 더 정교한 성과의 분류체계(taxonomy of outcomes)가 국제 역량 바탕 의학 교육(International Competency-based Medical Education, ICBME) 협력자들에 의해 기술되었습니다. 이 성과들은 시간선(수련, 진료로의 전환, 진료)에 따라 세 가지 영역: 초점(교육적, 임상적), 수준(미시적, 중범위적, 거시적)에 걸쳐 조직됩니다 [42]. 이 분류체계는 수련 중인 의사들의 궤적(trajectories of physicians in training)을 따라가는데,

  • 먼저 수련 중에 발생하는 성과에 초점을 맞추고,
  • 그 다음 수련에서 지도감독 없는 진료(unsupervised practice)로 전환하는 시기를 둘러싸고 발생하는 성과를 독특하게 강조하며,
  • 마지막으로 독립적인 진료(independent practice) 중에 발생하는 성과에 초점을 맞춥니다.

이 분류체계는 초기에 조사해야 할 중요한 성과가 CBD가 수련생의 "진료 준비도(readiness to practice)"를 향상시키는 정도(extent to which CBD enhances trainee “readiness to practice”)임을 시사합니다(즉, 증가하는 복잡성, 중증도, 그리고 환자의 기대가 변화의 주요 동인인 변화하는 의료 환경에서 졸업하는 수련생들이 진료할 준비가 되도록 보장하는 것). 더 구체적으로는, 수련 중 강화된 직접 관찰(enhanced direct observation)과 같은 교육과정의 변화가 지도감독 없는 진료에 요구되는 역량의 보증(assurance of competence)으로 이어질 것으로 예상됩니다.

 

모니터링해야 할 또 다른 중요한 성과는 CBD가 전공의 교육과 조직 문화(organizational culture)의 진정한 전환(true transformation)을 촉진하는 정도입니다. 실행의 진정성이라는 개념을 바탕으로, 우리는

  • 피드백의 질(quality of feedback),
  • 수련생에게 그들의 개별 학습 요구와 궤적에 맞춘 지원(support tailored to their individual learning needs and trajectory)이 제공되는 정도,
  • 그리고 평생 학습(lifelong learning)에 대한 헌신을 보여주는 수련생의 행동을 조사함으로써 수련생 평가에 대한 더 발달적인 접근으로의 이동(shift to a more developmental approach)을 조사할 수 있습니다.

중요한 것은, 이 분류체계가 원위의 환자 중심 성과(distal patient-focused outcomes)를 측정하는 도전에 직면하여 이러한 더 근위의 교육 성과(proximal educational outcomes)를 평가하는 것의 효용성을 강조한다는 점입니다. 하류의 환자 진료(downstream patient care)에 미치는 CBD의 영향을 측정한다는 높은 목표(lofty goal)는 혁신의 하류에 있는 통제하기 어려운 다른 많은 영향들(many other difficult-to-control influences) 때문에 도전이 될 것입니다 [43, 44]. 그러나 수련 프로그램은 의사의 진료 수행능력(physician practice performance)과 환자 진료 성과에 상당한 영향을 미치는 것으로 나타났으며 [45], 복잡성과 도전에도 불구하고 이 영향을 시간이 지남에 따라 측정하려는 노력이 이루어져야 합니다. 또한, 그러한 복잡한 혁신에 대해 인과 관계(cause-and-effect relationship)를 예측하는 어려움을 감안할 때, 긍정적이든 부정적이든 의도하지 않은 성과(unintended outcomes)를 포착하는 것은 Royal College 평가 계획의 중요한 측면입니다. 일부 분야는 이미 측정될 수 있는 원위 환자 중심 성과의 우선순위를 정하는 과정을 시작했습니다. 예를 들어, 응급의학과에서 Chan 등 [46]은 3가지 최우선 성과를 식별했습니다:

  • CBD 졸업생과 관련된 환자 안전 및 진료의 질 지표(patient safety and quality care metrics),
  • 근거 중심 진료에 대한 졸업생의 준수(graduate adherence to evidence-based practice), 그리고
  • 병원의 흐름과 기능(hospital flow and function)에 미치는 CBD의 영향.

그러한 복잡한 개입에서 성과 측정의 마지막 도전은 전통적인 무작위 대조 시험 방법론(randomized controlled trial methodology)을 넘어서야 할 필요성입니다 [41]. CBD를 실행하는 데 있어 지역적 맥락의 강력한 영향력(powerful influence of local context)을 감안할 때, 한 프로그램이 다른 프로그램과 진정으로 비교될 수 있다고 기대하는 것은 비현실적입니다. 오히려, Royal College는 복잡성의 조건 하에서(under conditions of complexity) 실현된 성과에 대한 풍부한 이해와 가치 있는 통찰력을 생성하기 위해 다중 방법(multiple methods)을 사용하는 데 초점을 맞출 것입니다. 이러한 성과 연구들은 Royal College가 충실도와 진정성을 가지고 실행되었을 때의 CBD의 영향에 대한 풍부한 지식 기반(rich knowledge base)을 체계적으로 개발하도록 해줄 것입니다.

실천 공동체 육성 (Fostering a community of practice)

첫 번째와 두 번째 목표가 CBD 평가의 세 가지 기둥에 의해 다루어진(addressed by) 반면, 세 번째 목표를 계획하는 것은 CBD 프로그램 평가에 참여하는 사람들의 실천 공동체(community of practice)를 형성하기 위한 다각적인 접근(multi-pronged approach)을 필요로 했습니다. CBD 실행이 국가, 기관, 전문과목, 개별 프로그램 수준에서의 조율된 노력(synchronized efforts)을 필요로 한다는 점이 즉각적으로 인식되었습니다. 따라서, 동시다발적인 프로그램 평가(simultaneous program evaluation) 역시 동일한 시스템 횡단적 노력(cross-system effort)을 필요로 했습니다. 이 세 번째 목표의 목적은 CBD 실행에 참여하는 수많은 교수진, 전공의, 프로그램 리더, 교육 학자들에 의한 프로그램 평가 노력을 촉진(catalyze)하는 것이었습니다. 이 과정을 시작하기 위해, Royal College는 전국 각지의 프로그램 평가 작업을 공유하고 선보이기 위해(to share and showcase) 일련의 대규모 대면 및 가상 연례 프로그램 평가 서밋(summits)을 주최했습니다 [47]. 부가적인 활동(adjunct activity)으로, Royal College는 또한 일 년에 두세 번 더 짧고 소규모인 가상 프로그램 평가 포럼을 주최했습니다. 이 포럼들은 증거에 기반한 토론(evidence-informed debate)이 가능할 만큼 충분한 프로그램 평가가 수행된 CBD의 측면들을 조사했습니다. 해당 주제와 관련된 학술 활동(scholarship)에 활발한 주요 연사들이 초청되어 자신의 연구를 짧게 발표하고, 이후 서로 다른 관점(differing perspectives)에 대한 패널 토론에 참여했습니다. 이러한 서밋과 포럼의 목표는 아이디어 공유를 위한 장(venue for sharing of ideas)을 만들고, 기관 간 협력(inter-institutional collaboration)을 촉진하며, CBD 프로그램 평가에 관련된 파트너들을 위한 지원적인 실천 공동체(supportive community of practice)를 만드는 것이었습니다.

 

Royal College가 주도한 프로그램 평가 프로젝트의 공유를 더욱 촉진하기 위해(To further facilitate sharing), Royal College 프로그램 평가 팀은 완료된 연구와 진행 중인 연구(studies in flight)의 세부 사항 및 결과에 누구나 접근할 수 있는 대중에게 공개된 상호작용형 대시보드(publicly facing interactive dashboard)를 만들었습니다 [48]. 이 대시보드는 정기적으로 업데이트되었으며 데이터 조직화 및 공유를 위한 단일 장소(single location) 역할을 하도록 의도되었습니다. 또한, Royal College는 CBD와 관련된 프로그램 평가 학술 프로젝트를 위해 경쟁적 연구비(competitive grant funding)를 제한된 금액으로 제공했습니다. 마지막으로, Royal College는 CBD에 영향을 받는 다른 주요 국가 기관들과 파트너십을 맺고 프로그램 평가 프로젝트에 협력했습니다. 이러한 유형의 협력의 한 예는 CBD 실행의 주요 구성요소에 대한 수련생의 관점(trainee perspectives)을 명확히 하기 위해(to elucidate) 캐나다 전공의 협회(Resident Doctors of Canada)와 함께 진행한 공동 설문조사 프로젝트(위에서 논의됨)였습니다 [36].

초기 발견과 향후 경로 (Early findings and path forward)

2017년 CBD 프로그램 평가 전략(PES)의 시작부터 2023년 초 집필 시점까지, Royal College 프로그램 평가 연구들은 1,670명의 설문 응답자, 128명의 인터뷰 대상자, 60명의 포커스 그룹 참가자를 포함하여 1,858명의 파트너 및 투자된 다른 사람들의 견해와 관점(views and perspectives)을 포착했습니다 [48]. 참가자들에는 887명의 프로그램 책임자, 700명의 수련생, 그리고 캐나다 내 17개 모든 의과대학의 52명의 전공의 교육(PGME) 리더들이 포함되었습니다. 프로그램 평가 서밋 및 포럼을 포함한 지역사회 참여 작업(community engagement work)을 통해, 91개의 초록과 20개의 기조연설(plenaries)이 총 1,779명이 넘는 청중에게 발표되었습니다. 투자된 파트너 참여(invested partner engagement)의 범위는 다양성과 규모(diversity and magnitude) 면에서 상당했습니다.

 

많은 CBD PES 연구들은 집필 시점에 여전히 진행 중(still in process)입니다; 예를 들어, Royal College는 CBD 펄스 체크를 통해 프로그램 책임자들을 설문조사하는 5년 차에 접어들고 있으며, Royal College-캐나다 전공의 협회 공동 수련생 설문조사의 두 번째 반복(second iteration)을 시작하고 있습니다. 이 작업의 많은 부분에서 나온 발견들은 주로 기술 보고서(technical reports), 프로그램 평가 대시보드, 회의 또는 웨비나 발표, 또는 미출판 저작물(unpublished works)로만 보고되었습니다. 그러나 모든 작업을 폭넓게 조망하고(taking a broad view) 캐나다 전역의 외부 그룹에서 수행한 다른 주요 연구들의 유사한 발견들과 삼각 검증(triangulating)을 해보면, 중요한 광범위한 주제와 교훈을 요약할 수 있습니다.

 

우선, 캐나다의 모든 전문 분야와 기관을 대표하는 많은 프로그램 전반에 걸쳐 긍정적인 전환의 강력한 지표들(strong indicators of positive transformation)이 있습니다.

  • 2022년에, 전국 CBD 펄스 체크 설문조사에 응답한 프로그램 책임자의 70%가 CBD의 실행이 잘 진행되고 있다는 데 동의하거나 강력히 동의했습니다(agreed or strongly agreed). 초기에 보고된 이점들은
    • 목적에 부합하는 프로그램 설계(program design fit for purpose)의 유연성,
    • 전공의 과정 및 진료로의 더 명시적이고 촉진된 전환(more explicit and facilitated transitions),
    • 수련생의 발전을 관찰할 더 많은 기회,
    • 수련생을 위한 더 많은 코칭과 지원,
    • 역량 위원회를 통한 더 객관적이고 타당하며 정보에 입각한 정당화된 발전 결정(better informed and justified progression decisions), 그리고
    • 프로그램의 질과 개혁에 대한 더 큰 초점 등 CBD의 바라는 목표들 중 많은 것을 반영합니다 [38, 48].
  • 이는 교육적 책무(educational mandates)에 헌신적인 교수진이 있는 많은 프로그램들이 그들의 "전공의 과정 2.0(residency 2.0)"을 만들면서 이미 고기능적인 수련 프로그램의 전면적인 수정(whole-scale revision)에 참여하는 결과를 낳았습니다 [49].

 

그러나, Royal College와 다른 의학교육 기구들에 의한 평가들은 CBD 실행의 충실도와 진정성(fidelity and integrity) 모두에서 변동성(variability)이 있음을 발견했습니다.

  • 일부 우려의 초기 신호들(early signals of concern)이 여러 전문 분야와 기관 전반에 걸쳐 표면화되고 있으며(surfacing),
  • 이는 일부 프로그램에서 실행이 전환(transformation)이라기보다는 필수 절차들의 내키지 않는 "억지로 덧붙인 것(bolt-on)"을 더 닮았음을 시사합니다.

이는 역사적으로 다른 대규모 전환적 변화들(large-scale transformative changes) 전반에서 흔히 있어왔습니다 [32, 50, 51]. 이와 같은 변화는 하룻밤 사이에 실행되는 것이 아니라, 참가자와 현장(sites)에 따른 예상된 변동성을 가진 전환적 변화의 여정(journey of transformational change)과 더 유사합니다. 캐나다의 CBD 실행에 내재된(engrained in) 의도적인 유연성 [1]은 이 초기 단계에서 CBD 실행의 충실도에 있어 상당한 양의 국가적 변동성에 더욱 기여했습니다. 또한 CBD 실행의 진정성이 많은 환경에서 아직 달성되지 않았음(has yet to be achieved)을 시사하는 강력한 신호들이 여러 영역에서 나타나고 있습니다.

 

전자 포트폴리오(electronic portfolios)와 관련된 도전과제들은 Royal College 연구와 다른 연구들 모두에서 CBD 실행에 관련된 파트너들에 의해 자주 기술되었습니다 [38, 52, 53, 54]. 수련생, 교수진, 역량 위원회 구성원 모두 전자 포트폴리오의 바라는 기능(desired functionality)과 효과적이고 유용한 수집된 데이터(effective useful collated data)를 제공하는 능력 사이의 불일치(misalignment)를 보고합니다. 캐나다의 여러 그룹은 지역적으로 또는 국가적으로 채택된 지역적 혁신(local innovations)을 통해 이를 해결하기 위해 노력해 왔습니다 [55].

 

CBD 실행 도전과제의 가장 강력한 신호는 위임 가능 전문 활동(entrustable professional activities)의 직장 기반 평가(workplace-based assessment)에 대한 우려와 가장 관련이 깊어 보입니다. 일부 환경에서 위임 가능 전문 활동은 인지된 평가 부담(perceived increase in the burden of assessment)의 증가와 "체크박스 채우기(ticking boxes)"에 집중하는 경향 [56, 57, 58], 그리고 어떤 경우에는 평가에 있어 "나무만 보고 숲을 보지 못하는(loss of the “forest for the trees”)" 결과를 초래한다고 보고되었습니다 [38, 59]. 이러한 문제들은 바라는 성장 마인드셋(growth mindset) [60]과는 반대로 학습과 평가에 대한 성과 지향적 접근(performance-orientated approach)을 영속화(perpetuated)시켰으며, 직장 기반 평가의 "게임화(gaming)"[역주: 평가 시스템을 악용하여 실제 역량 향상 없이 점수만 따내는 행위] 뿐만 아니라 수련생들에게 과도한 압박(undue pressures)으로 이어질 수 있습니다 [37, 56]. 내키지 않아 하는 교수진(reluctant faculty)으로부터 위임 가능 전문 활동의 "성공적인" 평가를 "쫓아다니는(chasing)" 수련생들의 이러한 행정 업무의 추가적인 부담(extra burden of administrative tasks)이 초래하는 가장 우려스러운 결과는 수련생의 웰니스(trainee wellness)에 미치는 상당한 부정적 영향일 수 있습니다 [36, 37].

 

전반적으로, 이미 제한된 자원과 다른 맥락적 어려움(contextual struggles)으로 고생하는 기존 프로그램에 CBD 요소들이 최소한으로 혹은 내키지 않는 "덧붙임(bolt-on)"으로 들어온 상황에서는, CBD의 실행이 아직 바라는 효과를 달성하지 못한 것으로 보입니다. 문화 변화(culture change)는 시간이 걸리고 전환 과정을 통한 지속적인 집단적 노력(sustained collective effort)이 필요할 것으로 보입니다; 그리고 요구되는 노력은 수많은 지역적 맥락 요인(host of local contextual factors)에 따라 확실히 가변적일 것입니다. 구조, 절차, 정책을 마련하는 것(Getting the structures, processes, and policies in place)이 첫 번째 단계일 수 있지만, 교육 설계의 반복적인 수정 및 수정(iterative revision and adaptation)을 동반한 지속적인 질 개선(continued quality improvement)이 프로그램과 전문 분야에서 바라는 마인드셋 변화로 이어질 수 있습니다. 이는 Royal College와 현장에 관여하는 전공의 수련 기관 및 프로그램 모두의 지원을 필요로 할 것입니다. 지금까지 얻은 교훈을 되돌아볼 때(Reflecting on lessons learned thus far), CBD PES의 다음 단계는 맥락 전반에 걸친 수련생의 CBD 경험에 대한 더 나은 이해 개발, 서로 다른 전문 분야의 고유한 CBD 경험에 대한 추가 탐구 및 서로 다른 맥락에 고유한 수정(unique adaptations)이 필요한지에 대한 도전, 그리고 CBD 실행의 환자 및 시스템 수준 성과(patient- and system-level outcomes) 조사를 포함한 몇 가지 핵심 영역에 초점을 맞춰야 할 것입니다.

 

이 평가 노력이 캐나다 내 CBD의 진화에 정보를 제공할 뿐만 아니라 전 세계적으로 CBME를 실행하는 사람들에게도 정보를 제공하기를 희망합니다. Royal College는 CBME 실행의 최전선(front edge)에 있는 여러 PGME 시스템 중 하나에 대해서만 책임이 있습니다. 예를 들어 2013년에 처음 실행된 ACGME 마일스톤(ACGME Milestones)은 전문 분야별 평가 프로젝트 [62, 63]를 포함한 광범위한 평가 노력 [61]을 통해 확인된 초기 마일스톤의 한계에 대응하여 "마일스톤 2.0(Milestones 2.0)"을 제정하고 있습니다. 전문 분야 전반에 걸친 마일스톤의 수정 외에도, 국가적인 변화는 마일스톤의 복잡성 감소(reducing milestone complexity), 지역사회 참여 강화(enhancing community engagement), 그리고 실행을 위한 추가 도구 제공에 초점을 맞추었습니다 [61]. 더 나아가, 수술 성과(surgical outcomes)와 마일스톤 수행능력의 상관관계를 분석한 Kendrick 등 [64]의 연구와 같이 성과에 초점을 맞춘 평가 프로젝트들이 이제 등장하고 있습니다. 또 다른 예로, 네덜란드에서는 세기가 바뀔 무렵부터 CBME가 채택되었습니다. 그러나 초기 실행은 수련생 발달을 위한 역량 프레임워크와 포트폴리오를 제공했음에도 불구하고 시간 기반(time-based)으로 남아있었습니다. 이는 2017-2019년 사이에 모든 전문 분야에 걸쳐 위임 가능 전문 활동과 진정한 시간 가변성(true time-variability)의 실행을 촉발했습니다 [65]. 이 실행에 대한 평가는 전반적인 수련 시간의 감소를 발견했으며, 지속적인 문화 변화를 위한 노력의 필요성과 전환기 동안 안전한 환자 진료의 연속성(continuity safe patient care)을 유지하는 데 초점을 맞춰야 함을 강조했습니다(underlined).

 

위에 언급된 평가 프로젝트들에도 불구하고, CBME에 있어 체계적인 국가 규모의 평가 노력(systematic national-scale evaluation efforts)을 기술한 출판물은 거의 없습니다. CBD 실행에서 취한 접근 방식은 그 규모와 실천 공동체 구축에 대한 초점(focus on building a community of practice) 면에서 독특합니다. 이러한 유형의 접근 방식은 전공의 프로그램에 대한 중앙의 감독(central oversight)이 있는 다른 맥락으로 이전 가능할 수 있습니다. 그러나 프로그램이나 기관이 더 독립적으로 행동하는 맥락에서는 중앙 주도의 체계적인 평가(centrally driven systematic evaluation)를 운영하기가 더 어려울 수 있습니다. 로직 모델과 세 가지 기둥을 포함하는 CBD 평가에서 취한 접근 방식은 방법론적 범위(methodologic scope)가 제한적이라는 비판을 받을 수 있습니다. 로직 모델에 대한 많은 비판 [66]이 있으며, 전통적인 평가 방법론을 넘어 시간이 지남에 따른 혁신의 지속가능성(sustainability of innovations over time)에 초점을 맞추는 것과 같은 현대적인 접근 방식(contemporary approach)을 취하라는 평가 작업에 대한 요구 [67]가 있습니다. 이는 CBD 평가에서 취한 접근 방식에서도 인정되는 부분이며, 내부 전략 외부에서 다양한 평가 접근 방식을 취하는 사람들로부터 교훈을 얻을 수 있는 역량(capacity to learn lessons)이 생기는 국가적 실천 공동체의 중요성을 강조합니다. 이에 대한 몇 가지 예로는 한 캐나다 기관에서 채택한 현실주의적 평가 접근법(realist evaluation approach) [68]과 다른 기관에서 취한 신속 주기 평가 접근법(rapid-cycle evaluation approach) [69]이 있습니다. 전반적으로, 내부적으로 그리고 CBD 평가 실천 공동체 전반에 걸쳐 얻은 교훈들이 캐나다의 CBD를 향상시키는 데 사용되고, 전공의 수련에서 CBME를 평가하는 모든 사람에게 통찰력을 제공할 수 있기를 희망합니다.

결론 (Conclusion)

CBD는 전환적 변화(transformative change)를 위한 활용 중심 프로그램 평가 전략(utilization-focused program evaluation strategy, CBD-PES)에 대한 상당한 투자 및 헌신과 결합된 대규모 국가적 변화 이니셔티브입니다. 변화의 본질과 그 영향에 대한 이해가 진화함에 따라, 지속적인 평가와 수정의 순환(continuous cycles of evaluation and adaptation)은 전환 과정을 더욱 집중시키는 데 도움이 될 것입니다. CBD 로직 모델과 평가의 세 가지 기둥인 실행 준비도(readiness to implement), 실행의 충실도와 진정성(fidelity and integrity of implementation), 그리고 실행의 성과(outcomes of implementation)에 기반을 둔(Grounded in) PES는 지금까지 가치 있는 통찰력을 제공해 왔습니다. 투자된 그룹들과 교류하고(Engaging with invested groups) 이 변화를 중심으로 실천 공동체를 육성하는 것은 결정적이었습니다(critical). 도전과제의 조기 식별과 의도하지 않은 성과의 감지, 그리고 CBD 실행의 충실도와 진정성에 대한 우려 신호는 이미 중요한 수정(important adaptation)을 낳았으며 의학교육에서의 CBME 실행과 변화에 대한 우리의 이해에 기여했습니다. CBD PES는 Royal College가 향후 CBD의 진화를 이끌어갈 수 있는 좋은 위치에 있게 하며(positions... well), 이상적으로는 전 세계의 다른 대규모 전환적 변화 이니셔티브와 모든 CBME 실행에 정보를 제공하는 데 도움을 줄 수 있습니다.

 

 

 

Perspect Med Educ. 2024 Feb 6;13(1):85-94. doi: 10.5334/pme.960. eCollection 2024.

Strategies to Enable Transformation in Medical Education: Faculty and Trainee Development in Competence By Design

 

 

오늘은 캐나다 왕립내과외과대학(Royal College)이 주도한 역량바탕 의학교육(CBME) 프로젝트인 'Competence By Design (CBD)'의 이행 전략을 다룬 흥미로운 논문을 소개해 드리려 합니다.

의학교육 커리큘럼을 바꾸는 건 단순히 시간표를 짜는 게 아니라, 거대한 조직 문화를 바꾸는 일이죠. 이 논문은 그 거대한 변화 속에서 교수개발(Faculty Development)과 수련생 개발(Trainee Development)이 어떤 전략적 역할을 했는지 아주 상세히 보여줍니다. 🇨🇦

캐나다의 경험이 우리에게 어떤 통찰을 주는지 핵심 내용을 콕콕 짚어볼까요? 🧐


1. 교수개발, 단순한 교육이 아닌 '변화의 도구' 🛠️

이 논문의 저자들은 교수개발을 단순히 교수님들에게 교수법을 가르치는 워크숍 정도로 보지 않았습니다. 그들은 이것을 시스템을 바꾸는 강력한 무기로 정의했죠.

"교수개발은 교수학습을 개선하는 데 기여하고 혁신과 조직 변화를 촉진할 수 있는 강력한 도구이며, 특히 역량바탕교육에 있어 더욱 그러합니다." "Faculty development is a powerful tool that contributes to improved teaching and learning and can promote innovation and organizational change, especially for competency-based education."

그래서 그들은 논리 모형(Logic Model)을 세우고, 공식적인 워크숍뿐만 아니라 비공식적이고, 개인적이며, 그룹 단위의 다양한 활동을 Steinert의 4분면 모형에 맞춰 촘촘하게 설계했습니다.

2. '적시(Just-in-Time)' 학습과 맞춤형 자원 ⏰

교수님들도 전공의들도 정말 바쁘잖아요. "나중에 필요할 테니 미리 배워두세요"라는 방식은 잘 통하지 않습니다. 저자들은 사용자가 필요할 때 즉시 꺼내 쓸 수 있는 '즉시 사용 가능한 자원(Off-the-shelf resources)'의 중요성을 강조합니다.

"교수개발 구성 요소 일부에 대한 ‘적시(Just-in-Time)’ 접근법은 핵심이었습니다... (중략) 사람들이 쉽게 접근하고, 사용하며, 조정할 수 있는 자원들을 강조했습니다." "A ‘just-in-time’ approach to some of the faculty development components was key... emphasized activities and resources that people could easily access, use, and adapt."

 

예를 들어, 역량 위원회(Competence Committee)가 열리기 직전에 위원장에게 관련 가이드를 '푸시(Push)'해주는 식이죠. 💡

3. 수련생도 '변화의 주체'입니다! 🧑‍⚕️👩‍⚕️

이 논문에서 가장 인상 깊었던 점은 바로 수련생(Trainee)을 변화 관리의 핵심 파트너로 보았다는 점입니다. 보통 교수개발만 신경 쓰기 쉬운데, 새로운 시스템에서 가장 혼란스러울 전공의들을 미리 준비시키는 것이 성공의 열쇠라고 말합니다.

"학습자를 위해 변화 관리(Change management)에 대한 기술을 구축하는 것이 결정적이며, 이는 전체적인 접근 방식에 내재되어야 함이 분명합니다." "It is clear that building skills around change management for learners... is critical and should be built into the overall approach."

 

전공의들이 '성장 마인드셋(Growth Mindset)'을 장착하고 시스템을 이해하면, 오히려 교수님들을 돕는 챔피언이 될 수 있다는 것이죠. 👍

4. 끊임없는 피드백과 인내심 🔄

물론 모든 것이 순조로웠던 건 아닙니다. 이해 부족, 시간 부족, 프로그램 간의 이질성(Heterogeneity) 등 수많은 장벽이 있었죠. 연구진은 지속적인 질 개선(CQI) 사이클을 돌리며 계속 전략을 수정했습니다. 그리고 무엇보다 '문화 변화(Culture Change)'에는 시간이 필요하다는 점을 인정해야 한다고 조언합니다.

"의미 있는 문화 변화는 시간과 노력이 필요하며 서로 다른 맥락에서 다양한 속도로 일어납니다." "Meaningful culture change takes time and effort and occurs at varying paces in different contexts."


📝 요약하며

결국 성공적인 의학교육 혁신을 위해서는 정교하게 설계된 논리 모형(Logic Model), 사용자 맞춤형의 적시(Just-in-time) 자원, 그리고 수련생을 파트너로 인정하는 태도가 필수적이라는 것을 알 수 있었습니다.


서론 (Introduction)

교수개발(Faculty development)은 교수학습(teaching and learning)을 개선하는 데 기여하고 혁신(innovation)과 조직 변화(organizational change)를 촉진할 수 있는 강력한 도구이며[1], 특히 역량바탕교육(competency-based education)에 있어 더욱 그러하다[2]. 따라서 교수개발은 국가적인 교육과정 재설계(national curricular redesign)를 촉진하고 국가 차원의 모든 전문 분야에 걸쳐 졸업 후 전공의 수련(postgraduate specialty training)의 시스템 변화(systems changes)를 달성하는 것을 목표로 하는, 캐나다 왕립내과외과대학(Royal College of Physicians and Surgeons of Canada, 이하 Royal College)의 Competence By Design (CBD) 국가 이행 전략의 주요 초점(major focus)이었다.

 

Competence by Design (CBD)은 역량바탕 접근법(competency-based approach)을 사용하여 캐나다의 전공의 수련을 재정의(redefining)하는 것을 목표로 하는 Royal College의 변혁적 변화 프로젝트(transformative change project)이다. CBD 이행(implementation) 초기부터, 그 성공은 새로운 교육과정 패러다임(curricular paradigm)과 관련된 변화를 만들 수 있도록 널리 분포된 수많은 이해관계 집단(invested groups)을 지원하는 데 부분적으로 달려 있었다[3]. 특히, Royal College는 의과대학들과 협력(partnering)하여 다양한 파트너 그룹 및 조직 전반에 걸쳐 역량(capacity)을 강화함으로써 광범위한 국가 및 지역적 변화를 지원할 수 있음을 인식했다. 따라서 환경 스캔(environmental scan) 및 기타 요구 사정(needs assessments, 투입)을 통합한 논리 모형(logic model: 목적, 투입, 활동, 산출, 성과)(그림 1)을 사용하여, 상호 연관된 다수의 교수개발 이니셔티브(faculty development initiatives, 활동)가 개발되고 시행되었다[4].

 

그림 1 Competence By Design (CBD) 이행에 사용된 논리 모형(Logic Model) [4].

그림 1 Competence By Design (CBD) 이행에 사용된 논리 모형(Logic Model) [4].

 

(1) 목적 (Purpose)

  • Competence By Design을 설계(designing), 계획(planning), 이행(implementing)하는 사람들을 위해 국가 차원에서 시스템 전반의 변화(system-wide changes)를 지원함
  • Competence By Design을 가르치고(teaching), 평가하고(assessing), 활용(utilizing)하는 사람들을 위해 국가 차원에서 시스템 전반의 변화를 지원함 – 교수진(faculty)과 학습자(learners) 모두 포함

(2) 투입 (Inputs)

  • 환경 스캔 (Environmental scan)
  • 요구 사정 (Needs assessments)
  • Royal College 자원 (Royal College resources)
  • 임상 교육가 전문성 (Clinician Educator expertise)

(3) 활동 (Activities)

  • 발표(Presentations), 워크숍(workshops), 현장 방문(site visits), 서밋(summits), 웨비나(webinars), 소셜 미디어(Slack), 비디오, 학술대회 제공 프로그램(conference offerings), 기술 가이드(technical guides), 즉시 사용 가능한 자원(off-the-shelf resources), 역량바탕 의학교육 리더 프로그램(Competency Based Medical Education Lead Program) 신설
  • 공식적(formal), 비공식적(informal), 개인(individual) 및 그룹(group) 학습의 혼합

(4) 산출 (Outputs)

  • 성공적인 이행(Successful implementation) – 지역적(locally) 및 국가적(nationally)으로
  • 프로그램 검토(인증 표준), 설문조사, 인터뷰, 직접적인 피드백, 서밋을 통해 측정됨

(5) 성과 (Outcomes)

  • 유능한 의사(competent physicians) 배출
  • 자신의 일을 즐기는 의사 배출
    • 환자 진료/성과 향상(Improved patient care/outcomes) (참고: 이는 추후 확인되어야 할 장기적인 성과임)

 

CBD와 관련하여 저자들은 교수개발"역량바탕 전공의 수련 시스템(competency-based residency system)에서 대상 집단(target audiences)이 자신의 다각적인 역할(multiple roles)을 효과적으로 수행하도록 돕기 위해 고안된 역량 강화 이니셔티브(capacity building initiatives)"로 정의한다. CBD 프로젝트의 대상 집단과 파트너에는 (각 분야의 국가 수준 표준 설정(standard setting) 및 평가(assessment)를 담당하는) 국가 전문분야 위원회(national specialty committees), 각 의과대학의 졸업 후 의학교육(PGME) 부서, 전공의 수련 프로그램 책임자(program directors, PDs), 일선 교수자(front-line faculty teachers), 그리고 수련생(trainees)이 포함되었다. Royal College는 변화를 이행하고 유지(sustaining)하는 데 있어 각 개인의 역할을 개발하도록 돕는 역량 강화 이니셔티브의 필요성을 인식했다. 이러한 도전과제는 전국적으로 전공의 수련을 제공하는 의과대학 및 프로그램 간, 그리고 그 내부의 맥락의 다양성(diversity of contexts)으로 인해 더욱 복잡해졌다(confounded).

 

제공된 활동 묶음(bundle of activities)은 Steinert의 4분면 모형(quadrant model)[1]에 근거(informed by)하였으며,

  • 발표(동기 및 비동기), 워크숍, 현장 방문(site visits), 서밋(summits), 웨비나, Slack과 같은 소셜 미디어 활용, 비디오, 학술대회 제공 프로그램, 기술 가이드, 즉시 사용 가능한 자원(off-the-shelf resources), 그리고 각 의과대학 내 CBME 리더(CBME Lead) 프로그램의 신설 등이 포함되었다.

전통적으로 수련생(trainees)은 교수개발의 대상 집단이 아니었으나, 역량을 강화해야 할 필수적인 그룹(essential group)이라는 점이 조기에 인식되었다는 점을 강조해야 한다. 이에 따라 Royal College는 수련생을 포함시키기 위해 논리 모형의 투입(inputs)과 그에 따른 활동(resultant activities)을 반복적으로 조정(iteratively adapted)했다. 이 논문은 성공적인 CBD 이행을 달성하기 위해 교수 및 수련생 개발(faculty and trainee development)에 대한 국가적 접근법(national approach)을 채택하면서 사용된 논리 모형의 전략, 그리고 직면했던 장벽(barriers)과 촉진 요인(enablers)을 검토한다.

Competence by Design 이행을 위한 교수개발 계획 수립: 목표, 원칙 및 근거 (Designing a faculty development plan for implementation of Competence by Design: goals, principles, and rationale)

CBD는 다년 간의 다자간 파트너(multi-year, multi-partner)가 참여하는 교육과정 설계 및 시스템 변화(systems change) 프로젝트로, 2017년에 첫 번째 프로그램 코호트(cohorts)가 이행을 시작했다. 이 국가 수준 PGME 이니셔티브의 광범위한 범위(broad scope)는 파트너들의 자원과 요구의 이질성(heterogeneity)을 해결하기 위해 광범위한 전략을 활용(leveraged)하는 개입(interventions)을 필요로 했다. 전반적으로, 다음과 같은 원칙들이 CBD 이니셔티브를 위한 교수개발 전략을 뒷받침(underpinned)했다.

전반적인 목적 명확화 (Clarify the overall purpose)

국가 교수개발 전략의 목표는 캐나다의 졸업 후 수련 프로그램들이 역량바탕 교육과정(competency-based curriculum)으로 전환(transitioned)함에 따라 국가 차원에서 시스템 전반의 변화(system-wide changes)를 지원하는 것이었다. 일련의 교수개발 이니셔티브를 통해, Royal College의과대학들은 공동 책임(shared responsibility) 모델을 통해 다음을 수행하고자 착수했다(set out to).

  • 모든 의과대학에서 CBD를 설계, 계획 및 이행하는 책임이 있는 사람들, 특히 PD들과 CBME 리더들의 지식을 향상하고 기술을 구축(build the skills)한다.
  • 임상 교수자(clinical teachers)와 수련생(trainees)을 포함하여, CBD 시스템 내에서 가르치고, 배우고, 평가하게 될 사람들의 지식을 향상하고 기술을 구축한다.

서로 다른 요구, 맥락 및 선호도를 고려하여 다양한 학습 활동 제공 (Provide a variety of learning activities to account for different needs, contexts, and preferences)

캐나다 전역의 의과대학 수(n=17), 전문 분야 수(n=67), 그리고 1000개에 육박하는 개별 프로그램을 고려할 때(Given), CBD를 지원하기 위해 가용한 요구(needs), 자원(resources), 역량(capacity)은 매우 상이(vastly different)했다. 지역 문화(local culture), 프로그램의 규모, 그리고 지역의 전문성(expertise)과 자원에 대한 접근 수준은 프로그램의 CBD 이행 접근 방식 및 성공과 관련된 결정적으로 중요한 요소(critically important factors)였다. 환경 스캔과 여러 차례의 요구 사정을 통해, 이러한 이질성(heterogeneity)에 접근하기 위해서는 다양한 학습 옵션(variety of learning options)이 필요하다는 점이 분명해졌다.

 

Royal College는 CBD 이행이 이미 극도로 바쁜 교수진(faculty members), 프로그램 행정가(program administrators), 그리고 수련생들의 업무량(workload)을 가중시킬 것임을 인정했다(acknowledged). 이에 따라 CBD 교수개발 전략은 사람들이 쉽게 접근(access)하고, 사용(use)하며, 조정(adapt)할 수 있는 활동과 자원을 강조했다. 이러한 즉시 사용할 수 있는(ready-to-use) 교수개발 자원은 Royal College의 전략과 캐나다 내 많은 의과대학에서 개발된 전략의 핵심(key)이었다.

 

Steinert의 4분면(Steinert’s four quadrants)[1]에 따라, 공식적(formal), 비공식적(informal), 개인(individual) 및 그룹(group) 학습 활동이 혼합되었다. 역량 강화 노력에는 전통적으로 공식적인 그룹 및 개인 학습과 관련된 다양한 지원(예: 워크숍 및 코스, 출판된 문헌, 매뉴얼)이 포함되었다. 이것들도 꽤 유용했지만, CBD를 위한 교수개발은 비공식적, 일터 기반(work-based), 마이크로(micro), 그리고 적시(just-in-time) 교수개발과 같은 다른 역량 강화 방법들도 강조했다. 이행 업무의 각기 다른 부분에 대한 교수개발 양식(modalities)의 선택은 다양한 세션(sessions) 제공 후의 피드백에 의해 정보를 얻었으며(informed by), 시간이 지남에 따라 상당히 진화했다. 예를 들어, 웨비나(webinars)는 파트너들이 Royal College 교육가들 및 전국의 동료들과 대화에 참여(engage in a dialogue)하고, 자원과 그 사용법을 이해하며, 실용적인 팁과 요령(practical tips and tricks)을 공유할 수 있게 해주기 때문에 높게 평가된다는 점이 분명해졌다. 이는 커뮤니티 참여(community engagement)와 동력(momentum)을 구축하는 데 도움이 되었다.

프로그램 수준의 리더들이 변화를 맥락화하고 유지하도록 지원 (Support program level leaders to contextualize and sustain the change)

캐나다에서 PD는 특정 의과대학의 해당 전문분야 또는 세부전공에 대한 졸업 후 수련 프로그램의 전체 계획 및 이행을 총괄(oversee)하며, 여기에는 선발(recruitment), 교육과정 개발, 평가 전략 개발, 수련생 지원 제공 및 교수개발이 포함된다.

  • 그들은 프로그램 내에서 신뢰받는 협력자(trusted collaborators)이자 조언자이다.
  • PD는 동료들을 참여시키고 학습, 교육 및 평가의 포괄적인 철학(overarching philosophy)에 대한 변화를 포함하여 프로그램 내에서 의미 있는 변화를 이끌기에 적합한 위치(well positioned)에 있다.
  • 이러한 이유로 PD를 지원하는 것은 CBD의 성공적인 이행에 결정적(critical)인 것으로 간주되었다.
  • 다행히 Royal College는 기존의 Royal College 전문분야 위원회(specialty committees)를 통해 PD들과 직접적이고 확고한 연결 고리(well-established connections)를 맺고 있다.

해당 전문분야의 모든 PD가 포함된 각 전문분야별 위원회는 독특하게 설계된(uniquely designed) CBD 교수개발 이니셔티브에 참여했다. 여기에는 약 1.5~2년에 걸쳐 개최된 세 차례의 수일간 진행되는(multi-day) CBD 설계 워크숍이 포함되었다. 이 워크숍들은 해당 전문분야의 수련생들이 공식적으로 CBD 수련을 시작하기 약 24개월 전에 처음 시작되었다. 워크숍은 새로운 CBD 표준을 설계하고, PD들이 임상 동료, 수련생, 프로그램 행정가들을 참여시켜 프로그램 내 변화를 촉진(facilitate change)할 수 있도록 준비시키는 주요 장(primary forum)이었다[5].

 

워크숍에 참여한 처음 몇몇 전문분야 코호트(cohorts)의 경우, 교수개발자들은 2년이라는 기간(window) 내에 CBD로의 원활한 전환(smooth transition)에 필요한 모든 것을 다루는 데 어려움을 겪었다. 이는 배정된 임상 교육가(clinician educator), Pulse Check 설문조사, 전문분야 위원회 위원장, 그리고 각 기관의 국가 CBME 리더들과의 논의를 통해 해당 전문분야로부터 구한 반복적인 피드백(iterative feedback)을 통해 분명해졌다. 또한 필수 벤치마크(benchmarks) 달성 능력에 관한 전문분야 이행 상황의 지속적인 모니터링 데이터에서도 명백히 드러났다. 많은 PD들이 CBD의 근거(rationale)에 대한 확실한 이해를 가지고 CBD 설계 워크숍을 떠났지만, CBD의 "방법(how)"과 소속 프로그램(home programs)에서의 효과적인 설계 적용에 대한 지식과 전문성(expertise)을 구축하기 위해서는 워크숍 밖에서의 추가적인 지원이 필요했다. 이러한 이유로 2019-2020년에 Royal College는 지원 기간을 24개월에서 거의 48개월로 연장(extending)하는 데 집중했으며, 여기에는 각 전문분야의 CBD 출범(launch) 이후까지 지원을 확장하는 것이 포함되었다. 이는 성공을 지원 및 보장하고, 과정의 초기 단계에 있는 다른 프로그램들을 도울 수 있는 이행 경험(implementation experience)에 대한 정보를 반복적으로 수집하기 위함이었다. 이 확장된 지원 모델(extended support model)에는 CBD 설계 워크숍 사이, 워크숍 이후, 그리고 CBD 출범 이후에 프로그램들을 지원하기 위해 고안된 새로운 CBD 부스터 세션(CBD booster sessions)을 통해 PD들의 지속적인 개발을 강화하고 장려(reinforce and encourage)할 기회가 포함되었다. 이 실용적인 세션들은 이행(implementation)에 초점을 맞추어, PD들이 이행 계획을 구상(map out)하도록 돕고 교수개발 지도의 각 섹션에 대한 구체적인 자원을 제공했다. 중요하게도, 참가자들은 무엇이 효과적이었고 무엇이 그렇지 않았는지에 대한 자원과 경험을 동료들과 공유했다. 또한 부스터 세션에서는 비동기 온라인 학습 모듈, 새로운 교육 도구, 동기식 가상 학습 이벤트도 소개되었다. 이 저장소(repository)의 예로는 역량 위원회(Competence Committee) 운영에 관한 슬라이드 자료, 장기간에 걸친 코칭(coaching over time)의 기초 학습 모듈, CBD 교육과정 매핑을 위한 10단계에 관한 2페이지 분량의 인포그래픽(infographic) 등이 있다. 중요하게도, 이 확장된 지원 모델을 통해 Royal College는 무엇이 효과가 있고 없는지를 파악하고 추가적인 교수개발 도구를 반복적으로 설계(iteratively design)할 수 있었다. 이 정보는 프로그램 평가(Program Evaluation) 전략에도 통합되었다[6].

 

의미 있고 지속 가능한 변화를 장려하기 위해 타인과 협력하라 (Partner with others to encourage meaningful and sustainable change)

PD들(Program Directors)이 CBD 이행(implementation)에 있어 필수적인(vital) 존재로 확인되었지만, 지역 프로그램의 변화가 단 한 명의 개인의 책임일 수는 없다는 점이 분명했다. 2016년에 캐나다의 각 의과대학은 자신의 지역 프로그램을 지원하고 대학 수준(University level)에서 CBD 이행 과정을 안내(guide)할 CBME 리더(CBME Lead)를 지정했다. 이들은 지역의 요구(local needs)와 장벽(barriers)에 대한 고유한 지식을 사용하여 그들의 맥락에 맞게(specific to their context) 활동했다. Royal College는 지역적 이행 노력(local implementation efforts)을 확장하는 데 도움을 주기 위해 CBME 리더들에게 의존하고, 협력(collaborated with)하며, 지원을 제공했다. 공식적인 협력 이니셔티브(formal collaborative initiative)와 공식 및 비공식 피드백을 통해, 리더들은 Royal College의 교수개발자(faculty developers)들의 작업에 정보를 제공(inform)하는 데 도움을 주었으며, 이를 통해 Royal College가 가장 크고 일반적인 도전과제(challenges)에 집중할 수 있도록 했다. 정기 회의에는 도전과제와 격차(gaps)를 해결하고, 개선 기회를 논의하며, 적절한 경우 해결책을 공동 창작(co-create)하기 위한 시의적절하고 솔직한 대화(timely and frank conversations)가 포함되었다.

 

Royal College와 전국의 의과대학들은 함께 모든 집단의 학습 및 개발 요구(learning and development needs)가 이해되고 지원받을 수 있도록 착수했다(set out to). 교수개발은 Royal College(국가 수준)와 각 의과대학(지역 수준) 간의 공동 책임(shared responsibility)으로 다루어졌으며, Royal College로부터 두 수준의 교육 활동 모두에 대한 광범위한 지원이 있었다. PD들과 CBME 리더들을 포함한 프로그램 챔피언(program champions)들은 CBD로의 전환(transition) 기간 동안 임상 교수자, 수련생(trainees), 그리고 프로그램 행정가들을 지원했다. Royal College는 신뢰와 지원을 구축하고(build trust and support) 접근법과 자원의 공동 창작(co-creation)을 통해 지역적 노력을 확장하기 위해 그 교육가들과 파트너십을 맺었다.

피드백 요청: 요구를 파악하고 대응하라 (Ask for feedback: identify and respond to needs)

수년에 걸쳐 코호트 방식(cohorted fashion)으로 CBD를 전개(roll out)하기로 한 결정[3, 5]은 부분적으로 초기 코호트의 요구와 경험이 나중 코호트에게 제공될 지원 및 자원의 설계를 반복적으로 알릴 수 있다(iteratively inform)는 이해에서 비롯되었다(motivated by). CBD의 초기 몇 년 동안 주요 그룹의 요구를 파악하는 것은 복잡했는데, 이는 교육가들이 경험을 통해 학습함에 따라 많은 CBD 개념이 새롭고 계속해서 진화했기 때문이었다. 프로젝트의 가장 초기 단계에서, Royal College는 그들의 떠오르는 요구(emerging needs)를 이해하고 해결하기 위해 첫 두 전문 분야인 종양내과(Medical Oncology) 및 마취통증의학과(Anesthesiology)와 협력했다. 이들 전문 분야는 지원이 필요한 영역을 강조하는 데 결정적인 역할(critical role)을 했으며, 뒤따르는 전문 분야들을 지원하기 위해 콘텐츠가 생성될 때 그 초안을 작성하고 다듬는(drafting and refining) 데 도움을 주었다. 이러한 지속적 질 개선(CQI) 접근법은 시간이 지남에 따라 직접적인 자원(directed resources)과 지원의 수를 크게 증가시키는 결과를 낳았다. 다행히도, PD들은 학습자와 교수자들의 요구를 예리하게 인식하고(keenly aware) 있었으며, 이는 그들이 지원상의 지역적 요구와 격차를 파악하는 데 결정적인 역할을 할 수 있게 해주었다. Royal College와 CBME 리더들은 이러한 데이터를 사용하여 격차를 해결했는데, 종종 공동 창작뿐만 아니라 새로운 도구와 자원의 공유를 통해 이루어졌다. 초기 수용자(early adopters)들은 또한 학습 요구와 맥락의 이질성(heterogeneity)을 보여주는 데 핵심적이었으며, 이는 궁극적으로 나중 코호트들을 위해 사용된 교수개발 콘텐츠와 전략에 정보를 제공했다.

 

더 많은 전문 분야가 CBD로 전환함에 따라, Royal College는 진화하는 요구(evolving needs)를 이해하는 데 도움을 얻고자 공식 설문조사와 인터뷰를 시행했다. 또한 Royal College는 이해관계 집단(invested groups)으로부터 공식 및 비공식 보고서를 받았으며, 이는 반복적인 변화(iterative change)를 통해 접근법을 검증(validate)하거나 다듬는 데 도움이 되었다.

맞춤형 적시 학습 및 교육 생산 (Produce customizable just-in-time learning and teaching)

교수개발 구성 요소 일부에 대한 적시(just-in-time) 접근법은 Royal College의 교수개발 전략과 캐나다 각 의과대학에서 지역적으로 개발된 많은 전략의 핵심이었다. 초기에, Royal College의 자원 전달 구조는 최종 사용자(end user)에게 필요한 콘텐츠를 찾아야 하는 책임(onus)을 지우게 했다. 이 전달 모델(delivery model)은 사용자들이 콘텐츠를 검색하려는 동기가 매우 높으며, 그들이 세 가지 핵심 사항, 즉 무엇이 필요한지, 언제 필요한지, 어디서 얻을 수 있는지를 알고 있다고 가정했다.

 

Royal College가 주도한 CBD 이행 설문조사와 기타 직접적인 피드백은 전달 모델과 이해관계 집단의 지식에 대한 이러한 가정이 보편적으로 정확하지 않음(not universally accurate)을 보여주었고, Royal College가 제공하는 자원 및 지원과 교수진이 필요로 하고 쉽게 찾을 수 있는 것 사이에 지식의 격차(gap in knowledge)가 있음을 입증했다. 이를 해결하기 위해 2020년에 대상 집단은 CBD 이행의 "단계(stage)"에 따라 계층화(stratified)되었고, 그리하여 관련 콘텐츠가 그들이 필요로 할 때 그들에게 푸시(pushed)될 수 있도록 했다. 예를 들어, 동기식 가상 이행 부스터 세션(synchronous virtual implementation booster sessions) 이후, 역량 위원회(competence committees), 수련생 오리엔테이션, 성장 마인드셋(growth mindset), 교육과정 매핑(curriculum mapping)에 관한 자원을 포함하여, 참가자들의 현재 요구를 해결하기 위해 논의되었던 상위 10개 자원 목록이 그들에게 발송되었다. 또한, 특정 자원들은 각 전문분야의 PD들이 CBD 출범(launch)을 향한 여정에서 특정 이정표(milestones)를 충족할 때 그들에게 푸시될 수 있도록 준비되어 큐레이팅(curated)되었다.

CBD 교수개발을 위한 우선순위 대상 식별 (Identify priority targets for CBD faculty development)

CBD와 관련된 변화의 범위(scope of change)를 고려할 때, 주요 그룹들이 서로 다른 요구와 우려를 가지고 있다는 것은 놀라운 일이 아니었다. 국가 전문분야 위원회(PD 포함), CBME 리더, PGME 학장들은 일반적으로 Royal College로부터 직접적인 지원을 받았지만, 다른 대학 교수진(임상 교수자, 프로그램 행정가, 학장, 주임교수, 분과장 등)과 수련생들은 종종 지역 지원 팀과 직접 협력했다. 어떤 도전과제들은 기관 특이적(institution-specific)이었고 다른 것들은 전국적으로 더 공통적이었다. 주요 그룹의 요구와 의미 있는 접촉(meaningful contact)의 기회에 따라, 이는 Royal College에 의해 제공되는 일부 표적화된(targeted) CBD 교수개발로 이어졌다(그림 2).

 

그림 2 Competence by Design 이행에 있어 Royal College 교수개발을 위한 우선순위 대상(Priority targets).

 

다른 경우에는 지원이 의과대학에 의해 지역적으로 전달되었으며, 템플릿 및 도구를 포함한 다양한 Royal College 자원에 의해 지역적 노력이 강화(enhanced)되었다(표 1).

 

표 1 Competence by Design (CBD) 이행 시 교수개발을 위해 생성된 자원의 예시 (Examples of resources created for faculty development in the implementation of Competence by Design (CBD).)

CBD 콘텐츠를 위한 자원 (학습용) CBD 교수개발을 위한 자원 (교육용)
웨비나 (Webinars)

예: CBD 101
웨비나 (Webinars)

예: 역량 위원회 운영 방법 (How to run your competence committee)
이행 자료 (Implementation materials)

예: CBD 이행 플래너 (CBD Implementation Planner)
워크숍과 연계된 부스터 세션 (Booster sessions aligned with workshops)

예: CBD 이행 – 당신은 어디쯤 와 있는가? (Implementation of CBD – where should you be?)
슬라이드 자료 (Slide decks)

예: 당신의 교육과정에 EPA 매핑하기 (Mapping the EPAs to your curriculum)
역량 위원회 모듈 (Competence Committee modules)

예: 역량 위원회 구성 방법 (How to set up a competence committee)
기술 가이드 및 정책 (Technical guides and policies)

예: EPA 관찰 서식 (EPA Observation Forms)
코칭 모듈 (Coaching modules)

예: WBA 및 코칭에 교수진 참여시키기 (Engage your faculty in WBA and coaching)
팁 시트 (Tip sheets)

예: CBD 전공의: 당신이 알아야 할 핵심 사항 (CBD Residents: Key things you need to know)
슬라이드 자료 (CBD 이행을 담당하는 PD들이 사용할 수 있도록 수정 가능 – “즉시 사용 가능한(off the shelf)”)

예: 교수진을 위한 CBD 소개 (Introduction to CBD for faculty)
  임시 가이드 (The Meantime Guide) – 프로그램들이 CBD 설계를 시작하기를 기다리는 동안 참여할 수 있는 기회에 대한 가이드

예: 코칭 역할을 맡을 교수진 준비시키기 (Preparing faculty to take on the role of coaching)

 

이러한 확립된 연결 고리(established connections)를 활용하여 변화를 전략적으로 지원하는 것이 효율적이고 효과적인 교수개발의 핵심 중 하나임이 초기에 분명해졌다.

종단적 교수개발을 위한 CQI 주기 (CQI Cycles for Longitudinal Faculty Development)

CBD 교수개발 논리 모형의 사용은 Royal College가 교수개발 이니셔티브들이 그 목표를 달성하고 있는지를 평가할 수 있게 해주었다. 또한, CBD 내 교수 및 수련생 개발에 대해 지속적 질 개선(continuous quality improvement) 접근법이 사용되었다. 많은 활동과 자원에 대한 다중 소스(활동 후 평가 피드백, 공식 설문조사, 서밋, 인터뷰 등)로부터의 투입(Input)은 자원과 활동의 반복적 개발(iterative development)을 가능하게 하는 데이터를 제공했다. 견고한(robust) 프로그램 평가 데이터를 얻는 데 오랜 지연(long delay)이 있고 주요 지표에 대한 교란 요인(confounders)이 있어, 데이터 정보에 입각한 접근(data-informed approaches)을 취하는 데는 여전히 도전과제가 있다.

 

시간이 지남에 따라, Royal College는 CBD 지원 요청의 초점

  • ‘CBME의 기초’에서
  • 양질의 이행을 보장하는 방법(how to ensure quality implementation)’으로, 그리고
  • CBD 설계가 학습자, 프로그램, 그리고 가장 중요하게는 환자에게 어떻게 혜택을 줄 것인지에 대한 정보에 대한 열망으로 이동(shift)하기 시작했음을 관찰하고 추적했다.

수련생은 어떠한가? 교수진을 넘어선 변화 관리 (What about the trainees? Change management beyond faculty)

수련생은 분명히 PGME 시스템의 필수적인 부분(integral part)이지만, 전통적인 교수개발 활동은 드물게 학습자를 대상으로 한다. 사실, 과정 초기에 얻은 가장 중요한 교훈 중 하나는 CBD에 수반되는 변화에 대해 수련생을 준비시키는 것의 중요성이었다. 이것은 설계상의 명백한 격차(clear gap)이자 성공을 위한 열쇠로 인식되었다. 학습자를 위해 이 경우 CBD 이행과 관련된 변화 관리(change management)에 대한 기술을 구축하는 것이 결정적(critical)이며, 이는 전체적인 접근 방식(overall approach)에 내재되어야 함이 분명하다[7]. 수련생을 "소비자(consumer)"로 참여시키고 그들과 파트너십을 맺는 것은 그들이 과정에 기여할 수 있게 해주었다. 이것은 수련생 또는 수련생 조직과 직접적으로, 혹은 PD와 CBME 리더를 통해 간접적으로 수행되었다.

 

새롭게 출범한 CBD 프로그램들로부터의 초기 피드백은 이 수정된 과정에 대한 방향을 제시했다. 초기 코호트의 수련생들은 이 변화에 대해 준비가 부족하다고 느꼈으며(felt underprepared), 만약 그들이 CBD의 목표, 설계, 과정 및 그 안에서의 자신의 역할에 대한 정보로 무장되어 있었다면(armed with information), 이행 과정을 진전시키는 데 도움을 줄 수 있었을 것이라고 생각했다. 어떤 면에서 수련생들은 특히 출범 초기 시절에 이 변화를 통해 프로그램의 교수진을 옹호하고(champion) 지원하기에 적합한 위치(well positioned)에 있었다.

 

이러한 초기 피드백은 Royal College 이행 팀들로 하여금 PD들이 수련생들을 CBD에 오리엔테이션하기 위해 "즉시 사용할 수 있는(off the shelf)" 자원을 개발하게 이끌었다. 목표는 이 자원들을 PD들이 사용하기에 접근 가능하고, 실용적이며, 효율적이고, 쉽게 만드는 것이었다. 표 2는 수련생 개발 및 지원을 위한 자원의 예시를 제공한다.

 

표 2 Competence by Design (CBD) 이행 시 수련생 개발을 위해 생성된 자원의 예시 (Examples of resources created for trainee development in the implementation of Competence by Design (CBD).)

수련생 개발 자원 (TRAINEE DEVELOPMENT RESOURCES)
-  CBD에 대한 전공의 오리엔테이션 (A Resident’s Orientation to CBD)
전공의 가이드: 당신이 알아야 할 것 (Resident Guide: What you need to know)
전공의를 위한 CBD: 당신이 알아야 할 핵심 사항 (CBD for Residents: Key things you need to know)
전공의: 역량 위원회 (Residents: Competence Committees)
장기간에 걸친 코칭의 기초 학습 (Learning the Basics of Coaching over Time)
성장 마인드셋 개발 (Growth Mindset Development)

 

수련생들이 변화에 대한 목표와 근거(즉, 졸업하는 학습자의 역량을 보장함으로써 환자 진료 개선)와 자신의 프로그램을 위한 CBD 설계를 이해하는 것이 무엇보다 중요했다(paramount). 이 정보로 무장되었을 때, 그들은 지역 교육과정에 더 쉽게 참여(engage)할 수 있었고 자신의 책임(예: 정기적인 간격으로 일터 기반 평가(work-based assessments) 획득하기, 지도전문의와의 코칭 대화 시작하기(initiating coaching conversations), 성장 마인드셋(growth mindset) 활용하기, 역량 위원회의 역할 이해하기)을 인지할 수 있었다. 지속적인 수련생 설문조사와 PD 및 CBD에 관여된 다른 교수진으로부터의 피드백을 통해, 도구들은 반복적으로 진화(evolved iteratively)했다.

 

모든 자원은 CBD 웹사이트(https://www.royalcollege.ca/ca/en/cbd/cbd-tools-resources.html)의의) 단일 소스를 통해 이용 가능하게 되었으며, 이행의 적절한 시점에 PD들에게 직접 푸시(pushed)되었다. PD들과 다른 교수진이 각 도구를 소개받고 사용법을 배우기 위해 웨비나에 참석할 수 있는 다양한 기회(multiple opportunities)가 있었다.

 

도전과제, 촉진 요인, 그리고 얻은 교훈 (Challenges, enablers, and lessons learned)

CBD와 관련된 변화의 범위와 규모(scope and scale)를 고려할 때, 접근법이 시작된 이래 수많은 교수개발 도전과제(challenges)가 있었던 것은 놀라운 일이 아니다. 이러한 각 도전과제는 논리 모형의 투입 단계(input phase)에 반복적으로 정보(iteratively informed)를 제공하여, 원하는 산출(output)과 성과(outcomes)를 달성하기 위해 활동(activities)을 수정할 수 있도록 했다.

 

도전과제들은 논리 모형의 투입 단계에 따라 환경 스캔(environmental scan) 및 요구 사정(needs assessments)을 포함한 다양한 소스를 통해 구체적으로 식별되었다. 여기에는 CBD 리더들의 Royal College와의 정기적인 상호작용, 정기적인 PD 타운홀 미팅(townhalls), 전공의 서밋(summits), 웨비나, 기성 파트너 그룹과의 회의, Royal College 터치 포인트(Touch Points)펄스 체크(Pulse Checks), CBD 워크숍의 피드백, 그리고 국가 단체로부터의 공식 전공의 보고서 등이 포함되었다[4]. 특히 전공의 그룹은 그들의 렌즈를 통해 본 CBD 이행의 도전과제에 대해 매우 명확한 피드백을 제공했다[8, 9, 10]. 이러한 피드백에 대한 성찰(Reflections)은 프로젝트의 이후 단계에 정보를 제공(informed)했으며, 이 지속적 질 개선(CQI) 접근법을 사용하여 앞으로의 우려 사항을 해결하기 위한 활동의 변화를 이끌어냈다.

 

상위 5가지 도전과제는 표 3에 나열되어 있다. 여기에는

  • 교수진, 수련생 및 기타 파트너들의 이해와 참여(engagement)의 격차(gaps);
  • 프로그램 리더들이 CBD를 이행하기 위한 시간과 자원의 부족;
  • 요구의 이질성(heterogeneity);
  • 적절한 사람들에게 적절한 지원을 제공하는 것의 어려움; 그리고
  • 성장 마인드셋(growth mindset)으로의 문화 변화 등이 포함된다.

우리가 기술한 처음 두 가지 도전과제는 사용자 그룹의 이해도 및 시간/자원 문제와 관련이 있으며, 이 두 가지 모두 문헌에 기술된 바 있다[11, 12]. 우리가 직면한 다른 도전과제들은 대규모의 개념적 및 교육과정 변화 이니셔티브와 관련된 과정 및 시스템 문제(process and system issues)를 더 많이 반영한다[13, 14]. 더 나아가, 표 3은 Royal College 교육가들이 이러한 도전과제를 해결하는 데 성공적이라고 판단한 전략들과 얻은 교훈(lessons learned)을 포함하고 있다.

 

표 3 대규모 Competence By Design (CBD) 교수개발 이니셔티브에서 흔히 직면하는 도전과제, 전략, 그리고 얻은 교훈 (Commonly encountered challenges, strategies, and lessons learned in large-scale faculty development initiatives in Competence By Design (CBD).)



 

도전과제 (CHALLENGE) 대응 (RESPONSE) 얻은 교훈 및 지속적인 고충 (LESSONS LEARNED AND ONGOING STRUGGLES)
1. 교수진, 수련생 및 기타 파트너들의 CBD에 대한 참여 및 이해의 격차 * 일관되고(consistent) 포괄적인(comprehensive) 자원과 지침 제공

* CBD 정보를 지속적이고, 반복적이며, 정기적으로, 소량씩 소비(bite-sized consumption)하도록 장려

정기 회의 및 교육 시간에 CBD 부스터(boosters) 통합

특정 전문분야, 프로그램 및 관련 임상 워크플로(clinical workflow)*에 맞게 접근법을 조정(Tailor)

전개(rollout)를 지원할 신뢰할 수 있는 챔피언(champions) 식별
* CBD 오리엔테이션은 일회성 이벤트가 아니라 지속적인 과정(continuous process)임

* 짧은 리더십 주기(short leadership cycles)(예: PD 임기)가 있을 수 있는 곳에서는 반복(repetition) 대 새로운 온보딩(onboarding) 대 심화 콘텐츠(advanced content) 간의 균형을 유지해야 함

*  그룹들이 처음에는 무엇이 필요한지 모를 수 있음을 예상해야 함; 경험이 쌓이면 교수개발자들이 요구를 더 잘 예상(anticipate)할 수 있게 됨
2. 프로그램 리더들이 CBD를 이행하기 위한 시간 및 자원 부족 * 지역 챔피언(local champions)*을 만들기 위해 학교들과 파트너십 체결

주요 프로그램 리더들의 시간을 확보(free up time)하기 위해 역량을 구축하고 과업을 공유할 수 있도록 지역 자원을 학교를 대신하여 옹호(Advocate)*함 (예: 단일 학교 내 여러 프로그램 그룹이 역량 위원회 설계에 대해 함께 배우도록 주선)

구체적인 주요 요구(예: 역량 위원회, EPA 관찰, 코칭)를 해결하기 위해 포괄적인 콘텐츠와 소량의 콘텐츠 옵션을 모두 생성하거나 큐레이팅(curate)함

접근하기 쉽고, 공유 가능하며, 사용하는 데 노력이 거의 들지 않고, 지역적으로 조정(adapted locally) 가능한 콘텐츠와 자원 생성

주요 CBD 개념을 소개하고 강화(reinforce)하기 위해 기존 교육 이벤트를 활용(Leverage)
* 변화 피로(change fatigue)와 역량의 변동(variations)*에 유의해야 함. 특히 경쟁적인 주요 변화들(팬데믹, 인증 방문, 전자의무기록 도입 등)이 발생할 때 더욱 그러함

*  시간 문제는 정기적인 주의(regular attention)가 필요함; 목표는 CBD 프로세스가 개발 및 정교화되고 문화 변화가 진전됨에 따라 이러한 도전과제들이 덜 두드러지게(less prominent) 되는 것임
3. 프로그램, 전문분야 및 학교 간 요구의 이질성 (Heterogeneity of needs) * 국가 및 지역 수준의 교수개발 이니셔티브를 조정(coordinate)하기 위해서는 이질성에 대한 명확한 의사소통, 신뢰, 협상, 그리고 유연성(flexibility)*이 필요함


파트너의 요구를 경청하고 그들의 고유한 요구와 기대에 기초하여 접근법을 조정

변화하고 다양한 요구에 민첩하고 반응적(agile and responsive)일 수 있도록 자원 역량 유지
* CBD 설계를 채택하는 역량이 매우 다양하며 각 프로그램마다 시작점(starting point)이 다를 수 있음을 인식


* 모든 파트너가 당신의 지원을 필요로 하거나 원하는 것은 아니라는 점을 수용(Accept)


* 이것은 초기에 상당한 시간과 노력이 들었지만, 유연하게 대처하고 이질성에 적응하는 능력은 결국 시스템의 강점(strength)이 되었음
4. 적절한 지원과 자원을 적절한 시기에 적절한 사람들에게 제공하는 것의 어려움 * 그룹별로 지원과 자원을 계층화(Stratify) (예: 전환 단계 또는 역할에 따라)

* 예상되는 필요 시점에 표적 그룹에게 콘텐츠를 큐레이팅하여 푸시(push)

* 새로운 구성원을 환영하고 온보딩하는 네트워크(networks) 구축

* 빠른 승리(quick wins)와 챔피언을 축하

* 자원을 만들 때, 잠시 멈추어(pause) 그것이 적절하고, 접근 가능하며, 사용자가 찾고 이용할 수 있는 방식으로 정리되어 있는지 확인하는 시간을 계획

* 리더십 역할(PD, CBME 리더 등)의 이직(turnover)*을 예상

*  직접적으로 관련 없는 자원으로 사용자를 압도(overwhelming)하는 것을 유의해야 함
5. 교육 및 평가 문화를 성장 마인드셋(growth mindset)으로 변화시키기 * 평가에서의 역할뿐만 아니라, 수련생을 위한 EPA와 CBME의 교육 및 피드백 혜택을 강조

* 변화를 축소하라(Shrink the change): 무엇이 변하고 무엇이 그대로 유지되는지에 대한 명확한 방향 제시

* 성공을 입증하기 위해 모범 사례(best practices) 공유


* 성장 마인드셋 원칙을 저해(undermine)할 수 있는 행동과 관행을 인지 (예: 수련생들이 자신이 "위임(entrusted)" 받을 것이라고 느낄 때만 WBA를 요청하는 경우, 이는 저부담(low-stakes) 평가를 고부담(high-stakes) 평가로 바꾸고 수련생들이 역량 달성을 위한 지속적인 코칭의 혜택을 받지 못하는 문화를 조장함)

* 다른 요인들이 이 문화 변화를 어떻게 형성하고 있는지 신중하게 고려 (포트폴리오의 데이터 제시 방식, 역량 위원회 활동을 둘러싼 잠재적 교육과정(hidden curriculum) 등)


* 인내심을 가져라(Be patient): 의미 있는 문화 변화는 시간과 노력이 필요하며 서로 다른 맥락에서 다양한 속도(varying paces)로 일어남

고찰 (Discussion)

CBD는 캐나다 의학교육의 복잡한 생태계(ecosystem) 내에서의 시스템적 변화(systemic change)이다. 이 논문에서 우리는 Steinert의 교수개발 모형을 설계 틀(design framework)로, 논리 모형을 평가 틀(evaluation framework)로 사용하여 어떻게 국가 교수개발 전략의 이행을 반복적으로 안내(iteratively guided)했는지 기술하였다. 이 전략은 복잡하고 전국적인 의학교육 시스템을 아우르며(encompassed), 파트너십, 공동 창작(co-creation), 그리고 폐루프형 CQI 접근법(closed-loop CQI approach) 내 피드백의 통합을 활용(leveraged)했다.

 

이 모형은 개인과 그룹 모두를 위한 공식 및 비공식 이니셔티브를 포함하는 교수개발 접근법에 대한 최근의 관점을 반영한다[1]. Royal College의 교수개발 이니셔티브는 Steinert의 4분면(Steinert’s quadrants)을 반영한다. 예를 들어, 부스터 세션, CBD 워크숍, 웨비나, 그리고 국제 전공의 교육 학술대회(International Conference on Residency Education)의 세션들은 Steinert의 공식적 그룹 접근법(formal group approaches) 분면과 일치하는 반면, 코칭 및 역량 위원회 사례에 대한 온라인 모듈은 개인을 대상으로 하는 공식적 학습(formal learning) 분면에 적합하다. CBD로 일찍 전환한 코호트의 동료 PD로부터 받는 동료 코칭(Peer coaching) 또한 개인적 접근법과 일치하며, 이는 공식적이거나 비공식적일 수 있다. 실천 공동체(Communities of practice)(그룹/비공식 분면)는 예를 들어 역량 위원회 위원장(역량 위원회 위원장 포럼)이나 프로그램 행정가(프로그램 행정가 컨퍼런스)를 위해 명시적으로 활성화(explicitly enabled)되었다. 멘토링(Mentoring)은 CBME 리더들에 의해 수행되었다. 비록 PD들은 "그들의 책임의 본질(by the nature of their responsibilities)"에 의해 학습하지만(개인/비공식 분면), 이러한 학습은 기술 가이드나 팁 시트와 같은 자원에 의해 촉진되었다. 소셜 미디어의 사용은 Steinert[3]에 의해 언급되지는 않았지만, 주요 자원에 대한 인식을 구축하고 동참(buy-in)을 촉진하기 위한 Royal College 교수개발 전략의 중요한 부분이었다.

 

성공적인 CBD 이행에 기여하는 데 있어 수련생 개발(trainee development)의 중요성은 과소평가(underestimated) 되어서는 안 된다. 이는 수련생들에게 가치가 부가된 경험(value-added experience)으로 이어졌다. 전공의들이 변화의 주체(agents), 심지어 챔피언이 될 수 있도록 권한을 부여(Empowering)한 것은 과정에 대한 그들 자신의 참여를 향상시켰을 뿐만 아니라 다른 사람들을 위한 교수개발의 질도 향상시켰다[15].

 

이 논문에 기술된 성과(outcomes)는 의도적인 틀(deliberate framework)과 설계, 그리고 지속적인 참여를 위한 사회적 및 의사소통 요소(social and communication elements)를 육성(nurturing)하겠다는 헌신을 필요로 했다. 주요 파트너들이 다양한 의사소통 채널(PD 수준에서부터 PGME 부서 수준까지)을 사용하여 그들에게 필요한 것과 효과가 있는 것 또는 없는 것에 대한 의견(input)을 제공하도록 장려했다. 논리 모형을 사용하여 방향을 전환(pivot)하고, 조정(adjust)하며, 격차를 메우기 위해 초기 결과에 지속적인 주의를 기울인 것이 성공에 결정적(crucial)이었다. 기관에서부터 개인에 이르기까지 모든 수준에서 성장 마인드셋을 장려한 것은 모두가 변화에 대해 배우고 성과에 기여할 수 있게 했다.

 

이 국가 교수개발 이니셔티브의 성과는 부분적으로 Kotter의 변화 주도 8단계(Kotter’s eight steps for leading change)[16]를 반영할 수 있다. 교수개발 제공의 시급성(urgency)은 급진적으로 새로운 교육과정 모델인 CBD의 이행으로부터 발생했다. 파트너들과 협력하고, 목표와 방향에 합의하며, 이를 소통하는 것은 필수적인 요소였다. 장애물을 제거하는 것은 도전적이었으며, 이 정도 규모(magnitude)의 여느 변화와 마찬가지로 도전과제들에 직면했다. 여기에는 새로운 교육 모델에 대한 저항(resistance)과 동참 부족(lack of buy-in), 이행을 위한 자원 부족, 그리고 참여의 격차 등이 포함되었다. 우리는 이러한 도전과제를 해결하기 위해 사용된 몇 가지 전략을 개괄했다. 논리 모형은 교수개발 이니셔티브가 반복적으로 수정될 수 있도록 단기 성과(short-term outcomes)를 제공했다. 현재의 교수개발 프로그램은 동력을 유지(maintain momentum)하고 변화를 정착(anchor)시키도록 설계되어 있지만, CBD 이행은 여전히 진행 중인 작업(work in progress)이며, 교수개발은 그 목표를 달성하는 데 있어 계속해서 중요한 단계가 될 것이다.

 

 

 

 

 

 

Perspect Med Educ. 2024 Feb 6;13(1):56-67. doi: 10.5334/pme.961. eCollection 2024.

Implementing Competence Committees on a National Scale: Design and Lessons Learned

 

 

안녕하세요! 오늘은 역량 바탕 의학교육(CBME)의 핵심인 역량위원회(Competence Committee, CC)에 대한 흥미로운 논문을 소개해 드리려고 합니다. 캐나다 왕립 내과 및 외과 대학(Royal College of Physicians and Surgeons of Canada)이 국가 차원에서 CC를 도입하면서 겪었던 생생한 경험과 그들이 설계한 모델에 대한 이야기를 담고 있는데요. CBME 도입을 고민하거나 운영 중인 우리에게 아주 뼈가 되고 살이 되는 내용들이 많답니다.


1. 왜 역량위원회(CC)인가요?

과거의 전공의 수련 평가는 종종 '감'이나 단편적인 데이터에 의존하곤 했습니다. 하지만 사회가 의사에게 더 높은 책무성을 요구하면서, 프로그램적 평가(Programmatic Assessment)가 중요해졌죠.

이 논문에서는 CC의 역할을 단순한 평가자가 아닌, 방대한 데이터를 모아(curating) 학습자의 성장을 돕는 '집단 지성'으로 봅니다.

"CC는 학습 분석(learning analytics)을 통해... 정량적 및 정성적 평가 데이터를 사용함으로써 프로그램적 평가의 약속된 이점을 활용합니다."

"CCs capitalize on the promissory benefits of programmatic assessment by using quantitative and qualitative assessment data... through learning analytics."


2. Royal College 모델의 핵심 원칙

캐나다 모델은 몇 가지 중요한 원칙 위에 세워졌습니다.

  • 발달적 관점 (Developmental view): 모든 전공의는 성공할 잠재력이 있다고 믿고 성장을 돕습니다. 🌱
  • 프로그램적 평가 (Programmatic Assessment): 다양한 출처의 데이터를 종합적으로 봅니다. 📊
  • 집단 의사결정 (Group Decision-making): 한 사람의 편향을 줄이기 위해 여러 사람이 모여 논의합니다. 🤝

특히 흥미로운 점은 CC가 '최종 역량'만 보는 게 아니라, 위임 가능한 직무(Entrustable Professional Activities, EPAs)를 기반으로 단계별 진행 상황을 판단한다는 거예요.


3. 현장의 목소리: 도전과 교훈 (Challenges & Lessons Learned)

하지만 이론과 현실은 다르죠? 😅 연구진은 대규모로 CC를 도입하면서 겪었던 5가지의 현실적인 어려움과 교훈을 아주 솔직하게 털어놓았습니다.

① 표준화 vs 유연성 (Fidelity with Flexibility)

국가 표준을 지키는 것도 중요하지만, 병원마다 사정(규모, 자원 등)이 너무 다르다는 게 문제였습니다. 연구진은 무조건적인 통일보다는 '유연성'이 필수라고 강조합니다.

"이러한 맥락적 차이점들은 지역적 적응을 필요로 합니다: 만능의 혹은 지나치게 규범적인 접근 방식은 있을 수 없습니다."

"These contextual differences necessitate local adaptations: there cannot be a one-size-fits-all or overly prescriptive approach."

② 자원 문제 (Resourcing)

역시 돈과 시간, 사람이 문제죠. 💸 새로운 평가 시스템을 도입하는 데 드는 비용을 초기에 너무 과소평가했다는 고백이 나옵니다.

"CBD를 시행하는 데 필요한 자원 중 많은 부분이 과소평가되었거나 처음에 식별되지 않았으며, 이는 상당한 도전을 제기했습니다."

"Many of the resources required to implement CBD were underestimated or not identified at the outset, which posed significant challenges."

③ 평가 문화의 변화 (Changing the Culture)

가장 어려운 건 사람의 마음을 바꾸는 것이었습니다. 전공의들은 저부담(low-stakes) 평가조차도 자신을 떨어뜨릴 수 있는 시험으로 받아들여 방어적으로 나오기도 했고, 교수님들은 단순히 '문제아'를 찾아내는 데만 집중하기도 했으니까요.

연구진은 이 '이중 목적'을 이해시키는 게 정말 어렵다고 말합니다.

"고부담 CC 결정(high-stakes CC decisions)을 위한 저부담 관찰(low-stakes observations)의 이중 목적의 본질을 소통하는 것은 학습자와 교수진 모두가 채택하거나 받아들이기에 도전적이었습니다."

"Communicating the nature of the dual purpose of low-stakes observations for high-stakes CC decisions has been challenging both for learners and faculty to adopt or accept."


4. 맺음말: 이것은 '진화'하는 과정입니다

이 논문이 주는 가장 큰 울림은 CC 도입이 한 번에 끝나는 이벤트가 아니라는 점입니다. 계속해서 수정하고, 소통하고, 다듬어가는 과정이라는 것이죠.

"CC의 대규모 시행은 단일 시점에서 발생하는 것이 아니라 지속적인 지원을 필요로 하는 진화하는 과정(evolutionary process)입니다."

"Large-scale implementation of CCs does not occur at a single point but is an evolutionary process requiring ongoing support."

우리나라의 의학교육 현장에서도 역량 중심 교육이 자리 잡아가고 있습니다. 캐나다의 이 생생한 경험담이 우리의 시행착오를 줄이는 데 좋은 나침반이 되기를 바랍니다. 🧭


서론 (Introduction)

더 큰 사회적 책무성(greater social accountability)의 시대에, 대중은 졸업 후 의학교육(postgraduate medical education, PGME) 시스템이 감독 없는 진료(unsupervised practice)로 나아가는 졸업생들의 역량(competence)을 보장하기 위한 견고한 평가 과정(robust assessment process)을 갖추기를 기대하게 되었습니다 [1]. PGME에서 수련 프로그램 책임자(training program directors)들은 훈련생의 진척도(progress)를 모니터링할 책임이 있습니다. 과거에는 임시 데이터(ad hoc data), 지도전문의의 원격 회고적 인상(remote retrospective impressions), 또는 성과의 대리 지표(proxy measures)에 의존하는 과정(processes)을 사용하여 이를 수행하곤 했습니다 [2, 3]. 최근 몇 년 사이, 졸업 후 수련은 역량 바탕 의학교육(competency based medical education, CBME)의 광범위한 도입과 함께 변화되었습니다; 이는 프로그램적 평가(programmatic assessment)의 사용역량위원회(Competence Committee, CC)에 의한 집단 의사결정(group decision-making)을 장려함으로써 훈련생 진척도의 구조를 개선하고자 하는 졸업 후 수련의 새로운 모델이며, 프로그램이 진척도에 대한 총괄 평가(summative assessment)를 위해 훈련생 성과 데이터를 체계적으로 수집(systematic collection)하도록 안내합니다 [4, 5]. PGME CBME 시스템에서 CC의 사용이 보편적으로 채택된 것은 아니지만, 현재까지 미국[6, 7, 8, 9, 10]과 캐나다[11, 12, 13]에서 광범위하게 도입되었으며, 국제적으로도(예: 네덜란드 및 대만) 관심이 커지고 있습니다 [14, 15, 16].

 

프로그램적 평가(programmatic assessment)에서,

  • 훈련생들이 수련 과정을 진행함에 따라 그들은 졸업생에게 기대되는 능력(expected abilities)에 대한 일련의 진술로 기술된 교육과정의 성과(outcomes)를 달성해야 합니다.
  • 평가 프로그램은 프로그램이 훈련생 성과 데이터를 체계적으로 수집(systematic collection)할 수 있도록 안내하기 위해 평가 전략(assessment strategies)과 평가 내용 및 맥락의 범위(breadth)를 명시적으로 개략합니다 [17].
  • 교육과정 동안 원하는 역량을 달성해가는 학습자의 진척도(progress)에 대한 많은 표본(samples)이 획득됩니다.
  • 다수의 도구많은 다른 평가자들이 훈련생 진척도 평가에 다양한 투입(inputs)을 제공합니다.
  • 비록 프로그램적 평가는 CC의 도입 없이도, 예를 들어 프로그램 책임자가 다양한 평가 투입물을 검토하는 방식을 통해 달성될 수 있지만, 검토해야 할 데이터의 양(volume of data)과 개별 검토자가 가질 수 있는 내재된 주관적 편향의 위험(risk of inherent subjective biases) 증가를 고려할 때 이는 도전적일 수 있습니다 [2, 3, 18].
  • 정확하고 효과적으로 수행될 때, 프로그램적 평가는
    • 학습을 최적화(optimizes learning)하고,
    • 원하는 성과를 향한 학습자의 진급에 관한 의사결정을 촉진(facilitates decision making)하며,
    • 프로그램의 질 향상 활동(quality improvement activities)에 정보를 제공합니다 [19].

캐나다 왕립 내과 및 외과 대학(Royal College of Physicians and Surgeons of Canada, 이하 Royal College)이 설계하고 시행한 PGME에 대한 혁신적인 역량 기반 변화인 설계를 통한 역량(Competence by Design, CBD)에서,

  • CC는 학습 분석(learning analytics)을 통해 전자적으로 수집되고, 큐레이팅(curated) 되며, 개별 학습자 및 학습자 집단을 설명하는 의미 있는 정보(meaningful information)로 대조된 정량적 및 정성적 평가 데이터(quantitative and qualitative assessment data)를 사용함으로써 프로그램적 평가의 약속된 이점(promissory benefits)을 활용합니다 [20].

프로그램적 평가와 CC는 개선된 평가 시스템(improved assessment systems)과 고부담 총괄 결정(high stakes summative decisions)(예: 감독 없는 진료)에 대한 타당도 근거(validity evidence) 요구에 대한 직접적인 대응으로 CBD 내에서 서로 연결된 방식으로 도입되었습니다 [21, 22]. 학습 분석 및 기타 모든 형태의 평가 데이터는 진급(progress), 승급(promotion), 그리고 궁극적으로는 감독 없는 진료에 대한 준비 상태(readiness for unsupervised practice)에 대해 집단적 판단(collective judgment)을 내리기 위해 CC를 구성하는 훈련되고 전담된 교육자 그룹에 의해 준비되고, 검토되며, 종합(synthesized)됩니다 [23]. CC의 결정은 집단적으로 이루어지며, 따라서 역량을 향한 훈련생의 진행에 대한 폭넓은 그림(broad picture)을 만들기 위해 다양한 관점(multiple perspectives)을 통합합니다.

 

CC에 대한 논리적 근거는 집단 의사결정(group decision-making)에 관한 문헌에서 도출되는데, 이는 집단이 개인보다 더 나은 결정을 내릴 수 있으며 [24], 더 많은 정보 공유를 촉진하는 체계적인 집단 절차(systematic group procedures)가 집단 결정의 품질(quality)을 향상시킬 수 있음을 시사합니다 [25, 26]. 따라서 CC는 훈련생의 성과와 진척도에 대한 판단을 내리기 위해 평가 데이터를 집단적으로 종합하고 해석하는 집단 의사결정 과정(group decision-making processes)을 활용할 수 있습니다. CC 내에서 공정한 의사결정(fair decision-making)을 유지하기 위해서는, CC가 훈련생의 진척도를 검토하는 방식에 대한 일관된 과정과 절차(consistent processes and procedures)가 있어야 합니다. 이 총괄 평가의 타당도(validity)는 개별 프로그램 내 평가 데이터의 양, 품질, 해석의 가변성(variability)에 의해 영향을 받을 수 있습니다 [27, 28, 29]. 총괄적 역량 결정을 위한 집단 과정의 많은 이점이 제안되었지만, CC가 오류가 없는 것(infallible)은 아닙니다 [26]. 구성원의 다양성 부족, 열악한 데이터 품질 및 종합, 비효율적인 정보 공유, 그리고 집단 사고(groupthink)가 모두 집단 결정의 품질과 방어 가능성(defensibility)을 위협할 수 있다는 증거가 증가하고 있습니다 [30, 31]. 따라서 국가적 규모로 CC를 설계하고 시행할 때 이러한 위협들에 대해 특별한 주의(special attention)를 기울여야 합니다.

 

이 논문에서 우리는 CBD에서 사용되는 Royal College의 CC 모델(Royal College model of CCs)을 설명합니다. 여기서 우리는 모델 디자인의 논리적 근거와 원하는 영향(desired impact)을 성찰하고, 캐나다 Royal College 전문과목 PGME에서 CC가 기능하는 데 있어 주목된 몇 가지 초기 성공과 도전(early successes and challenges)을 개략합니다. 우리의 저자 그룹은 다양한 전문 분야의 임상 교육자(physician clinician educators)를 포함합니다. 이 그룹은 Royal College CC 설계, 시행 및 교수 개발 지원에 관여한 구성원들을 포함하므로 이 여정을 통한 포부(aspirations)와 도전(challenges) 모두에 대해 상세한 인식을 가지고 있습니다. 우리는 이러한 렌즈가 이 국가적 시행을 개발하고 지원하기 위해 계속 일하는 사람들과 관련된 편향(biases)을 가져올 수 있으며, 이것이 논리적 근거 또는 시행으로 고군분투하는 사람들의 것과는 다를 수 있음을 인정합니다. 그러나 우리 저자 그룹의 모든 구성원은 각자의 지역 기관에서 CC 위원장(DD, JK, WC)이거나 CC 구성원(AO, JF, LS, RA)이었거나 현재 활동 중이므로, 현장에서 CC 과정에 대한 생생한 경험(lived experience) 또한 가지고 있어 이러한 관점들의 균형을 맞추는 데 도움이 될 수 있습니다.

Royal College의 국가적 역량위원회 모델 (The Royal College’s national model of competence committees)

CC의 구조와 기능(structure and function)은 의료 교육 시스템 전반에 걸쳐 많은 유사점을 가지고 있지만, Royal College는 캐나다 내 CC 업무의 기반이 되는 국가적 모델(national model)을 개발했습니다 [32]. 캐나다 전문의 CBD 모델의 CBME 내 CC들은 최적의 집단 기능을 촉진하기 위해 Royal College가 권장하는 과정과 절차(processes and procedures)에 따라 국가적 차원에서 안내를 받습니다 [33]. 국가적 CC 모델이 근거하고 있는 핵심 원칙(key principles)은 포괄적인 CBD CBME 접근 방식에서 파생되었으며 Table 1에 요약되어 있습니다.

 

Table 1 캐나다 왕립 내과 및 외과 대학의 역량위원회(Competence Committee) 설계의 핵심 원칙

역량위원회 원칙 (COMPETENCE COMMITTEE PRINCIPLE) 설명 (DESCRIPTION)
학습자에 대한 발달적 관점 (Developmental view of a learner) 시스템은 모든 훈련생의 역량 진척(progression of competence)을 지원하고 모든 학습자가 인증(certification)에 이르는 경로를 갖도록 설정됨.

CC는 올바른 기회가 주어진다면 모든 학습자가 성공할 잠재력이 있다는 입장을 취함.

CC는 역량을 향한 훈련생의 발달을 위한 다음 단계에 대한 지도와 결합된 맞춤형 학습 계획(tailored learning plans)을 통해 학습자를 지원함.
프로그램적 평가 (Programmatic assessment) CC는 다양한 데이터 소스(data sources)와 맥락에서 나오는 다수의 데이터 투입을 활용하는 평가에 대한 포괄적인 접근 방식(comprehensive approach)을 사용함.

데이터 대조 및 큐레이션(Data collation and curation)은 훈련생의 전체 평가 포트폴리오에 대한 심층적인 검토(in-depth review)를 가능하게 함.
규칙이 있는 정의된 집단 과정 (Defined group process with rules) CC는 편향을 완화(mitigate bias)하고 방어 가능한 집단 결정(defensible group decisions)을 도출하기 위한 전략을 적용하여 공정하고 정의로운 방식으로 데이터를 해석할 것으로 기대됨.

CC의 검토와 심의는 다양한 견해(diverse views)의 고려와 합의 형성(consensus building)을 허용해야 함.

CC는 프로그램 및 기관 내에서, 그리고 프로그램 및 기관 간에 충분한 일관성(consistency)을 허용하기 위해 공통된 기대치와 과정을 가질 것으로 기대됨.
준거 지향 의사결정 (Criterion-referenced decision-making) CC는 의사결정에 정보를 제공하기 위해 각 국가 전문과목 위원회(national specialty committee)가 수립한 사전 정의된 진척 지표(predefined markers of progression)에 의해 안내됨.
투명성 (Transparency) CC는 성취, 진척 및 승급에 대한 권고를 하기 위해 훈련생 데이터를 검토하고 심의함에 있어 구조화된 과정과 절차(structured processes and procedures)를 따를 것으로 기대됨. 이러한 과정과 절차는 관련된 모든 투자 그룹(invested groups), 특히 훈련생에게 명확하게 전달되어야 함.
명확한 의사소통 (Clear communication) CC는 위원회의 산출물이 모든 관련 투자 그룹에게 전달되도록 보장하기 위해 명확한 의사소통 전략(clear communication strategies)을 사용할 것으로 기대됨.

CC: Competence Committee (역량위원회)

 

CBD에서의 CC 과정은 각 Royal College 국가 전문과목 위원회가 분야별 콘텐츠(discipline-specific content)를 만들기 위해 사용한 CBD 교육과정 설계 구조에 강력한 영향을 받습니다 [34]. CBD의 특징과 CC 설계의 기초가 되는 핵심 원칙 간의 연결 고리는 Table 2에 요약되어 있습니다. Royal College CBD 모델에서, 각 국가 전문과목 위원회는 표준화된 설계 과정(standardized design process)(전문 과목 교육 설계[specialty education design, SED] 워크숍 시리즈)에 참여했습니다 [35]. 이 과정에서 위원회들은

  • 훈련생 성과에 대한 단계별 기대치(stage-specific expectations)를 설정하고
    • 위임 가능한 직무(entrustable professional activities, EPAs),
    • 필수 훈련 경험, 그리고
    • 해당 분야에 특화된 CanMEDS 역량에 대한 평가 가이드를
  • 포함하는 훈련 및 평가 표준(standards)을 만들었습니다 [36].

SED 워크숍은 Royal College와 일선 임상의 및 프로그램 책임자들이 공동 창작(co-creation)에 참여할 기회를 제공했으며, 이는 지역 프로그램들이 그들의 CC 관행에 표준을 통합할 가능성을 극대화했습니다. 각 지역 프로그램의 CC는 훈련생의 진척과 승급에 대한 권고에 정보를 제공하기 위해 이러한 국가적 평가 표준을 사용합니다. 국가 전문과목 위원회의 작업과의 이러한 연결은 다양한 지역 CC 맥락 전반에 걸쳐 일관성(consistency)을 촉진하면서도, 동시에 프로그램들이 그들의 특정 지역 맥락에 고유한 역량을 포함할 수 있도록 허용합니다. CC는 지역 및 국가 역량 기대치가 모두 충족되도록 보장해야 합니다.

 

Table 2 주요 CBD 설계 특징과 역량위원회 원칙 간의 연결

 

 

CBD 설계 특징 (CBD DESIGN FEATURE) 역량위원회 원칙 (COMPETENCE COMMITTEE PRINCIPLES)
  훈련생에 대한 발달적 관점 프로그램적 평가 규칙이 있는 정의된 집단 과정 준거 지향 의사결정 투명성 명확한 의사소통
프레임워크 (Framework)
국가 전문과목 및 단계별 EPA 평가 기대치와 필수 훈련 경험이 CC 결정을 안내함    
WBA는 EPA 평가 및 의사결정을 지원하는 데이터를 제공함        
국가 인증 표준은 CC의 최소 요구사항을 보장함      
국가 가이드라인은 CC 과정 및 지역적 시행에 대한 공통된 기대치를 개략함      
CC는 기존 프로그램 위원회 구조의 소위원회임        
포괄적인 데이터 기반 검토는 진척 결정에 정보를 제공하기 위해 정량적 및 정성적 데이터 소스 모두를 중요하게 여김  
역량 달성을 보장하기 위한 지역 수준에서의 교육 경험의 유연성        
의사소통 및 교수 개발 (Communication and faculty development)
국가 기술 지침(National technical guides)은 CC가 국가 정책, 과정 및 인증 표준을 따라야 하는 영역과 지역 CC가 그들의 환경에 맞게 조정할 수 있는 유연성이 있는 영역을 개략함      
국가 문서, 표준 및 기대치는 쉽게 접근 가능함        
국가적, 목표 지향적 교수 개발 이니셔티브는 CC의 생성 및 운영을 지원함
확대된 CC 역할 (Expanded CC role)
CC 검토는 개별화된 학습 계획 개발에 기여함    
CC는 국가적으로 프로그램, 전문과목 및 CBD CQI의 주체(agents)로서 통합됨        

CBD: Competence by Design (설계를 통한 역량); CC: Competence Committee (역량위원회); CQI: continuous quality improvement (지속적 질 향상); EPA: entrustable professional activity (위임 가능한 직무); WBA: workplace-based assessment (직장 기반 평가).

 

Royal College는 CBD 모델에서 CC의 구조와 기능을 안내하기 위한 문서들을 제작했습니다 [32, 33]. 이 문서들은 모든 Royal College 인증 프로그램 전반에 걸쳐 CC 모델 적용의 일관성(consistency)을 지원합니다; 여기에는

  • CC의 적절한 구성원 자격에 대한 지침,
  • CC 과정 및 절차(CC processes and procedures) [33],
  • CC를 위한 위임 사항 샘플(sample terms of reference for a CC) [32], 그리고
  • CC 의사결정에서의 유연성 영역(areas of flexibility)뿐만 아니라
  • 구체적인 요구사항을 개략한 기술 지침(technical guide) [37]이 포함됩니다.

구성원 자격과 관련하여, 최소 3명의 구성원이 권장되며 위원회는 다양한 구성원(예: 연차, 성별, 도시/농촌, 의사 및 비의사 구성원 등)을 포함하도록 장려됩니다; 이는 데이터의 다양한 해석(diverse interpretation)과 다른 관점(differing perspectives)의 고려를 촉진하는 것을 목표로 합니다 [38]. 프로그램 책임자들은 CC와 전공의 수련 프로그램 위원회(residency program committee, RPC) 간의 의사소통을 촉진하기 위해 의결권이 없는 구성원으로 CC에 참여하도록 장려되지만, 이해 상충(conflicts of interest)과 과도한 업무량을 피하기 위해 CC 위원장을 맡는 것은 지양됩니다 [39]. 과정 및 절차는 CC가 검토 시 임상 역량을 넘어선 평가 포트폴리오에 대해 전인적이고 포괄적인 접근 방식(holistic comprehensive approach)을 적용할 것이라는 기대치를 제시합니다 [40, 41]. CC는 EPA 관찰과 같은 직장 기반 평가(workplace-based assessments, WBAs), 비-WBA 임상 평가(예: OSCE 및 시뮬레이션 평가), 비임상 평가(예: 연구 역량 및 교육 평가)를 포함할 수 있는 다양한 평가 데이터에 접근하고 이를 통합할 것으로 기대됩니다. CC가 수행하는 검토는 데이터 기반(data driven)이어야 하며 훈련생의 평가 포트폴리오에 문서화된 증거(evidence)에 근거해야 합니다. 이는 투명성(transparency)을 촉진하고 전해 들은 말(hearsay)이나 내재된 편향을 최소화하는 역할을 합니다 [25, 42]. CC 회의 중심의의 효율성(efficiency)을 유지하면서 훈련생 포트폴리오에 대한 심층 검토(deep review)를 가능하게 하기 위해, CC는 CC 토론에 정보를 제공하기 위해(대체하는 것이 아니라) 개별 파일에 대한 심층 검토를 완료할 주요 검토자(primary reviewer)를 배정하도록 장려됩니다. 프로그램은 CC의 권고 사항을 훈련생과 공유하는 것이 필수입니다. Royal College는 프로그램들이 훈련생이 CC가 만든 권고 사항을 이행하기 위한 계획을 세우는 것을 돕기 위해 장기 코치(longitudinal coaches) [14, 43, 44]를 제공하도록 장려하지만, 프로그램들은 동일한 목적을 수행하는 다른 시스템을 개발할 수 있는 유연성을 가집니다.

 

Royal College CBD 모델은 CC가 최종(수련 종료 시) 역량(terminal competencies)의 성취만을 판단하는 것이 아니라, 단계별로 발달 순서가 정해진 EPAs(stage-specific developmentally sequenced EPAs, RCEPAs)에 대한 훈련생의 성취를 판단한다는 점에서 독특합니다. 이러한 역량에 대한 판단은 각 단계별 EPA에 대한 범주형 성취 결정(categorical achievement decisions)(예/아니오)이며 전반적인 역량을 향한 훈련생의 진척에 기여합니다. 또한, CC는

  • 학습자의 상태(status)(예: 예상대로 진행 중[progressing as expected], 예상대로 진행되지 않음[not progressing as expected], 가속된 진행[accelerated progress]),
  • 한 단계에서 다음 단계로의 진급 준비 상태(readiness for progression),
  • 인증 시험 응시 준비 상태(readiness for sitting the certification examination),
  • 그리고 궁극적으로 인증 준비 상태(readiness for certification)에 대해 RPC에 권고를 합니다 [45].

이것들은 EPA 관찰 데이터뿐만 아니라 포트폴리오 내의 전체 성과 데이터 수집에 의해 정보를 얻는 포괄적인 결정(comprehensive decisions)이어야 합니다. Royal College CBD 모델에서, CC는 단계 내 및 단계 간에 이러한 총괄적 상태 권고(summative status recommendations)를 부여하기 위해 평가 데이터를 종합하는 과업을 맡습니다; 다른 CBME 모델에서처럼 각 EPA나 마일스톤에 대해 신뢰의 연속 척도(continuous scale of entrustment)를 따라 "수준"이나 역량의 정도를 결정하지 않습니다 [46, 47].

 

캐나다 PGME에서,

  • Royal College는 CC의 국가적 시행을 지원하는 독특한 위치(unique position)에 있습니다. 국가 교육 설계 및 표준 설정, 프로그램 및 기관 인증, 그리고 개별 의사 자격 부여(credentialing)에 대한 책임으로 인해, Royal College는 CC 기능의 여러 측면에 대한 표준을 설정합니다. CBME 이전에는, Royal College는 구체적으로 항목화된 시간 기반 경험(time-based experiences)의 성공적인 완료가 전문의 인증을 위한 시험 준비 및 자격 부여 결정의 기초가 되는 시스템을 가지고 있었습니다.
  • CBD에서는, 지역 CC가 국가 전문과목 시험 응시 자격과 인증 자격을 권고할 책임이 있습니다. 그러나 Royal College가 이러한 시험을 주관하고, (대부분 CC의 권고에 기초하여) 후보자에게 자격을 부여하며, 인증을 수여합니다.
  • Royal College는 CC가 적용하는 훈련 및 평가에 대한 국가 표준과 CC 기능에 대한 국가적 기대치를 개발하는 반면, CC에 대한 책임과 감독(oversight)은 각 대학의 PGME 사무국 수준에 있습니다.
  • CC에 대한 이러한 지역적 감독은 Royal College가 회원으로 있는 캐나다 전공의 과정 인증 연합(Canadian Residency Accreditation Consortium, CanRAC)을 통한 프로그램 인증의 국가 시스템에 의해 통제됩니다; CanRAC는 프로그램 및 기관 PGME 수준 모두에서 CC에 대한 표준을 포함합니다 [48, 49].

Royal College CBD CC 모델은 안전하고 고품질의 환자 진료를 제공하는 졸업생을 배출하기 위한 감독의 책임이 세 주체,

  • Royal College와 그 국가 전문과목 위원회,
  • 지역 프로그램과 그들의 CC, 그리고
  • 지역 기관의 PGME 사무국
    • ...간에 공유된다(shared)는 개념을 인식하고 받아들입니다.

 

CBD에서 CC의 중요한 목표는 훈련생에게 그들의 역량과 숙달(mastery)의 추가적인 발달을 촉진하기 위한 지원과 지도가 제공되도록 보장하는 것을 목표로 하는 발달적 접근(developmental approach)을 적용하는 것입니다 [50, 51]. 예를 들어, CC는 단계 진급이나 국가 인증 시험에서의 성공을 지원하기 위해 학습 계획(learning plans)이나 임상 경험을 제안할 수 있습니다. 그러나 이는 CC가 훈련생의 진척 결정과 역량 성취 보증에 있어서 문지기(gatekeeper) 또는 공공 안전 역할(public safety role)을 수행하는 동시에, 추가적인 성장을 위한 목표를 식별하고 방향을 제공하는 발달적 접근을 취해야 한다는 이중 목적(dual purpose)에 직면해 있음을 의미합니다.

 

Royal College CBD CC 모델에서, CC는 추가적인 역할을 가집니다: 바로 분야별 전문과목 위원회의 지속적 질 향상(continuous quality improvement, CQI) 활동입니다 [31, 52]. 전문과목 위원회는 정기적으로 그들의 표준을 검토하도록 요청받습니다. 이 검토의 일환으로, CC는 프로그램 책임자를 통해 국가 평가 가이드에 수정이 필요할 수 있는 경우나 가이드의 업데이트된 버전이 요구될 수 있는 사례를 식별하고 국가 전문과목 위원회에 보고하도록 초청받습니다. 이는 지역 CC의 관행 및 경험과 전문과목 교육 설계의 국가적 CQI 사이의 연결 고리(link)를 제공합니다.

 

도전과제와 얻은 교훈 (Challenges and lessons learned)

CC(역량위원회)의 대규모 시행(large-scale implementation)은 복잡한 과업(complex undertaking)이었기에, Royal College의 교육자, 프로그램 책임자, 그리고 CC 위원장들이 과정 중에 여러 도전과제(challenges)에 직면한 것은 놀라운 일이 아닙니다. 그들의 경험과 그들이 그러한 도전들을 완화(mitigate)하기 위해 사용한 전략들은 규모에 맞게 CC를 시행하려고 계획 중인 다른 이들이 유사한 도전에 직면할 수 있으므로, 그들을 안내할 수 있는 얻은 교훈(lessons learned)을 제공합니다 (Table 3 참조). 우리는 모든 해답(all the answers)을 가지고 있지는 않으며, 이 여정의 일부로서 해결책을 공동 창조(co-create)하기 위해 우리의 PGME 및 Royal College 커뮤니티 내의 관여된 그룹(invested groups)들과 계속 협력하고 있습니다. 우리는 현재까지 배운 내용을 제시합니다.

 

Table 3 역량위원회의 대규모 시행에서의 도전과제와 얻은 교훈

 

 

도전과제 (CHALLENGES) 도전에 대한 ROYAL COLLEGE의 대응 (ROYAL COLLEGE RESPONSES TO CHALLENGES) 과정에서 얻은 통찰과 교훈 (INSIGHTS AND LESSONS WE LEARNED ALONG THE WAY)
1. 유연성을 유지하면서 과정과 절차 표준화하기 (Standardizing process and procedures while maintaining flexibility) 국가적 위임 사항(terms of reference) 및 정책 문서 배포

기술 지침(technical guide)을 통해 지역 구조에 대한 적응을 허용하고 주인의식(ownership)을 높이기 위해 과정 내 어디에 유연성이 있는지 명확히 함

유사한 맥락을 가진 프로그램 간의 모범 사례를 식별하고 개발하도록 돕기 위해 CC 위원장 포럼을 통해 실천 공동체 모델(community of practice model) 생성

과정이 의도대로 시행되었는지 확인하고 예측하지 못한 도전을 식별하기 위해 관여된 그룹에게 배포되는 연례 펄스 조사(annual pulse surveys) 개발
일관된 메시지와 관행을 보장하기 위해 명확한 지침(clear guidance)단순화된 기대치 제공

만능 접근법(one-size-fits-all approach)은 없으므로 지역적 적응을 예상할 것

개입의 유연성과 표준화 사이의 긴장(tensions)을 예상할 것

관행의 분기(divergence)를 식별 및 완화하고 시행 중 충실도와 무결성을 유지하는 데 도움이 되는 핵심 가능 요인(key enabler)으로 프로그램 평가를 사용할 것
2. 기관, 프로그램 및 시스템 내의 맥락적 가변성 다루기 (Addressing the contextual variability within institutions, programs, and systems) 각 대학 내에 리드(Leads)를 둔 국가 CBME 리드 그룹(national CBME Leads group)을 식별하고 모집함

각 대학 내 동료 네트워크와 CC 위원장 포럼을 통해 개별 전문과목을 통한 외부 네트워크를 생성함

Royal College와 관여된 그룹 간의 지속적인 양방향 대화(ongoing two-way dialogue)를 개발함

명확한 의사소통, 모범 사례 공유, 시행 상의 공통된 도전 식별을 위해 다수의 대면 및 가상 CC 위원장 포럼을 조직함
각 대학과 개별 프로그램은 적응 가능한 시행(adaptable implementation)을 필요로 하는 고유한 맥락(unique contexts)을 가질 것임을 인식할 것

CC 시행을 적응시키는 방법에 대한 방향을 제공하는 데 도움이 될 수 있는 맥락(예: 프로그램 규모, 기관 정책 및 자원)과 관련된 공통 요소(common elements)를 식별하고 그룹화할 것

새로운 평가 시스템이 너무 엄격하게(too rigidly) 적용될 때 좌절이나 과중한 평가 관행(overburdened assessment practices)으로 이어질 수 있음을 유념할 것

공유된 비전(shared vision)을 만들고 신뢰(trust)를 구축하기 위해 과정에 관여된 그룹을 참여시킬 것
3. 한정된 인적 및 재정적 자원으로 일하기 (Working with finite human and financial resources) 무료 핵심 자원(예: 전자 플랫폼, 평가 템플릿, e-모듈, 교수 개발을 위한 적응 가능한 슬라이드 덱) 개발을 통해 중앙 집중식 투자(centralized investment)를 제공함

국가 CBME 리드 그룹과 국가 CC 위원장 포럼을 통해 기관이 적응시킬 수 있는 모범 사례 및 지역적으로 개발된 접근 방식을 공유할 수 있는 장을 제공함
기관 및 프로그램 간의 재정적 및 인적 자원의 광범위한 차이(wide variations)를 인식하고 수용할 계획을 세울 것

CC는 새로운 구조이므로 포트폴리오 검토 및 회의 참석을 위한 추가적인 교수 시간(additional faculty time)의 필요성을 예상하고 지원할 것

개별 기관은 기존 자원이나 지역적으로 개발된 자원을 사용하는 것을 더 편안하게 느낄 수 있으며, 이는 해당 기관의 자원 부담(resource burden)을 증가시킬 수 있음을 유념할 것
4. 교수 개발 제공 및 참여 보장하기 (Providing faculty development and ensuring engagement) 온라인 교수 개발 자원(e-모듈, 워크숍, 웨비나)의 큐레이션 된 저장소(curated repository)를 개발하고 유지함

효과적인 네트워킹, 혁신 공유, 그리고 CC 관행을 개선하기 위해 필요한 사람들에게로의 지식 이동(movement of knowledge)을 가능하게 하기 위해 국가 CC 위원장 포럼을 생성함
모든 관여된 그룹(예: CC 위원장, 행정가, 교수진 및 훈련생)을 대상으로 하는 종단적이고 다중적인 방식의 제공(longitudinal and multimodal offerings)을 포함하는 교수 개발 활동을 계획할 것

복잡한 시스템에서 효과적인 지식 번역(knowledge translation)에 대한 통찰을 지원하기 위해 상호연결성(interconnectedness)과 관계 형성을 강조하는 교수 개발 전략을 개발할 것
5. 평가 문화 변화시키기 (Changing the culture of assessment) 의도된 CC 시행에 대해 관여된 그룹 간의 공유된 정신 모형(shared mental models)을 향해 노력함

혼란스럽거나 섞인 메시지를 피하기 위해 국가 기관 정책과 인증 표준의 정렬(alignment)을 보장함
CC 기능을 안내하는 정책, 과정 및 절차에 대한 지침(guidance)을 제공할 것

평가 시스템 내 투명성(transparency)을 구축하기 위해 모든 관여된 그룹에게 CC 업무의 목적과 흐름을 전달할 것

평가의 이중 목적(dual purpose)(발달적 목적과 총괄적 진척 목적)을 인정하면서 이 긴장(tension)을 관리하는 방법에 대한 논거와 전략을 제공할 것

부정적인 평가 행동 및 관행으로 이어질 수 있는 프로그램적 평가에 대한 선형적 또는 환원주의적 접근(linear or reductionist approaches)을 모니터링할 것

CBME: competency based medical education (역량 바탕 의학교육); CC: Competence Committee (역량위원회).

 

1. 충실도와 유연성의 균형 맞추기 (Balancing fidelity with flexibility).

  • 이러한 도전 중 첫 번째는 CC 시행 및 절차의 핵심 원칙(key principles)과의 일관성 및 정렬(consistency and alignment)을 유지하는 것과, 기관 간 및 프로그램 간의 광범위한 가변성(wide variability)을 수용하기 위해 필요한 유연성(flexibility)을 포용하는 것 사이의 긴장(tension)과 관련이 있습니다. 이러한 이질성(heterogeneity)의 예로는
    • 프로그램의 규모,
    • 수련 장소의 분포,
    • 임상 업무의 맥락,
    • 프로그램의 CBME로의 변화에 대한 준비도(readiness),
    • 전자 평가 포트폴리오(electronic assessment portfolios)의 정교함,
    • 지역 기관의 정책,
    • 교육 문화, 그리고
    • 심지어 임상 교수진을 위한 수수료 구조(fee structures) 등이 있습니다.
  • 예를 들어, 작은 프로그램들은 CC 정족수(CC quorum)를 달성하기 위한 교수진 부족이나 이해 상충(conflicts of interests)을 최소화하는 능력에서 도전을 겪을 수 있고, 더 큰 프로그램들은 검토해야 할 훈련생 수가 많거나 위원회 구성원이 너무 많아 효과적인 의사결정을 내리기 어려워 어려움을 겪을 수 있습니다. 어떤 프로그램들은 훈련생들과 밀접하게 일하며 임상 업무에 대한 직접 관찰(direct observation)을 제공하는 반면, 다른 프로그램들은 WBA(직장 기반 평가)를 위해 간접 관찰(indirect observation)에 더 많이 의존하는 워크플로우(workflows)를 가질 수 있습니다.
  • 이러한 맥락적 차이점들은 지역적 적응(local adaptations)을 필요로 합니다: 만능의(one-size-fits-all) 혹은 지나치게 규범적인 접근 방식(overly prescriptive approach)은 있을 수 없습니다 [5]. 이러한 가변성에 직면하여 CC 원칙과의 정렬을 유지하기 위해, Royal College는 각 대학의 대표자들로 구성된 국가 CBME 리드 그룹(national CBME Lead group)을 창설하고 정기 회의와 국가 CC 실천 공동체(national CC community of practice)를 촉진했습니다. 이 두 그룹은 CC의 개발 및 조직을 돕기 위해 모범 사례(best practices)와 정책 관리를 공유하고, 더 넓은 의사소통 전략(communication strategy)의 일환으로 관여된 그룹들 간의 대화를 촉진하기 위한 장을 마련했습니다.

절차와 운영의 표준화(Standardization)는 과정의 투명성(transparency)과 일관성(consistency)을 제공하는 데 도움이 될 수 있지만, 훈련생 진척도에 대한 포괄적 관점(holistic view)을 가지고 방어 가능한 총괄 결정(defensible summative decisions)을 내린다는 대원칙에 집중하도록 보장하기 위해서는 CC 관행에 여전히 유연성(flexibility)이 필요합니다.

  • 과정이나 절차가 너무 엄격하게(too rigidly) 적용될 때,
    • 이는 CC, 훈련생, 그리고 일선 교수진에게 좌절감이나 역효과를 낳는 행동(counterproductive behaviours)으로 이어질 수 있습니다 [53, 54].
    • 따라서 CC는 모든 데이터를 이해하기 위해 추론(reasoning)에 참여하기보다는 데이터를 정리하고 대조하기 쉬운 것을 검토하는 데 인지적 노력의 대부분을 집중할 수 있습니다. 이는 일부 프로그램이 정량적 평가를 과대평가(overvalue)하게 만들었고, 이는 "체크박스 행동(checkbox behaviours)"과 학습자의 성과 지향성 또는 마인드셋(performance orientation or mindset)으로 이어질 수 있습니다; 또는
  • 이러한 평가를 과소평가(undervalue)하여 지나치게 관대해짐(being overly lenient)으로써
    • 학습자나 교수진의 관여 부족(disengagement)을 초래하거나;
    • 고전하는 훈련생에게 과도하게 불이익을 주어 평가 회피(assessment avoidance)로 이어지기도 했습니다 [55, 56, 57].

CC가 다양한 환경에서 기능할 수 있게 하고 위에서 설명한 몇 가지 도전과제를 완화하기 위해, Royal College는 표준과 최소 요구사항을 명시적으로 진술하면서도 어디에 유연성이 있는지를 개략하는 국가 기술 지침(national technical guide)을 만들었습니다 [37]. 예를 들어, 원래 CBD 설계의 의도는 Royal College의 국가 CanMEDS 역량 프레임워크를 마일스톤 수준에 통합하는 것이었지만, CC 검토 관행은 기존 전자 포트폴리오에서 사용 가능한 데이터 보고 기능(data reporting features)의 한계로 인해 방해를 받았습니다. 따라서, 기술 지침은 이러한 도전을 인정하고 마일스톤 평가 척도에 대한 요구사항을 제거함으로써 평가자 부담(assessor burden)을 줄이는 것을 목표로 합니다. Royal College의 CBME 접근 방식의 진화(evolution)뿐만 아니라 Table 1에 요약되고 기술 지침에 명시된 원칙을 유지하면서 맥락적 수정(contextual modifications)을 할 수 있는 기회는 CC가 기능하는 방식에 어느 정도의 유연성을 허용했습니다.

 

지역적 적응(local adaptations)을 지원하면서 시행의 충실도(fidelity)를 유지하는 것은 또한 핵심 요소들이 여전히 충족되고 있는지 보장하기 위한 지속적인 프로그램 평가(ongoing program evaluation)와 기관 인증을 필요로 합니다. Royal College의 프로그램 평가 위원회는 효과적인 CC 시행과 관련된 정보를 제공했으며, 이러한 평가 보고서(evaluation reports)는 시행자들과 주요 관여된 그룹들에게 배포되었습니다 [57, 58]. 지역적 적응을 고려할 때, CC 감독(oversight), 지속적 질 향상(continuous quality improvement), 그리고 동료 검토(peer review)에 대한 책임은 기관 수준(institution level)으로 이동하고 있습니다. 기관 중심의 CC 감독으로의 이러한 이동은 여전히 시행 및 평가의 파일럿 단계에 있습니다. 국가적 벤치마킹(National benchmarking)과 집계 데이터 공유(aggregate data sharing)는 정책 및 절차의 진화에 정보를 제공하는 데 도움이 될 수 있지만, 그러한 단계는 높은 수준의 복잡성(complexity) 및 기관 간 데이터 안전(data safety) 및 개인정보 보호에 관한 우려와 관련이 있습니다.

 

2. CC 시행을 위한 자원 지원 (Resourcing implementation of CCs).

  • 주요 교육과정 변경이 계획될 때, 시행을 지원하기 위한 충분한 자원(sufficient resources)충분한 시간이 있어야 합니다. CBD를 시행하는 데 필요한 자원 중 많은 부분이 과소평가(underestimated)되었거나 처음에 식별되지 않았으며, 이는 상당한 도전을 제기했습니다 [59]. 프로그램에 대한 CC 설립의 진정한 비용(true costs)은 알려지지 않았지만, 몇 가지 문제에 대한 고려가 필요합니다:
    • 교수진현실적인 시간 할애(realistic time commitment)가 확립되어야 하고, 프로그램 행정과 관련된 비용이 명확히 식별되어야 하며, 새로운 평가 데이터 요구사항(novel assessment data requirements)(예: 다면 평가, 시뮬레이션)의 잠재적 가능성을 검토해야 합니다.
    • CC 구성원은 교수 개발 및 검토 활동을 위해 보호된 시간(protected time)을 가져야 하며, 이를 위해서는 리더십으로부터 재정적 인센티브(financial incentives), 시간 및/또는 인정(recognition)에 대한 지원이 필요합니다.
    • 기관들은 감독, 프로그램 평가, 그리고 전자 포트폴리오 플랫폼의 예상치 못한 지연이나 비용 초과(cost overruns)와 관련된 비용에 직면할 수 있습니다. 자원 요구사항을 지원하기 위해 Royal College는 중앙 집중식 전자 포트폴리오(centralized electronic portfolio), 큐레이션 된 교수 개발 자원을 제공하고, 이러한 유형의 지원이 필요한 프로그램들을 위해 프로그램 평가를 착수했습니다.

 

3. CC를 위한 교수진 지원 (Supporting faculty for CCs).

  • CC의 목적, 과정, 절차에 대한 명확하고 간결한 의사소통(Clear and concise communication)은 구성원 참여와 교수진의 이해에 있어 결정적입니다. Royal College는 시스템에 대한 신뢰(trust)를 개발하기 위해 관여된 그룹들 사이에서 공유된 정신 모형(shared mental model)을 전달하기 위한 계획을 세웠습니다. 중요하게도, 이 작업은 집단 의사결정의 방어 가능성(defensibility)과 수용성(acceptability)을 높이기 위해 기본 원칙(Table 1 참조)에 대한 지식 전파 노력(knowledge dissemination efforts)을 지원했습니다.
    • 시행 과정 전반에 걸쳐 Royal College는 훈련생 및 교수 개발을 위한 종단적이고 강화하는 제공(longitudinal and reinforcing offerings)을 다수 마련했습니다.
      • 여기에는 워크숍 개발뿐만 아니라 녹화된 웨비나, 쉽게 수정 가능한 슬라이드 세트, 교육 비디오, 인포그래픽, 기술 지침, e-모듈을 포함하는 자원 디렉토리(resource directory)가 포함되었습니다 [60].
    • Royal College는 또한 시행에 대한 장벽과 촉진 요인을 더 잘 이해하고 CC 위원장들에게 지속적인 지원을 제공하기 위해 CC 위원장들을 위한 국가적 실천 공동체 모델(national community of practice model)(CC 위원장 포럼이라 불림)을 개발했습니다.
    • 지속적인 대화(ongoing dialogue)와 종단적 교수 개발 전략(longitudinal faculty development strategy)은 모든 과정을 표준 원칙 CC 수행에 대한 조정된 기대치(calibrated expectations)와 정렬시킬 수 있게 했습니다. CC 리더들의 높은 이직률(high turnover) [61]을 고려할 때, 실천 공동체는 지속적인 지원과 개발을 필요로 합니다.

 

4. 평가 문화 다루기 (Addressing assessment culture).

  • 뿌리 깊은 성과 평가 문화(culture of performance assessment)는 CBME의 무결성, 따라서 CC 시행을 제한하는 가장 만만치 않은 장벽(formidable barrier)이었습니다.
    • 이전의 평가 경험과 인식을 고려할 때, 훈련생들학습을 위한(for learning) 평가이자 학습에 대한(of learning) 평가라는 이중 목적(dual purpose)을 이해하는 데 어려움을 겪을 수 있으며, 심지어 저부담 일일 평가(low-stakes daily assessment)조차 총괄적(summative)인 것으로 간주할 수 있습니다 [62, 63]. 이는 훈련생들이 그들의 진척 결정에 잠재적으로 해롭다고 인식할 수 있는 피드백을 피하거나 부정할 수 있기 때문에 WBA에서 제공되는 피드백의 유용성을 제한합니다.
    • CC 내의 교수진문제 식별 모델(problem identification model) 내에서 그들의 역할을 정렬하고 고전하는 훈련생을 식별하는 데만 모든 노력을 집중할 수 있습니다 [64]. 의도하지 않았더라도, 이러한 행동은 CBME와 CC의 근본적인 이점을 제한할 수 있습니다.
  • 프로그램적 평가를 실행(enact)하기 위한 CC의 사용은 관여된 그룹과 소통하거나 그들을 개발할 때 세심한 주의와 사려 깊음을 요구합니다. 고부담 CC 결정(high-stakes CC decisions)을 위한 저부담 관찰(low-stakes observations)의 이중 목적의 본질을 소통하는 것은 학습자와 교수진 모두가 채택하거나 받아들이기에 도전적이었는데, 이는 더 복잡한 대화와 학습자 진척에 대한 발달적 관점(developmental view)을 취한다는 CC의 목표에 대한 근본적인 신뢰(fundamental trust)를 필요로 하기 때문입니다. 이러한 핵심적인 대화 없이는, 총괄적 요소만이 가치 있게 여겨지는 잠재적 교육과정(hidden curriculum)이 나타날 위험이 있습니다. CC를 시행하는 사람들은 학습을 위한 평가(assessment for learning)와 성장 마인드셋(growth mindset)이 강조되는 평가 문화를 만들기 위해 노력해야 합니다.

결론 (Conclusions)

 

새로운 CBME 시스템을 위한 CC의 국가적 시행(national implementation)은 개입을 전달하고 받는 사람들에게 요구되는 전문 지식과 기술(expertise and skills); 목표로 하는 그룹, 환경 및 수준의 수; 그리고 개입 또는 그 구성 요소의 허용된 유연성 수준(level of flexibility)으로 인해 복잡합니다. 대규모 CC 시행에 있어, 표준화와 유연성의 긴장(tension of standardization with flexibility)을 관리하는 것은 세심한 고려와 관여된 그룹과의 참여(engagement)를 통해 예상하고 다루어야 할 근본적인 문제입니다. 다양한 맥락에서의 시행상 도전을 예상하는 것은 지역적 적응(local adaptation)을 허용하기 위해 다중 참여 및 의사소통 전략(multiple engagement and communication strategies)을 사용하는 접근 방식을 필요로 합니다. CC의 대규모 시행은 단일 시점에서 발생하는 것이 아니라 지속적인 지원을 필요로 하는 진화하는 과정(evolutionary process)입니다. 따라서, 시행 초기에 프로그램 평가 계획(program evaluation plan)을 내재화(embedding)하는 것을 고려하는 것이 중요합니다. 우리는 Royal College의 CC 시행 경험, 직면했던 도전과제, 그리고 이를 다루기 위해 사용한 몇 가지 전략을 제시했습니다. 이것이 대규모 CBME CC 시행을 고려하고 있는 다른 교육자들에게 가치가 있기를 바랍니다.

 

 

 

 

 

 

Perspect Med Educ. 2024 Feb 6;13(1):75-84. doi: 10.5334/pme.963. eCollection 2024.

Enabling Implementation of Competency Based Medical Education through an Outcomes-Focused Accreditation System

 

📢 인증평가(Accreditation), CBME의 '걸림돌'이 될까, '디딤돌'이 될까?

안녕하세요! 오늘은 의학교육계의 뜨거운 감자인 역량바탕의학교육(CBME)과 인증평가(Accreditation)의 관계를 다룬 흥미로운 논문을 소개해 드리려 해요.

우리는 흔히 인증평가가 교육의 질을 담보한다고 생각하지만, 때로는 혁신적인 교육 모델인 CBME를 도입하는 데 있어 장벽(Barrier)이 되기도 한다는 사실, 알고 계셨나요? 이 논문은 인증평가 시스템이 어떻게 변해야 CBME를 성공적으로 정착시킬 수 있는지에 대한 통찰을 담고 있습니다.

함께 핵심 내용을 살펴볼까요? 🧐


1️⃣ 인증평가의 두 얼굴: 촉진제인가, 장벽인가?

연구진은 인증평가가 CBME 구현의 강력한 도구가 될 수도 있지만, 자칫하면 시스템이나 기준의 특성 때문에 한계와 부작용을 낳을 수도 있다고 지적해요. 특히 성과(Outcomes)에만 너무 집착하는 것이 오히려 독이 될 수 있다고 경고합니다.

교육에는 성과로 딱 잘라 측정하기 힘든 '교육 과정(Educational processes)'이나 '학습 환경(Learning environment)' 같은 요소들이 있거든요. 연구진은 이렇게 말합니다.

"성과 중심 구성에 대한 경직된 고수는 이러한 요소들이 효과적으로 평가되는 것을 방해하여, 인증기구가 지닌 신탁 책임을 훼손할 수 있습니다."

"Rigid adherence to the outcomes-based construct would prevent these elements from being effectively evaluated, compromising the fiduciary responsibility that accreditation bodies hold."

 

즉, 성과만 보다가 정작 중요한 교육 환경을 놓칠 수 있다는 것이죠.


2️⃣ 무엇이 CBME 구현을 막고, 무엇이 돕는가? (핵심 4가지 요소)

논문에서는 인증 시스템의 4가지 특징이 어떻게 작용하느냐에 따라 결과가 달라진다고 분석했어요.

  • 🎓 교육 이론의 정렬 (Alignment of educational theory)
    • Good: 교육 패러다임과 인증 시스템이 한 방향을 바라보면 변화가 가속화됩니다.
    • Bad: 하나의 이론만 너무 고집하면(Rigid adherence), CBME 초기 정착에 필요한 다른 중요한 요소들을 놓칠 수 있어요.
  • 🎯 질적 초점 (Quality focus)
    • Good: 질 향상(Quality Improvement)에 초점을 맞추면 스스로 발전하고 혁신을 공유하게 됩니다.
    • Bad: 단순히 최소 기준만 맞추는 질 보증(Quality Assurance)에 머무르면, 학교들은 '혁신'보다 '기준 달성'에만 급급해집니다.
  • 📝 인증 기준 (Accreditation standards)
    • Good: 유연한 성과 바탕 기준(Outcome-based standards)은 학교별 상황에 맞는 혁신을 가능하게 합니다.
    • Bad: 너무 시시콜콜하고 규범적인 기준(Prescriptive standards)은 변화를 억누를 수 있습니다. 특히 '수련 시간'을 깐깐하게 따지는 구시대적 기준은 CBME와 맞지 않죠.
  • ⚙️ 인증 절차 (Accreditation processes)
    • Good: 초기에는 어느 정도 관용(Leniency)을 베풀고, 처벌보다는 개선을 돕는 방식이어야 합니다.
    • Bad: 너무 엄격하거나 실패를 용인하지 않는 분위기는 학교들의 도전 의지를 꺾을 수 있어요.

연구진은 인증기구의 의무에 대해 단호하게 이야기합니다.

"따라서 인증기구는 그들의 기준이 의학교육의 주요 변화—이 경우 CBME—와 보조를 맞추도록 할 의무가 있습니다."

"Accreditation bodies thus have a duty to ensure their standards keep pace with major changes in medical education — in this case, CBME."


3️⃣ 미래를 위한 제언: 데이터와 성과의 연결

그렇다면 앞으로 인증평가는 어떻게 진화해야 할까요? 🚀

연구진은 데이터(Data)의 힘을 강조합니다. 프로그램 평가 분석(Program evaluation analytics)을 통해 단순히 전공의가 시험을 통과했느냐 뿐만 아니라, 교수진이 피드백을 잘 주고 있는지, 로테이션은 적절한지 등을 깊이 있게 들여다볼 수 있습니다.

"이러한 유형의 데이터 사용은 인증평가 내 평가 과정의 구체성과 객관성을 진전시킬 수 있습니다."

"The use of this type of data could therefore advance the specificity and objectivity of evaluation processes in accreditation."

 

더 나아가, 졸업생이 실제 진료 현장에 나갔을 때 환자를 얼마나 잘 치료하는지 보여주는 임상 성과(Clinical outcomes)까지도 인증평가의 지표로 활용될 수 있는 미래를 그리고 있습니다.


📝 마치며

결국 인증평가 시스템은 CBME라는 거대한 변화의 물결 속에서 '수동적인 심판'이 아니라 '능동적인 조력자'가 되어야 합니다.

연구진의 결론으로 이 글을 마무리할게요. 학교가 CBME로 전환하려 한다면, 인증평가 시스템의 역할을 절대 간과해서는 안 됩니다.

"인증 시스템은 CBME로의 전환을 가능하게 하는 데 있어 강력한 역할을 합니다."

"Accreditation systems have a powerful role to play in enabling the transition to CBME."



서론 (Introduction)

캐나다 전공의 교육(postgraduate medical education, PGME) 전반에 걸친 역량 바탕 의학 교육(competency based medical education, CBME) 의 구현(implementation)은 전례 없는 수준의 개혁(unprecedented level of reform) 을 가져왔습니다. 캐나다 가정의학회(College of Family Physicians of Canada, CFPC)가 ‘Triple C 역량 바탕 교육과정(Triple C Competency-based Curriculum)’을 시행(implementing)하고, 캐나다 왕립 내과 및 외과 대학(Royal College of Physicians and Surgeons of Canada, Royal College)이 ‘설계에 의한 역량(Competence by Design, CBD)’으로 전환(transitioning)함에 따라, 전공의 교육(PGME)에서 수련생(trainees)을 교육하고 평가하는 방식(the way in which trainees are educated and assessed)이 근본적으로 변화(fundamentally changed)했습니다 [1, 2, 3]. CBME의 구현은 대규모의 복잡한 변화 이니셔티브(large-scale, complex change initiative)입니다 [4]. 성공적인 구현(successful implementation)이 없다면, 학습자들은 이 교육적 접근 방식(educational approach)이 제공한다고 알려진 이점들(purported advantages)로부터 혜택을 얻지 못할 것(fail to benefit)입니다.

 

다른 연구들이 CBME 구현 경험(CBME implementation experience)을 특징짓고(characterized) 그 결과에 영향을 미친 것으로 인식되는(perceived to have influenced) 요인들을 규명(identified)해왔지만, 문헌들은 이러한 전환을 가능하게 하는(enabling this transition) 데 있어 인증(accreditation)이 수행하는 중요한 역할(important role)에 대해서는 논의하지 못하고 있습니다(fails to discuss) [5, 6, 7]. 캐나다 전공의 교육(PGME) 시스템에서 일어난 실질적인 변화들(substantive changes)은 전공의 교육(PGME) 내의 성과 중심 인증 과정(outcomes-based accreditation process) 으로의 전환과 병행하여(in parallel with) 발생했습니다. 교육 패러다임(educational paradigm)과 인증 시스템(accreditation system) 사이에는 반드시 연계(alignment)가 있어야 하며, 그렇지 않을 경우 변혁적인 변화(transformational change)의 구현은 방해받을 것(hampered)입니다.

 

우리는 독특하고 협력적으로 구축된 인증 시스템(unique, collaboratively constructed accreditation system) 이 어떻게 CBME로의 전환과 그 구현을 가능하게 했는지(enabled) 기술합니다. 여기서 얻은 교훈들(lessons learned)은 지역적으로는 지속적인 개선 과정(continuous improvement process)을 촉진(facilitate)하고, 진화하는 시스템(evolving systems) 내에서 구현의 충실도와 무결성(fidelity and integrity of implementation) 을 극대화하기 위한 도구로서의 인증에 대한 세계적인 담론(world discourse)에 정보를 제공하기 위해(to inform) 공유됩니다.

정의 (Definitions)

역량 바탕 의학 교육(Competency-based medical education, CBME)“졸업 성과 능력(graduate outcome abilities)에 지향점을 두고(oriented to), 사회 및 환자의 요구(societal and patient needs) 분석에서 도출된 역량(competencies)을 중심으로 조직된 것”입니다 (p. 636) [8].

  • 개별 학습자의 역량(Individual learner competencies)은 지식, 기술, 태도(knowledge, skills, and attitudes)를 통합하는 관찰 가능한 능력(observable abilities) 입니다 [9].
  • CBD는 2017년에 구현이 시작된 로열 칼리지(Royal College) 버전의 CBME이며, 시간을 자원으로 활용하면서(utilizing time as a resource) 학습에 대한 성과 중심 접근 방식(outcomes-based approach)을 결합한 것입니다 [3].
  • CBME는 교육과정(curriculum) 그 이상입니다. 그것은 관련된 교육 프로그램의 설계(design), 구현(implementation), 평가(assessment and evaluation)뿐만 아니라 일련의 정책 결정 및 영향(policy decisions and implications)을 포함합니다 [9, 10].
  • CBME의 채택(adoption), 그리고 이 경우 CBD의 채택은 행동의 상당한 전환(significant shift in behaviours)을 필요로 하는 변혁적 변화(transformational change) 로 특징지어졌습니다(characterized) [11].

 

인증(Accreditation)“질 보장 및 향상(quality assurance and enhancement)을 목적으로 외부 기관(external body)에 의해 정의된 기준(defined standards)에 따라 교육 프로그램, 기관 또는 시스템을 공식적으로 평가하는 과정(process of formal evaluation)”입니다 (p. 4) [12].

  • 인증 시스템을 위한 목적 적합성 프레임워크(fit-for-purpose framework) 는 최상의 설계(best design)가 현지의 요구와 맥락(local needs and contexts)을 우선시하여(prioritizes), 관할권(jurisdiction)의 시간 흐름에 따른 변화에 적응할 수 있는(adaptable) 맞춤형 접근 방식(tailored approach) 을 도출한다고 명시합니다 [13].
  • 맥락을 우선시함으로써(By prioritizing contexts), 목적 적합성 프레임워크는 현지 요인(local factors)(quality)을 추구함에 있어 상황적으로 의미 있는 인증(situationally meaningful accreditation) 을 효과적으로 수행할 수 있는 인증 시스템의 능력 사이에 중요한 연결 고리(important connection)를 확립합니다.
  • 모든 인증 시스템의 설계에서 고려되어야 할(must be considered) 그러한 현지 맥락 중 하나는 교육적 접근 방식(educational approach), 즉 이 경우에는 CBME입니다 [13, 14].

CanERA (CanERA)

캐나다에서는 세 개의 협회(colleges)가 전공의 교육(PGME)을 인증할 권한(mandate)을 공유합니다:

  • 캐나다 가정의학회(CFPC),
  • 퀘벡 의사협회(Collège des Médecins du Québec, CMQ), 그리고
  • 로열 칼리지(Royal College)입니다.

이 협회들의 인증 시스템은 수십 년 동안(대략 1990년부터 2010년까지) 변혁적인 변화 없이(without transformational change) 지속되었으며, 기준을 강화하고(enhancing standards) 대학 간의 연계(alignment)를 개선하는 데 초점을 맞춘 점진적인 개선(incremental improvements) 만이 있었습니다. 현재의 변화에 대한 추진력(impetus)은 2000년대 후반(대략 2008~2009년)에 발생했는데, 주요 전공의 교육 이해관계자들(stakeholders)이 현대적인 재설계(modern redesign)의 필요성을 알리는 신호를 보내면서(signalling) 시작되었습니다 [15]. 이러한 변화에 대한 요구(call for change)는 CBME 모델의 초기 개발 및 캐나다 내에서의 CBME를 향한 추진(drive)과 동시에 일어났습니다(coincided with) [16, 17].

 

이러한 변화의 요구에 대응하여(In response to), 세 협회는 2013년에 캐나다 전공의 인증 컨소시엄(Canadian Residency Accreditation Consortium, CanRAC) 을 결성했습니다. 협력적으로(Collaboratively), CanRAC은 2013년부터 2018년까지 캐나다 전공의 교육(PGME) 및 인증 환경(landscape) 전반의 이해관계자들이 참여한 일련의 정상 회의(series of summits)를 주최했습니다. 이 과정을 통틀어(Throughout this process), CanRAC은 의학 교육의 연속체(continuum of medical education) 전반에 걸쳐

  • 인증 절차의 연계 및 조정(alignment and coordination) 기회를 식별하고(identify),
  • 인증의 모범 사례(best practices)를 통합 및 혁신(incorporate and innovate)하며,
  • 교육 패러다임 내에서 일어나는 변화에 적응(adapt to changes)하고자 했습니다 [18].

이 작업은 2019년 7월 1일에 공식적으로 ‘캐나다 우수 전공의 인증(Canadian Excellence in Residency Accreditation, CanERA)’ 이라는 새로운 통합 전공의 교육 인증 시스템(unified PGME accreditation system)을 출범(launch)하면서 결실을 맺었습니다(culminated in). CanERA는 일련의(a bundle of) 변혁적 인증 변화(transformational accreditation changes) 를 특징으로 합니다(features) [18] (그림 1).

 

그림 1 캐나다 우수 전공의 인증(CanERA) 시스템의 변혁적 변화. Copyright 2017. The Canadian Residency Accreditation Consortium (CanRAC). https://www.canrac.ca/canrac/about-e. 허가를 받아 전재함(Reproduced with permission).

 

이 새로운 시스템의 설계 및 출범과 함께 CanERA를 위한 일련의 목표들(A set of goals)이 수립되었습니다. 여기에는

  • 새로운 기준(new standards)을 통해 인증 접근 방식을 현대화(modernize) 하고,
  • 기준 평가를 안내할(guide) 새로운 프레임워크를 제공하며,
  • 지속적인 질 향상(continuous quality improvement) 에 대한 강조를 높이고(increase the emphasis),
  • 더 길어진 8년의 인증 주기(accreditation cycle)와 디지털 인증 관리 플랫폼(digital accreditation management platform)을 통해 모든 이해관계자의 업무량(workload)을 줄이며,
  • CBME의 원칙과 부합하는(align with) 기준, 정책 및 절차를 통해 CBME 구현을 지원(support CBME implementation) 하려는 의도가 포함되었습니다.

어떤 인증 시스템의 특징들이 CBME의 구현을 가능하게 하는가? (What features of an accreditation system enable the implementation of CBME?)

교육 이론의 연계 (Alignment of educational theory)

이전 연구들은 인증 시스템(accreditation systems)과 그 설계(design)가 그것들이 위치한 환경(environments)에 의해 영향을 받는다고 제안했습니다(proposed) [13]. 그러나, 그 반대 또한 사실입니다(the opposite is true as well): 교육 환경(educational environment)은 인증 시스템과 그 설계에 의해 심오하게 영향을 받을 수 있습니다(profoundly influenced). 인증 시스템들이 규제적 권한(regulatory mandates)을 통해 상당한 영향력을 행사한다(wield considerable influence)는 점이 인식되어야 합니다(must be recognized). 잠재적인 인증 결과(Potential accreditation outcomes)는 인증을 받는 대상들의 교육적 행동과 결정(educational behaviour and decisions)을 유도합니다(drive). 새로운 교육 패러다임(new educational paradigm)을 구현할 때(implementing), 따라서 공유된 특성과 구성 개념(shared characteristics and constructs)을 증진하고 우선시하는(promotes and prioritizes) 인증 시스템을 갖추는 것이 중요합니다. 새로운 패러다임의 이론적 기초(theoretical basis), 교육적 우선순위(educational priorities), 그리고 사회적 책무(societal responsibilities)를 포함한 근본적인 특징들의 연계(Alignment of the underlying features)는 구현이 의도된 교육적 변화(intended educational change)의 방향으로 추진되도록 보장하는 데 결정적(critical)입니다.

 

전통적인 인증 시스템(Traditional accreditation systems)은 구조와 과정(structures and processes) 에 초점을 맞추었는데, 이는 학습자들이 유능한 의사(competent physician)가 되기 위해 필요한 훈련(required training)을 받았음을 보장하기 위해 시간(time)에 의존했던 교육 시스템에 잘 맞았습니다(well suited). 성과 중심 교육 패러다임(outcome-based educational paradigm)으로서, CBME는 교육 경험 전반에 걸쳐 역량(competencies)의 형태를 띤 성과(outcomes)의 평가(assessment), 기록(documentation), 그리고 해석(interpretation)을 중심으로 조직된 교육과정을 활용합니다(utilizes) [9, 19, 20]. CanERA의 새로운 인증 시스템 설계는 구조와 과정이라는 더 쉽게 평가되는 구성 개념(more easily evaluated constructs)으로부터의 이탈(departure)을 반영하며, 대신 인증 기준 내에서 성과(outcomes)에 강조점(places emphasis)을 둡니다 [21].

  • 예를 들어, 단순히 정책이 존재한다는 것(policy exists)을 요구하는 대신, 인증을 받는 대상들은 기준 준수(compliance with the standard)를 확립하기 위해 정책이 어떻게 사용되는지, 그리고 그 결과(outcome)를 입증(demonstrate)할 것으로 기대됩니다.

성과 중심 인증 시스템(outcomes-based accreditation system) 내에서, 전공의 수련 프로그램(postgraduate training programs)들은 CBME의 원칙과 일치하는(consistent with) 교육적 혁신(educational innovations)을 더 자유롭게 채택하고 우선시할 수 있습니다(more freely able to adopt and prioritize). 여기에는 훈련생의 성과(outcomes of the trainee)에 초점을 맞춘 교육적 개입(educational interventions), 학습 경험(learning experiences), 그리고 평가(assessments)가 포함될 수 있습니다.

  • 예를 들어, 모든 학습자가 특정 교육 경험(specific educational experience)을 거치도록 요구하는 대신, 프로그램들은 교육적 역량(educational competencies)을 충족시키기 위해 비전통적이거나 학습자 주도적인 경험(non-traditional, or learner-driven experiences)을 자유롭게 활용(free to utilize) 할 수 있습니다.

이러한 유형의 핵심 요소(critical components)를 통합하는 능력은 구현의 충실도(fidelity of implementation), 다시 말해 혁신의 핵심 요소가 실행된 시스템(enacted system) 내에 존재하는 정도(extent)를 진전시키는 데 중요합니다 [22].

 

게다가(Furthermore), 성과 중심 인증 시스템의 원칙은 더 근본적인 수준(more fundamental level)에서 CBME의 교육적 성과 우선순위(educational outcome priorities)와 일치합니다(align with): 구체적으로, 개인과 인구 집단의 건강을 개선하는 데 기여하고 책임을 질(contribute to, and be responsible for) 유능한 의사를 배출할 졸업생 및 프로그램 성과(graduate and program outcomes)에 대한 강조입니다 [9, 23, 24]. 이러한 연계는 인증 시스템과 절차의 타당성(validity)을 강화하는(serve to strengthen) 동시에, 사회적 책무성(social accountability)에 대한 기대를 다룹니다(addressing expectations) [9, 23, 24]. 이 수준에서의 연계는 프로그램과 기관들이 이러한 필수적인 원칙들(essential principles)을 그들 자신의 맥락(contexts)에 통합하고 적용할 가능성을 높여주며(increases the likelihood), 그로 인해 구현의 무결성(integrity of implementation)을 심화시킵니다(furthering) [25].

질 보장 대 질 향상의 초점 (Quality assurance versus quality improvement focus)

인증 시스템(Systems of accreditation)은 종종 질 보장(quality assurance)과 질 향상(quality improvement) 모두를 포함하는 목적을 가집니다 [12].

  • 질 보장 초점(quality assurance focus)은 프로그램들이 교육적 질(educational quality)에 대한 최소 기준(minimum standards)을 충족함을 대중, 규제 기관 및 기타 사람들에게 확언(assures)하며, 이를 통해 특히 주요 교육과정 개혁(major curricular reform) 기간 동안 위해를 방지(preventing harm)합니다 [26]. 따라서 인증 기구들은 기관과 프로그램, 수련생, 그리고 궁극적으로는 환자들에게 중요한 수탁 의무(fiduciary duty)를 가집니다.
  • 반대로(Conversely), 질 향상 초점(quality improvement focus)은 자기 평가(self-evaluation)의 수행을 통해 질을 개선하고 시간이 지남에 따라 열망적인 기준(aspirational standards)을 달성하도록 프로그램과 의학 교육 시스템을 돕는 것을 강조하며(emphasizes helping), 이 모든 과정에서 인증 지위(accreditation status)에 대한 위험은 더 낮게 유지합니다 [27, 28].
    • 틀림없이(Arguably), 이러한 개선 추구(pursing improvement)의 개념은 CBME 채택의 초기 단계(early stages) 동안 특히 중요할 수 있습니다. 질 향상 철학(quality improvement philosophy)은 또한 “다음” 및 모범 사례(“next” and best practices)의 식별과 공유를 촉진하고, 따라서 CBME 구현 기간 동안 혁신의 확산(diffusion of innovation)을 촉진할 수 있습니다 [27].
  • 일부 인증 시스템은 두 가지 질적 목표 중 하나에 더 큰 강조점을 두기도 하지만, 대부분의 시스템은 이 두 끝점 사이의 스펙트럼(spectrum) 어딘가에 위치해 있습니다 [13].

두 가지 우선순위를 모두 충족하기 위해(To meet both priorities), CanERA 시스템은 그 권한(mandate)을 재설정(reframed)하고 질 보장에 초점을 맞춘 설계 특징들을 유지하면서도 지속적인 질 향상(continuous quality improvement)에 대한 강조와 기대치를 높였습니다(placed increased emphasis and expectations). 프로그램 수준에서, 이러한 강조는 인증 기준 내에 새로운 질 향상 영역(new quality improvement domain) 을 생성함으로써 구체화되었습니다(manifested) [29]. 이 영역은 관련된 기준 및 지표(associated standards and indicators)와 함께, 전공의 수련 프로그램 내에 질 향상 문화(culture of quality improvement)가 존재하도록 보장하고 모든 프로그램이 준수해야 할(held) 기대치를 명확히 정의하기 위해 만들어졌습니다. 이 새로운 시스템 설계에서는 시스템 내의 안전(safety)을 유지하면서 구현을 진전시키는(advanced implementation) 균형(balance)이 이루어졌습니다 [29].

인증 기준 (Accreditation standards)

인증 기준(Accreditation standards)은 “프로그램, 기관 또는 시스템의 질에 대한 결정을 내리는 데 사용되는 척도(measures) 또는 일반적으로 수용되는 벤치마크(generally accepted benchmarks)”로 정의될 수 있습니다 (p. 6) [12]. 따라서, 기준은 프로그램과 기관의 질적 성취(achievement of quality)에 대한 기대치를 개요화(outline)하고 기준을 충족하기 위한 관련 행동을 유도합니다 [30, 31]. 인증 기준은 아마도 인증 시스템의 가장 근본적인 구성 요소(most fundamental components) 중 하나일 것입니다 [32]. CBME의 경우, 인증 기준의 내용이 역량 바탕 설계(competency-based design)의 핵심 구성 요소(core components)와 연계되고(aligned with) 이상적으로는 그에 기반하도록(based upon) 보장하는 것이 [11] CBME의 구현을 추진하는 데(drive the implementation) 도움이 될 것입니다.

 

인증 기준은 세부 사항의 수준(level of detail), 요구 사항에서 허용되는 유연성(flexibility afforded), 그리고 구조, 과정 및/또는 성과에 대한 초점 측면에서 다릅니다(differ).

  • 매우 상세하거나 규범적인(highly detailed or prescriptive), 또는 주로 구조적이고 과정 기반의 기준(structural and process-based criteria)을 강조하는 인증 기준은
    • 프로그램 간의 표준화(standardization)를 추진하는 데 가장 효과적일 수 있습니다 [33]. CBME에서, 이는 기대치 측면에서 프로그램에 명확성(clarity)을 제공하고 교육 설계의 원하는 모델(desired model)과 관련하여 충실도(fidelity)를 높일 수 있습니다.
    • 하지만, 이러한 접근 방식이 변화 확산(change diffusion)의 자연스러운 과정을 통해 발생하는 중요한 혁신을 저해(stifle important innovation)할 수도 있다는 주장이 제기될 수 있습니다 [34].
  • 반대로(Conversely), 더 큰 유연성(greater flexibility)을 허용하거나 교육적 성과(educational outcomes)에 더 큰 강조점을 두도록 작성된 기준
    • 프로그램들이 CBME의 현지 구현(local implementation)에서 혁신할 수 있는 능력을 촉진(facilitate)할 수 있습니다. 이러한 접근 방식은 구현이 진행됨에 따라 혁신에 의해 인증 기준이 지속적으로 정보를 제공받을 수 있도록(continuously informed by innovations) 하는 메커니즘과 결합될 때, 지속적인 반복과 개선(ongoing iteration and improvement)을 추진하는 데 꽤 강력할 수 있으며, 따라서 CBME의 구현을 지원할 수 있습니다.
    • 그러나, 지나치게 유연하거나 모호한 기준(overly flexible or vague standards) 은 특히 구현 초기 단계에서 프로그램에 필요한 지침(guidance)을 제공하지 못할 수 있으며, 궁극적으로는 교육 설계의 원하는 모델에 대한 구현의 충실도 상실(loss of fidelity of implementation)을 초래할 수 있습니다.

전반적으로(Overall), CanERA 기준은 구조, 과정, 그리고 성과 측정(structure, process, and outcome measures)의 균형을 염두에 두고 작성되었으며, 이는 각각 더 상세한 것에서 더 유연한 것으로 이어지는 스펙트럼을 반영합니다. 구체적으로, 기준은 계층 구조(hierarchy) 로 구성되었는데, 포괄적인 기준(overarching standard) 으로 시작하여, 그 아래에 요소(elements), 요건(requirements) 및 지표(indicators)가 내포(nested) 되어 있습니다;

  • 평가 프레임워크는 측정 가능한 각 요건과 지표가 평가될 것을 요구하며 [29], 기준의 기대치(standards’ expectations)에 따라 무엇이 구현되었는지, 그리고 개선을 위한 영역(areas for improvement)이 어디서 식별되는지에 대해 프로그램에 정확한 피드백(precise feedback)을 제공합니다.
  • 예를 들어, 교육 프로그램에 관한 기준(standard 3)은 “전공의는 독립적인 진료를 위해 준비된다(Residents are prepared for independent practice)”라는 포괄적인 성과를 명시하며 (p.9) [29]; 그 내포된 요소, 요건 및 지표들은 CBME의 핵심 구성 요소에 기반한 기대치를 개요화합니다.

인증 절차를 통해 평가되는 이 기준의 구체적인 지표들은

  • CBME 구현의 일부로서 무엇이 요구되는지(예: 지표 3.1.1.2: “역량 및/또는 목표는 해당 분과의 CanMEDS/CanMEDS-FM 프레임워크의 각 역할을 다룬다” (p.9) [29])와
  • 성과를 달성하는 방법에 있어 더 많은 유연성이 허용되는 부분(예: 3.2.3.1: “개별 전공의의 교육 경험은 해당 분과의 국가적 기준과 사회적 요구를 충족하면서, 그들의 학습 요구와 미래 경력 열망을 수용하도록 맞춤화된다” (pg.9) [29])
  • ...에 대해 프로그램에 구체적인 지침을 제공합니다.

CanERA 기준의 내용은 의도적인 평가 구조 및 문구(wording)와 결합되어, CBME로의 전환에 있어 강력한 활성자(powerful enabler)로 작용합니다.

인증 절차 (Accreditation processes)

“인증 절차(Accreditation processes)”

  • 기준이 어떻게 평가되는지(즉, 자기 평가 및 외부 평가 모델, 평가에 사용되는 정보),
  • 결정이 어떻게 내려지는지(how decisions are rendered)(즉, 결정 범주 및 절차),
  • 누구에 의해(즉, 현장 검토 모델), 그리고
  • 얼마나 자주(즉, 인증 주기) 이루어지는지를 포함하여
  • 대부분의 인증 시스템에 공통적인 몇 가지 핵심 활동(core activities) 을 포괄(encompass)하는 광범위한 용어입니다 [13].

인증 시스템마다 이러한 절차에는 상당한 차이(significant variation)가 있습니다. 중요한 것은 — 혹은 아마도 필수적인 것은 — 그것들이 인증을 받는 프로그램이나 기관의 바람직한 행동(desired behaviours)과 연계되고 그것을 보상(reward)하며(따라서 촉진하는) 것이라는 점입니다 [13].

 

CanERA 인증 시스템은 CBME의 구현을 육성(foster)하는 것을 돕기 위해 의도된 몇 가지 특징들을 도입했습니다.

  • 첫째, 프로그램들은 어떠한 인증의 영향(accreditation impacts) 전에 CBME 구현에 작업할 시간(time to work)을 부여받았습니다.
    • 구체적으로, 인증 기준이 프로그램들로 하여금 전문 분야별 교육 요건(specialty-specific educational requirements)에 따라 CBD를 구현할 것을 요구하는 경우, 예를 들어 프로그램 목표를 정의할 때 전문 분야별 학습자 역량을 사용할 것(지표 3.1.1.1, pg. 9 [29])이나 특정 교육 경험, 예컨대 로테이션(지표 3.2.1.2, pg. 9 [28])에 대한 요건과 같이, 인증 정책은 프로그램들이 해당 전문 분야의 CBD 출범 첫해 동안에는 그러한 요건을 준수할 것으로 기대되지 않도록(would not be expected to comply) 보장했습니다 [35].
  • 둘째, CanERA는 CBD 구현을 지원하기 위한 새로운 인증 의사결정 접근 방식(new approaches to accreditation decision-making) 을 도입했습니다. CanERA 인증 범주(categories)와 관련된 의사결정 원칙은 징벌적(punitive)이기보다는 지속적인 개선을 장려하고 보상하도록(encourage and reward continuous improvement) 개정되었습니다;
    • 구체적으로, 결정 원칙은 프로그램과 기관이 자신들이 작업하고 있는 내용을 인증자들과 적극적으로 공유하는 경우(actively share), 그들이 최소 기준을 달성하고 개선을 이루고 있다면(provided they achieve minimum standards and are making improvement), 인증 결정 시점에 해당 영역에 대해 불이익을 받지 않도록(not penalized) 설계되었습니다 [35].
      • 이는 개선이 이루어지고 있는 프로그램이 알고 있는 영역을 포함하여 기준의 모든 격차(any gap)가 프로그램의 공식적인 약점 목록(formal list of weaknesses)에 포함되고 인증 결정에 반영되었던(factored into) 이전의 인증 모델들과 대조됩니다(contrasted with).
    • 추가적으로, 기관 수준(institution level)에서 새로 도입된 인증 결정과, 기관이 전공의 수련 프로그램을 어떻게 감독(oversee)하고 질 향상을 지원하는지에 대한 추가적인 기준 요건들은, CBME와 같은 기관 전반의 변화(institution-wide change)를 이끄는 데 있어 PGME 부서와 그 리더십이 수행하는 역할을 강화(bolster)하기 위함입니다.
  • 마지막으로, 새로운 CanERA 인증 절차는 특히 CBD를 성공적으로 구현하기 위한 참신한 접근 방식(novel approaches)과 관련하여 혁신과 실험(innovation and experimentation)을 육성하는 것을 목표로 합니다.
    • CanERA에서, 선도적 관행 및 혁신(leading practice and innovation, LPI)“해당 학문 분야, 또는 전공의 교육 전반(writ large)에 있어 주목할 만하며(noteworthy); 그리고/또는 본질적으로 독특하고 혁신적인(unique and innovative) 관행(방법, 절차 등)”으로 정의됩니다 [35].
    • LPI는 조사관들(surveyors)이 전국의 다른 프로그램이나 기관에 흥미로울 수 있는 참신하거나 흥미로운 관행에 대해 프로그램과 기관을 인정(recognize)할 수 있는 기능을 도입했습니다. 그 목표는 이러한 관행들을 미래에 공유하는 것이며, 여기에는 CBD를 구현하는 참신하고 성공적인 접근 방식들이 포함되고, 이를 통해 개선을 위한 특정 영역을 다루거나 일반적으로 프로그램을 개선할 방법을 찾는 다른 프로그램들이 접근할 수 있는 데이터베이스에 저장하는 것입니다.

인증평가가 어떻게 동시에 CBME 구현의 장벽이 될 수 있는가 (How accreditation can simultaneously be a barrier to implementation of CBME)

인증평가(accreditation)가 역량바탕의학교육(CBME) 구현의 촉진제(enabler) 역할을 할 수 있는 반면, 시스템, 기준(standards), 그리고 절차(processes)의 특성들은 한계(limitations)와 결과(consequences)를 도입하기도 합니다. 인증평가와 CBME 모두에서 성과(outcomes)에 초점을 맞추는 것(aligned focus)이 구현을 가능하게 할 수 있다는 합의[36, 37]에도 불구하고, 인증평가에서 성과에 대한 과도한 의존(over-reliance on outcomes)에 따르는 어려움(challenges)이 있습니다[23]. 모든 교육 사업(curricular enterprise)에는 성과의 형태(form of outcomes)로는 평가될 수 없는[24] 교육 과정(educational processes)과 학습 환경(learning environment)의 특성들을 포함한 요소들이 있으며, 이는 프로그램의 질(quality of the program)과 따라서 인증기구(accrediting bodies)에게 본질적으로 중요합니다. 성과 중심 구성(outcomes-based construct)에 대한 경직된 고수(rigid adherence)는 이러한 요소들이 효과적으로 평가되는 것을 방해하여, 인증기구가 지닌 신탁 책임(fiduciary responsibility)을 훼손할(compromising) 수 있습니다. 게다가, 인증 시스템 설계(accreditation system design) 내에 이러한 구성요소(constructs)가 부재할 경우, 이러한 필수 요소들에 대한 불충분한 특성화(deficient characterization)를 통해 초기 구현(early implementation)을 저해할(impair) 수 있습니다 (표 1 참조).

 

표 1 (Table 1) 인증 시스템의 특성이 어떻게 CBME의 구현을 가능하게 하거나 저해할 수 있는가

(How features of an accreditation system can enable or hinder implementation of competency based medical education.)

인증 시스템 특성 (ACCREDITATION SYSTEM FEATURE) CBME 구현을 가능하게 함 (ENABLE IMPLEMENTATION OF CBME) CBME 구현을 저해함 (HINDER IMPLEMENTATION OF CBME)
교육 이론의 정렬 (Alignment of educational theory) 교육 패러다임과 인증 시스템 내의 교육 이론의 정렬(Alignment of educational theory)은 일관되고 의도된 방향(consistent and intended direction)으로 변화를 주도합니다(drives change).


예시: 성과 바탕 정렬(Outcomes-based alignment): 인증평가에서 구조(structure)와 과정(process)에 대한 강조를 줄이는 것은 프로그램 내 CBME 원칙의 채택(adoption)을 촉진합니다.
단일 교육 이론에 대한 경직된 고수(Rigid adherence)는 상충하는 전통적 구성요소(competing traditional constructs)의 중요성을 무시하여, 그것들에 대한 평가를 방해하고 초기 구현을 저해할 위험(risk impairing)이 있습니다.


예시: 성과 바탕 시스템(outcomes-based system)에서조차, 학습 환경의 속성과 같은 과정 요소(process elements)들은 성과(outcomes)로 가장 잘 평가되는 것이 아님에도, 효과적인 교육과정 구현에 여전히 필수적(critical)입니다.
질적 초점 (Quality focus) 질 향상 초점(quality improvement focus)은 자체 평가(self-evaluation)를 주도하며, 시스템 개발(system development)이라는 목표를 가지고 CBME의 채택을 촉진하여 구현의 충실도와 진정성(fidelity and integrity)을 이끌어낼 수 있습니다.


이러한 초점은 또한 모범 사례(best practices)의 공유와 혁신의 확산(diffusion of innovations)을 장려합니다(promotes).
질 보증 초점(quality assurance focus)은 프로그램이 최소 기준(minimum standards)을 충족하도록 보장하여, 이해관계자(stakeholders)에 대한 위해의 위험을 최소화(minimizing the risk of harm)합니다. 이 과정에서 프로그램들은 CBME의 구현보다는 기준의 달성(achievement of standards)을 우선순위(prioritize)에 두게 됩니다.


혁신의 채택(Adoption of innovations)은 우선시되지 않습니다.
인증 기준 (Accreditation standards) 매우 상세하고 규범적인 기준(prescriptive standards)은 명확한 기대치(clear expectations)를 제공하여, 구현의 충실도(fidelity of implementation)를 향상시킬 수 있습니다.


더 큰 유연성(greater flexibility)을 허용하는 성과 바탕 기준(Outcome-based standards)은 구현을 장려하는 혁신(innovation)과 기관별 맞춤화(site-specific adaptations)를 촉진합니다(promote).
매우 상세하고 규범적인 기준은 혁신과 변화 과정(change process)을 억누를(stifle) 수 있으며, 따라서 구현을 저해할 수 있습니다.


성과 바탕 기준은 너무 유연할(too flexible) 수 있어, 결과적으로 부적절한 지침(inadequate guidance)과 낮은 구현 충실도(low fidelity of implementation)를 초래할 수 있습니다.


실패하거나 진화가 느린(slow to evolve) 기준들은 CBME 채택의 속도를 늦출 수 있습니다.
인증 절차 (Accreditation processes) 구현 첫해 동안 인증 기준에 대한 관용(Leniency)은 프로그램들의 CBME로의 전환(transition)을 지원할 수 있습니다.


징벌적 결과(punitive consequences) 없이 프로그램 내의 지속적 질 향상(continuous quality improvement)을 장려하는 인증 판정 범주(accreditation decision categories)와 의사결정 원칙들은 구현을 촉진할 수 있습니다.


새로운 선도적 실천(novel leading practices)과 혁신에 대한 인정(Recognition)은 다른 프로그램들에 의한 구현을 육성할(foster) 수 있습니다.
관용과 맞춤형 의사결정 원칙(tailored decision-making principles)을 통한 저부담 인증 과정(lower stakes accreditation process)이라는 인식은, 일부에게는 변화와 CBME 구현에 대한 동기(motivation)를 감소시킬 수 있습니다.

 

인증평가는 본질적으로 수년에 걸친 주기적인 과정(cyclical process)입니다; 프로그램들은 종종 인증 기준을 충족하기 위해 수년을 준비하며, 이는 인증 시스템이 민첩성(agile)을 유지하고 기준이 유의미성(relevant)을 유지하도록 하는 것을 어렵게 만들 수 있습니다[34]. 그러나 CBME의 구현을 촉진하기(promote) 위해서, 특정 인증 기준들은 지향적(aspirational)이거나, 적어도 원하는 변화를 뒷받침할 만큼 충분히 유연(flexible)해야 합니다. 훈련에 소요되는 시간(time spent in training)에 대한 규범적 요구사항(prescriptive requirements)과 같이 원하는 CBME 모델과 상충하는 시대착오적인 기준(anachronistic standards)은 CBME를 채택하는 프로그램들에게 부당하게 불이익을 주고(unduly punishing) 전체 시스템 전반의 CBME 채택 및 구현 속도를 늦출(slowing the overall pace) 위험이 있습니다. 따라서 인증기구는 그들의 기준이 의학교육의 주요 변화(major changes)—이 경우 CBME—와 보조를 맞추도록(keep pace with) 할 의무(duty)가 있습니다.

 

마지막으로, CBME 변화와 병행되는 인증평가 개혁의 자원 관련 함의(resource implications)가 장벽(barrier)이 될 수 있습니다. 기존의 인증 시스템이 CBME 패러다임의 채택(adoption)에 더 잘 부합하도록 진화함에 따라, 인증 과정의 질과 효과성(effectiveness)을 유지하기 위해 많은 내부적인 변화가 요구됩니다[36].

  • 이와 같은 대규모 변화(large-scale changes)에 대한 정확한 자원 요구량(resource requirements)은 기술된 바 없으나, 예로 Greenfield 등[38]은 호주의 일반 진료(general practice)를 위한 인증 기준의 개발 및 개정이 상당한 자원을 필요로 하는 중대하고, 도전적이며, 어려운 작업(significant, challenging, and difficult undertaking)이었다고 언급했습니다.

이러한 영향(implications)은 인증 과정 자체가 CBME 도입으로 인해 새롭거나 상당히 수정되었을 때 더욱 클 수 있습니다. 인증 시스템에 대한 변화는 결과적으로 프로그램으로 되돌아가는(cycle back) 자원적 영향을 초래할 가능성이 있습니다. 인증 과정에 대한 관여 및 참여(engagement and participation)는 때때로 수개월에서 수년에 걸쳐 이어지는 자원 영향(resource impacts)을 가집니다. 이는 인증 과정이 검토(examine)하고자 하는 교육적 사명(educational mission)뿐만 아니라 CBME의 구현 과정(implementation process)에도 부정적인 영향(negative impacts)을 미칠 가능성이 있습니다.

미래 시스템 설계를 위한 고려사항 (Considerations for future system design)

CBME는 의학교육 설계에 있어 성과(outcomes), 주로 해당 프로그램의 졸업생들이 획득한 역량(competencies)을 강조하는 근본적인 변화(fundamental shift)를 나타냅니다. 미래에는, 프로그램 활동(program activities)과 졸업생 성과(graduate outcomes)에 기반하여 지능(intelligence)을 제공하기 위해 개발된 방법론과 기술들이 인증 사업(accreditation enterprise)을 변화시킬(transform) 수 있습니다.

 

프로그램 평가 분석(Program evaluation analytics).

  • CBME 프로그램은 방대한 양의 평가 데이터(assessment data)를 생성하며, 이는 훈련생의 진급(trainee progression)[39, 40]에 정보를 제공할 뿐만 아니라, 교수진의 교수 및 평가 관행(teaching and assessment practices of faculty)[41]이나 순환 실습(rotations)[42]과 같이 인증 기준의 초점이 되는 프로그램의 다른 측면들에 대한 통찰력(insights)을 제공할 수 있습니다.
  • 이러한 정보는 인증 과정에 의해 주도되는[43] 질 향상 노력의 효과성(effectiveness of quality improvement efforts)에 대한 특히 가치 있는 통찰력을 제공할 수 있는데, 왜냐하면 교수개발(faculty development) 노력은 평가에 대한 훈련생들에게 제공되는 지도전문의 피드백(supervisor feedback)의 개선과, 의도된 평가 완료(desired completion of assessments)와 실제 완료(realized completion) 간의 정렬(alignment)을 개선하기 위한 순환 일정(rotation schedules)의 변경으로 이어질 것으로 기대되기 때문입니다.
  • 따라서 이러한 유형의 데이터 사용은 인증평가 내 평가 과정(evaluation processes)의 구체성(specificity)과 객관성(objectivity)을 진전시킬(advance) 수 있습니다.

프로그램 성과 기준(Program outcomes standards).

  • 단순한 평가 지표(simple assessment metrics)의 포함을 넘어서, 더 원위의 교육 및 임상 성과(distal educational and clinical outcomes)를 추적할 수 있는 기회는 CBME의 채택 없이는 불가능했을[4, 20, 44] 인증 관점(accreditation lens)에서의 추가적인 질적 차원(additional dimensions of quality)을 평가할 기회를 제공할 수 있습니다.
    • 예를 들어, 프로그램의 졸업생들이 진료를 시작했을 때(begin practice) 적절한 임상 성과(clinical outcomes)를 낸다는 것을 증명(demonstration)하는 것보다 더 나은 양질의 교육 프로그램에 대한 증거가 어디 있겠습니까?
  • 교육 및 임상 데이터의 견고한 통합(robust integration)은, 프로그램 수준에서는 전공의 프로그램이 졸업생들을 진료를 위해 얼마나 잘 준비시키고 있는지(preparing its graduates for practice)[45]에 대한 통찰력을 제공할 수 있으며, 시스템 수준에서는 더 나은 임상 성과를 초래하는 전공의 수련(residency training)의 특징에 대한 통찰력을 제공할 수 있습니다. 이러한 통찰력들은 결과적으로 미래의 인증 기준 개발에 정보(inform)를 제공할 수 있습니다.

 

변혁적 설계를 위한 타당도 증거(Validity evidence for transformative designs).

  • 마지막으로, 인증 과정의 고부담 성격(high-stakes nature)과 그에 부여되는 가치를 고려할 때, 새로운 인증 설계가 CBME와 함께 전개됨(roll out in tandem)에 따라 인증에 대한 타당도 논거(validity argument)[46]가 어떻게 강화될 수 있을지[47] 고려해보는 것은 흥미로울 것입니다. 의학 인증평가와 그 일부인 의사결정(decisions)을 뒷받침하기 위한 타당도 증거(validity evidence)의 탐색은 새로운 것이 아닙니다[48]. 현재 출판된 타당도 증거는 제한적이며, 대개 고유한 설문 도구(unique survey tools)의 타당도와 개별 기준들의 안면 타당도(face validity)에 국한되어 있습니다[48, 49].
  • 앞서 기술된 CanERA 내의 변혁적 설계 결정(transformative design decisions)들은 단지 CBME 구현을 가능하게 하기 위해서뿐만 아니라, 인증평가의 일부인 의사결정의 질(quality of decision making)을 높이기 위해(advance) 이루어졌습니다. 일화적 증거(anecdotal evidence)는 이것이 성공적이었음을 시사하지만, 미래에는 평가 데이터, 프로그램 분석(program analytics), 그리고 새로운 프로그램 성과 측정치(new program outcome measures) 모두가 이를 객관적으로 탐구하고 인증 의사결정의 타당도에 기여하는 데 사용될 수 있을 것입니다.

결론 (Conclusion)

인증 시스템은 CBME로의 전환(transition)을 가능하게 하는 데 있어 강력한 역할(powerful role)을 합니다. 기저에 깔린 교육 이론(underlying educational theory)의 정렬, 질적 초점(품질 보증[quality assurance] 대 질 향상[quality improvement]), 인증 기준, 그리고 인증 절차를 포함한 시스템의 특징들은 모두 이 전환을 촉진하기(facilitate) 위해 사용될 수 있는 설계 기회(design opportunities)를 나타냅니다. 그러나, 이러한 각 영역 내에는 한계(limitations)가 있으며 모든 설계 기회에는 결과(consequence)가 따를 수 있음을 인정해야 합니다(must be acknowledged). 우리는 현재까지 관찰된 기회와 한계, 그리고 미래를 위한 기회를 설명하기 위해 CanERA 인증 시스템의 예시를 제시했습니다. CBME로의 전환을 고려 중이거나 착수하고 있는(undertaking) 교육 기관들은 이 새로운 교육 패러다임으로의 성공적인 전환을 가능하게 하는 데 있어 인증평가의 중요성(importance of accreditation)을 고려해야 합니다.

 

 

 

 

 

Perspect Med Educ. 2024 Feb 6;13(1):44-55. doi: 10.5334/pme.956. eCollection 2024.

Design and Implementation of a National Program of Assessment Model - Integrating Entrustable Professional Activity Assessments in Canadian Specialist Postgraduate Medical Education

 

 

캐나다의 실험: 국가 단위로 EPA 기반 평가 시스템을 도입하면 어떤 일이 생길까? 🇨🇦🩺

안녕하세요! 오늘은 의학교육, 그중에서도 역량 바탕 의학 교육(Competency Based Medical Education, CBME)에 관심 있는 분들이라면 아주 흥미로워하실 내용을 들고 왔습니다.

바로 캐나다 왕립 내과 및 외과 대학(Royal College)이 주도한 대규모 프로젝트, '설계에 의한 역량(Competence by Design, CBD)' 모델의 도입 과정과 그 교훈을 담은 논문 리뷰입니다. 전공의 수련 과정에 신뢰할 수 있는 전문 활동(Entrustable Professional Activities, EPAs)을 국가 차원에서 어떻게 접목했는지, 그리고 그 과정에서 겪은 시행착오는 무엇이었는지 함께 살펴보시죠! 🧐


1. 왜 '프로그램 평가(Programmatic Assessment)'인가?

과거의 평가는 주로 "시험 한 번 잘 보면 통과!"하는 식이었죠. 하지만 의사를 길러내는 과정이 그래서는 안 된다는 문제의식에서 프로그램 평가(Programmatic Assessment)가 등장했습니다.

이 논문에서 강조하는 프로그램 평가의 핵심은 '한 방'이 아니라 '꾸준함'과 '모음(Suite)'입니다.

🗣️ 연구진의 의견: "프로그램 평가는 개별 평가 도구에 의존하는 것에서 벗어납니다; 대신 고부담 의사결정에 정보를 제공하기 위해 의도적으로 그리고 지속적으로 수집 및 분석되는 평가 구성 요소들의 “모음(suite)”에 초점을 맞춥니다." "Programmatic assessment shifts away from relying on individual assessment tools; it focuses instead on a “suite” of assessment components that are purposefully and continually collected and analyzed to inform high-stakes decisions."

 

즉, 평가 하나하나는 가벼운 저부담(low-stakes) 피드백을 위한 것이고, 이것들이 모여서 나중에 진급이나 졸업 같은 고부담(high-stakes) 결정을 내리는 근거가 된다는 것이죠.

2. EPA는 '체크리스트'가 아니라 '데이터 포인트' 📊

캐나다의 CBD 모델에서는 각 전공과목별로 EPA를 개발했습니다. 전공의가 특정 의료 행위를 혼자서 수행할 수 있는지 확인하는 것이죠. 여기서 중요한 건, EPA 관찰 한 번으로 모든 게 결정되지 않는다는 점입니다.

많은 교수님들이나 전공의들이 "이거 점수 잘 받아야 통과해!"라고 오해하곤 하는데요, 저자들은 이 점을 분명히 합니다.

🗣️ 연구진의 의견: "모든 평가(의 일부)는 단지 하나의 데이터 포인트(data-point)일 뿐입니다." "Every (part of an) assessment is but a data-point."

 

여러 교수자에게, 다양한 상황에서, 여러 번 관찰된 결과들이 모여야 비로소 역량 위원회(Competence Committee, CC)가 "이 전공의는 다음 단계로 가도 좋다"는 결정을 내릴 수 있습니다. 이를 다각검증(Triangulation)이라고 해요.

3. 현장의 혼란과 교훈: "위임 가능성(Entrustability)"이라는 단어의 함정 ⚠️

이 논문의 백미는 바로 '성찰과 교훈' 파트입니다. 이론은 완벽했지만, 실제 현장(Real-world)에서는 예상치 못한 문제들이 터져 나왔거든요.

가장 큰 문제는 용어였습니다. 평가 척도에 '위임 가능성 척도(Entrustability scale)'라는 이름을 붙였더니, 평가를 하는 교수님들이 엄청난 부담을 느낀 겁니다. "내가 5점 주면, 내일부터 얘는 이거 혼자 다 해도 된다고 보증하는 건가?" 하고 말이죠. 😅

🗣️ 연구진의 의견: "'위임 가능성 척도'라는 용어가 교수진에게 그들이 EPA 관찰 양식에 기록한 수행 평정이 전공의의 미래 위임에 대한 결정이라는 메시지를 의도치 않게 그리고 잘못 전달하고 있다는 우려가 제기되었습니다." "
The wider medical education community raised concerns that the term entrustability scale was inadvertently and erroneously conveying a message to faculty that the rating of performance they documented on the EPA observation form was a determination of the resident’s future entrustment."

그래서 연구진은 이 척도를 '회고적 감독 척도(Retrospective supervision scale)'라고 부르는 쪽으로 선회하고 있다고 해요. "앞으로 맡길 수 있다"가 아니라, "방금 내가 어느 정도로 감독했나"를 기록하는 것으로 부담을 낮춘 거죠.

4. EPA만 쳐다보지 마세요! (Tunnel Vision 주의) 🔭

또 하나의 문제는 모든 관심이 EPA에만 쏠리면서, 정작 EPA로 측정하기 힘든 다른 중요한 역량들이 소홀해질 수 있다는 점이었습니다. EPA는 중요한 뼈대지만, 전공의 수련의 '전부'는 아니니까요.

🗣️ 연구진의 의견: "밀러 피라미드의 다중 수준과 EPA 프레임워크에 포착된 것 이외의 내용을 다루는 평가 방법 및 도구의 모음은 피교육자 발달의 전체적인 관점(holistic view)을 얻고 CC에 의한 진전에 대한 고부담 결정을 지원하기 위해 필요합니다."
"A suite of assessment methods and tools that address multiple levels of Miller’s pyramid and content beyond those captured in the EPA framework are necessary to obtain a holistic view of trainee development and support high-stakes decisions about progress by a CC."

5. 마치며: 완벽을 기다리지 말라 🚀

전국 단위의 거대한 교육 개혁이 쉬울 리 없겠죠. 하지만 연구진은 마거릿 애트우드(Margaret Atwood)의 명언을 인용하며, 시행착오를 두려워하지 말고 계속 수정하고 개선해 나가는 것이 중요하다고 강조합니다.

🗣️ 연구진의 의견: "만약 내가 완벽을 기다렸다면, 나는 한 글자도 쓰지 못했을 것입니다."
"If I waited for perfection, I would never write a word."

 

우리나라 의학 교육 현장에서도 시사하는 바가 큰 논문인 것 같습니다. 완벽한 시스템을 기다리기보다, 일관된 철학(프로그램 평가)을 가지고 현장의 목소리에 귀 기울이며 계속 나아가는 태도가 필요하지 않을까요?


 

서론 (Introduction)

 

프로그램 평가 (Programmatic assessment)는 역량 바탕 의학 교육 (competency based medical education, CBME)의 핵심 구성 요소 (core component)이며 전 세계 교육 시스템 (systems of education)에 점차 도입되고 있습니다 [1, 2, 3]. CBME의 중심에는 (Central to CBME) 프로그램들이 피교육자 (trainees)의 역량 개발 및 성취 (development and achievement of competence)를 평가하기 위한 체계적인 수단 (systematic means)을 갖추어야 한다는 개념이 있습니다. 이를 위해서는

  • 바람직한 성과 (desired outcomes)에 대한 명확한 정의 (clear definitions)와,
  • 피교육자가 다음 단계로 나아가기에 (to advance) 충분한 진전 (sufficient progress)을 이루었는지를 정확하게 식별 (accurately identify)하는 동시에
  • 학습을 위한 양질의 피드백 제공 (provision of high-quality feedback)을 촉진하고 성찰적 실천 (reflective practice)을 지원하는 견고한 평가 시스템 (robust assessment systems)이 필요합니다 [4, 5].

프로그램 평가는 이러한 목표들과 부합하며 (aligns with) 유능한 졸업생을 배출한다는 (produce competent graduates) 의학의 사회적 계약 (social contract)을 이행하는 데 있어 매우 중요합니다 (crucial) [6]. 프로그램 평가

  • 평가의 의사결정 및 학습 기능 (decision-making and learning function)을 동시에 최적화 (simultaneously optimize)하기 위해, 교육적 틀 (educational framework) 내에 내재된 (embedded) 다양한 평가 방법 및 활동 (variety of assessment methods and activities)을 의도적으로 선택하고 조합 (intentional selection and combination)하여 평가 시스템을 설계하는 특정한 접근법 (specific approach)입니다 [7, 8, 9].

프로그램 평가는 개별적인 고부담 평가 도구 (individual high-stakes assessment tools)의 개발과 사용에 초점을 맞춤으로써 평가의 총괄적 기능 (summative function)을 주로 강조해 온 전통적인 평가 접근법 (traditional approaches to assessment)의 몇 가지 단점 (shortcomings)을 해결하고자 합니다 [10].

  • 전통적인 접근법들은 구조화된 고부담 시험 (structured high-stakes examinations)과 같은 수행의 제한된 단면들 (limited snapshots of performance)이 학습자의 성취 및 역량 개발 (learners’ achievement and competence development)에 관한 견고한 의사결정 (robust decision-making)을 뒷받침하기에는 충분한 증거 (sufficient evidence)를 제공할 수 없다는 이유로 비판받아 왔습니다 [11].
  • 더욱이, 교육자들이 교수 및 학습 현장 (teaching and learning encounters)과 동떨어진 (removed from) 주기적인 평가 활동 (periodic assessment activities)에 의존할 때, 그들은 성찰적 실천과 개선 (reflective practice and improvement)을 가능하게 하는 데 필요한 빈번하고 의미 있는 수행 피드백 (frequent and meaningful performance feedback)을 제공함으로써 학습자의 발달을 지원할 기회를 놓치게 됩니다 (miss opportunities) [10].

 

대조적으로 (By contrast), 프로그램 평가개별 평가 도구에 의존하는 것에서 벗어납니다 (shifts away from relying on individual assessment tools); 대신 고부담 의사결정 (high-stakes decisions)에 정보를 제공하기 위해 (to inform) 의도적으로 그리고 지속적으로 수집 및 분석되는 (purposefully and continually collected and analyzed) 평가 구성 요소들의 “모음 (suite)”에 초점을 맞춥니다 (표 1 참조) [7]. 프로그램 평가는 다음의 세 가지 근본적인 개념 (fundamental concepts)에 기반을 두고 있습니다 (grounded in):

  • 종단성 (Longitudinality): 프로그램 평가는 훈련 과정 전반에 걸친 (through training) 종단적 평가 (longitudinal assessments)를 강조합니다. 이는 피교육자에게 빈번하고 지속적인 피드백 (frequent and ongoing feedback)을 지원하여 성찰과 학습 (reflection and learning)을 촉진하는 동시에, 시간이 지남에 따른 (over time) 피교육자의 진전 상황을 추적 (tracking)할 수 있게 해주는 프로그램으로의 지속적인 정보의 흐름 (continual flow of information)을 생성합니다 [7].
  • 다각검증 (Triangulation): 어떠한 단일 평가 (single assessment)도 결정을 뒷받침하기에는 충분하지 않습니다. 그보다는, 동일한 내용 (same content)에 관련된 평가 정보가 다각검증 (triangulated)되며, 의사결정의 신뢰성 (decision reliability)은 시간이 지남에 따라, 서로 다른 평가자들 (different assessors)에 의해, 서로 다른 방법 (different methods)을 사용하여 수집된 다양한 데이터 포인트의 종합 (synthesis of multiple data points)으로부터 도출됩니다 [12]. 다각검증의 개념에는 각 역량 영역 (competency domain)을 포착 (captures)하는 평가 프로그램을 설계할 때 신중을 기해야 한다 (need to be deliberate)는 점과, 각 영역이 다양한 정보원 (variety of information sources)에 의해 정보를 제공받아야 한다는 점이 내재되어 있습니다 (inherent).
  • 비례성 (Proportionality): 평가 결정의 중요도/부담 (stakes of an assessment decision)은 해당 결정을 알리는 데 사용되는 데이터의 풍부함과 신뢰성 (richness and trustworthiness)에 상응해야 (correspond with) 합니다 [8]. 전공의 수련 (postgraduate training)에서의 고부담 결정은 수련 과정 동안의 진급 및 승진 (progress and promotion)과 같은 중요한 결과를 초래합니다. 따라서, 방어 가능한 (defensible) 고부담 결정을 알리기 위해서는 다수의 저부담 평가 (multiple low-stakes assessments)에서 나온 집계된 양적 및 질적 데이터 (aggregated quantitative and qualitative data)가 필요합니다. 추가적으로, 고부담 결정은 개별 평가 (individual assessment)와 분리되어 발생하기 때문에, 학습자가 관찰될 때마다 개선을 위한 코칭 (coaching for improvement)과 학습 지도 (guide learning) (즉, 학습을 위한 평가 [assessment for learning])에 더 큰 주의를 기울일 수 있습니다.

표 1. 전통적인 평가 접근법에 대한 비판을 다루는 프로그램 평가의 특징 (Features of programmatic assessment that address criticisms of traditional assessment approaches.)

특징 (FEATURE) 설명 (DESCRIPTION)
일상적이고, 부담이 적은 평가 활동들이 일일 임상 진료에 통합됨 (Routine, low-stakes assessment activities are integrated into day-to-day clinical practice) 각 평가 만남 (assessment encounter)은 발달을 위한 의미 있는 종단적 피드백 (meaningful longitudinal feedback)을 제공하는 자극제 (stimulus) 역할을 합니다.
의도적으로 선택된 평가 및 평가 방법들이 “목적에 부합함” (Intentionally selected assessments and assessment methods are “fit for purpose”.) 평가 및 방법의 의도적 선택 (Intentional selection)은 교육 활동의 의도된 학습 성과 (intended learning outcomes)와 수집된 데이터 간의 더 큰 일치 (greater alignment)를 지원합니다.
고부담 결정은 개별 평가 만남과는 별도로 이루어짐 (High-stakes decisions are made separately from the individual assessment encounter.) 각 평가 만남은 부담이 적도록 (low stakes) 의도되었으며, 이는 학습 지도 (학습을 위한 평가 [assessment for learning])에 더 큰 초점을 맞추는 것을 지원합니다.
결정은 시간이 지남에 따라 서로 다른 방법을 사용하여, 서로 다른 평가자들에 의해 수집된 광범위한 증거를 기반으로 이루어짐 (Decisions are made on the basis of a wide body of evidence that is collected by different assessors, using different methods over time.) 개별 사례 (individual cases) 및 맥락 (contexts)의 특수성으로 인한 변동 (variation)의 효과뿐만 아니라 평가자의 특이성 (assessor idiosyncrasies)이 감소됩니다 (적절한 표본 추출 [adequate sampling]이 제공된다면). 또한, 한 가지 평가 유형의 한계점 (limitations)은 다른 유형의 강점 (strengths)에 의해 상쇄됩니다 (countered).

 

교육과정 및 평가 설계 (curricular and assessment design)에 있어 프로그램 평가가 제공하는 (affords) 발전은 점점 더 많은 수의 의료 훈련 프로그램 (medical training programs)에서 그 실행 (implementation)을 촉진시켰습니다 (catalyzed) [7]. 프로그램 평가가 학습자, 교사 및 프로그램에 미치는 영향 (impact)에 대한 연구 증거 (research evidence)가 계속해서 증가하고 있는 반면 [7, 13], 대규모 (large scale)로 진행된 프로그램 평가 실행의 영향에 대해서는 아직 널리 알려진 바가 거의 없습니다 (little has yet been disseminated). 캐나다에서는, 전공의 교육 (postgraduate specialist medical education)이 신뢰할 수 있는 전문 활동 (entrustable professional activities, EPAs)을 중심으로 한 (centred around) 역량 바탕 모델 (competency based model)로의 변혁적인 변화 (transformative change)를 겪었습니다. 이 논문에서, 우리는 학습을 지도하고 (guide learning) EPA 성취 및 훈련 과정의 진전 (EPA achievement and progress through training)에 대한 방어 가능한 결정 (defensible decisions)을 지원하기 위해 견고한 데이터 (robust data)가 수집되도록 보장하게끔 설계된 평가 프로그램 모델의 대규모, 전국적 실행 (large scale, national implementation)에 대해 기술하고 성찰 (describe and reflect on)합니다. 이를 수행함에 있어, 우리는 오타와 2020 합의 성명서 (Ottawa 2020 consensus statement)에 정의된 프로그램 평가의 원칙들을 참조합니다 (make reference to) (표 2 참조) [8]. 이러한 원칙들은 프로그램 평가의 중요하고 인식 가능한 측면들 (important and recognizable facets)을 나타냅니다. 이 논문에서는 원칙 1-8에 특히 주의를 기울입니다 (Attention is specifically given to). 원칙 9-12는 이 시리즈의 다른 논문들에서 다루어집니다 [14, 15].

 

표 2. 프로그램 평가를 위한 오타와 2020 합의 성명서에 따른 프로그램 평가의 원칙들 (Principles of programmatic assessments from the Ottawa 2020 consensus statement for programmatic assessment [8].)

  1. 모든 평가(의 일부)는 단지 하나의 데이터 포인트 (data-point)일 뿐이다.
  2. 모든 데이터 포인트는 학습자에게 의미 있는 피드백 (meaningful feedback)을 제공함으로써 학습을 위해 최적화 (optimised for learning)된다.
  3. 합격/불합격 결정 (Pass/fail decisions)은 단일 데이터 포인트 (single data-point)에 기반하여 내려지지 않는다.
  4. 평가 방법들의 혼합 (mix of methods of assessment)이 존재한다.
  5. 선택된 방법은 해당 방법을 사용하는 교육적 정당성 (educational justification)에 의존해야 한다.
  6. 총괄 평가 (summative)와 형성 평가 (formative)의 구분은 부담의 연속선 (continuum of stakes)으로 대체된다.
  7. 학습자 진전 (learner progress)에 대한 의사결정은 그 부담 (stake)과 비례적으로 관련 (proportionally related)된다.
  8. 평가 정보는 적절한 프레임워크 (appropriate framework)를 향해 데이터 포인트 전반에 걸쳐 다각검증 (triangulated)된다.
  9. 고부담 결정 (진급 [promotion], 졸업 [graduation])은 포괄적 접근 (holistic approach)을 사용하여, 신뢰할 수 있고 투명한 방식 (credible and transparent manner)으로 이루어진다.
  10. 학습자와 그들의 진전 (progression)에 대해 논의하고 결정하기 위해 중간 검토 (Intermediate review)가 이루어진다.
  11. 학습자는 모든 평가 데이터에 대한 자기 분석 (self-analysis)을 사용하여 (교수) 멘토/코치와 반복적인 학습 미팅 (recurrent learning meetings)을 갖는다.
  12. 프로그램 평가는 개인의 학습 우선순위 (individual learning priorities)를 지원하도록 맞춤화된 학습 (learning being tailored)을 통해 자신의 학습에 대한 학습자의 주도성 및 책무성 (agency and accountability)을 점진적으로 증가시키는 것을 추구한다.

캐나다 왕립 내과 및 외과 대학 (Royal College)의 신뢰할 수 있는 전문 활동 (EPAs) 실행 (Royal College implementation of Entrustable Professional Activities [EPAs])

 

설계에 의한 역량 (Competence by Design, CBD)은 전공의 전문 훈련 (postgraduate specialist medical training)을 위해 캐나다 왕립 내과 및 외과 대학 (Royal College of Physicians and Surgeons of Canada, 이하 Royal College라 칭함)이 개발한 CBME 모델입니다. CBD에서 훈련은 네 가지 진행 단계 (progressive stages)로 구성됩니다. 각 훈련 단계마다 피교육자가 다음 단계로 승진 (promoted to the next stage)하기 전에 반드시 성취해야 하는 일련의 성과들 (a set of outcomes)이 정의되었습니다. 각 국가 전문 위원회 (national specialty committee)는 해당 전문 분야의 피교육자들을 위해 관련된 CanMEDS 이정표 (milestones)와 함께 EPA를 개념화하고 작성했습니다 (conceptualized and wrote).

  • EPA는 피교육자가 충분한 역량 (sufficient competence)을 입증한 후 수행하도록 완전히 위임 (fully entrusted to perform)될 수 있는 해당 전문 분야의 핵심 과업 (key tasks)이며,
  • 이정표는 그 과업을 완수하기 위해 요구되는 구성 기술들 (component skills)을 나타냅니다 [16, 17].

Royal College의 EPA (RCEPAs)는 단계별로 특화되어 있으며 본질적으로 발달적 (stage-specific and developmental in nature)입니다. 즉, 후반 단계의 EPA는 점진적으로 더 복잡해지며 (incrementally more complex) 초기 단계의 EPA를 기반으로 구축됩니다 (build upon). 한 단계에서 다음 단계로 나아가기 (progress) 위해서, 피교육자는 해당 단계 내의 EPA 성취를 입증해야 합니다. 역량 위원회 (Competence Committee, CC)는 피교육자의 포트폴리오 (portfolio) 내에 있는 사용 가능한 데이터를 포괄적으로 검토 (comprehensive review)한 후:

  • a) EPA 성취에 대한 고부담 결정 (high-stakes decisions)과
  • b) 훈련 단계를 거치는 전반적인 피교육자 진전 및 승진 (overall trainee progress and promotion)에 대해 프로그램에 권고 (recommendations)를 합니다 [14].

EPA 성취에 대한 결정은 CC의 관점에서 그리고 다수의 관찰 (multiple observations)에 근거하여, 전공의 (resident)가 해당 EPA를 일관되게 완수하도록 위임 (entrusted to consistently complete)받을 수 있을 때 내려집니다. 각 전문 위원회는 해당 분야의 EPA 성취에 대한 고부담 CC 결정을 지도하기 위해, 맥락의 다양성 (context variety)과 성공적인 EPA 관찰 횟수 (number of successful EPA observations)에 대한 국가 가이드라인 (National guidelines)을 개발했습니다. 그러나, 결정을 뒷받침하는 데 필요한 데이터의 유형과 양 (type and amount of data)을 결정하는 것은 CC에게 달려 있습니다 (up to the CC).

 

EPA는 즉각적인 관찰 및 코칭 피드백 (in-the-moment observation and coaching feedback)을 위한 목표물 (targets)로 기능하도록 설계되었습니다. 관찰된 과업에 대한 문서화 (Documentation)는 또한 CC가 EPA 성취에 대한 결정을 내리는 데 정보를 제공하기 위한 중요한 직장 바탕 평가 (workplace-based assessment, WBA) 데이터에 기여하도록 의도되었습니다. EPA 관찰은 일반적으로 EPA 관찰 양식 (EPA observation form) (그림 1)에 기록되지만, 프로그램들은 관찰을 기록하는 데 적합하다고 판단되는 어떠한 WBA 도구라도 사용할 수 있는 유연성 (flexibility)을 부여받습니다. EPA 관찰 양식 템플릿은 프로그램을 위한 자원 (resource)으로 개발되었으며, 수행에 대한 코칭 피드백과 판단 (judgments of performance)의 즉각적인 문서화를 용이하게 하도록 설계되었습니다. 이 관찰 양식은 RCEPA의 주요 특징 (key features)을 개요화하고 (outlines) 과업이 관찰된 구체적인 맥락 (specific context) (임상 환경, 환자 특성, 케이스 복잡성 등)을 문서화하도록 장려합니다. 지도전문의 (Supervisors)는 해당 임상 활동에 요구되는 감독 수준 (degree of supervision)에 근거하여 수행에 대한 단일한 포괄적 평정 (single global rating)을 제공하도록 요청받습니다. Royal College는 프로그램들이 다양한 임상 환경 전반에 걸쳐 강력한 심리측정적 특성 (strong psychometric characteristics)과 타당도 증거 (evidence of validity)를 입증한 O-SCORE 평정 척도 (rating scale)를 사용할 것을 강력히 권장했습니다 [18, 19, 20, 21, 22, 23]. 그러나, 프로그램들은 발달적 궤적 (developmental arc)을 따라 피교육자의 독립성 수준 (level of independence)을 나타내는 다른 회고적 감독 척도 (retrospective supervision scales)를 사용할 수 있는 지역적 유연성 (local flexibility)을 부여받았습니다 [24, 25]. 또한 각 EPA에 대한 이정표가 양식에 표시되어 지도전문의와 피교육자를 위해 과업을 “세분화 (breaking down)”함으로써 구체적이고 실천 가능한 (specific and actionable) 피드백 및 코칭 제공을 용이하게 합니다. 이러한 피드백을 문서화하기 위해 서술형 의견 섹션 (narrative comment section)이 포함되어 있습니다.

 

그림 1. EPA 관찰 양식 템플릿. EPA 신뢰할 수 있는 전문 활동 (EPA observation form template. EPA entrustable professional activity.)

 

직장 내 (In the workplace)에서는, EPA 관찰 양식 이외의 다양한 평가 방법 및 도구를 사용하여 EPA를 관찰하고 평가하는 방식에 다용도성 (versatility)이 존재합니다.

  • EPA는 임상 평가, 의사소통 기술, 리더십 기술, 술기 능력에 대한 관찰과 같이 임상 지도전문의에 의해 직접 관찰 (directly observed)될 수 있습니다.
  • 또한 케이스 또는 차트 검토, 혹은 자문 기록 (consult note)과 같은 작업 산출물 검토 (review of work products)와 같은 다양한 방법을 사용하여 간접적으로 관찰 (indirectly observed)될 수도 있습니다.
  • EPA는 다면 피드백 (multisource feedback)으로부터 수집된 데이터를 사용하여 평가될 수도 있습니다.
  • 더욱이, 다양한 WBA 도구 (단지 EPA 관찰 양식뿐만 아니라)에서 나온 질적 및 양적 데이터가 집계되고 다각검증 (aggregated and triangulated)되어 EPA 성취에 관한 CC 결정에 정보를 제공할 수 있습니다.
  • 따라서, EPA를 수행하는 전공의의 능력은 서로 다른 관찰 방법 (different methods of observation)을 사용하는 지도전문의들에 의해 평가될 수 있으며 다양한 WBA 도구를 사용하여 기록될 수 있습니다.

 

문서화된 EPA 관찰 (documented EPA observations)의 설계 및 실행은 2020 오타와 합의 성명서 (Ottawa consensus statement)에 정의된 프로그램 평가의 원칙들과 일치하도록 (align) 의도되었습니다 (표 3).

 

표 3. 2020 오타와 합의 성명서에 정의된 프로그램 평가 원칙과 매칭된 문서화된 EPA 관찰 특성 (Documented EPA observation characteristics matched to programmatic assessment principles defined in the 2020 Ottawa consensus statement [8].)

EPA 관찰 특성 (EPA OBSERVATION CHARACTERISTIC) 원칙 (PRINCIPLES)
저부담, 직장 관찰이 즉각적인 피드백 및 평가를 위해 사용됨 (Low-stakes, workplace observations are used for in-the-moment feedback and assessment) 1–3, 5
관찰은 시간이 지남에 따라 서로 다른 맥락에서, 서로 다른 평가자에 의해, 서로 다른 방법 및 도구를 사용하여 의도적으로 수집됨 (Observations are purposefully collected in different contexts, by different assessors, using different methods and tools over time) 4, 5, 8
EPA 성취에 대한 고부담 결정은 CC에 의해 EPA 관찰과 별도로 이루어짐 (High-stakes decisions about EPA achievement are made separately from the EPA observation by the CC) 3, 6, 7
다양한 평가 도구 및 방법에서 나온 데이터가 EPA 성취에 대한 고부담 결정을 알리기 위해 다각검증됨 (Data from a variety of assessment tools and methods are triangulated to inform high-stakes decisions about EPA achievement) 4, 8

약어: EPA 신뢰할 수 있는 전문 활동; CC 역량 위원회 (Abbreviations: EPA entrustable professional activity; CC competence committee).

 

EPA를 넘어서 – 평가 프로그램 (Beyond EPAs – the program of assessment)

 

CBD 모델은 프로그램들이 반드시 준수해야 하는 (must adhere to) 각 전문 분야별 단계 및 EPA로 구성된 국가 교육 프레임워크 (national educational framework)를 수립합니다. 그러나 CC에 의한 훈련 진전에 대한 고부담 결정은 오로지 EPA 성취 여부의 결정 (determination of EPA achievement)에만 기반하도록 의도되지 않았습니다. 그보다는, 프로그램들은 피교육자의 발달에 대한 포괄적인 관점 (comprehensive view)을 얻기 위해 EPA 프레임워크에 의해 포착되지 않는 역량 및 내용 (competencies and content)에 관련된 평가 정보 또한 수집해야 합니다. 프로그램들은 전공의의 훈련 진전에 대한 CC의 결정을 알리기 위해 EPA 기반 데이터와 비-EPA 기반 데이터 (non-EPA based data) 모두의 다수를 통합하는 (integrates a host of) 그들만의 고유한 평가 “모음 (suite)”을 설계할 수 있는 유연성 (flexibility)을 부여받습니다 (표 2, 원칙 6–8 참조).

 

CBME는 피교육자의 발달에 대한 보다 전체적인 관점 (holistic view)을 희생시키면서 (at the expense of) 역량을 EPA와 같이 분절되고 측정 가능한 과업 (discrete measurable tasks)으로 해체한다는 (deconstructing) 비판을 받아왔습니다 [26, 27]. 그러나, CBD 맥락에서의 EPA는 모든 것을 포함하도록 (all-encompassing) 설계되지 않았습니다; 그것들은 유능한 졸업생에게 필수적인 모든 지식, 기술, 태도 및 전문적 기대 (professional expectations)를 포착할 수 없습니다. 그보다는, 그것들은 프로그램과 피교육자를 위한 훈련 성과의 국가적 프레임워크 (national framework of training outcomes) 역할을 하도록 만들어졌습니다. CBD의 설계에 있어, 일선 교수진 (front-line faculty)에 의한 학습자의 직장 바탕 관찰 및 평가 (즉, EPA 프레임워크)를 위한 실질적인 기회 (practical opportunities)에 대한 필요성과 [16], 단지 직장 바탕 데이터뿐만 아니라 밀러의 피라미드 (Miller’s pyramid)의 모든 수준에 있는 평가 데이터를 CC가 포괄적으로 검토함으로써 학습자에 대한 전체적인 개요 (holistic overview)를 유지하는 것 사이의 균형을 맞추려는 시도 (attempt was made to balance)가 있었습니다 [14, 28]. 따라서, CBD 모델에서 피교육자의 진전 및 승진에 대한 방어 가능한 결정 (defensible decisions)을 위해서는 EPA 및 비-EPA 기반 내용과 관련된, 시간이 지남에 따라 다수의 출처와 방법으로부터 수집된 평가 정보의 보완 (complement)이 필요합니다 (표 2, 원칙 4 및 8 참조).

 

설계상 (By design), EPA는 전문 분야의 필수 과업이며 따라서 EPA 기반 평가는 전공의가 일일 임상 진료에서 무엇을 “하는가 (does)”에 초점을 맞춤으로써 밀러 피라미드의 가장 높은 수준 (highest level)을 목표로 합니다 [28]. 그러나, CC에 의한 피교육자 진전에 대한 방어 가능한 고부담 결정을 알리기 위해서는 밀러의 평가 위계 (assessment hierarchy)의 다양한 수준 (various levels)을 다루는 다양한 평가 방법들 (diverse assessment methods)이 필요합니다 [29]. 그러므로, 국가 EPA 프레임워크에 의해 안내되는 평가 데이터를 수집하는 것에 더하여, 프로그램들은 그들의 평가 “모음”에 포함할 추가적인 비-EPA 기반 데이터가 무엇인지 결정해야 하며, 다음을 보장해야 합니다:

  • 1) 각 평가 유형이 그것이 선택된 교육 활동의 목적과 일치함 (aligns with) (표 2, 원칙 5 참조),
  • 2) 각 평가가 학습자에게 의미 있는 피드백 (meaningful feedback)을 생성하고 CC 결정에 정보를 제공할 유용한 데이터를 생성함 (표 2, 원칙 2 참조), 그리고
  • 3) 서로 다른 평가 활동 전반의 데이터가 다각검증 (triangulated)될 수 있음 (표 2, 원칙 8 참조).

CBD EPA 설계의 독특한 특징 (Unique feature)은 구성 이정표 (component milestones)를 EPA 내에서 그리고 EPA 간에 연결 (linking)하는 것이며, 이는 EPA 관찰에 의해 잘 다루어지는 역량들과 다른 교수 및 평가 방법 (other methods of teaching and assessment)을 필요로 하는 역량들을 식별할 수 있게 해줍니다. 표 4는 고부담 진전 결정을 알리기 위해 프로그램들이 그들의 평가 모음에 통합하는 것을 고려할 수 있는 특정 평가 도구의 예시와 함께 다양한 평가 유형의 전부는 아니지만 일부 목록 (non-exhaustive list)을 제시합니다. 평가 모음의 신중한 선택 (deliberate selection)을 용이하게 하기 위해, 프로그램들은 교수 및 학습 활동뿐만 아니라 평가 방법이 의도된 학습 성과와 일치되는 구성적 일치 (constructive alignment) 개념을 적용하도록 장려됩니다 [30]. 이 과정은 다음을 명시적으로 매칭시키는 (explicitly matches) 교육과정 지도 (curriculum map)의 생성을 통해 지원받을 수 있습니다: 1) 학습 활동과 훈련 단계, 2) 역량과 학습 활동, 3) 평가 활동과 학습 활동, 그리고 4) 평가 도구와 평가 활동 [31].

 

표 4. 평가 유형별 평가 방법 및 도구의 예시 (Examples of assessment methods and tools by assessment type.)

평가 유형 (ASSESSMENT TYPE) 예시 (EXAMPLES)
지식 시험 (Tests of knowledge) 국가 또는 지역 수련 중 시험 (in-training examinations)
  진급 시험 (Progress testing)
OSCE, 시뮬레이션 평가 (OSCEs, simulation assessments) 객관구조화진료시험 (Objective structured clinical examinations)
다면 평가 (Multisource assessments) 360도 평가 (360 assessment), O-RON [32]
직장 바탕 평가 (Workplace-based assessments) O-EDShOT [22], OCAT [33], Mini-CEX [34]

약어: OSCEs 객관구조화진료시험 (Abbreviation: OSCEs objective structured clinical examinations).

 

요약하자면 (In summary), CBD 접근법전문 분야의 모든 프로그램에 국가 EPA 세트 (national set of EPAs)를 제공함으로써 중요한 임상 학습 성과를 표준화 (standardizing)하고 이러한 성과를 중심으로 한 WBA 시스템의 실행을 용이하게 합니다. 개별 프로그램들은 피교육자의 발달에 대한 포괄적인 그림 (comprehensive picture)을 생성하기 위해 국가 EPA 프레임워크에 의해 안내되는 WBA와 비-EPA 기반 평가 모두를 포함하는 지역적 평가 프로그램 (local program of assessment)을 설계하는 데 유연성 (flexibility)을 부여받습니다. Royal College 인증 기준 (accreditation standards)과 정기적인 인증 조사 (accreditation surveys)는 개별 프로그램들이 해당 전문 분야의 전체 역량 스펙트럼 (full spectrum of competencies)을 다루고 방어 가능한 진전 및 승진 결정을 가능하게 하는 전체적인 평가 프로그램 (holistic program of assessment)을 개발하기 위한 요구사항을 충족하도록 보장합니다.

 

성찰과 교훈 (Reflections and lessons learned)

 

여느 주요한 변화 이니셔티브 (major change initiative)와 마찬가지로, Royal College는 초기에 실행상의 도전 (implementation challenges)에 직면했습니다. 그러나, 이러한 시련들 (trials)은 보편적으로 경험된 것은 아니었습니다 (not universally experienced). 예를 들어, 나중에 실행한 전문 분야들은 초기 실행자들 (early implementers)의 과거 경험과 그들이 얻은 교훈으로부터 혜택을 받았습니다. 하지만, 동일한 실행 집단 (implementation cohort) 내에서도 기관, 전문 분야 및 프로그램 전반에 걸쳐 변동성 (variability)이 관찰되었습니다 [35]. 따라서, 성공적인 실행에 영향을 미치는 매개 요인들 (mediators)을 결정하고 특징짓는 노력은 여전히 Royal College의 프로그램 평가 전략의 중요한 요소로 남아 있습니다 [36]. 우리는 또한 이러한 도전 중 많은 부분이 CBD 실행에만 고유한 것이 아니며 (not unique) 이전에 문헌에서 기술된 바 있다는 점을 인정합니다 (acknowledge). 일부는 각 프로그램의 지역적 맥락 (local context) 전반에 적용될 수 있는 단일한 분절적 해결책 (single discrete solution)이 없는 “난제들 (wicked problems)”을 나타내며, 이는 전국적 규모의 실행이 가진 복잡성 (complexity)을 강조합니다. 더욱이, 일부 도전은 예상되었던 반면, 일부는 의도하지 않은 예상치 못한 결과 (unintended and unexpected consequences)를 나타내며, 이에 대해 CBD의 평가, 적응 및 대규모 진화 (evaluation, adaptation and large-scale evolution)라는 반복적인 과정 (iterative process)이 진행 중입니다. 여기서 우리는 이러한 도전들이 CBD의 전국적 실행에 어떻게 독특한 영향을 미쳤는지 성찰하고, 다른 이들에게 지침이 되기를 (guide others) 바라는 마음으로 얻은 교훈을 강조합니다.

 

도전 1 – 평가 프로그램 (program of assessment)을 배제한 채 EPA 기반 평가 데이터에만 치중 (Challenge 1 – Emphasis on EPA-based assessment data at the exclusion of a program of assessment)

 

CBD의 설계 및 실행과 함께, 직장 바탕 평가 (workplace-based assessments)를 지도하기 위한 새로운 국가적 EPA 프레임워크 (new national framework of EPAs)가 도입되었습니다. 전문 위원회와 프로그램 책임자들 (program directors)은 일련의 CBD 워크숍 동안 그들의 국가적 EPA를 설계, 정제 및 수립하기 위해 상당한 시간과 노력을 투자했습니다 [37]. 게다가, 일선 현장 (on the front lines)에서는 활용과 참여 (uptake and engagement)를 강화하려는 목표로 프로그램, 교수진 및 피교육자들을 그들의 새로운 전문 분야별 EPA에 적응시키는 데 (on-boarding) 자원이 투입되었습니다 (dedicated). 이러한 노력은 각 전문 분야를 위한 새로운 국가적 역량 세트 (new national set of competencies)의 실행을 용이하게 하기 위해 필요했지만, EPA에 대한 인식된 강조 (perceived emphasis)는 프로그램 평가의 원칙에 도전하는 (challenge) 몇 가지 상호 관련된 그리고 의도하지 않은 결과들을 낳았습니다 (표 5).

 

표 5. EPA 실행으로부터 얻은 성찰과 교훈 (Reflections and lessons learned from EPA implementation.)

의도하지 않은 결과 (UNINTENDED CONSEQUENCE) PA 원칙 (PA PRINCIPLES) 성찰과 교훈 (REFLECTIONS AND LESSONS LEARNED)
일부 프로그램에서 EPA가 유일한 평가 목표가 됨. (In some programs, EPAs became the sole target of assessments.) EPA 관찰 양식 템플릿이 밀러 피라미드의 다양한 수준에 걸쳐 EPA 및 비-EPA 기반 데이터를 모두 포착하는 평가 “모음 (suite)”을 배제한 채 기본 평가 도구 (default assessment tool)가 되었음. 4, 8  
프로그램 리더와 CC는 오로지 EPA 관찰 양식 데이터에만 의존하는 것이 평가 공백 (assessment gaps)을 초래한다는 것을 확인했음; 그들은 평가 시스템을 정제하는 주체 (agents)로서 기능할 수 있는 좋은 위치에 있음 [38, 39, 40, 41].

밀러 피라미드의 다중 수준과 EPA 프레임워크에 포착된 것 이외의 내용을 다루는 평가 방법 및 도구의 모음은 피교육자 발달의 전체적인 관점 (holistic view)을 얻고 CC에 의한 진전에 대한 고부담 결정을 지원하기 위해 필요함.


대규모 실행 동안, 변화 관리 (change management) 노력은 필연적으로 새로운 혁신 (예: EPA 프레임워크)에 자원을 쏟겠지만, 앞으로 계속 가져갈 (carried forward) 기존 요소들 (existing elements) (즉, 평가 방법의 모음)의 통합 또한 반드시 지원되어야 함.
EPA 관찰 및 평가가 피교육자들에게 고부담으로 인식됨. (Observation and assessment of EPAs are perceived by trainees as high stakes.) 1, 2, 3, 7 EPA 시스템은 코칭과 성장을 위한 기회를 지도하는 프레임워크라기보다는 훈련의 CBD 단계를 통과하기 위한 (progress through) 일련의 요구사항 (set of requirements)으로 간주되었음.
EPA 시스템은 코칭과 성장을 위한 기회를 지도하는 프레임워크라기보다는 훈련의 CBD 단계를 통과하기 위한 (progress through) 일련의 요구사항 (set of requirements)으로 간주되었음.

성취를 위한 맥락의 다양성과 성공적인 EPA 관찰 횟수에 대한 국가 가이드라인이 엄격한 요구사항 (strict requirements)으로 해석되었으며, 이는 EPA 기반 평가 데이터 수집을 둘러싼 “체크리스트” 사고방식 (“checklist” mentality)을 조장했음 [42, 43].

=>
 Royal College는 맥락의 다양성과 성공적인 EPA 관찰 횟수가 엄격한 기준 (strict criteria)이 아닌 CC에 대한 지침 (guidance)으로 기능해야 함을 프로그램과 피교육자에게 명확히 하기 위해 기술 가이드 (technical guide)와 필수 요구사항 성명서 (statement of essential requirements)를 배포했음 [29, 44].


성장 마인드셋 (growth mindset)을 촉진하고 직장 바탕 평가가 학습자에게 저부담 (low stakes)이며 긍정적으로 인식될 수 있도록 하는 안전한 학습 환경 (safe learning environments)을 조성해야 할 지속적인 필요성이 있음. 연구에 따르면 a) 피교육자와 평가자 간의 상호작용b) 평가의 의미와 결과에 대한 피교육자의 이해가 평가 부담에 대한 인식에 영향을 미침 [43].

=>
 Royal College의 즉각적인 코칭 (coaching in the moment) 모델 [15]은 프로그램과 교수진이 실천 가능한 피드백 (actionable feedback)을 강조하고 평가의 학습 기능을 최적화하는 긍정적인 피교육자-평가자 상호작용을 수립하도록 돕기 위해 개발되었음.


=>  프로그램과 전공의를 위해 EPA 관찰의 역할을 명확히 하는 국가적 이니셔티브들이 개발되고 배포되었음 [45, 46]. 이러한 이니셔티브들은 EPA 관찰의 학습 기능, 합격/불합격 결정은 단일 관찰에서 이루어지지 않는다는 점, 그리고 다양한 출처에서 수집된 많은 데이터 포인트가 EPA 성취 및 진전에 대한 결정을 알리는 데 사용된다는 점을 강조함.

약어: CBD 설계에 의한 역량 (Competence by Design); CC 역량 위원회 (Competence Committee); EPA 신뢰할 수 있는 전문 활동 (entrustable professional activity); PA 프로그램 평가 (programmatic assessment).

 

도전 2 – 평가 부담에 대한 인식에 영향을 미치는 용어 (Challenge 2 – Terminology impacting the perception of assessment stakes)

Royal College에 의한 EPA 관찰 양식의 설계에는 O-SCORE 평정 척도의 광범위한 도입 (wide-scale introduction)이 포함되었습니다 [18, 47]. O-SCORE 척도는 관찰된 과업에 대해 지도전문의가 필요로 했던 관여 정도 (degree of involvement)를 기술하기 위해 구어체 언어 (colloquial language)를 사용하여 작성된 앵커 (anchors)를 포함합니다. 이 척도는 다양한 임상 맥락에 적용되어 왔으며 신뢰할 수 있는 점수 (reliable scores)와 훈련 수준을 변별하는 능력 (ability to discriminate training level)을 포함하여 강력한 심리측정적 특성을 입증했습니다 [19, 20, 22, 23, 48]. O-SCORE와 다른 유사한 척도들은 초기에 위임 가능성 척도 (entrustability scales)라고 기술되었습니다 [49]. Royal College가 예상하지 못한 것은 일선 교수진이 단일 EPA 관찰 양식에 제공한 평정을 피교육자가 미래에 해당 과업을 수행하도록 완전히 위임될 수 있는지 여부에 대한 고부담 판단 (high-stakes judgment)으로 인식할 것이라는 점이었습니다 (이 결정은 시간이 지남에 따라 서로 다른 맥락에서 수집된 다수의 데이터 포인트의 다각검증에 근거하여 CC를 위해 유보된 것입니다; 표 2, 원칙 7 및 8 참조). 더 넓은 의학 교육 커뮤니티는 위임 가능성 척도라는 용어가 교수진에게 그들이 EPA 관찰 양식에 기록한 수행 평정이 전공의의 미래 위임에 대한 결정 (determination)이라는 메시지를 의도치 않게 그리고 잘못 전달하고 있다 (inadvertently and erroneously conveying)는 우려를 제기했습니다 [50]. 이는 이러한 평가에 대해 인식된 부담 (perceived stakes)을 높이고 일선 교수진에게 과도한 부담과 책임 (undue burden and responsibility)을 지우게 되었습니다 (표 2, 원칙 3 및 7 참조) [24, 51].

 

 

https://pubmed.ncbi.nlm.nih.gov/22914526/

 

 

성찰과 교훈 (Reflections and lessons learned)

 

EPA 수행에 대한 교수진 판단의 부담을 둘러싼 오해를 불식시키기 위한 (dispel the misconception) 노력의 일환으로, Royal College는 ‘위임 가능성 (entrustability)’이라는 용어와 그것이 가질 수 있는 모든 고부담 함축 의미 (high-stakes connotations)를 제거하기 위해 회고적 감독 척도 (retrospective supervision scale)라는 용어로 전환하는 것을 고려하고 있습니다 [24]. 추가적으로, 평가자들이 평가의 학습 목표 (learning goal) (저부담, 관찰된 만남에 근거한 피드백과 성장에 초점)를 더 잘 이해하도록 돕기 위해 교수 개발 (faculty development)을 위한 지속적인 자원이 개발 및 배포되고 있습니다. 평가의 교육적 영향력 (educational impact)은 주로 학습자에 대한 서술형 피드백 (narrative feedback)에서 파생되므로, 평가에 기록된 서술형 의견의 질을 향상시키기 위한 지속적인 교수 개발 전략은 Royal College가 CBD 실행을 계속해서 강화함에 따라 (continues to enhance) 초점이 되어 왔습니다.

 

도전 3 – 파견 로테이션 (Challenge 3 – Off-service rotations)

 

전문 분야별 EPA 시스템 (system of discipline-specific EPAs)을 사용하여 파견 로테이션 (off-service rotations) 중인 피교육자를 평가하는 것은 몇 가지 이유로 둥근 구멍에 네모난 못을 끼우려는 것 (square peg in a round hole)처럼 도전적일 수 있습니다.

  • 첫째, 평가자가 피교육자와 동일한 전문 분야가 아니기 때문에, 피교육자의 전문 분야에서 유능하고 독립적인 진료를 위한 표준 (standard)에 익숙하지 않을 수 있습니다.
  • 둘째, EPA는 전문 분야에 특화된 과업 (discipline-specific tasks)이므로 다른 임상 환경에서는 관찰되지 않을 수 있습니다. 일부 전문 위원회는 파견 로테이션에서 관찰되고 평가될 수 있는 EPA를 설계하는 데 신중을 기했지만 (deliberate), 이는 전문 분야 전반에 걸쳐 다양하게 고려되었습니다 (variably considered).
  • 셋째, 파견 로테이션의 목표는 과업을 독립적으로 수행하는 능력 (즉, EPA)을 획득하는 것이 아닐 수 있습니다; 대신 지식 습득 (knowledge acquisition)이나 기술 개발 (skill development)일 수 있습니다. 결과적으로, 파견 교수진에게 EPA 평가를 완료하도록 요청하는 것은 의도된 학습 성과 (intended learning outcomes)와 관련이 없을 수 있으며 많은 프로그램이 필요하다고 느끼는 수준의 유용한 정보 문서화를 촉진하지 못할 수 있습니다.
  • 넷째, 다양한 전문 분야에서 로테이션을 도는 파견 피교육자들을 위해 무엇을 가르치고 평가해야 하는지에 대해 교수진을 오리엔테이션 (orienting)하는 것은 도전적입니다.

 

성찰과 교훈 (Reflections and lessons learned)

 

피교육자가 왜 특정 파견 로테이션을 가는지에 대한 명확한 이해 (clear understanding)가 본 소속 프로그램 (home program)에 의해 수립되어야 하며 사용되는 평가 도구는 이러한 목표를 반영해야 합니다 (표 2, 원칙 5 참조).

  • 파견 로테이션 동안 피교육자가 어떻게 발달하고 있는지에 대한 세부 사항을 포착하기 위해 (EPA 관찰 양식 이외의) 다른 유형의 평가 도구를 사용하는 것은 CC에게 더 의미 있는 데이터 (meaningful data)를 제공할 수 있습니다.
  • 이는 또한 피교육자가 이러한 로테이션 동안 적절한 훈련 경험에 노출되고 있는지 확인하는 데 도움이 됩니다. 파견 교수진에게 이러한 로테이션의 목표, 평가해야 할 것, 그리고 사용될 평가 도구의 유형에 대한 오리엔테이션을 제공하는 것은 이러한 로테이션 동안 수집되는 수행 데이터의 질 (quality of performance data)을 향상시킬 수 있습니다. 그러나, 관여될 수 있는 교수진의 상당한 숫자 (significant number) 때문에 이것이 항상 가능하지는 않을 것임이 인식됩니다.
  • 따라서, 평가 도구를 가능한 한 사용자 친화적 (user friendly)으로 만드는 것이 도움이 될 수 있습니다.

 

도전 4 – 평가에 대한 전공의 부담 (Challenge 4 – Resident burden of assessment)

 

많은 프로그램이 피교육자가 EPA 관찰을 주도하는 것 (driving EPA observations)에 전적으로 책임 (solely responsible)이 있도록 평가 시스템을 설정했습니다. 피교육자가 자신의 학습을 지휘하는 것 (direct their own learning)에는 분명 가치가 있지만, 피교육자 주도 평가 (trainee-driven assessments)에 대한 배타적 의존 (exclusive reliance)은 몇 가지 의도하지 않은 결과를 초래했습니다. 여기에는

  • 피교육자에 대한 업무 부담 증가 (increased burden of work) [42],
  • 전공의 웰빙 (resident wellness)에 대한 부정적 영향 [52],
  • 어떤 교수진이 평가를 완료하는지에 대한 제한 (limitations),
  • 피교육자가 독립적인 수행 (independent performance)을 입증한 경우로만 평가가 제한되는 것 [53], 그리고
  • 전반적으로 문서화된 관찰 수의 감소가 포함됩니다.

 

성찰과 교훈 (Reflections and lessons learned)

 

평가 활동의 개시 (Initiation)교수진과 피교육자 모두가 공유하는 책임 (responsibility shared)이어야 합니다.

  • 피교육자는 자신의 강점 영역과 더 많은 관찰 및 코칭이 필요한 진료 영역에 대해 가장 잘 알고 있을 수 있지만, 교수진은 피교육자가 아직 식별하지 못한 결핍 (deficiencies)을 포착하는 데 더 잘 조율되어 있을 수 있습니다 (more attuned to pick up).
  • 따라서, 평가는 이 작업의 부담이 공유되고, 매우 다양한 교수진과 광범위한 관찰자 (range of observers)가 참여하며, 피교육자가 독립을 향해 나아감에 따라 임상 수행에 대한 일상적이고 문서화된 피드백 (routine and documented feedback)을 받을 수 있도록 보장하기 위해 교수진과 피교육자 모두에 의해 촉발 (triggered)되어야 합니다.
  • EPA를 특정 로테이션에 매핑 (Mapping)하는 것은 교수진이 그들이 일상적으로 관찰하고 평가할 과업의 하위 집합 (subset of tasks)에 더 익숙해지도록 돕고 (표 2, 원칙 5 참조) 그들이 피교육자 평가에 투자해야 하는 노력을 줄여줄 수 있습니다.
  • 또한, 주당 촉발되어야 하는 문서화된 관찰의 수누가 촉발해야 하는지에 대한 기대치 (expectation)를 설정한 프로그램들이 위의 도전들을 해결하는 데 더 큰 성공을 거두었습니다.

 

도전 5 – EPA의 현실 세계 실행 (Challenge 5 – Real-world implementation of EPAs)

 

프로그램 책임자와 전문 위원회가 EPA를 해당 분야의 핵심 과업을 반영하도록 설계하기 위해 모든 노력을 기울였지만, 실행 초기 단계에서 일부 EPA가 실질적인 일일 업무 흐름 (practical daily workflow)과 일치하지 않음 (not congruent)이 분명해졌습니다 (예: 재택 당직 [home-call] 중인 교수진에 의한 과업의 직접 관찰). 이해할 만하게도 (Understandably), 이는 그러한 EPA 관찰의 수용성 (acceptability), 인식된 타당도 (perceived validity), 그리고 교육적 영향력 (educational impact)에 영향을 미쳤습니다 (표 2, 원칙 2 및 5 참조) [54, 55, 56].

 

성찰과 교훈 (Reflections and lessons learned)

 

마거릿 애트우드 (Margaret Atwood)는 “만약 내가 완벽을 기다렸다면, 나는 한 글자도 쓰지 못했을 것이다 [57]”라고 말했습니다. 여느 주요한 변화 이니셔티브와 마찬가지로, Royal College는 지속적인 질 향상 (continuous quality improvement) 과정을 사용하여 전문 위원회 수준에서 국가적 EPA 세트를 반복하고 정제하는 것 (iterate and refine)을 목표로 했습니다. CBD를 가장 먼저 시작한 (first to launch) 일부 전문 분야들은 그들의 원래 EPA에 대한 정제 (refinements)를 수행했지만, 다른 분야들은 이제 막 개정 과정 (revision process)을 시작하고 있습니다. Royal College는 전문 위원회 수준에서 EPA 개정을 지원할 수 있는 역량 (capacity)이 자원 제약 (resource constraints)에 의해 영향을 받을 것임을 인식했습니다. 대규모 평가 프로그램을 실행하려는 교육자들은 전체 실행 (full implementation) 이전에 더 작은 규모로 파일럿 (piloting)을 수행하는 것을 고려해야 합니다. 파일럿은 예상치 못한 도전을 식별하고, 자원 필요가 증가하는 영역을 파악하며, 지속적인 개발을 위한 인프라를 구축하고, 지속적인 질 향상을 촉진하기 위한 충분한 역량 (sufficient capacity)을 보장하는 데 도움이 될 수 있습니다 [58].

 

결론 (Conclusion)

 

학습을 지도하도록 설계된 평가 프로그램 모델의 실행은, 동시에 다양한 전문 분야 (multiple disciplines)에 걸쳐 전국적 수준 (national level)에서 EPA 성취 및 훈련 진전에 대한 방어 가능한 결정을 지원하기 위한 견고한 데이터 수집을 보장해야 하며, 이는 복잡한 과정 (complex process)이자 주요한 변화 이니셔티브입니다. 우리는 EPA를 중심으로 한 WBA 시스템을 통합하는 CBD 프로그램 평가 모델을 기술하고 이 여정 (journey)에서 겪은 도전들에 대해 성찰했습니다. 이 논문이 평가 시스템의 대규모 변혁 (large-scale transformation)에 착수하려는 (intending to embark on) 다른 교육자들에게 가치 있는 통찰력 (valuable insights)을 제공하기를 희망합니다.

 

 

 

 

 

 

 

Perspect Med Educ. 2024 Feb 6;13(1):68-74. doi: 10.5334/pme.965. eCollection 2024.

Competence by Design: The Role of High-Stakes Examinations in a Competence Based Medical Education System

 

역량 중심 교육(CBME) 시대, 시험은 사라질까?

안녕하세요! 오늘은 캐나다 왕립 대학(Royal College)의 시험 위원회 리더들이 발표한 흥미로운 논문을 하나 소개하려고 합니다.

요즘 의학 교육의 대세는 단연 역량 중심 의학 교육(Competence Based Medical Education, CBME)이죠. 현장에서 전공의들을 수시로 관찰하고 피드백을 주는 직장 기반 평가(Workplace-based Assessment)가 강조되면서, 혹자는 "이제 예전처럼 각 잡고 보는 거대한 시험(Examination)은 필요 없는 거 아니야?"라고 묻기도 합니다.

 

하지만 이 논문의 저자들은 단호하게 "아니요"라고 말합니다. 왜 CBME 시대에도 고부담 시험(High-stakes examinations)이 여전히 중요할까요? 그리고 이 시험들은 새로운 교육 흐름에 맞춰 어떻게 진화해야 할까요?


1. 왜 여전히 '시험'이 필요한가? (The "Failure to Fail" Problem)

우리는 수시로 전공의들을 평가한다고 하지만, 솔직히 말해 현장에는 여전히 '실패시키지 못함(Failure to fail)' 문화가 존재합니다. 교수님들도 사람인지라 제자를 유급시키거나 낙제점을 주는 게 쉽지 않죠.

논문에서는 이 점을 아주 뼈아프게 지적합니다.

"불행하게도, 보건 의료 전문직 교육은 임상 환경에 있는 전공의들에 대해 ‘실패시키지 못함’ 문화를 계속해서 보여주고 있으며, 우리가 직장 기반 평가의 타당도를 결정할 때까지는 CBME가 도입된다고 해서 이것이 변할 것이라고 가정할 수 없다." (Unfortunately, health professions education continues to exhibit a “‘failure to fail” culture for trainees in the clinical environment and we cannot assume this will change with CBME until we determine the validity of workplace-based assessment.)

 

더 무서운 사실은, 교수님들이라면 누구나 마음속으로 '아, 저 친구는 좀 불안한데...'라고 생각하는 전공의가 있다는 겁니다.

"솔직한 성찰에 참여하는 임상 교수라면 누구나 우려를 가지고 있는 전공의들, 즉 임상 훈련이 끝날 때쯤 자신의 가족을 믿고 맡길 수 없는 의사 지망생들을 거의 확실하게 식별해 낼 것이다." (Any clinical faculty who engage in honest reflection will almost certainly identify trainees about whom they have concerns — aspiring physicians whom they would not trust to look after their own family members by the end of their clinical training.)

 

결국, 각 수련 병원이나 프로그램이 '온정주의'나 '소송 걱정' 때문에 제대로 걸러내지 못하는 부분을, 국가 차원의 독립적인 시험이 최후의 보루로서 걸러줘야 한다는 것이죠. 이는 사회와의 약속이기도 합니다.

"모든 수련 프로그램이 수련 기간 내내 학습자에 대한 정직한 평가를 완료하고... 사회적 계약상의 의무를 다하고 있는 것은 아니라고 주장할 수 있다." (It can be argued that not all training programs are meeting their obligation in the social contract to complete honest assessments of learners throughout their training.)


2. 시험은 어떻게 진화해야 하는가? (9 Key Adaptations)

그렇다고 옛날 방식 그대로 시험만 고집해서는 안 되겠죠? Royal College는 CBD(Competence by Design) 모델에 맞춰 시험 제도를 9가지 측면에서 대대적으로 뜯어고쳤다고 해요. 핵심만 쏙 뽑아 정리해 드릴게요.

  • ① 더 이른 시험 시기 (Earlier Timing) ⏰ 수련이 다 끝날 때 시험을 보는 게 아니라, 조금 앞당겨서 봅니다. 시험에 합격하고 나면 남은 수련 기간(Transition to Practice 단계) 동안은 시험 공부가 아니라 진짜 '임상 실무'에만 집중할 수 있게요. 혹시 떨어지더라도 수련 중에 재교육(Remediation) 받을 기회를 줍니다.
  • ② 평가 간의 정렬 (Alignment) 🔗 시험에서 잘 볼 수 있는 것(지식, 드문 케이스 대처)과 현장에서 잘 볼 수 있는 것(태도, 술기)을 구분해서 서로 상호 보완(Complementary)하게 설계합니다.
  • ③ 시험 순서 재배치 (Sequencing) 1️⃣➡️2️⃣ 필기시험(Written)에 먼저 합격해야 구술/실기(Applied) 시험을 볼 수 있게 바꿨습니다. ('필기 후 실기' 원칙)
  • ④ 투명성 강화 (Transparency) 🔍 시험 청사진(Blueprint)과 예시 문항을 투명하게 공개해서, 운이나 요령이 아니라 진짜 역량(Competence)이 점수에 반영되도록 합니다.
  • ⑤ 시험관 교육 (Examiner Training) 👨‍🏫 시험관들이 단순히 지엽적인 지식을 묻는 게 아니라, "이 사람이 캐나다에서 전문의로 활동할 역량이 있는가?"를 판단하도록 교육합니다.
  • ⑥ 질 관리 (Quality Review) ✅ 문항 출제에 참여하지 않은 제3의 검토자가 문제의 명확성을 다시 확인합니다.
  • ⑦ 포괄적 평정 척도 (Global Rating Scales) 📊 체크리스트(Checklist) 방식에서 벗어나, 전공의의 고차원적 사고와 임상적 의사결정을 평가할 수 있는 포괄적 평정 척도를 도입했습니다. 기계적 암기보다는 '생각하는 힘'을 보겠다는 거죠.
  • ⑧ 심리측정의 변화 (Psychometrics) 📈 상대평가적 요소가 강한 'Cronbach's alpha' 대신, 절대적인 기준(역량) 도달 여부를 판단하기 좋은 'Theta' 값을 신뢰도 지표로 사용합니다.
  • ⑨ 지속적 질 향상 (QI) 🔄 시험이 끝날 때마다 데이터를 분석해서 계속해서 시험 자체를 업그레이드합니다.

 

3. 마무리하며: 공존의 미학

결론적으로, 역량 중심 교육 시대에도 시험은 사라지지 않습니다. 오히려 직장 기반 평가가 놓칠 수 있는 부분을 채워주는 든든한 파트너로서 그 역할이 더 명확해졌다고 볼 수 있습니다. 저자들은 마지막으로 이렇게 강조합니다.

"시험은 직장 기반 평가를 보완하는 독립적인 제3자 평가로서 Royal College 인증 과정에서 필수적인 역할을 계속 수행한다." (Examinations continue to play an integral role in the Royal College certification process as an independent, third-party assessment that complements workplace-based assessment.)

 

결국 중요한 건 '시험이냐 아니냐'의 이분법이 아니라, '어떻게 하면 안전하고 유능한 의사를 길러낼 것인가'라는 목표를 위해 두 가지 평가 방식을 얼마나 조화롭게 섞느냐(Mix)인 것 같습니다.


서론 (Introduction)

역량 중심 의학 교육(competency based medical education, CBME) 시대에 고부담 시험(high-stakes examinations)의 역할(role)은 무엇인가? CBME와 프로그램식 평가(programmatic assessment)는 전공의(trainees)의 일상 업무(daily work) 속에서 이루어지는 빈번한 저부담 평가(frequent low-stakes assessments)로의 평가 철학(assessment philosophy) 및 설계(design)의 변화(shift)를 대변하며, 일부에서는 이것이 시험의 종말(end of examinations)을 알리는 신호가 되어야 한다고 제안해왔다. 불행하게도, 보건 의료 전문직 교육(health professions education)은 임상 환경(clinical environment)에 있는 전공의들에 대해 “실패시키지 못함(failure to fail)” 문화[1, 2]를 계속해서 보여주고 있으며(continues to exhibit), 우리가 직장 기반 평가(workplace-based assessment)의 타당도(validity)를 결정(determine)할 때까지는 CBME가 도입된다고 해서 이것이 변할 것이라고 가정(assume)할 수 없다. 대부분의 전공의가 성공(succeed)하고 많은 이들이 졸업 후 의학 교육(postgraduate medical training)에서 뛰어난 성과(excel)를 보이지만, 솔직한 성찰(honest reflection)에 참여(engage)하는 임상 교수(clinical faculty)라면 누구나 우려(concerns)를 가지고 있는 전공의들, 즉 임상 훈련(clinical training)이 끝날 때쯤 자신의 가족을 믿고 맡길 수 없는(would not trust to look after their own family members) 의사 지망생들을 거의 확실하게 식별(identify)해 낼 것이다. 이러한 우려는 전공의의 의학적 전문성(medical expertise)뿐만 아니라 의사소통(communication), 협력(collaboration) 또는 전문 직업적 품행(professional conduct)과 같은 다른 핵심 역량(core competencies)과도 관련이 있을 수 있다.

 

캐나다 왕립 내과 및 외과 대학(Royal College of Physician and Surgeons of Canada, 이하 Royal College)의 설계에 의한 역량(Competence by Design, CBD) 모델[3]을 포함한 CBME교육을 재형성(reshape)하고, 학습을 지원(support learning)하며, 우리의 미래 동료들에게 성장 마인드셋(growth mindset)을 촉진(promote)할 수 있는 엄청난 잠재력(tremendous potential)을 가지고 있다. 이러한 기회(opportunity)가 실현(realized)되기 위해서는,

  • 학습자가 자신의 한계(limits)를 인정(acknowledgment)하고 개선이 필요한 영역(areas for improvement)에 대해 솔직한 토론(candid discussion)을 할 수 있도록 허용하는 안전하고 지지적인 학습 환경(safe, supportive learning environment)을 인식하는 문화적 변화(cultural shift)가 필요하다.
  • 그 위에 더해(Layered on top of that), 전공의들의 지도 감독 없는 진료(unsupervised practice)를 향한 진행(progression)을 결정하기 위해 일선 교수진(front-line faculty)과 역량 위원회(Competence Committee) 구성원들의 책임무(accountability)가 강화되어야 한다.

밀러의 피라미드(Miller’s pyramid)[5] 최상단, 즉 전공의가 임상 진료(clinical practice)에서 실제로 “수행하는 것(what a trainee does)”(모든 CanMEDS[6] 역할(Roles)과 관련된)에 대한 빈번한 평가(frequent assessment)를 강조하는 잘 설계된 평가 프로그램(well-designed program of assessment)[4]은 널리 퍼져 있는 ‘실패시키지 못함(failure to fail)’ 문제를 해결(address)할 수 있는 이론적 잠재력(theoretic potential)을 제공한다.

 

‘실패시키지 못함(failure to fail)’ 현상을 뒷받침하는(underpinning) 요인(factors)은 무수히 많으며(myriad of), CBD가 의미 있는 문화 변화(meaningful culture change) 없이는 이 모든 것을 해결할 가능성은 낮다.

  • 학습자 수준(learner level)에서, 전공의들은 평가의 인지된 부담(perceived stakes)과 그것이 자신의 진급(progression)에 미치는 영향 때문에,
    • 자신이 잘 수행할 수 있는 쉬운 증례(easy cases)를 선택(select)하거나 자신의 역량(competence)을 평가받기 위해 더 관대한 임상 지도전문의(lenient faculty supervisors)를 찾으려(seek) 할 수 있다.
    • 이는 성장 마인드셋의 발달(development)을 저해(hinders)할 뿐만 아니라 최종적인 총괄 평가(eventual summative assessment)의 타당도에 대한 위협(threat)이 된다.
  • 임상 지도전문의 수준(clinical supervisor level)에서는
    • 수행에 대한 기대치(expectations of performance)가 불명확(unclear)할 수 있으며, (훈련받지 않은) 평가자(raters)들은 상당한 변동성(considerable variability)을 보일 수 있다.
    • 관대화 편향(leniency bias) 또한 우려되는 부분인데, 특히 전공의와의 사회적 상호작용(social interaction)이 있는 맥락이나, 평가자가 저조한 수행(poor performance)을 상황(circumstance)이나 증례(case)의 탓으로 돌리며(attribute), 관찰된 저조한 수행이 일회성 발생(one-time occurrence)이었다고 가정하여 우려 사항을 기록하지 않기로(choosing not to document) 선택하는 경우에 더욱 그러하다.
  • 프로그램 수준(program level)에서는
    • 전공의의 “실패(failure)”가 수련 프로그램(training program)에 대한 좋지 않은 반영(reflects poorly)이 될 것이라는 우려,
    • 실패가 확인된 후 기다리고 있을 상당한 교정 교육 업무량(substantial remediation workload), 그리고
    • 실패한 전공의가 임상 진료 제공 일정(clinical service delivery schedules)에 공백(gaps)을 남길 수 있다는 우려가 있을 수 있다.
  • 외부적 요인(External factors) 또한 신뢰할 수 있는 평가 결정(trustworthy assessment decisions)에 영향을 미칠 수 있는데,
    • 예를 들어 예상대로 발전하지 못하고 있는(not progressing as expected) 저성과 전공의(underperforming trainees)로부터의 소송 위협(threat of litigation) 등이 있다.
  • 이러한 요인들은, 견고한 시험 과정(robust examination process)과 결합되어, 일부 프로그램들이 저조한 성과를 보이는 지원자(poorly performing candidates)를 식별(identify)하고 이들이 지도 감독 없는 진료(unsupervised practice)에 진입하는 것에 대한 장벽(barrier)을 만들기 위해 암묵적으로(implicitly) 국가 Royal College 시험에 의존(rely on)하는 환경을 고착화(perpetuated)시켰다.

 

비록 국가 인증 기관(national certifying bodies)이 시행하는 총괄 인증 시험(summative certification examinations)의 유용성(utility)과 역할이 특히 COVID-19 팬데믹 초기 단계[7] 동안 의문이 제기되었으나(questioned), 문헌(literature)은 인증/면허 시험(certifying/licensure examinations)이 중요한 환자 결과(important patient outcomes)뿐만 아니라 미래의 의사 성과(future physician performance)를 예측(predict)하는 데 도움이 된다고 시사한다[8–16]. 이 시험들은 지역 수련 프로그램(local training program)이 고전하고 있는 전공의(trainee struggling)를 식별하지 못하거나 앞서 언급한 ‘실패시키지 못함(failure to fail)’ 문제로 어려움을 겪고 있을 때, 대중을 위한 중요한 안전장치(important safeguards) 역할을 할 수 있다. 캐나다에서는 Royal College 시험에 불합격할 위험(risk of failing)이 있는 전공의들이 수련 과정에서 비교적 일찍 식별 가능한(identifiable) 경우가 많지만[17], 이러한 “신호(signal)”가 기록되어 사용 가능한 평가 데이터(documented, usable assessment data)로 변환(translated)되지는 않는다. 수련 중 평가(in-training evaluations)가 가장 취약한(weakest) 사람들은 Royal College 내과 시험(Internal Medicine examination)에서 불합격할 위험이 4배나 높지만[18], 그러한 개인들은 여전히 프로그램에 의해 시험 자격이 있는(eligible) 것으로 간주된다. Royal College 시험은 지도 감독 없는 진료를 위한 역량(competence for unsupervised practice)을 결정(determining)한다는 목표로 개발되므로, 모든 수련 프로그램이 수련 기간 내내 학습자에 대한 정직한 평가(honest assessments)를 완료하고 역량 및 프로그램 수료(program completion)에 대해 정확한 결정(accurate decisions)을 내려야 한다는 사회적 계약(social contract)[19]상의 의무(obligation)를 다하고 있는 것은 아니라고 주장할 수 있다. 따라서 국가 총괄 시험(National summative examinations)은 인증 과정(certification process)에서 중요한 상호 보완적 역할(important complementary role)을 계속해서 수행한다.

 

Royal College의 각 전문과(Specialty) 및 세부 전문과(Subspecialty)에는 시험 개발을 책임지는(responsible for the development) 시험 위원회(Examination Board)가 있다. 이 위원회는 교육 표준(educational standards)을 개발하는 국가 전문과 위원회(national Specialty Committee)뿐만 아니라, 정책(policy)을 개발하고 시험의 질(quality)과 타당도(validity)에 대한 지침(guidance) 및 감독(oversight)을 제공하는 상위 조직인 Royal College 시험 위원회(Examination Committee)에 보고(reports to)한다. 시험 위원회의 구성원(membership)은 캐나다 전역의 평가 분야 리더(leaders in assessment)들을 대변하며, 여기에는 다양한 외과, 내과 및 실험실 기반 분과(lab-based disciplines)를 대표하는 전현직 시험 위원장(Exam Board Chairs)들과 평가에 초점을 맞춘 박사급 과학자(PhD scientist)가 포함된다. 이 과정은 내부의 시험 품질 및 분석 부서(Exam Quality and Analytics unit)의 지원을 받는데, 여기에는 심리측정 팀(Psychometrics team)과 시험의 시행(delivery)을 구현(implements)하는 Royal College의 운영 팀(Operations team)이 포함된다. 전체적으로, 1,300명 이상의 전문의(specialist physicians)가 그들의 시간을 자원봉사(volunteer)하고 있으며, 67개 전문과/세부 전문과에 걸쳐 50명에 가까운 상근 직원(fulltime staff)이 시험 과정에 기여(contribute)하고 있다.

 

시험 위원회(Examination Committee) 내의 리더들과 시험 및 인증 분야에서 리더십 역할(leadership roles)을 맡은 의사 직원(staff physicians)들이 저술한 이 논문은, Royal College 고부담 인증 시험의 목표(aims), 미래의 역할(future role), 그리고 이것들이 CBD 모델과 어떻게 관련되는지(how they relate)를 설명(describes)한다. 고부담 시험을 위한 준비(preparation) 자체가 전공의의 학습(learning)과 행동(behaviour)에 지대한 영향을 미칠 수 있음을 인정(Acknowledging)하면서, 우리는 Royal College 시험이 CBD의 교육적 설계(educational design)를 지원하기 위해 어떻게 중요한 수정(important modifications)을 거치고 있는지 설명한다.


Royal College 시험의 목적 (Purpose of Royal College examinations)

Royal College 시험은 지원자가 CBD 프로그램에서 수련을 받았든 그 외의 맥락(outside of that context)에서 수련을 받았든 상관없이 모든 지원자(all candidates)에게 공정한 평가(fair assessment)를 제공하는 것을 목표로 한다(aim to).

  • 모든 평가 활동(assessment activities)의 중요한 첫 단계(critical first step)는 평가의 목적(purpose of the assessment)을 결정하는 것이어야 한다.
    • Royal College 시험은 캐나다에서의 지도 감독 없는 임상 진료(unsupervised clinical practice)를 위한 역량을 결정하려는 의도(intention)로 청사진이 그려지고(blueprinted), 개발(developed)되고, 시행(delivered)되며, 각 전문 분야(discipline) 내의 현대적 진료 범위(contemporary scope of practice)에 기반하여 각 전문과에 대한 국가적 벤치마크(national benchmark)를 제공한다.
  • 대부분의 지원자는 캐나다의 졸업 후 수련 프로그램(postgraduate training programs) 출신이다; 하지만, 상당한 소수(substantial minority)는 캐나다 밖에서 의학 수련을 마쳤으며 현재 캐나다에서 진료 중이거나 캐나다에서의 인증(및 면허) 취득(obtain certification and licensure)을 원하는 해외 의과대학 졸업생(international medical graduates)이다.
  • 따라서 Royal College 인증을 통해 면허를 취득하고자 하는(seek licensure) 모든 이들이 해당 전문 분야의 동일한 기대 진료 범위(same expected scope of practice)에 걸쳐 동일한 기준(same standard)에 따라 평가받도록 보장(ensure)하는 것은 시험의 추가적인 기능(additional function)이다.

우리는 시험이나 평가 프로그램(program of assessment)과 같은 평가 활동에서 고려해야 할(consider) 핵심 요소(key elements)를 강조하기 위해 유용한 도구로서 CARVE라는 기억술(mnemonic)을 활용(utilize)한다[20, 21]. 좋은 평가(good assessment)를 위한 오타와 합의 프레임워크(Ottawa Consensus Framework)[22]에 기반하여, 이 기억술은 고부담 시험을 위한 다섯 가지 핵심 고려사항을 개괄(outlines)한다: 비용 효율성(Cost-effectiveness); 수용성(Acceptability); 신뢰도(Reliability); 타당도(Validity); 그리고 교육적 영향(Educational Impact).

 

시험의 일차적 목표(primary aim)는 관대화 편향(leniency bias)이 우려될 수 있는 지원자의 졸업 후 의학 교육(postgraduate medical education) 또는 임상 진료 감독(clinical practice supervision)으로부터 독립적이고(independent from), 거리를 둔(at arm’s length to) 과정을 활용하는 것이다.

  • 이 시험은 인증 과정의 중요한 부분을 형성하는 직장 내 평가 프로그램(program of assessment in the workplace)을 보완(complement)하기 위해 내용 전문성(content expertise)을 갖춘 훈련된 시험관(trained examiners)을 고용하는 표준화된 과정(standardized process)을 활용(leverages)한다.
  • 이러한 추가적인 평가의 원천(additional source of assessment, 즉 시험)은 인증(certification)을 둘러싼 의사결정(decision-making)에 있어 대중의 신뢰(public trust)를 증진(promoting)하는 데 도움이 될 수 있다.

Royal College가 개원 의사(physicians in practice)들에게 지속적인 재인증 시험(ongoing recertification examinations)을 시행(administer)하지 않는다는 점을 고려할 때, 이 초기 인증(initial certification)은 지원자와 사회(society) 모두에게 상당한 부담(substantial stakes)을 지닌다. 비록 Royal College 시험의 주된 목적이 지원자의 역량을 결정하는 것이지만, 평가가 학습을 주도(assessment drives learning)한다는 것은 잘 알려져 있으므로(well recognized), 평가 결정의 교육적 영향(educational impact)(예: 시험의 시기 및 내용)은 여전히 중요하다. 직장 기반 평가(workplace assessment)의 문화가 변화하고 CBD 평가의 타당도에 대한 증거(evidence)가 시간이 지남에 따라 더 명확해짐(becomes clearer)에 따라, Royal College는 인증을 위한 견고한 국가적 표준(robust national standard)을 보장(ensuring)하면서 시험을 계속해서 수정(revise)하고 적응(adapt)시켜 나갈 것이다.

 

통합된 역량 중심 국가 인증 과정에서의 시험을 위한 9가지 핵심 설계 적응 (Nine key design adaptations for examinations in an integrated competency-based national certification process)

Royal College의 시험 위원회(Examination Committee)는 이러한 적응(adaptations)을 개발하기 위해 대학 내의 상임 위원회(standing Committees), 시험 위원회(Examination Boards) 및 임상 교육자(Clinician Educators)들의 조언(advice)이나 정책(policy)을 통합(incorporate)하고자 긴밀히 협력해왔다(worked closely). 많은 이해관계자(stakeholders)가 있는 거대한 시스템에서의 여느 복잡한 변화(complex change)와 마찬가지로, 합의(consensus)가 항상 가능한 것은 아니었지만, 위원회는 문제점들을 성찰(reflect on issues)하고 전문과별 시험 위원회(Specialty specific Examination Boards)가 변화를 실행(implement)할 수 있도록 허용하는 통합된 접근법(integrated approach)을 개발했다. 변화의 영향(impact of the changes)은 위원회 업무의 진행 중인 지속적인 질 향상(Continuous Quality Improvement)의 일환으로 검토된다.

 

COVID-19 팬데믹은 지필 시험(paper-and-pencil examinations)과 대면 구술(face-to-face oral) 및 OSCE 시험에서 두 가지 모두를 위한 온라인 플랫폼(online platforms)의 사용으로 이동함에 따라, 시험 과정(examination process)에 상당한 변화(considerable change)를 요구했다. 아래에 개괄된 적응들(adaptations outlined below)은 시행 방법(methods of delivery)과 구체적인 시험 구조(specific examination structure)의 변화에도 불구하고 Royal College가 시험 과정에서 엄격성(rigour)과 타당도(validity)를 유지(maintain)할 수 있도록 해주었다.

더 이른 시험 시기 (Earlier timing for Examinations)

전공의(Trainees)들은, 심지어 CBD 프로그램에 있는 이들조차도, 그들의 인증 시험(certifying examinations)을 위해 계속해서 열심히 공부할 가능성이 높다(likely to continue to study hard). 시험을 수련 과정의 더 이른 시기(earlier in training)로 옮길 수 있는 기회는 전공의들이 시험에서 자신의 역량을 입증(demonstrate their competence)한 다음, 수련의 마지막 몇 달(final few months of training) 동안은 임상 교육(clinical education)에 학습을 집중(focus their learning)할 수 있게 해준다.

  • 시험 준비(examination preparation)를 통한 해당 학문 분야(discipline)에 대한 강력한 이론적 이해(strong theoretical understanding)와 결합된 이러한 기회는, 학습자들이 흔히 강조되지 않는 수련의 측면(commonly underemphasized aspect of training)이자
  • 여러 전문 분야에 걸쳐 졸업하는 전공의들에게서 자주 확인되는 진료 준비도 부족(perceived lack of readiness for practice)을 바로잡을(rectify) 수 있는 핵심 기회인 ‘진료 이행기(Transition to Practice, TTP)’ 단계(CBD 프로그램의 마지막 단계)에서 그들의 학습을 증폭(amplify)시킬 수 있게 해준다.
  • 시험에 성공하지 못한(not successful) 전공의에게 있어, 더 이른 시험 시기는 그들이 여전히 수련 프로그램에 등록(registered)되어 있는 동안 교정(remediation)과 시험 준비 지원(examination preparation support)을 받을 기회를 제공한다.

현재까지, Royal College의 필기시험(written examinations)은 수련의 끝에서 CBD 프로그램의 4단계 중 3번째 단계인 ‘전문 분야의 핵심(Core of Discipline)’ 단계로 옮겨졌다[3, 23].

  • 지금까지, TTP 단계로 이어지는 학습자의 지식(learner knowledge) 측면에서 일화적인 피드백(anecdotal feedback)은 긍정적이었으며, 지원자들은 나중에 시험을 치렀던 역사적 대조군(historical cohorts)과 유사한 비율(similar rates)로 시험에 합격할 수 있었다.
  • 전문의(specialist physicians)들로부터의 콘텐츠 개발(content development)과 운영 지원(operational support) 측면 모두에서, 더 이른 시기의 고품질 시험(earlier high-quality examination)을 하나 더 만들어내는 업무량(workload)은 상당하다(substantial).

평가 간의 정렬 (Alignment across assessments)

모든 Royal College 시험은 캐나다의 임상 진료(clinical practice)를 반영(reflect)하고 있는지 보장하기 위해 청사진(blueprints)에 대한 검토(review) 및/또는 수정(revisions)을 거친다.

  • 시험 위원회는 무엇이 시험에서 가장 잘 평가되는지(best assessed on examinations), 그리고 반대로 무엇이 직장 기반 평가(workplace-based assessment)를 통해 가장 잘 결정되는지(best determined)를 고려하며, 이를 통해 인증 과정(certification process)에서 두 가지 형태의 평가에 대한 상호 보완적인 접근법(complementary approach)을 지원한다.
  • 이 접근법은 주제(topics)들이 한 가지 형태의 평가에서만 배타적으로 다루어져야 한다(covered exclusively)는 것을 요구하지 않으며,
  • 시험이 캐나다 프로그램 출신의 전공의와 CBD 수련 프로그램 출신이 아닌 해외 의과대학 졸업생(international medical graduates) 모두를 위한 인증의 외부 확인 지점(external checkpoint for certification)으로 기능(function)하기 위해서는 중복(overlap)이 있을 수 있고, 또 있어야 한다.

원칙(principle)은 평가되는 역량(competencies)에 대한 최적의 접근법(optimal approach)을 고려하는 것이다.

  • 예를 들어, 전문 직업적 품행(professional conduct)은 임상 환경(clinical environment)에서 가장 잘 평가되는 반면, 해당 영역의 유능한 전문의(competent specialist)를 정의하는 유형인 덜 흔하지만 중요한 임상 상태(less common but important clinical condition)에 대한 지원자의 처치(management)는 시험에서 더 잘 평가될 수 있다.
  • 수련 프로그램 내에서 발생하지만 국가적으로 개발되는(nationally developed) 시뮬레이션 기반 평가(Simulation based assessment) 또한 해당 전문과와 관련이 있을 때(when relevant) 인증 과정에 통합되었다[24]. 인증 과정이 필기(written) 및 응용 시험(applied examination - 구술, 객관구조화진료시험[OSCE], 또는 실기)을 모두 포함하는 경우, 시험 위원회는 또한 각 시험에서 무엇이 가장 잘 평가되는지를 결정한다.

시험의 순서 배열 (Sequencing of examinations)

  • Royal College 시험은 지원자가 응용 시험(applied examination)에 응시(present)하기 전에 필기시험에 반드시 합격(must pass)해야 하는 ‘필기 후 실기(written-before-applied)’ 형식으로 전환(transitioning)되고 있으며, 이에 맞춰 청사진이 그려지고 설계되고 있다.
  • 이러한 전환은 Royal College의 선다형 시험(multiple-choice examinations)에 대해 이미 이루어졌으며, 단답형 질문(short-answer questions)이 있는 시험을 가진 전문과들이 CBD로 전환됨에 따라 해당 시험들에 대해서도 시행되고 있다.

투명성 (Transparency)

  • 지원자들이 시험 과정(examination process), 청사진(blueprint), 그리고 시험과 관련된 예시 문항(sample questions)을 이해할 수 있도록 투명성이 개선되고 있다. 이는 모든 Royal College 시험 위원회 위원장(board chairs)과 집행부(executives)의 광범위한 작업(extensive work)뿐만 아니라 Royal College 웹사이트에 대한 상당한 업데이트(substantial updates)를 필요로 했다. 투명성을 높이기 위한 이러한 노력은 구성 개념과 무관한 분산(construct-irrelevant variance)을 줄여서 점수의 변동(variation in scores)이 역량의 진정한 차이(true differences in competence)와 더 관련되도록 돕는다.

시험관 및 시험 리더십의 개발 (Development of examiners and exam leadership)

  • 시험관(examiners)과 시험 위원회 리더십(examination board leadership)이 그들 역할의 의무(duties of their role)를 이행하고 캐나다 맥락에서의 역량(competence in the Canadian context)을 시험의 목표(target)로 고려할 수 있도록 돕기 위해 강화된 훈련(Enhanced training)이 제공되고 있다. 시험관들은 유능한 전문의(competent specialist)나 세부전문의(subspecialist)라면 시험에서 성공할 수 있도록(able to succeed) 문항을 개발하는 것을 목표로 한다(aim to).
  • 일부 문항은 다른 문항보다 더 어려울 수 있지만, 전체 시험(overall examination)은 역량을 목표로 고려하도록 구축된다.
  • Royal College는 인증 과정에서 전문과의 표준(standards)이 유지되도록 보장하기 위해 시간을 자원봉사(volunteer)하는 67개 전문과 및 세부 전문과에 걸친 1,300명 이상의 시험 위원회 구성원을 보유하고 있는 행운을 누리고 있다.
  • 이 시험관들은 운영 시험 개발 및 시행 팀(operational examination development and delivery team)뿐만 아니라, 위원장, 부위원장, 집행부 및 위원들이 시험을 개발하고 검토할 때 교육과 지속적인 지원을 제공하는 심리측정 및 데이터 분석 팀(psychometrics and data analytics team)에 의해 지원받는다.

시험의 질 검토 (Quality review of the examination)

  • 문항 개발 과정(question development process)에 참여하지 않는 시험 질 검토자(examination quality reviewer)가 전문과 또는 세부 전문과에 대한 명확성(clarity)과 관련성(relevance)을 위해 문항들을 검토한다. 이 과정은 시험의 타당도(validity)를 더해주며 시험이 가장 관련성 있는 자료(most relevant material)에 집중하도록 돕는다. 또한 학습자들을 관련성 있는 임상 진료(relevant clinical practice)에 집중시킴으로써 교육적 영향(educational impact)을 지원할 수도 있다.

포괄적 평정 척도 (Global rating scales)

  • 응용 시험(구술, OSCE, 또는 실기 시험)을 활용하는 전문과 및 세부 전문과의 경우, 채점 도구(scoring tool)가 체크리스트(checklists)에서 벗어나 기계적 암기(rote memory)를 테스트하기보다는 임상적 의사결정(clinical decision-making)과 같은 의사의 과업(physician tasks)과 더 잘 정렬되는 고차원적 사고(higher order thinking)에 초점을 맞춘 포괄적 평정 척도(global rating scale)로 이동했다. 이 접근법은 인증 시험 수준에서의 역량 결정(determination of competence)과 더 잘 정렬되며, 더 낮은 연차의 학습자(more junior learners) 수준에서 더 적절할 수 있는 완전성(completeness)보다는 지원자들의 사려 깊은 답변(thoughtful answers)에 보상(rewards)을 준다.

심리측정적 접근법의 최신화 (Updating the psychometric approach)

  • 더 역량 중심적인 접근법(competency-based approaches)과 정렬하기 위해 업데이트된 심리측정 과정(psychometric processes)이 시행되고 있다. 예를 들어, Royal College는 시험을 치르는 지원자 집단(cohort of candidates)에 의존적인(그리고 점수의 분산(spread of scores)을 달성하는 데 더 의존적이어서 규준 지향적 접근(norm-referenced approach)과 더 잘 정렬되는) 크론바흐 알파(Cronbach’s alpha) 대신, 일차적인 신뢰도 척도(primary reliability measure)로서 세타(theta, 시험의 결정 일관성(decision consistency)과 더 관련이 있고 시험에 대한 준거 지향적 접근(criterion-referenced approach)과 더 잘 정렬되는)로 이동했다.
  • 추가적으로, 의도한 대로 작동하지 않을 수 있는(may not be working as intended) 문항을 식별하고 고려하여 시험에서 제거(removed)할 필요가 있는지 판단하기 위한 강화된 시험 후 문항 검토(post-examination question review) 및 심리측정 과정뿐만 아니라, 각 시험 위원회의 패널들과 함께 기준 설정(standard setting)을 수행하기 위한 강화된 과정이 있다.

1. 세타(theta)란 무엇인가요?

"학생의 '진짜 실력'을 나타내는 절대적 수치"
통계학(특히 문항 반응 이론)에서 **세타(theta)**는 피험자의 **잠재적 능력(Latent Trait/Ability)**을 뜻합니다.
  • 쉽게 말해, 시험 점수(100점 만점에 80점)가 아니라, **이 학생의 '진짜 역량 수준'**을 수치화한 것입니다.
  • 보통 평균적인 능력을 0으로 두고, 능력이 높으면 +값, 낮으면 -값을 가집니다.

2. 왜 '크론바흐 알파'를 버리고 '세타'로 갈까요?

논문에서 언급한 **"집단에 의존적이다(dependent on the cohort)"**라는 말이 핵심입니다.

⛔ 기존 방식: 크론바흐 알파 (Cronbach's Alpha)

크론바흐 알파는 **"문항들이 서로 얼마나 비슷하게 묻고 있나(내적 일관성)"**를 봅니다. 이 수치가 높게 나오려면 학생들의 **점수 분포(분산, Spread)**가 넓어야 합니다. 즉, 공부 잘하는 애(1등)와 못하는 애(꼴찌)가 확연히 갈려야 신뢰도가 높게 나옵니다.
  • 문제점 (규준 지향, Norm-referenced):
    • 의사 국가고시나 전문의 시험을 보는 사람들은 대부분 공부를 아주 잘하는 상위권 집단입니다. (점수 차이가 크지 않음)
    • 모두가 다 잘해서 점수가 90점~95점에 몰려 있으면, 실제로는 시험이 공정했어도 분산이 작아서 크론바흐 알파 값은 뚝 떨어집니다.
    • 마치 "1등부터 100등까지 줄 세우기"에는 좋지만, "모두가 합격할 실력이 되는가?"를 판단하기엔 부적절합니다.

✅ 새로운 방식: 세타(theta) 신뢰도 (Item Response Theory)

반면, 세타를 기반으로 한 신뢰도(Conditional Standard Error of Measurement)는 누가 시험을 보느냐에 상관없이, 시험 문제 자체가 특정 능력대를 얼마나 정밀하게 측정하는지를 봅니다.
  • 장점 (준거 지향, Criterion-referenced):
    • 우리의 목표는 1등을 뽑는 게 아니라, **"이 사람이 전문의로서 환자를 볼 역량이 되는가?(합격선/Cut-off)"**를 판별하는 것입니다.
    • 세타 신뢰도는 전체 구간의 평균적인 정확도보다는, 합격선(예: theta = -0.5 지점) 근처에서 얼마나 오차 없이 정밀하게 측정하는지를 중시합니다(결정 일관성).
    • 따라서 응시자 집단의 수준이 모두 높아서 점수 분포가 좁더라도, 합격선 근처에서의 측정 정밀도만 높다면 "이 시험은 신뢰할 수 있다"고 봅니다.

3. 시각적 이해: 정보 함수 (Information Function)

이 개념을 가장 잘 보여주는 것이 문항 반응 이론의 검사 정보 함수(Test Information Function) 그래프입니다.
위와 같은 그래프를 상상해 보십시오:
  • X축 (Theta) : 왼쪽은 능력이 낮은 사람, 오른쪽은 능력이 높은 사람입니다.
  • Y축 (Information/Reliability): 측정의 정확도(신뢰도)입니다. 높을수록 정확합니다.
CBME(역량 중심 교육)에서의 변화:
  • 과거 (크론바흐 알파): 전 구간에서 고르게 점수가 퍼져야 좋다고 믿음.
  • 현재 (세타 기반): 그래프의 산봉우리(가장 정확한 지점)가 합격선(Cut-score) 위에 오도록 시험을 설계함. 아주 잘하는 사람과 아주 못하는 사람은 대충 측정해도 되지만, **합격/불합격의 경계선에 있는 사람은 아주 정밀하게 측정(High Information)**해야 한다는 철학입니다.

요약: 교수님을 위한 한 줄 정리

  • 크론바흐 알파: "학생들 간에 **등수 놀이(상대평가)**를 하기에 이 시험이 적절한가?" (집단의 점수 차이가 커야 함)
  • 세타(theta) 신뢰도: "이 학생이 **합격 기준(절대평가)**을 넘었는지 판별하기에 이 시험이 정밀한가?" (집단의 수준과 상관없이, 합격선 근처의 정밀도가 중요함)
이 논문은 **"우리는 이제 전공의들을 줄 세우는 것(Ranking)보다, 역량을 갖췄는지 확인(Pass/Fail)하는 것이 중요하므로 통계 기법도 그에 맞춰 바꾸었다"**라고 선언하는 것입니다.

 

질 향상 (Quality improvement)

  • 한 번의 시험 반복(iteration)에서 다음으로의 지속적인 질 향상(Continuous quality improvement)은 고부담 평가(high-stakes assessment)에 관여하는 모든 조직에게 중요하다. Royal College의 지속적인 질 향상 과정은 지원자들의 시험 후 설문조사(post-examination surveys) 검토, 시험 질 검토자(examination quality reviewers)의 평가, 심리측정 데이터(psychometric data), 그리고 상위 조직인 Royal College 시험 위원회에 의한 전문과별 시험 검토에 의해 지원받는다.

요약 (Summary)

시험(Examinations)은 직장 기반 평가를 보완(complements)하는 독립적인 제3자 평가(independent, third-party assessment)로서 Royal College 인증 과정에서 필수적인 역할(integral role)을 계속 수행한다. 시험은 CBD 내의 평가 프로그램에 신뢰할 수 있는 앵커(credible anchor)를 제공하며 CBD 및 비-CBD 수련 프로그램 출신의 지원자 모두가 공통의 표준(common standard)에 따라 평가받을 수 있게 해준다. 오직 신중한 개발(careful development)과 시행(delivery)을 통해서만 Royal College는 시험 과정의 타당도(validity)를 유지할 수 있다. Royal College가 더 빈번한 직장 기반 평가를 포함하여 더 견고한 평가 프로그램(robust programs of assessment)을 개발하고 있지만, 대중의 신뢰(public trust)를 유지하고 Royal College의 전체 평가 과정(entire process of assessment)에서 타당도를 보장하기 위해서는 인증 시험의 변화를 신중하게 고려(considered carefully)해야 한다. 캐나다에서 착수된(undertaken) 시험 개혁에 대한 단계적 접근법(stepwise approach to examination reform)은 CBD로의 이동에 대한 프로그램 평가(program evaluation)에 정보를 줄 수 있는(inform), 시험으로부터 축적된 집계 데이터(aggregate data)를 제공한다. 시험에서의 전공의 성과(trainee performance) 변화, 특히 시험 점수(examination scores)나 합격률(pass rates)의 향상이 있거나, 심지어 시험이 몇 달에서 1년 더 일찍 치러졌음에도(taking place months to a year earlier) 합격률이 역사적 대조군(historical controls)과 유사하다면, 이는 CBD의 긍정적인 교육적 효과(positive educational effect)에 대한 신호(signal)로서 기능할 수 있다.

 

 

Perspect Med Educ. 2024 Feb 6;13(1):33-43. doi: 10.5334/pme.959. eCollection 2024.

Coaching in Competence by Design: A New Model of Coaching in the Moment and Coaching Over Time to Support Large Scale Implementation

 

 

안녕하세요! 👋 오늘은 최근 전 세계 의학교육의 화두인 역량 바탕 의학 교육(Competency Based Medical Education, CBME), 그중에서도 캐나다 왕립 내과·외과 대학(Royal College)에서 제시한 혁신적인 코칭 모델(Coaching Model)에 대한 따끈따끈한 논문을 소개해 드리려고 해요.

학생이나 전공의를 가르치다 보면 "어떻게 하면 이 친구가 더 성장할 수 있을까?" 고민하게 되잖아요. 이 논문은 그 해답을 '코칭(Coaching)'에서 찾고 있답니다. 🧐


1. 왜 하필 '코칭'인가요? 🤔

우리는 흔히 '가르친다(Teaching)' 혹은 '조언한다(Mentoring)'라는 말에 익숙하죠. 하지만 이 논문에서는 코칭을 아주 명확하게 구분하고 있어요. 바로 "지시하기보다 질문하기"입니다.

연구진은 코칭의 핵심을 이렇게 설명해요.

"점차 널리 퍼지고 있는 구분점은 지시하기보다 질문하기를 향한 코치의 지향성입니다; 코치는 학습자의 자기 성찰을 촉진하기 위해 강력한 질문을 던져 학습자를 자기 발견으로 이끄는 반면, 멘토, 조언자, 또는 교사는 자신의 과거 경험이나 전문성을 바탕으로 정보나 조언을 전달합니다."

"While it can be argued that mentoring, teaching, and coaching all focus on an individual’s development, an increasingly prevalent distinction is the coach’s orientation toward asking over telling; a coach asks powerful questions to catalyze learner self-reflection, leading the learner in self-discovery, whereas a mentor, advisor, or teacher imparts information or advice based on their own past experience or expertise."

즉, 답을 주는 게 아니라 스스로 답을 찾게 도와주는 것이 코칭의 본질이라는 거죠! ✨


2. 두 가지 코칭 스타일: CiM과 CoT ✌️

이 모델의 가장 큰 특징은 코칭을 두 가지 역할로 나눴다는 점이에요.

  • 현장 코칭 (Coaching in the Moment, CiM): 임상 현장에서 짧고 굵게! ⏱️ 수련생이 환자를 볼 때 그 즉시 이루어지는 코칭이에요. "방금 그 처치는 어땠나요?"라고 묻는 것처럼요.
  • 지속적인 코칭 (Coaching over Time, CoT): 한 명의 코치와 오랫동안 관계를 맺으며 성장 과정을 쭉 지켜보는 거예요. 📈 학습 포트폴리오를 함께 보면서 장기적인 목표를 세우는 거죠.

3. 코칭의 마법 주문: RX-OCR 🪄

"코칭 좋은 건 알겠는데, 당장 어떻게 해요?"라고 묻는 분들을 위해 연구진은 RX-OCR이라는 아주 구체적인 프로세스를 제안했어요.

  1. R (Relationship/Rapport): 먼저 라포(Rapport)를 형성해서 안전한 학습 환경(Safe Learning Environment)을 만드세요.
  2. X (Expectations): 오늘 무엇을 배울지 기대치를 설정하세요.
  3. O (Observe): 직접 혹은 간접적으로 수련생을 관찰하세요.
  4. C (Coach): 관찰한 내용을 바탕으로 코칭 대화를 나누세요.
  5. R (Record/Reflect): 내용을 기록하고, 함께 성찰하세요.

특히 연구진은 첫 단추인 '안전한 환경'을 엄청나게 강조했답니다.

"이 안전을 확립하는 것의 중요성은 아무리 강조해도 지나치지 않습니다: 이것은 코칭의 근본 원칙입니다."

"The importance of establishing this safety cannot be overstated: it is a fundamental principle of coaching."


4. 현실적인 어려움과 해결책 💡

물론 바쁜 병원에서 코칭할 시간을 낸다는 게 쉽지는 않아요. 💦 연구진도 이를 잘 알고 있어요. "평가받는다"는 느낌 때문에 수련생들이 위축될 수도 있고요.

그래서 연구진은 이렇게 조언합니다.

"관찰은 현장 기반 평가(WBA)라기보다는 현장 기반 학습으로 프레임화되어야 하며, 임상 환경에서 수련생의 성장 마인드셋 채택을 지원하는 행동과 관행을 강조해야 합니다."

"Observations should be framed as workplace-based learning rather than workplace-based assessment (WBA), highlighting behaviours and practices that support trainees’ adoption of a growth mindset in clinical settings."

결국, "너를 평가하겠어!"가 아니라 "너의 성장을 도와줄게!"라는 메시지를 주는 게 핵심이겠죠? 🌱


📝 마무리하며

이 논문은 단순히 새로운 교육 이론을 소개하는 것을 넘어, 우리가 학습자를 대하는 태도 자체를 '성장(Growth)'과 '성찰(Reflection)' 중심으로 바꾸자고 제안하고 있어요.

더 좋은 의사를 길러내기 위해, 오늘부터 우리도 "정답을 말해주기보다 질문을 던지는" 코치가 되어보는 건 어떨까요? 🙌

 


캐나다 왕립 내과·외과 대학 코칭 모델 (The Royal College of Physicians and Surgeons of Canada coaching model)

서론 (Introduction)

 

역량 바탕 의학 교육(competency based medical education, CBME)이 학습자 중심의 발달적 교육(learner-centered, developmental education)이라는 약속을 이행하기 위해서는 의학 교육의 연속선상(continuum of medical education) 전반에 걸쳐 새로운 교수 학습 관행(new teaching and learning practices)이 요구됩니다. 역량 중심의 지도(Competency-focused instruction)는 역량의 발달적 습득(developmental acquisition of competencies) [1]을 촉진하는 CBME의 핵심 구성 요소(core component)이며, 코칭(coaching)은 이를 달성하기 위한 두드러진 수단(salient avenue)입니다. 발달 궤적(trajectory of development)은 학습자마다 다를 것입니다(vary among learners). 따라서 역량 중심 지도의 완전한 혜택(full benefit)을 가능하게 하려면, 지도와 안내(instruction and guidance)는 각 개인의 현존하는 능력 수준(existing level of ability)과 학습 목표(learning goals)에 맞춰 개별화(tailored)되어야 합니다. 코칭은 점진적인 향상(progressive improvement)에 초점을 맞추고 성장과 발달(growth and development) [2, 3]을 촉진하기 위해 개별화된 안내(individualized guidance)를 활용하며, 이는 역량 중심 지도와 일치(aligning with)하는 동시에 개별화된 지도의 필요성(need for individualized guidance)도 충족시킵니다. 점차적으로, 코칭은 개별 의학 학습자(individual medical learners)가 점진적인 역량(progressive competence)과 전문성 개발(professional development) [4, 5]을 추구하는 것을 돕는 접근법(approach to assist)으로 부상하고 있습니다(emerging). 따라서, 코칭은 CBME의 잠재력을 완전히 실현하는 데 있어 결정적(critical in realizing the full potential)입니다 [1].

 

코칭은 의학 교육의 연속선상에서 학습자에게 지도를 제공(provide guidance)하기 위해 활용될 수 있는 여러 접근법 중 하나입니다. 의학 교육에서 코칭에 대한 관심이 증가함(growing interest)에 따라, 그 목적을 명확히 하고(clarifying its purpose) 멘토링(mentoring) 및 티칭(teaching)과 구별하는 것(differentiating it from)이 중요합니다 [6, 7]. 멘토링, 티칭, 코칭 모두 개인의 발달(individual’s development)에 초점을 맞춘다고 주장할 수 있지만, 점차 널리 퍼지고 있는 구분점(increasingly prevalent distinction)은 지시하기보다 질문하기(asking over telling)를 향한 코치의 지향성(coach’s orientation)입니다;

  • 코치는 학습자의 자기 성찰(learner self-reflection)을 촉진(catalyze)하기 위해 강력한 질문(powerful questions)을 던져 학습자를 자기 발견(self-discovery)으로 이끄는 반면, 멘토, 조언자(advisor), 또는 교사는 자신의 과거 경험이나 전문성(own past experience or expertise)을 바탕으로 정보나 조언을 전달(imparts information or advice)합니다.
  • 또한, 코치는 문제 지향적(problem-oriented)이라기보다는 (미래의 진료를 위한) 향상 지향적(improvement-oriented)입니다 [8, 9]. 역량 프레임워크(Competency frameworks)는 훈련의 목표(goals of training)에 대해 필요한 명확성(necessary clarity)을 제공하는 한편, 코치는 학습자가 그 목표를 달성하기 위한 자신의 개별적인 궤적(individual trajectory)을 이해하도록 지원하고 촉진(supports and facilitates)합니다.
  • 코칭은 미래의 수행(future performance)에 초점을 맞춥니다: 코치는 학습자가 더 큰 프레임워크(larger framework) 안에서 개인화된 목표(personalized goals)를 식별하고 학습을 위한 개별화된 경로(individualized pathways)를 만들 수 있도록 하는 성찰의 과정(process of reflection)을 통해 학습자를 안내합니다 [4, 6].
  • 그렇게 함으로써, 코치는 학습자의 자율성(autonomy)을 증진하여 계속해서 성장하고 발달하려는 내재적 동기(intrinsic motivation)에 기여하는 동시에, 자기 조절 학습 기술(self-regulated learning skills) [10]을 촉진합니다.
  • 코칭의 목적에 대한 이러한 공유된 이해(shared understanding)에 도달하는 것은 일관된 실행(consistent implementation), 유용한 교수 개발 지원(useful faculty development supports), 그리고 코칭의 영향에 대한 프로그램 평가(program evaluation of its impact)를 촉진할 것입니다.

 

피드백(Feedback) 또한 학습자의 수행 능력을 향상시키는(improving learner performance) [11, 12] 중요한 수단입니다. 그러나 수십 년간의 노력(decades of effort)에도 불구하고, 피드백은 학습자와 교사 양쪽의 관점 모두에서 여전히 난관으로 가득 차 있으며(fraught with challenges), 따라서 그 잠재력에 미치지 못했습니다(fallen short of its potential) [13, 14, 15, 16, 17, 18, 19, 20, 21, 22]. 1983년, Ende가 의학 교육에 피드백을 도입했을 때, 그는 피드백을 "학생이나 전공의(house officers)의 특정 활동에서의 수행을 기술하는 정보로서, 동일하거나 관련된 활동에서 미래의 수행을 안내하기 위해 의도된 것(intended to guide their future performance)"이라고 언급했습니다 [11]. 피드백은 방금 일어난 일(what has just happened)에 대한 정보를 제공하지만, 너무나 자주(all too often) 사후에(well after the fact), 비동기적으로(asynchronously), 서면 형태로(in written form), 그리고 그 말들에 실질적인 의미(practical meaning)를 부여하는 중요한 학습 대화(learning conversation) 없이 학습자에게 전달됩니다. 그렇기는 하지만(That said), 많은 경우 피드백은 코칭의 일부로서, 혹은 코칭 이전에 발생하기도 하지만, 코칭은 학습자와 코치가 관련 진료 분야(relevant practice area)에서 미래의 향상(future improvement)을 위한 현실적이고 실행 가능한 계획(realistic actionable plan)을 공동 생성(co-create)하는 것을 보장합니다. 흥미롭게도, 지난 10년 동안 피드백과 관련하여 확인된 몇 가지 도전 과제(challenges identified)를 해결하려는 시도 속에서, 피드백과 관련된 학술적 담론(scholarly discourse)은 개념적으로 변화(shifted, conceptually)했습니다. 이는 실행 가능한 개선 단계(actionable steps for improvement)를 도출하는 성찰적 대화(reflective conversation)에 학습자를 참여시켜야 할 필수적인 필요성(vital need)과, 피드백의 유용성(utility of feedback)에 영향을 미치는 중요한 관계적 및 사회문화적 요인(relational and sociocultural factors)에 주의를 기울여야 함을 환기시켰습니다 [23, 24, 25, 26]. 이러한 피드백의 새로운 실용론(new pragmatics of feedback)에 대한 진화하는 개념화(evolving conceptualization)는 코칭 관계(coaching relationship)의 기본적인 필수 요소들을 포함하고 있습니다.

 

코칭이 의학 교육에서는 여전히 부상하는 접근법(emerging approach)으로 여겨질 수 있지만, 다른 영역에서는 결코 새로운 개념(by no means a new concept)이 아닙니다. "코치(coach)"라는 단어는 16세기 중반으로 거슬러 올라갑니다(dates back to). 최종 목표(end goal)를 향해 학습을 안내하거나 촉진하는 사람을 지칭하는 오늘날의 의미(present-day meaning)는 1830년 옥스퍼드 대학의 학문적 맥락(academic context)에서 유래했습니다 [2]. 발달을 촉진하는 수단(means of promoting development)으로서, 코칭은 지난 50년 동안 스포츠, 예술, 비즈니스와 같은 다수의 고성과 전문 분야(multiple high-performing professional domains)로 확장되었습니다 [27, 28, 29, 30, 31]. 코칭의 만연함(prevalence)에도 불구하고, 통일된 접근법(unified approach)은 존재하지 않습니다. 광범위한 지식 기반(wide range of knowledge bases)에서 도출되어 매우 가변적인 맥락(variable contexts)에 적용되는 다양한 코칭 접근법과 관련된 다양성 [32]은, 그것이 사용될 맥락의 고유성(uniqueness of a context)에 부합하는(matched to) 코칭 모델을 갖춰야 한다는 결정적인 책무(crucial imperative)를 강조합니다.

 

의학 학습의 독특한 맥락(distinctive contexts)과 코칭에 수반되는 사회문화적 상호작용의 복잡성(complexity of the sociocultural interaction)은, 코칭의 목적과 필요한 코칭 역할 및 관련 과정(associated processes)에 대한 공유된 이해(shared understanding)를 제공하는 CBME를 위한 새로운 코칭 모델(new coaching model for CBME)을 필요로 합니다(necessitate). 이 논문에서, 우리는 대규모 CBME 구현(large scale CBME implementation)을 지원하기 위해 개발된, 목적에 부합하는(fit for purpose) 이 새로운 코칭 모델을 설명하고, 이 과정을 통해 얻은 교훈(lessons learned)을 성찰합니다. 이 모델은 현재 문헌의 격차(gaps in the current literature)를 다룹니다.

  • 여기에는 관찰된 임상 활동(observed clinical activity)과 시간적으로 밀접하게 병치된(juxtaposed closely in time) 임상 환경에서의 현장 코칭(coaching in the moment)의 적용이 포함됩니다;
  • 이는 임상 환경에서의 관찰(observation) 필요성을 강조할 뿐만 아니라, 양방향 코칭 학습 대화(bidirectional coaching learning conversation)의 필요성도 강조합니다;
  • 또한 학습자가 진정으로 성찰(truly reflect)하고 코치와 함께 향상된 미래 진료 습관(improved future practice habits)을 목표로 하는 개별화된 학습 목표(individualized learning goals)공동 생성(co-create)하도록 장려합니다.

CBD 모델에 코칭 대화와 과정(coaching conversations and processes)을 포함시키는 것은 이 CBME 모델이 단순히 평가 관행 및 규정의 변화(shift in assessment practices and regulations) 이상의 것이 되도록 합니다. 이는 학습 문화(learning culture)를 포용하기 위한 진정한 변화(genuine change)를 장려하며, 의학 교육 환경 내의 풍부한 학습 기회(wealth of learning opportunities)를 강조합니다.

  • 현장 코칭(Coaching in the moment)은 향상된 임상적 통찰력과 진료(improved clinical acumen and practice)를 촉진하며, 이에 더해
  • 지속적인 코칭(coaching over time)은 학습자의 발달적 궤적(developmental arcs)과 의사 및 평생 학습자(lifelong learners)로서의 전문직 정체성 형성(professional identity formation)을 지원합니다.

이 CBD 코칭 모델은 전공의 학습(resident learning)을 확실하게(squarely) 주된 초점(primary focus)으로 두고 있으며, 두 가지의 구별되면서도 상호보완적인(distinct yet complementary) 코칭 역할인 '현장 코칭(Coaching in the moment, CiM)''지속적인 코칭(Coaching over Time, CoT)', 그리고 관련 프로세스 도구인 RX-OCR을 포함합니다. 이 모델은 코칭 구현의 충실도(fidelity of implementation)를 보장하기 위한(즉, 훈련 프로그램이 구현 후 모델의 핵심 구성 요소를 고용하도록 보장하기 위한) 공유된 멘탈 모델(shared mental model)을 제공할 뿐만 아니라, 코치, 학습자, 그리고 전체 코칭 프로그램에 대해 그토록 필요로 했던 코칭 과정의 반복적인 평가(iterative evaluation)를 가능하게 합니다.

캐나다 왕립 내과·외과 대학 코칭 모델 (The Royal College of Physicians and Surgeons of Canada coaching model)

캐나다 왕립 내과·외과 대학(Royal College)은 전 세계적인 CBME의 움직임 [34]에 발맞추어(in keeping with), 캐나다의 전공의 전문직 교육(postgraduate specialist education)을 개혁하기 위해 '설계에 의한 역량(Competence by Design, CBD)' [33]이라고 불리는 주요 변화 이니셔티브(major change initiative)를 도입했습니다. 코칭은 이 이니셔티브의 필수적인 교육적 구성 요소(essential educational component)로 식별되었으며 [1, 35], CBD 코칭 모델(CBD Coaching Model)이 개발되었습니다. CBD 코칭 모델(그림 1 참조)은 코칭 및 의학 교육 영역의 전문성을 갖춘 다학제 팀(multidisciplinary team)에 의해 반복적으로 개발된(iteratively developed), 이론에 기반하고(theory based), 근거에 입각하며(evidence informed), 원칙이 주도하는(principle driven) 모델입니다 [33, 36]. 이 코칭 모델은 각 수련생(trainee)의 개별적인 학습과 역량의 점진적 발달(progressive development of competence)을 지원하고 촉진하려는 명시적인 목적(explicit purpose)을 위해 PGME(졸업 후 의학 교육) 맥락에 최적화(fit for purpose)되어 특별히 만들어졌습니다.

  • 이 모델은 역량에 대한 학습자 중심의 발달적 접근(learner-centered, developmental approach)의 중요성을 강조합니다. 왜냐하면 코칭은 발달 궤적(trajectory of development)을 따라 각 고유한 학습자의 역량 단계(stage of competence)에 맞춘 개별화된 지도 및 안내(individualized instruction and guidance)를 통해 점진적인 발달을 촉진하기 때문입니다.
  • 모델에 필수적인(Integral to the model) 관련 프로세스 도구인 RX-OCR은 코칭 관계 및 과정(coaching relationship and process)의 중요한 요소들의 중요성을 강조하기 위해 만들어졌습니다.
  • CBD 모델은 중요하게도 '현장 코치(Coach in the Moment, CiM)'의 역할을 포함하는데, 이는 임상 환경(clinical settings)에서의 실용적인 코칭 역할(pragmatic coaching role)을 말합니다. CiM은 반드시 종단적인 코칭 관계(longitudinal coaching relationship)를 요구하지는 않습니다. 이 두 가지 구체적인 요소 모두 기존의 코칭 모델이나 의학 교육 문헌의 기술(descriptions)에서는 다루어지지 않았습니다.
  • 코칭 프로세스인 RX-OCR은 라포(rapport) 또는 관계 구축(relationship building)의 중요성을 강조할 뿐만 아니라, 코칭 과정에 대한 기대치(expectations of the coaching process)를 명시적으로 표현(explicit articulation)해야 할 필요성을 강조합니다. 그러나 CBD 모델은 이것이 사전에(in advance of) 일어나는 것의 가치뿐만 아니라, 하이픈(-)으로 구분된 것처럼 임상 작업의 직접 또는 간접적 관찰(observation, directly or indirectly) 이전에 반복적으로 재검토(iteratively being revisited)되는 것의 가치도 강조합니다.
  • 추가적으로, 관찰(observation)을 코칭의 초석(cornerstone for coaching)으로 명시적으로 강조하는 것은 이 CBD 모델을 다른 모델들과 구별 짓습니다(sets apart).
  • 마지막으로, 학습과 향상(learning and improvement)을 궁극적인 목표로 삼는 CBD 코칭 모델은, 코칭 대화가 심리적으로 안전한 환경(psychologically safe environments)임상적(현장 코칭) 및 비임상적(지속적인 코칭) 환경 모두에서 성장과 발달을 촉진하기 위한 실행 가능한 단계(actionable steps)를 공동 식별(co-identifying)하는 것의 중요성을 강조합니다(underscores).
  • 전체 과정과 코칭 자체의 목표는 학습자가 유도된 성찰(guided reflections)을 받아들이고(receive) 통합하여(incorporate) 미래의 진료를 위해 개선(make improvements)을 이룰 가능성을 최적화(optimize the likelihood)하는 것입니다.

 


그림 1. 설계에 의한 역량(CBD) 코칭 모델 (The Competence by Design (CBD) Coaching Model)
전공의 학습(Resident learning)이 초점(focal point)이며, 이는 역량 습득(competency acquisition)에 대한 학습자 중심의 발달적 접근의 중요성을 반영합니다. 두 가지 별개의 코칭 역할이 그 발달을 지원합니다: 현장 코칭(coaching in the moment)지속적인 코칭(coaching over time). 이 그래픽은 또한 설계에 의한 역량(CBD) 코칭 모델의 기본이 되는(fundamental to) 다른 중요한 개념들을 보여줍니다.

  • 첫째, 전공의의 발달은 학습 포트폴리오(learning portfolio)에 보관된 기록(documentation)에 의해 포착되며, 이는 자기 성찰(self-reflection) 및 유도된 성찰 활동(guided reflection activities)을 위해 쉽게 이용 가능합니다.
  • 픽셀화된 고리(pixelated ring, 파란색과 회색)는 전문성(expertise)의 발달이 일어남에 따라 전공의의 역량이 점점 더 완전하게 묘사됨(increasingly more complete depiction)을 그래픽으로 표현한 것입니다.
  • 현장 코칭과 지속적인 코칭 모두에 대해 전공의와 코치 사이에 양방향 연결(bidirectional connection, 노란색 화살표)이 있으며, 이는 전공의의 학습과 발달의 이익을 위해 육성(nurtured)되어야 하는 협력(collaboration)과 관계, 즉 "교육적 동맹(educational alliance)" [23]의 중요성을 보여줍니다.
  • 마지막으로, CBD 코칭 모델은 전공의의 학습과 코칭이 대부분 캐나다 의료 시스템의 복잡한 업무 현장(complex workplace)에 내재되어(embedded) 있음을 명시적으로 인식합니다.
  • 이 현장은 모든 임상의(clinicians)에게 다수의 상충하는 우선순위(multiple competing priorities)를 제시하는데, 그중 가장 중요한 것은 환자에게 안전하고 고품질의 진료(safe, high-quality care)를 제공하는 것의 최고의 중요성(paramount importance)입니다 [36].

 

CBD 코칭 모델은 의도적으로(purposefully) 두 가지 별개의 코칭 역할로 설계되었습니다: 1) 현장 코칭(coaching in the moment, CiM)2) 지속적인 코칭(coaching over time, CoT). 이 역할들은 고유한 기능(unique functions)을 가지면서도 둘 다 수련생의 점진적인 발달을 지원합니다. 중요하게도, 두 역할 모두 임상 환경에서 관찰된 작업(observed work)을 학습 기회(learning opportunities)로 가치 있게 여깁니다. 또한 둘 다 학습자의 필요(learner’s needs)를 최우선(at the forefront)으로 둡니다. 코칭 대화의 지속 시간(duration), 다루어지는 목표(goals attended to), 다루어지는 내용(content addressed), 그리고 대화가 일어나는 맥락(context)조차도 역할에 따라 다를 것입니다(differ between the roles).

  • 임상 환경에서 학습자와 상호작용하는 모든 임상 교사(Any clinical teacher)는 CiM을 사용할 것이며,
  • 반면에 소수의 특별히 지정된 교수 코치(specifically designated faculty coaches)는 CoT를 적용할 것입니다.

함께(Together), 이 코칭 역할들은 수련생의 전문성 개발을 독특하지만 상호보완적인 방식(unique but complementary ways)으로 지원합니다.

 

현장 코칭 (Coaching in the moment)

현장 코칭(CiM)은 임상 교사(clinical teacher)와 수련생(trainee) 사이의 임상 환경(clinical environment)에서 발생하며, 수련생이 임상 활동(clinical activity)에 참여하는 것이 관찰되는(observed) 바로 그 순간이나 그 시간에 근접하여(at or close to the moment in time) 일어납니다. CiM은 오랫동안 확립된(long-established) 임상 교사의 역할이 진료의 질(quality of care)에 초점을 맞춘 전통적인 감독 역할(traditional supervisory role)에서, 학습자가 정규 훈련(formal training)을 거치는 동안(progress through) 그들의 성장과 지속적인 향상(growth and continual improvement)을 촉진하는(facilitating) 데에도 초점을 맞추는 역할로 진화할 것(evolve)을 요구합니다. CiM의 일환으로 수행되는 관찰은 실제적인 일상 업무(authentic daily work)에 대한 저부담 관찰(low-stakes observations)이 되도록 의도되었습니다; 단일 관찰(single observations)은 그 자체로(on their own) 어떠한 승급 결정(progression decision)에도 사용되지 않습니다; 오히려, 많은 관찰이 함께 모여 수련생의 학습 포트폴리오(learning portfolio) 내에서 데이터 포인트의 집합(aggregate of data points)을 형성하며, 학습자는 이에 대해 성찰(reflect)할 수 있습니다 [33, 37]. CiM은 이러한 개별 관찰(individual observations)을 개별 수련생의 발달(individual trainee development)을 촉진하기 위한 짧은 "현장(in the moment)" 코칭 대화(coaching conversations)를 뒷받침하는(underpin) 핵심적인 기초 재료(key foundational ingredient)로 활용합니다. CiM 대화가 일어나는 분주한 임상 환경(busy clinical environment)을 고려할 때(Given), 이러한 대화는 간결할 것(brief)이며, 대부분의 경우 단 몇 분 길이(only a few minutes long)일 것으로 예상됩니다. 종종 공동 생성(co-creation)에 의한 코칭의 바람직한 결과(desired outcome)는, 수련생이 미래의 유사한 임상 만남(future similar clinical encounters)에서의 구체적인 향상(specific improvement(s))이나 향상을 위한 목표(goals for improvement)를 이해하는 것입니다. 이러한 방식(In this way)으로, 코치는 수련생의 발달을 현재 위치(current place)에서 바람직한 미래 역량(desired future competence)을 향해 촉진하되, 단계적인 방식(graduated fashion)으로 수행합니다. 따라서, CiM의 완전한 잠재력(full potential)은 그것이 모든 임상 학습 환경(clinical learning settings)에서 정상적이고(normal), 기대되며(expected), 내재된(embedded) 일상적인 교육 활동(daily educational activity)이 될 때 비로소 실현될 것입니다.

지속적인 코칭 (Coaching over time)

지속적인 코칭(CoT)은 지정된 코치(designated coach)와 수련생 간의 종단적인 관계(longitudinal relationship)를 요구합니다. CBD 코칭 모델은 CoT에 이중 목적(dual purpose)을 명시적으로 부여합니다(explicitly assigns): 그것은 수련생이 독립적이고 유능한 임상의(independent, competent clinician)가 되는 것과, 자기 조절 학습자(self-regulated learner)로서 지속적인 역량(continued competence)을 갖춘 경력을 준비하는 것을 돕는 데 동시에 초점을 맞춥니다(concurrently focuses). 각 CoT 관계는 어떠한 단일 임상 경험(one clinical experience)보다 오래 지속되도록(last longer) 의도되었지만, 구체적인 기간(specific duration)은 현재 기술되어 있지 않습니다(not currently delineated). 따라서 일부 프로그램에서는 CoT 동맹(alliance)이 전체 전공의 훈련 기간(entire postgraduate training period)에 걸쳐 있을 수(span) 있는 반면, 다른 프로그램에서는 수련생들이 각각 몇 달 이상의 기간(not less than several months’ duration)을 가진 일련의 순차적인 CoT 관계(series of sequential CoT relationships)를 가질 수도 있습니다.

  • 모든 CoT 관계에서, 역량을 향한 수련생의 진전(progression toward competence)에 대한 정기적으로 예정된 대면 토론(regularly scheduled face-to-face discussions)은 필수적(essential)이며, 이는 전공의 훈련 기간 전체에 걸쳐(across the entire duration) 이루어져야 합니다.
  • CiM에 정보를 제공하는(inform) 관찰과 달리, CoT 만남(encounters)에 정보를 제공하는 관찰은 수련생 학습 포트폴리오에 수집된 데이터(data collected)를 검토하고 성찰함으로써 이루어지며, 또한 CoT 코칭 미팅 중의 행동(behaviours)을 주목하는 것뿐만 아니라, 중요한 것은(importantly), 수련생이 자신의 수행이나 전문성 개발(professional development)에 대해 수행한 성찰(reflections)도 포함한다는 점입니다.
  • 이러한 유형의 관찰 중 어느 것에 기초하여(On the basis of), CoT 코치는 종종 초기 단계에서는 공동 구성(co-construction)을 통해, 수련생이 학습 목표를 수립(establish learning goals)하고 수행 능력을 향상시키기 위한 명확한 실행 계획(clear action plan)을 개발하도록 안내할 것입니다.
  • 이러한 유형의 관계가 발전하고 잘 작동하기 위해서는, 수련생은 코치가 자신의 최선의 학습 이익(best learning interests)을 염두에 두고 있다는 것을 확신(confident)해야만 합니다 [23].

코칭은 과정이다: 현장 코칭과 지속적인 코칭의 역할을 모두 지원하는 프로세스 도구, RX-OCR (Coaching is a Process: RX- OCR, a process tool supporting both the role of Coaching in the Moment and Coaching over Time)

CiM과 CoT 모두 1:1 코칭 대화(1:1 coaching conversations)를 장려하는 CBD 코칭 모델의 구조는 코칭의 핵심 원칙(key principle)을 강조합니다(underscores): 즉, 학습과 점진적 발달(progressive development)을 촉진하기 위한 개별화된 안내의 제공(provision of individualized guidance)입니다. 그러나 향상을 위한 1:1 코칭 대화는, 비록 중요한 부분이기는 하지만(albeit an important one), 효과적인 코칭이 발생하기 위해 필요한 더 큰 과정(larger process)의 한 부분일 뿐입니다. 효과적인 CiM과 CoT를 촉진하기 위해, 코치들은 CBD 코칭 모델에서 RX-OCR이라는 두문자어(acronym)로 표시된 단계별 과정(step-by-step process)에 의해 안내받습니다(표 1 참조). RX-OCR은 모델의 필수적인 프로세스 도구(integral process tool)로서, 실질적인 구현(practical implementation)을 지원하고 내재된 핵심 코칭 원칙(embedded key coaching principles)의 적용을 가능하게 하도록 의도되었습니다. RX-OCR 과정의 사용은 임상 경험의 기간(duration of the clinical experience)과 관계없이(irrespective of) 코칭을 촉진하며, 모든 코치에게 코칭을 준비하고 참여(engaging in)하기 위한 안내 프레임워크(guiding framework)를 제공합니다.

표 1. CBD 코칭 모델에서의 RX-OCR 프로세스 (The RX-OCR process in the CBD Coaching Model)

단계 설명
관계/라포 (Relationship/Rapport) 안전한 학습 환경(safe learning environment)을 조성하기 위해 수련생과 코치 사이에 교육적 관계/라포(educational Relationship/Rapport, "교육적 동맹(educational alliance)")를 수립하십시오.
기대치 (Expectations) 만남에 대한 기대치를 설정(Set eXpectations)하십시오 (학습 목표 논의).
관찰 (Observe) 수련생과 수련생의 작업을 관찰(Observe)하십시오 (직접 또는 간접적으로).
코치 (Coach) 그 작업을 향상시키기 위한 목적(purpose of improving that work)으로 수련생을 코치(Coach)하십시오.
기록/성찰 (Record/Reflect) 코칭 만남의 요약(summary)을 기록(Record)하고 성찰(Reflect)하십시오.

RX-OCR 과정은 5가지 핵심 단계(five key steps)를 가지며 반복적인 과정(iterative process)이 되도록 설계되었습니다. 이 섹션의 나머지 부분에서는 각 단계를 설명하고 기저에 깔린 코칭 원칙(underlying coaching principles)을 강조할 것입니다.

1단계와 2단계: 관계/라포 형성 및 기대치 설정 (Steps 1 and 2: Establish a Relationship/Rapport and set eXpectations), RX-

처음 두 단계인 RX는 코칭이 성공하기 위해 결정적(critical for coaching to be successful)인 것으로 여겨집니다 [23, 24]. 코칭의 주된 목적(primary purpose)이 성장과 발달을 촉진(facilitate growth and development)하는 것임을 감안할 때, 수련생이 성장 마인드셋(growth mindset)을 채택하도록 지원하는 코칭 관행은 필수적(vital)입니다 [38]. RX-OCR 코칭 과정에서 RX 단계를 시작점으로 삼고 분리함으로써(starting with and separating), 이 도구는 코치가 수련생과 관계를 형성(establishing a relationship)하고, 라포를 구축(building rapport)하며, 명확한 기대치를 보장(ensuring clear expectations)하는 것이 코칭의 기초(foundational to coaching)라는 점을 강조합니다 [25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39]. 중요하게도, 여기에는 안전한 학습 환경(safe learning environment)을 조성하는 것이 포함됩니다. 학습 환경에서의 심리적 안전(Psychological safety)은 수련생들이 불이익에 대한 두려움(fear of repercussion) 없이 자신의 학습과 발달을 위해 대인관계적 위험(interpersonal risks)을 감수하고, 성장 마인드셋을 포용(embrace)하도록 하기 위해 필수적(imperative)입니다 [40, 41, 42, 43, 44]. 이 안전을 확립하는 것의 중요성은 아무리 강조해도 지나치지 않습니다(cannot be overstated): 이것은 코칭의 근본 원칙(fundamental principle)입니다 [45, 46]. 코치가 개인의 발달에 대한 헌신(commitment to the individual’s development)을 수련생에게 분명히 표현할 때(articulates), 코칭 관계는 강화되고 초점이 판단(judgment)이 아닌 발달에 있다는 메시지가 강화(reinforced)됩니다 [23, 47].

 

RX의 X는 전반적인 코칭 과정(overall coaching process)과 관련된 것들과 특정 코칭 만남(specific coaching encounter)과 관련된 것들을 포함하여, 기대치가 명확하게 표현(clearly articulated)되고 코치와 수련생 양측에 의해 상호 이해(mutually understood)되도록 보장하는 것의 중요성을 강조합니다. 기대치의 명확성(clarity of expectations)을 보장하고 코칭을 개인의 필요(individual’s needs)에 기반을 두기(ground) 위해, 수련생은 어떠한 코칭 전이라도 목표 설정(setting goals)에 적극적으로 참여(actively engaged)해야 합니다. 이 핵심 원칙은 수련생이 자신의 학습과 발달에 있어 능동적인 파트너(active partners)가 되도록 힘을 실어줍니다(empowers) [48]. 성공적일 때, RX 단계는 수련생이 고정 마인드셋(fixed mindset)에서 벗어나 성장 마인드셋으로 전환(shift away)하도록 돕고, 영향력 있는 코칭 대화(impactful coaching conversations)를 위한 무대를 마련해야 합니다(set the stage).

 

RX-OCR 두문자어 내의 하이픈(-)은 이러한 초기 기초 단계(initial foundational steps)를 강조하고 코치들에게 각 코칭 만남의 시작 부분에서 과정의 처음 두 단계를 재검토(revisit)하도록 상기시키기 위한 의도입니다. 또한, 특히 CiM(현장 코칭)에서, 이 처음 두 단계가 항상 작업 관찰(observation of work) 바로 직전에 선행(immediately precede)될 필요는 없지만, 시간상 근접하여(in close proximity) 수행되어야 함을 인정합니다.

3단계: 관찰 (Step 3: Observe), O

수련생 작업의 관찰(Observation)은 CiM과 CoT(지속적인 코칭) 모두에서 핵심 요소(key ingredient)입니다. 관찰은 직접적(directly) 또는 간접적(indirectly)으로 발생할 수 있습니다.

  • 직접 관찰(Direct observation)은 수련생이 지식과 기술을 실무에 어떻게 적용하는지(apply their knowledge and skills to practice)에 대한 이해를 발전시키기 위해 수련생이 과업을 수행하는 것을 지켜보는 과정(process of watching)을 말합니다 [49, 50].
  • 간접 관찰(Indirect observations)은 개인이 수련생이 과업을 수행하는 것을 직접 지켜보지 않고 수행하는 관찰입니다. 간접 관찰은 수련생의 구두 증례 발표(oral case presentation), 임상 기록(clinical documentation), 다른 의료 제공자, 환자 또는 가족으로부터의 보고, 또는 수련생의 학습 포트폴리오와 같은 대리 데이터(surrogate data)로부터 정보를 수집하는 것(gathering information)을 포함할 수 있습니다.
  • CoT 역할에서, 일부 코치들은 이용 가능한 데이터를 간접 관찰(또는 검토)하는 것을 정보를 획득하는 것(obtaining information)으로 개념화(conceptualize)하는 것을 더 쉽게 생각합니다. 그렇기는 하지만(That said), CoT 코치들이 수련생의 자기 조절 학습 기술(self-regulated learning skills)을 직접 관찰할 기회들도 있습니다.

관찰은 주로 발달과 향상(형성적[formative] 또는 "학습을 위한[for learning]")을 위해 수행됩니다 [51]. 관찰은 코칭이 수련생의 고유한 개별화된 발달 궤적(individualized developmental trajectory)상에서 그들이 위치한 곳(where the trainee is situated)에 적절하도록(relevant) 해줍니다. 빈번한 저부담 관찰(Frequent low-stakes observations)은 수렴되고 종합되어(converge and aggregate) 수련생의 역량에 대한 더 포괄적인 묘사(fulsome representation)를 제공하는 역량의 진정한 스냅샷(authentic snapshots)을 생성합니다. 여러 코치에 의해 관찰된 다양한 임상 상황에서의 다수 관찰(multiple observations)이 이루어지고 나서야 비로소, 역량 위원회(competence committees)는 데이터의 종합(aggregate of data)과 발달 궤적에 기초하여 수련생의 역량에 대한 판단(judgments)을 내립니다 [52].

4단계와 5단계: 코치, 기록/성찰 (Steps 4 and 5: Coach, C, Record/Reflect, R)

관찰 후에, 수련생과 코치는 코칭 대화(coaching conversation)에 참여해야 합니다(engage in). 코칭 대화에 대한 코치의 접근법은 맥락 특이적(context specific)이며(CiM 또는 CoT), 대화는 수련생과 코치의 선호도(preferences)에 따라 다른 형태를 취할 수 있습니다. 코치가 성찰을 촉진하여 수련생이 향상을 위해 필요한 것을 스스로 식별(self-identify)하도록 이끄는 성찰 기반 접근법(reflection-based approach)을 사용하는 것은, 수련생이 자신의 학습에 있어 능동적인 파트너가 되도록 더욱 장려할 것입니다. 그러나 어떤 맥락에서는, 스포츠나 음악에서 종종 활용되는 지시적(directive) 또는 "전제적(autocratic)" 접근법이 더 효과적이며 [8, 53], 이 경우 코치는 향상을 위한 구체적인 제안(specific suggestions)을 제공합니다. 어떤 유형의 코칭 대화가 일어나든, 수련생은 코치와 함께 향상을 위한 구체적인 단계(specific steps)를 명확하게 공동 구성(co-construct)해야 합니다.

 

마지막이지만 동등하게 중요한 단계(equally important step)는 학습 및 향상 포인트(learning and improvement points)를 포함한 코칭 만남의 요약(summary)을 기록(record, R)하고 성찰(reflect)하는 것입니다. 일단 기록되면, 코칭 만남은 수련생 학습 포트폴리오의 일부가 되며, 이는 수련생의 미래 성찰(future reflection)을 촉진하고, 그 성찰에 기반하여 향상(improvement can be based)이 이루어질 수 있습니다. 모든 코칭 대화가 기록될 필요는 없지만, 안전한 학습 환경을 보장하고 성장 마인드셋을 포용하는 학습 문화(learning culture)에서는, 드물게 일어나는 큰 교정(infrequent larger corrections)보다는 반복적인 "넛지(nudges, 가벼운 찌름/자극)"를 제공하기 위해 코칭이 빈번하게 수행될 때 코칭의 이점이 극대화될 것입니다. 코칭 만남의 결과를 기록하는 것은 또한 CBME에서의 프로그램적 평가(programmatic assessment)의 일부입니다 [54]. 역량 위원회는 수련생의 역량을 판단하고 훈련 프로그램 내에서 수련생의 진급 및 승진(progression and promotion)에 대한 권고(recommendations)를 하기 위해, 종합적으로(in aggregate) 이 기록들에 의존합니다.

 

마지막으로, 수련생과 코치 모두 코칭 만남에 대해 정기적으로 성찰(regularly reflect)하도록 장려됩니다. 성찰은 향상의 과정(process of improvement)을 뒷받침하는(underpins) 근본적인 코칭 원칙이며, 그 사용은 CBD 코칭 모델과 RX-OCR 도구의 구조에 의해 장려됩니다. 수련생은 초기에 자기 성찰(self-reflect)을 하고 그 후 자신의 CoT 코치와 성찰 내용을 논의하도록 장려됩니다. 코치들 또한 미래의 코칭 만남을 개선할 수 있는 방법에 대해 성찰하도록 장려됩니다.

성찰과 얻은 교훈 (Reflections and lessons learned)

전공의 의학 교육(postgraduate medical education)의 혁신적인 변화(transformative change)를 위한 대규모 국가적 실행(large-scale national implementation)의 일환으로 코칭을 도입하는 것은, 예상했던 대로(not unexpectedly), 몇 가지 난관(challenges)이 있었습니다. 이 마지막 섹션에서는 유사한 변화를 수행할지 모르는(undertake similar changes) 다른 사람들을 돕기 위해 통찰력과 얻은 교훈(insights and lessons learned)을 제공하고자 이러한 난관들 중 일부를 논의합니다.

 

도전 과제 1 – 직접 관찰과 코칭을 분주한 임상 진료에 통합하는 것은 어려울 수 있다 (Challenge 1 – It can be difficult to incorporate direct observation and coaching into busy clinical practice)

 

직접 관찰(direct observation)이 효과적인 코칭의 핵심(key)이긴 하지만, 임상의들은 분주한 임상 진료 환경(busy clinical practice environments)에서 수많은 상충하는 우선순위와 압박(competing priorities and pressures)에 직면합니다 [55, 56]. 비록 코치가 전체 환자 평가(whole patient assessment)를 관찰할 필요는 없더라도, 관찰과 관련된 코칭은 여전히 시간이 걸립니다(take time).

 

많은 코치들은 임상 업무 흐름(clinical workflow) 내에서 직접 관찰을 위해 특정 시간을 할애하는(dedicating a specific time) 전략을 고용(employ strategies)한다면(예: 하루의 첫 번째 또는 마지막 환자나 케이스, 또는 회진 중 검토할 임상 소견이 있는 한두 명의 입원 환자를 관찰) 관찰을 수행하는 것이 더 쉽다는 것을 발견했습니다 [50]. 간접 관찰(Indirect observations)은 여러 방식(예: 구두 증례 검토, 업무 현장 기록 검토, 다른 의료 전문가와의 토의)으로 일어날 수 있으며 코칭 상호작용(coaching interactions)의 기초로 사용될 수 있지만, 이는 반드시 일부 직접 관찰에 더하여(in addition to) 이루어져야 합니다. CBD를 실행하는 과정(process of implementing)은 지도전문의(supervisors)와 수련생이 관찰 직후에 코칭을 위한 시간을 만드는 것에 대해 의도적(intentional)이어야 함을 드러냈습니다. 미리 계획하는 것(Planning ahead)은 두 가지 모두가 일어나도록 보장하는 데 결정적(crucial)입니다.

 

도전 과제 2 – 의사들은 문제를 해결하도록 훈련받았으나 코칭은 새로운 기술 세트를 요구한다 (Challenge 2 – Physicians are trained to solve problems and coaching requires a new skill set)

 

의사들은 전통적으로 문제를 해결(solve problems)하고 쟁점을 다루도록(address issues) 사회화되고 훈련받아(socialized and trained) 왔습니다; 코칭에서의 탐구적 접근(inquiry approach)은 그들에게 낯설 수 있습니다(can be foreign). CiM이나 CoT에서 코치로 활동하는 의사의 자연스러운 경향(natural tendency)은 학습자가 해결책을 찾도록 안내(guiding the learner)하기보다는 확인된 격차(identified gap)에 대한 해결책을 제안(propose solutions)하는 것입니다. 또한, 코칭은 전통적으로 의학 교육 커리큘럼의 일부가 아니었으며 따라서 대부분의 임상의의 기술 세트(skill set)의 일부가 아닌 기술들을 요구합니다.

 

수련생과 교수진을 탐구적 접근에 적응시키는 것(Orienting)이 아마도 도움이 되겠지만, 목표화된 전문성 개발(targeted professional development) 또한 필요합니다. Royal College는 교수 개발(faculty development)을 돕기 위해 CiM과 CoT 모두에 대한 자원을 제공하지만, 현지의 적용된 실습(local applied practice) 또한 중요합니다. 새로운 증거(Emerging evidence)는 코칭에 대해 공동 학습(co-learning, 수련생과 교수진이 함께)하는 것이 유리할 수 있음(advantageous)을 시사합니다 [57]. CoT에 특이적으로(Specific to), 수련생이 코치와 만나기 전에 자기 성찰 도구(self-reflection tool)를 작성하게 하는 것은 탐구적 접근의 채택을 촉진(expedite adoption)할 수 있습니다. 이러한 전환(shift)은 시간이 걸릴 것입니다.

 

도전 과제 3 – 학습자들은 관찰을 지배적인 성과 지향적 문화와 관련된 총괄 평가로 인식한다 (Challenge 3 – Learners perceive observation as summative assessment related to the prevailing performance-oriented culture)

 

CBD에서, 관찰된 작업은 이중 목적(dual purpose)을 수행합니다. 관찰은 코칭의 기초를 형성하지만 또한 수련생의 학습 포트폴리오에 기록되며, 역량 위원회(competence committees)를 위한 프로그램적 평가 모델(programmatic assessment model)에서 설명된 대로 종합된 전체(aggregated whole)로서 검토됩니다. 이러한 이중 용도(dual purposing)는 학습자들이 모든 관찰된 작업을 총괄 평가(summative assessment)로 인식하는 데 기여했습니다 [58, 59]. 학습자의 경험은 그들이 배우고 있는 문화에 얽혀 있습니다(entangled in the culture) [60]. 그렇기에 놀랍지 않게도, 의학 교육의 여전히 두드러진(still-prominent) 평가 중심의 성과 문화(assessment-focused performance culture)는 이러한 관점을 조장합니다(promotes) [58, 59].

 

이 난관은 공유된 멘탈 모델(shared mental model)을 개발하고 코칭 과정에서의 투명성(transparency)을 보장하는 것의 중요성을 강조합니다(underscores). 관찰은 현장 기반 평가(workplace-based assessment, WBA)라기보다는 현장 기반 학습(workplace-based learning)으로 프레임화(framed)되어야 하며, 임상 환경에서 수련생의 성장 마인드셋(growth mindset) 채택을 지원하는 행동과 관행을 강조해야 합니다. 심리적으로 안전한 학습 환경(psychologically safe learning environment)을 보장하고, 상호 이해된 목표와 기대치(mutually understood goals and expectations)를 수립하며, 바람직한 향상 지향적 문화(improvement-oriented culture)를 지원하는 코칭 관계를 개발하는 것이 결정적입니다 [61]. 심리적 안전을 유지하는 하나의 중요한 방법은 기록된 관찰이 무엇을 위해 사용될 것인지, 그리고 그 정보가 누구와 공유될 것인지에 대한 공유된 이해(shared understanding)를 갖는 것입니다. 그러나 현재의 지배적인 판단 및 성과 중심 문화(predominant current judgement, performance-focused culture)가 수행해야 한다는 필요성(need to perform)에 대한 학습자의 인식에 미치는 영향은 아무리 강조해도 지나치지 않습니다(cannot be understated). 일차적인 목표(primary goal)는 모든 학습자, 교수진, 의학 교육 조직 및 시스템이 개인을 건강 돌봄의 연속선상(continuum of care for health)에서 캐나다 인구에게 봉사할 수 있는 최고의 의사로 개발한다는 공유된 목적(shared purpose)에 집중하도록 보장하는 것이어야 합니다. 그렇게 하기 위해서, 시스템은 안전한 학습 환경을 조성(foster)하고 학습자와 교수진이 학습 문화를 포용(embrace a learning culture)할 수 있도록 필요한 지원을 제공해야 합니다. RX-OCR 과정의 두 번째 R은 초기에 기록(Record)만을 의미하도록 제안되었으나, 기록된 관찰은 성장 지향성(growth orientation)에 발맞추어(in keeping with) 수련생이 코치와 함께 학습 목표를 공동 생성(co-create)하기 위해 자신의 과거 수행을 자기 성찰(self-Reflect)할 수 있게 해줍니다.

결론 (Conclusion)

코칭은 개인, 관계, 시스템 수준(individual, relational, and systems levels)의 다수 요인(multiple factors)을 포함하는 복잡한 인간 상호작용(complex human interaction)이며, 이 모든 것에 주의(attention)가 요구됩니다. Royal College CBME 변화 이니셔티브의 일부로 개발된 CBD 코칭 모델과 그 관련 실행 도구인 RX-OCR은 그 설계를 안내한 코칭의 핵심 원칙들을 강조하며 기술되었습니다. 의학 교육의 독특한 맥락(unique context)에서 CBD 코칭 모델의 성공적인 실행(Successful implementation)은 시간이 걸릴 것이며 지속적인 노력(sustained effort)을 필요로 할 것입니다. 특히 이 접근법이 의학 교육에서 새로운 것(novel one)임을 고려할 때 더욱 그렇습니다. 실행에서 얻은 성찰과 교훈(Reflections and lessons learned)은 이 영역에서 일하는 것을 고려 중이거나 이미 일하고 있는 다른 사람들에게 정보를 제공하기 위해 공유되었습니다. CBME 접근법의 실행은 자원의 투자(investment of resources)를 필요로 하지만, 새로운 증거는 코칭의 이점이 특히 학습자에게, 그리고 코치에게도 그 투자에 대한 수익(return on that investment)이 될 수 있음을 시사합니다.

 

 

 

 

 

Perspect Med Educ. 2024 Feb 6;13(1):24-32. doi: 10.5334/pme.957. eCollection 2024.

Competency-Based Medical Education at Scale: A Road Map for Transforming National Systems of Postgraduate Medical Education

 

 

캐나다는 어떻게 의사 교육을 뜯어고쳤을까? 대규모 CBME 전환기

안녕하세요! 오늘은 의학 교육 분야에서 정말 거대한 프로젝트를 성공시킨 사례를 다룬 논문을 하나 소개하려고 해.

바로 캐나다의 Royal College of Physicians and Surgeons of Canada가 주도한 'Competence by Design(CBD)' 프로젝트에 대한 이야기야. 캐나다 전역의 전공의 교육 시스템을 역량 바탕 의학 교육(Competency-Based Medical Education, CBME)으로 전환시킨, 그야말로 '대공사'의 기록이지. 🏗️

이 논문은 그 10년 넘는 여정의 로드맵(Road Map)과 그 과정에서 얻은 교훈(Lessons Learned)을 아주 솔직하게 담고 있어.

1. 도대체 무슨 일을 벌인 거야? 🤔

캐나다 Royal College는 무려 67개의 전문과목(내과, 외과 등)과 세부 전문과목 전체를 대상으로 교육 과정을 싹 바꿨어. 핵심은 전공의가 수련 기간 동안 단순히 시간을 채우는 게 아니라, 실제로 환자를 진료할 수 있는 역량(Competence)을 갖췄는지 확인하는 거야.

이 거대한 변화를 위해 이들이 세운 원칙은 이거였어.

"표준은 각 분야에 구체적이어야 합니다... 새로운 CBD 표준은 해당 분야와 Royal College에 의해 공동 생성됩니다."

"Standards would be specific to each discipline... The new CBD standards would be co-created by the discipline and the Royal College..."

 

즉, 중앙(Royal College)에서는 큰 틀과 자원을 제공하고, 실제 내용은 각 전문과목 위원회가 채워넣는 공동 창작(Co-creation) 방식을 택한 거지.

2. 어떻게 진행했어? (The Strategy) 🗺️

67개 과를 한 번에 다 바꾸면 난리가 나겠지? 그래서 이들은 '코호트(Cohort)' 방식을 썼어. 몇 개의 과를 묶어서 순차적으로 진행한 거야.

  1. 코호트 나누기: 준비가 된 '얼리 어답터(Early Adopters)' 과들을 먼저 시작하게 했어.
  2. 워크숍 시리즈: 각 과의 위원들을 모아서 3일짜리 워크숍을 3번씩 진행했어. 여기서 교육 과정을 설계하고, EPA(위임 가능한 전문 활동)를 만들었지.
  3. 지원은 확실하게: 중앙에서 재정 지원은 물론이고, 임상 교육자(Clinician Educators)와 집필가(Writers)를 붙여서 서류 작업을 도와줬어. (이게 신의 한 수! 👍)

3. 시행착오와 배움 (Learning Along the Journey) 💡

처음에는 이론대로 '역량(Competencies)'이나 '이정표(Milestones)'부터 쓰려고 했대. 그런데 의사들이 너무 힘들어했다는 거야. 그래서 순서를 바꿨어. 연구진은 이 부분에서 아주 중요한 발견을 해.

"대신, 임상의들은 분야의 EPA를 식별하는 것이 더 쉽다는 것을 알게 되었는데, 이 활동이 그들이 자신의 업무와 전공의 수련에 대해 생각하는 방식에 더 맞춰져 있었기 때문입니다."

"Instead, clinicians found it easier to identify the EPAs of the discipline as this activity was more attuned to the way they thought about their work and postgraduate training."

 

결국, 현장의 언어인 EPA(실제 하는 일)를 먼저 정의하고, 거기에 역량을 연결하는 방식이 훨씬 효과적이었다는 거지. 역시 해봐야 아는 법이야.

또한 초기에는 EPA를 너무 많이 만들어서(욕심쟁이들! 😅) 나중에 관리하기 힘들었대. 그래서 개수를 30~50개 정도로 줄이고, 다양한 상황(소아/성인, 외래/응급실 등)에서 평가할 수 있게 유연성을 줬다고 해.

4. 현실적인 어려움들 (The Challenges) 🚧

물론 꽃길만 있었던 건 아니야. 10년에 걸쳐 순차적으로 도입하다 보니 생긴 문제도 있었어.

"전문과목 코호트에 걸쳐 CBD 변혁의 순서를 정한 결정은 그 영향의 지속 기간을 늘렸습니다."

"The decision to sequence CBD transformation across cohorts of disciplines prolonged the duration of the impact."

 

한 병원 안에 구식 시스템과 신식(CBD) 시스템이 공존하는 기간이 길어지면서, 행정 부서는 죽을 맛이었고... 😫 아직 CBD를 시작 안 한 과로 파견 나간 전공의들은 평가받기가 애매해지는 상황도 생겼대. 게다가 COVID-19까지 터지면서 워크숍이 중단되기도 했지(하지만 줌(Zoom)으로 극복!).

5. 결론: 다른 나라들에게 주는 조언 📢

이 논문의 저자들은 비슷한 변화를 꿈꾸는 다른 나라나 기관들에게 뼈 있는 조언을 남겼어.

첫째, 시스템 전체를 한방에 바꿀지(Simultaneously) 아니면 순차적으로 바꿀지(Sequentially) 명확히 결정하라는 거야. 캐나다는 순차적 방식을 택해서 재정 부담을 줄이고 노하우를 쌓았지만, 그만큼 과도기 혼란이 길었다는 점을 솔직히 인정했어.

둘째, 유연성!

"교육 설계에 대한 엄격한 고수와 다른 분야나 지역적 맥락을 위한 유연한 적응 사이의 균형을 맞추는 것"

"Balancing strict adherence to the educational design with flexible adaptation for different disciplines or local contexts"

결국 CBME라는 큰 원칙은 지키되, 각 과의 특성에 맞게 유연하게 적용하는 것이 성공의 열쇠라는 거지.


📝 요약하자면: 캐나다의 이 거대한 실험은 완벽해서가 아니라, 문제를 마주하고 끊임없이 수정(Iteration)해 나갔기 때문에 성공적인 모델로 평가받는 것 같아. 우리나라도 의학 교육 변화를 고민할 때 이들의 '로드맵'과 '시행착오'를 꼭 참고해보면 좋겠어!

혹시 더 자세한 내용이 궁금하면 댓글 남겨줘! 👋

 

 

서론 (Introduction)

1990년부터, Royal College of Physicians and Surgeons of Canada (이하 Royal College)는 캐나다의 전문의 교육(specialty education) 시스템을 역량 바탕 의학 교육(competency based medical education, CBME)으로 발전시키는 의도적인 경로(deliberate path)를 밟기 시작했습니다(embarked on). Royal College는 67개의 전문과목 및 세부 전문과목(specialty and subspecialty disciplines)(28개의 전문과목(specialties), 37개의 세부 전문과목(subspecialties), 그리고 2개의 특별 프로그램(special programs))에 대한 전문의 교육을 감독합니다(oversees). 각 분야는 국가적 차원(national level)에서 해당 분야를 감독하기 위한 전문과목 위원회(specialty committee)를 두고 있으며; 구성원(membership)에는 교육 리더(educational leaders), 지역 대표(regional representatives), 그리고 해당 분야의 모든 전공의 수련 프로그램 책임자(postgraduate training program directors)가 포함됩니다. Royal College전문과목 위원회와 협력하여(Working with), 공통 교육 프레임워크(common educational framework)인 CanMEDS [1, 2]에 기반하여 각 분야의 교육 표준(educational standards)을 설정하고, 개별 전공의 수련 프로그램(postgraduate training programs)의 인증(accreditation)을 위한 표준을 설정하며, 인증 시험(certification examinations)을 개발 및 시행(develops and delivers)하고, 개별 의사들에게 자격을 부여합니다(credentials). 전공의 수련 프로그램은 의과대학(university faculty of medicine)과 제휴된(affiliated with) 대학 병원/학술 건강 과학 센터(academic health science centres)에 기반을 두고 있으며, 졸업 후 의학 교육(postgraduate medical education, PGME) 학장(dean)의 감독을 받고, Royal College에 의해 인증(accredited)받습니다. 캐나다에는 17개의 의과대학, 약 1000개의 전공의 수련 프로그램, 그리고 10,000명이 넘는 수련생(trainees)이 있습니다.

 

Competence by Design (CBD)은 사회적 건강 요구(societal health needs)와 환자 결과(patient outcomes)를 해결하기 위해 설계된(designed to address) 캐나다 전문의 교육 시스템의 혁신적인 변화 이니셔티브(transformational change initiative)입니다 [3].

  • 이는 CBME에 대한 이전의 Royal College 접근 방식(approaches)(예: CanMEDS 역량(CanMEDS competencies))을 기반으로 구축되었으며(builds on), CBME의 5가지 핵심 구성 요소(five core components)를 적용합니다(applies) [4].
  • CBD 프레임워크의 특징(Features)으로는
    • CanMEDS 2015 역량 프레임워크에 대한 기반(basis),
    • 전공의 수련에 대한 시간 가변적 접근(time-variable approach),
    • 역량 연속체(Competence Continuum)의 4단계를 따르는 수련 순서 배열(sequencing of training), 그리고
    • 교육, 학습, 관찰, 코칭 및 평가(teaching, learning, observation, coaching, and assessment)의 초점(focus)으로서 각 단계에 특화된 위임 가능한 전문 활동(entrustable professional activities, EPAs)(즉, RCEPAs로 약칭되는(abbreviated as) EPA에 대한 Royal College의 접근 방식)의 사용(use)이 포함됩니다 [5].
  • 2015년 9월 CanMEDS 2015의 출시(launch)와 함께, Royal College는 CBD 프레임워크를 각 전문과목, 세부 전문과목 및 특별 프로그램에 적용하기 위한 야심 찬 이니셔티브(ambitious initiative)를 시작했습니다.

CBD 전문과목 변혁 (CBD Specialty Transformation)

초기에(At the outset), Royal College는 이 변화 이니셔티브의 설계 및 구현(design and implementation)을 안내하기 위해(to guide) 몇 가지 원칙(principles)을 수립했습니다(established).

  • 공통된 접근 방식(common approach)이 존재해야 합니다;
    • 즉, CBD의 교육 설계(educational design)와 CBME의 5가지 핵심 구성 요소의 사용은 Royal College가 인정한(recognized) 모든 전문과목, 세부 전문과목 및 특별 프로그램에 적용됩니다(apply).
  • 표준은 각 분야에 구체적(specific to each discipline)이어야 합니다;
    • 이 교육 설계의 프레임워크 안에서, 각 분야는 해당 분야의 요구에 맞게(to fit the needs) 교육 표준을 개발하고 개별화(develop and individualize)해야 합니다. 새로운 CBD 표준은 해당 분야와 Royal College에 의해 공동 생성(co-created)되며, 전문과목 위원회는 의학 및 교육 전문 지식(medical and educational expertise)을 제공하고, Royal College는 자원(resources), 행정적 지원(logistical support), 그리고 CBD 프레임워크 및 그룹 촉진(group facilitation)에 대한 전문 지식을 제공합니다.
  • 변혁은 반복적(iterative)이어야 합니다;
    • 학습한 교훈(lessons learned)을 바탕으로 설계와 프로세스에 대해 시기적절한 조정 및 수정(timely adaptations and modifications)이 이루어져야 합니다.

이 이니셔티브를 수행하기 위해(To carry out), 참가자들은 CBME와 CBD 교육 설계에 대한 새로운 지식과 기술(knowledge and skills)을 개발하고, 이 패러다임(paradigm) 내에서 새로운 수련 표준과 요건(requirements)을 조정 및/또는 생성(adapt and/or create)하며, 자신의 책임 영역(spheres of responsibility) 내에서 변화를 주도하거나 관리(lead or manage)해야 했습니다. CBD 프로젝트 팀은 CBD 전문과목 변혁을 위한 다년 계획(multi-year plan)을 개발하기 위해 교수 개발(faculty development), 교육과정 설계(curriculum design), 그리고 변화 관리 프레임워크/모델(change management frameworks/models)을 적용했습니다(표 1 참조).

 

표 1. 전공의 교육(residency education)을 역량 바탕 의학 교육(CBME) 모델로 변혁하기 위한 접근 방식에 사용된 이론적 프레임워크/모델

목적 (PURPOSE) 프레임워크/모델 (FRAMEWORK/MODEL) 프레임워크/모델 사용의 예시 (ILLUSTRATION OF THE USE OF THE FRAMEWORK/MODEL)
구현 준비 (Preparation for Implementation) Kotter의 8단계와 ADKAR를 활용한 변화 관리/리더십 (Change management/leadership) [6, 7] 전문과목 위원회를 포함한 파트너들과의 상호작용(Interactions)은 변화의 필요성에 대한 자문(consulting), 그들의 지지 확보(establishing their support), 그리고 피드백을 Competence by Design의 비전에 통합하는 것(incorporating)으로 시작되었습니다.
워크숍 참가자들은 변화에 대한 지식과 기술(knowledge and skills)을 개발했고, 그 지식과 기술을 적용하여 해당 분야의 교육 설계를 개발했으며, 교육 설계의 구현을 지원하기 위해(to support) 워크숍과 웨비나의 개발 활동에 참여했습니다(participated).
참가자 개발 (Participant development) Yvonne Steinert의 핵심 개념과 원칙을 활용한 교수 개발 (Faculty development) [8] 워크숍은 공식적 및 비공식적 그룹 학습(formal and informal group learning)을 모두 제공했습니다: 임상 교육자(clinician educators)가 정보를 제공했습니다; 임상 교육자의 지원을 받은 그룹 작업은 비공식적 그룹 학습을 제공했습니다; 공유된 활동을 통해 해당 분야 내 실천 공동체(communities of practice)를 개발하는 것은 비공식적 그룹 학습을 제공했습니다.
온라인 모듈은 공식적인 개별 온라인 학습(formal individual online learning)을 제공했습니다.
표준 개발 (Standards development) 전문성 이론(Expertise theory)을 활용한 교육과정 설계 (Curriculum design) [9] 표준 개발은 전체적인 진료 범위(scope of practice)에 대한 논의로 시작되었으며, 이어 해당 분야의 과업(tasks)을 식별하고, 이를 사용하여 역량 개발(development of competences) 평가를 위한 요건뿐만 아니라 필수 학습 경험(required learning experiences)을 확인했습니다.

파트너와의 참여 (Engaging with Partners)

2012년부터, CBD 프로젝트 팀은 PGME 시스템 내의 핵심 파트너(key partners)들과 제안된(proposed) CBD 프레임워크 및 CBD 구현 계획(plan for implementation)에 대해 협의했습니다(consulted). 협의 대상에는

  • 대학 PGME 학장, 국가 전문과목 위원회(national specialty committees), 국가 전문학회(national specialty societies), 수련생 조직(trainee organizations), 관련 규제 당국(regulatory authorities), 그리고 Royal College 임상 교육자(clinician educators)가 포함되었습니다.

CBD 프로젝트 팀은 이러한 파트너들과의 오랜 관계(longstanding relationships)와 Royal College 또는 각 조직(respective organization)이 주최하는 회의에서의 정기적인(regular)(적어도 연 1회) 상호작용(interactions)활용했습니다(leveraged). 이러한 논의(discussions)는 프로젝트 팀에게 PGME 커뮤니티에 정보를 제공하고 참여(inform and engage)시키는 동시에, 제안된 이니셔티브에 대한 그들의 의견을 수집할(gathering their input) 기회(opportunities)를 제공했습니다. 또한, 이러한 협의를 통해 얼리 어답터(early adopters)인 전문과목 위원회, 즉 변혁을 시작하기를 열망하거나(eager to) 이미 CBD의 목표를 향해 진전(making progress)을 보이고 있는 위원회들을 식별했습니다(identified).

로드맵 만들기 (Making the Road Map)

CBD와 그 구현(implementation)을 위한 후속 계획(subsequent plan)은 앞서 언급한 파트너들과의 협의(consultations)에서 확인된(identified) 문제들을 다루었습니다(addressed).

  • 업무량(workload),
  • 변화를 위한 자원 및 지원의 가용성(availability of resources and support), 그리고
  • 이니셔티브와 관련된 일정(timelines)에 대한 우려(Concerns)가 제기되었습니다(had been raised).

 

또 다른 공통된 우려는 진행 중인 Royal College 인증 활동(accreditation activities)과 관련이 있었는데, 여기에는

  • 변화하는 교육 설계(educational design)와 관련된 새로운 인증 표준(accreditation standards)에 대한 요건을 충족(meeting requirements)하는 동시에
  • CBD 변혁과 인증 활동을 동시에 관리(manage... at the same time)해야 하는 프로그램 및 학교의 업무량이 포함되었습니다.

이 교육과정 변화(curricular change)와 관련하여 인증의 어려운 측면(challenging aspect)은 Royal College 인증 활동의 운영 메커니즘(mechanism of operation)이었습니다. 인증은 하나의 대학, 그 대학의 PGME 부서(PGME office), 그리고 모든 전공의 수련 프로그램에 초점을 맞추는 반면, 교육 표준의 변화는 모든 대학에 걸쳐 단일 분야(a discipline)의 수련 프로그램 차원(level)에서 발생합니다. 따라서, 인증을 받고 있는(undergoing) 대학은 CBD 변혁 과정의 서로 다른 단계(varying stages)에 있는 프로그램들을 보유하게 됩니다.

 

변혁을 위한 로드맵(road map)은 Royal College가 전문과목 교육 설계(specialty’s educational design, SED) 개발과 CBD 구현 작업을 직접 지원한다(directly support)는 원칙(principle)에 기초했습니다. 이는 5가지 핵심 결정(key decisions)으로 이어졌습니다:

  • 새로운 교육 표준의 생성(creation)은 Royal College 전문과목 위원회(specialty committee)에 의해 이루어지며, 해당 분야의 모든 프로그램에 걸친 동시적인(simultaneous) CBD 구현을 위한 기반(basis)으로 사용됩니다.
  • 전문과목들은 코호트(cohorts)로 그룹화됩니다(grouped); 각 코호트는 한꺼번에 시작하기보다는 순차적으로(in sequence) 작업을 시작합니다.
  • 은 해당 분야의 선호도(preference), 범주(category)(내과계, 외과계, 검사계, 전문과목, 세부 전문과목 등), 그리고 다른 분야와의 관계(relationship)에 기초하여 의도적(intentional)으로 이루어집니다 (보충 파일 1: 코호트의 순서 및 그룹화 참조).
  • Royal College는 각 개별 전문과목 위원회와 협력하여 SED를 생성할 임상 교육자(clinician educators), 집필가(writers), 행정가(administrators)로 구성된 팀을 수립하고 지원(establish and support)합니다.
  • 이 작업은 Royal College가 자금을 대고 지원하는(funded and supported) 일련의 워크숍(workshops)을 통해 이루어집니다.

앞서 언급한 업무량과 자원에 대한 우려가 전문과목 위원회에 대한 중앙 집중식 지원(centralized support)일련의 워크숍에 대한 자금 지원(funding)에 관한 결정을 이끌었습니다(drove). Royal College는 각 전문과목 위원회가 CBD의 포괄적인 프레임워크(overarching framework)를 자신의 분야에 맞게 조정(adapted)할 때 그 작업을 촉진(facilitate)하기로 약속했습니다(committed). 이 작업을 통해, 프로그램 책임자들은

  • 전문과목의 교육 설계에 직접적인 의견(direct input)을 내고,
  • 교수 개발(faculty development)에 참여(engage)하며,
  • 최종적인 졸업 시의 분야별 역량(discipline-specific competencies) 세트 외에도 수련의 순서(sequence)를 안내하는(guide) 교육과정 요소(curricular elements)(즉, 단계(stages), RCEPAs, 평가 전략(assessment strategies), 및 수련 경험(training experiences))를 제공받게 됩니다(be provided with).

이 작업을 중앙 집중화(centralizing)하고 재정적 지원(financial support)뿐만 아니라 행정 및 CBD 전문성(logistical and CBD expertise)을 제공함으로써, Royal College는 개별 학교, 프로그램, 그리고 프로그램 책임자들의 부담(burden)을 줄이는 것(reduce)을 목표로 했습니다(aimed).

 

코호트 접근 방식(cohort approach)으로 진행하기로 한 결정은 실용적(pragmatic)이었습니다. 전문과목 위원회에 자금과 전문성을 지원하겠다는 약속 때문에, 67개 위원회 모두와 동시에(simultaneously) 작업하는 것은 실현 불가능했습니다(not feasible). 서로 다른 전문과목들과의 순차적인 참여(sequential engagement)는 재정적 영향(financial impact)을 10년에 걸쳐 분산시켰습니다(spread). 또한 이는 한 번에 워크숍이나 CBD 구현에 적극적으로 참여하는(actively engaged) 전문과목의 수를 제한(limited)하여, Royal College가 지원 및 기타 자원(support and other resources)(임상 교육자, 교육 집필가(education writers), 교수 개발 지원 등)을 해당 전문과목들에 집중(target)할 수 있게 했습니다. 전문과목 위원회들은 언제 작업을 착수할지(initiate)에 대한 선호도를 확인하기 위해 설문 조사(polled)를 받았으며, 그들의 선호도 및 다른 Royal College 책무(commitments)와 관련된 전문과목 위원회의 업무량 같은 요인(factors)들이 코호트 내 배치(placement)에 고려되었습니다(were considered).

 

코호트 내 전문과목의 그룹화 및 순서 배열 또한 전략적(strategic)이었습니다. Royal College는 의도적으로(intentionally) "얼리 어답터(early adopters)"를 처음 두 코호트에 배치했습니다; 이 분야들은 이미 CBME 접근 방식으로의 준비 또는 변혁에 일부 참여했었습니다(participated)(예: EPA 생성 또는 시뮬레이션 기반 수련 및 평가(simulation-based training and assessment)를 위한 교육과정 개발). 처음 두 코호트는 또한 Royal College 전문과목들의 대표적인 혼합(representative mix)을 의도적으로 포함했습니다: 여기에는 전문과목과 세부 전문과목; 내과계, 외과계, 및 진단 분야(diagnostic disciplines); 그리고 전공의 수련 기간(durations)이 다양한(1년~5년) 분야들이 포함되었습니다 (보충 파일 1 참조). 이러한 신중한 배정(careful assignment)의 목표 중 하나는 CBD의 통일된 설계(uniform design)가 다양한 분야에 적용될 수 있는지(could be applied)를 검토하는 것(examine)이었습니다. 전문과목 간의 관계도 전략적 순서 배열의 또 다른 요인이었습니다; 예를 들어, 산부인과(Obstetrics and Gynecology)는 세 개의 세부 전문과목보다 먼저 CBD 변혁을 시작하도록 순서가 정해졌으며, 세부 전문과목들은 서로 동시에(at the same time) 시작하도록 순서가 정해졌습니다. 이러한 전문과목 "가족(families)"별 순서 배열은 소규모의 세부 전문의 그룹보다 앞서 해당 분야의 더 큰 교수진 그룹을 참여시킴(engaging)으로써 CBD 구현 작업을 촉진할 수 있다고 인식되었습니다(was perceived).

 

일련의 워크숍은 새로운 교육 표준을 생성하는 작업의 순서를 정하고(sequence) 이를 시간과 노력 면에서 감당할 수 있는 "덩어리(manageable chunks)"로 나누어, 전문과목 위원회의 참여를 촉진하고 위원회 구성원들이 임상 및 기타 책임에서 자리를 비우는 시간(time away from)을 최소화(minimizing)하도록 설계되었습니다. 워크숍은 약 6개월 간격(intervals)으로 열리는 3일짜리 세션 3회로 구성되었습니다. 각 워크숍은 표준 작업, 교수 개발, 그리고 CBD 구현 준비 간의 균형을 맞췄습니다(balanced). 전체 전문과목 위원회가 전체 워크숍 시리즈에 참석하도록 자금 지원(funded)을 받았으며, 각 위원회는 한두 명의 수련생뿐만 아니라 1~3명의 다른 초청 기고자(guest contributors)(예: CBME 또는 현장 기반 평가(work-based assessment)에 전문성이 있는 해당 분야 구성원)를 포함하도록 장려되었습니다(encouraged). Royal College 임상 교육자들이 워크숍을 진행했습니다(facilitated): 그들은 CBME를 설명하고, 전문과목 위원회를 워크숍 활동 순서에 따라 이끌었으며(led), CBD 프레임워크를 통해 그들을 안내했습니다. Royal College 전문과목 부서(Specialties Unit)는 워크숍을 위한 행정 지원(logistics)을 조직했고, 부서의 교육 집필가와 임상 교육자들은 해당 분야 RCEPAs, 평가 전략, 역량, 수련 경험, 그리고 인증 표준의 개발을 진전시키기 위해(to advance) 편집 지원(editorial support)과 콘텐츠 전문성(content expertise)을 제공했습니다. 일련의 활동에 대한 표준화(standardization)와 워크숍 및 표준 개발에 대한 Royal College의 지원은 업무량, 자원, 일정과 관련된 이해관계자(stakeholder)들의 우려를 해결하기 위한 것이었습니다.

여정에서 얻은 배움 (Learning Along the Journey)

워크숍의 설계 및 전달(design and delivery)은 전문과목 위원회 구성원들의 피드백, 지역 및 국가 프로그램 평가 노력(local and national program evaluation efforts), 워크숍을 진행하는 Royal College 팀의 관찰(observations), 그리고 COVID-19 팬데믹의 현실(realities)에 대응하여(in response to) 수정되었습니다.

 

원래 설계(original design)는 각각 교육과정 설계와 학습자 평가에 초점을 맞춘, 3일 길이의 워크숍 2회를 구상했습니다(envisaged).

  • 첫 번째 워크숍은 전문과목 위원회가 CanMEDS 2015의 형식, 내용 및 언어(format, content, and language)에 대한 업데이트를 포함하여 해당 분야의 역량을 수정(revision)하도록 안내하는 것으로 시작했습니다. 그룹은 분야의 전반적인 역량을 다시 쓰는 것(rewriting)으로 시작하여 역량 연속체의 각 단계에 대한 발달 이정표(developmental milestones)를 작성하는 것으로 나아갔습니다(moved on). 해당 분야를 위한 RCEPAs를 생성하는 것이 3일차의 초점이었습니다.
  • 두 번째 워크숍에서, 그룹은 RCEPAs를 다듬고(refined), 평가 계획(assessment plans)을 작성했으며, 프로그램이 제공해야 하는 수련 경험을 확인했습니다.

원래의 워크숍 계획은 종양내과(Medical Oncology)와 이비인후과-두경부외과(Otolaryngology — Head and Neck Surgery)라는 처음 두 분야의 경험 후 수정되었습니다. Royal College 팀과 전문과목 위원회 구성원 모두 다른 CBD 결정을 내리기 전에 역량과 이정표를 작성하는 것이 어렵다(difficult)고 보고했습니다(reported). 대신, 임상의들은 분야의 EPA를 식별하는 것이 더 쉽다는 것을 알게 되었는데, 이 활동이 그들이 자신의 업무와 전공의 수련에 대해 생각하는 방식에 더 맞춰져 있었기(attuned) 때문입니다. 또한 이 순서는 그러한 과업을 수행하는 데 필요한 역량의 식별을 촉진했습니다. 이 피드백은 임상의들이 자신의 업무와 기술을 공식적인 역량 프레임워크(formal competency frameworks)의 언어로 옮길 때(translating) 직면하는 어려움에 대한 발표된 보고서(published reports) [10, 11, 12]와 일치했습니다(concurred).

 

초기 경험은 또한 교수 개발의 시기와 순서(timing and sequencing)를 안내했습니다. 워크숍에는 전문과목 위원회 구성원들이 자신의 프로그램의 CBD 구현을 준비하도록 돕는 것을 목표로 하는(aimed to) 세션이 포함되었습니다. 초기 피드백은 변화 활동(change activities)의 양과 복잡성(volume and complexity)을 일선 교사(front-line teachers)들의 변화 수용 능력(capacity for change) 및 그들이 교수와 평가에 대한 새로운 접근 방식을 적용하는 시기와 균형을 맞추기(balance) 위해 구현 활동의 순서를 적절하게 정할 필요가 있음을 확인했습니다.

 

이러한 초기 경험들은 또한 두 번의 워크숍으로는 SED 작업을 완료하는 데(to complete) 충분한 시간을 제공하지 못한다는 것을 확인시켜 주었습니다.

 

CBD 워크숍 계획은 이 피드백을 통합하여(incorporate) 수정되었고, 3일짜리 워크숍 3회 시리즈가 되었습니다(표 2 참조).

 

표 2. 전문과목 교육 설계를 생성하기 위한 워크숍

기간 (DURATION) 워크숍 1 (WORKSHOP 1) 워크숍 2 (WORKSHOP 2) 워크숍 3 (WORKSHOP 3)
  3일 (3 DAYS) 3일 (3 DAYS) 3일 (3 DAYS)
참가자 개발 (Participant development) CBD란 무엇인가?

EPA란 무엇인가?
현장 기반 평가란 무엇인가?

역량 위원회(competence committees)란 무엇인가?
코칭(coaching)이란 무엇인가?

CBD에서 이정표(milestones)는 어떻게 사용되는가?
표준 개발 (Standards development) 진료 범위(Scope of practice)

수련의 성과(Outcomes of training)

단계를 통한 진전(Progression through stages)

RCEPAs 및 수련 경험의 첫 번째 초안(First draft)
다듬어진(Refined) RCEPAs

RCEPAs를 위한 평가 요건

역량 문서 검토
RCEPAs를 위한 다듬어진(Refined) 평가 계획

RCEPAs에 연결된 이정표

역량, 수련 경험, 및 인증 표준에 대한 최종 수정(Final revisions)
구현 준비 (Preparation for implementation) 다가올 변화에 대한 인식 구축(Build awareness)

지역 변화 관리 팀 구축(Build)
역량 위원회 수립(Establish)


교육과정 맵(curriculum map) 생성(Create)

지역 구현을 위한 전략 계획(strategic plan) 생성


일선 교사 및 전공의 오리엔테이션(Orient)
*각 워크숍은 Competence by Design (CBD)의 요소에 관한 전문성 개발(professional development), 해당 분야 교육 표준의 생성 또는 수정, 그리고 지역 구현 준비에 대한 안내(guidance)를 포함하는 활동들의 조합(combination)*이었습니다.
RCEPAs – 단계별 특화된(stage specific) Royal College 위임 가능한 전문 활동; 역량, 수련 경험, 및 인증 표준 – 분야별 Royal College 교육 표준을 상세히 설명하는(elaborating) 문서들.
약어: CBD = Competence by Design; EPA = 위임 가능한 전문 활동(entrustable professional activity); RCEPA = EPA에 대한 Royal College 접근 방식.
 
  • 첫 번째 워크숍(The first workshop)은 분야의 범위(scope)와 수련의 바람직한 성과(desired outcomes)를 기술하고(delineating), 역량 연속체(competence continuum)의 단계에 따른 수련생 책임(responsibility)의 순차적 진전(sequential progression)을 수립하며(establishing), 분야별 RCEPAs의 첫 번째 초안을 작성하고(producing the first draft), 각 단계에 대한 필수 수련 경험(required training experiences)을 수립하는 데 초점을 맞췄습니다(focused on).
  • 두 번째 워크숍(The second workshop)은 RCEPAs를 다듬고(refine), 역량 위원회(competence committees)가 RCEPA 달성 여부를 결정할 때(determining) 사용할 평가 계획(assessment plans)과 지침(guidelines)을 개발하는 데 사용되었습니다. RCEPAs를 개발하고 다듬는 작업은 전문과목 위원회 구성원들 사이에서 과업 수행에 필요한 기술(skills)에 대한 풍부한 논의(rich discussions)를 촉발했습니다(triggered). 임상 교육자(clinician educator)와 집필가(writer)로 구성된 Royal College 팀은 이러한 논의에서 나온 자료(material)를 사용하여 전문과목 위원회가 세 번째 워크숍이나 그 전에 검토할(to review) 이정표(milestones)와 역량(competencies)의 초안을 작성했습니다.
  • 세 번째 워크숍(The third workshop)의 목적(purpose)은 평가 계획 및 이정표가 포함된 RCEPAs 세트와, 역량, 수련 경험 및 인증 표준(standards of accreditation)을 포함한 분야 표준 등 전문과목 교육 설계(SED)의 모든 측면을 확정하는 것(finalize)이었습니다.

워크숍 사이사이에, 그룹을 지원하는(supporting) Royal College 집필가와 임상 교육자는 워크숍의 산출물(output)을 검토하고 수정했으며(reviewed and revised), 작업의 명확화(clarification)와 진전(advancement)을 위해 워크숍 참가자들을 참여시켰습니다(engaged).

 

CBD 구현(implementation)을 위한 준비(Preparations)순서가 정해져 있었습니다(were sequenced):

  • 변화에 대한 인식을 조성하는 방법(how to create awareness)은 첫 번째 워크숍에서,
  • 역량 위원회를 수립하고 운영하는 방법(how to establish and run)은 두 번째 워크숍에서, 그리고
  • 지역 CBD 구현(local CBD implementation)을 위한 교육과정 맵(curriculum map)과 전략 계획(strategic plan)을 생성하는 방법은 세 번째 워크숍에서 논의되었습니다.
  • 추가 웨비나(Additional webinars)는 CBD 구현 6개월 전(six months preceding)에 열리도록 일정이 잡혔으며(timed), 일선 교사(front-line teachers)와 신입 수련생(incoming trainees)을 오리엔테이션(orient)하는 방법에 초점을 맞췄습니다.

COVID-19 팬데믹의 시작(The onset of the COVID-19 pandemic)으로 인해 워크숍을 가상 환경(virtual setting)에서의 전달(delivery)을 위해 수정(modified)해야 했으나; 활동의 순서(sequence)는 유지되었습니다(maintained). Royal College가 대면 회의(in-person meetings)를 주최하지 않았던 2년의 기간 동안, 가상 워크숍으로의 전환(shift)을 통해 14개 분야가 CBD 교육 설계를 완료하고 4개 분야가 작업을 시작할 수 있었으며; 5개 분야는 모든 워크숍을 가상 형식으로 개최했습니다(held). 그러나 전문과목 위원회 구성원들은 대면 회의로 복귀하기를 열망했습니다(eager); 워크숍 참가자 대상 설문 조사(survey)는 서로 간의 네트워킹(networking), 실천 공동체 구축(building a community of practice), 그리고 직장 내 방해 요소 회피(avoiding workplace distractions)의 이점(benefits)을 포함하여 그들의 선호(preference)에 대한 이유를 확인했습니다.

 

마지막으로, 초기 코호트 분야들과 지역 및 국가 프로그램 평가 노력의 피드백에 기초하여(based on feedback) CBD 설계 요소에 대한 중요한 수정(important modifications)이 이루어졌습니다. RCEPAs의 구조(structure), CanMEDS 콘텐츠의 형식(format), 그리고 평가 전략의 선택(selection)에 변화가 있었습니다.

  • 초기 코호트는 많은 수(large number)의 RCEPAs를 생산했습니다; 구현 시, 이 많은 수는 수련생, 지도전문의(supervisors), 그리고 역량 위원회가 관리하고 추적하기에(manage and track) 어려움(challenge)이었습니다. 그 후, RCEPAs 개발은 분야의 필수 과업(essential tasks)에 초점을 맞추었고, RCEPA가 다양한 양상(presentations)(예: 외래, 병동, 또는 응급실과 같은 다른 환경(settings), 아동, 성인, 또는 노인과 같은 다른 연령(ages), 심장, 호흡기, 또는 신장과 같은 다른 질환(conditions))에 걸쳐 관찰될 수 있도록(to be observed) 맥락 메뉴(context menus)가 통합되었습니다(incorporated); 이는 분야당 RCEPAs의 전형적인 수(typical number)를 30~50개로 줄였습니다(reduced).
  • 또한, 짧은 CanMEDS 역량 진술 형태의 발달 이정표(developmental milestones)가 지도전문의가 해당 활동의 수행(performance)과 관련된 기술에 대해 수련생을 코칭(coach)하기 위한 프롬프트(prompt)로서 RCEPAs연결되었습니다(linked). 피드백을 통해 이러한 이정표들이 평가가 완료되는 디지털 플랫폼(digital platforms)에서 잘 작동하려면 간결해야(concise) 할 필요성이 확인되었습니다; 따라서 Royal College는 이정표의 장황함(wordiness)뿐만 아니라 그 숫자도 제한했습니다(limited) (보충 파일 2: RCEPA 및 이정표 수정 예시 참조).
  • 더 나아가, 다면 평가 방법(multisource feedback methods), 환자 입력(patient inputs), 그리고 다부분 평가 도구(multi-part assessment tools)는 현재 환경과 디지털 플랫폼을 고려할 때 실행하기에(to be executed) 너무 복잡하다(complex)는 것이 밝혀졌습니다; 이에 대응하여(in response), RCEPA 평가 전략이 조정되었습니다(adjusted).
  • 이런 방식으로, 초기 코호트 분야의 경험은 중요한 반복적 변화(iterative changes)에 정보를 제공했습니다(informed).

코호트 접근 방식의 이점과 과제 식별 (Identifying Benefits and Challenges of the Cohort Approach)

Royal College는 코호트 접근 방식을 통해 CBD의 구현을 10년에 걸쳐 분산하고 순서를 정한(spread and sequence) 결정에 대해 비판과 칭찬을 동시에(both criticized and praised) 받았습니다. 이 접근 방식의 몇 가지 핵심 이점(key benefits)은 이미 설명되었습니다(elucidated):

  • 초기 피드백에 기초하여 워크숍을 수정 및 조정하는 것;
  • 재정적 영향을 시간에 따라 분산하는 것; 그리고
  • 위원회에 향상된 지원(improved support)을 제공하는 것입니다.

코호트 접근 방식은 또한 전문과목 위원회의 노력을 지원하는 Royal College 팀 내에 전문성(expertise)을 개발할 시간을 제공했습니다. 각 위원회는 SED 과정을 단 한 번만 겪었지만, 임상 교육자, 집필가, 행정가로 구성된 Royal College 팀은 내과계, 외과계, 진단 분야의 다양한 분야와 함께 그 과정에 반복적으로 노출되었고(repeated exposures) 경험을 쌓았습니다. 이는 이전 코호트로부터 관련 작업(relevant work)을 공유하고(sharing) 여러 분야에 걸쳐 유사한 CBD 표준의 일부 측면(예: 입원 환자 서비스를 이끄는 것(leading)에 대한 EPA의 표준 문구(standard wording))을 표준화함(standardizing)으로써 위원회의 업무를 효율화하는(streamline) Royal College의 능력을 촉진했습니다(facilitated).

 

그러나, CBD 변혁에 대한 긴 접근 방식(lengthy approach)은 학교와 프로그램이 CBME로의 변혁과 동시에 이전의 수련 시스템을 관리해야 했던 기간(period)을 연장시켰습니다(extended). 새로운 수련 패러다임은 다년 프로그램(multi-year programs)에서 이미 수련 중인 전공의가 아닌 신입 전공의에게만 적용될 것이기 때문에 이것은 어느 정도 불가피했습니다(inevitable); 그러나 전문과목 코호트에 걸쳐 CBD 변혁의 순서를 정한 결정은 그 영향의 지속 기간(duration)을 늘렸습니다(prolonged). 이는 한 교육 패러다임을 따르는 수련생들이 다른 교육 패러다임의 프로그램과 상호작용할 때 과제(challenges)를 만들어냈습니다(created). 예를 들어,

  • CBD 수련생들이 아직 CBD를 사용하기 시작하지 않은 분야에서 "타과 파견(off-service)" 로테이션을 할 때, 그곳의 지도전문의들은 RCEPAs와 평가 플랫폼의 사용에 익숙하지 않았습니다(not familiar).
  • 또 다른 예는 한 전문과목에서 다른 전문과목으로의 전공의 전과(resident transfer), 그리고 교육 패러다임들이 서로 다른 진척도 척도(measures of progress)(즉, 로테이션의 성공적 이수(successful completion) 대 RCEPA 성취 및 역량 진전의 문서화(documentation))를 사용하고 있을 때 그 시점까지의 수련에 대한 학점(credit)을 적용하는 데 있었습니다.
  • 구현의 연장된 기간은 또한 학교가 인증 검토(accreditation reviews) 중에 일부 프로그램은 "구(old)" 요건을 따르고 일부는 새로운 CBD 요건을 따르는 두 세트의 표준을 관리해야 함을 의미했습니다.

10년에 걸친 과정과 전문과목 위원회 자원봉사자들의 정상적인 이직(normal turnover)은 또한 전문과목 위원회 내에 멤버십과 리더십의 변화(membership and leadership changes)가 있었음을 의미했고, 이는 해당 분야에서 CBD가 완전히 구현되기 전에 결정과 계획에 대한 "조직의 기억(corporate memory)"에 영향을 미쳤습니다(impacted). 마지막으로, 더 많은 분야가 CBD 구현 단계에 도달함에 따라(reached), Royal College의 관심, 자원, 및 역량(attention, resources, and capacity)은 구현 과정에 있는 전문과목 위원회를 지원하는 것과 워크숍 시리즈에 여전히 참여하고 있거나 참여를 기다리고 있는(waiting to engage) 위원회를 지원하는 것 사이에서 나뉘었습니다(divided).

 

CBD 구현 일정에는 몇 가지 예상치 못한 지연(unexpected delays)이 있었습니다.

  • 처음 세 코호트의 경우, 학교들의 준비 상태(readiness)가 구현을 진행하는(move forward) 능력을 제한했습니다. 이 지연의 결과로(As a result of), 일부 초기 코호트 분야들은 변화 과정에서 이탈했으며(disengaged), 이는 프로그램 및 교수진의 준비 상태에 추가적인 과제(further challenges)를 초래했습니다. 워크숍에 참여하는 분야의 규모(volume)가 증가함에 따라, 팀 내 임상 교육자와 교육 집필가의 이직 외에도 이니셔티브를 지원하는
  • Royal College 팀을 확장하는 데(expanding) 있어서의 과제들이 계획된 출시(rollout)를 계속하는 Royal College의 역량을 제한했습니다; 후기 코호트들의 일정은 따라잡기(catch-up)를 허용하고 이니셔티브의 지속적인 지속가능성(ongoing sustainability)을 보장하기 위해 수정되었습니다.
  • COVID-19 팬데믹은 전문과목 위원회 구성원들이 건강 관리 요구 및 전달(health care needs and delivery)의 변화라는 현실과 수련생들의 요구에 자신의 임상 진료를 적응시키는 것(adapting)을 우선시함에 따라(prioritized) 워크숍 전달에 6개월간의 중단(hiatus)을 초래했습니다; Royal College는 가상 작업 환경으로 전환했습니다. 팬데믹에 큰 영향을 받은(heavily impacted) 분야(예: 공중보건 및 예방의학(Public Health and Preventive Medicine))의 워크숍 및 CBD 구현 참여에 대한 가용성 및/또는 의향(availability and/or willingness)은 코호트 일정에 추가적인 지연을 초래했습니다.

목표 달성 (Achieving the Goal)

변혁을 위한 로드맵에서 Royal College가 내린 결정들은 CBD 교육 설계의 매개변수(parameters) 내에서 수련 표준을 개발하는 데 필요한 작업의 양을 감당할 수 있게 했습니다(enabled). 임상 교육자, 집필가, 행정가로 구성된 소규모 팀이 전문과목 위원회 자원봉사자들과 함께 250회 이상의 워크숍을 촉진할 수 있었습니다. CBD 교육 설계는 광범위한 내과계, 외과계, 진단 전문과목 및 세부 전문과목의 수련 요구를 충족하도록(meet the needs) 성공적으로 적응되었습니다.

 

첫 번째 CBD 워크숍은 2014년 9월 종양내과와 함께 열렸습니다. 2017년 7월, 수련 프로그램에 CBD 교육 설계를 공식적으로 구현한 첫 번째 분야는 마취통증의학과(Anesthesiology)와 이비인후과-두경부외과였습니다. 2023년 7월 현재(As of), (67개 중) 65개의 전문과목, 세부 전문과목, 및 특별 프로그램이 CBD로의 변혁에 참여했습니다. 그 65개 분야 중 61개가 전문과목 교육 설계의 생성을 완료했고, 53개가 수련 프로그램에 CBD를 구현했으며, 24개 분야에서 이 패러다임으로 수련한 후 졸업한 수련생을 배출했습니다(have had trainees graduate).

결론 (Conclusion)

이 논문은 캐나다의 졸업 후 전문의 교육 시스템을 재편한(reshaped) 혁신적인 변화 이니셔티브를 출범하기 위해(to launch) Royal College가 취한 접근 방식을 기술합니다(describes). 우리는 이 접근 방식을 계획하는 데 관련된 고려 사항(considerations)을 특징지었고(characterized), 이 변화를 수행하는 방법(how to undertake)에 대한 결정을 안내한(guided) 원칙들을 기술했으며, 그러한 결정들이 과정과 현재까지의 성과에 미친 영향을 설명했습니다. CBME로의 변화나 복잡한 PGME 환경 내에서 어떤 주요 이니셔티브(major initiative)를 계획하고 있는 다른 관할권(jurisdictions)은 다음 사항을 고려해 볼 수 있습니다:

  • 파트너들과 일찍 그리고 자주(early and often) 참여하는 것을 포함하여, 시작 단계와 과정 전반에 걸쳐 변화 관리(change management)의 원칙과 관행을 통합하는 것(Incorporating).
  • 이니셔티브를 PGME 시스템의 모든 부분에 걸쳐 동시에 구현할지, 아니면 순차적으로 구현할지 명시적으로 결정하는 것(Explicitly deciding). 각 접근 방식에는 장점(merits)이 있습니다; 우리는 구현의 순서를 정한 Royal College 결정의 이점과 과제 일부를 기술했습니다.
  • 만약 순차적 접근 방식(sequential approach)이 선택된다면, 참여 순서를 목적에 맞게 선택하는 것(purposefully select) (예: 얼리 어답터 먼저, 분야의 혼합).
  • 지속적인 질 향상(continuous quality improvement)을 과정에 체계적으로 통합하는 것(Systematically incorporating); 여기에는 피드백을 수집하는 방법을 수립하고, 적응(adaptation)을 가능하게 하기 위해 의도된 결과와 의도하지 않은 결과(intended and unintended consequences)를 식별하고 해석하는 것(interpreting)이 포함됩니다.
  • 과정에 대한 전문성을 가진 사람뿐만 아니라 내용 전문가(content experts)참여시키는 것(Involving). 우리의 경우, 전문과목 위원회가 해당 분야에 대한 내용 전문성을 제공한 반면, Royal College 임상 교육자와 집필가는 CBD 교육 설계에 대한 전문성을 제공했습니다. 전문성의 조합(combination)은 작업을 효율화했고, CBD 교육 설계와의 정렬(alignment)을 보장했으며, 67개 분야 전반에 걸쳐 일관성과 통일성(consistency and coherency)을 제공했습니다.
  • 교육 설계에 대한 엄격한 고수(strict adherence)와 다른 분야나 지역적 맥락(local contexts)을 위한 유연한 적응(flexible adaptation) 사이의 균형을 맞추는 것; 공유된 공통 요소(shared common elements)는 자원, 모범 사례(best practices), 그리고 학습한 교훈의 공유를 촉진할 수 있습니다.
 
 

 

 

 

 

Perspect Med Educ. 2024 Mar 18;13(1):201-223. doi: 10.5334/pme.1096. eCollection 2024.

Competence By Design: a transformational national model of time-variable competency-based postgraduate medical education

 

 

제목: 🇨🇦 캐나다는 어떻게 전공의 수련을 확 바꿨을까? '설계에 의한 역량(CBD)' 완벽 정리!

안녕하세요! 오늘은 의학교육 분야에서 정말 핫하고 중요한 논문 하나를 소개해드리려고 해요. 바로 캐나다의 전공의 교육 시스템을 송두리째 바꾼 거대한 프로젝트, 'Competence By Design (CBD)'에 대한 이야기입니다.

우리가 흔히 "전공의 1년차, 2년차..." 이렇게 '시간'이 지나면 다음 단계로 넘어가는 시스템에 익숙하잖아요? 그런데 캐나다 왕립내과외과대학(Royal College)은 이런 20세기 방식을 과감히 버리고, 역량(Competence) 중심의 새로운 모델을 국가 차원에서 도입했습니다.

도대체 어떤 내용인지, 핵심만 쏙쏙 뽑아서 정리해 드릴게요! 🧐


1. 왜 바꾸게 된 거죠? 🤔

기존의 전공의 교육(Postgraduate Medical Education, PGME)은 '시간 기반(Time-based)'이었어요. 정해진 기간을 채우면 수련을 마치는 식이었죠. 하지만 이런 방식에는 몇 가지 문제가 있었습니다.

  • 졸업생마다 실력(역량) 차이가 너무 큼
  • 환자 안전(Patient Safety)에 대한 우려
  • 전공의에 대한 직접 관찰과 피드백 부족 ("그냥 알아서 배워" 식?)
  • 평가가 점수 매기기에 급급함

그래서 캐나다는 역량 바탕 의학교육(Competency Based Medical Education, CBME)을 도입하기로 결심합니다. 단순히 이론에 그치지 않고, 시스템 전체를 뜯어고치는 혁신을 감행한 것이죠!

"CBD는 강조점을 수련에 소요된 시간에서 졸업생이 성취한 역량으로 이동시킵니다." (CBME shifts the emphasis from time spent in training to competencies achieved by graduates.)


2. CBD의 핵심! 무엇이 달라졌나? 💡

CBD는 총 14가지의 혁신적인 요소들을 '묶음(Bundle)'으로 제공하는데요, 그중 가장 중요한 몇 가지를 살펴볼게요.

1) 수련 단계의 변화 (Stages of Training)

더 이상 "1년차, 2년차"가 아닙니다. 수련 과정을 4단계로 나눴어요.

  1. 전공의 전환기 (Transition to Discipline)
  2. 기초기 (Foundations)
  3. 핵심기 (Core)
  4. 진료 전환기 (Transition to Practice)

각 단계를 통과하려면 시간이 지나는 게 아니라, 그 단계에 필요한 역량을 증명해야 합니다.

2) 신뢰할 수 있는 전문 활동 (EPAs)

이 용어 많이 들어보셨죠? EPAs (Entrustable Professional Activities)는 "교수님이 믿고 맡길 수 있는 업무 단위"를 말해요. 예를 들어 '단순 봉합하기'부터 '복잡한 수술 집도하기'까지, 수련 단계에 맞는 구체적인 업무를 직접 관찰(Direct Observation)하고 평가합니다.

3) 코칭과 성장 마인드셋 (Coaching & Growth Mindset)

평가는 "너 탈락!"이 아니라 "어떻게 하면 더 잘할 수 있을까?"를 알려주는 코칭(Coaching)으로 변했습니다.

"학습에 대한 발달적 관점; 모든 학습자는 역량을 향한 여정에 있으며, 어떤 주어진 역량은 성취되었거나 아직 성취되지 않은 상태입니다." (A developmental view of learning; every learner is on a journey to competence, and any given competency is achieved or not yet achieved.)

즉, 실패가 아니라 "아직 도달하지 못함(Not yet)"인 것이죠. 멋지지 않나요? 🌱

4) 역량 위원회 (Competence Committees)

한 명의 지도전문의가 전공의의 운명을 결정하지 않습니다. 여러 명의 교육자가 모인 위원회에서 다양한 데이터(포트폴리오)를 보고 전공의의 진급 여부를 결정합니다. 훨씬 공정하겠죠?


3. '시간'은 이제 중요하지 않나요? ⏳

아니요, 시간은 여전히 중요합니다. 하지만 그 의미가 달라졌어요. 예전에는 시간이 '목표'였다면, 이제는 '도구'가 되었습니다.

"시간은 학습을 위한 자원이지, 수련 완료의 기준이 아닙니다." (Time is a resource for learning, not the criterion for completion of training.)

 

역량을 빨리 채우면 이론적으로는 조기 졸업도 가능하고, 부족하면 시간을 더 써서라도 역량을 채우고 나가야 한다는 뜻입니다. (이게 바로 '시간 가변적' 모델의 핵심!)


4. 물론, 어려움도 있었어요 💦

논문에서는 솔직하게 시행착오도 고백하고 있어요.

  • 전공의들의 스트레스: 수많은 EPA 평가를 받아야 한다는 압박감이 있었대요. (마치 할당량 채우기처럼 느껴지기도 했다고...)
  • 기술적 문제: 전자 포트폴리오(Electronic Portfolios) 시스템이 완벽하지 않아서 고생했다고 합니다.
  • 팬데믹: 하필 코로나19가 터지면서 구현에 어려움이 있었지만, 오히려 유연한 시스템 덕분에 수련을 이어갈 수 있기도 했답니다.

📝 요약하며

이 논문은 캐나다의 사례를 통해 역량 바탕 의학교육(CBME)이 단순히 이상적인 이론이 아니라, 국가적 차원에서 실제로 구현 가능한 시스템임을 보여주었습니다.

결국 이 모든 변화의 목적은 단 하나입니다. "환자에게 더 안전하고 효과적인 진료를 제공할 수 있는 의사를 길러내는 것!"

우리나라의 의학교육도 이런 흐름에 맞춰 어떻게 변화해 나갈지 기대가 됩니다. 😊

 


서론 (Introduction)

전공의 교육(Postgraduate medical education, PGME)은 의사들이 사회에 봉사(serve society)하고 진료(practise)하는 데 필요한 역량 수준(level of competence)을 성취하도록 준비시키는 필수적인 사회적 과업(essential societal enterprise)으로 묘사되어 왔습니다 [1]. 효과적인 PGME 시스템(effective PGME system)이 없다면, 대중(population)은 충분한 의료 인력(sufficient health workforce)이 부족하거나 진료를 위한 준비가 충분하지 않은(not adequately prepared) 의사 집단(cadre of physicians)을 갖게 될 수도 있습니다. Osler, Halsted, 그리고 Flexner에 의해 크게 영향을 받은(heavily influenced) 20세기 의학교육 모델(20th century model of medical education)은 수십 년에 걸쳐 더 많은 교육적 구조(educational structure)를 점진적으로 통합한(progressively incorporated) 도제 모델(apprenticeship model)로부터 발전했습니다(evolved out of) [2, 3]. 하지만 이 모델은 21세기에는 부적절하며(inadequate) [4-10] 사회적 책무성(social accountability)에 더 큰 관심을 기울일 필요가 있다는 비판을 받아왔습니다 [11, 12]. 이에 대한 대응(In response)으로, 새로운 성과 지향적(outcomes-oriented)이고 역량 바탕 접근법(competency-based approaches)들이 지지를 받았습니다(endorsed) [13-18]. 전 세계적으로 역량 바탕 의학교육(competency based medical education, CBME)은 보건 전문직(health professions) 분야에서 주요한 혁신적 움직임(major transformational movement)이 되었습니다 [19-23].

 

CBME는 "역량(competencies)이라는 조직화된 틀(organizing framework)을 사용하여 교육 프로그램의 설계(design), 실행(implementation), 평가(assessment) 및 프로그램 평가(evaluation)를 수행하는 성과 바탕 접근법(outcomes-based approach)"으로 정의되어 왔습니다 [18]. 보건 전문직 교육(health professions education, HPE)에 대한 이러한 접근 방식은 세계보건기구(World Health Organization)의 주요 보고서로 거슬러 올라가며(extends back to) [24], 이후 많은 저자와 조직들에 의해 더욱 발전되었습니다(further developed). International CBME Collaborators는 현대적 CBME 모델(modern CBME model)의 다섯 가지 요소(five elements)(van Melle 핵심 구성요소[Core Components])를 제안했습니다:

  • 졸업생을 위한 역량 프레임워크(competency framework)로 조직된 수련 성과(Training outcomes)
  • 초심자(novice)에서 전문가(expert)로 이어지는 정의된 수련의 진척(Defined progression of training)
  • 학습자의 요구(needs of learners)를 충족시키기 위한 맞춤형 학습 경험(Tailored learning experiences)
  • 역량 성취(competency achievement)에 초점을 맞춘 교수(Teaching)
  • 프로그램식 평가(Programmatic assessment) [25]

많은 국가의 PGME 시스템들이 CBME를 채택(adopt)하는 방향으로 움직여 왔습니다 [26-31]. 이러한 움직임을 주도하는 것(Driving this movement)은 현대의 수련(contemporary training)에 대한 여러 우려와 PGME 설계를 향상시킬 수 있는 기회(opportunities to enhance)들입니다.

  • 환자 안전 위험(Patient safety risks) [32-34],
  • 졸업생 역량의 변동성(variability in graduate competence) [35-38],
  • PGME로의 진입/내부/종료 과정의 전환(transitions)과 관련된 문제들 [39-43],
  • 부적절한 관리감독(inadequate supervision) 및 전공의 업무에 대한 불충분한 직접 관찰(insufficient direct observation) [44-52],
  • 현장 기반 평가(workplace-based assessments) 및 진급 결정(promotion decisions)에 대한 우려 [53-59],
  • 임상 평가에서의 형평성 결여(lack of equity) [60, 61], 그리고
  • 적거나 빈약한 피드백(poor feedback) [62-67]
    • ...등은 교육 리더들이 해결하고자 노력해 온 PGME의 중요하고 반복적인 난제(important recurring challenges)들의 사례입니다.

동시에,

  • 프로그램식 평가(programmatic assessment) [68, 69],
  • 신뢰할 수 있는 전문 활동(entrustable professional activities, EPAs) [70, 71],
  • 새로운 코칭 피드백 모델(coaching feedback models) [72, 73],
  • 의도된 연습(deliberate practice)완전 학습(mastery learning) [74, 75],
  • 역량 위원회(Competence Committees) [76, 77],
  • 평가 소프트웨어(assessment software) [78-80],
  • 학습 분석(learning analytics) [81], 그리고
  • 새로운 인증 접근법(novel approaches to accreditation) [82]
  • ...과 같은 혁신과 발전들은 모두 의학교육에서의 최상의 근거(best evidence in medical education)를 실행함으로써 더 나은 PGME를 위한 중대한 기회(significant opportunities)를 제시합니다(표 1 참조).

표 1. Competence by Design 프로젝트의 동인 (Drivers of the Competence by Design project)

PGME 시스템의 우려되는 문제들 (ISSUES OF CONCERN IN PGME SYSTEM) PGME 시스템 향상을 위한 기회 (OPPORTUNITIES FOR PGME SYSTEM ENHANCEMENT)
보건 전문직 및 교육 시스템의 사회적 책무성(social accountability) 강화에 대한 대중의 기대(Public expectations) [11, 12] 수련 성과(outcomes of training)에 대한 더 큰 집중 요구 [14-18]
전공의 수련 중 및 이후 제공되는 진료와 관련된 환자 안전 우려(Patient safety concerns) [32-34] 주요 의료 단체(예: 세계보건기구)에 의한 성과 지향적(outcomes-oriented), 역량 바탕 시스템(competency-based systems)으로의 전환 권고 [90-92]
의과대학 졸업생 역량의 용납할 수 없는 변동성(unacceptable variability)에 대한 증거 [35-38] 발전의 토대가 될 수 있는 성공적인 CBME 구현 사례(successful CBME implementations)들 (예: 토론토 정형외과 [93], CFPC [94], ACGME [91])
수련 중인 전공의에 대한 직접 관찰(direct observation) 부족

부적절한 관리감독(inadequate supervision) 사례들 [44-52]
신뢰할 수 있는 전문 활동(entrustable professional activities, EPAs)의 사용은 더 많은 교수진이 전공의의 진척 상황에 대해 더 나은 의견(better input)을 제공하도록 허용함 [70, 71]
식별된 약점을 해결하지 못함 ("유급의 실패[failure to fail]")

전문의 자격 시험 불합격(Certification examination failures)

격차(gaps)나 진료 준비 부족(unreadiness for practice)의 증거에도 불구하고 진급됨

진급 의사결정(promotion decision-making)에 대한 우려

부적절한 현장 기반 평가(inadequate workplace-based assessments)에 대한 우려

현장 평가(workplace assessment)에 참여하는 지도전문의가 거의 없음 [53-59]
프로그램식 평가(programmatic assessment)의 사용은 평가 결정(assessment decisions)을 향상시킬 수 있음 [68, 69, 95]

의학교육에 학습 분석(learning analytics)을 적용하면 역량을 향해 나아가는 전공의의 진척(progression)에 대한 새로운 통찰력을 얻을 수 있음 [81, 96]
현장 평가(workplace assessments)가 부담스럽다는(burdensome) 보고 [53] 전자 포트폴리오 소프트웨어(electronic portfolio software)의 개발은 평가의 디지털화(digitization) 및 문서화를 가능하게 함 [78-80]
전공의에게 제공되는 피드백(feedback)의 질(quality)과 빈도(frequency)가 부적절하다는 보고 [62-67] 의학교육을 위해 개발된 새로운 코칭 모델(coaching models) [72, 73]

CanMEDS 프레임워크 업데이트는 지도전문의 피드백을 위한 비계(scaffolding)로 사용될 수 있는 발달적 이정표(developmental milestones)를 통합함 [88]
현장 평가(workplace assessment)에 대한 전공의의 불안(anxiety) 보고 [97, 98] 성장 마인드셋(Growth mindset)은 학습을 향상시킬 수 있음 [99-101]
전공의 수련으로의 진입, 고년차 전공의 책임으로의 전환, 그리고 개원/진료 현장으로의 전환(transitions) 문제들 [39-43, 103] 완전 학습(Mastery learning) 방법은 학습을 향상시킴 [74, 75]

수련 단계(Stages of training)는 PGME로의 진입 및 종료 시의 전환(transitions)을 명시적으로 다룰 수 있게 함 [25, 103]
전공의의 참여 부족(disengagement)에 대한 보고 [104] 수련에 대한 더 큰 전공의 참여(Greater trainee engagement)는 학습 성과를 향상시킴 [105]
평가 불평등(assessment inequity)에 대한 보고 [60, 61]

'학습의 평가(assessment of learning)' 접근법이 전공의의 발달(development) 대신 문제가 있는 전공의를 색출하는 것을 지나치게 강조한다는 우려 [77]
수련에 대한 발달적 관점(developmental view)은 모든 전공의가 역량까지 진척하도록 보장하기 위해 수련과 평가를 맞춤화(tailoring)할 수 있게 함 (학습을 위한 평가[assessment for learning]) [68]
수련을 향상시키지 못할 수도 있는 과정 지표(process measures)에 지나치게 초점을 맞춘 프로그램 리뷰 [106] 새로운 인증 시스템(accreditation systems)은 프로그램 성과(program outcomes)와 지속적 개선(continuous improvement)에 더 큰 강조점을 둠 [106, 107]

의학교육에 학습 분석(learning analytics)을 적용하면 프로그램 성과(program performance)에 대한 새로운 통찰력을 얻을 수 있음 [108]

ACGME Accreditation Council for Graduate Medical Education (미국 전공의 수련 교육 인가 위원회); CBME competency based medical education (역량 바탕 의학교육); CFPC College of Family Physicians of Canada (캐나다 가정의학회); PGME postgraduate medical education (전공의 교육).

 

핵심 구성요소(Core Components)를 사용함으로써, CBME 설계는 이러한 문제들과 기회들을 다룰 수 있습니다(address). CBME는 강조점(emphasis)을 수련에 소요된 시간(time spent in training)에서 졸업생이 성취한 역량(competencies achieved)으로 이동시킵니다(shifts).

  • 졸업생에게 요구되는 역량의 수준과 유형에 대한 명확한 진술(Clear statement)은 학습자와 교수자의 주의(attention)를 역량에 대한 공유된 정신 모형(shared mental model)으로 향하게 합니다(directs) [83].
  • 역량 달성에 대한 발달적 접근(developmental approach)은 의도적으로 순서가 정해진(deliberately sequenced) 수련 경험코칭 피드백(coaching feedback)에 반영됩니다.
  • 더 빈번하고(More frequent) 질 높은 피드백(better quality feedback)은 학습과 전공의 만족도(trainee satisfaction)를 향상시킵니다.
  • 다양한 평가자(assessors)와 도구들에 의해 기여된 많은 데이터 포인트(data points)를 가진 프로그램식 평가(programmatic assessment)는 학습자의 진척(learner progress)에 대해 더 많은 정보를 바탕으로 한(better informed), 그리고 더 공정한 의사결정(equitable decision-making)을 가능하게 합니다.
  • 종합하면(Combined), 이러한 CBME 설계 요소들은 전공의들이 수련의 각 단계(each stage of training)에 대해 진정으로 준비되도록 보장하고, 안전하고 효과적인 진료(safe and effective care)를 제공할 수 있는 잠재력(potential)을 가지고 있습니다 [25].

오랫동안 지속된(longstanding) 보건 전문직 교육(HPE) 설계에 대한 이러한 변화들은, CBME가 근거 기반(evidence base)이 없는 주장들의 집합(set of assertions)이라거나, 기저에 깔린 가정(underlying assumptions)이 타당하지 않으며(invalid), 국가적 규모(national scale)에서의 CBME에 대한 개념 증명(proof of concept)이 부족하다는 비판을 초래했습니다(led to criticisms) [84, 85]. 전 세계적으로 진행 중인(underway) 대규모 CBME 구현 프로젝트(large-scale CBME implementation projects)들이 있지만, 문헌(literature)에 기술된 것은 거의 없습니다. 다양한 환경(variety of settings)에서의 CBME 구현(implementation)을 설명하는 근거 기반(evidence base) 없이는, 이러한 성과 중심 접근법(outcome-focused approaches)들은 열망적인(aspirational), 이론적인(theoretical), 혹은 근거 없는(unfounded) 것으로 간주될 수 있습니다.

 

우리는 국가적 전공의 교육(national PGME) 환경을 다학제적(multi-specialty)이고, 시간 가변적인(time-variable) 역량 바탕 시스템으로 변화시키는 변혁적 변화(transformational change)에 대해 기술합니다. CBME의 van Melle 핵심 구성요소(Core Components)가 전문과목 PGME의 기초(basis)로 사용되었습니다. 이 주요한 시스템 개혁 프로젝트는, 시간 기반 수련(time-based training)에 의한 역량 성취에 기초했던 이전 시스템과 구별하기 위해(distinguish) '설계에 의한 역량(Competence by Design, CBD)' [86]이라 명명되었습니다. 이 논문은 CBD라는 국가적 혁신(national innovation)을 형성한 이론적 근거(rationale), 동인(drivers), 그리고 교육적 개입들의 묶음(bundle of educational interventions)에 대한 개요(overview)를 제공합니다. 이 특별 호(special collection)에 실린 동반 논문(Accompanying papers)들은 Competence by Design의 특정 측면들을 탐구하는 반면, 이 논문은 CBME 이론을 실제(practice)로 옮기는 데 관련된 목표(aims)와 혁신(innovations)에 초점을 맞춥니다.

맥락 (Context)

캐나다에서 PGME 시스템은 의과대학(university medical schools), 수련 병원(academic hospitals), 지역사회 임상 교육 센터(community clinical teaching centres), 정부 자금 지원 기관(government funders), 그리고 규제 기관(regulatory bodies)이 뒤얽힌 네트워크(interwoven network)입니다 [87]. 캐나다 왕립내과외과대학(Royal College of Physicians and Surgeons of Canada, 이하 Royal College)은 가정의학(family medicine)을 제외전문과목 의학(specialty medicine)의 표준(standards), 인증(accreditation), 자격 인정(certification), 그리고 역량 유지(maintenance of competence)를 감독하기 위해 연방 의회(federal Parliament)의 법령에 의해 창설된 전문과목 표준 기구(specialty standards body)입니다. 현대적 환경(contemporary landscape)에서, Royal College는 기능을 수행하기 위해 PGME 시스템 내의 모든 이해관계자(stakeholders) 및 기관들과 협력합니다(partners). 이 논문에서, 우리는 당시 관여했던 Royal College의 설계(design), 정책(policy), 그리고 표준(standards) 팀의 관점(perspective)에서 변혁적인 의학교육 변화의 초기 단계(early stages)를 제시합니다. 수천 명의 다른 개인들이 이 변혁(transformation)에 기여했으며, 그들 또한 이에 대한 관점을 가지고 있을 것입니다.

 

20세기 캐나다 PGME는 전형적인 북미식 설계(North American design)를 가지고 있었습니다. 의과대학 졸업 후(Following medical school graduation), 수련생들은 임상 현장(clinical settings)에서의 시간 기반 수련(time-based training) 시스템으로 진입했습니다. 캐나다의 수련은 협력하는 세 개의 협회(Colleges)에 의해 감독됩니다:

  • Royal College (67개 전문과목 및 세부전문과목),
  • 캐나다 가정의학회(College of Family Physicians of Canada, 가정의학), 그리고
  • 퀘벡 의사협회(Collège des médecins du Québec, 퀘벡 지역에서 인정된 모든 분과).

의과대학을 갓 졸업한(Directly from medical school), 가정의학 이외의 분야 수련생들은 일차 전문과목(primary specialties)의 자격 인정(certification)으로 이어지는 Royal College 프로그램에 진입했습니다. 모든 캐나다의 전문과목과 세부전문과목은 CanMEDS 역량 프레임워크(CanMEDS competency framework) [88, 89]를 중심으로 구조화되었습니다.

  • 수련은 전형적으로 4주에서 52주에 이르는 특정 임상 서비스(clinical services)에 대한 몰입(immersion)과, 강의실, 술기 워크숍(skills workshops), 시뮬레이션 세션, 또는 실험실에서의 구조화된 정기 교육(structured regular instruction)으로 구성되었습니다.
  • 경험들(Experiences)은 수련생들이 해당 수련 분과와 관련된 정의된 역량(defined competencies)을 습득하고, 자격 시험(certification examinations)을 준비하며, 필요한 임상 서비스를 제공하고, 자격 증명(credentials)을 위한 모든 기준을 충족할 기회를 제공하도록 선택되었습니다.
  • 평가는 가장 일반적으로 4주 단위의 수련 블록(block)이 끝날 때마다 단일 지도전문의(single supervisor)에 의해 작성되는 CanMEDS 기반 후향적 서식(CanMEDS-based retrospective form)을 수반했습니다(entailed). 일부 수련 기관(training sites)은 특별한 목적에 따라(on an ad hoc basis) 다른 평가 방법(예: 객관구조화진료시험[OSCEs])을 통합했습니다.
  • 전형적으로, Royal College 수련생은 최종적인, 고부담(high-stakes) Royal College 전문의 시험(specialty examination)을 치르기(writing) 전까지 4년에서 6년 동안 매년 13개의 블록을 순환(rotate)했습니다. 성공적인 수련생들은 그 후 해당 전문과목에서 자격을 인정받아(certified), 진료(practice)로 이동하거나, 세부전문과목(subspecialty) 수련 프로그램을 시작하거나, 덜 구조화된 추가적인 전임의 수련(fellowship training)을 수행할 수 있게 되었습니다.

시스템 변화를 위한 동인 (Drivers for system change)

개발 당시, CBD는 의료 전문직(medical profession)에 의해 서비스를 받는 사람들에 대한 신탁 의무(fiduciary duty)로서, 캐나다 PGME 시스템의 지속적 개선(continuous improvement)에 대한 Royal College의 헌신(commitment)에 의해 추진되었습니다(driven). Royal College는 다른 이해관계자들과 함께, 우려되는 영역(areas of concern)과 미래 의사들의 수련을 향상시킬 기회를 찾기 위해 환경을 조사했습니다(scanned the environment). 이것들은 표 1에 요약되어 있습니다.

개발 과정 (Development process)

캐나다 PGME는 1990년으로 거슬러 올라가는 CanMEDS 역량 프레임워크의 통합을 포함하여 주요 개혁(major reforms)의 역사를 가지고 있었습니다 [109-111]. 제안된 이 모든 개혁들이 성공적이었던 것은 아니었으므로 [112], CBME를 통해 PGME 시스템을 개선하고자 하는 열망(desire)은 성공을 지원하기 위해 공식적인 시스템 전반의 프로젝트(formal system-wide project)로 조직되었습니다. Royal College는 CBD를 개발하기 위해 주요 기관 프로젝트 그룹(institutional project group)을 출범시켰으며(launched), 여기에는 교육 전략(education strategy), 전문과목 표준(specialty standards), CanMEDS, 교수개발(faculty development), 인증(accreditation), 정책(policy), 평가(assessment), 재무, IT, 커뮤니케이션, 그리고 거버넌스(governance)를 담당하는 팀들이 포함되었습니다. CBD 프로젝트는 4단계(four phases)로 조직되었습니다(그림 1 및 부록 A 참조). 작업을 수행하기 위해, 프로젝트 그룹은 PGME 시스템에 적용되는 여섯 가지 원칙(six principles)을 채택했습니다:

 

그림 1. Competence by Design 개발의 단계 (Phases of Competence by Design development).

제목: Competence by Design의 개발 (The Development of Competence by Design) 캡션: 그림 1. Competence by Design 개발의 단계 (Figure 1 Phases of Competence by Design development)

1단계: 계획을 위한 계획 (Plan the Plan)

  • 프로젝트 팀 (Project Team)
  • 이해관계자 참여 (Engagement of stakeholders)
  • CBME 설계 (CBME design)
  • 표준 및 정책 검토 (Examine standards & policies)

2단계: 준비 (Preparation)

  • 프로젝트 계획 (Project plan)
  • 실무 그룹, 네트워크, 연합 (Working groups, networks, coalition)
  • CanMEDS 2015 (CanMEDS 2015)
  • EPA 시범 프로젝트 (EPA pilot projects)
  • 새로운 표준 및 정책 (New standards & policies)
  • 새로운 인증 시스템 (New accreditation system)
  • 전문과목 표준 변환 모델 (Specialty standards transformation model)

3단계: 실행 (Implementation)

  • 이해관계자 조정 (Stakeholder coordination)
  • 변화 지원 (Change support)
  • 정책 승인 (Policy approvals)
  • 새로운 표준 (New standards)
  • 전문과목 코호트별 도입 (Rollout by cohorts of specialties)
  • 공유 자원 및 보조금 (Shared resources & grants)

4단계: 평가 및 적응 (Evaluation & Adaptation)

  • 모니터링 및 감독 (Monitoring & oversight)
  • 변화 관리 (Change management)
  • 설계의 반복 (Iterations to design)
  • 정책, 표준, 절차의 개정 (Revisions to policies, standards, procedures)
  • 지속적인 평가 (Ongoing evaluation)
  • 우려 사항 해결 (Addressing concerns)

조직의 정렬과 지원 (Organizational alignment and support)

  • 이 프로젝트를 효과적으로 실행하기 위해(execute this project effectively), 관련된 조직들(involved organizations) 스스로가 이 이니셔티브와 정렬(align)되도록 변화될(transformed) 필요가 있었습니다.
  • 따라서, Royal College와 의과대학 및 조직적 파트너들은 새로운 역량 바탕 PGME 시스템(competency-based PGME system)의 창출(creation)을 촉진하는(facilitated) 공식적인 프로젝트 팀(project teams), 실무 그룹(working groups), 공유된 거버넌스 기구(shared governance bodies), 변화 전략(change strategies), 그리고 새로운 정책(new policies)들을 만들었습니다 [113].

이해관계자 참여와 공동 생산 (Stakeholder engagement and co-production)

  • 이것이 오래 확립된 시스템(long-established system) 내에서의 변혁적 변화(transformational change)로 인식되었기 때문에, 프로젝트 그룹은 조기의 광범위한 이해관계자 참여(stakeholder engagement)를 우선순위로 두었습니다(prioritized) [114, 115].
  • 학장(Deans), 정부 대표, 의대생, 전공의(postgraduate trainees), 고위 교육 리더, 일선 교육자(front-line teachers), 교육 행정가, 의료 규제 당국자(medical regulators), 그리고 그 외 많은 이들이 하나의 공동체로서 CBD를 공동 생산(co-produce)하도록 초대되었습니다. 참여와 지원은 다양했지만(varied), 대다수의 이해관계자들은 변화 노력(change effort)을 지지했습니다.

반복적인 공동체 개발과 출시 (Iterative community development and rollout)

  • 초기부터(Early on), 이 거대한 변혁적 변화는 반복적인 접근법(iterative approach)이 필요하다고 결정되었습니다. 교육적 및 정책적 설계들은 2010년부터 시작된 일련의 서밋(summits)에서 브레인스토밍되었으며, 이는 실행(implementation) 전에 의견과 개선을 위해 이해관계자들 사이에서 널리 회람되었습니다(circulated).
  • 마찬가지로, 전문과목과 세부전문과목들(예: 마취통증의학과, 종양내과, 이비인후-두경부외과)이 얼리 어답터(early adopters)가 되어 새로운 모델을 구현하는 첫 번째 집단(cohorts)에 합류하도록 자원해달라는 초청을 받았습니다. 여정의 각 단계에서 얻은 교훈(Lessons learned)은 다음 코호트와 전체 시스템을 위한 변화에 정보를 제공했습니다(informed) [116].

자원 공유 (Resource sharing)

  • 이것이 거대한, 시스템적 변화(systemic change)였기 때문에, 추가적인 교육 자원(education resources)이 필요할 것이라는 점이 일찍이 인식되었습니다.
  • 새로운 교수개발 자원(faculty development resources)(컨퍼런스, 웨비나, 비디오, 템플릿)이 개발되었습니다 [86]. 수련 프로그램(training programs) 내에서 수행되어야 할 작업뿐만 아니라 프로그램 평가(program evaluation)와 연구 결과의 확산(dissemination of findings)을 지원하기 위해 보조금(Grants)이 신설되었습니다(established). 각 의과대학에 새로운 변화 리더십 역할(CBME Leads라고 불림)을 수립하는 것을 돕기 위해 자금(Funding)이 제공되었습니다 [117].

공식적인 전문가 네트워크의 창설 (Creation of formal expert networks)

  • CBME는 1978년 세계보건기구(World Health Organization)의 행동 촉구(call to action) [13] 이후 논의되어 왔지만, CBD가 시작되었을 때 CBME 구현의 많은 측면들이 여전히 개발 중(in development)이라는 점이 인식되었습니다. 아이디어의 공유(Pooling)와 모범 사례(best practices) 및 함정(pitfalls)의 공유는 프로젝트 성공의 핵심 요소(key ingredient)가 될 것이었습니다.
  • 따라서, Royal College 팀은 지식 창출과 확산을 촉진하기 위해(facilitate) 여러 국내 및 국제 네트워크(national and international networks)를 설립하고(founded) 조력했습니다(facilitated).
    • 여기에는 International CBME Collaborators, Learning Analytics Medical Education Network, Canadian Competence Committee Chairs Collaborative, 전공의 원탁회의(Residents Roundtable), 일련의 프로그램 평가 서밋(Program Evaluation Summits), 캐나다 가정의학회(College of Family Physicians of Canada)와의 협력, 그리고 의과대학 기반 CBME 리드 원탁회의(CBME Leads Roundtable)가 포함되었습니다.

선험적 프로그램 평가 (A priori program evaluation)

  • CBD의 많은 측면이 새롭고 변혁적이었기 때문에, CBD의 모든 측면에 대한 지속적 개선(continuous improvement)을 보장하기 위해 견고한 프로그램 평가 전략(program evaluation strategy)과 네트워크를 구축하는 것이 초기 우선순위였습니다.
  • 새로운 PGME 시스템의 어떠한 부정적인 의도하지 않은 결과(unintended consequences)라도 적시에(in a timely manner) 인식되고 개선되는(ameliorated) 것이 필수적이었습니다(imperative). 마찬가지로, 긍정적인 의도하지 않은 결과들도 인식되고, 축하받고, 증폭될(amplified) 필요가 있었습니다. CBD 프로그램 평가 전략은 이 컬렉션에 실린 Hall 등의 논문에 상술되어 있습니다 [118].

Competence by Design 모델: CBME 시스템을 지원하기 위한 14가지 혁신의 묶음 (The Competence by Design model: a bundle of 14 innovations to support a CBME system)

Competence by Design은 캐나다 전문의 PGME 시스템의 모든 측면에 대한 변혁적 변화(transformational changes)를 수반했습니다. 혁신들은 PGME의 문제와 기회들을 CBME의 Van Melle 핵심 구성요소(Van Melle Core Components) [25]와 연결하는 프로그램 논리 모형(program logic model)으로부터 도출되었습니다(derived) (표 2 참조). 핵심 역량(core competencies)에서부터 수련에서 시간의 역할(role of time), 평가(assessment), 인증(accreditation), 자격 검증(credentialing), 그리고 자격 인정(certification)에 대한 정책과 표준에 이르기까지, PGME의 모든 측면이 기본 원칙(first principles)에서부터 다시 구상되었습니다(reimagined). CBD는 새로운 PGME 시스템을 가능하게 하기 위해 14가지 주요 혁신들을 "묶었습니다(bundled)". 이는 아래에 기술되어 있습니다.

표 2. Competence By Design 논리 모형 (Competence By Design Logic Model)

CBME의 핵심 구성요소* (CORE COMPONENTS OF CBME*) 이슈 및 기회 (ISSUES & OPPORTUNITIES) CBD 설계 요소 (CBD DESIGN ELEMENTS) 산출물 (OUTPUTS) 영향 (IMPACT)
졸업생을 위한 역량 프레임워크로서의 성과

(Outcomes as a Competency Framework for Graduates)
모든 졸업생이 필요한 역량 수준을 충족하도록 보장하기 위한 PGME (안전한 환자 진료를 위한 졸업생 성과에 초점)

성과(outcomes)가 아닌 과정(process)에 초점을 맞춘 프로그램 리뷰
CanMEDS 2015 프레임워크

새로운 전문과목 특이적 역량(specialty-specific competencies)

새로운 성과 지향적 인증(outcomes-oriented accreditation)
모든 전문과목에 대한 명확하고 새로운 역량(Clear new competencies)

PGME 성과에 초점을 맞춘 새로운 인증 기준(accreditation standards)
역량 있는 졸업생(Competent graduates), 진료 준비 완료(ready for practice)

향상된 수련 프로그램(Enhanced training programs)
초심자에서 전문가로의 정의된 수련 진척

(Defined progression of training from novice to expert)
전환(transitions)과 관련된 이슈들

시간 기반 수련(Time-based training)은 변동성 있는 졸업생을 배출함

환자 안전 우려(Patient safety concerns)

부적절한 관리감독(inadequate supervision) 사례들
계획된 전환(Planned transitions)

PGME의 4단계(4 stages)

CanMEDS 이정표(milestones)
전공의 수련 및 진료로의 더 나은 전환(Better transitions)

역량으로 가는 명확한 경로(Clear pathways)

학습을 위한 더 나은 평가(Better assessments for learning)
수련의 각 단계에 준비된 전공의(Residents prepared)

역량 있는 졸업생, 진료 준비 완료

더 안전한 진료(Safer care)
맞춤형 학습 경험

(Tailored learning experiences)
일반적인 수련(Generic training)은 변동성 있는 졸업생을 배출함

수련에 대한 전공의 참여(Resident engagement)는 학습을 향상시킴
시간 가변적 수련(Time variable training)

유연한 수련 요건(Flexible training requirements)

성취에 기반한 진급(Promotions on achievements)

개별화된 순환 계획(Individualized rotation plans)

지속적인 코칭(Coaching over time)
자격 인정으로 가는 개별화된 경로(individualized pathways)를 가진 전공의들 수련의 각 단계에 준비된 전공의

역량 있는 졸업생, 진료 준비 완료

수련에 대한 더 큰 전공의 만족도(Greater resident satisfaction)
역량 바탕 교수

(Competency-based teaching)
수련생에 대한 직접 관찰(direct observation)이 거의 없음

현장에서의 부적절한 피드백(Inadequate feedback)

성장 마인드셋(Growth mindset)은 전문성 숙달을 향상시킬 수 있음

EPAs는 더 많은 교수진이 더 나은 의견을 제공할 기회를 제공함

발달적 관점(Developmental view)은 어떤 수련생도 낙오되지 않도록 보장함
직접 관찰(Direct observation)

현장 기반 평가를 위한 EPAs

즉각적인 코칭(Coaching in the moment)

수련에 대한 발달적 관점

성장 마인드셋
더 많은 직접 관찰

더 많고 더 나은 피드백

진척 상황에 대한 풍부한 그림을 제공하는 전공의 포트폴리오(Trainee portfolios)
수련의 각 단계에 준비된 전공의

역량 있는 졸업생, 진료 준비 완료

수련에 대한 더 큰 전공의 만족도
프로그램식 평가

(Programmatic assessment)
시험 불합격(Exam failures)

역량 부족(dyscompetence)에도 불구하고 진급

평가 횟수 부족(Few assessments)

현장 기반 평가(WBA)에 대한 우려

진급 결정에 대한 우려

학습 분석을 사용할 기회

평가를 디지털화할 기회
모든 전공의 진척에 대한 역량 위원회(Competence committee) 리뷰

높은 수의 EPA 관찰

학습 분석e포트폴리오

수련에 대한 발달적 관점

성장 마인드셋

지속적인 코칭

자격 시험의 새로운 역할
더 나은 진급 결정

진척 상황에 대한 풍부한 그림을 제공하는 전공의 포트폴리오

WBA에 관여하는 더 많은 교수진

역량으로 가는 명확한 경로

자격 인정으로 가는 개별화된 경로를 가진 전공의들

더 많고 더 나은 피드백
수련의 각 단계에 준비된 전공의

역량 있는 졸업생, 진료 준비 완료

수련에 대한 더 큰 전공의 만족도

필요한 평가 이의제기(appeals) 감소

동일하거나 더 높은 시험 합격률(exam pass rates)

*출처: Van Mell E, et al. International Competency-based Medical Education Collaborators. A core components framework for evaluating implementation of competency-based medical education programs. Acad Med. 2019; 94: 1002–9.

발달적 이정표가 있는 새로운 역량 프레임워크 (New competence framework with developmental milestones)

  • Royal College PGME 시스템은 1996년부터 교육과정의 기초(basis of curriculum)로 CanMEDS 역량 프레임워크(CanMEDS competency framework)를 사용하고 정기적으로 업데이트해 왔습니다 [110, 111]. CBD를 위해, 새로운 버전인 CanMEDS 2015가 만들어졌으며, 이는 각 역량 영역(domain of competence, 예: 의사소통 기술)에 대한 발달적 이정표(developmental milestones)를 포함했습니다. 이는 의과대학 종료 시점부터 전문의 수준(specialist level)까지의 진척(progression)을 반영하는 짧은 진술(short statements) 형태입니다 [88]. 이정표들은 현장 기반 코칭 대화(workplace-based coaching conversations)를 위한 비계(scaffold)로 배치되었습니다(deployed) [119].

발달적 신뢰할 수 있는 전문 활동의 도입 (Introduction of developmental entrustable professional activities)

  • Karpinski와 Frank [120]가 기술한 바와 같이, Royal College는 학습을 조직하는 접근법(approach to organize learning)이자 평가를 위한 프레임워크(framework for assessment)로서 신뢰할 수 있는 전문 활동(entrustable professional activities, EPAs)을 선택했습니다. CBD 형태의 EPA(RCEPAs)는 해당 전문과목과 수련 단계(stage of training)에 맞춤화된 일련의 전문적 과업(professional tasks)을 나타냈습니다. 그것들은 명시적으로 발달적(explicitly developmental)이어서, 수련이 진행됨에 따라 RCEPA의 복잡성과 범위(complexity and scope)가 커졌습니다.
    • 수련 시작 단계의 RCEPA는 더 단순했고(예: "비뇨의학과 서비스로 환자 입원시키기"),
    • 수련 종료 단계의 RCEPA는 임상 의사의 능력에 근접한 능력(abilities approaching that of a practising clinician)을 반영했습니다(예: "수술 목록 조정, 조직 및 실행").
  • RCEPA는
    • 과업 기술(description of the task),
    • 과업 완수에 필수적인 2개 이상의 CanMEDS 역할(Roles)에서 가져온 8-12개의 이정표,
    • 관리감독 서열 점수(supervision ordinal score, 즉 O-Score [121]), 그리고
    • 필수적인 서술형 코멘트(narrative comment)를 작성하는 영역을 포함했습니다.
  • 이러한 EPA는 현장에서 빈번하게 직접 관찰(directly observed)되어야 했으며, 임상 환경에서 진척 모니터링(학습의 평가[assessment of learning])과 즉각적인 코칭(coaching in the moment, 학습을 위한 평가[assessment for learning])을 위한 프레임워크 역할을 했습니다 [122].
  • RCEPA는 완료되고, 기록되며(logged), 디지털 플랫폼에 집계되었습니다(aggregated). 따라서 EPA는 수련의 진척을 정의하고, 개별 수련생의 학습을 맞춤화(tailor)하며, 핵심 과업에 대한 현장 기반 교수(workplace based teaching)를 촉진하고, 프로그램식 평가(programmatic assessment)를 위한 데이터를 생성하는 역할을 했습니다.

새로운 수련 단계 (New stages of training)

  • 모든 졸업생이 안전하게 진료할 수 있는(practise safely) 모든 역량을 갖추도록 보장하는 프로그램 성과(program outcomes)에 초점을 맞추기 위해, CBD는 수련에 소요된 시간(time spent in training)이라는 조직화된 틀에서 순차적으로 성취되는 역량(competencies achieved sequentially)으로 이동했습니다 [25, 103]. 교육 시스템에서 전공의 연차(Postgraduate years, PGYs)는 공식적으로 4개의 정의된 수련 단계(stages of training)를 선호하여 대체되었습니다:
    • 전공의 전환기(Transition to Discipline), 기초기(Foundations), 핵심기(Core), 그리고 진료 전환기(Transition to Practice).
  • 각 단계는 이전의 경험과 성취 위에 구축되도록(build upon) 설계되었습니다. 단계들은 성취해야 할 사전 정의된 역량(predefined competencies), 학습 경험(예: 순환[rotations], 환자 만남의 유형, 시뮬레이션 세션), EPA, 기타 평가, 그리고 진급 기준(criteria for promotion)을 통합했습니다. 처음으로, PGME로의 진입과 진료(practice)로의 전환(transitions)을 위해 수련생을 준비시키는 데 특별한 주의가 기울여졌습니다.
  • 단계를 통한 진척(Progression)은 역량 위원회(Competence Committee)의 공식적인 권고(formal recommendation)를 필요로 했습니다. 새로운 표준(standards)은 프로그램들이 단계 간의 전환을 위해 수련생을 준비시키고, 그들이 모든 관련 역량을 습득했는지 확인하여, 미래의 순환에서의 효과성을 높이고 안전한 환자 진료(safe patient care)를 증진할 것을 요구했습니다. 이 단계들은 CBD 역량 연속체(Competence Continuum)에 묘사되어 있습니다(그림 2 참조).

그림 2. Competence by Design 역량 연속체 (The Competence by Design Competence Continuum). Copyright 2012. The Royal College of Physicians and Surgeons of Canada. 허가를 받아 전재함.

새로운 전문과목 특이적 표준 (New specialty-specific standards)

  • CanMEDS 2015 프레임워크는 모든 Royal College 전문과목 및 세부전문과목에 맞춤화된 새롭고 업데이트된 역량 세트의 템플릿(template)으로 사용되었습니다. 모든 분과(discipline)는 이러한 역량, 단계, RCEPA를 사용하여 교육과정과 평가를 위한 새로운 국가 청사진(national blueprint)을 만들었습니다 [123].
  • 그 후 분과들은 4가지 수련 단계에 기초한 그들의 새로운 맞춤형 PGME 설계를 보급했습니다(disseminated); 각 단계는 수련 경험 요건, 교수(instruction), 성취해야 할 역량, 그리고 관찰 및 기록되어야 할 EPA를 포함했습니다.
  • 이 단계들은 시간이나 EPA의 할당량(quotas)에 기초하지 않았습니다; 시간은 학습을 위한 자원(resource for learning)이었고, 현장 평가(workplace assessments)는 피드백을 주고받으며 진척의 증거(evidence of progress)를 문서화할 기회였습니다. 따라서 CBD는 각 전문과목의 수련 설계를 개조할(revamp) 세대적 기회(generational opportunity)를 제공했습니다.

교수 및 평가를 위한 새로운 프로그램 청사진 (New program blueprints for teaching and assessment)

  • CBD 국가 전문과목 표준은 캐나다 내 거의 1000개의 Royal College 수련 프로그램 모두에서 교수 및 평가를 위한 새로운 청사진(blueprints)으로 번역되었습니다. 이는 인증 기준(accreditation standard)으로 요구되었습니다. 지역 프로그램 위원회(Local program committees)는 이 기회를 사용하여 그들의 맥락(context)에서 수련을 다시 구상(reimagine)하고, 필수적인 순환과 교수에 시간을 배정하며(allocating time), 계획된 경험에 EPA와 기타 평가를 배정하도록 요청받았습니다.
  • 이는 역량 성취를 돕기 위한 최상의 경험을 재평가(reassess)하고 더 이상 필요하지 않은 경험을 재고(reconsider)할 기회를 제공했습니다. 이러한 방식으로 CBD는 전국의 모든 수련 프로그램의 갱신(renewal)을 촉진했습니다.

직접 관찰이 있는 현장 기반 평가 시스템 (Workplace-based assessment system with direct observation)

  • Competence by Design은 학습을 위한 평가(assessment for learning)학습의 평가(assessment of learning) 모두에 중점을 둔 새로운 현장 기반 평가 시스템(workplace-based assessment system)을 도입했습니다 [68, 69].
  • 4주간의 수련이 끝날 때마다 단일 지도전문의가 작성하는 단일 후향적(retrospective) 현장 기반 평가 대신, 프로그램들은 모든 수련생이 현장에서 EPA를 사용하여 빈번하게 관찰(frequently observed)되고 해당 EPA에 대해 즉각적인 코칭(coaching in the moment)을 받으며, 지도전문의의 인상(impressions)이 전자 포트폴리오(electronic portfolio)에 기록되도록 보장할 것을 요청받았습니다.
  • EPA는 다수의 평가자(multiple assessors)로부터 포착된 다수의 수행 미시 평가(multiple micro-assessments of performance)를 보장하여 학습자 진척에 대한 더 풍부하고 신뢰할 수 있는 결정을 알리는 데(inform) 사용되었습니다. 단일 전문과목에서의 첫해 구현 연구에서, 수련생당 기록된 관찰 횟수는 기관 전반에 걸쳐(across sites) 20회 미만의 전통적 평가에서 90-230회의 EPA로 증가했습니다 [124].

역량 바탕 코칭 모델 (Competency-based coaching model)

  • 전통적 수련에서 수련생에게 제공되는 유용한 피드백의 부재(lack of useful feedback)에 대한 우려를 해결하기 위해 [125], CBD의 EPA는 평가 프레임워크로만 사용되지 않았습니다. EPA는 또한 빈번한 직접 관찰(direct observations) [126]과 즉각적인 임상 코칭(clinical coaching in the moment) [127, 128]의 토대(foundation)였습니다. 이를 지원하기 위해, 이 컬렉션의 Richardson 등 [122]이 기술한 바와 같이 "RX-OCR" 코칭 모델이 출시되었습니다(rolled out).

성장 마인드셋 수련 (Training in a growth mindset)

  • 증가된 직접 관찰, 현장 기반 평가, 역량 지향 코칭 피드백의 도입은 새로운 CBD 시스템이 압도적으로(overwhelmingly) 평가에만 초점을 맞출 위험을 초래했습니다.
  • 대신, 새 시스템의 목표는 교수와 학습을 향상(enhance teaching and learning)시키는 것이었습니다 [101]. 따라서, CBD 조직자들은 Carol Dweck의 성장 마인드셋(growth mindset)에 대한 수련생 및 교수의 오리엔테이션을 명시적으로 포함했습니다 [129, 130]. 역량 바탕 교육에 대한 이 접근법은 학습에 대한 발달적 관점(developmental view)을 옹호합니다(advocates);
  • 모든 학습자는 역량을 향한 여정(journey to competence)에 있으며, 어떤 주어진 역량은 성취되었거나(achieved) 아직 성취되지 않은(not yet achieved) 상태입니다. CBD 하에서, 교수자들은 수련생이 EPA나 역량 영역을 성취했을 때뿐만 아니라 도중의(enroute) 진척 상황도 기록하도록 장려되었습니다.
  • 많은 관찰은 학습자 포트폴리오의 어떤 주어진 데이터 포인트도 "역량이라는 그림 속의 픽셀(pixel in a picture of competence)"이며, 각각은 고부담(high stakes)이 아니라는 것을 의미했습니다. 목표는 수련생과 교수자가 수련생의 능력에 대한 논의를 발달에 대한 "경과 기록(progress note)"으로 사용하고 학습자의 인격(character)에 대한 논평으로 사용하지 않는 것이었습니다. 이는 의학교육에 널리 퍼져 있는 고정 마인드셋(fixed mindset)으로부터의 뚜렷한 전환(distinct shift)이었습니다 [100, 122, 128].

역량 위원회 및 프로그램식 평가의 도입 (Introduction of competence committees and programmatic assessment)

  • 프로그램식 평가(Programmatic assessment)는 다양한 지도전문의(diversity of supervisors)들로부터 시간이 지남에 따라 수집된 광범위한 평가(spectrum of assessments, 주로 RCEPA이지만 수련 단계와 관련된 다양한 과제도 다룸)를 특정 수련 단계에 있는 수련생에 대한 종합적 평가(global assessment)로 통합하기 위해(synthesize) 포함되었습니다.
  • CBD 모델에서, 역량 위원회(Competence Committee)는 수련생 포트폴리오의 EPA 및 기타 집계된 수행 데이터(aggregated performance data)를 정기적으로 검토하고, 규정된 합의 과정(consensus process)을 사용하여 그들의 진척에 공식적인 상태(formal status, 예: "기대대로 진척 중[Progressing as Expected]")를 부여하는 헌신적인 교육자들로 구성된 공식적으로 임명된 그룹이었습니다.
  • 피드백과 교육적 처방(educational prescription)이 수련생에게 제공되어야 했습니다. 조기 교정(early remediation)이나 수련 과정의 가속화된 진척(accelerated progression)을 포함하여, 미래 수련의 수정(Modification) 또한 가능했습니다. 역량 위원회는 전체 전공의 프로그램 위원회(Residency Program Committee, RPC)에 보고했으며, RPC는 지역 프로그램 전반의 전반적인 정렬(overall alignment)을 보장하기 위해 모든 진급 권고(promotion recommendations)와 결정에 대해 책임을 지고 인지하고 있었습니다 [131-134].

전자 포트폴리오의 도입 (Introduction of electronic portfolios)

  • CBD는 디지털 수련생 포트폴리오(digital trainee portfolios)를 전공의 교육의 필수적인 요소(essential ingredient)로 만들었습니다 [135]. Royal College는 종이 서식(paper forms, 여전히 일부 프로그램에 존재함) 사용에서 벗어나 수련생 진척 데이터(예: EPA 관찰)의 증가를 관리하기 위해 더 정교한 전자 포트폴리오(electronic portfolios)의 사용을 장려하고자(incentivize) 했습니다 [78-80].
  • RCEPA의 디지털 작성은 효율적이고 안전한 데이터 포착(data capture)을 보장했습니다. 전자 포트폴리오는 수련생, 교수, 역량 위원회가 프로그램 요건 충족에 대한 수련생의 진척을 모니터링하는 데 사용할 수 있는 대시보드 뷰(dashboard views)를 허용했습니다 [136, 137].
  • 이 모든 것을 지원하기 위해, Royal College는 모든 인증된 프로그램에 무료 e포트폴리오를 투자하고 제공했습니다. 대학과 병원들도 그들이 선택한 다른 전자 포트폴리오를 구현할 선택권(option)이 있었습니다.

학습 분석 (Learning analytics)

  • CBD는 더 많은 평가 데이터 포인트의 가용성과 디지털 데이터 집계의 용이성을 통해 PGME 시스템을 위한 학습 분석(learning analytics)을 국가적으로 가능하게 했습니다. 학습 분석은 고등교육(higher education)에서는 널리 퍼져 있지만 [138], CBD 출시 이전 캐나다 PGME에서는 거의 사용되지 않았습니다(minimal use).
  • 학습 분석은 표준(standard) 대비 수련생의 진척을 보여주는 강력한 도구 세트입니다. 이 분석은 또한 교수의 행동(teacher behaviour), 순환의 효과성, 그리고 프로그램 전반에 대한 관점(views)을 제공할 수도 있습니다 [139]. 강력한 그래픽 학습 분석 대시보드(graphical learning analytics dashboard)는 CBD 하에서 역량 위원회를 위한 중요한 도구가 되었습니다 [81, 108].

자격 시험의 변화된 역할 (Changed role for certification examination)

  • 수십 년 동안, Royal College 자격 시험(certification examination)은 독립적 면허(independent licensure)와 자격 인정을 위한 단일하고, 고부담 외부 관문(high-stakes external gateway)으로서 수련의 마지막에 발생하는 PGME의 마지막 단계(final act)였습니다.
  • CBD 하에서, 이 시험은 수련의 핵심기(Core stage) 종료 시점으로 이동되었습니다 [140]. 이 조치는 학습의 강력한 동인(powerful driver of learning)인 시험 준비를 수련의 더 이른 단계로 이동시켰고, 진정한 진료 전환기(Transition to Practice stage)를 위한 시험 없는 기간(examination-free period)을 만들었습니다.
  • 일반적으로, 시험이 수련의 끝에서 핵심기(Core stage)의 끝으로 이동했을 때 응시자들은 그만큼 잘 수행했습니다(performed just as well). 시험은 역량으로 가는 수련생의 진척 포트폴리오에 있는 또 다른 주요한 증거물(exhibit)이 되었으며, 시험의 성공적인 완료는 여전히 자격 인정을 위한 요건이었습니다. CBD에서 시험의 역할은 이 컬렉션의 Bhanji 등 [141]에서 더 자세히 설명됩니다.

지속적 질 개선과 질 보장을 강조하는 새로운 인증 기준 (New accreditation standards emphasizing continuous quality improvement and quality assurance)

  • CBD 시스템의 출시를 지원하기 위해, Royal College 인증 시스템(accreditation system) 또한 성과(outcomes)에 더 초점을 맞추도록 갱신되었습니다. 인증 이해관계자 컨소시엄(CanRAC)의 일환으로, CBME 요소를 둘러싼 요건들을 포함하는 새로운 기준 세트가 만들어졌습니다 [142]. CBD에 정보를 제공하는 철학(philosophies)을 따라, 새로운 인증 시스템은 강조점을 질 보장(quality assurance, 기준 충족)에서 지속적 질 개선(continuous quality improvement, 프로그램 향상 전략을 보여주는 프로그램 보상)으로 이동시켰습니다 [106]. CBD를 위한 새로운 인증 시스템은 이 컬렉션의 동반 논문인 Dalseg 등 [143]에서 더 설명됩니다.

시간 가변적 자격 검증 (Time-variable credentialing)

  • 마지막으로, CBD는 규정된 임상 서비스에서 수련에 소요된 시간에 기초한 자격 검증(credentialing)으로부터의 이동을 표시했습니다(marked) [144]. 대신, Royal College는 수련생의 진료 준비도(readiness for practice)에 대한 가용한 모든 데이터에 기초하여 지역 프로그램 역량 위원회의 진급 결정을 수용하는 정책을 채택했습니다 [132].
  • 안전장치(safeguard)로서, 역량 위원회의 기능은 인증 방문의 일부로 검토되었습니다. CBD는 하이브리드 시간 가변적 접근법(hybrid time-variable approach)을 나타내지만, CBD 프로그램의 수련생들은 만약 그들이 모든 필수 역량과 수련 경험을 성취했다는 증거가 있다면 표준 수련 기간보다 일찍 졸업(graduate earlier)할 수 있었습니다.

 

고찰 (Discussion)

 

많은 국가들이 CBME 설계를 위한 작업을 시작했지만, PGME 시스템의 역량 바탕 교육으로의 국가적 규모의 변혁(national-scale transformation)을 기술하는 출판물은 현재까지 거의 없었습니다(little has been published to date). 이 논문에서, 우리는 CBD를 보건 전문직 교육(health professions education)에서 독특한 혁신(unique innovation)으로 기술했으며, PGME 창설 이래 캐나다 수련에서 가장 큰 변화였던 새로운 CBME 시스템의 동인(drivers), 개발(development), 그리고 설계(design)를 상술했습니다(elaborated). 모든 교육 프로그램이 지속적으로 진화하고 있을지 모르지만, 교육 시스템에서의 대규모 변혁(large-scale transformations)은 흔하지 않습니다 [145]. CBD 프로젝트는 기존 PGME 시스템에 대한 변혁적 변화이자 시간 가변적 CBME(time-variable CBME)의 적용을 모두 나타냅니다. CBD의 초기 구현으로부터 얻은 몇 가지 교훈(lessons learned)과 보건 전문직 교육에서 변화를 이끄는 사람들을 위한 시사점(implications)이 있습니다.

 

대규모 교육 변화에 대한 교훈 (Lessons learned about large-scale educational change)

대규모 변화는 시스템이 작동하는 방식을 다시 구상할 드문 기회를 제공합니다 (Large-scale change provides a rare opportunity to reimagine how a system works)

  • CBD 이니셔티브는 정책(policies)에서 철학(philosophies), 절차(procedures), 인증(accreditation)에서 평가(assessment)에 이르기까지 PGME 시스템의 모든 측면을 근본적으로 다시 구상(reimagine)할 기회가 되었습니다. 이는 전문직 교육에서 드문 현상입니다. 이를 통해 많은 오래된 우려(long-standing concerns)와 아이디어들이 이번 구현의 일부로 다루어질 수 있었습니다(예: 인증 리뷰의 디지털화). 관련된 사람들은 궁극적으로 미래의 졸업생과 그들의 환자를 위해 지속적 개선(continuous improvement)에 헌신했습니다. 그럼에도 불구하고, 근본(fundamentals)을 재검토할 기회는 그러한 기회를 추구하는 데 필요한 높은 수준의 노력(high degree of effort)과 균형을 이루어야 합니다.

"거대한 변화"를 지속하기 위해 조직의 변혁이 필요합니다 (Organizational transformation is needed to sustain “big change”)

  • CBD를 구현하는 과정에서, 성공하기 위해서는 참여하는 조직들 스스로가 변화해야 한다는 것이 깨달아졌습니다. 조직들은 정책, 절차, 그리고 인력(personnel)을 변경했습니다. 후자의 변화는 새로운 교육 과정(educational processes)에 헌신하는 개인들을 배치하기(put in place) 위해 필요했습니다. 근본적으로, CBD는 의사를 준비시키는 이 새로운 방식을 채택한 모든 사람들, 관련된 기관의 리더십을 포함하여, 그들의 정신 모형(mental models)을 변화시켰습니다 [146].

이해관계자와의 공동 생산은 필수적입니다 (Co-production with stakeholders is essential)

  • CBD의 구현은 변화의 진전을 이루기 위해(make progress in change) 수많은 이해관계자의 참여(engagement)를 필요로 했습니다. 수련생 조직이나 의과대학과 같은 이해관계자들은 어떠한 PGME 프로젝트의 영향도 가장 먼저 받는 최전선(front line)에 있었기 때문에, CBD를 형성하는 데 중요한 의견(critical input)을 제공했습니다. 파트너들과 CBD의 요소들을 공동 생산(Co-production)하는 것은, 비록 더 느릴지라도, 다양한 관점에서 최상의 가능한 설계를 얻기 위해 필수적이었습니다 [115].

적응형 프로그램 평가 전략은 필수적입니다 (An adaptive program evaluation strategy is essential)

  • 처음부터(From the outset), CBD는 세 가지 주요 활동 기둥(pillars of activity)을 가진 견고한 프로그램 평가 전략(program evaluation strategy)을 개발했습니다: 구현 준비도(readiness to implement), 구현의 충실도(fidelity of implementation), 그리고 성과(outcomes). PGME 시스템 전반에 걸친 지속적인 평가 연구는 교육 리더들에게 이슈, 우려, 강점, 그리고 지역적 차이(regional variations)를 신속하게 알려주었습니다(rapidly informed). 이는 그토록 크고 복잡한 변화 프로젝트의 성공에 절대적으로 결정적(critical)이었습니다 [118].

의학교육에서의 대규모 변화는 학문적 연구와 경력 변화로 이어질 수 있습니다 (Large-scale change in medical education can lead to scholarship and career changes)

  • 일화적으로(Anecdotally), CBD는 변혁의 의도치 않은 영향으로서 참여자들이 역할을 바꾸고 학문적 연구(scholarship)를 생산하도록 촉발했습니다(triggered). 수련생과 교수진은 교육 경력 트랙(education career track)에 관심을 갖게 되어, 치프 레지던트(대표 전공의), 프로그램 책임자(program directors), 또는 학자(scholars)가 되었습니다.

CBME 구현에 대한 교훈 (Lessons learned about CBME implementation)

CBD는 규모 있는 CBME 개념 증명입니다 (CBD is a CBME proof of concept at scale)

  • CBD는 CBME의 Van Melle 핵심 구성요소(Van Melle Core Components) [25]를 사용하도록 명시적으로 만들어졌습니다. CBME 운동에 대한 비판 중에는, 이 접근법이 근거 기반이나 실적(track record)이 없는 이론적(theoretical)인 것이라는 우려가 있었습니다 [84]. CBD는 CBME의 핵심 구성요소가 21세기 국가적 PGME 시스템의 기초로 사용될 수 있음을 입증함으로써 HPE의 담론(discourse)에 기여합니다.

변화의 "묶음"으로 CBME를 구현하는 것에는 이점이 있습니다 (There are benefits to implementing CBME as a “bundle” of changes)

  • International CBME Collaborators의 이전 작업에서, 많은 선구적인 CBME 설계들은 주로 역량 프레임워크나 프로그램식 평가에 초점을 맞추었습니다. 이것들은 Van Melle 핵심 구성요소 중 두 가지입니다. 대조적으로, CBD 이니셔티브는 모든 핵심 구성요소를 사용했으며, 이는 하나의 변혁적 시스템 변화로 "묶인(bundled)" 14개의 구현된 혁신으로 이어졌습니다 [147, 148]. 초기 프로그램 평가 결과들은 수련 프로그램 수준에서의 변화들과의 더 큰 정렬(alignment)이 CBD 논리 모형(Logic Model)의 바람직한 성과들과 더 나은 정렬을 만들어냈음을 시사했습니다 [118].

시간은 학습을 위한 자원이지, 수련 완료의 기준이 아닙니다 (Time is a resource for learning, not the criterion for completion of training)

  • PGME 시스템들은 수련에서의 시간을 다양한 방식으로 사용합니다. 일부는 규정된 학습 경험에서 정해진 주(weeks) 수를 요구하는 고정 시간 설계(fixed-time designs)를 가지고 있습니다. 소요된 시간(time spent)에 기초한 시스템들은 졸업생들이 안전한 진료를 위해 필요한 모든 역량을 성취하지 못한 채로 나갈 수 있는 잠재적 위험이 있다는 비판을 받아왔습니다. 대조적으로, 개방형 시간 시스템(open-time systems)은 비효율성과 장기화된 수련(prolonged training)으로 비판받아 왔습니다. CBD는 필수 역량의 성취를 가능하게 하는 학습 경험에 대한 가이드라인을 갖춘 시간-하이브리드 시스템(time-hybrid system)을 만들고자 했습니다.
  • 이 시스템에서, 시간은 수련을 위한 자원(resource)이지, 조직화된 틀(organizing framework)이 아닙니다. 따라서, 주어진 순환(rotations)은 요구되는 것이 아니라(not required) 권장되었으며(recommended), 역량의 성취는 시간에 기초하지 않았습니다. 모든 졸업생이 모든 필수 역량을 성취했다는 증거가 있도록 보장하면서, 프로그램들이 개별 수련생의 요구에 수련을 맞춤화(tailoring)하고 있는지 확인하기 위해 인증 방문에 질 관리(Quality controls)가 내재되었습니다 [144].

시간 변동성은 개별화된 학습 계획을 가능하게 했습니다 (Time variability enabled individualized learning plans)

  • CBD 설계는 개별화된 수련생 학습 계획(individualized trainee learning plans)을 허용했습니다. 역량 위원회는 수련생의 포트폴리오가 다음 단계로 진척하기 위해 필요하다고 나타내는 것에 기초하여 미래의 수련 경험을 고려하도록 장려되었습니다.
  • 대다수의 수련생에게, 이것은 수련의 조기 또는 지연 완료를 의미하지 않았습니다. 이것이 의미한 바는 역량 위원회가 프로그램 성과를 달성할 수 있도록 필요에 따라 수련생의 순환이나 기타 활동에 대한 변경을 권고(recommend changes)할 수 있었다는 것입니다. 그렇게 함으로써, 프로그램들은 임상 서비스의 요구와 수련생의 교육적 요구 사이의 균형(balanced)을 맞추었습니다. 이것이 구현된 정도(extent)는 다양했습니다 [134].

"발달적" EPA는 진척 결정을 촉진합니다 (“Developmental” EPAs facilitate progress decisions)

  • EPA를 사용하는 전 세계의 많은 보건 전문직 교육 프로그램들은 EPA를 졸업하는 수련생이 목표로 삼는(works toward) 과업으로 설계했습니다. CBD에서, Royal College는 명시적으로 초심자에서 전문가로 수련의 순서를 정하고(sequence) 학습자들이 그들의 발달의 각 단계에 진정으로 준비되도록 보장하기를 원했습니다. 이는 핵심 구성요소의 이론과 정렬되었고, 수련생들이 그들의 과업에 준비되도록 보장함으로써 환자 안전에 대한 우려를 해결했으며, 수련 수준에 맞는 특정 과업에 대한 직접 관찰(direct observation)과 코칭을 가능하게 했습니다. 학습자가 각 단계의 끝에서 수행할 수 있을 것으로 기대되는 과업을 정확히 지적함(pinpointing)으로써, 역량 위원회는 진급 결정을 안내할 기준 세트를 갖게 되었습니다 [120].

더 나은 피드백이 가능합니다 (Better feedback is possible)

  • CBD의 동인 중 하나는 수련생에게 유용하고 실천 가능한 피드백(actionable feedback)이 부족하다는 끊임없는 불만(perennial complaints)이었습니다 [62-67]. 이를 해결하기 위해 선택된 전략들에는 학습과 관찰의 초점으로서 EPA의 배치(deployment), 새로운 현장 코칭 모델, 성장 마인드셋에 대한 명시적 논의, 그리고 정기적인 직접 관찰 및 코칭 피드백에 대한 요건이 포함되었습니다. 초기 평가 연구들은 수련생들이 현장 기반 평가와 EPA 대화의 일환으로 더 빈번하고 더 실천 가능한 피드백을 보고했음을 보여주었습니다 [118].

프로그램식 평가는 주요 이점을 제공합니다 (Programmatic assessment offers key benefits)

  • CBD의 근본적인 기둥은 프로그램식 평가(programmatic assessment)의 배치였습니다. 이것의 사용은 PGME 평가가 주관적이고(subjective), 역량 발달에 대한 포괄적 관점이 부족하며, 너무 적은 지도전문의 및/또는 너무 적은 관찰에 기초하고 있다는 오래된 우려들을 해결하기 위한 것이었습니다.
  • 프로그램식 평가는 PGME 시스템 내 대부분의 프로그램에 있어 큰 변화였으며, 채택률(rates of adoption)은 다양했습니다. 평가에 대한 이 접근법이 충실하게(with fidelity) 채택된 프로그램들에서는, 지역 교육 리더들이 더 강력한 평가 의사결정, 개별 수련생에 대한 더 풍부한 데이터, 평가 결정에 대한 더 적은 이의제기(fewer appeals), 그리고 학습자에 대한 더 질 높은 피드백에 대해 높은 만족도를 보고했습니다. 프로그램식 평가가 수행되었을 때, 총괄 평가 결정(summative assessment decisions)은 현장 지도전문의에게서 역량 위원회로 이동되었습니다 [133, 134, 149, 150].

실시간, 저부담 현장 기반 평가가 가능합니다 (Real-time, low-stakes workplace-based assessment is possible)

  • 전 세계적으로, 견고한 CBME 설계를 지원하는 데 있어 주요한 난제는 역량을 향한 수련생 진척에 대한 유용한 현장 직접 관찰을 적절한 수(adequate number)만큼 확보하는 데 있습니다 [45, 126]. CBD를 구현하면서, Royal College는 모든 1000개 수련 기관의 지도전문의들에게 모든 수련생의 업무를 정기적으로 표본 추출(sample)하도록 요청했습니다. 지도전문의들이 작고 짧은 에피소드(small, brief episodes)로 직접 관찰을 수행하고 수련생에 대한 풍부하고 유용한 노트를 기록할 수 있다는 것이 발견되었습니다. 이것이 모든 환경에서 쉬운 것은 아니었지만, 일부 프로그램들은 더 많은 직접 관찰로의 이동을 실현했습니다(realize) [118, 150].

역량 위원회는 효과가 있습니다 (Competence Committees work)

  • CBD에서, 프로그램 리더들은 역량 위원회 구현에 대해 높은 만족도를 보고했습니다 [118, 133]. 그들은 개별 수련생들이 더 깊이 있고 풍부하게 논의되었고, 평가 결정이 더 견고했으며(robust), 기능적인 공식 역량 위원회를 만드는 과정이 다양한 환경 전반에 걸쳐 실행 가능(doable)했다고 보고했습니다. 이 경험은 PGME에서 역량 위원회의 사용에 대한 추가적인 지지를 제공합니다.

CBME는 평가의 형평성을 지지할 수 있습니다 (CBME may support equity in assessment)

  • 최근, 다수의 연구들이 다양한 참고문헌(Refs)에서 수련생 평가의 형평성(equity)에 대한 우려를 확인했습니다. 편애받거나(favoured) 우려 대상으로 표시된(flagged for concern) 수련생뿐만 아니라 모든 수련생이 다수의 지도전문의에 의해 직접 관찰되고 빈번하게 역량 위원회에서 논의되도록 요구함으로써, CBD 평가 시스템은 형평성을 향한 작은 발걸음을 내디뎠습니다.

PGME 전환의 함정들은 개선될 수 있습니다 (Pitfalls in PGME transitions can be ameliorated)

  • 다수의 이전 보고서들은 수련에서의 전환(transitions)이 학습자들에게 스트레스를 주고(stressful), 환자를 위험에 빠뜨릴 수 있으며, 이상적인 교육 설계가 아니라고 지적했습니다(flagged) [39-43, 102]. 의대생에서 PGME 수련생으로, 저년차에서 고년차 수련생으로, 그리고 고년차 수련생에서 진료(practice)로의 이러한 전환들은 끊임없는 난제(perennial challenges)입니다.
  • CBD는 의도적인 수련 순서(deliberate sequence of training)로서 단계(stages)를 사용함으로써 이러한 난제들을 해결하고자 명시적으로 계획했습니다.
    • 특히, 전공의 전환기(Transition to Discipline) 단계는 학습자를 해당 분과에 명시적으로 오리엔테이션하고 그 분과의 주니어 구성원으로서 학습자의 전문직 정체성 발달(professional identity development)을 증진했습니다.
    • 진료 전환기(Transition to Practice) 단계는 수련생이 독립적 진료의 현실(realities of independent practice)을 준비하면서 가장 책임 있는 의사(most responsible physician) 또는 외과 의사의 역할로 안전하게 행동할 수 있는 캡스톤 기회(capstone opportunity)를 제공했습니다.

학습 분석은 이점을 가진 강력한 도구 모음입니다 (Learning analytics is a powerful suite of tools with benefits)

  • 학습 분석은 교육 분야에 오랫동안 존재해 왔지만, CBD 하에서 프로그램식 평가를 채택한 것은 PGME 시스템 전반에 걸쳐 이 도구 모음의 최초의 전면적인 사용(whole-scale use)을 가능하게 했습니다. 학습 분석은 수련생들이 그들의 진척을 시각화하고, 역량 위원회가 데이터 기반 결정(data-driven decisions)을 내리며, 교수진이 피드백을 개선하고, 프로그램이 학습 환경에 대한 통찰력을 얻고, 기관이 이상점 프로그램(outlier programs)을 식별(flag)하도록 했습니다 [80, 81, 136-139, 151-154].

자격 시험은 여전히 역할을 가집니다 (Certification examinations still have a role)

  • CBD 하에서, Royal College 자격 시험은 유지되었으며 수련의 핵심기(Core stage) 이후의 공식적 평가가 되도록 이동되었습니다. 합격률은 전반적으로 변동이 없었습니다(unchanged). 교육적 설계 관점에서, 더 이른 자격 시험은 학습을 위한 강력한 동인이며, 역량 위원회를 위한 또 다른 핵심 데이터 포인트이고, 시험 완료 후 진료로의 전환에 초점을 맞출 수 있게 하는 것으로 많은 사람들에 의해 간주되었습니다 [141].

교훈: 대규모 CBME 구현에서의 함정 (Lessons learned: pitfalls in large-scale CBME implementation)

CBD의 구현(implementation)은 진행 중입니다(ongoing). 변화의 모든 단계(every step of the change)에서, CBME와 다른 변혁적 교육 변화(transformational education changes)를 고려하는(contemplating) 다른 이들에게 잠재적으로 중요한 시사점(implications)을 갖는 도전들(challenges)에 직면했습니다.

 

대규모 변화는 시스템에 스트레스를 줍니다 (Large-scale change stresses a system)

  • CBD는 국가 PGME 시스템에 14가지 혁신(innovations)을 가져왔습니다. 필연적으로(Inevitably), 일부 수련 기관(training sites)은 다른 곳보다 변화를 채택하기(adopt) 더 쉽다는 것을 알게 되었습니다. 수련 기관 전반의 인증 성취(accreditation achievements)에 기초하여, CBD 설계 팀은 새로운 설계가 1000개의 모든 수련 프로그램(training programs)에서 달성 가능할 것(achievable)이라고 가정했습니다(assumed).
  • 그러나, 일단 변화가 진행되자(underway), 일부 수련 기관들은 새로운 수련 체계(scheme)의 다양한 측면에서 어려움(difficulties)을 보고했습니다. 이러한 보고된 어려움 중 일부는 이전 수련 패러다임(previous training paradigm)의 기존 요건(existing requirements)이었습니다; CBD로의 변혁(transformation)은 PGME 시스템 내의 난제들에 새로운 빛을 비추었습니다(shed new light on).
    • 다수의 기관이 예상보다 CBD를 구현하는 데 더 큰 비용(greater cost)이 든다고 보고했습니다.
    • 전국적인 변동성(Variability)이 가장 큰 패턴이었으며, 일부 추정된 수련 특징(presumed training features)들은 CBD가 도착했을 때 항상 갖추어져 있지는 않았습니다(not always in place).

전문과목의 변동성은 유연한 접근법을 요구했습니다 (Specialty variability required flexible approaches)

  • 의학 분과들(Medical disciplines, 전문과목, 세부전문과목 등)은 그들만의 독특한 하위문화(distinct subcultures)를 가지고 있습니다. CBD가 출시되면서(rolled out), 분과들은 변화에 대한 반응성(responsiveness), 교육 개혁(educational reform)을 수행할 능력, 그리고 응집력(cohesiveness)에서 서로 다른 수준을 보였습니다. CBD 팀은 새로운 수련 접근법의 출시를 지원하기 위해 분과들과 개별적으로 협력했습니다. 임상적 현실(Clinical realities)(예: 코로나 팬데믹, 자원 스트레스 요인[resource stressors])은 교육 채택(education adoption)에 영향을 미치는 것으로 보였습니다 [116].

현장 기반 평가에 대한 요건은 웰니스 문제였습니다 (Requirements for workplace-based assessments were a wellness issue)

  • CBD 초기의 예상치 못한 전개(unexpected development) 중 하나는 새로운 프로그램식 평가 요건(programmatic assessment requirements)에 대한 수련생의 스트레스였습니다. 각 학습자의 포트폴리오를 채우기(populate) 위한 EPA 관찰과 관련된 가이드라인은 할당량(quotas)으로 인식되었으며(perceived), 전공의들은 종종 EPA 서식 완성을 위해 교수진의 참여(faculty engagement)를 시작해야 하는 책임을 부여받았습니다.
  • 이러한 구현 이슈들은 일부 수련 기관들이 예상치 못했던(not anticipated) 수련생와의 웰니스 문제(wellness issues)를 보고하는 것으로 이어졌습니다. 우리는 Dweck의 성장 마인드셋(growth mindset)과 학습자 중심 접근법(learner-centered approach)을 가르치는 것이 수련생들이 새로운 현장 기반 평가를 유익한 것(beneficial)으로 보는 데 도움이 되기를 바랐지만, 이것은 새로운 체계의 초기 몇 년 동안 분명히 보편적이지 않았습니다(not universal) [53, 98, 150, 155].

팬데믹 동안 대규모 변화를 구현하는 것은 예기치 못한 일이었습니다 (Implementing large-scale change during a pandemic was unanticipated)

  • CBD의 구현은 다년 프로젝트(multiyear project)로 계획되었으며, CBD 구현이 진행 중일 때 COVID-19 팬데믹이 시작되었습니다. 전 세계의 HPE와 마찬가지로, CBD 설계는 격심하게 영향을 받았습니다(drastically impacted) [156]. 특정 학습 경험(learning experiences)이 일정 기간 동안 중단되었을(shut down) 뿐만 아니라, 수련생과 교수자들은 수많은 COVID-19 환자를 치료하기 위해 재배치되었습니다(redeployed). 다행히도, CBD에 내재된 유연성(flexibility)은 수련생들이 대안적 활동(alternative activities)으로부터 역량 성취의 증거(evidence of achievement)를 사용하여 수련을 계속 진척(progress)할 수 있도록 허용했습니다.

전자 포트폴리오 기술은 문제가 많았습니다 (Electronic portfolio technology was problematic)

  • CBD가 구상되었을(conceived) 때, 캐나다와 같이 인구가 적은 국가는 Royal College가 개발하고 무료로 배포한(deployed for free) 국가적 e포트폴리오(national eportfolio)를 공유할 것이라고 가정되었습니다. 그러나, 어떤 소프트웨어 패키지도 수련 센터(training centres)의 모든 요구(needs)를 충족시키거나, 선호되는 워크플로(preferred workflows)를 충족시키거나, 모든 소프트웨어 환경(software environment)에서 배포 가능하지(deployable) 않다는 것이 곧 밝혀졌습니다.
  • 게다가, 수련생과 기관들은 학습자 프라이버시 우려(learner privacy concerns)를 제기했으며, 따라서 데이터 공유(data sharing)에 예상치 못한 장벽(barriers)이 있었습니다 [157]. 대신, 시간이 지남에 따라 전역에 걸쳐 수많은 지역 전자 포트폴리오(local electronic portfolios)가 사용되었으며 그 풍경(landscape)은 계속해서 빠르게 진화하고 있습니다.

성장 마인드셋은 PGME 전반에 걸쳐 구현하기 어렵습니다 (Growth mindset is difficult to implement across PGME)

  • 위에서 논의된 바와 같이, CBD의 혁신 중 하나는 PGME 시스템 전반에 걸쳐 교수, 학습 및 평가에 대한 Carol Dweck의 성장 마인드셋(growth mindset) 접근법의 채택을 장려하는 것이었습니다. CBD 초기에는 참여자들이 흥미를 느꼈지만(intrigued), 광범위한 채택(widespread adoption)은 쉽게 목격되지 않았습니다. 대신, 새로운 마인드셋을 수용하는 것(embracing)은 길고 느린 채택 곡선(adoption curve) 위에 있는 것으로 보이는 혁신이었습니다 [101].

EPA를 사용할 때 역량은 포섭될 수 있습니다 (Competencies can be subsumed when using EPAs)

  • CBD는 CanMEDS 역량과 EPA 모두를 이중 프레임워크(dual frameworks)로 사용할 것을 장려했습니다(promoted). 그러나, 구현 지원(supporting implementation)의 일환으로 EPA를 홍보할 때, 자문 위원회(advisory committees)의 교육자들은 EPA에 대한 지나친 강조(over-emphasis)에 대한 우려를 보고했습니다. 의도하지 않은 결과(unintended consequence)로서, CBD 이전보다 PGME에서 CanMEDS에 대한 강조가 줄어들었다는(less emphasis) 인식이 있었습니다.

 

PGME에서의 다른 CBME 구현 사례들과의 비교 (Comparisons to Other CBME Implementations in PGME)

International CBME Collaborators의 2021년 연구에서, 조사된(surveyed) 대다수의 CBME 프로그램들은 van Melle 핵심 구성요소 중 두 가지, 즉 역량 프레임워크(competence framework)와 프로그램식 평가(programmatic assessment)를 구현하는 데 공을 들였습니다 [158]. 그러나, 네 개의 주요 PGME 프로그램은 Competence by Design과 범위(scope) 및 규모(scale) 면에서 비교 가능했습니다(comparable):

  • 캐나다 가정의학회(College of Family Physicians of Canada)의 Triple-C 프로젝트 [27, 159, 160],
  • 미국의 ACGME 성과 프로젝트(Outcomes project) [22],
  • 호주 정형외과 협회(Australian Orthopaedic Association)의 AOA-21 교육과정 [161], 그리고
  • 네덜란드 의학 전문과목 협회(Dutch Association of Medical Specialties)의 개별화된 전공의 수련(Individualizing Postgraduate Medical Training) 프로젝트 [162].

이 모든 역량 바탕 PGME 이니셔티브들은 CBD에서와 같이 van Melle 핵심 구성요소를 구현하기 위한 그들만의 방법을 특징으로 합니다(feature). 이러한 이니셔티브들의 설계 특징(design features)에 대한 간단한 비교가 표 3에 표시되어 있습니다.

표 3. CBD와 다른 CBME 구현 사례의 비교 (Comparing CBD to Other CBME Implementations)

핵심 구성요소(CORE COMPONENT) COMPETENCE BY DESIGN(캐나다 왕립내과외과대학) TRIPLE-C(캐나다 가정의학회) OUTCOMES PROJECT(미국 ACGME) AOA 21(호주 정형외과 협회) INDIVIDUALIZING POSTGRADUATE MEDICAL TRAINING(네덜란드 의학 전문과목 협회)
졸업생을 위한 역량 프레임워크로서의 수련 성과

(Training outcomes organized as a competency framework for graduates)
CanMEDS 프레임워크 CanMEDS-FM 프레임워크 ACGME 6가지 역량(Competencies) AOA 21 교육과정 프레임워크 CanMEDS 프레임워크
초심자에서 전문가로의 정의된 수련 진척

(Defined progression of training from novice to expert)
수련의 단계(Stages) 수련 프로그램을 통한 진척(Progression) ACGME 이정표(Milestones) 수련의 단계(Stages) 전공의 연차(Postgraduate years) 및 EPA
학습자의 요구를 충족하기 위한 맞춤형 학습 경험

(Tailored learning experiences to meet the needs of learners)
시간 가변적(Time-variable), 유연한 수련(flexible training) 프로그램 내에서의 맞춤화(Tailoring) 프로그램 내에서의 맞춤화(Tailoring) 시간 가변적, 유연한 수련 시간 가변적, 유연한 수련
역량 성취에 초점을 맞춘 교수

(Teaching focused on competency achievement)
현장에서의 EPA 주도(EPA-driven), 직접 관찰, 그리고 코칭.

성장 마인드셋.
가정의학 자격 인정을 위한 평가 목표(Assessment Objectives)에 의해 안내되는 교수 ACGME 이정표에 의해 안내되는 교수 단계별 특이적 교육과정(stage-specific curriculum)에 초점을 맞춘 교수 EPA에 초점을 맞춘 교수
프로그램식 평가

(Programmatic assessment)
역량 위원회 리뷰를 포함하는 CBD 평가 프로그램.

다수의 e포트폴리오.
전공의 프로그램 위원회가 검토하는 수련을 위한 지속적 성찰 평가(CRAFT)를 포함하는 Triple-C 평가 프로그램.

다수의 e포트폴리오.
임상 역량 위원회(Clinical Competency Committee) 리뷰를 포함하는 이정표 기반 평가 프로그램.

다수의 e포트폴리오.
지역 수련 위원회(Regional Training Committee) 리뷰를 포함하는 AOA-21 평가 프로그램.

국가적 e포트폴리오.
임상 역량 위원회 리뷰를 포함하는 EPA 기반 평가 프로그램.

다수의 e포트폴리오.

 

이 모든 이니셔티브들은 대규모 변화를 PGME 시스템에 구현하는 데 있어 유사한 도전들(similar challenges)을 보고했습니다.

  • 이 이니셔티브들은 각각 주요한 변화 관리 노력(change management efforts)과 자원을 필요로 했습니다.
  • 이러한 변혁적 교육과정 변화(transformative curriculum changes) 하나하나는 구현을 위해 즉각적으로 교수개발(faculty development)에 대한 주요한 투자(major investments)를 필요로 했습니다 [163] (예: 네덜란드 교육과정만으로도 약 7000명의 임상 지도전문의에게 도달했습니다 [164]).
  • 그들 모두는 새로운 현장 기반 평가(workplace-based assessments)에 대한 이해관계자들의 우려를 보고했습니다 [52, 53, 150, 155, 165, 166]. 비록 네덜란드 시스템과 CBD만이 EPA의 사용을 요구했지만 말입니다.
  • 그들은 또한 시간이 지남에 따라 개선된 디지털 평가 포트폴리오 소프트웨어(digital assessment portfolio software)에 대한 초기 도전들을 공유했습니다. 모든 그룹은 우려하는 이해관계자들로부터의 피드백에 기초하여 평가 요건(assessment requirements)을 수정했습니다(revised).

공통적인 이점(benefits in common)들도 있었습니다.

  • 보고된 모든 곳에서 수련생을 위한 향상된 피드백 기회(enhanced feedback opportunities)가 있었습니다.
  • 이 모든 이니셔티브들은 역량에 대한 판단의 엄격성(rigour of judgments)을 증가시킨 수련생에 대한 역량 위원회 유형(competence committee-type)의 프로그램식 평가(programmatic assessment)를 성공적으로 배치했습니다(deployed) [77, 83, 133, 134, 149].
  • 시간 가변적(Time-variable), 수련생 맞춤형 수련(trainee-tailored training)은 네덜란드, AOA-21, 그리고 CBD에서 다양한 정도(varying degrees)로 달성되었으며, 동시에 서비스 제공(service provision)이 과도하게 영향을 받지 않도록(not overly impacted) 하는 방법을 찾았습니다. (시간 가변성은 Triple-C와 ACGME의 설계 요소는 아니었습니다.)
  • 전반적으로, 21세기를 위한 이 모든 주요한 역량 바탕 PGME 교육과정들은 성공적으로 배치되었고, 지속되었으며(sustained), 시간이 지남에 따라 진화했습니다(evolved) [93, 159, 160, 161, 162, 167, 168, 169].

한계점 (Limitations)

위에서 논의된 바와 같이, 이 논문은 당시 재직 중이던 Royal College 설계 및 구현 팀의 관점(perspective)에서 작성되었습니다. 이는 이 팀이 이용할 수 있었던 데이터를 기술합니다. 그러한 어떤 대규모 변혁(large-scale transformation)에서도, 다양한 이해관계자들로부터의 상이한 관점들(differing perspectives)은 필연적으로 존재합니다. 이것들은 종종 시간에 따라 다르고(vary over time), 해당 이슈(issues in question)에 따라 다르며, 관련된 감정의 강도(degree of intensity of emotion)에 따라 다릅니다. CBD도 예외는 아니었습니다(no exception). CBD가 진화함에 따라, 다른 PGME 이해관계자들과 논평가(commentators)들은 상이한 관점들을 가졌습니다. 이러한 각각의 관점들은 HPE의 변화 리더(change leaders)들을 위한 교훈(lessons)을 가지고 있습니다.

결론 (Conclusions)

Competence by Design은 국가 전공의 교육 시스템(national postgraduate medical education system)에 대한 주요한 변혁적 변화(transformational change)입니다. 14가지 혁신의 묶음(bundle of 14 innovations)인 CBD는 규모 있는(at scale) 역량 바탕(competency-based), 시간 가변적(time-variable), 성과 지향적(outcomes-oriented) 의학교육 구현의 사례(example)를 제공합니다. CBD는 졸업생이 제공하는 환자 진료(patient care)에 영향을 미칠 수 있는 20세기 수련 설계에 대한 반복적인 우려(recurring concerns)들을 다룹니다(addresses). CBME 구현에 관심이 있는 다른 이들은 CBD 설계와 경험으로부터 교훈을 얻을 수 있습니다(learn lessons).

 

 

 

Perspect Med Educ. 2024 Mar 25;13(1):224-228. doi: 10.5334/pme.1342. eCollection 2024.

From Competence by Time to Competence by Design: Lessons From A National Transformation Initiative

 

 

역량 바탕 의학 교육(Competency based medical education, CBME)은 보건 의료 전문직 교육(health professions education, HPE)을 개혁(reform)하기 위한 글로벌 운동(global movement)입니다.

  • 전통적인 시간 기반 훈련(time-based training)과는 대조적으로(In contrast to),
  • 이는 필요한 학습자 능력(learner abilities), 더 큰 학습자 중심성(learner-centeredness), 그리고 의료 제공자(healthcare providers)에 대한 대중의 요구(public’s needs)와의 더 나은 일치(alignment)를 강조하는 교육 설계 접근 방식(educational design approach)입니다.

수많은 이전의 HPE 혁신(innovations)들과는 달리(Unlike), CBME는 여러 제안된 요소(multiple proposed elements)를 갖춘 복잡한 변혁적 변화(complex transformational change)로 틀이 잡혀 있습니다(framed) [1]. 역량 기반 접근 방식(competency-based approach)을 채택하는(employing) 훈련 프로그램들은 그 구현(implementation)을 충실하게(with fidelity) 운용하기 위해(operationalize) 다섯 가지 핵심 구성 요소(core components)를 가질 수 있습니다:

  • 성과 역량(outcome competencies),
  • 점진적 계열화(progressive sequencing),
  • 맞춤형 학습 경험(tailored learning experiences),
  • 역량 중심 수업(competency-focused instruction), 그리고
  • 프로그램적 평가(programmatic assessment)입니다 [2].

전 세계의 보건 의료 전문직 교육 기관, 학문 분야(disciplines), 그리고 프로그램들은 점차 증가하는 속도(ever-increasing rate)로 CBME를 구현하고 있습니다.

  • CBME 운동은 CanMEDS 프레임워크(CanMEDS framework) [3-7],
  • ACGME 성과 프로젝트(ACGME Outcomes Project) [8-10],
  • 위임 가능한 전문 활동(entrustable professional activities) [11, 12],
  • 네덜란드 CBME 교육과정(Dutch CBME curriculum) [13, 14],
  • 신시내티 관찰 가능한 진료 활동(Cincinnati observable practice activities) [15],
  • 캐나다 가정의학회 Triple C 교육과정(College of Family Physicians of Canada Triple C Curriculum) [15-17], 그리고
  • 토론토 대학 정형외과 프로그램(University of Toronto Orthopedic program) [18]과 같은 초기 혁신(early innovations)들과 함께 시작되었습니다.
  • CBME는 이제 스위스, 대만, 호주 정형외과 훈련(Australian Orthopedic training) [19], 핀란드, 남아프리카 공화국, 브라질, 그리고 더 많은 국가에서의 구현(implementations)과 함께 전 세계적으로 확산되었습니다(spread worldwide).
  • 역량 바탕 교육(Competency based education)은 간호학(nursing) [20]과 수의학(veterinary medicine) [21]을 포함하여 의학(medicine)을 넘어선 많은 보건 전문직(health professions)의 일부가 되었습니다.

전 세계적인 구현 노력(global implementation effort)에도 불구하고, CBME를 둘러싼 현재의 담론(current discourse)은 여전히 주로 이론적 토대(theoretical underpinnings)와 잠재력(potential) [22, 23]에 초점이 맞춰져 있으며, 회의적인 비판(skeptical criticisms) [24, 25]에 부딪히고 있습니다(countered). 이러한 CBME 교육과정의 성과(outcomes)를 평가하고 명확히 하려는 초기 노력(early efforts) [26, 27]들이 있습니다. 그러나 혁신의 확산(diffusion of these innovations) 중 이 단계(at this stage)에서 필요한 것은 CBME의 실천(CBME praxis)을 공유하는 것입니다: 즉, 실제(real-life) HPE 시스템에 CBME 접근 방식을 적용(application)한 사례들과 이를 뒤따르는 사람들을 위해 얻은 교훈(lessons learned)입니다.

 

Perspectives on Medical Education의 이번 특별호(special issue)에서, 교육자 팀이 모여 설계에 의한 역량(Competence by Design, CBD)이라고 불리는 독특한 캐나다식 CBME 구현 구성(configuration)을 기술(describe)했습니다. 전 세계적으로, 대다수의 CBME 혁신은 van Melle의 CBME 핵심 구성 요소(van Melle Core Components) 중 두 가지인 역량 프레임워크(competency frameworks) 또는 프로그램적 평가(programmatic assessment)를 구현하는 데 초점을 맞춰왔습니다 [28]. CBD는 의학 훈련(medical training)의 현재 과제(current challenges)를 해결하기(address) 위해 다섯 가지 핵심 구성 요소(five Core Components) 모두와 (역량 위원회(competence committees)와 같은) 가용한 최상의 설계 요소(design elements)를 사용하여 의도적으로 구축(deliberately built)되었습니다. CBD는 캐나다의 전문의 의학 교육(specialty medicine education)을 졸업 후 의학 교육(postgraduate medical education)을 위한 국가적(national)이고, 시간 가변적(time-variable)인 역량 기반 다전문과목 시스템(competency-based multi-specialty system)으로 바꾸는 변혁적 변화(transformational change)입니다. 이 논문들의 목적(aim)은 더 큰 글로벌 CBME 구현(global CBME implementation)의 맥락(context)에서 CBD의 이야기를 전하는 것입니다. 이 논문들은 국가적 규모(national scale)에서의 CBME 구현의 도전(challenges)과 성공(successes)을 식별하고, 근거(rationale), 접근 방식 및 방법론(approach and methodology), 맞춤형 설계 요소(tailored design elements), 초기 성과(early outcomes) 및 얻은 교훈(lessons learned)을 포함하여 CBD 구현에 있어 캐나다 왕립 내과 및 외과 대학(Royal College of Physicians and Surgeons of Canada, Royal College)이 취한 독특한 접근 방식(unique approach)을 분명히 보여줍니다(articulate). 이 논문들은 방법 가이드라인(how-to guidelines) 시리즈가 아니며, 모범 사례(best practices)로 틀을 잡은 것도 아님(nor are they framed)에 유의하십시오. CBD는 성공(successes)과 함정(pitfalls)이 공존하는 실제 맥락(real-life context)에서 구현된 CBME의 한 사례(example)입니다. 우리는 전 세계의 독자들이 이러한 서술(descriptions) 속에서 자신들과 그들의 프로그램을 발견하고, 대규모 CBME 구현(large scale CBME implementation)이라는 그들만의 독특한 경로(unique path)를 가속화(accelerated)할 수 있기를 바랍니다.

 

CBD 특별 모음(The CBD Special Collection)은 아홉 편의 논문으로 구성되어 있습니다(made up of):

  1. CBD에 대한 주력 설명(flagship description)에서, Frank 등[29]은 변화의 근거(rationale for change)와 CBD의 주요 특징(key features) 및 의도적인 설계 요소(intentional design elements)를 기술합니다.
  2. Karpinski 등[30]은 졸업 후 의학 교육(postgraduate medical education)에서 이러한 국가적 변혁적 변화(national transformational change)를 구현하는 데 취해진 접근 방식의 세부 사항(details of the approach)을 기술합니다.
  3. 학습을 위한 평가(assessment for learning)를 발전시키기(advance) 위해, Richardson 등[31]은 CBD의 일환으로서 즉각적인 코칭(coaching in the moment)과 장기간에 걸친 코칭(coaching over time)을 정의하기 위해 취해진 접근 방식에 대해 상술합니다(elaborate).
  4. Cheung 등[32]은 학습자의 발달(learner development)을 지원하고 학습자의 진척(learner progress)에 대한 판단(judgements)에 정보를 제공하기 위해, 시간의 흐름과 맥락(contexts)을 가로질러 다양한 평가 전략(multiple assessment strategies)을 사용하는 프로그램적 평가(programmatic assessment)에 대한 CBD 접근 방식을 기술합니다.
  5. 다음으로 Oswald 등[33]은 역량 위원회(Competence Committee) 설계, 교수 개발(faculty development) 및 질 향상(quality improvement)에 대한 국가적으로 통합된 전략(nationally integrated strategy)을 논의하며, 주요 설계 특징의 운용(operationalization)과 도전 및 평가를 통해 얻은 교훈을 성찰합니다(reflecting on).
  6. Bhanji 등[34]은 CBD 내에서 고부담 국가 평가 및 시험(high-stakes national assessment and examination)의 역할에 대한 관점(perspectives)을 제시하고, 역량 기반 국가 인증 과정(competency-based national certification processes)에서 고부담 시험이 어떻게 적응(adapted)되어야 하는지에 대한 통찰력(insight)을 제공합니다.
  7. Dalseg 등[35]은 CBME의 조력자(enabler)로서의 인증(accreditation)을 성찰하며, CBD 구현과 병행하여(in parallel with) 성과 기반 국가 인증 시스템(outcomes-based national accreditation system)으로의 전환(transition)을 기술합니다.
  8. CBD에서의 교수 및 전공의 개발(faculty and trainee development)의 주요 특징을 기술하며, Atkinson 등[36]은 국가 수준(national level)에서 각 전문과목(specialty)을 위한 훈련 프로그램의 재설계(redesign)를 촉진하고(facilitating) 학문 분야와 프로그램 전반에 걸쳐 더 일반적으로 구현을 지원하는 데 있어서의 도전, 조력자(enablers), 그리고 얻은 교훈을 강조합니다(highlight).
  9. 마지막으로, Hall 등[37]은 구현 준비(readiness to implement), 구현의 충실도와 진정성(fidelity and integrity of implementation), 그리고 성과(outcomes)라는 세 가지 기둥(three pillars)을 중심으로 구축된 CBD를 위한 견고한 국가적 프로그램 평가 전략(national program evaluation strategy)의 의도적인 통합(intentional incorporation)을 기술하고, 일부 초기 평가 결과(early evaluation findings)를 공유합니다.

 

여느 변혁적 변화 과정(transformational change process)과 마찬가지로, CBD의 수년간에 걸친 국가적 출범(multi-year national launch)은 새로운 도전과 예기치 못한 영향(unanticipated impacts)을 가져왔습니다. 공식적인 프로그램 평가(formal program evaluation)와 파트너 그룹(partner groups)의 피드백 모두에서 얻은 6년 간의 근거(Six years of evidence)는 이론을 실제(practice)로 옮기는 것(translating theory into)이 복잡한 과업(complex task)이라는 명확한 신호(clear signals)를 제공합니다 [38, 39]. CBD와 같은 대규모 혁신(large-scale innovation)이 향상된 훈련(improved training)이라는 초기 약속(initial promises)의 많은 부분을 이행하기(deliver on) 위해서는 추가적인 작업(Further work)이 필요합니다. 전 세계의 독자들은 이 모음집(collection)에서 CBME의 원칙(principles)을 가져와 기능하고 있는 국가 시스템(functioning national system)에 대한 주요 업데이트(major update)를 설계하고 구현하려는 의학 교육자들의 노력(efforts)에 대한 서술을 발견하게 될 것입니다. 역량 기반 혁신, 설계 요소, 그리고 함정(pitfalls)에 대한 사례(examples)를 찾고 있는 기관(Institutions)과 교육자들은 CBD의 본격적인 전개(rollout)를 기술하는 아홉 편의 논문에서 풍부한 선택지(rich selection)를 발견하게 될 것입니다.

 

 

Acad Med. 2025 Oct 1;100(10):1134-1149. doi: 10.1097/ACM.0000000000006134. Epub 2025 Jun 25.

Artificial Intelligence to Support Qualitative Data Analysis: Promises, Approaches, Pitfalls

 

 

안녕하세요! 요즘 챗GPT(ChatGPT) 같은 생성형 AI가 연구 분야에서도 뜨거운 감자죠? 🔥 특히 숫자로 딱 떨어지는 양적 연구가 아닌, 인터뷰나 텍스트의 숨은 의미를 찾아야 하는 질적 데이터 분석(Qualitative Data Analysis, QDA)에서도 AI를 써도 될지, 쓴다면 어떻게 써야 할지 고민이 많으실 거예요.

 

오늘 소개할 논문은 바로 이 질문에 대해 아주 명쾌하고 비판적인 시각을 제공합니다. 연구자들이 AI를 '어떻게' 쓸 수 있는지, 그리고 '무엇을' 조심해야 하는지 꼼꼼하게 짚어준 논문이에요. 핵심 내용만 쏙쏙 뽑아 정리해 드릴게요! 🧐


1. AI가 주는 약속 (The Promise): 든든한 조수, 하지만 대장은 나!

이 논문은 AI가 단순히 시간을 아껴주는 도구를 넘어, 연구의 진입 장벽을 낮추는 '파괴적 혁신(Disruptive Innovation)'이 될 수 있다고 말해요. 비용이나 언어 장벽 때문에 연구를 못 했던 사람들에게 기회를 줄 수 있다는 거죠.

하지만 AI가 완벽한 건 아닙니다. 연구진은 AI를 '팀의 일원'으로 보되, 절대적인 리더가 아닌 '주니어 멤버'로 생각하라고 조언합니다.

"AI는 가상 동료, 초심자... 그럼에도 유용한 기여를 할 수 있는 존재로서 역할을 수행할 수 있습니다."
"AI can serve as a virtual colleague, a novice … who nevertheless can make a useful contribution."

 

즉, 전사(Transcription)나 번역, 텍스트 요약 같은 일은 AI가 기가 막히게 잘하지만, 깊은 의미를 찾아내는 건 여전히 사람의 몫이라는 거죠.

2. 어떻게 쓸 수 있을까? (Approaches): 주제 분석부터 담론 분석까지

논문에서는 AI를 활용한 여러 접근법을 소개해요.

  • 주제 분석 (Thematic Analysis): 방대한 데이터에서 코드(Code)를 찾고 패턴을 발견하는 데 도움을 줄 수 있어요.
  • 담론 분석 (Discourse Analysis): 특히 거대 언어 모델(LLM)을 이용한 토픽 모델링(Topic Modeling)은 우리가 평소에 놓치기 쉬운, 너무나 당연해서 보이지 않는 '헤게모니(Hegemony)'를 발견하는 데 유용하다고 해요.

하지만 연구진은 챗GPT 같은 LLM을 사용할 때 프롬프트(Prompt)를 아주 정교하게 짜야 한다고 강조합니다. 대충 물어보면 대충 답하거든요. 😅

3. 주의해야 할 함정 (Pitfalls): 편한 게 능사는 아니다! 🚨

이 부분이 정말 중요해요! AI는 기본적으로 확률적(Probabilistic) 모델이지, 의미를 이해하는 존재가 아니에요. 그래서 그럴듯한 거짓말, 즉 '환각(Hallucination)'을 만들어낼 수 있어요.

 

더 무서운 건, AI가 분석을 너무 쉽게 해주다 보니 연구자가 데이터와 멀어질 수 있다는 점이에요. 질적 연구는 연구자가 데이터에 푹 빠져서(Immersion) 그 안의 미묘한 의미를 읽어내야 하는데, AI에게만 의존하면 그 '감'을 잃게 되죠.

"분석을 아웃소싱하는 것은... 연구 품질에 영향을 미치고... 연구자들에게서 데이터와의 정서적 연결—친밀감, 자부심, 주인의식—을 앗아갑니다."
"Outsourcing analysis … impacts research quality [and] robs [researchers] of their emotional connection—the intimacy, pride, and ownership—with the data."

4. 성찰성 (Reflexivity): AI도 편향이 있다?

질적 연구에서 연구자의 주관성을 성찰하는 건 필수죠. 이 논문은 AI도 하나의 '팀원'으로서 성찰의 대상이 되어야 한다고 제안해요. AI가 어떤 데이터로 학습했는지(개인적 렌즈), AI가 연구자와 어떻게 상호작용하는지(대인적 렌즈) 등을 따져봐야 한다는 거죠. AI의 알고리즘은 '보이지 않는 손(Invisible Hand)'처럼 우리 분석에 영향을 미치니까요.


💡 결론: 인간이 루프를 장악해야 한다!

결국 이 논문의 결론은 "AI를 쓰지 말라"가 아닙니다. "잘 알고, 똑똑하게 쓰자"는 거예요. AI는 엄청난 잠재력을 가지고 있지만, 그 운전대는 반드시 사람이 잡고 있어야 합니다. 연구진의 마지막 핵심 조언을 인용하며 마칠게요.

"'인간을 루프 안에(human in the loop)' 두어야 할 뿐만 아니라, 인간이 루프를 책임져야(in charge of the loop) 합니다." "Not only must there be a ‘human in the loop,’ the human must be in charge of the loop."

 

여러분도 AI라는 강력한 도구를 활용하되, 연구의 주인으로서 날카로운 통찰력을 놓치지 마시길 바랍니다! 💪

 


인공지능(Artificial intelligence, AI)은 우리 존재(existence)의 많은 측면에 침투하여(infiltrated), 우리의 직업적, 개인적 삶에 강력한 약속(powerful promises)과 엄청난 골칫거리(tremendous troubles)라는 새로운 긴장(new tensions)을 도입했습니다. 보건 의료(health care), 교육(education), 연구(research) 분야에서 AI의 역할에 대한 수많은 담론(discourses) 속에서, 우리는 AI가 질적 연구(qualitative research)를 어떻게 지원할 수 있는지를 명확히 설명하는 데(articulating) 있어 격차(gap)가 있음을 인식합니다. 연구자들(초심자와 전문가 모두)과 저널 편집자들은 서술형 데이터 분석(analysis of narrative data), 즉 질적 데이터 분석(qualitative data analysis [QDA])에 있어 AI의 능력(capabilities), 결점(shortcomings), 역할(roles), 위험(dangers), 그리고 윤리적 파장(ethical repercussions)에 대한 비판적 평가(critical appraisal)를 통해 혜택을 얻을 수 있을 것입니다. 우리의 목적은 그러한 평가(appraisal)를 제공하는 것입니다.

 

이 논문은 3가지의 구별되는 활동(distinct activities)을 기술합니다:

  • (1) QDA를 위해 챗GPT(ChatGPT)를 사용한 즉흥적인 실험(extemporaneous experiment),
  • (2) QDA를 위한 AI 사용에 대한 주제 범위 문헌 고찰(scoping review), 그리고
  • (3) QDA를 위해 AI를 사용하는 것의 역사, 현재의 사용, 잠재적인 약속(행동 유도성[affordances], 적용[applications]) 및 함정(pitfalls)에 대한 비판적 탐구(critical exploration)입니다.

이 논문은 튜토리얼(tutorial)이 아닙니다. 사용 가이드(how-to guide)가 바람직할 수도 있겠지만, 우리는 몇 가지 이유로 그것을 미루고자(defer) 합니다.

  • 그것은 시기상조(premature)일 것입니다: 우리는 먼저 QDA를 위한 AI 사용이 과연 좋은 아이디어인지부터 고려해야 합니다.
  • 그것은 불완전할(incomplete) 것입니다: 다른 문제들을 다루면서 특정 방법론(specific methods)을 적절히 상세화하는 것은 불가능할 것입니다.
  • 이 분야는 너무 빨리 움직이고 있습니다(moving too fast): 상세한 지침은 금방 구식(outdated)이 되어버릴 것입니다.
  • 가장 중요한 것은, 우리의 목적이 광범위하고 지속적인 문제들(broad, enduring issues)—즉 약속(promises)과 잠재적 함정(potential pitfalls)—에 초점을 맞추는 것이라는 점입니다.

정의 (Definitions)

 

현재의 목적을 위해, 우리는 QDA를 서술형(비수치적) 데이터(narrative [nonnumeric] data)에 대한 모든 분석으로 정의합니다. QDA는 공식적인 학술 연구(formal academic research), 시장 조사(market research), 프로그램 평가(program evaluation), 정책 문서 생성(creation of policy documents)에 사용됩니다. 이러한 사용은 광범위한 존재론(ontologies, 진리의 본질에 대한 믿음), 인식론(epistemologies, 진리가 어떻게 학습될 수 있는지), 패러다임(paradigms), 그리고 방법론(methods)을 포괄합니다.

 

부록 1(Appendix 1)은 AI와 관련된 핵심 개념(key concepts)에 대한 간략한 검토를 포함하고 있습니다. 다른 출처들이 더 상세한 소개(detailed introductions)를 제공합니다. 우리는 AI가 확률적(probabilistic)이며 지각이 있는 것(sentient)이 아님을 강조합니다; AI는 패턴을 식별하는 데(identifying patterns) 탁월하지만 의미를 추론(infer meaning)할 수는 없습니다. 우리는 독자들에게 현재 챗GPT(ChatGPT)가 유행(in vogue)하고 있지만, 그것이 AI와 동의어(synonymous)는 아니라는 점을 상기시킵니다.

  • 챗GPT는 OpenAI의 생성형 사전학습 트랜스포머(generative pretrained transformer, GPT)로 가는 사용자 인터페이스(user interface, 앞문[front door])일 뿐이며,
  • GPT는 수많은 거대 언어 모델(large language models, LLMs) 중 하나일 뿐이고, LLM은 AI의 한 유형일 뿐입니다.

이러한 떠오르는 "기반 모델(foundation models)"들이 이전의 AI 도구들과 비교하여 새로운 능력(novel capabilities)을 가지고 있기는 하지만, 우리는 대부분의 경우 의도적으로 이것들을 구별하지 않습니다; 대신, 우리는 AI의 사용을 일반적인 용어(general terms)로 논의하여 사용자들이 자신의 필요에 가장 적합한 도구(tools best suited)를 고려할 수 있도록 합니다.

 

QDA를 위한 챗GPT: 증례 보고 (ChatGPT for QDA: A Case Report)

 

이 논문의 추진력(impetus)은 챗GPT(OpenAI, San Francisco, California)가 QDA를 위해 즉시 사용 가능한 도구(out-of-the-box tool)로서 어떻게 기능할 수 있을지에 대한 우리의 개인적인 호기심(personal curiosity)이었습니다. 다른 과업(tasks)들에서의 챗GPT의 성공에 자극받고(prompted), 이전 저자들의 탐색적 QDA 노력(exploratory QDA efforts)에 고무되어, 우리는 3개의 기존 서술형 데이터셋(existing narrative datasets)을 재분석(reanalyze)하기 위해 챗GPT-4(2024년 2월 기준)를 테스트했습니다. 부록 2(Appendix 2)는 우리의 경험을 간략히 기록하고 있으며(chronicles), 추가 디지털 부록 1(Supplemental Digital Appendix 1)은 더 자세한 세부 사항을 제공합니다. 요약하자면, 반복적인 노력(repeated efforts)에도 불구하고, 우리는 실질적인 가치(substantial value)가 있는 분석 결과를 도출(elicit)할 수 없었습니다. 우리는 이 노력을 대체로 실패(failure)로 간주했으며, 돌이켜보면(in retrospect) 이것은 우리의 순진함(naivete)—기대치(expectations), QDA를 위한 컴퓨터 사용, 프롬프트 엔지니어링의 정교함(sophistication of prompt engineering, 특히 다단계 및 고차원적 요청[multistep and high-level requests] 사용)에 있어서의—과 챗GPT의 내재적 결점(inherent shortcomings)이 결합된 결과라고 생각합니다.

 

주제 범위 문헌 고찰 (Scoping Review)

 

이러한 경험은 AI가 QDA를 어떻게 지원해 왔는지에 대해 더 배우도록 우리를 자극했고(prompted), 이에 우리는 주제 범위 문헌 고찰(scoping reviews)을 위해 수용된 방법(accepted methods)에 따라 QDA에서의 AI에 대한 체계적이지만 제한적인(systematic but limited) 주제 범위 문헌 고찰을 수행했습니다. 우리의 방법(methods), 결과(results), 한계(limitations)는 여기에 간략히 요약되어 있으며 추가 디지털 부록 2(Supplemental Digital Appendix 2)에 자세히 기술되어 있습니다. 전문 연구 사서(expert research librarian)의 지원을 받아, 우리는 2024년 2월과 5월에 Scopus, PsycInfo, Web of Science, ERIC, Google, Google Scholar를 체계적으로 검색(systematically searched)했습니다. 우리는 언어에 상관없이(in any language) AI가 지원하는 QDA(AI-supported QDA)를 다룬 모든 출판물(예: 원저 연구[original research], 리뷰[review], 사설[editorial])을 포함시켰습니다. 한 명의 저자(One author, D.A.C.)가 DistillerSR(Distiller SR Inc., Ottawa, Ontario, Canada)를 사용하여 논문 포함 여부 결정(article inclusion)과 데이터 추출(data extraction)을 수행했습니다. 필요에 따라 논문을 번역(translate)하기 위해 구글(Google)이 사용되었습니다. 포함 기준(inclusion criteria)을 위해 스크리닝(screened)된 483편의 논문 중, 130편이 포함 기준을 충족했습니다. 64편은 2023년 또는 2024년 1월에서 5월 사이에 출판되었습니다. 표 1(Table 1)은 주요 연구 특징(key study features)을 보고하며, 추가 디지털 부록 3(Supplemental Digital Appendix 3)은 모든 논문을 나열합니다. 이 리뷰의 한계(limitations)로는 한 명의 검토자(one reviewer)에 의한 수행, 제한적인 데이터 추출(limited data extraction), 그리고 관련 연구의 누락 가능성(possible omission) 등이 있습니다.

 

 

QDA에서 AI의 잠재적 약속과 함정 (Potential Promises and Pitfalls of AI in QDA)

 

맥락 속의 기술: 컴퓨터 보조 QDA 기능 (Technology in context: Computer-assisted QDA functions)

 

주제 범위 문헌 고찰(scoping review) 초기에, 우리는 컴퓨터 보조 질적 데이터 분석 소프트웨어(computer-assisted qualitative data analysis software, CAQDAS)의 역사에 대한 이해(appreciation)를 얻게 되었습니다. 1963년부터 컴퓨터는 QDA를 지원해왔으며, 현재 수십 개의 무료 소프트웨어(freeware)와 상용 도구(commercial tools)가 이용 가능합니다(예: NVivo, Atlas.ti, MAXQDA, Dedoose). 전통적인 CAQDAS 제품들은 다수의 유용한 기능(useful functions)을 제공하며, 이들 중 대부분은 일반적인 의미(usual sense)에서의 "AI"를 필요로 하지 않습니다. 다음은 그러한 기능들입니다(상세 내용은 표 2 및 다른 출처 참조):

 

 

표 2 - 컴퓨터 보조 질적 데이터 분석 소프트웨어(CAQDAS)의 핵심 기능 (Core Functions of Computer-Assisted Qualitative Data Analysis Software [CAQDAS])

이 목록은 CAQDAS가 질적 데이터 분석을 지원할 수 있는 8가지 기능과 해당 기능이 수행할 수 있는 구체적인 코딩 또는 패턴 탐색 과업을 설명합니다.

  • 텍스트 검색 (Text retrieval)
    • 설명: 특정 단어 또는 구문(specific words or phrases)을 식별하고 표시함.
    • 출력물: 텍스트(text), 표(table), 트리 다이어그램(tree diagram).
    • 적용 (데이터 탐색 및 코딩): 직감(hunches)을 탐색함; 텍스트 검색 후 코드 적용.
    • 적용 (패턴 탐색): 해당 없음(NA).
  • 단어 빈도 (Word frequencies)
    • 설명: 자주 사용된 단어 및 단어 군집(word clusters)을 식별하고 표시함.
    • 출력물: 목록(list), 워드 클라우드(word cloud), 군집 다이어그램(cluster diagram).
    • 적용 (데이터 탐색 및 코딩): 텍스트를 탐색함; 직감(hunches)을 확인함.
    • 적용 (패턴 탐색): 해당 없음(NA).
  • 예시를 통한 질의 (Query by example)
    • 설명: 머신러닝 알고리즘(Machine learning algorithm): 연구자가 관심 있는 텍스트 세그먼트(text segment of interest)를 식별하면, 프로그램이 유사한 텍스트(similar text)를 찾도록 학습함.
    • 출력물: 목록(list), 표(table).
    • 적용 (데이터 탐색 및 코딩): 직감(hunches)을 탐색함; 텍스트 검색 후 코드 적용.
    • 적용 (패턴 탐색): 해당 없음(NA).
  • 코드 빈도 (Code frequency)
    • 설명: 코드(이전에 인간에 의해 적용된)를 식별하고 계산함(Identify and count codes).
    • 출력물: 목록(list), 표(table), 교차 분석표(cross-tabulation).
    • 적용 (데이터 탐색 및 코딩): 코드북 정제(Refine the codebook): 낮은 빈도의 코드를 병합(더 추상적으로 재개념화), 너무 광범위한 코드를 분할(세분화[drill down]), 전체 데이터셋 또는 특정 사례에 대해 이미 텍스트에 적용된 코드를 변경하거나 삭제함.
    • 적용 (패턴 탐색): 사례(참여자)들 또는 사례 속성(case attributes) 간의 유사점이나 차이점을 찾음; 코드 간의 연관성(associations)을 탐색함.
  • 코드 검색 (Code retrieval)
    • 설명: 주어진 코드가 할당된 모든 텍스트 세그먼트(text segments)를 식별하고 표시함.
    • 출력물: 목록(list), 표(table), 코드와 인용문(codes and quotations), 인용문과 코딩 스트라이프(coding stripes).
    • 적용 (데이터 탐색 및 코딩): 코드북 정제(코드 빈도와 동일); 코드 또는 하위 코드(subcodes) 내의 텍스트 세그먼트를 비교함(예: 하위 코드가 구별되는가?); 코더(coder) 간 또는 시간에 따른 코딩을 비교함.
    • 적용 (패턴 탐색): 상위 구성개념(higher-order constructs)을 식별함.
  • 코딩 동시 발생 (Coding co-occurrence)
    • 설명: 코드 간의 연결(connections among codes)을 식별함(중복[overlapping], 인접[adjacent], 순차적으로 정렬된 코드[sequentially ordered codes]).
    • 출력물: 연결 다이어그램(linkage diagram: 덴드로그램, 집괴 다이어그램, 군집 분석, 다차원 지도), 빈도 목록, 빈도 매트릭스, 표.
    • 적용 (데이터 탐색 및 코딩): 해당 없음(NA).
    • 적용 (패턴 탐색): 코드 간의 연결 고리(linkages)를 식별함; 텍스트 내 코드의 순서(sequence)를 비교함(즉, 가능한 인과 관계[causal relationships]).
  • 코더 일치도 (Coder agreement)
    • 설명: 코드에 대한 평가자 간(Interrater) 또는 평가자 내(intrarater) 일치도.
    • 적용 (데이터 탐색 및 코딩): 2명 이상의 코더 간의 일치 및 불일치(agreement and disagreement)를 검토함; 단일 평가자의 자가 재코딩 일치도(recoding agreement with self)를 확인함.
    • 적용 (패턴 탐색): 해당 없음(NA).
  • 코더별 코드 빈도 (Code frequency by coder)
    • 설명: 코더별로 코드를 계산함(Count codes by coder).
    • 적용 (데이터 탐색 및 코딩): 코더별로 유사한 코드 빈도(similar code frequencies)가 있는지 확인함.
    • 적용 (패턴 탐색): 해당 없음(NA).

  • 텍스트 검색 (Text retrieval): 문서 내의 특정 단어 또는 구문(specific words or phrases)의 식별.
  • 단어 빈도 (Word frequencies): 문서 내의 단어와 단어 군집(word clusters)을 세고 이를 표시하는 것.
  • 예시를 통한 질의 (Query by example): 연구자가 관심 있는 텍스트 세그먼트(text segments of interest)를 식별하면, 컴퓨터가 유사한 텍스트(similar text)를 인식하도록 학습하는 것(지도 머신러닝[supervised machine learning]).
  • 코드 빈도, 검색, 및 동시 발생 (Code frequency, retrieval, and co-occurrence): 인간이 문서를 코딩(code)한 후, 컴퓨터가 코드를 세거나, 주어진 코드가 할당된 텍스트 세그먼트를 표시하거나, 코드 간의 연결(connections among codes, 예: 중복되거나 인접한 텍스트)을 식별하는 것.
  • 코더 일치도 (Coder agreement): 평가자들이 문서에 루브릭(rubric)을 적용할 때 얼마나 자주 일치하는지에 대한 통계적 계산(statistical computation).

 

AI가 지원하는 QDA는 새로운 것이 아님 (AI-supported QDA is not new)

 

우리는 주제 범위 문헌 고찰에서 또 다른 교훈(lesson)을 얻었습니다: QDA를 위한 AI의 사용은 새로운 것이 아닙니다(not new). 사실(True), 2022년 11월 챗GPT(ChatGPT) 출시 이후, 여러 인기 있는 CAQDAS 제품들이 AI 도구를 적극적으로 홍보(actively promoted)했습니다. 이러한 도구 중 일부는 새로운 것이지만, 많은 경우 단순히 기존 능력(existing capabilities)에 대한 홍보 우선순위를 재조정한 것(reprioritized promotion)을 반영할 뿐입니다.

 

사실, AI는 25년 이상 QDA를 지원하는 데 사용되어 왔습니다.

  • Qualrus(현재 이용 불가)와 DiscoverText는 초기의 목적 맞춤형 도구(purpose-built tools) 중 하나였으며;
  • 챗GPT 이전에 존재했던(predating) 다른 도구들로는 Wordstat, QDA Miner, Leximancer가 있습니다.
  • 더욱이, 현대의 프로그래밍 플랫폼(programming platforms)은 서술형 텍스트 분석(analysis of narrative text)을 지원하는 전체 라이브러리(entire libraries)를 보유하고 있습니다(예: Python의 NLTK, SpaCy, TextBlob; R의 tm, text2vec, lda, spacyr, quanteda).
  • 챗GPT 출시에 따른 소동(furor)은 입증된 QDA 기능성(demonstrated QDA functionality)이라기보다는 주로 인식(awareness), 사용자 친화성(user-friendliness), 그리고 추측되는 이점(conjectured benefits)의 결과인 것으로 보입니다.

기술이 QDA를 혁신(revolutionize)하겠다고 약속한(누군가는 위협했다[threatened]고 말할 수도 있는) 것은 이번이 처음이 아닙니다.

  • 40년 전, 휴대용 카세트 녹음기(portable cassette recorder)의 발명은 유사한 격변(upheaval)을 일으켰습니다. 이전까지의 데이터 수집은 필기 노트(written notes)에 의존했고, 민족지학적 관찰(ethnographic observation)이 지배적이었습니다. 갑자기, 기술은 대화의 축어적 기록(verbatim recording)을 가능하게 했습니다.
    • 이것은 새로운 분석 기법(new analysis techniques, 예: 대화 분석[conversation analysis]),
    • 그에 상응하는 해결책을 필요로 하는 새로운 문제들(new problems with corresponding solutions, 예: 전사[transcription]의 필요성),
    • 그리고 데이터 소싱의 새로운 위계(new hierarchies in data sourcing, 예: 민족지학을 대체하는 인터뷰와 포커스 그룹)로 이어졌습니다.

그렇긴 하지만(That said), 현재의 "AI 혁명(AI revolution)"은 과거의 변혁(transformations)과는 다를 수 있습니다.

  • 첫째, 이것은 졸졸 흐르는 물(trickle)이 아니라 "해일(tidal wave)"이며, 추측(speculation), 약속(promises), 그리고 제품들(검증된 것과 시도되지 않은 것 모두)의 홍수(deluge)가 거의 하룻밤 사이에 나타나고 있습니다.
  • 둘째, 사람들이 연구 커뮤니티 밖에서(outside the research community) 이 기술을 사용하고 있습니다—잠재적 연구 참여자와 연구자 자신들 모두 일상생활에서 AI를 사용합니다.
  • 셋째, LLM과 다른 떠오르는 AI 도구들은 진정으로 변혁적인 잠재력(truly transformative potential)을 가진 능력들(다양한 과업 수행, 지시와 데이터 해석, 콘텐츠 생성)을 가지고 있습니다.
  • 넷째, AI는 끊임없이 그리고 빠르게 진화하고 있습니다(constantly and quickly evolving, 예: 카세트 녹음기와 대조적으로). 각 반복(iteration)마다 어떤 문제들은 해결되지만, 다른 문제들은 고조되고(escalate), 새로운 문제들이 등장합니다.
  • 다섯째, AI 혁명과는 별개로, 학계에서는 "출판하지 않으면 도태된다(publish or perish)"는 압력이 증가하고 있습니다. 떠오르는 AI 도구들이 빠르고 대량의 연구(rapid, high-volume research)를 촉진할 수 있다는 제안(proposition)은 이들의 수용(embrace)을 고조시킬 수 있습니다

 

약속: AI가 어떻게 도울 수 있는가? (The promise: How can AI help?)

 

AI는 특정 과업(tasks)을 더 잘 수행함으로써("존속적[sustaining]" 혁신) 그리고 해결책(solutions)을 더 접근 가능하게 만듦으로써("파괴적[disruptive]" 혁신) 도울 수 있습니다. 현대의 AI 도구들은 이용 가능한 CAQDAS 도구들이나 인간 연구자들보다 일부 QDA 과업을 더 잘(better) 수행합니다. 이는 전사(transcription)와 언어 번역(language translation)에 있어 사실인데, 현재의 AI 도구들은 비용의 일부(fraction of the cost)만으로 숙련된 인간(skilled humans)에 필적하는(rival) 산출물을 생성합니다. AI는 또한 텍스트 내의 패턴을 식별하고(identifying patterns), 발췌문을 추출하고(extracting excerpts), 요약을 생성하는(generating summaries) 데 있어 전통적인 CAQDAS를 넘어설 수도 있습니다.

 

다른 과업들에 대해서는, AI가 인간이나 기존 도구들보다 실제로 더 나쁠(worse) 수도 있습니다. 그러나, AI는 여전히 파괴적 혁신(disruptive innovation)을 통해 중요한 기여(important contributions)를 할 수 있습니다. 어떤 파괴적 혁신이든, 현재의 성능(current performance)은 다른 (이상화된) 접근법들보다 덜 효과적(less effective)이지만, 새로운 접근법은 더 큰 사용자 집단에게 훨씬 더 접근 가능(more accessible)합니다. 비용(cost), 훈련(training), 언어(language)와 같은 장벽(barriers)을 낮춤으로써 달성된 그러한 향상된 접근성(enhanced accessibility)은 감소된 효과성(reduced effectiveness)을 무색하게 만들고(overshadows) 순 승리(net win)라는 결과를 낳습니다. 챗GPT(ChatGPT)와 같은 거대 언어 모델(LLMs)들은 비록 현재로서는 많은 목적 맞춤형 CAQDAS나 AI 접근법들보다 덜 효과적일지라도, 언어, 교육, 경제, 문화의 장벽을 초월하는(transcends) 지식과 전문성의 전 지구적 민주화(global democratization)를 가능하게 할지도 모릅니다.

 

귀납적 및 연역적 텍스트 분석을 위한 AI (AI for inductive and deductive text analysis)

 

QDA는 흔히 귀납적 분석(inductive analysis)—질적 데이터로부터 새로운 코드(novel codes)와 패턴을 개방적이고 탐색적으로 식별하는 것(open, exploratory identification)—을 포함합니다.

  • 비록 많은 연구자가 이 과업을 즐겁게 생각하지만, 그럼에도 불구하고 이는 노력이 들고(effortful), 어렵고, 지저분하며(messy), 시간 소모적입니다.
  • 연구자들은 향상된 효율성(enhanced efficiency)을 바랄 뿐만 아니라, 일부는 불완전한 연구(imperfect research)에 대한 죄책감(guilt)이나 두려움(분석을 "제대로" 했는가?)을 경험하거나, 혹은 자신의 관점(viewpoint: 렌즈[lens], 위치성[positionality], 또는 개인적 관점[personal perspective])이 무심코 중요한 무언가를 놓치거나 오해하게 만들었는지(inadvertently miss or misinterpret) 궁금해합니다.
  • 그들은 데이터를 조직화(organizing) 및 시각화(visualizing)하고, 주제를 강조(highlighting themes)하며, 새로운 통찰을 식별(또는 확인)하는 데 있어 지원(support)을 원합니다.

 

QDA는 또한 흔히 연역적 분석(deductive analysis)—정의된 코드(defined codes: 선험적으로[a priori] 선택되거나 초기 단계에서 귀납적으로 식별된)를 서술형 데이터셋(narrative dataset)에 적용하는 것—을 포함합니다.

  • 이 또한 지루하고(tedious) 시간 소모적일 수 있습니다.
  • 게다가, 많은(전부는 아니지만) 연구 프로토콜은 인간 코더들이 코드에 일치(agree on codes)할 것을 요구하는데, 이는 신뢰도(reliability), 편향(bias), 독립성(independence), 협업(collaboration), 갈등 탐지(conflict detection), 합의 구축(consensus building)에 대한 우려를 제기합니다.
  • 일부 저자들은 또한 연구 팀 내에 존재하는 거의 피할 수 없는 위계(inevitable hierarchies)를 고려할 때 합의가 냉철할(dispassionate) 수 있는지 의문을 제기합니다.

우리는 QDA 연구자들이 AI에게 데이터셋을 맡기고(take their dataset, 혹은 더 나아가 데이터셋을 자동으로 수집하여) 연구 질문에 답하도록 자율적으로 분석(autonomously analyze)하게 요청하고 싶은 유혹(lure)을 느낄 수 있음을 이해합니다(appreciate). 이것은 위에 나열된 힘들고 지루한 단계들을 우회하고(bypass) 잘 만들어진 최종 답변(final well-crafted answer)을 내놓을 것입니다. 그러나, 우리는 이것이 가능할지라도, 실제로는 바람직하지 않다(undesirable)고 주장합니다. 이 "이상적인" 세계는 유토피아적이라기보다는 디스토피아적(dystopian)입니다.

  • 그것은 순진하게도(naively) AI에게 책임을 맡겨(puts AI in charge), 인간을 루프에서 제거(removing the human from the loop: 통제와 감독[control and oversight]을 포기함)합니다.
  • 그것은 또한 연구자를 분석으로부터 거리 두게(distances) 합니다—그들은 더 이상 데이터에 몰입(immersed)하지 않고, 참여자들과 협력하여 의미를 공동 구성(co-constructing meaning)하지 않으며, 해석을 맥락화(contextualize interpretations)할 능력이 떨어지게 됩니다.
  • 그러나, 우리가 단점(disadvantages)을 완화하면서 장점(advantages)을 활용한다면, AI는 그러한 분석에 대해 실질적인 지원(support)을 제공할 수 있습니다.

AI는 귀납적 분석(텍스트에서 코드와 주제를 추론[inferring])과 연역적 분석(기존 코드를 텍스트에 적용) 모두를 지원할 수 있지만, 한계(limitations)가 있습니다.

  • 놀랍게도, 일부 AI 도구들은 키워드 식별 및 계산(keyword identification and counting), 코드 검색(code retrieval), 데이터 시각화(data visualization)와 같은 "기초적인(basic)" CAQDAS 과업들을 잘 수행하지 못합니다(do poorly). 예를 들어, 챗GPT(ChatGPT)와 같은 현재의 LLM들은 계산이나 다단계 지시(multistep instructions)에 어려움을 겪습니다(struggle).
  • 대조적으로, LLM은 텍스트 요약 생성(generating summaries)에 탁월합니다(excel). LLM과 토픽 모델링(topic modeling: 자주 함께 등장하는 단어들을 식별하는 것)과 같은 다른 AI 접근법들은 귀납적으로 잠재적 주제(potential themes)나 코드를 식별하고 해당하는 텍스트 발췌문을 연결할 수 있습니다.
  • AI는 주어진 텍스트의 특징(features)을 분석할 수 있습니다; 예를 들어, Python과 R의 도구들은 정확한 감성 분석(sentiment analysis: 진술이 감정적으로 긍정적인지 부정적인지 결정하는 것)을 제공합니다. AI는 지정된 코딩 루브릭(coding rubric)과 일치하는 텍스트 영역을 식별할 수 있습니다(연역적 분석). 일부 질적 연구는 비텍스트 데이터(nontext data: 예, 이미지, 비디오)를 분석하는데, AI는 잠재적으로 이것 또한 도울 수 있습니다.

이론적으로, AI는 주제나 테마를 가로지르는 분석(축 코딩[axial coding])으로부터 유용한 통찰을 추론(infer)할 수 있습니다; 그러나 이 과업은 경험적 데이터(empirical data)가 연구 맥락(study context), 문제 공간(problem space), 관련 이론(relevant theory), 개인적 경험(personal experience)과 병합될 것을 요구합니다. 그러한 복잡성을 고려할 때, 우리는 축 코딩이 당분간(for the foreseeable future) 인간의 영역(purview)으로 남을지 궁금해합니다.

 

우리는 "전통적인" CAQDAS와 AI 사이의 흐릿한 경계(blurry line)를 인정합니다. 과업이 점차 더 복잡해짐에 따라(successively more complex: 예, 키워드 계산, 텍스트 마이닝, 의미론적 분석[semantic analysis], 감성 분석, 주제 분석, 주제 간 추론, 이론의 통합, 깊은 이해의 점진적 난해함), "지능(intelligence)"에 대한 요구는 꾸준히 증가합니다.

 

(오직) 팀의 일원 ([Only] a member of the team)

 

이러한 각 과업에 대해, AI는 팀의 필수적인 일원(integral member)으로 간주될 수 있지만—오직 일원일 뿐(only a member, 팀 전체가 아님), 게다가 주니어 일원(junior member)입니다. 모든 AI 전반에 걸쳐 보편적인—"인간을 루프 안에(human in the loop)" 두라는 강력한 권고(strong admonition)는 유효합니다(holds true). 사실(Indeed), 우리는 인간이 루프를 책임져야 한다(remain in charge)고 주장합니다. 대부분의 질적 연구는 한 명 이상의 연구자를 포함하며, AI가 지원하는 QDA에서 AI는 연구 책임자(primary investigator)라기보다는 연구 보조원(research assistant)으로 보는 것이 가장 좋습니다.

  • 한 저자가 언급했듯이, AI는 "연구자의 판단(judgement), 성찰성(reflexivity), 창의성(creativity), 경험(experience), 세계관(worldviews), 문화적 신념(cultural beliefs), 직관(intuitions), 그리고 편향(biases)조차" 대체할 수 없습니다.
  • 또 다른 저자는 논평했습니다, "분석을 아웃소싱(Outsourcing)하는 것은... 연구 품질에 영향을 미치고... [연구자들에게서] 데이터와의 정서적 연결(emotional connection)—친밀감(intimacy), 자부심(pride), 주인의식(ownership)—을 앗아갑니다(robs)."
  • 그러나, AI는 "가상 동료(virtual colleague), 초심자(novice)... 그럼에도 유용한 기여를 할 수 있는" 역할을 수행할 수 있습니다.
  • AI의 기여가 제한적임을 인정하며, 또 다른 저자는 "불완전한 제안(imperfect suggestions)조차 도움이 될 수 있다"고 강조했습니다.

 

이론 주도적 QDA는 어떠한가? (What about theory-driven QDA?)

 

일부 질적 분석은 결과(result, 산출물[product])로서 이론과 개념적 틀(conceptual frameworks)을 개발합니다; AI는 이론 개발적(theory-developing)인 귀납적 또는 연역적 분석을 분명히 지원할 수 있습니다. 대조적으로, 이론 주도적(theory-driven) 분석은 특정 이론이나 틀을 특정 현상(phenomenon)을 연구하기 위한 렌즈(lens)로서 사용합니다. 후자의 접근법에서, 이론은 연구 질문을 정의하고, 관련 데이터의 선택과 수집을 안내하며, 데이터를 해석(interpreting)하는 데 중요한 역할을 할 수 있습니다.

  • 해석 단계(interpretive phase)에서, 연구자는 이론이 제공하는 개념(theory-provided concepts)이라는 렌즈를 통해 데이터를 끊임없이 심문(interrogates)합니다. 그들의 목적은 현상에 대해 가능한 모든 것을 배우는 것이 아니라, 오히려 렌즈를 통해 확대되고 초점이 맞춰진(magnified and focused) 현상의 측면들을 더 잘 이해하거나, 렌즈 자체를 정제(refine)하는 것입니다.

AI가 그러한 분석을 수행하려면,

  • 먼저 이론의 핵심 요소(key elements)를 학습해야 하고,
  • 그런 다음 이 렌즈를 통해 데이터를 해석할 능력(capacity to interpret: 즉, 데이터가 그 이론의 특정 교리[tenet]를 지지하거나 지지하지 않는 사례를 찾는 것)을 가져야 합니다.

이것은 어려울(challenging) 뿐만 아니라, 현재의 AI 모델들이 이론의 요소를 통합하기 위해 원래의 데이터를 조작(fabricate)하거나 수정(modify)할("환각[hallucinate]") 위험이 있습니다. 비록 미래의 AI 기술들이 이론 주도적 QDA를 지원할 수 있을지라도, 현재로서는(for the moment) 우리는 그것이 주로 인간의 통찰(predominantly human insights)을 필요로 한다고 믿습니다.

 

구체적인 AI-QDA 적용과 접근법 (Specific AI-QDA applications and approaches)

 

AI 지원 분석 (AI-supported analysis). 저자들은 몇 가지 AI 지원 QDA 접근법(AI-supported QDA approaches)에 대해 상세히 설명해 왔습니다(elaborated). 아래에서 우리는 4가지 구체적인 접근법(주제 분석[thematic analysis], 계산적 근거 이론[computational grounded theory], 담론 분석[discourse analysis], 대규모 데이터셋 분석[analysis of large datasets])과 QDA를 지원하는 여러 다른 AI 기능들을 다룹니다.

 

주제 분석 (Thematic analysis). 우리가 찾은 문헌은 브라운과 클라크(Braun and Clarke)의 주제 분석 접근법을 자주 인용했습니다. 다음의 단계들과 그에 상응하는 AI의 기여(AI contributions)는 다음과 같습니다:

  • 데이터와 친숙해지기 (Familiarize with data): 텍스트 또는 여러 텍스트의 요약 생성(generate a summary); 전사본(transcripts) 정리를 지원함.
  • 코드 생성 (및 적용) (Generate [and apply] codes): 텍스트로부터 후보 코드(candidate codes)를 귀납적으로 식별함(inductively identify); 후보 코드 목록을 정제(refine: 압축[condense], 병합[merge])함; 코드의 설명(정의)을 생성하고 코딩을 뒷받침할 예시 인용문(example quotes)을 식별함; 코딩 루브릭(coding rubric)을 텍스트에 적용함.
  • 후보 주제 구성 (Construct candidate themes): 더 긴 코드 목록과 코드 설명으로부터 주제 목록(list of themes)을 생성함.
  • 후보 주제 검토 (Review candidate themes): 후보 주제를 수집되고 코딩된 텍스트 세그먼트(text segments)와 대조(contrast)함 (모든 세그먼트가 주어진 주제와 관련이 있는지, 그리고 이 세그먼트들의 모든 중요한 개념이 해당 주제에 반영되었는지 확인함); 코드나 텍스트 세그먼트가 두 개 이상의 주제에서 얼마나 자주 나타나는지 탐색(explore)함 (일치하는 세그먼트는 고유하지 않은 주제[nonunique themes]를 시사함).
  • 주제 정의 및 명명 (Define and name themes): 각 주제에 대한 잠정적 정의(tentative definitions)와 라벨을 생성함.
  • 보고서 작성 (Produce the report): 각 주제를 예증(illustrate)할 인용문을 식별함; 선택된 인용문을 편집(단축[shorten])함; 보고서 작성 자체를 지원함 (단, 과학적 글쓰기[scientific writing]에 AI를 사용할 때의 중요한 윤리적 고려사항[important ethical considerations]에 유의).

미묘한(nuanced) 인간 분석의 필요성을 강조하며, 브라운과 클라크는 "코딩 신뢰도(coding reliability)" 주제 분석과 "성찰적(reflexive)" 주제 분석을 구별했습니다.

  • 코딩 신뢰도 접근법은 코딩을 하나의 과정(process)으로 강조하고 코딩의 정확성(accuracy)을 우선시합니다(코더의 주관성[coder subjectivity] 제한). 주제는 일반적으로 연구자에 의해 "발견되는(discovered)" 토픽이나 토픽 요약을 나타내며, 이것들은 흔히 데이터 수집 질문들과 밀접하게 매핑됩니다. 많은 AI 중심 접근법들—자동화된(automated), 정형화된(routinized), 그리고 토픽을 식별하기 위해 단어 동시 발생(co-occurring words)에 의존하는—은 코딩 신뢰도와 일치할 것입니다.
  • 브라운과 클라크가 우월하다고 주장하는 성찰적 주제 분석(Reflexive thematic analysis)은 인간이 "데이터와의 깊고 장기적인 관여(deep and prolonged engagement)"에 몰입할(immerse) 것을 요구합니다.
    • 인간이 주 도구(primary tool)이며, 주관성(subjectivity)은 문제가 아니라 자원(resource)입니다(다른 저자가 말했듯이, "불확실성(Uncertainty)은 질적 연구에서 버그가 아니라 기능(feature)입니다.").
    • 주제는 토픽이나 요약이라기보다는 의미의 패턴(patterns of meaning)입니다; 그것들은 데이터가 해석됨에 따라 진화(evolve)하며 연구자에 의해 생산되는(produced) 것이지 ("발견되거나[discovered]" "식별되는[identified]" 것이) 아닙니다.
    • 데이터 분석은 예술(art)이며, 창의성(creativity)과 뜻밖의 발견(serendipity)이 소중히 여겨지고, 연구자의 주관성과 성찰성(reflexivity)이 성공의 열쇠입니다. AI가 이러한 형태의 QDA를 확실히 지원할 수는 있겠지만, 가정(assumptions), 과정(processes), 그리고 AI의 역할은 매우 다를 것입니다.

계산적 근거 이론 (Computational grounded theory). 근거 이론(Grounded theory)은 주어진 현상(예: 사회적 경험)의 어떤 측면을 설명하는 모델이나 이론을 귀납적으로 식별(inductively identify)하고자 합니다. Nelson은 AI를 사용하여 근거 이론 분석을 대규모 데이터셋으로 확장하고 과정의 감사 가능성(auditability)과 투명성(transparency)을 높이는 "계산적 근거 이론(computational grounded theory)"을 위한 모델을 제안했습니다. 그녀의 3단계 모델(다소 실증주의적[positivist] 또는 후기 실증주의적[postpositivist] 패러다임을 반영하는)은 "인간이 제공하는 텍스트를 전체론적으로 해석하는 우월한 능력(superior abilities to interpret text holistically)을 보존(preserv[es])하면서, 컴퓨터 보조 방법의 공식적 엄격성(formal rigor), 신뢰도(reliability), 재현성(reproducibility)을 통합(incorporat[es])"합니다.

  • 1단계, 패턴 탐지(pattern detection)는 "비지도 머신러닝(unsupervised machine learning)과 단어 점수(word scores) 같은 기법을 사용하여 연구자들이 데이터에서 새로운 패턴(novel patterns)을 보도록 돕는 텍스트의 귀납적 계산 탐색(inductive computational exploration)"을 포함합니다. 단어 비율 분석(word proportion analysis)과 토픽 모델링(topic modeling, Python과 R에서 이용 가능) 같은 AI 기법은 "복잡하고 지저분한 텍스트를 더 단순하고 해석하기 쉬운 단어 목록이나 네트워크로 축소(reduc[e])... 결과물은 여전히 인간에 의해 해석되어야 하지만, 계산적 탐색 분석은 연구자가 이전에 고려하지 못했던 범주(categories)를 제안할 수 있고... 연구자가 자신의 편향(biases)을 피하도록 도울 수 있습니다."
  • 2단계, 패턴 정제(pattern refinement)"[인간의] 질적 심층 읽기(qualitative deep reading)를 통해 데이터와의 해석적 관여(interpretive engagement)로 돌아갑니다." "계산적으로 유도된 심층 읽기(computationally guided deep reading)"에서, 연구자는 1단계에서 식별된 패턴의 타당성(plausibility)을 확인하고, 인간의 해석을 추가하며, "데이터에 대한 인간적이고 전체론적인 읽기(human, and holistic, reading)에 더 잘 맞도록" 패턴을 수정(modifies)합니다.
  • 3단계, 패턴 확인(pattern confirmation)은 "추가적인 계산 및 자연어 처리(natural language processing) 기법을 사용하여 귀납적으로 식별된 패턴을 평가(assesses)합니다." 이것은 "이러한 패턴들이 말뭉치(corpus) 전체에 걸쳐 유지되는지 연역적으로 테스트(deductively tests)"합니다.

 

담론 분석 (Discourse analysis). 담론 분석(Discourse analysis)은 언어가 사회적 현실(social realities)과 권력 역학(power dynamics)을 형성하는 방식을 비판적으로 검토합니다(critically examines). Jacobs와 Tschötschel은 AI가, 특히 헤게모니(hegemony)다른, 덜 특권적인 해석들보다 어떤 말하기와 행동 방식을 더 관습적(conventional)이고, 용인 가능하며(acceptable), 겉보기에 논리적(seemingly logical)인 것으로 만드는 "세상을 이해하는 지배적이고(dominant), 정상화된(normalized) 방식"—에 대한 연구를 어떻게 지원할 수 있는지 설명합니다. 따라서, 특정 단어는 다른 맥락과 다른 사람들에게 다른 의미를 가질 수 있습니다(다의성[polysemy]의 개념).

  • 그들은 토픽 모델링(topic modeling)이라는 AI 기법이 인간 의사소통 과정을 역전시킨다(reverses)고 관찰합니다.
    • 말하거나 쓸 때, 인간먼저 주제(topic)를 선택하고, 말하는 방식(양식[mode])을 선택한 다음, 구체적인 단어(specific words)를 선택합니다.
    • 대조적으로 토픽 모델링구체적인 단어를 분석하고 "말뭉치 전체에 걸친 단어의 관찰된 분포(observed distributions)를 사용하여 공통적으로 사용되는 비배타적 군집(non-exclusive clusters)—각각이 특정 [주제]에 대한 화법의 양식을 나타내는—을 추론(infer)"합니다.
    • 토픽 모델링"각 단어의 주제별 의미(topic-specific meaning)와 각 주제의 맥락적 의미(contextual meaning)"를 포착합니다. 즉, 텍스트 내 의미의 다의성과 관계적 본성(relational nature)을 독특하게 강조할 수 있으며—이는 담론 분석의 원칙과 메타 이론적(meta-theoretical) 및 인식론적(epistemological) 적합성을 나타냅니다.

이 저자들은 (1) 잘 구획된 주제와 단일 장르(single genre)의 텍스트에 집중하고 (2) 많은(large) 수의 주제를 요청하는 토픽 모델링을 사용하는, AI 지원 담론 분석 접근법을 제안합니다. 결과적으로, "대부분의 주제는 더 이상 말뭉치에서 다루는 다양한 테마나 주제를 나열하는 것이 아니라, 대신 언어 사용의 더 세밀하고 미묘한 측면(fine-grained and nuanced aspects)을 포함할 것입니다."

 

그들은 헤게모니 연구에 있어 토픽 모델링의 독특한 이점을 강조합니다. 전통적인 담론 분석은 헤게모니가 무너지는 사례를 찾습니다. 대조적으로, 대규모 데이터셋을 이용한 토픽 모델링은 "우리가 소수의 매우 통찰력 있는 사례들을... 헤게모니가 문제없이(without a hitch) 재생산되는 수많은 정상적이고(normal), 예외적이지 않으며(unexceptional), 개별적으로는 유익하지 않은(individually uninstructive) 사례들로 보완(complement)하게 해줍니다." 연구자는 "정상적인 것으로 간주될 수 있는 것에 대한 선험적 가정(a priori assumptions) 없이 말뭉치 전체를 탐색"할 수 있습니다. "이것은 우리가 그렇지 않았으면 발견하지 못했을 루틴과 정상화된 논리(normalized logics)를 찾는 데 도움을 줍니다."

  • 비유하자면(By analogy), 전통적인 담론 분석은 희귀한 검은 백조(예외)의 검은색을 사용하여 흰 백조(헤게모니)의 하양을 눈에 띄게 만듭니다. AI-QDA 토픽 모델링은 99%의 흰 백조(헤게모니 그 자체)에 대한 더 깊은 이해를 가능하게 합니다.

1. 교통 흐름의 비유 (교통사고 vs. CCTV 분석)

  • 전통적 담론 분석 (교통사고): 도로에서 **교통사고(예외)**가 났을 때를 연구합니다. 사고가 나서 차들이 엉키는 모습을 보고 나서야, 역설적으로 "아, 원래는 여기서 우측통행을 해야 하고, 신호는 지켜야 하는구나"라는 **교통 법규(헤게모니)**의 존재를 깨닫습니다. 질서가 깨지는 순간을 통해 질서를 이해하는 방식입니다.
  • AI 토픽 모델링 (CCTV 전체 분석): 도시 전체의 **CCTV 영상(대규모 데이터셋)**을 분석합니다. 여기에는 사고 장면은 거의 없고, 수만 대의 차가 신호를 지키며 **매끄럽게 달리는 지루한 영상(정상적이고 예외적이지 않은 사례)**뿐입니다. 하지만 AI는 이 지루한 영상을 통해 "대부분의 차가 오전 8시에는 시속 40km로 서쪽으로 이동한다"는 거대한 **흐름과 패턴(정상화된 논리)**을 찾아냅니다. 사고는 없지만, 시스템이 어떻게 완벽하게 작동하고 있는지 꿰뚫어 보는 것입니다.

2. 건강 검진의 비유 (질병 vs. 빅데이터)

  • 전통적 담론 분석 (질병 연구): **아픈 사람(헤게모니가 무너진 사례)**을 연구합니다. 열이 펄펄 끓는 환자를 보면서 "아, 인간의 정상 체온은 36.5도여야 하는데 그게 깨졌구나"라고 이해합니다. '비정상'을 통해 '정상'을 정의하는 것입니다.
  • AI 토픽 모델링 (건강인 빅데이터): 아무 데도 아픈 곳이 없는 **평범한 사람 100만 명의 일상 기록(개별적으로는 유익하지 않은 사례)**을 분석합니다. 한 사람의 기록은 별 볼 일 없지만, 100만 명을 모아놓으면 "인간은 보통 하루에 몇 번 숨을 쉬고, 언제 잠을 자는지"에 대한 완벽한 **표준 모델(헤게모니 그 자체)**을 그려낼 수 있습니다.

3. 물고기와 물의 비유 (물 밖으로 튀어 오름 vs. 물속 생활)

  • 전통적 담론 분석 (튀어 오르는 물고기): 물고기가 물 밖으로 **튀어 오르는 순간(예외)**을 포착합니다. 물고기가 공기 중에서 파닥거리는 것을 보고 "아, 이 녀석들은 원래 물속에 살아야 하는구나"라며 **물(헤게모니)**의 존재를 인식합니다.
  • AI 토픽 모델링 (물 성분 분석): 물고기가 숨 쉬고 헤엄치는 **물 자체(99%의 배경)**를 분석합니다. 물고기들에게는 너무나 당연해서 느껴지지도 않는 물의 온도, 흐름, 성분을 분석하여, 그들이 어떤 환경(정상화된 논리) 속에서 살아가고 있는지 지도를 그립니다.

4. 공기 청정기의 비유 (먼지 센서 vs. 대기 분석)

  • 전통적 담론 분석 (빨간 불): 공기 청정기에 **빨간 불(문제 발생)**이 들어올 때를 주목합니다. 오염 물질이 들어왔을 때 비로소 "깨끗한 공기"가 무엇인지 정의하고 비교합니다.
  • AI 토픽 모델링 (24시간 로그): 공기 청정기가 파란 불을 켜고 조용히 돌아가는 24시간 동안의 데이터를 분석합니다. 아무 일도 일어나지 않는 것처럼 보이지만, 그 안에서 "이 집안의 공기는 평소에 어떤 성분으로 구성되어 있는지"라는 **일상의 지배적 상태(헤게모니)**를 완벽하게 파악합니다.

 

대규모 데이터셋 분석 (Analysis of large datasets). QDA의 노력과 복잡성은 데이터셋의 크기에 따라 기하급수적으로(exponentially) 증가합니다. AI는 확장 가능(scalable)하여, 매우 큰 실제 데이터셋(real-world datasets)의 효율적 분석을 가능하게 합니다. 이 기능은 짧은 텍스트(short texts)를 대량으로 분석할 때 특히 유용합니다(예: 대규모 강의 평가의 코멘트, 국가적 설문조사, 소셜 미디어 게시물, 제품 리뷰, 뉴스 헤드라인). 다른 대규모 데이터셋은 출판된 저작물(예: 저널이나 신문 기사, 책)이나 긴 인터뷰로 구성될 수 있습니다. (참고로, LLM은 유한한 컨텍스트 윈도우(context window)—응답을 생성하는 동안 처리할 수 있는 정보[데이터와 지시사항을 합친]의 총량—를 가지고 있어, 현재로서는 제한적인 확장성[limited scalability]을 가짐 [비록 이것이 빠르게 증가하고 있지만]. 맞춤형 기법[Bespoke techniques, 예: Python이나 R 사용]과 목적 맞춤형 상용 QDA 제품들은 덜 제약적입니다.)

  • 대규모 표본 외에도, 지저분한 실제 데이터셋(messy, real-world datasets)의 장점은 다음을 포함합니다:
    • 자기 보고(self-report: 예, 의도된 사용, 인터뷰 진술) 대신 참여자의 실제 행동(real behaviors: 예, 실제 소셜 미디어 게시물, 실제 웹사이트 사용)을 포착,
    • 실험실 환경 대신 실제 사회적 환경의 맥락을 보존,
    • 다양한 참여자 특성에 걸친 샘플링, 그리고
    • 데이터 및 도구의 연구 협력과 공유 장려.
  • 진정성 있는 맥락(authentic context)은 또한 부채(liability)입니다:
    • 데이터가 일반적으로 연구 목적으로 의도되지 않았기 때문에 데이터 품질이 가변적(variable)이고,
    • 타당성 증거(validity evidence)가 일반적으로 이용 불가능하며,
    • 핵심 정보와 관계없는 정보(salient and extraneous information)가 흔히 뒤얽혀 있습니다.
    • 추가적으로, 소스에서 정보를 추출하는 것이 어려울 수 있습니다(비록 AI가 "스크래퍼[scraper]" 도구와 데이터 클리닝 등으로 이를 도울 수 있지만).
    • 또한 문제가 되는 윤리적 이슈(problematic ethical issues)가 있으며, 우리는 아래에서 이를 상세히 설명합니다.

 

QDA를 지원하는 다른 AI 기능들 (Other AI functions to support QDA)

AI는 공식적인 분석(formal analysis) 이외의 방법으로 QDA를 지원할 수 있습니다.

 

연구 컨설턴트로서 조언 제공 (Offering advice as a research consultant).

  • AI 대화형 에이전트(AI conversational agents, 예: LLM)는 "연구 컨설턴트(research consultant)"의 기능을 포함하여 전통적인 CAQDAS를 넘어서는 기능을 제공합니다. 연구자가 경험 많은 인간 동료와 아이디어를 상의할(bounce ideas off) 수 있는 것처럼, 대화형 에이전트는 잠재적 방법론(potential methods), 개념적 틀(conceptual frameworks), 문헌 출처(literature sources), 구조적 위치화(structural positioning), 성찰성(reflexivity), 그리고 한계점(limitations)을 포함하여 연구 계획(study planning) 및 해석(interpretation)에 관한 제안을 위해 질의(queried)될 수 있습니다. 당연히, AI와 인간 모두의 제안은 기계적 수용(rote adoption)보다는 사려 깊은 고려(thoughtful consideration)를 필요로 합니다.

데이터 수집 및 선택 (Data collection and selection).

  • 많은 연구는 소셜 미디어, 기타 인터넷 사이트, 지역 아카이브(local archives)와 같은 공공 및 민간 사이트에서 데이터를 찾습니다. 컴퓨터 구동 "스크래퍼(scrapers)"는 그러한 출처에서 데이터를 수집합니다. AI는 관련 출처(relevant sources)를 식별하고, 다수의 출처로부터 데이터를 취합(pool)하며, 주변 텍스트(peripheral text)로부터 핵심 인용문(salient quotations)을 추출하고, 분석을 위해 데이터를 조직화(organize)하는 데 도움을 줄 수 있습니다.
  • AI는 표집(sampling, 즉 더 큰 모집단이나 말뭉치[corpus]로부터 풍부한 데이터와 독특한 통찰을 기여하는 참여자나 데이터의 하위 집합[subset]을 선택하는 것)을 도울 수 있습니다. 질적 연구에서의 표집은 "편의(convenient)" 표집(가장 덜 선호되는 접근법)이거나 무작위(random)일 수 있지만, "의도적(purposeful)" 표집이 종종 이상적입니다. 의도적 표집은 공통적이거나 중심적인 주제보다는 의도적으로 광범위한(전체적인) 범위의 반응과 패턴을 나타내는 데이터 소스(예: 인터뷰 참여자, 데이터 스크래핑을 위한 웹사이트)를 찾습니다. AI는 의도적 표집을 안내하는 데 유용할 수 있는 데이터 소스의 특성(characteristics)을 식별하고, 이러한 특성과 일치하는 참여자나 소스를 식별하는 데 도움을 줄 수 있습니다.
  • AI는 또한 대규모의 기존 데이터셋에서 핵심 정보를 선택할 수 있으며, 단순히 중심(center)뿐만 아니라 가장자리 및 불일치 사례(edge and disconfirming cases, AI 분석에서의 "꼬리와 치우침[tails and skews]")를 의도적으로 표집할 수 있습니다. 대안적으로, AI는 인간이 다룰 수 있는 것보다 훨씬 더 큰 모집단이나 데이터셋의 분석을 지원할 수 있습니다; 이 경우, 규범(norms, 중심 경향[central tendencies])과 가장자리(예외[exceptions]) 모두가 대표될 수 있습니다.

인터뷰 지원 (Interview support).

  • AI의 강력한 언어 능력(language skills)은 연구자가 유창하지 않은 언어를 사용하는 참여자들과의 인터뷰를 위한 실시간 번역(live translation)을 지원할 수 있습니다. 이것은 전 세계적으로 소외된 및 소수자 집단(marginalized and minority populations)과의 연구를 크게 확장할 수 있습니다. AI는 또한 코더 훈련(coder training)이나 지도 머신러닝(supervised machine learning)을 위한 모의 인터뷰 전사본(mock interview transcripts)을 생성할 수 있습니다.

데이터 준비 (Data preparation).

  • AI 기반 언어 번역 도구(language translation tools)는 수년 전부터 Google, Microsoft 및 다양한 상용 제품에서 이용 가능했습니다. 챗GPT(ChatGPT)와 같은 새로운 도구들과 함께, 이것들은 원본 문서(source documents)와 인터뷰 전사본의 빠르고 쉬운 번역을 지원합니다. 우리는 주제 범위 문헌 고찰을 위해 여러 논문(스페인어, 타갈로그어, 중국어)을 번역하는 데 AI를 사용했습니다.
  • AI는 또한 데이터 정제(data cleaning: 부정확하고, 일관성 없고, 손상되고[corrupted], 잘못된 형식의, 중복된 데이터 수정)를 도울 수 있습니다.

오디오 녹음의 전사 (Transcription of audio recordings).

  • AI는 전사(transcription)의 부담을 덜어줄 뿐만 아니라, 실시간(in real time) 전사를 지원하여 세션 직후(또는 심지어 도중에) 전사본을 이용할 수 있게 합니다. 이것은 데이터 수집과 데이터 분석을 통합(integrating)하려는, 자주 추구되지만 거의 실현되지 않는 목표의 달성을 크게 촉진합니다. AI 전사는 연구자가 대화가 생생할(fresh) 때 전사본을 검토할 수 있게 하며, 추가적인 인상(additional impressions)을 정제하고(refine), 공고히 하고(solidify), 문서화할 전례 없는 기회를 만듭니다. 일부 질적 접근법에서는, 연구 참여자가 수정(correct), 수정(amend), 그리고 심지어 추가적인 아이디어로 부연 설명(elaborate)해달라는 요청과 함께 전사본 사본을 받는 것이 적절할 수 있습니다. 시기적절한 전사는 인터뷰 가이드(interview guide)의 시기적절한 수정을 추가로 지원합니다. 그러나, 전사 과정에서 연구자를 제거하는 것에는 위험(risk)이 따릅니다(아래 참조). 이 논문을 준비하면서, 우리는 유튜브 비디오로만 이용 가능한 2개의 웨비나를 전사하는 데 AI를 사용했습니다.

이미지 및 비디오 분석 (Analysis of images and video).

  • AI는 또한 1차 데이터 소스(primary data source)로서 이미지와 비디오를 준비하고 나중에 분석하는 것을 돕는 데 있어 가능성(promise)을 보여줍니다.

인간-인간 협업 (Human-human collaborations).

  • 한 연구 그룹은 인간-인간 코딩 팀(human-human coding teams)이 직면한 과제들을 식별하기 위해 인터뷰를 수행했는데, 여기에는 평가자 독립성(rater independence) 보존, 평가자 조정(rater calibration) 및 코딩 해석의 변동(variation), 사전 정의된 코드북(predefined codebook)의 진화 및 정제, 그리고 갈등 해결(conflict resolution)이 포함되었습니다. 그 후 그들은 이러한 과제들을 완화(mitigate)하기 위해 새로운 AI 지원 시스템을 개발하고 테스트하여 어느 정도 성공을 거두었습니다.

 

함정: QDA를 위한 AI에 대한 우려 (Pitfalls: Apprehensions about AI for QDA)

 

문헌 검토와 팀 내 논의(within-team discussions)를 통해, 우리는 AI 지원 QDA에 대한 몇 가지 우려(concerns)를 확인했습니다.

연구자들은 그들이 사용하는 기술—즉 "내부 작동 원리(under the hood)"—를 이해해야 합니다. 가장 중요한 것은, AI는 확률적(probabilistic)이며 의미를 생성하는 것(meaning-making)이 아니라는 점입니다. 기본적으로, AI는 빈도가 높은 사건(high-frequency events)과 광범위한 패턴에 초점을 맞춥니다; 명시적인 계획(explicit planning) 없이는, 가장자리 사례(edge cases), 예외(exceptions), 불일치 사례(disconfirming examples), 희귀한 사건(rare events)을 놓칠 것입니다. 더욱이, "인공지능"은 능력, 강점, 한계가 매우 다양한 다수의 도구와 기법을 포괄합니다. 우리는 연구자들이 이용 가능한 다양한 옵션(range of options)을 충분히 고려하지 않고 편리하거나 인기 있는 도구(현재의 LLM과 같은)에만 집중할까 봐 우려합니다. LLM과 다른 생성형 AI 도구들은 강력하지만 상당한 한계(significant limitations)를 가지고 있습니다(부록 1), 여기에는

  • 제한적인 맥락 이해(limited contextual understanding),
  • 불완전한 지식 기반(incomplete knowledge base),
  • 사실적으로 정당화되지 않은 응답("환각[hallucinations]"),
  • 편향된 응답(biased responses),
  • 제한된 컨텍스트 윈도우(limited context window),
  • 빈약한 추론 능력(poor reasoning capabilities)이 포함됩니다.

한 저자가 언급했듯이, LLM은 유창한 언어의 "소리를 내지만(pronounce the sounds)" 의미를 이해하거나 불어넣지는(imbue) 못합니다. 다른 AI 도구들(예: 상용 제품에 내장된 도구, Python과 R의 툴킷)은 그들만의 한계를 가지고 있습니다.

 

AI는 게으르고, 세련되지 못한 분석(lazy, unsophisticated analysis)을 초래할 수 있습니다. 컴퓨터 통계 패키지들은 정량적 연구에서 유사한 문제를 일으켰습니다:

  • 사용자 친화적이고 쉽게 접근 가능한 도구들은 가정(assumptions), 전제 조건(preconditions), 적절한 적용(appropriate applications), 해석에 대한 훈련이나 지도가 부족한 사용자들의 손에 고급 분석 기법을 쥐어주었습니다. 이는 잘못된 통계 검정의 사용, 가정 충족 실패, 세련되지 못한 탐색적 검정("p-해킹[p-hacking]"), 결과의 오해석(misinterpretation)으로 이어집니다. 현대의 CAQDAS 패키지들이 이미 QDA를 접근 가능하게 만드는 것을 목표로 하고 있지만, AI는 이를 훨씬 더 쉽게 만들며—따라서 문제의 범위를 확장합니다. 연구자들은 이러한 강력한 도구들에 대한 세련되지 못한("무작정 대입하기[plug and chug]") 적용이나 의존을 피해야 합니다.
  • AI 팀원(AI teammate)에 대한 의존은 또한 인간-인간 QDA 협업(human-human QDA collaborations)을 줄여, 잠재적으로 분석의 미묘함(nuance)에 부정적인 영향을 미칠 수 있습니다.
  • 쉬운 답변은 위험할 수 있습니다: 좋은 답변(완전히 발전된 통찰)은 좋고, 유용하지 않은 답변은 감지하기 쉽지만, 빠른 "그럭저럭 괜찮은(good-enough)" 답변은 연구자가 의미에 대한 더 심층적인 탐색(more in-depth search for meaning)을 하지 못하게 주의를 분산시킨다면 위험할 수 있습니다.
  • 피상적인 답변(superficial answer)은 형식적인 만족감(perfunctory satisfaction)을 자극하여 데이터에 대한 더 깊은 탐구를 미연에 훼방(forestall)할 수 있습니다. 세련되지 못한 분석은 또한 예외(exceptions)에 의해 제안된 통찰을 탐색하기보다는 다수의 의견(majority opinions)에 초점을 맞출 수 있습니다.
  • 쉽고, 빠르고, 자동화된 AI는 연구자들을 데이터에 대한 강렬하고 장기적인 몰입(intense prolonged immersion)으로부터 제거합니다; 그들은 개인적인 "의미 만들기(sense-making)"와 미묘한 의미 생성의 기회를 놓치게 됩니다.
  • 요컨대, QDA는 노력이 들고, 신중하며, 능숙한 계획(effortful, deliberate, adroit planning)을 요구합니다—단지 앉아서 AI 인터페이스와 잡담하는 것(chatting)이 아닙니다. 탁월한 연구 질문을 던지고 탁월한 질적 연구를 설계하고 수행하기 위해서는 전문성(Expertise)—훈련과 경험—이 필요할 것입니다.

우리는 종종 질적 연구의 분석 단계에 초점을 맞추지만, 데이터 수집(data collection)도 동등하게 중요합니다. 많은 질적 연구에서, 연구자가 곧 데이터 수집 도구(instrument)입니다. 연구자는 참여자들로부터 데이터를 추출(extracting)하기보다는 그들과 함께(with) 데이터를 구성(constructs)합니다. 이는 친밀한 상호작용(intimate interaction), 내부자적 이해(insider understanding), 신뢰(trust), 효과적인 의사소통 기술을 필요로 합니다. 따라서, AI 지원 데이터 수집이 유용한 이점을 제공하지만, 감소된 연구자 관여(reduced researcher involvement)로 인해 발생하는 트레이드오프(trade-off)를 고려해야 합니다.

 

AI의 해석은 단순히 틀리거나 오해의 소지가 있을(wrong or misleading) 수 있습니다. 질적 연구에 단 하나의 "정답(correct)" 결과는 없지만, 명백히 틀릴(blatantly wrong) 가능성은 있으며—AI는 이에 취약합니다.

  • 첫째, 일부 AI 기법(GPT와 같은 LLM 포함)은 데이터에 실제로 존재하지 않는 정보를 발명(invent, 예: 인용문이나 저널 인용)하거나 데이터를 수정(modify, 종종 프롬프트 자체에서 끌어옴)할 수 있습니다. 이러한 "환각(hallucinations)"은 확률적 모델링에서 비롯됩니다: 발명된 인용문은 이 맥락에서 그럴듯합니다(probable).
  • 둘째, AI는 의미를 오해석(misinterpret)할 수 있으며, 특히 언어가 미묘할 때(nuanced) 그렇습니다;
    • 이는 빈정거림(sarcasm, 긍정적인 진술이 실제로는 정반대를 의미함), 은유(metaphor), 전문 어휘(specialized vocabulary), 그리고 참여자들이 베일에 싸인 언어(veiled language)로 그들의 진짜 의도를 가장할 때("행간에 숨겨진[hidden between the lines]";
    • 예를 들어, "좋은" 학생 평가는 종종 실제로는 "열등한 수행[inferior performance]"을 의미함) 발생할 수 있습니다.
  • AI는 결코 실천적 지혜(practical wisdom)를 소유하지 못할 것입니다. 더 모호한 "틀림(wrongness)"은 AI가 깊거나 층위가 있는 의미(deep or layered meaning)를 이해하지 못할 때, 관련 이론이 무시되거나 잘못 적용될 때, 또는 형식적인 분석이 새로운 통찰을 간과할 때 발생할 수 있습니다: 여기서 결론은 부정확하지는 않지만, 연구 중인 현상을 완전히 포착하는 데 실패합니다. 이는 연구자가 분석으로부터 거리 두어졌을 때(필요에 의해[극도로 큰 데이터셋] 또는 선택에 의해) 특히 문제가 됩니다. 그러나, 연구자가 친밀하게 관여된 상태라 하더라도, 그들은 "제안을 보지 않았던 것으로 할 수 없으며(cannot unsee a suggestion)," 결론은 부정확한 AI 해석에 의해 영구적으로 오염될(permanently tainted) 수 있습니다.

AI는 일반적인 연구(질적 연구에 국한되지 않음)에 몇 가지 문제를 도입합니다.

  • 첫째, AI는 엄격함이나 권위(aura of rigor or authority)를 부여하는데, 이는 인간 연구자들을 평가절하하고 궁극적으로 대체(displace)할 수 있습니다.
  • 둘째, 생성형 AI 도구(LLM 같은)는 매우 읽기 쉽고 대단히 그럴듯한 텍스트를 생성하지만, 그럼에도 불구하고 "진실 같은(truth-y)" 헛소리(nonsense)일 수 있습니다.
  • 셋째, AI는 오해의 소지가 있는 결과를 내놓도록 조작될 수 있으며(의도적이든 우발적이든), 단순히 틀릴 수도 있습니다. 그러한 거짓 결과(false findings)는 진실로 유포될 것이며—아무도 그것을 알거나 억제할 수 없을 것입니다.
  • 넷째, AI 지원 지식 창출이 반향실(echo chamber)의 일종(사람이 자신의 의견을 강화하는 정보만 접하게 되는 상황)을 만들 위험이 있습니다: AI에 의해 선택된 질문들이 AI에 의해 수집된 데이터를 사용하여 AI에 의해 답변되고 AI 지원 검토를 거쳐 출판되는 것입니다(이것은 "모델 붕괴[model collapse]"라는 더 큰 문제의 한 가지 징후입니다).
    • 물론, 거짓 결과의 위험은 이미 존재합니다(예: 과학적 부정행위); AI와의 구별되는 차이점은 그것이 더 많아질 것이고, 컴퓨터는 권위의 아우라를 가지며, 정직한 과학자들조차 무심코 결함 있는 결과(flawed findings)를 출판할 수 있다는 것입니다. 이러한 문제들은 집합적으로 지식과 전문성 민주화의 어두운 면(dark side)을 구성합니다.
  • 우리는 궁금해합니다: 만약 이러한 문제들이 구체화된다면, 그것이 사람들로 하여금 QDA를 전반적으로 불신하게(distrust) 만들 수 있을까요?

 

AI-QDA가 더 빠르고 쉬울 것이라는 약속은 어떨까요? 더 쉬운 것이 더 좋은 것은 아닐 수 있습니다(Easier might not be better). 사실, 더 적은 연구자 노력은 아마도 더 적은 통찰(fewer insights)로 이어질 것입니다; 더 깊은 의미를 명료화하기(elucidate) 위해 추가적인 작업을 하는 것은 가치가 있을 수 있습니다. 더욱이, 여러 연구는 AI가 실제로 시간이나 노력을 절약해주지 않고 오히려 AI 분석을 해석하거나 AI가 생성한 코드북을 정제하는 것과 같이 인간의 노동을 단순히 다른 활동으로 재분배(redistributes)한다는 것을 시사합니다. 한 연구는 GPT가 새로운 데이터가 축적됨에 따라 코딩 주제(coding themes)를 계속 추가하여, 결과적으로 인간의 업무량(human workload)을 지속적으로 확장시킨다는 것을 발견했습니다.

 

일부 AI 접근법은 매우 재현 가능(reproducible, 반복하면 분석이 같은 답을 산출함)하지만, 다른 것들은 그렇지 않습니다. 특히 LLM은 비재현적("비결정론적[non-deterministic]") 결과를 생성합니다: 동일한 데이터셋과 프롬프트를 다시 제출해도 동일한 결과가 나오지 않을 것입니다. 이것은 저주이자 축복(curse and a blessing)입니다. 당연히, 비재현성은 결과의 신뢰성(trustworthiness)에 대한 의문을 제기합니다. 그러나, 인간의 분석 또한 개인 간 또는 개인 내에서조차 재현 가능하지 않으며, AI의 가변성(variability)은 인간의 창의성을 모방합니다. 더욱이, 여러 반복된, 일관성 없는 분석에 걸친 결과를 종합(synthesizing)하는 것은 최종 결론을 풍부하게 만들 수 있습니다.

 

AI는 필연적으로 노동 인력의 변화(shifts in the workforce)로 이어질 것입니다.

  • AI는 일반적으로 주니어 연구자들에게 위임되는 과업들(전사 및 예비 분석 같은)을 쉽게 수행합니다. 이는 그러한 과업들로부터 얻어지는 경험적 학습(experiential learning)과 문화적 적응(acculturation)을 감소시킬 수 있으며, 궁극적으로 시니어 연구자들의 수와 자격 요건에 영향을 미칠 수 있습니다. 일자리 대체(Job displacement)는 이미 초급 은행 전문가나 프리랜서 작가와 같은 다른 분야에서 관찰되었습니다.
  • AI는 또한 훈련 중인 연구자들을 위한 새로운 목표와 역량(competencies)을 필요로 할 것이며, 커리큘럼의 수반되는 변화를 가져올 것입니다. 마지막으로, AI에 대한 과도한 의존은 시니어 연구자들 사이에서 기술, 통찰력(perceptivity), 창의성, 또는 이론적 민감성(theoretical sensitivity)의 상실로 이어질 수 있습니다.

현재 LLM의 인기를 고려하여, 우리는 이 접근법에 특유한 과제들을 강조합니다(부록 1).

  • 첫째, 우리는 현재의 LLM이 유용한 "즉시 사용 가능한(out-of-the-box)" 해결책을 제공하는지 의심합니다(우리의 개인적 경험을 보십시오). 산출물은 비결정론적이며 환각에 취약합니다. 그들은 겉보기에 단순한 과업들을 잘 수행하지 못하며 다단계 지시(multistep instructions)를 따르지 않습니다.
  • 둘째, 효과적인 프롬프트(지시와 동반 데이터)를 엔지니어링하는 것은 쉽지 않으며, 우리의 경험상 이것은 만족스러운 결과를 제공하는 데 실패했습니다. 다른 저자들도 마찬가지로 QDA를 위한 효과적인 LLM 프롬프트 생성의 어려움을 언급했습니다.
  • 셋째, LLM은 컨텍스트 윈도우(context window)에 의해 제한됩니다. 현재, 전형적인 컨텍스트 윈도우는 무료 LLM의 경우 약 12,000단어, 유료 버전의 경우 100,000단어입니다. 작은 컨텍스트는 적당한 데이터셋(예: 각 8,000단어의 20개 전사본은 160,000단어임)의 분석조차 가로막습니다(preclude). 한 가지 해결책은 데이터셋을 더 작은 하위 집합(smaller subsets)으로 나누는 것이지만, 이는 자연히 분석 결과에 영향을 미칩니다. 이 문제는 LLM 기술이 향상됨에 따라 사라질 수 있습니다.

 

마지막으로, AI는 다수의 윤리적 우려(ethical concerns)를 제기합니다. 비록 많은 소셜 미디어가 공공 영역(public domain)으로 간주되지만, 사용자 허가 없이 데이터가 연구에 사용될 때 윤리적 및 법적 과제가 발생해왔습니다.

  • LLM을 포함한 상용 제품들은 참여자들이 동의(consented)했을 때조차 데이터 기밀성(confidentiality), 프라이버시, 보안에 대한 추가적인 우려를 제기합니다. LLM에 제출된 각 프롬프트(데이터 포함)는 기본적으로 미래의 응답을 생성하는 데 사용되는 모델의 영구적인 일부가 됩니다(모델 "학습"). 안전한 저장과 내부 분석을 위해 의도된 인터뷰 인용문은 일단 LLM에 제출되면 그 이후로는 잠재적으로 공개적으로 이용 가능하게 됩니다. 물론, 이것이 개인에게 역추적될 가능성은 희박하지만—기밀성에 대한 철학적 위반(philosophical breach)은 남습니다.
  • 일부 연구자들은 또한 AI 회사들이 이윤 창출 벤처를 위해 그들의 데이터에 기생한다(parasitize)는 것을 알고 분개하기도 합니다. 대부분의 현대 LLM들은 이제 학습을 끄는 옵션을 제공합니다. 다른 상용 제품들의 데이터 보안 또한 고려되어야 하며, 특히 점점 더 흔해지는 보안 위반(security breaches)에 비추어 볼 때 그렇습니다. 여러 국가가 데이터 보안 및 사용을 규제하는 법률을 가지고 있습니다. 우리는 계획된 또는 잠재적 AI 사용과 관련 경고(caveats)가 프로토콜과 동의 절차(consent procedures)에서 명시적으로 인정될 것을 권장합니다.
  • AI는 또한 연구자의 안일함(complacency, 불완전한 분석), 부풀려진 생산성(inflated productivity, 질보다 양), 그리고 노골적인 사기(outright fraud)를 조장할 수 있습니다. 마지막으로, 원고 작성(writing manuscripts)에 있어 AI의 역할에 대해 최근 많은 글이 쓰였습니다.

 

성찰성은 어떠한가? (What about reflexivity?)

 

모든 연구는 관련된 연구자들의 가정과 경험에 의해 형성되며, 또 그것을 형성합니다. 성찰성(Reflexivity)은 연구자들이 이러한 피할 수 없는 주관성(subjectivity)—즉, "연구자가 자신의 주관성과 맥락이 연구 과정에 어떻게 영향을 미치는지 자의식적으로 비판하고, 평가하고, 판단하는 지속적이고, 협력적이며, 다면적인 실천들(practices)"—을 다루는 활동입니다. 성찰성은 크게 4가지 방식으로 분류될 수 있습니다.

  • 첫째, 연구자들은 자신의 주관성을 중립화(neutralize)하거나 제쳐두려고 노력할 수 있습니다—개인적 관점을 "괄호 치기(bracketing)"하고 분석에 "백지 상태(blank slate)"로 접근하려고 시도합니다.
  • 둘째, 연구자들은 자신의 관점을 인정(acknowledge)하되, 해석이나 영향의 완화 없이 단순히 나열할 수 있습니다.
  • 셋째, 연구자들은 자신의 관점이 분석에 어떻게 영향을 미칠 수 있는지 설명할 수 있는데, 흔히 부정적인 것(즉, "편향[bias]")으로 표현됩니다.
  • 넷째, 아마도 가장 강력하게, 연구자들은 긍정적인 입장을 취할 수 있습니다—자신의 관점을 강점(strength)으로 틀 짓고 주관성을 의미 만들기(meaning-making)의 중요한 원천으로 활용하는 것입니다.

AI를 사용하는 QDA에 성찰성이 어떻게 통합될 수 있을까요? 중립화하거나 설명하는 입장이 표면적으로는(ostensibly) 가장 적절해 보입니다—AI의 영향을 괄호 치기 하거나 방어하고 인간의 역할을 주장하는 것입니다. 그러나, AI의 일부 특징들이 방어적인 자세를 요구함에도 불구하고, 우리는 완전한 성찰성(full reflexivity)은 그것의 긍정적인 기여 또한 고려해야 한다고 제안합니다.

 

이를 탐구하기 위해, 우리는 AI를 연구팀의 독립적인 구성원(independent member)으로 상상하고(AI를 의인화하는 것에 대한 논란을 인식하면서), AI의 "경험"이 분석에 어떻게 영향을 미칠 수 있을지 4가지 렌즈개인적(personal), 대인적(interpersonal), 방법론적(methodological), 맥락적(contextual)—를 통해 고찰했습니다( 표 3 참조).

  • 개인적 렌즈는 모델을 훈련시키는 데 사용된 방법을 강조합니다: 훈련 데이터의 폭, 깊이, 대표성(representativeness)은 훈련 알고리즘과 마찬가지로 불가피하게 AI 산출물을 좌우(dictate)할 것입니다.
  • 대인적 렌즈는 연구 참여자와 다른 연구팀 구성원을 포함하여 AI와 인간 간의 상호작용을 강조합니다. 이러한 상호작용은 대안적으로 분석을 확언(affirm)하거나 방향 전환(redirect)할 수 있습니다—연구자의 기존 신념, 편향, 가정, 경험을 증폭하거나 도전하면서 말입니다.
  • 방법론적 렌즈는 연구 패러다임, 이론, 방법의 영향을 강조합니다. 여기에는 사용자에게 종종 불투명한(opaque), AI가 내리는 분석적 "선택들(choices)"이 포함됩니다. 예시를 들자면, 누군가 인터넷을 검색하기 위해 구글을 사용할 때 구글이 정보를 식별하고 우선순위를 매기는 과정을 거의 숙고하지 않습니다. 본질적으로, 구글의 끊임없이 진화하는 AI 알고리즘은 매일 우리 삶에 영향을 미치는 보이지 않는 손(invisible hand)을 구성합니다. 유사하게, 연구자들이 복잡한 모델(LLM이나 다른 딥러닝 모델 같은)이나 정형화된 레시피(예: 토픽 모델링용)를 사용할 때 그들은 보이지 않는 손에 동의(accede)하는 것입니다.
  • 마지막으로, 맥락적 렌즈는 AI가 분석을 수행하고 제시하는 역사적, 문화적 맥락의 영향을 강조합니다. 기본적으로 이것은 한계가 될 수 있지만, 전략적으로 사용된다면 AI는 연구자들이 고려하지 못한 맥락(예: 소외된 공동체)을 식별하는 데 도움을 줄 수 있습니다.

1. 개인적 (Personal) 관점

👉 AI의 "출신 성분"과 "과거 경험" (학습 데이터)
  • 인간 연구자라면: "나는 한국에서 자란 40대 남성 의사니까, 환자의 경험을 내 방식대로 해석할 수 있어"라고 자신의 배경을 고민합니다.
  • AI라면: "나는 인터넷에 있는 서양권 데이터 위주로 학습(훈련)되었어. 그래서 동양권 문화나 소수자의 입장은 잘 모를 수도 있고, 백인 남성 위주의 편향된 시각을 가질 수 있어."
    • 핵심: AI가 학습한 데이터와 알고리즘이 AI의 '성격'과 '편견'을 형성한다는 점을 경계해야 합니다.

2. 대인적 (Interpersonal) 관점

👉 AI와 "인간(연구자/참여자)" 사이의 관계와 상호작용
  • 인간 연구자라면: "내가 교수라서 학생인 참여자가 솔직하게 말을 못 했을까?" 혹은 "동료 연구자와 내 의견이 달라서 결과가 이렇게 나왔나?"를 고민합니다.
  • AI라면: 두 가지 측면이 있습니다.
    1. AI ↔ 연구 참여자: "참여자가 내 목소리를 녹음하는 게 AI라고 알게 되면, 더 딱딱하게 말하지 않을까? AI는 사람들 사이의 미묘한 눈빛이나 권력 관계(기싸움 등)를 눈치채지 못할 거야."
    2. AI ↔ 연구자(나): "내가 AI를 너무 맹신해서 AI가 내놓은 결과를 그냥 받아들이진 않았나? 아니면 내가 프롬프트를 입력할 때 내 의도를 너무 강하게 주입해서 AI를 조종했나?"
    • 핵심: 연구자가 AI를 얼마나 신뢰하고 어떻게 지시(프롬프트)하느냐, 그리고 AI의 존재가 참여자에게 어떤 영향을 미치느냐를 따져봐야 합니다.

3. 방법론적 (Methodological) 관점

👉 AI의 "일하는 방식"과 "도구적 한계"
  • 인간 연구자라면: "내가 선택한 이 연구 방법론이 정말 최선이었을까? 내 이론적 관점이 분석을 제한하진 않았나?"를 고민합니다.
  • AI라면: "나는 문맥을 깊이 이해하는 게 아니라, 확률적으로 단어를 조합하는 방식(알고리즘)으로 작동해. 이게 내 한계야."
    • 마치 '보이지 않는 손'처럼, AI의 알고리즘 자체가 분석 결과를 특정 방향으로 이끌 수 있습니다. 예를 들어, 토픽 모델링은 단어 빈도수에 집착하지만, 질적 연구는 빈도수보다 '맥락'이 중요할 수 있거든요. AI가 흉내 내는 것이 진짜 '근거 이론(Grounded Theory)'인지, 아니면 그냥 흉내만 낸 것인지 비판적으로 봐야 합니다.

4. 맥락적 (Contextual) 관점

👉 AI의 "눈치(맥락 파악 능력)"와 "사회적 배경지식"
  • 인간 연구자라면: "이 인터뷰는 병원이라는 특수한 공간에서 진행됐고, 한국의 의료대란이라는 시기적 상황이 반영되어 있어"라고 맥락을 이해합니다.
  • AI라면: "나는 텍스트만 보니까, 이 말이 농담인지 진담인지, 여기가 병원인지 집인지, 한국 문화에서 '네'라는 대답이 긍정인지 거절인지 잘 몰라."
    • 핵심: AI는 텍스트 너머의 문화적, 역사적, 물리적 배경(맥락)을 읽어내는 능력이 부족할 수 있습니다. 그래서 엉뚱하거나 피상적인 해석을 내놓을 위험이 있습니다.

 

표 3 - 성찰성: 질적 데이터 분석에서 AI의 영향 고찰 (Reflexivity: Contemplating the Influence of AI in Qualitative Data Analysis) 이 표는 성찰성에 대한 4가지 접근법과 그에 따른 AI의 특징이 분석 결과에 미칠 수 있는 영향을 정의합니다. 이 고찰들은 AI를 마치 "관점"을 가진 것처럼 연구팀의 독립적인 구성원으로 위치시키고, 특정 모델이나 접근법의 경험, 분석 과정, 선택, 편향이 분석 산출물에 어떻게 영향을 미칠지 고려합니다.

  • 개인적 (Personal)
    • 정의: "연구 프로젝트를 형성하는 태도와 기대... 개인의 연구에 영향을 미치는 가정(assumptions), 기대(expectations), 반응(reactions), 무의식적 반응."
    • 분석 결과에 영향을 미칠 수 있는 AI 특징: 모델을 훈련시키는 데 사용된 방법에서 발생하는 AI의 관점(부정적 [편향] 또는 호의적) - 훈련 데이터셋, 훈련 모델, 훈련 알고리즘(AI의 "과거 경험") 포함.
      • 예시: 분석을 특정 집단이나 사고방식으로 편향되게 하는 훈련 데이터, 특정 통찰을 식별하는 능력은 향상시키지만 다른 것들은 무심코 제약할 수 있는 특수한 훈련 데이터, 지도 vs 비지도 학습 알고리즘의 본질과 범위, 훈련을 위해 라벨링된 예시(labeled exemplars)가 생성되는 방식.
  • 대인적 (Interpersonal)
    • 정의:
      • "연구자와 참여자 간의 관계... 데이터 수집의 대화적 성격과 이것이 요구하는 윤리적 의무를 인식하는 것; 그리고 내재된 권력 역학(implicit power dynamics)을 드러내기 위해 '사후에' [분석 중] 대화를 면밀히 조사하는 것." /
      • "참여자의 고유한 지식과 관점을 인식하고 인정하는 것... 그들이 우리의 질문을 어떻게 해석하는지. 반대로, 참여자가 공유한 정보와 통찰은 연구자의 결정과 결과에 직접적인 영향을 미칠 것이다." /
      • "연구팀 구성원 간의 관계."
    • 분석 결과에 영향을 미칠 수 있는 AI 특징:
      • AI와 연구 참여자 간의 상호작용: AI가 개입되었다는 것을 아는 것이 참여자의 응답에 어떻게 영향을 미칠 수 있는지, 미묘한 인간-인간 권력 역학에 대한 AI의 (둔)감성([in]sensitivity), 초기 인간 반응에 의해 AI 분석이 어떻게 형성되는지(혹은 안 되는지).
      • AI와 연구팀의 인간 구성원 간의 상호작용: 전체적인 연구 설계(계획에서의 선택)에 미치는 AI 행동 유도성(affordances)의 영향, 분석 과정에서 AI를 안내할 때 인간이 내리는 재량적 선택(discretionary choices), 연구자가 AI 산출물을 신뢰하는 정도, AI 분석 결과가 후속 분석 선택에 미치는 영향. 이러한 선택에는 모델; 훈련 예시의 성격과 수(있다면); 프롬프트, 지시사항, 컴퓨터 코드의 구체화 및 순서; 그리고 분석을 지속할지, 전환(pivot)할지, 중단할지 여부가 포함됨.
  • 방법론적 (Methodological)
    • 정의:
      • "각 연구 프로젝트를 둘러싼 이론적 헌신(Theoretical commitments)... 프로젝트가 수행되는 이론적 접근법의 경계 또는 한계." /
      • "패러다임적 지향(Paradigmatic orientation)." /
      • 매 순간의 결정과 반응이 "윤리적이고, 엄격하며, 패러다임적으로 일치"한다는 보증.
    • 분석 결과에 영향을 미칠 수 있는 AI 특징: 알고리즘이나 분석 접근법(AI에 의해 내려진 "선택들")에서 발생하는 AI의 관점(부정적 [편향] 또는 호의적); 무대 뒤의 "보이지 않는 손(invisible hand)."
      • 예시: 주어진 접근법(예: 토픽 모델링, 거대 언어 모델, 연역적 분석을 위한 지도 학습)의 행동 유도성과 제약, 이론이나 패러다임을 분석에 통합하는 AI의 능력(즉, AI가 근거 이론 vs 현상학 vs 담론 분석; 또는 후기 실증주의 vs 구성주의 패러다임을 얼마나 의미 있게 그리고 진정성 있게 구현하는지의 정도).
  • 맥락적 (Contextual)
    • 정의:
      • "주어진 연구를 문화적, 역사적 환경(milieu) 속에 위치시키는 것; ... 특정 현상이 나타나는 맥락뿐만 아니라 주어진 연구의 배경," 물리적 맥락(위치)을 포함. /
      • "연구 질문과 그 답은 가정과 실천의 사회적 장(social field) 안에 묻혀 있고 그 영향을 받는다... 연구는 [또한] 사회적 장 [자체]를 변형시킨다."
    • 분석 결과에 영향을 미칠 수 있는 AI 특징: 응답을 더 큰 문화적, 물리적, 또는 역사적 맥락과 사회적 장(social field) 안에 위치시키는 AI의 능력.
      • 예시: 참여자의 문화나 물리적 위치(예: 그들의 집, 병원, 또는 연구 인터뷰실)의 영향을 고려하거나, 기존의 사회 이론과 연구를 식별하고 분석에 통합하는 능력(또는 그 결여).

우리는 성찰성의 이러한 각 특징이 강점이자 약점이 될 수 있음을 주목하며, 이러한 특징들을 비난하기보다는 활용(capitalizing on)하는 것의 바람직함을 강조합니다. 우리는 또한 이 주제에 대한 우리의 고찰이 미완성(unfinished nature)임을 강조하며, 다른 이들이 이 도입적인 노력을 부연 설명해 주기를 바랍니다.

 

무엇이 가능해질까? 추가적인 약속들 (What will become possible? Additional promises)

위의 많은 내용은 이미 존재하는 QDA 접근법을 지원하기 위해 AI를 사용하는 것에 초점을 맞추고 있습니다. 우리는—휴대용 카세트 녹음기가 40년 전 QDA를 변화시켰던 것처럼—AI가 현재는 꿈꾸지 못한(undreamt) 새로운 접근법들을 영감을 주고 가능하게 할 것을 예상하고, 희망하며, 기대합니다. 우리는 코딩 루브릭의 연역적 적용, 대규모 데이터셋의 귀납적 분석, 예외뿐만 아니라 헤게모니에 초점을 맞춘 담론 분석과 같은 초기 가능성(early promise)을 이미 보았습니다. 세련된(sophisticated) 질적 연구자들이 강점과 한계를 충분히 인식한 상태에서 AI를 연구 파트너로서 사려 깊고, 창의적으로 사용함에 따라, AI 도구들은 그들이 더 많은 질문에 답하고, 더 높은 효율성과(또는) 더 깊은 통찰력으로 답할 수 있도록 도울 잠재력을 가지고 있습니다.

 

맺음말 (Final Thoughts) 우리가 이것을 해야 할까요? 이 질문은 아마 너무 늦었을 것입니다—이 분야는 25년 이상 QDA를 지원하기 위해 AI를 사용해 왔습니다! 아마 더 나은 질문은, "단점을 최소화하면서 AI의 장점을 어떻게 활용할 수 있을까?"일 것입니다. 우리는 3가지 답변을 제안합니다.

 

첫째, 연구자들은 이러한 기술들—그 한계와, 아마도 더 중요하게는, 이용 가능한 옵션의 다양성(diversity of options) 및 각 옵션의 강점을 잠금 해제하는 방법("AI 리터러시[AI literacy]")을 이해할 필요가 있습니다. 이러한 기술들은 목적 맞춤형 AI QDA 도구와 맞춤형 제작 AI 절차(예: LLM, Python, R 사용)를 모두 포함합니다. 더욱이, 이러한 기술들은 끊임없이 움직이는 과녁(moving target)입니다: GPT(및 다른 LLM)의 최신 버전들은 이미 이용 가능하며, 급격한 변화가 새로운 표준(new normal)입니다. CAQDAS 도구(AI 포함)를 선택하는 데 도움을 구하는 연구자들에게, CAQDAS 네트워킹 프로젝트(CAQDAS Networking Project, surrey.ac.uk/computer-assisted-qualitative-data-analysis)는 훌륭한 자원을 제공합니다.

 

둘째, 연구자들은 그들의 데이터에 몰입(immersed)하고 의미 만들기 분석에 친밀하게 관여(intimately involved)된 상태를 유지해야 합니다. AI는 노력이 들고, 신중하며, 세련된 데이터 수집 및 분석의 필요성을 덜어주지(offload) 않을 것이며—덜어주어서도 안 됩니다. 인간은 QDA에서 주 도구(primary tool)로 남습니다. "인간이 루프 안에(human in the loop)" 있어야 할 뿐만 아니라, 인간이 루프를 책임져야(in charge) 합니다. 연구 책임자가 완전하고 최종적인 책무성(accountability)을 보유합니다.

 

셋째, 우리는 AI의 변혁적 잠재력(transformative potential)을 찾고, 인식하고, 포용해야 합니다. AI는 새로운 행동 유도성(novel affordances)을 제공합니다—우리는 무엇을 얻을까요? 2002년에, Gibbs 등은 언급했습니다, "CAQDAS의 깊은 수용을 위한 결정적 테스트(acid test)는 연구자들이 소프트웨어의 기능을 사용하여 전통적이고 수동적인 기법으로는 고려조차 할 수 없었던 분석을 수행하기 시작할 때가 될 것입니다... 연구자들이 연필과 종이의 과거에는 생각조차 하지 못했던 새로운 형태의 데이터와 새로운 유형의 분석을 사용할 때 말입니다." 우리는 AI 지원과 함께, 그날이 마침내 도래할지 궁금해합니다.

 

 

부록 1 - 인공지능과 관련된 핵심 용어 (Appendix 1 - Key Terms Relevant to Artificial Intelligence)

  • 인공지능 (Artificial intelligence [AI])
    • 정의: "컴퓨터와 기계가 인간의 학습(learning), 이해(comprehension), 문제 해결(problem solving), 의사 결정(decision making), 창의성(creativity), 그리고 자율성(autonomy)을 시뮬레이션할 수 있게 하는 기술." a
  • 머신러닝 (Machine learning)
    • 정의: 데이터에 기초하여 예측(predictions)이나 결정(decisions)을 내리도록 컴퓨터 알고리즘을 훈련시키는 과정. 이는 컴퓨터가 특정 과업(specific tasks)을 위해 명시적으로 프로그래밍되지 않고도(without being explicitly programmed) 데이터로부터 학습하고 추론(make inferences)할 수 있게 하는 광범위한 기법들을 포괄합니다.
  • 지도 학습 (Supervised learning)
    • 정의: 새로운 데이터를 분류(classify)하거나 결과를 정확하게 예측하도록 알고리즘을 훈련시키기 위해 인간이 분류한("라벨링된[labeled]", "주석이 달린[annotated]") 데이터셋을 사용하는 머신러닝.
  • 비지도 학습 (Unsupervised learning)
    • 정의: "라벨링되지 않은 데이터셋(unlabeled datasets)을 분석하고 군집화(cluster)하는 머신러닝 알고리즘; 이 알고리즘들은 인간의 개입(human intervention) 없이 숨겨진 패턴(hidden patterns)이나 데이터 그룹핑을 발견합니다." a
  • 딥러닝 (Deep learning)
    • 정의: "인간 뇌의 복잡한 의사 결정 능력(complex decision-making power)을 시뮬레이션하는 다층 신경망(심층 신경망[deep neural networks])을 사용하는 머신러닝." a
  • 자연어 처리 (Natural language processing [NLP])
    • 정의: 컴퓨터가 텍스트와 말(speech)을 이해하고 생성할 수 있게 하기 위해 머신러닝을 사용하는 컴퓨터 과학 및 AI의 하위 분야. 이는 인간 언어의 규칙 기반 모델링(계산 언어학[computational linguistics])을 통계적 모델링(statistical modeling), 머신러닝, 딥러닝과 결합합니다.
  • 토픽 모델링 (Topic modeling)
    • 정의: 텍스트의 전반적인 주요 토픽(primary topics)을 나타내는 용어 세트(summary set of terms)를 생성하기 위해 비지도 학습을 사용하는 NLP 기법. 토픽 모델은 텍스트 데이터셋에서 자주 등장하는 단어 또는 함께 발생하는 단어들의 군집(clusters of co-occurring words)을 식별하고, 텍스트를 특징짓는 잠재된 토픽(latent topics)이나 테마를 밝해내기 위해 정의된 수의 토픽 하에 이 단어들을 조직화합니다. 이 접근법의 최근 확장판들은 더 미묘한 잠재적 테마(nuanced latent themes)를 생성하기 위해 단어의 추상적 의미론적 표현(abstract semantic representations)과 맥락적 단어 패턴(contextual word patterns)을 사용합니다.
  • 생성형 AI (Generative AI)
    • 정의: 사용자 프롬프트나 질의(query)에 반응하여 복잡한 독창적 콘텐츠(complex original content, 예: 유창한 텍스트, 고품질 이미지, 현실적인 비디오나 오디오)를 생성할 수 있는 딥러닝 모델.
  • 기반 모델 (Foundation model)
    • 정의: 광범위한 라벨링되지 않은 데이터(broad set of unlabeled data)로 훈련되어 최소한의 추가 미세 조정(minimal additional fine-tuning)만으로 다양한 과업에 사용될 수 있는 모델.
  • 거대 언어 모델 (Large language model [LLM]) b
    • 정의: 광범위한 사용 사례(use cases)와 과업에 적용할 수 있도록 엄청난 양의 라벨링되지 않은 데이터로 훈련된 기반 모델(각 사용 사례별로 도메인 특화 모델[domain-specific models]을 개별적으로 구축하고 훈련하는 것과 대조됨). 다른 능력들 중에서도, LLM은 일반적으로 사용자로부터의 프롬프트(구체적 요청, 질문, 또는 지시)에 반응하여 자연어(natural language)와 다른 유형의 콘텐츠를 이해하고 생성할 수 있습니다. 현재의 LLM에는 OpenAI GPT, Gemini, Claude, Mistral, Llama가 포함됩니다. LLM은 매우 강력하지만, 한계(limitations)를 가지고 있습니다:
      • 그들은 확률적(probabilistic)입니다(지각이 있는 것[sentient]이 아님): 응답은 모델에 이전에 동화된(assimilated) 방대한 양의 정보를 고려할 때, 이 맥락에서 다음 단어로서 가장 적절할 것 같은(likely to be appropriate) 단어(또는 이미지나 소리)를 추정함으로써 생성됩니다.
      • 상업적으로 이용 가능한 모델들은 비결정론적(non-deterministic)인데, 이는 반응할 때마다 산출물이 다를 것임을 의미합니다. 동일한 프롬프트(identical prompt)라도, 응답의 형식, 구조, 내용은 달라질 것입니다.
      • 응답은 프롬프트의 품질(quality of the prompt)에 크게 의존합니다. 거대 언어 모델이 프롬프트를 오해하거나, 프롬프트의 잘못된 부분에 집중하거나, 맥락적 세부사항(contextual details)이 부족하거나 이를 잘못 해석할 경우 오류(Errors)가 발생할 수 있습니다.
      • 그들은 환각(hallucinate)을 일으킬 수 있습니다(완전히 조작되고[fabricated] 사실적으로 부정확한 응답을 제공함). 환각은 응답의 확률적 본성(probabilistic nature)에서 발생합니다: 산출물은 논리적이며(logical) 매우 그럴듯하게 사실일 수 있지만(plausibly be true, 훈련 데이터의 패턴과 상관관계에 기초하여)—단지 틀렸을 뿐입니다. 불행히도, 환각은 올바른 응답과 구별할 수 없으며 확실성의 환상(illusion of certainty)을 만듭니다.
      • 응답은 체계적 편향(systematic bias)을 반영할 수 있습니다. 훈련 데이터셋의 크기와 내용은 LLM과 그 응답에 지대한 영향을 미칩니다. 많은 훈련 데이터셋이 편향되어 있어(예: 백인 인종이나 비원어민 영어와 같은 특정 하위 집단[specific subgroup]을 과대 대표하거나 과소 대표함), 잠재적으로 편향된 LLM 산출물을 초래합니다.
      • 그들은 한 번에 유한한 양의 정보(finite amount of information)만 처리할 수 있으며, 여기에는 프롬프트와 응답이 모두 포함됩니다("컨텍스트 윈도우[context window]").
      • 그들은 이전 응답에 대한 기억(memory)이 없습니다. 각 프롬프트는 완전히 새로운 것으로 간주됩니다. 연속성(continuity)이 필요하다면, 사용자는 전체 이전 맥락(프롬프트와 응답)을 새롭거나 업데이트된 프롬프트와 함께 처리를 위해 다시 제출해야 합니다. (일부 LLM이 더 큰 맥락 기억[context memory]을 실험하고 있으므로 이는 바뀔 수 있습니다.)
      • 그들의 지식 기반(knowledge base)은 훈련 데이터셋에 기반을 두고(grounded) 있으므로 흔히 주목할 만한 격차(gaps)를 가집니다(즉, 훈련 데이터에 특정 내용이 없거나, 구식이거나, 단순히 오류가 있는 경우). 대부분의 현재 LLM은 인터넷 접속이 제한되어 있어, 마지막 훈련 날짜 이후의 새롭거나 변경된 정보로 응답하는 데 제약이 있습니다. (이는 바뀔 수 있습니다.)
      • 그들은 서술형 텍스트(narrative text)를 생성하는 데는 탁월하지만, 확률적 모델과 일치하지 않는 겉보기에 쉬운 과업들(예: 간단한 수학, 상식적 추론[commonsense reasoning], 다단계 지시[multistep instructions])에는 서툽니다(bad). (새로운 LLM들이 복잡한 추론 과업을 위해 설계되고 있으므로 이는 바뀔 수 있습니다.)
      • LLM 훈련과 데이터 프라이버시(data privacy) 또는 보안(security)과 관련하여 윤리적 우려(Ethical concerns)가 제기되어 왔으며, 이는 초기 훈련(흔히 인터넷상의 공개적으로 이용 가능한 데이터를 사용하여 수행됨)과 지속적인 훈련(각 사용자 프롬프트와 함께 제출된 정보를 사용하여 수행됨) 모두에 해당합니다.
  • 사전학습 트랜스포머 (Pretrained transformer)
    • 정의: 이전의 신경망보다 훨씬 빠른 학습을 가능하게 하는 딥러닝 모델의 유형. 2017년 기술된 이후, 이는 신경망, NLP, 생성형 AI에 있어 혁명적 진보(revolutionary advance)를 구성했습니다. 구별되는 기본 원칙은 위치 인코딩(positional encoding, 문장 내 각 단어["토큰"]에 고유한 번호를 할당함)과 셀프 어텐션(self-attention, 문장 내의 모든 단어[순서 내의 토큰]에 다른 단어들과의 관계에 따라 가중치를 할당함)입니다. 이러한 기법들은 이미지를 "패치(patches)"로 나누거나(또는 오디오 신호를 "스펙트로그램[spectrograms]"으로 나누어) 이것들을 순서 내의 토큰으로 취급함으로써 이미지와 소리에 적용될 수 있습니다. 따라서 트랜스포머 모델은 순서상 나타날 가능성이 있는 토큰(단어, 패치, 또는 스펙트로그램)을 예측하도록 "학습"하고, 이로부터 새로운 콘텐츠를 생성합니다.
  • 프롬프트 (엔지니어링) (Prompt [engineering])
    • 정의: 프롬프트는 생성형 AI 모델에 제출되는 지시(instructions), 질문(questions), 또는 요청(requests)입니다. 형편없이 형성된 프롬프트(Poorly formed prompts)는 부정확하고, 편향되거나, 목표를 벗어난 응답을 초래할 수 있습니다. 프롬프트 엔지니어링은 생성형 AI 모델이 원하는 응답(desired response)을 제공하도록 프롬프트를 반복적으로 정제(iteratively refining)하는 과정입니다.

a 따옴표 안의 정의는 www.ibm.com/topics 에서 가져왔습니다. 이 주제에 대해 더 많은 정보를 찾는 독자들은 이 자원이 도움이 될 수 있습니다. b LLM에 대한 상세한 정보는 현재의 인기와 능력 때문에 제공되었습니다.


부록 2 - 질적 데이터 분석을 위해 챗GPT를 사용한 저자들의 첫 노력에 대한 사례 연구 연대기, 2024년 2월 (Appendix 2 - Case Study Chronicle of the Authors’ First Efforts Using ChatGPT for Qualitative Data Analysis, February 2024) a

 

데이터셋 1 (의대생 30명의 학습 목표, 각 2개의 응답, 1,380단어) b

  • 챗GPT-4.0에게 각 응답 내에서 학생들 간의 공통 주제(common themes)를 식별하고, 그것을 세고(count), 그러고 나서 이 응답들 전반에 걸친 공유된 주제를 찾도록 요청하는 프롬프트가 생성되었습니다. 결과:
    • 요청된 대로 주제의 유병률(prevalence)을 계산하지 않았습니다.
    • 구체적으로 돌아가서 유병률을 세라고 요청했을 때, 모든 데이터를 단일 주제("기타[other]")로 군집화하고 유병률을 보고했습니다(N = 30).
    • 설문지의 항목 전반에 걸쳐 특정 개인의 응답 내 패턴을 찾지 않았습니다.
  • 프롬프트는 요청을 점진적으로 명확히 하고 단순화(clarify and simplify)하기 위해 여러 반복(iterations)을 거쳐 수정되었습니다. 결과:
    • 챗GPT는 지시사항을 앵무새처럼 되뇌었지만(parroted back) 원래의 (결함 있는) 분석을 반복해서 진행했습니다.
    • 상당한 수의 인용문(20%–77%)을 일관되게 "기타(other)"로 코딩했습니다.
    • "기타" 사용을 피하라고 요청했을 때, 단순히 그 범주를 "일반적 개선(general improvement)"으로 라벨을 다시 붙였고(relabeled), 이후 "일반적 개선"을 "구체적 기술 향상(specific skill enhancement)"으로 라벨을 다시 붙였습니다.

데이터셋 2 (의사 211명의 설문조사, 각 1개의 응답, 7,419단어) c

  • 공통 주제를 찾고, 주제 빈도(theme frequency)를 세고, 각 주제에 대한 예시적인 인용문(exemplary quotations)을 제공하도록 챗GPT에 요청하는 3단계 프롬프트가 생성되었습니다. 결과:
    • 또다시 "기타(other)"라는 주제를 과도하게 사용(overused)했습니다—이 주제가 215회 발생했다고 언급했습니다(이는 응답자 수보다 많음). 다른 주제들의 빈도는 3회에서 55회 사이였습니다.
    • 인용문은 종종 주제를 뒷받침하지 못했고(not supportive), 동일한 인용문이 1개 이상의 주제를 뒷받침하는 데 사용되었습니다.
  • 프롬프트는 요청을 점진적으로 명확히 하고 단순화하기 위해 여러 반복을 거쳐 수정되었습니다. 결과:
    • "기타" 범주를 재분석(reanalyze)하라고 요청했을 때, 챗GPT는 성공을 주장했지만 (215개의 코드 중) 오직 2개의 새로운 주제만을 식별했습니다: 이것들은 각각 데이터셋에서 단 한 번 발생했으며, 그중 하나는 단순히 "잡다한(miscellaneous)"으로 라벨링되었습니다.
  • 챗GPT에게 각 인용문의 간략한 요약(brief summary)을 제공하고 그것의 감성(sentiment: 긍정, 부정, 중립)을 기록하도록 요청하며 프롬프트가 수정되었습니다. 결과:
    • 개별 인용문의 의미 있는 요약을 생성하는 데 실패했습니다—대신 원래 인용문을 4~6단어 뒤에서 잘라내어(truncation) 축어적으로 반복(verbatim repetition)하거나, 여러 인용문에 걸쳐 적용된 토픽(일반적인 코드나 주제)을 제공했습니다.
    • 감성 분류(sentiment classifications)는 원래 인용문의 정서적 어조(emotional tone)와 거의 관계가 없어 보였습니다.

데이터셋 3 (연구자 3명의 인터뷰, 19,207단어) d

  • 챗GPT는 전체 데이터셋(30개의 인터뷰, 각각 약 6,000단어)을 분석할 수 없었는데, 왜냐하면 그것의 컨텍스트 윈도우(context window)가 한 번에 약 24,000단어로 분석을 제한했기 때문입니다. 그래서 전체 데이터셋의 하위 집합(subset)이 선택되었습니다.
  • 이 분석은 단일 지시 세트로 전체 주제 분석을 완료하려고 시도하기보다는 특정 CAQDAS 기능에 초점을 맞추었습니다. 분석은 워드 클라우드(word cloud)를 생성하는 아마도 단순한 과업으로 시작되었습니다. 결과:
    • 워드 클라우드에 대한 초기 요청은 토픽과는 관련이 있지만 실제 데이터셋 내에서는 발견되지 않는 단어들을 보여주는 그림을 초래했습니다.
  • 프롬프트는 워드 클라우드에 대한 상세한 설명을 포함하도록 수정되었고, 이후 몇 번의 추가적인 반복을 거쳐 점진적으로 수정되었습니다. 결과:
    • 두 번째 요청은 표준적인 워드 클라우드를 초래했지만, 가장 빈번한 단어들은 참여자 이름이나 익명화된 식별자(anonymized identifiers), 그리고 "yeah", "okay", "basically"와 같은 채움말(filler words)이었습니다.
    • 이러한 단어들을 제거하라는 반복된 요청은 대체로 성공적이지 못했습니다. 챗GPT는 단어들을 제거했다고 주장했지만, 결과적인 워드 클라우드에는 여전히 그 단어들이 존재했습니다.

핵심 통찰 및 교훈 (Key insights and lessons learned) 요약하자면, 챗GPT는 서술형 텍스트의 정확하고 간략한 요약을 쉽게 생성했습니다. 시도된 다른 모든 과업에 대해서, 초기 프롬프트는 원하는 결과를 산출하는 데 실패했습니다. 반복적인 프롬프트 엔지니어링(iterative prompt engineering) 후, 일부 과업(키워드 계산, 요약)은 성공적이었으나 다른 것들은 결코 만족스러운 결과를 생성하지 못했습니다. 추가적으로 우리는 챗GPT-4에 대해 다음을 배웠습니다:

  • 길고, 다단계 프롬프트(multistep prompts)를 따를 수 없었습니다.
  • 제한된(24,000단어) 컨텍스트 윈도우 때문에 대규모 데이터셋을 분석할 수 없었습니다(이 한계는 현재의 거대 언어 모델들이 훨씬 더 큰 컨텍스트 윈도우를 가지고 있으므로 덜 제약적입니다).
  • 유창한 텍스트를 생성했지만 단순한 수학(simple math, 주제 세기 같은)에는 형편없었습니다(lousy).
  • 종종 지시사항을 앵무새처럼 되뇌었지만(parroted back) 그 지시사항을 따르는 데는 실패했습니다.
  • 종종 요청된 산출물을 제공했다고 주장했지만 실제 산출물은 그 주장과 일치하지 않았습니다(자신이 한 일에 대해 틀렸음).
  • 주제를 기억할 만한 뒷받침 인용문(memorable supportive quotations)과 연결하는 데 어려움을 겪었습니다(Struggled).
  • 가끔(드물게) 데이터셋에서 나오기보다는 일반적으로 이용 가능한 지식, 논리, 또는 그럴듯한 세계관에 기반을 둔 결과를 "식별"했습니다.
  • 대규모 데이터셋을 포괄적으로 나타내는 공통 주제를 식별할 수 없었고(적어도, 단일 단계 요청에 대한 반응으로는) "기타(other)" 분류를 과도하게 사용(인용문의 최대 50%까지)하며 피상적인 주제(superficial themes)를 식별하는 경향이 있었습니다.
  • 자신이 식별한 주제에 대해 유용한 정의(useful definitions)를 제공했습니다.
  • 워드 클라우드 생성과 같은 "단순한" CAQDAS 과업을 완료하는 데 어려움을 겪었습니다.
  • 한 번 실행할 때와 다음 실행할 때 널리 다른 결과(divergent results, 내용과 형식 모두에서)를 제공했습니다.

약어: CAQDAS, 컴퓨터 보조 질적 데이터 분석 소프트웨어 (computer-assisted qualitative data analysis software).

a 이 부록은 챗GPT-4(2024년 2월)가 3개의 기존 데이터셋을 재분석하는 데 사용된 짧은 사례 연구의 행동, 결과, 통찰을 간략히 요약합니다. 추가 디지털 부록 1은 축어적 프롬프트를 포함한 추가 세부 사항을 제공합니다. b 데이터셋 1은 30명의 3학년 의대생들의 임상실습 전 학습 목표를 포함하는 작은 데이터셋(1,380단어)이었습니다. 2개의 열(설문지 항목)—"목표"와 "목표의 이유"—이 있었습니다. 이 응답들의 분석은 미출판 상태입니다(원고 준비 중). c 데이터셋 2는 유지 보수 인증(maintenance of certification) 주제에 대한 211명의 설문 응답자(개원 의사)들의 자유 텍스트 코멘트를 포함하는 더 큰 데이터셋(7,419단어)이었습니다. 이 설문조사의 정량적 결과는 이전에 출판되었으나, 이 자유 텍스트 응답의 분석은 미출판 상태입니다. d 데이터셋 3은 질적 데이터 재사용을 위한 데이터 큐레이션 주제에 대한 3명과의 인터뷰 전사본 3개(19,207단어)로 구성되었습니다. 챗GPT-4가 분석 용량을 약 24,000단어로 제한하는 32,000 "토큰"의 "컨텍스트 윈도우"를 가지고 있었기 때문에, 이 전사본들은 30개 인터뷰의 더 큰 데이터셋에서 선택되었습니다. 데이터셋은 오픈 소스 데이터 저장소에서 얻었으며, 이 데이터셋의 분석은 대학원 논문으로 출판되었습니다.

Int J Transgend Health. 2022 Oct 25;24(1):1-6. doi: 10.1080/26895269.2022.2129597. eCollection 2023.

Toward good practice in thematic analysis: Avoiding common problems and be(com)ing a knowing researcher

 

 

안녕하세요! 오늘은 질적 연구, 특히 주제 분석(Thematic Analysis, TA)을 수행하는 분들이라면 눈이 번쩍 뜨일만한 논평 하나를 소개하려고 해요. 👀 

TA의 창시자 격인 Braun과 Clarke가 자신들의 방법론을 사용한 논문 20편을 직접 뜯어보고(?), "제발 이렇게 좀 하지 마세요!" 혹은 *"이건 정말 잘했네요!"*라고 코멘트한 <주제 분석 연구에서의 모범 사례에 대한 개념적 논평>입니다.

많은 연구자가 "Braun & Clarke (2006)에 따라 분석했다"고 쓰지만, 정작 그들이 의도한 철학과는 맞지 않는 경우가 많다고 해요. 혹시 나도 모르게 '무늬만 TA'를 하고 있었던 건 아닌지, 핵심 내용을 함께 살펴볼까요? 📝


1. TA는 하나가 아닙니다: '가족'을 이해하세요 👨‍👩‍👧‍👦

많은 분이 TA를 하나의 고정된 레시피처럼 생각해요. 하지만 저자들은 TA가 단일한 방법이 아니라 방법들의 가족(Family of methods)이라고 강조합니다. 가장 흔한 실수는 실증주의적(Positivist)인 태도를 버리지 못한 채 성찰적 TA를 하는 거예요. 저자들은 연구자를 '아는 연구자(Knowing Researcher)'가 되라고 초대합니다.

"아는 연구자는 자신의 개인적 및 이론적 관점을 '소유'하려고 노력하고, 의사결정에 있어 숙고적이며, TA 실천에 있어 성찰적인 사람입니다."

"A knowing researcher is one who strives to “own” their perspectives (Elliott et al., 1999), both personal and theoretical, is deliberative in their decision-making, and reflexive in their practice of TA."

 

핵심 포인트:

  • 소문자 q (Small q): 코딩의 정확성, 신뢰도(Reliability), 일치도(Agreement)를 중시하는 실증주의적 접근. (이건 Braun & Clarke의 성찰적 TA가 아니에요!)
  • 대문자 Q (Big Q): 연구자의 주관성(Subjectivity)을 자원으로 활용하고, 의미를 맥락적으로 해석하는 접근. 성찰적 TA(Reflexive TA)는 여기에 속합니다.

👉 Tip: 성찰적 TA를 한다면서 "코더 간 일치도(Intercoder agreement)"를 구하고 있다면? 땡! 🙅‍♀️ 방법론적 불일치(Methodological incoherence)입니다.


2. 주제(Theme): '토픽 요약' vs '의미 있는 이야기' 📖

이 논평에서 가장 강조하는 문제점 중 하나입니다. 여러분이 뽑은 주제는 단순히 데이터를 요약한 것인가요, 아니면 해석적인 이야기인가요?

  • 토픽 요약(Topic Summaries): 데이터 수집 질문과 비슷하거나, 단순히 "장벽", "경험", "영향" 등으로 묶은 것. (예: "의사와의 관계")
  • 의미 기반 해석적 이야기(Meaning-based Interpretative Stories): 데이터 속에 숨겨진 핵심 아이디어를 포착해 엮어낸 것. (예: "내 인격의 타당성 입증")

저자들은 성찰적 TA에서 토픽 요약은 말이 안 된다고 딱 잘라 말합니다.

"간단히 말해서, 토픽 요약은 성찰적 TA에서 개념적으로 말이 되지 않으며, 그 절차들은 깊은 이해의 발전과... 의미들에 대한 해석적 이야기 말하기를 지원하도록 설계되었습니다!"

"Simply put, topic summaries make no conceptual sense in reflexive TA, and the procedures have been designed to support the development of deep understanding and the telling of interpretative stories about meanings...!"

👉 Tip: 분석을 시작하기도 전에 만들 수 있었을 것 같은 제목이라면(예: "치료의 장점"), 그건 주제가 아니라 토픽 요약일 확률이 높아요!


3. "비너스는 바다에서 그냥 솟아나지 않습니다" 🐚

연구자의 성찰성(Reflexivity)에 대한 이야기예요. 단순히 "나는 백인 여성이고..." 같은 정체성 나열(Shopping list)에 그쳐서는 안 됩니다. 내가 누구인지가 분석에 어떻게 영향을 미쳤는지 설명해야 해요.

특히 주제가 데이터에서 저절로 "떠올랐다(Emerge)"라고 표현하는 것을 경계합니다. 주제는 연구자가 능동적으로 만들어내는(Generate/Construct) 것입니다.

"주제는 식별되거나, 찾아지거나, 발견되는 것이 아니며, 보티첼리의 유명한 그림에서 바다에서 솟아올라 해변에 도착하는 다 자란 비너스처럼 데이터로부터 단지 '떠오르는' 것은 결코 아닙니다."

"In reflexive TA, themes are generated, created or constructed... they are not identified, found or discovered, and they definitely don’t just “emerge” from data like a fully-grown Venus arising from the sea and arriving at the shore in Botticelli’s famous painting..."

 

또한, 참여자에게 분석 결과를 확인받는 구성원 확인(Member Checking)도 성찰적 TA와는 맞지 않는다고 해요. 왜냐하면 연구자는 '진실'을 전달하는 투명한 관이 아니라, 주관을 가지고 해석하는 존재이기 때문이죠. 대신 참여자의 추가적인 생각을 듣는 구성원 성찰(Member Reflections)을 권장합니다.


🧪 '아는 TA 연구자'가 되기 위한 10계명

마지막으로 저자들이 제안하는 10가지 권장 사항을 요약해 드릴게요. 체크리스트처럼 활용해 보세요! ✅

  1. TA의 다양성 인식하기: 내가 하는 게 '소문자 q'인지 '대문자 Q'인지 파악하세요.
  2. 철학적 가정 위치시키기: 나의 연구 가치관이 무엇인지 이론적으로 명시하세요.
  3. 일관성 확인하기: 모든 절차가 나의 연구 가치관과 충돌하지 않는지 점검하세요.
  4. 섞어쓰기(Mash-ups) 정당화하기: 기존 절차를 바꿨다면 왜 그랬는지 이유를 밝히세요.
  5. 성찰성 연결하기: 편향(Bias)이라는 말 대신, 나의 성찰성이 분석에 미친 영향을 적으세요.
  6. '어떻게'를 논의하기: 분석 과정을 구체적으로 설명하세요.
  7. 주제 유형 확인하기: '토픽 요약'이 아니라 '의미 기반 이야기'인지 확인하세요.
  8. 언어 점검하기: 주제가 "발견됐다"가 아니라 "생성했다"라고 표현하세요.
  9. 시각화하기: 주제 지도를나 표로 구조를 명확히 보여주세요.
  10. 품질 기준 맞추기: 실증주의적 잣대(예: 삼각검증)를 무비판적으로 가져다 쓰지 마세요.

마치며: 2006년 논문 그 너머를 보세요! 📚

저자들은 마지막으로 "제발 2006년 논문만 읽지 말고, 최근에 우리가 쓴 글들도 좀 읽어주세요!"라고 호소(?)합니다. TA에 대한 그들의 생각도 계속 진화해왔거든요.

"성찰적 TA에서 모범 사례를 추구하고자 하는 독자들을 위한 마지막 권장사항으로 끝맺는다—우리의 2006년 논문 그 너머를 읽어라!"

"We end with a final recommendation for readers wanting to pursue good practice in reflexive TA—read beyond our 2006 paper!"

 


주제 분석(Thematic Analysis, TA), 특히 우리가 개발한 TA 접근법이 IJTH에 게재된 질적(qualitative) 및 혼합 연구(mixed methods research)에서 점점 더 많이 사용됨(increasing use)에 따라, 저널의 편집자들(editors)은 우리에게 TA 연구에서의 모범 사례(good practice)와 흔한 문제점(common problems)에 대한 논평(commentary)을 제공해 달라고 요청했다(invited). 이 논평의 목적(aim)은 연구자들이 방법론적으로 일관성 있는(methodologically coherent) TA를 생산하고 보고하도록 안내하고(guide), 심사자들(reviewers)이 무엇이 모범 사례를 구성하는지 평가(assessing)하도록 도우며, 궁극적으로는 IJTH가 고품질(high quality) TA를 출판하도록 지원하는 것이다. 이 논평은 우리 연구를 인용한(citing) IJTH에 게재된 20편의 논문에 대한 검토(review)를 바탕으로 한다Footnote 1—주로 우리가 처음으로 우리의 TA 접근법을 개괄한(outlined) 논문인 Braun과 Clarke (2006)을 인용함—. 대부분의 저자들은 우리 접근법을 "따랐다(followed)"고 주장했고(claiming), 소수는 우리 연구를 인용했지만 다른 접근법을 사용했다. 여기서 우리의 목표가 우리가 개괄한 절차(procedures)에 대한 엄격한 준수(strict adherence)를 장려하거나 강제(enforce)하는 것이 아님을 강조하는 것(stress)이 중요하다. 이는 절차가 성찰성(reflexivity)과 이론적 민감성(theoretical sensitivity)보다 우선시되는(prioritized), 이른바 방법론 숭배(methodolatry) (Chamberlain, 2000) 또는 절차주의(proceduralism) (King & Brooks, 2018)라고 불리는 것이다. 오히려, 우리는 우리가 TA의 아는 실천(knowing practice)이라고 부르는 것을 장려하고 싶다. 아는 연구자(knowing researcher)는 자신의 개인적 및 이론적 관점(perspectives)을 "소유(own)"하려고 노력하고(strives), 의사결정(decision-making)에 있어 숙고적(deliberative)이며, TA 실천에 있어 성찰적(reflexive)인 사람이다.

 

우리가 검토한 20편의 논문은 트랜스젠더 건강 연구(transgender health research) 분야의 TA 연구에 대한 흥미로운 "스냅샷(snapshot)"을 제공한다. 대부분의 논문은 질적 연구(qualitative studies)를 보고했으며—나머지는 혼합 연구 설계(mixed-method designs)였다—주로 인터뷰(interview), 포커스 그룹(focus group) 또는 질적 설문조사 데이터(qualitative survey data)를 기반으로 했다. 대부분은 질적 연구에 대한 경험적 지향(experiential orientation)을 예시(exemplified)했는데, 이는 트랜스젠더 사람들(transgender folx)의 체험된 경험(lived experience)과 관점에 초점을 맞추거나 (그리고 트랜스젠더 청소년의 부모와 같은 타인의 견해에 대한 일부 관심), 특정 행동과 선택에 영향을 미치고 맥락화하는(contextualize) 요인들에 초점을 맞추었으며, 실재론적(realist) 또는 비판적 실재론적 존재론(critical realist ontology)에 의해 뒷받침되었다(underpinned). 우리는 트랜스젠더 건강 분야의 일부 연구자들이 질적 연구에 대한 비판적 지향(critical orientation) 내에서 의미의 사회적 구성(social construction of meaning)을 탐구(interrogate)하기 위해 TA를 사용하고 있다는 점에 고무되었다(heartened) (경험적/비판적 구분에 대한 추가 논의는 Braun & Clarke, 2022b 참조). TA가—혹은 사실상 질적 연구가—단지 경험을 들여다보는 창(window into experience)을 제공할 뿐이라는 생각은 불행히도 너무 흔하다(too common). 그 완전한 잠재력(full potential)은 훨씬 더 넓은데도 말이다.

 

우리의 비판적 검토(critical review)에서, 우리는 세 가지 중요한 이슈를 강조한다(highlight).

  • (1) 종종 인지되지 않는(unacknowledged) TA 내의 다양성(diversity)과, Marecek (2003)의 말을 빌리자면, "자신도 모르게 실증주의의 물에서 수영하는(swim unknowingly in the waters of positivism)" 많은 연구자들의 경향(tendency);
  • (2) '의미가 통합된 해석적 이야기로서의 주제(themes-as-meaning-unified-interpretative-stories)''토픽 요약으로서의 주제(themes-as-topic-summaries)'와 혼동하는 것(confusing); 그리고
  • (3) 자신의 관점을 소유하지 않는 것((not) owning one’s perspective).

TA는 방법들의 가족(family of methods)이지, 단일한 방법(singular method)이 아니다—"표준화된 TA(standardised TA)"란 없다! (TA is a family of methods, not a singular method—there is no “standardised TA”!)

 

아는 TA 실천(knowing TA practice)으로 가는 길의 중요한 단계(step)는 TA 내의 다양성을 인정하고(appreciating) 당신이 어떤 유형(type)의 TA를 실천하고 있는지 이해하는 것이다. 검토된 논문 중 일부는 암묵적으로(implicitly) 또는 명시적으로(explicitly) TA를 단일한 방법으로 제시했는데(예: "표준화된 TA"에 대한 언급을 통해), 반면 TA는 방법들의 가족(family of methods)으로 생각하는 것이 더 낫다. TA 가족 내의 다양성 일부를 포착(capture)하기 위해, 우리는 유사한 접근법들의 유형(typology)을 개발했는데, 이를 코딩 신뢰도(coding reliability), 코드북(codebook), 성찰적 TA(reflexive TA), 그리고 주제 코딩(thematic coding)으로 명명한다(designate) (가장 상세한 논의는 Braun & Clarke, 2022b 참조). 이러한 접근법들은 몇 가지 공통점(things in common)을 가진다:

  • 코딩 및 주제 개발(theme development)의 실천;
  • 의미적(semantic) 및/또는 잠재적 의미(latent meaning)를 포착할 가능성;
  • 자료에 귀납적으로(inductively) 및/또는 연역적으로(deductively) 지향하는 것;
  • 그리고 TA를 이론적으로 정보를 갖춘(theoretically informed) 한계가 정해진 방법론(delimited methodology)이 아니라, 이론적으로 유연한 방법(theoretically flexible method)Footnote 2으로 지정하는 것.

그러나 그것들은 코딩과 주제 개발의 실행(enactment), 기저에 깔린 연구 가치(underlying research values), 그리고 주제(theme)와 같은 핵심 개념의 개념화(conceptualization)에 있어 다르다(differ). 절차적 차이(procedural differences)는 사소한(trivial) 것으로 일축되어서는 안 되는데(dismissed), 왜냐하면 그것들은 기저의 연구 가치를 반영하기 때문이다. 우리는 Kidder와 Fine (1987)의 소문자 q(small q)/대문자 Q(Big Q) 질적 구분이 우리 유형을 개발할 때 유용하다는 것을 발견했다. 또한 우리는 Finlay의 더 최근 (2021) 구분인

  • 과학적으로 기술적인(scientifically descriptive) (소문자 q, 실증주의적) TA와
  • 예술적으로 해석적인(artfully interpretive) (대문자 Q, 비실증주의적, 성찰적) TA의 구분을 좋아한다.

소문자 q 질적 연구(Small q qualitative research)(후기)실증주의((post)positivism)의 틀(framework) 내에서 질적 자료 수집 및 분석 기법(techniques)의 사용을 반영한다—심리학이라는 우리 학문을 포함한 많은 학문 분야에서, 이것이 연구를 위한 지배적인 가치 틀(dominant values framework)이다. 코딩 신뢰도 TA(Coding reliability TA)는 소문자 q 또는 실증주의적 질적 연구의 예(example)인데, 왜냐하면 그것은 코딩의 객관성(objectivity), 신뢰도(reliability) 또는 정확성(accuracy)을 보장하고 "연구자 편향(researcher bias)"을 억제하는(keeping in check) 절차를 강조하기(emphasizes) 때문이다 (예: 구조화된 코드북(structured codebooks)의 사용, 동일한 데이터를 독립적으로 코딩하는 다수의 코더(multiple coders), 코더 간 일치도(intercoder agreement) 계산 및 합의 코딩(consensus coding) 등을 통해).

 

대문자 Q 질적 연구(Big Q qualitative)는 질적 연구 가치에 의해 정보를 얻은 비실증주의적 틀(non-positivist framework) 내에서 질적 자료 생성(data generation) 및 분석 기법의 사용을 수반한다(involves). 모든 질적 연구자들이 동의하는 하나의 연구 가치 세트는 없지만, 많은 이들이 연구자 주관성(researcher subjectivity)을 억제되어야 할 위협(threat to be contained)이 아니라 연구를 위한 자원(resource)으로 강조하며, 의미와 지식을 맥락적으로 위치한(contextually situated), 부분적이고(partial), 잠정적인(provisional) 것으로 강조한다. 대문자 Q 연구자들은 전형적으로 마음과 독립적인 진리(mind-independent truth)가 아니라 마음에 의존적인 진리들(mind-dependent truths)을 개념화한다(Tebes, 2005). 우리의 접근법—TA의 다원성(plurality)을 인정하고 다른 접근법들과 더 잘 구별하기 위해 이제 성찰적 TA(reflexive TA)라고 부르는—은 대문자 Q 또는 비실증주의적 질적 접근법의 예이다(다른 성찰적 접근법으로는 Hayes, 2000; Langdridge, 2004 참조). 성찰적 TA 접근법은 연구자 주관성을 연구 자원으로 수용하고(embrace) (연구자 편향이라는 실증주의적 관념을 거부하며(rejecting), Varpio et al., 2021 참조), TA의 실천을 본질적으로 주관적인(inherently subjective) 것으로 보며, 연구자 성찰성(researcher reflexivity)을 강조하고, 코딩이 언제라도 정확할(accurate) 수 있다는 관념을 거부한다(reject)—왜냐하면 그것은 본질적으로 해석적인 실천(inherently interpretative practice)이며, 의미는 데이터 내에 고정되어(fixed) 있지 않기 때문이다.

 

코드북 접근법(Codebook approaches)프레임워크(framework) (Gale et al., 2013) 또는 템플릿(template) 분석 (King & Brooks, 2018)과 같은—은 코딩 신뢰도 TA Footnote 3의 더 구조화된 절차(structured procedures) 중 일부와 성찰적 TA의 질적 연구 가치 중 일부를 결합한다(combine). 마지막으로, 주제 코딩(thematic coding)은 데이터로부터 주제를 개발하기 위해 근거 이론(grounded theory) 코딩 절차의 사용을 수반한다. 주제 코딩은 여전히 사용되고 있으며—우리 검토에 포함된 몇몇 논문 Footnote 4을 포함하여—일부 방법론 텍스트(예: Flick, 2018; Rivas, 2018)에서 논의되고 있지만, TA가 별개의 방법(distinct method)으로 널리 인식되기 전에 더 흔했다(more common).

 

연구자들이 겉보기에 자신도 모르게(seemingly unknowingly) 서로 다른 TA 접근법들을 마구 섞을(mash together) 때 방법론적 불일치(Methodological incoherence)가 손짓한다(beckons) (Braun & Clarke, 2022a 참조). 우리가 검토한 논문들 중에는 연구자들이 대문자 Q 성찰적 TA 접근법과 절차를 사용하면서 개념적으로 일관성 없는(conceptually incoherent) 추가 사항들을 곁들인 사례가 여러 건 있었다. 예를 들어,

  • 소문자 q의 합의 코딩(consensus coding) 및 코더 간 일치도 측정(measuring intercoder agreement), 또는 코드북 개발/데이터 재코딩(recoding) 단계를 추가하거나,
  • 연구자 편향이라는 실증주의적 관념과 성찰성이라는 대문자 Q의 관념을 모두 참조하거나(referencing), 또는
  • 코딩의 정확성과 객관성, 혹은 데이터를 잘못 해석할(misinterpreting) 가능성(올바른 해석이 가능하다는 것을 암시함)에 대한 우려(concern)를 표명하는 것 등이다.

그 논문들은 실증주의적/소문자 q와 비실증주의적/대문자 Q TA/질적 연구 양쪽의 개념과 절차를 가져다 쓸(drawing on) 때 방법론적 불일치의 가능성에 대한 인식(recognition)을 거의 보여주지 않았으며(evidenced little), 이러한 "매시업(mash-ups, 뒤죽박죽 섞기)"에 대한 정당성(justification)이나 근거(rationale)에 대해서도 마찬가지였다. 이를 지적함(pointing this out)에 있어, 우리는 분석 절차가 베이킹 레시피(baking recipes)처럼 정확하게 따라야 하며 이것이 좋은 연구를 구성한다고 주장하는 것이 아니다. 오히려, 아는 TA 연구자(knowing TA researcher)라면 확립된 절차로부터의 일탈(divergence)을 인정하고(acknowledge)—개념적 불일치를 포함하여—그들의 혁신적인 접근법(innovative approach)에 대한 근거(rationale)를 제공할 것이다. TA 연구에서 "무엇이든 좋다(anything goes)"는 것은 사실이 아니다(not the case). 왜냐하면 절차들은 광범위한 패러다임적(paradigmatic) 및 개념적 기초(conceptual foundations)를 가지고 있기 때문이다. 연구자는 일관성 있게(coherently) 기술적 과학자(descriptive scientist)인 동시에 해석적 예술가(interpretative artist)일 수는 없다(Finlay, 2021). 우리와 다른 TA 방법론자들이 개발한 절차들은 기저의 연구 가치에 대한 심사숙고된 표현(thought-through manifestations)이며, 이는 일탈과 매시업 또한 동등하게 신중해야(thoughtful) 함을 의미한다.

 

 

의미가 통합된 이야기를 말하기인가 아니면 토픽을 요약하기인가? (Telling meaning-united stories or summarizing topics?)

 

TA(주제 분석) 방법의 가족(family of methods) 전체에 걸친 또 다른 차이점(divergence)은 주제(themes)의 개념화(conceptualization), 그리고 주제가

  • a) 토픽이나 범주의 요약(summaries of topics or categories) (주제 내에서 관찰된 것들을 공유하고 결속시키는(unites) 것은 "의료 서비스에서의 좋은 경험"과 같은 토픽(topic)임)으로 이해되는지; 아니면
  • b) 핵심 아이디어 또는 의미를 포착(capturing a core idea or meaning)하고 (주제 내에서 관찰된 것들을 공유하고 결속시키는 것은 의미(meaning)임), 그것에 대한 해석적 이야기(interpretative story)를 말하는 것(telling)으로 이해되는지와 관련이 있다.

이 후자의 유형(latter type)의 주제는 만약 핵심 아이디어(core idea)나 의미가 분명하다면(evident), 겉보기에는 관련 없어 보이는 토픽들(seemingly unrelated topics)과 연결된 데이터조차도 하나로 끌어모을(draw together) 수 있다. 주제로서의 토픽 요약(Topic summaries as themes)은 코딩 신뢰도(coding reliability) 및 일부 코드북 TA(codebook TA), 그리고 주제 코딩(thematic coding)에서 흔하다(common). 반면 성찰적(reflexive), 그리고 일부 코드북 TA에서의 주제는 의미 기반의(meaning-based), 해석적 이야기(interpretative stories)로 개념화된다. 그러나 이러한 개념화들(conceptualisations)은 종종 실제 현장(practice)에서 일어나는 일과 일치하지(map onto) 않는다.

  • 토픽 요약 주제(Topic summary themes)는 성찰적 TA에서 너무나 널리 사용되어(widely used) 우리는 이것을 성찰적 TA에서의 가장 "흔한 문제(common problem)"로 식별했다(identified) (Braun & Clarke, 2021a 참조)—
  • 우리가 "실증주의 슬금슬금 기어오기(positivism creep)"라고 부르는 것과 나란히(alongside). 여기서 실증주의 슬금슬금 기어오기란 실증주의(positivism)가 자신도 모르게 성찰적 TA로 미끄러져 들어오는(slips unknowingly into) 현상을 말한다 (연구자 편향(researcher bias)과 같은 개념의 사용을 통해; Braun & Clarke, 2022b 참조).

두 가지 문제 모두—실증주의 슬금슬금 기어오기, 그리고 성찰적 TA에서의 토픽 요약 주제 사용—우리가 검토한 논문들에서 분명했다(evident). 우리에게는, 이 두 가지 "유형(types)"의 주제 사이의 구분(distinction)이 매우 명확하지만(very clear), 우리는 연구자들이 때때로 그 구분을 어려워한다(struggle with)는 것을 안다.

 

그렇다면, 만약 당신이 성찰적 TA를 수행하고 있다면(doing), 당신의 주제가 토픽 요약인지 아니면 의미 기반의 해석적 이야기인지 어떻게 확인할(check) 수 있을까? 만약 당신이 데이터를 분석하기 전(before analyzing)에 이 주제를 개발하는 것이 상상 가능했다면(conceivably), 혹은 그것이 데이터 수집 질문(data collection question)과 밀접하게 일치한다면(maps closely on to), 그것은 토픽 요약(topic summary)일 가능성이 꽤 높다(quite likely). 마찬가지로(Similarly), 만약 그것이 특정 이슈나 토픽에 대해 참여자들이 말한 다르거나 주요한 것들을 요약한다면(summarizes) [그렇다]. 주제 이름(Theme names)은 예를 들어 토픽을 식별하는(identifies)

  • "의사들(Doctors)"과 같은 한 단어 이름(one-word name)이나,
  • "…의 경험들(Experiences of…)",
  • "…에 대한 장벽들(Barriers to…)",
  • "…에 대한 영향들(Influences on…)"
    • 과 같은 것을 통해 토픽 요약임을 암시할(suggest) 수 있다.

이는 다양한 경험, 장벽, 영향들이 논의될 것임을 암시한다 (때로는 의미 기반 주제들도 나쁘게 명명될(badly named) 수 있다, Braun & Clarke, 2022b 참조). 대조적으로(By contrast), 결속시키는 의미(uniting meaning)를 중심으로 구축된 해석적 이야기로서의 주제는 분석에 앞서(in advance of analysis) 개발될 수 없다. 그것들은 다양성(diversity)을 포함하지만(contain), 그 다양성을 통합하는(unifies) 중앙 아이디어(central idea)를 가지고 있다 ("의료 서비스에서의 좋은 경험" 대신에 "내 인격의 타당성 입증(validation of my personhood)"이라는 주제를 가질 수 있다).

 

검토된 논문 중 두 편이 의미 기반 해석적 이야기로서의 주제에 대한 명확한 예시(clear examples)를 제공했다.

  • Fraser 등 (2021)은 뉴질랜드에서 트랜스젠더 성인들의 성 확정 의료(gender affirming healthcare) 준비도 평가(readiness assessments) 경험을 탐구했다(explored). 더 많은 수의 주제와 하위주제(subthemes)를 보고한 대부분의 검토된 논문들과는 대조적으로(In contrast to), Fraser 등은 두 가지 주제를 보고했다: 젠더 증명하기(proving gender)트랜스 서사(the trans narrative).
    • 젠더 증명하기는 그들이 적절하게(adequately) 혹은 진정으로(truly) 트랜스인지 시험하기 위해 설계된 혐오스러운 문지기 실천(aversive gatekeeping practice)으로서의 평가 과정(assessment process)에 대한 참여자들의 경험을 중심으로 했다(centered around).
    • 트랜스 서사는 참여자들이 성 확정 의료에 대한 접근(access)을 얻기 위해 자신의 젠더를 특정한 방식(particular way)으로 제시해야(present) 한다고 느꼈던 압박(pressure)을 중심으로 했다—"제대로 트랜스(properly trans)"인지 시험하는 평가 과정의 성격 때문에—. 트랜스 서사는 이분법적 트랜스 정체성(binary trans identity)을 요구했고(required), 아주 어린 나이부터 자신이 트랜스임을 알고 있었으며 "완전한(full)" 의학적 전환(medical transition)을 원할 것을 요구했다.
  • Frohard-Dourlent 등 (2020)은 캐나다에서의 수술 준비도 평가(surgical readiness assessments) 경험을 탐구했고 세 가지 주제와 일곱 가지 하위주제를 보고했다.
    • 1) 문지기 역할로서의 평가(Assessments as gatekeeping) (세 가지 하위주제 포함: 구식이고 부적절한(outdated and irrelevant) 평가; 치료를 약화시키는 권력 비대칭(power asymmetry undermining care); 차별적인(discriminatory) 평가);
    • 2) 치료에 대한 장벽으로서의 평가(Assessments as a barrier to care) (하위주제: 혼란스러운(confusing) 평가; 그리고 접근 불가능한(inaccessible)); 그리고
    • 3) 유용한 것으로서의 평가(Assessments as useful) (하위주제: 효과적이고 명확하게 해주는(effective and clarifying) 평가; 그리고 지지해주는(affirming)).
    • Fraser 등이 보고한 경험과 유사하게(Similar to), 참여자들은 종종 평가 과정을 혐오스러운 문지기 역할로 경험했는데, 의료 전문가들(health professionals)이 치료 접근을 거부할(deny access) 권력을 가지고, 전형적이고(archetypal) 구식인 이분법적 트랜스 서사에 대한 순응(conformity)을 강요했다(compel). 평가는 불투명성(opaqueness), 관료주의(bureaucracy), 그리고 사회경제적 특권(socio-economic privilege)의 결여 때문에 접근하기 어려운(difficult to access) 것으로 경험되었다. 평가는 또한 역으로(conversely) 일부에 의해 긍정적인(positive) 것으로 경험되기도 했는데, 참여자들은 평가자(assessor)에 의해 지지받는다고(supported) 느끼고 다음 단계를 위해 준비되었다고(prepared) 느꼈다.
    • Frohard-Dourlent 등은 또한 주제 구조(thematic structure)에 대한 명확한 개요(overview)의 예시(표 형식으로)와, 저자들의 분석 과정(analytic process) 및 성찰적 TA와의 관여(engagement)에 대한 간략하지만 효과적인 설명(account)을 제공하는데, 이 둘은 모두 고품질 TA 보고서(high-quality TA report)의 중요한 요소들이다(Braun & Clarke, 2022b).

 

토픽 요약과 의미 기반 해석적 이야기 주제 사이의 이러한 구분(distinction)이 왜 중요하며(matter), 연구자들이 성찰적 TA를 사용하면서도 일련의 토픽 요약들(set of topic summaries)을 생산하는 것이 왜 문제(problem)인가? 간단히 말해서(Simply put), 토픽 요약은 성찰적 TA에서 개념적으로 말이 되지 않으며(make no conceptual sense), 그 절차들(procedures)은 깊은 이해(deep understanding)의 발전과, 데이터셋을 가로지르며(cut across) 당신이 이해하려고 노력하는 것의 중요한 측면을 포착하는 의미들(meanings) (때로는 명백하고, 때로는 미묘한)에 대한 해석적 이야기 말하기(telling of interpretative stories)를 지원하도록 설계되었다(designed)! 그 실천(practice)은

  • 관여의 깊이(depth of engagement), 데이터에 대해 창의적이고(creatively) 성찰적으로 생각하기, 데이터 의미의 다른 측면들(facets)을 분석해 내고(parse out) 연구자가 데이터 내의 가장 뻔하거나(obvious) 표면적인 의미들(superficial meanings) 너머로 이동하도록(move beyond) 돕기 위해 설계된 집중적이고(intensive) 유기적인 코딩 과정(organic coding process)을 요구한다(requires).

분석을 시작하기 전(before beginning the analysis)에 결정될 수도 있었을 표제(headings) 아래에 데이터를 요약하기 위해 이 힘든(laborious) (하지만 바라건대 보람 있는) 과정에 참여하는 것은 별 의미가 없다(little point). 만약 당신의 목표(goal)가 토픽 요약 유형의 주제 세트를 개발하는 것이라면, 당신의 연구 가치(research values)에 의해 결정되고 그것을 분석적 목적(analytic purpose)으로 삼는 접근법(approach)을 선택하라(select). 코딩 신뢰도와 일부 코드북 접근법 모두 주제를 토픽 요약으로 개념화한다(템플릿 분석(template analysis)은 코딩 중 또는 코딩으로부터 주제를 개발할 가능성을 허용한다는 점이 주목할 만하다(notably)). 그것들은 분석 과정의 초기(early)에 개발되며, 때로는 데이터 수집 질문에서 가져오기도(lifted from) 하며, 코딩은 데이터를 이러한 초기/사전 결정된 주제(early/pre-determined themes)에 할당하는(allocating) 과정이다.

 

자신의 관점을 소유하기 [또는 소유하지 않기] ((Not) owning one’s perspective)

 

우리가 검토한 논문들은 연구자가 자신의 관점(perspective)을 소유하려고 노력하는 것(striving to own)과 관련하여 모범 사례(good practice)와 나쁜 사례(bad practice)를 모두 예시했다(exemplified). 모든 논문은 연구자의 개인적 위치(personal positioning) 및/또는 젠더 정체성(gender identity)과 관련된 전문적 경험에 대한 어떤 종류의 진술(statement)을 포함했는데, 이는 사회적으로 소수자화된 집단(socially minoritized groups)을 연구할 때, 그리고 연구자가 더 사회적으로 강력하고 특권적인 외부인(privileged outsiders)일 때 특히 중요하다. 그러나, 성찰성(reflexivity)은 이러한 더 개인적인 프레이밍(personal framing)을 넘어서는 경우가 드물었다(rarely extended beyond) (Wilkinson, 1988). 정체성의 "쇼핑 리스트(shopping list)"넘어서는(goes beyond) 성찰적 실천(Reflexive practice) (Folkes, 2022)은 성찰적 TA(reflexive TA)에 있어 특히 중요하다. 우리는 연구자들이 자신의 개인적 위치를 분석 과정(analytic process)에 연결하는 더 많은 사례(instances)와, 연구자들이 어떻게(how) 성찰성에 관여했는지(engaged in), 그리고 이것이 그들이 생산한 분석을 어떻게 형성했는지(shaped)에 대한 더 상세한 논의를 읽기를 고대한다 (이에 대한 훌륭한 예시는 Ho et al., 2017; Trainor & Bundon, 2021 참조). 주제 개발(theme development)을 둘러싼 언어 또한 주제를 생성하는 데 있어 연구자의 능동적 역할(active role)을 알리는 데(signal) 중요하다 (그리고 주제가 분석 이전에 데이터 내에 존재하는 실재하는 것들(real things)로 암묵적으로 개념화되지 않았음을 분명히 알리기 위해서도). 성찰적 TA에서, 주제는 생성되거나(generated), 창조되거나(created), 구성된다(constructed) (예를 들어). 그것들은 식별되거나(identified), 찾아지거나(found), 발견되는(discovered) 것이 아니며, 보티첼리의 유명한 그림에서 바다에서 솟아올라 해변에 도착하는 다 자란 비너스(fully-grown Venus)처럼 데이터로부터 단지 "떠오르는(emerge)" 것은 결코 아니다 (Braun & Clarke, 2006, 2016 참조).

 

개인적이든 아니든, 성찰성(Reflexivity)은 연구자가 자신의 관점을 소유하려고 노력하는 것의 한 측면(aspect)이다; 그들의 이론적 가정(theoretical assumptions)을 논의하고 일관성 있게 실행하는 것(coherently enacting)은 또 다른 측면이다. 검토된 논문 중 일부는 TA 사용에 정보를 주는(informing) 이론적 가정에 대한 진술을 포함했다. 그러나 일부는 그렇지 않았다. TA는 방법론(methodology)이라기보다는 방법(method)에 더 가까운 것으로 이해되는 것이 낫기 때문에, 그리고 그것의 이론적 유연성(theoretical flexibility) 때문에, 연구자들이 TA의 사용을 이론적으로 위치시키는 것(locate theoretically)은 필수적이다(vital) (Braun & Clarke, 2022a, 2022b 참조). TA는 이론적 진공(theoretical vacuum) 상태에서 수행될 수 없다—연구자들은 비록 논의되지 않더라도 실재(reality)의 본질에 대해, 무엇이 의미 있는 지식(meaningful knowledge)과 지식 생산(knowledge production)을 구성하는지에 대해, 그리고 그들의 데이터가 무엇을 나타내거나 접근하게 해주는지에 대해 피할 수 없이(inescapably) 가정을 가져온다. 이상적으로는(Ideally), 독자가 연구자의 가정이 무엇인지 탐지하도록(detect) 남겨져서는 안 되며—그것들은 논문에서 명시적으로(explicitly) 논의되어야 한다. 우리는 원래 성찰적 TA가 (단순) 실재론((simple) realism)에 의해 뒷받침될 수 있다고 진술했었지만(Braun & Clarke, 2006), 이제 우리는 성찰적 TA의 대문자 Q 연구 가치(Big Q research values)가 단순하거나 순진한 실재론적(naive realist) 성찰적 TA를 까다로운 명제(tricky proposition)로 만든다고 생각한다. 이는 포화(saturation), 삼각검증(triangulation), 구성원 확인(member checking) (Varpio et al., 2017 참조)과 같이 널리 사용되는 실재론적/실증주의적 품질 실천(quality practices)들이 성찰적 TA와 일관성이 있는지(coherent)에 대한 의문을 제기한다(raises questions). 이들은 검토된 논문들과 출판된 TA에서 더 광범위하게 참조되는 것들이다.

 

우리는 이것을 탐구하기 위해 구성원 확인(member checking) 또는 분석에 대한 참여자 타당화(participant validation)를 사용할 것이다—여기서 참여자들은 분석이 그들의 경험을 충실하게(faithfully) 또는 공정하게(fairly) 나타내는지에 대해 투입(input)하도록 요청받는다. 이론적으로(in theory) 이 관행은 연구자의 주관적 편향(subjective bias)—오해(misinterpretation), 잘못된 강조(misemphasis)—을 통제하거나(controls for) 수정한다(corrects) (Smith & McGannon, 2018). 윤리적으로/정치적으로, 이 관행은 사회적으로 소외된 집단(socially marginalized groups)의 경험을 연구하고 대변한다고(represent) 주장할 때 의문의 여지 없이 중요하다. 특히 트랜스 건강 연구(trans health research)의 경우 흔히 그렇듯 연구자들이 모두 해당 집단에 대해 특권적인 "외부인(outsiders)"일 경우 더욱 그렇다. 그러나, 구성원 확인의 사용은 성찰적 TA와 (개념적으로) 불편하게 자리 잡는(sit uncomfortably) 실재 및 지식 생산에 대한 가정들로 스며들어 있다(infused with)—연구자 영향력(researcher influence)의 잠재적으로 왜곡하는 효과(distorting effects)를 억제할(keep in check) 수만 있다면 우리가 접근할 수 있는 참여자 경험의 진실(truth)이 있다는 가정을 포함하여 (Smith & McGannon, 2018 참조). 성찰적 TA는 연구자가 항상 그들의 연구를 형성한다(shaping)는 것을 전제로 한다(premised on); 그것은 항상 그들의 주관성으로 스며들어 있을 것이며, 그들은 결코 단순히 직접 접근된(directly-accessed) 참여자 경험의 진실을 전달하는 중립적 전달자(neutral conduit)가 아니다. Tracy (2010)는 구성원 확인에 대한 대문자 Q 대안(Big Q alternative)으로서 구성원 성찰(member reflections)이라는 개념을 강조했는데(highlighted), 이는 검증(verification)이나 진실 또는 실재에 접근하는 것에 관한 것이 아니다. 이 과정을 통해, 참여자들은 분석에 대해 성찰(reflect)하여 추가적인 통찰(additional insight)을 제공하고 당면한 주제에 대한 더 많은 데이터를 생성하도록 초대받는다. 이는 이해의 간극(gaps)을 탐구하고, 이해의 모순(contradictions)과 차이점을 인식하고 성찰하며, 이를 서면 보고서에 어떻게 인정하고 제시할지 고려하는 것을 의미할 수 있다 (Smith & McGannon, 2018 참조). 원주민(Indigenous) 및 참여적 접근법(participatory approaches)의 넓은 다양성 내에서 (예: Barlo et al., 2020; Cammock et al., 2021; Fine et al., 2021; Ware et al., 2018), "연구자"와 "참여자" 사이의 다르게 개념화된 관계, 그리고/또는 지식의 (목적) 및 연구의 (일차적) 의무와 목적에 대한 이해 또한 "구성원 확인"에 대한 고려를 (질적) 지식 생산의 더 관습적인 서구적 틀(conventional western frameworks)과는 상당히 다르게 만든다(render).

 

방법론적으로 일관성 있는 품질 기준(quality standards)과 도구를 선택하는 열쇠는 아는 실천(knowing practice)이다—즉, 특정 개념과 관행에 내재된(embedded) 가정을 통해 추론하는 것(reasoning through)이다. 다행히도, 질적 방법론자들은 이미 여기서 많은 힘든 일(heavy lifting)을 해왔으며 (예: Braun & Clarke, 2021b; Smith & McGannon, 2018; Varpio et al., 2017, 2021), 보편적이라고 가정되는 다양한 기준(criteria)들에서 무엇이 가정되고 무엇이 위태로운지(at stake)에 대한 사려 깊은 고려사항들을 제시했다. 당신의 과업(task)은 생각하고, 성찰하며, 당신이 사용하는 어떤 품질 척도(quality measures)도 당신의 TA 접근법 및 기저의 이론적 가정과 일관성이 있는지(coherent) 확인하는 것이다.

 

방법론적으로 일관성 있는 TA를 생산하고 보고하며, 아는 TA 연구자가 되기 위한 10가지 권장사항 (Ten recommendations for producing and reporting methodologically coherent TA and being a knowing TA researcher)

 

이제 우리는 이 논평을 TA 연구자들이 방법론적으로 일관성 있는 TA를 생산하고 보고하는 데 도움이 되도록 열 가지의 간결한 권장사항(snappy recommendations)으로 증류한다(distill). 우리는 심사자들(reviewers)이 TA 원고(manuscripts)에 대한 평가(assessments)에 정보를 주기 위해 이 권장사항들을 사용할 것을 장려한다. 이것들은 좁은 의미의 체크리스트(checklist)로 취급되어서는 안 되며, 성찰하고 추론해야 할(reason through) 중요한 것들로 취급되어야 한다—이것들을 아는 실천을 위한 도발(provocations)로 고려하라.

  1. TA의 다원성(plurality)을 인식하라; 당신이 선택한 TA 접근법이 과학적으로 기술적인(소문자 q)—예술적으로 해석적인(대문자 Q) 스펙트럼의 어디에 위치하는지 결정하라.
  2. 당신의 기저에 깔린 연구 가치와 철학적 가정을 결정하라; TA의 사용을 이론적으로 위치시켜라(locate).
  3. 당신의 분석적 실천(practice)을 고려하라; 모든 방법론적 절차와 개념이 당신의 연구 가치 및 TA 접근법과 일치하는지(cohere) 확인하라.
  4. 확립된 실천에서의 일탈(divergences)과 "매시업(mashups)"을 정당화하라(Justify); 이것들이 이론적으로 일관성이 있는지 확인하라.
  5. 만약 성찰적 TA를 사용한다면, 개인적 성찰성을 당신의 분석적 실천에 연결하라; 편향(bias)을 언급하지 마라.
  6. 분석을 생산하기 위해 당신이 선택한 접근법에 정확히 어떻게(how) 관여했는지 논의하라.
  7. 주제에 대한 '토픽 요약' 개념화와 '의미 기반 해석적 이야기' 개념화 사이의 차이를 인식하라; 당신의 주제 유형이 당신의 TA 접근법과 일관성이 있는지 확인하라 (그리고 어떤 일탈이든 정당화하라).
  8. 주제 개발을 둘러싼 당신의 언어가 당신의 TA 접근법과 일관성이 있는지 확인하라.
  9. 목록(list), 표(table) 또는 주제 지도(thematic map)의 형태로 주제/주제 구조에 대한 명확한 개요(overview)를 제공하라.
  10. 사용된 품질 기준과 실천이 당신의 TA 접근법 및 기저의 이론적 가정과 일치하는지(cohere) 확인하라.

모든 것은 변한다… (Everything changes…)

 

우리는 성찰적 TA에서 모범 사례를 추구하고자(pursue) 하는 독자들을 위한 마지막 권장사항으로 끝맺는다—우리의 2006년 논문 그 너머를 읽어라(read beyond)! TA에 대한 우리의 생각은 2006년 이후 진화해왔으며(evolved), 이제는 성찰적 TA(reflexive TA)라는 특정 이름을 사용하는 것을 포함한다(Braun & Clarke, 2019).

  • 우리의 최근 저서 Thematic analysis: A practical guide (Braun & Clarke, 2022b)는 성찰적 TA를 수행하는 것과 TA에 대해 생각하는 것 모두에 대해 가장 포괄적인 지침(comprehensive guidance)을 제공한다.
  • 우리는 우리가 생산한 모든 자원(resources)으로 연결되는 웹사이트—www.thematicanalysis.net—를 개발했다.
  • 우리는 다른 무엇보다도(among other things), 성찰적 TA를 둘러싼 오해(misconceptions)와 혼란, 포화가 성찰적 TA에 의미 있는 개념인지(요약하자면(TL; DR) 아니, 그렇지 않다!; Braun & Clarke, 2021b),
  • 방법론적으로 일관성 있는 TA 연구 설계하기(Braun & Clarke, 2022a), 그리고
  • 언제 왜 성찰적 TA를 사용하는지(Braun & Clarke, 2021c)를 다루는 수많은 논문을 출판했다.
  • 우리는 특히 심사자들이 Braun과 Clarke (2021a)에 있는 출판용 TA 원고를 평가하기 위한 도구(tool for evaluating TA manuscripts)를 읽을 것을 장려한다.
J Contin Educ Health Prof. 2025;45(4):299-303. doi: 10.1097/CEH.0000000000000607. Epub 2025 Apr 30.

Beyond the Lecture: A Delphi Study of In-Person and Virtual Active Learning Techniques in Didactic Continuing Education

Yemisi O Jones 1 2 3 4 5 6 7Kristen Timmons 1 2 3 4 5 6 7Rebecca Kolb 1 2 3 4 5 6 7Lisa E Herrmann 1 2 3 4 5 6 7Laura Werts 1 2 3 4 5 6 7Melissa Klein 1 2 3 4 5 6 7Jennifer O'Toole 1 2 3 4 5 6 7

 

 

제목: 🎤 "그냥 강의만 듣는 건 지루해!" 보수교육(CE)을 깨우는 능동적 학습 기법들

 

안녕하세요! 오늘은 교육자, 특히 의료계나 전문직 보수교육(Continuing Education, CE)을 담당하시는 분들에게 아주 흥미로운 연구 결과를 소개해 드리려고 해요. 다들 공감하시겠지만, '그랜드 라운드(Grand Rounds)' 같은 대규모 강의는 준비하기 편하고 많은 정보를 전달할 수 있어서 여전히 많이 쓰이고 있죠. 하지만 솔직히... 그냥 앉아서 듣기만 하는 건 졸리고 지루하잖아요? 😴

 

그래서 '능동적 학습(Active Learning)'이 중요한데, 과연 이미 다 아는 '전문가 학습자(Expert Learners)'들이 모인 대규모 강의에서도 이게 통할까요? 그리고 요즘 같은 온/오프라인 하이브리드 시대에 줌(Zoom) 같은 가상 환경에서도 가능할까요?

 

이 궁금증을 해결하기 위해 전문가와 학습자 패널이 모여 머리를 맞댄 델파이 연구(Delphi Study) 결과를 정리해 봤습니다.


1. 왜 이 연구를 했을까요? 🤔

초보자들에게 능동적 학습이 좋다는 건 다들 알지만, 이미 현업에 있는 전문가들에게는 어떤 기법이 맞는지 잘 알려지지 않았어요. 연구진은 이렇게 말합니다.

"이 격차를 해소하는 것은 교육자들이 대규모 그룹 CE를 위한 더 효과적인 주입식 교육을 개발하는 데 도움을 줄 수 있습니다." (Addressing this gap can help educators develop more effective didactic education for large-group CE.)

 

2. 어떤 기법들이 '합격점'을 받았나요? ✅

 

전문가와 실제 참여자 모두가 "이건 괜찮다(적절성)", "할 만하다(실행 가능성)", "참여하고 싶다"고 입을 모은 Best 기법들은 다음과 같습니다. (대면과 온라인 모두 OK!)

  • 청중 반응 (Audience Response): 투표 기능 등을 써서 참여 유도하기 📊
  • 증례 토의/연구 (Case Discussion/Study): 케이스를 보고 내 접근법 공유하기
  • 지식 확인 (Knowledge Check): 점수 없는 퀴즈로 내 상태 점검하기
  • 가장 혼란스러운 점 (Muddiest Point): 강의 후 가장 이해 안 된 부분 적어내기
  • 질의응답 (Question & Answer): 이건 기본 중의 기본! 🙋‍♀️
  • 소그룹 토의 (Small Group Discussion): 잠깐 옆 사람과, 혹은 소회의실에서 토론하기

놀라운 점은 우리가 대면(In-person) 용이라고 생각했던 것들이 온라인에서도 충분히 통한다는 거였어요.

"대면 학습을 위해 기술된 기법들은 대체로 가상 환경에서도 적절하고, 실행 가능하며, 참여 가능성이 높은 것으로 간주되었습니다." (Techniques described for in-person learning were largely also deemed appropriate, feasible, and with high likelihood for engagement in virtual settings.)

 

3. 전문가와 학습자의 동상이몽? 🙅‍♂️

 

흥미로운 건 전문가(강사/기획자)와 학습자(청중)의 생각이 달랐던 부분이에요.

  • 전문가들은 '1:1 멘토링'이나 '복잡한 피드백'이 필요한 기법(예: 시험 문항 작성하기)은 대규모 강의에서 현실적으로 힘들다고 봐서 점수를 낮게 줬어요.
  • 반면, 학습자(청중)들은 '공개적으로 망신당할 수 있거나', '너무 경쟁적인' 분위기를 만드는 기법을 싫어했어요. 그냥 강의 듣으러 왔는데 갑자기 시키면 부담스럽잖아요? 😅

"참석자들은 대규모 그룹에서 참여하기 불편하다고 느끼거나 경쟁적인 환경을 조성하는 기법들을 낮게 평가했습니다." (...attendees rated poorly techniques with which they felt uncomfortable engaging in large groups or that created a competitive environment.)

4. 결론: 어떻게 적용하면 좋을까요? 💡

보수교육(CE)을 듣는 사람들은 완전히 새로운 걸 배우러 오는 초보자가 아니에요. 이미 알고 있는 지식을 업데이트하러 오는 전문가들이죠.

"우리의 결과는 학습자들이 종종 새로운 개념을 배우기보다는 기존 지식을 업데이트하는 대규모 그룹 주입식 CE에서 기법을 선택하기 위한 가이드를 제공합니다." (Our results provide a guide for selecting techniques for use in large-group didactic CE, where learners are often updating existing knowledge rather than learning new concepts.)

 

📌 요약하자면: 대규모 강의나 온라인 세미나를 기획 중이라면, 거창한 활동보다는 간단한 투표(Audience Response), 짧은 케이스 토의, 익명 질의응답 같은 가벼운 '능동적 학습 기법'부터 섞어보세요. 학습자들의 부담은 줄이면서도 훨씬 생동감 넘치는 시간이 될 거예요!

 


능동적 학습 기법(Active learning techniques)은 학습자(learners)를 고차원적 사고 과제(higher order thinking tasks)에 참여시킴(engaging)으로써 주입식 교육(didactic education)을 강화(enhance)할 수 있다. 그러나 대규모 그룹(large-group) 보수교육(continuing education, CE) 환경(settings)에서는 이러한 기법이 드물게 사용된다(infrequently used). 능동적 학습(active learning)을 통합(incorporating)하는 것은 초심자 학습자(novice learners)에게 매우 중요(crucial)하지만, 전문가 학습자(expert learners)를 위해 적절한 기법(appropriate techniques)을 선택(selecting)하는 것에 대해서는 잘 알려지지 않았다. 이러한 격차를 해소하는 것(Addressing this gap)은 교육자들(educators)이 대규모 그룹 CE를 위한 더 효과적인 주입식 교육(more effective didactic education)을 개발하는 데 도움을 줄 수 있다.

 

구성주의 이론(constructivist theory)에 따르면, 주입식 교육(didactics)은 사전 지식(prior knowledge)을 바탕으로 구축(building on)하고, 학습자의 문제 해결(learner problem solving)을 포함하며(involving), 사회적 교류(social exchanges)를 장려함(encouraging)으로써 강화될 수 있다. 이러한 기법들은 학습을 교사 중심(teacher centered)에서 학습자 중심(learner centered)으로 전환(shift)시키며, 지식 유지(knowledge retention)와 고차원적 사고(higher order thinking)를 돕는다(aiding). 능동적 학습 기법은 새로운 자료를 조직화(organizing new material)하고 저장된 정보를 인출(retrieving stored information)하는 데 도움이 필요한 초심자 학습자들에게 유익하다(beneficial). 경험과 전문성(experience and expertise)을 갖춘 CE 학습자들은 새로운 지식을 더 효율적으로 통합(incorporate new knowledge more efficiently)하고 더 적은 인지적 요구(less cognitive demand)로 사전 정보를 인출할 수 있다. 따라서, 경험이 풍부한 학습자(experienced learners)에게 어떤 능동적 학습 기법이 가장 유용한지(most useful)는 알려지지 않았다(unknown).

 

그랜드 라운드(Grand Rounds)와 같은 대규모 그룹 CE 세션은 일반적으로 능동적 학습 기법을 거의 통합하지 않는(rarely incorporate) 1시간짜리 주입식 강의(hour-long didactics)이다. 주입식 강의로부터 전환해야 한다는 요구(calls for a shift away)에도 불구하고, 이 형식은 널리 사용되고 있는데(remains widely used),

  • 이는 세션 준비가 더 쉽고(easier to prepare),
  • 짧은 시간 안에 많은 양의 정보를 다룰 수 있으며(cover large amounts of information),
  • 학습자들이 선호하기(preferred by learners) 때문이다.

그럼에도 불구하고(Nevertheless), 주입식 CE는 능동적 학습 기법을 통합함으로써 강화될 수 있다. 이 연구의 목적(aim of this study)은 대면(in-person) 및 가상 강의(virtual lectures) 중 다양한 능동적 학습 기법의 적절성(appropriateness), 실행 가능성(feasibility), 그리고 참여 가능성(likelihood to engage)에 대해 델파이 기법(Delphi process)을 사용하여 전문가(experts)와 학습자(learners) 간의 합의(consensus)를 도출(achieve)하는 것이었다. 이 정보는 기획자들(planners)이 필요시 대규모 그룹 CE 주입식 강의를 위한 능동적 학습 기법을 선택하는 데 도움을 줄 수 있다(aid).

방법 (METHODS)

우리는 다음의 키워드(keywords)를 사용하여 ERIC 및 PubMed 데이터베이스에서 능동적 학습 기법에 대한 문헌을 검색(searched the literature)했다:

  • "active learning(능동적 학습)", "continuing education(보수교육)", "medical education(의학교육)", "interprofessional education(전문직 간 교육)", "interprofessional(전문직 간)", "continuing education(지속적 교육)", "adult education(성인 교육)", "adult learning(성인 학습)", "instructional design(교수 설계)", "curriculum design(교육과정 설계)", 및 "design(설계)".

패널 모집 (Panelist Recruitment)

  • 전문가 패널(Expert panelists)은 CE 활동을 계획(planned), 실행(executed), 또는 연구(studied)한 경험이 있으며, 출판물(publications)이나 발표(presentations)로 입증된 능동적 학습에 대한 전문성(expertise)을 갖추고 있었다. 학술 의학 보수교육 학회(Society of Academic Continuing Medical Education), 학술 소아과 학회(Academic Pediatric Association), 보건 전문직 보수교육 연합(Alliance for Continuing Education in Health Professions) 등의 기관에서 후보자(nominees)를 제공받았다. 또한 주요 출판물의 저자들(authors of key publications)을 초청하고, 의사와 비의사가 고르게 섞인(even mix) 최소 10명의 패널을 등록할 때까지 눈덩이 표집법(snowball sampling)을 사용했다.
  • 참석자 패널(attendee panel)은 지난 6개월 동안 우리 대학 병원에서 열린 소아과 그랜드 라운드(Pediatric Grand Rounds) 세션에 최소 5회 참석(대면 또는 가상)하고 학점(credit)을 청구한 임상의(clinicians) 또는 연구자(researchers)로 구성되었다. 전문가 패널과 마찬가지로, 우리는 의사와 비의사의 혼합을 목표로 하여 최소 10명의 패널을 모집했다.

델파이 과정 (Delphi Process)

문헌 고찰(literature review)에서 식별된 능동적 학습 기법들은 두 패널 모두에 의해 5점 리커트 척도(5-point Likert scale)(1 = 낮음 ~ 5 = 높음)를 사용하여 평가(rated)되었다. 보충 디지털 콘텐츠 1(Supplemental Digital Content 1, 부록 1 참조)에는 패널들에게 발송된 설문지(questionnaire)가 포함되어 있으며, 여기에는 문헌 요약(literature summary), 인구통계학적 질문(demographic questions), 그리고 평가할 각 기법의 정의(definitions)가 포함되어 있다. 각 기법은 다섯 가지 평가를 받았다:

  • 전문가들은 CE 대규모 그룹 주입식 강의에 대한 각 기법의 적절성(appropriateness)과 대면 또는 가상 발표에 대한 실행 가능성(feasibility)을 평가하여 세 가지 점수를 부여했다.
  • 참석자 패널로부터는 대면 또는 가상 환경에서 참여할 가능성(likelihood to engage)을 평가한 두 가지 점수가 나왔다.

참가자들은 기법을 평가할 수 없는 경우 "익숙하지 않음(not familiar)"을 선택할 수 있었으며, 피드백을 제공하거나 포함할 추가 기법을 제안(suggest additional techniques)할 수 있었다. 패널들은 1차 라운드(first round)에서 모든 기법을 평가했으며, 합의에 도달하지 못한(did not reach consensus) 기법들은 2차 라운드(second round) 평가를 위해 다시 발송되었다. 다른 델파이 연구들과 일관되게(Consistent with other Delphi studies), 우리는 합의를 패널의 75%가 4점 또는 5점(긍정적 합의, positive consensus) 혹은 1점 또는 2점(부정적 합의, negative consensus)으로 평가한 경우로 정의했다.

 

합의를 유도하기 위해(To drive consensus), 패널들은 2차 라운드 평가 전에 자신의 1차 라운드 점수다른 참가자들의 평가 분포(distributions of ratings)를 받았다. 두 패널 모두에서 긍정적 합의를 충족한 기법들이 최종적으로 높게 평가된 기법 목록(final list of highly rated techniques)을 구성했다. 데이터는 신시내티 대학(University of Cincinnati)에서 호스팅하는 안전한 웹 기반 전자 데이터 수집 플랫폼인 Research Electronic Data Capture를 사용하여 수집 및 관리되었다. 이 연구는 현지 임상시험심사위원회(institutional review board)에 의해 관련 규정 및 기관 정책에 따라 심의 면제(exempt from review)로 결정되었다. 설문지 작성(Completion of the questionnaire)은 연구 참여에 대한 동의(consent to participate)를 나타냈다.

결과 (RESULTS)

우리의 문헌 고찰은 대면 환경을 위해 기술되었지만(described for in-person settings) 가상 동기식 학습(virtual synchronous learning)에 맞게 조정 가능한(adaptable) 29가지의 능동적 학습 기법을 식별했다.

  • 전문가들은 박사(PhDs) 4명, 의사(MDs) 4명, 간호사(RN) 1명, CME 전문가 1명을 포함했다. 보충 디지털 콘텐츠 1(부록 2 참조)은 그들의 전문 분야(areas of expertise)에 대한 더 많은 정보를 제공한다. 모두 CE 활동 개발 경험이 풍부했으며(experienced in developing), 90%가 의학교육 관련 학술 활동(medical education scholarship)을 출판하거나 발표한 경험이 있었다. 모든 전문가(n = 10)가 1차 평가를 완료했고, 80%(n = 8)가 2차 평가를 완료했다.
  • 우리는 12명의 참석자 패널을 모집했는데, 의사 7명, 그리고 전문 간호사(nurse practitioner), 간호사, 공중보건 전문가, 사회복지사, 임상 연구 전문가가 각각 1명씩이었다. 12명 모두 1차 평가를 완료했고, 11명(92%)이 2차 평가를 완료했다.

두 라운드 후, 전문가들은 23개(79%) 기법의 적절성(appropriateness)에 대해 긍정적 합의에 도달했다. 그들은 대면 사용(in-person use)을 위한 27개(93%) 기법과 가상 사용(virtual use)을 위한 23개(79%) 기법의 실행 가능성(feasibility)에 대해 긍정적 합의에 도달했다. 시험 문항 작성(Writing Test Items)과 가르침을 통한 학습(Learning from Teaching)은 적절성에 대해 부정적 합의(negative consensus)에 도달했다. 한 패널은 추가 기법으로 변화 다짐(Commitment to Change)을 포함할 것을 제안했으며, 이는 2차 라운드에서 전문가 패널에 의해서만 평가되었다. 두 라운드의 평가 후, 참석자들은 대면에서 18개(62%) 기법, 가상에서 16개(55%) 기법에 대해 참여할 가능성(likelihood to engage)에 긍정적 합의를 보였다. 참석자 패널에서 부정적 합의에 도달한 기법은 없었다.

 

표 1(Table 1)은 두 패널에 걸친 30가지 기법 모두에 대한 합의 등급(consensus ratings)을 요약한다.

  • 13개(43%)의 능동적 학습 기법이 적절성, 실행 가능성, 그리고 가상 및 대면 모두에서의 참여 가능성 등 모든 척도(all measures)에서 긍정적 합의에 도달했다.
  • 3개(10%) 기법은 대면 사용에 대해, 2개(7%) 기법은 가상 사용에 대해 두 패널 모두에서 긍정적 합의에 도달했다.
  • 10개(33%) 기법은 패널 간 합의에 도달하지 못했다(did not reach consensus).

합의에 도달하지 못한 기법에 대한 패널들의 의견(Comments)은 대규모 그룹이나 가상 환경에서 어떻게 작동할지에 대한 불확실성(uncertainty), 학부 또는 대학원 교육에 더 적합한지에 대한 불확실성, 대규모 그룹 환경에서 참여하는 것에 대한 불편함(discomfort), 그리고 경쟁적인 환경(competitive environment)에 있고 싶지 않음 등을 기술했다.

표 1. - 능동적 학습 기법 설명 및 패널 평가 (Table 1. - Active Learning Techniques Descriptions and Panelist Ratings)

능동적 학습 기법 (Active Learning Technique) 설명 (Description) 전문가 패널 평가 (Expert Panel Rating) 참석자 패널 평가 (Attendee Panel Rating)
모든 척도에서 합의된 기법 (Techniques with consensus on all measures)
청중 반응 (Audience response) - 발표자와 학습자 간의 상호작용을 촉진(facilitate interactivity)하는 데 사용됨
- 학습자들은 도발적인 질문(provocative questions)에 대한 답변을 선택함
- 응답은 구두로 또는 서면으로 공유될 수 있음
A FP FV P V
버즈 그룹 (Buzz group) - 대규모 그룹이 특정 질문에 응답하거나 매우 정밀한 정보(very precise information)를 찾기 위해 약 3명의 참가자로 나뉨

- 방 안의 대화 소리로 인해 "윙윙거리는 소리(Buzz)"가 만들어짐
A FP FV P V
증례 토의/연구 (Case discussion/Study) - 학습자들은 다양한 단계에서 증례(case)에 어떻게 접근할지 공유함

- 증례 결과(Case outcome)가 공유됨
A FP FV P V
도입 질문 (Introductory question) - 발표 전에 참가자들에게 증례나 그들이 가진 세 가지 질문을 적어보도록 요청함 A FP FV P V
지식 확인 (Knowledge check) - 학습을 돕기 위해 질문이 제기됨(posed). 피드백이 제공되지만, 점수가 매겨지지 않는다는(not scored) 점에서 퀴즈와 다름 A FP FV P V
오개념/선입견 확인 (Misconception/preconception check) - 학습자의 사전 지식을 평가하고 추가 학습을 방해하거나 차단(hinder or block)할 수 있는 사전 지식이나 신념을 드러내는(uncovering) 데 초점을 맞춤

- 교육 전 설문지(pre-education questionnaire)를 사용하여 주제에 대한 사전 아이디어와 신념에 대한 정보를 이끌어낼(elicit) 수 있음

- 내용을 발표하기 전에 아는 것을 모두 적어볼 기회를 제공할 수도 있음
A FP FV P V
가장 혼란스러운 점 (Muddiest point) - 학습자들은 수업, 강의 또는 읽기 후에 가장 어렵거나 혼란스러운 부분(most difficult or confusing part)을 적어보도록 요청받음 A FP FV P V
문제 중심 학습 (Problem-based learning, PBL) - 개방형 문제(open-ended problem)를 해결하는 과정을 통해 학습이 이루어짐

- 학습자가 향후 실무(future practice)에서 사용될 기술을 개발하도록 허용함

- 비판적 평가(critical appraisal), 문헌 검색(literature retrieval)을 강화하고 지속적인 팀 학습(ongoing team learning)을 장려함
A FP FV P V
찬반 격자 (Pro-con grid) - 학습자들은 이슈, 절차, 행동 또는 결정의 장점과 단점(advantages and disadvantages)을 고려함

- 상호작용을 요구하고 아이디어 공유를 장려함으로써 깊은 사고(deep thought)를 촉진함
A FP FV P V
질의응답 (Question & answer) - 학습자들은 발표 도중이나 후에 발표자나 동료에게 질문하고 답변을 받음 A FP FV P V
성찰 (Reflection) - 발표자가 생각을 자극하는 질문(thought-provoking questions)을 함

- 학습자가 생성한 게시물(learner-generated postings)을 장려함

- 학습자에게 배운 내용을 요약(summarize learning)하도록 요청함
A FP FV P V
소그룹 토의 (Small group discussions) - 발표자가 그룹 토의를 위한 주제나 아이디어를 제공하고 학습자들이 아이디어를 기여함(contribute ideas) A FP FV P V
소규모 지면 증례 (Small paper case) - 진단이나 관리를 위한 프롬프트(prompts for diagnosis or management)가 있거나 학습자가 완성하도록 빈칸(blank spaces)을 남겨둔 증례 A FP FV P V
대면 사용에 대해 합의된 기법 (Techniques with consensus for in-person use)
정의적 특징 행렬 (Defining features matrix) - 학습자들은 관련되거나 유사한 항목 또는 개념을 구별하고 분류함(distinguish and categorize) A FP P
시뮬레이션 (Simulation) - 시나리오의 일부로 역할 연기자(role-players)가 학습자와 함께 즉흥 연기(improvise)를 하는 경험적 학습 방법(Experiential learning method) A FP FV P
탁상 훈련 (Table-top-exercise) - 학습자들은 전개되는 증례(evolving case)의 다양한 설정 지점에서 다음 단계(next steps)를 적음

- 각 설정 지점 후에 각 단계의 모범 사례(Best practices)가 논의되거나 공유됨
A FP FV P
가상 사용에 대해 합의된 기법 (Techniques with consensus for virtual use)
게임 기반 학습 (Game-based learning, GBL) - 기억(retention)과 적용(application)을 돕기 위해 주제 내용(Subject matter)과 게임플레이가 통합됨 A FP FV V
서면 응답 (Written responses) - 학습자들은 배운 내용과 유지하거나 변경할 계획인 관행(practices they plan to maintain or change)을 적음

- 진행자(Facilitator)가 토론과 다음 단계를 요약함
A FV FP V
패널 간 합의가 없는 기법 (Techniques without consensus between panels)
변화 다짐 (Commitment to change)* - 참가자들은 학습 활동으로 인한 행동 변화(behavioral change)를 성찰하고 다짐할 시간을 가짐 A FV FP
개념도 작성 (Concept mapping) - 학습자들은 개념 간의 관계(relationships between concepts)를 묘사하는 다이어그램을 만듦

- 지식을 조직화하고 구조화하는 그래픽 도구
A FV FP
퀴즈 (Quiz) - 학습자들은 기준(criteria)에 대비해 성과를 평가함

- 각 질문에 대한 최선의 답(Best answer)이 논의되거나 공유됨
A FV FP
역할극 (Role play) - 학습자들은 안전하고 지지적인 환경(safe and supportive environment)에서 1인칭 경험(first-person experience)을 쌓음 A FP
피라미드식 토의 (Pyramiding)† - 학습자 쌍(pairs)에서 시작하여 4-6명 그룹으로, 최종적으로는 전체 청중(entire audience)이 증례 토의나 유사한 연습에 참여하도록 구축해 나감 FP V
생각-짝-나누기 (Think-pair-share) - 학습자에게 성찰하고(reflect on), 짝과 토론한(discuss with a partner) 다음, 대규모 그룹과 공유(share with the large group)하도록 하는 프롬프트

- 개념을 읽거나 가르치기 전에 사용 가능; 소규모 그룹에서 더 잘 작동함
A FP
토론 (Debate) - 학습자들이 상반된 주장(opposing arguments)을 제안하는 토의 NC P V
피드백 (Feedback) - 학습자들은 개선(improvement)의 기초로서 성과에 대한 정보를 받음 FP
직소 모형 (Jigsaw) - 학습자들이 성공하기 위해 서로 의존하게(dependent on each other) 만드는 교육 조직 방법

- 내용을 그룹으로 나누고 과제를 조각(pieces)으로 나누어 그룹이 (직소) 퍼즐을 완성하도록 조립함

- 그 후 학습자들은 각 주제에 한 명의 구성원이 배정된 그룹으로 나뉨
NC P
3단계 인터뷰 (Three-step interview) - 학습자들은 3인 1조로 나뉘어 인터뷰어(interviewer), 인터뷰 대상자(interviewee), 또는 보고자/기록자(reporter/note taker)의 역할을 맡음

- 학습자들은 역할을 교대(rotate roles)할 수 있음
FP
부정적 합의가 있는 기법 (Techniques with negative consensus)
가르침을 통한 학습 (Learning from teaching) - 학습자들은 동료에게 자료를 가르치기 위해 채워야 할 지식 격차(knowledge gaps)를 식별함

- 격차와 식별된 학습에 대한 검토를 바탕으로 멘토가 구조화된 피드백(Structured feedback)을 제공함
NA
시험 문항 작성 (Writing test items) - 학습자들은 동료들에 의해 평가되는 시험 문항을 작성함

- 작성 과정 전반에 걸쳐 피드백이 제공됨
NA

*이 기법은 평가가 시작된 후에 추가되었으므로 참석자 패널에 의해 평가되지 않음.

†이 기법은 다른 패널들이 "익숙하지 않음"을 선택하거나 응답하지 않았기 때문에 6명 이하의 패널만이 평가를 제공함.

합의에 대한 지정: ---, 합의 없음; A, 적절함(appropriate); NA, 적절하지 않음(not appropriate); FP, 대면 실행 가능(feasible in-person); FV, 가상 실행 가능(feasible virtually); P, 대면 참여 가능성 있음(likely to engage in-person); V, 가상 참여 가능성 있음(likely to engage virtually).

고찰 (DISCUSSION)

우리 연구는 적절성, 실행 가능성, 그리고 CE 학습자의 참여 가능성에 대해 다양한 수준의 동의(varying levels of agreement)를 보인 능동적 학습 기법의 합의 목록(consensus list)을 제공한다. 전문가 패널에서 부정적 합의에 도달한 기법은 거의 없었으며, 참석자 패널에서는 전혀 없었다. 대면 학습을 위해 기술된 기법들은 대체로 가상 환경(virtual settings)에서도 적절하고, 실행 가능하며, 참여 가능성이 높은 것으로 간주되었다(deemed).

 

주입식 교육에서의 능동적 학습 기법에 대한 이전 연구들(Prior studies)은 초심자(novice) 또는 학부 학습자(undergraduate learners)에 초점을 맞추었으며 동기식 가상 환경(synchronous virtual settings)에서의 사용은 평가하지 않았다. 이 맥락에서 능동적 학습 기법의 초점은 학습자가 추론 기술(reasoning skills)을 구축하고 새로운 지식을 유지(retaining new knowledge)하도록 돕는 것이다. 우리의 결과는 학습자들이 종종 새로운 개념을 배우기보다는 기존 지식을 업데이트(updating existing knowledge)하는 대규모 그룹 주입식 CE에서 기법을 선택하기 위한 가이드(guide)를 제공한다. 많은 기법이 대면 및 동기식 가상 학습 환경 모두에서 사용하기에 높은 평가를 받았지만(highly rated), 우리는 또한 일부 기법들이 패널들에 의해 어느 한쪽 환경에서의 사용이 선호됨(favored)을 발견했다.

 

CE에서의 능동적 학습 연구들은 소그룹 및 대규모 그룹 토의, 증례 연구 및 토의(case study and discussion), 시뮬레이션, 청중 반응 등 제한된 수의(limited number of) 능동적 학습 기법을 사용해 왔다. 보수 의학 교육(continuing medical education, CME) 부서 리더들에 대한 연구는 프로그램에 능동적 학습 기법을 구현하는 데 있어 주요 장벽(major barriers)을 식별했는데, 여기에는 교수 발표자들의 익숙하지 않음(lack of familiarity)과 능동적 학습 기법을 통합하는 데 필요한 준비 시간의 증가에 대한 인식(perceived increase in preparation time)이 포함되었다. 우리의 결과는 미래 연구의 기초(basis for future study)가 되고 교수 개발(faculty development)을 안내할 수 있는 확장된 기법 목록(expanded list of techniques)을 제공한다.

 

두 패널 모두에서 부정적 합의에 도달한 기법은 없었다.

  • 그러나 개별 멘토링(individual mentorship), 피드백, 또는 교육과정에 대한 집중적인 구조(intensive structure)를 요구하는 기법들은 전문가들에 의해 대체로 낮게 평가된(rated poorly) 반면,
  • 참석자들은 대규모 그룹에서 참여하기 불편하다고 느끼거나(felt uncomfortable engaging) 경쟁적인 환경을 조성하는(created a competitive environment) 기법들을 낮게 평가했다.
  • 참석자들은 또한 어떻게 구현될지에 대한 불확실성이 있거나(uncertainty about how they would be implemented), 주입식 CE 세션 참석 시 수동적인 경험(passive experience)에 대한 기대와 어울리지 않는(incongruous) 것으로 보이는 기법들을 낮게 평가했다.

한계점 (Limitations)

이 연구는 몇 가지 한계점이 있다.

  • 첫째, 일부 참가자들은 특정 기법에 대한 익숙함이 부족했다(lacked familiarity). 이를 완화하기 위해(To mitigate this), 우리는 각 능동적 학습 기법을 설명하고 패널들이 평가를 제공하는 대신 "익숙하지 않음"을 표시할 수 있도록 허용했다.
  • 둘째, 다양한 관점과 경험(diverse perspectives and experiences)을 가진 참가자들을 모집했지만, 그들이 모든 CE 교육자와 학습자를 대표하지(representative) 않을 수 있다.
  • 셋째, 널리 퍼진(prevalent) 능동적 학습 기법을 식별하기 위해 광범위한 문헌 고찰을 수행했지만, 그 결과 목록이 빠짐없지(exhaustive) 않을 수 있다.
  • 넷째, 우리 데이터는 가상 대 대면 기법에 대한 낮은 평가를 설명하는 환경 특이적 요인(setting specific factors)을 구별할 수 없었다.
  • 마지막으로, 패널들이 도달한 합의는 실제 기법의 성과(actual technique performance)나 효과성을 반영하지 않을 수 있는데, 이는 우리가 현장에서(in situ) 그것들을 관찰하거나 평가하지 않았기 때문이다.

결론 (CONCLUSION)

우리의 확장된 능동적 학습 전략 목록(expanded list of active learning strategies)은 대규모 그룹 주입식 CE에 능동적 학습을 통합하고자 하는(seeking to incorporate) 교육자들에게 지침(guidance)을 제공한다. 미래 연구는 학습자 경험(learner experience)과 학습 성과(learning outcomes) 측정을 통해 대규모 그룹 CE에서 능동적 학습 기법들이 어떻게 수행되는지(how active learning techniques perform) 조사해야 한다.

 

 

 

Acad Med. 2025 Nov 1;100(11):1284-1290. doi: 10.1097/ACM.0000000000006172. Epub 2025 Jul 17.

What Really Matters: A Qualitative Study of Student Perspectives on Exceptional Teaching

 

 

제목: 🎓 의대생들이 꼽은 '진짜 스승'의 5가지 비밀 (논문 리뷰)

안녕하세요! 오늘은 의학 교육 분야에서 매우 흥미로운 논문 하나를 소개해 드리려고 해요.

좋은 의사를 길러내는 데 있어 '좋은 교육'이 중요하다는 건 누구나 알지만, 도대체 무엇이 교사를 '탁월하게(Exceptional)' 만드는 걸까요?

미국 Penn State 의과대학에서 무려 5년 동안, 3,000건이 넘는 학생들의 이야기를 모아 그 답을 찾았습니다. 의대생들이 직접 말하는 "나를 성장시킨 선생님들의 비결", 지금부터 함께 살펴볼까요? 🏥


🔍 연구 배경: 학생들은 '관계'를 원한다

이 연구는 학생들이 제출한 3,409개의 서사(Narratives)를 분석했어요. 연구진은 학생들이 의학 지식 전달(Cognitive)보다는, 교사의 태도나 관계 기술 같은 비인지적 속성(Noncognitive attributes)에 더 큰 가치를 둔다는 점을 확인했습니다.

연구진은 이렇게 말합니다.

"탁월한 교육은 비록 다요인적이지만 평범한 교육을 초월하며, 학생들에게 영감을 주고, 지지하며, 능동적으로 참여시키고, 소통하는 것으로 특징지어집니다."
"Excellent teaching, although multifactorial, transcends ordinary teaching and is characterized by inspiring, supporting, actively involving, and communicating with students."

 

그렇다면 구체적으로 어떻게 해야 할까요? 연구진이 제안하는 5가지 핵심 제언(Recommendations)을 정리해 드립니다.


💡 1. 심리적 안전감을 지켜주며 '도전'하게 하라
(Challenge students while maintaining psychological safety)

많은 교수님들이 "학생들을 너무 밀어붙이면(Pushing) 힘들어하거나 결과가 안 좋지 않을까?" 하고 걱정합니다. 하지만 놀랍게도 학생들은 자신이 안전하다고 느낀다면, 도전적인 과제를 받는 것을 오히려 선호했습니다.

연구진은 이렇게 분석했습니다.

"학생들은 학습 환경에서 안전하다고 느낄 때 위험을 감수하려는 경향이 더 컸습니다. ... 탁월한 교사들은 먼저 수련생의 기초 능력을 평가한 다음, 점진적인 복잡성을 서서히 적용합니다."
"Students were more inclined to take risks when they felt secure in their learning environment. ... Exceptional teachers first assess the trainee’s baseline ability, then gradually apply progressive complexity."

 

즉, 심리적 안전감(Psychological safety)이라는 토대 위에서 학생의 능력치를 조금씩 끌어올려 주는 것이 핵심입니다.


🗣️ 2. 피드백은 '자주', 그리고 '구체적'으로
(Provide feedback that is frequent and specific)

"수고했다"는 한마디로 끝나는 실습은 이제 그만! 학생들은 빈번하고(Frequent), 구체적인(Specific), 그리고 무엇보다 실행 가능한(Actionable) 피드백을 원합니다.

흥미로운 점은 학생들이 쓴소리, 즉 부정적 피드백도 성장을 위해 꼭 필요하다고 느낀다는 점이에요.

"본 연구의 수련생들은 탁월한 교사들이 비판적이거나 부정적인 피드백을 기꺼이 주려는 의지를 바람직하고 심지어 존경할 만한 것으로 확인했습니다."
"Trainees in this study identified the willingness of exceptional teachers to give critical or negative feedback as desired and even admirable."


🚀 3. 성장을 위한 '자율성'을 부여하라
(Give autonomy for growth)

학생들을 병풍처럼 세워두지 마세요. 환자를 직접 보고, 타과에 자문(Consult)을 구하고, 처방을 넣는 등 지도하의 자율성(Guided autonomy)을 줄 때 학생들은 눈부시게 성장합니다.

연구진의 의견은 다음과 같습니다.

"심지어 일상적인 책임조차도 수련생을 수동적 관찰자에서 능동적 참여자로 재구성했으며, 팀 내에서의 그들의 역할에 목적을 부여했습니다."
"Even routine responsibilities recasted trainees from passive observers into active participants and provided purpose to their roles on the team."


🤝 4. 그들을 팀의 '일원'으로 만들어라
(Make them part of the team)

실습 나온 학생들은 늘 불안합니다. "내가 방해가 되는 건 아닐까?" 하는 '투명 인간(Being a shadow)'의 두려움을 없애주는 것이 중요합니다. 단순히 말로만 팀원이라고 하는 게 아니라, 실제 환자 진료에 기여하게 함으로써 소속감을 느끼게 해주세요.

"환자 진료에 대한 실질적인 기여는 팀 내 수련생의 위치에 타당성을 제공하기 때문에 무엇보다 중요했습니다."
"A real contribution to patient care was paramount because it provided validity to the trainee’s position on the team."


❤️ 5. 수련생-교사 관계를 함양하라
(Cultivate the trainee-to-teacher relationship)

마지막으로 가장 중요한 것은 인본주의(Humanism)입니다. 학생의 이름을 기억해 주고, 가끔은 교수님 자신의 실패담이나 취약성(Vulnerability)을 보여주는 것. 이런 인간적인 모습이 학생들에게는 평생 잊지 못할 롤모델이 됩니다.

"우리는 본 연구의 학생들이 탁월한 교사의 열정과 시간 투자를 의도적인 선택으로 간주했으며, 이는 그들의 교육과 그들 개인에 대한 깊은 헌신을 의미한다고 보았습니다." "We found that students in our study viewed an exceptional teacher’s passion and time investment as a deliberate choice, signifying a deep commitment to their education and to them personally."


📝 마치며: 결국 '마음'이 닿아야 합니다

이 논문은 단순히 '잘 가르치는 기술'을 넘어, 교육자와 학습자 사이의 신뢰(Trust)와 연결(Connection)이 얼마나 중요한지를 보여줍니다. 연구진의 결론으로 글을 마칩니다.

"이 연구는 '팀에 있는 것'과 '팀의 일부가 되는 것' 사이의 미묘한 차이를 설명합니다. 마찬가지로, 이름뿐인 자율성과 수련생이 의미 있게 기여할 수 있도록 장비해 주는 자율성 사이의 차이를 강조합니다."
"This study describes the nuance between being 'on the team' and being 'part of the team.' Similarly, it highlights the difference between autonomy in name only and autonomy that equips trainees to contribute meaningfully."

 

오늘 만나는 학생의 이름을 한 번 더 불러주고, 작은 역할이라도 믿고 맡겨보는 건 어떨까요? 그것이 바로 '탁월한 교육'의 시작일지도 모릅니다. 🌱

 


 

의학 학습 환경(medical learning environment)은 수련생(trainees)을 지도(supervise)하고 멘토링(mentor)하는 전공의(residents)와 지도 전문의(attending physicians)에 의해 크게 영향을 받습니다. 탁월한 교육(exceptional teaching)에 기여하는(contribute to) 구체적인 속성(specific attributes)을 이해하는 것은 복잡한 과제(complex challenge)입니다. 본 연구는 탁월한 교사를 정의하는(define) 특성(characteristics)을 식별하고 의학 교육에서의 가르침에 대한 제언(recommendations)을 제공하는 것을 목표로 했습니다.

 

탁월한 교육자(exceptional educator)를 구성하는(constitute) 자질(qualities)에 대한 의대생들의 수많은 통찰(insights)에도 불구하고, 이러한 특성을 정확하게 정의하는 것(precisely defining these traits)은 여전히 어려운 일(challenging)입니다. Sutkin 등은 68개 논문에 대한 포괄적 고찰(comprehensive review)에서 훌륭한 임상 교사(good clinical teachers)의 480가지 특성을 확인했으며, 이를 의사(physician), 교사(teacher), 인간적 특성(human characteristics)의 3가지 범주(categories)에 걸친 49개 주제(themes)로 구성했습니다. 그들은 더 나아가 교육적 특성

  • 비인지적(noncognitive) (예: 관계 기술[relationship skills], 정서 상태[emotional states], 성격 유형[personality types]) 또는
  • 인지적(cognitive) (예: 지각[perception], 기억[memory], 추론[reasoning], 술기 능력[procedural skills])으로 분류(classify)했습니다.

주목할 점은, 이러한 주제의 3분의 2가 비인지적이었다는 것인데, 이는 학생들이 학술적 교사(academic teachers)의 전통적인 도식(traditional schemas) (즉, 강단 위의 현자[the sage on the stage])보다 학습의 관계적 측면(relational aspects)에 가치를 둔다(place value on)는 것을 의미합니다. 전반적으로 그들은 "탁월한 교육(excellent teaching)은 비록 다요인적(multifactorial)이지만 평범한 교육(ordinary teaching)을 초월(transcends)하며, 학생들에게 영감을 주고(inspiring), 지지하며(supporting), 능동적으로 참여시키고(actively involving), 소통하는(communicating) 것으로 특징지어진다"고 결론지었습니다(determined).

 

전공의(resident physicians)를 대상으로 122명의 학생과 60명의 전공의를 조사한 한 연구에서는 교사 효율성(teacher effectiveness)의 4가지 특성을 발견했습니다:

  • 학습자를 학습 과정에 참여시키기(involve the learner),
  • 수행에 대한 기대치 소통하기(communicate expectations),
  • 학습자의 흥미 유발하기(stimulate the interest),
  • 환자와의 능숙한 상호작용(skillful interaction).

게다가 학습자의 자율성 존중(respecting learner autonomy)자기주도 학습 함양(fostering self-directed learning)은 효과적인 외래 교육(ambulatory teaching)에 결정적(crucial)이었습니다.

 

2016년, Montacute 등은 의대생 115명의 서면 성찰(written reflections)을 통해 그들이 전공의 교사(resident teachers)에게서 가치 있게 여긴 점에 대한 최신 지견을 제공하고자 했습니다. 그들은

  • 안전한 학습 환경 조성(creating a safe learning environment),
  • 팀의 일원이 되는 것(being a team member),
  • 코칭과 피드백 받기(receiving coaching and feedback),
  • 준비성(preparation), 그리고
  • 자극적인 학습 환경 조성(creating a stimulating learning environment)을 기술했습니다.

이러한 각 연구는 학습 환경(learning environment)을 긍정적으로 향상시킨(enhanced) 특성을 묘사하고 학생들이 비인지적 주제(noncognitive themes)에 두는 가치를 강조합니다. 그러나, 이러한 연구들은 탁월한 교사들이 실제로 이러한 행동을 어떻게 실행(enact)하는지에 대한 실질적인 예시(practical examples)가 부족합니다 (즉, 어떻게 그들이 학생들이 자기주도적[self-directed]이 되도록 돕는지, 학생들에게 영감을 주는지[inspire], 그리고 교육적 관계를 구축하는지[cultivate educational relationships]).

 

2016년, Penn State 의과대학(PSCOM)은 학습자 부당 대우(learner mistreatment)를 해결하기(tackle) 위해 '존중하는 학습 환경 사무국(ORLE: Office for a Respectful Learning Environment)'을 설립했습니다. 초기에는 불만 사항 해결(addressing complaints)에 초점을 맞추었으나, PSCOM에서 일어나는 뛰어난 교육(outstanding teaching)에 대한 인식 부족(underrecognition)을 둘러싼 피드백 이후 ORLE는 진화하여 '탁월한 교사 이니셔티브(Exceptional Teacher Initiative)'를 출범하게 되었습니다.

 

PSCOM 학습자들은 자신에게 긍정적인 영향을 미치거나(impacted) 감화(influenced)를 준 교사들에 대한 서사(narratives)를 제출하도록 요청받았습니다(invited). 이 프로그램은 비록 겸손한 의도(modest intentions)로 만들어졌지만 결과는 인상적(impressive)이었으며, 프로그램의 첫 5년 동안 3,409건의 서사를 접수했고 프로그램은 오늘날까지 계속되고 있습니다. 우리 팀은 다음 질문에 답하기 위해 이 데이터셋을 분석했습니다: "의대생의 눈에 누군가를 탁월한 교사(exceptional teacher)로 만드는 것은 무엇이며, 그들은 그것을 어떻게 수행하는가?" 하지 말아야 할 것에 대한 부정적 사례(negative examples)에 집중하는 대신, 우리가 수집한 정보는 수련생들이 무엇을 탁월하다고 느끼는지에 기반하여 교육 관행(teaching practices)을 강화(reinforce)하거나 수정(modify)하는 데 사용될 수 있습니다.

 

방법 (Method)

 

환경 및 설계 (Setting and design)

 

PSCOM에서 모든 학습자는 그들이 탁월하다고 생각한(found exceptional) 교사에 대한 피드백을 요청받았습니다. 피드백은 참여를 장려하기 위한 어떠한 동기 부여 기제(motivational mechanism) 없이 자발적인 서사(voluntary narratives) 형태로 수집되었습니다. 학습자들은 모든 과정(course) 및 임상 실습(clerkship) 평가가 끝날 때 또는 ORLE 웹사이트를 통해 직접 서사를 제출하도록 초대받았습니다. 단 하나의 개방형 질문(open-ended prompt)은 다음과 같았습니다. "그 교사들이 탁월한 교육적 경험(exceptional educational experience)을 낳기 위해 무엇을 했으며, 그것이 당신을 어떻게 변화시켰는지 말해주십시오." 그 후 서사는 해당 교육자에게 이메일로 발송되었으며, 참조(copies)로 그들의 교육 및 임상 리더십(educational and clinical leadership)에게도 보내졌습니다. 서사는 ORLE의 이사(G.F.B.)가 수령한 후 Smartsheet에 입력되었으며, 여기서 학생 정보는 익명으로 유지되었습니다(remained anonymous). 응답은 몇 단어에서 몇 문단까지 길이(length)가 다양했으며, 평균(mean) 단어 수는 78.4개(표준편차[SD] 58.0) (범위[range], 2–776)였습니다. 서사는 2017년 8월부터 2022년 1월 사이에 수집되었습니다. 코딩(Coding)과 분석(analysis)은 2022년 전체에 걸쳐 수행되었습니다.

 

윤리적 고려사항 및 검토 (Ethical considerations and review)

 

'탁월한 교사 이니셔티브'는 자발적인 서사 제출(voluntary narrative submission)로 설계되어 참여에 대한 공평한 기회(equitable opportunity)를 보장했습니다. 참여자에 대한 위험(Risks)은 최소화되었는데, 모든 서사가 분석 전에 이름과 날짜를 제거하여 비식별화(deidentified)되었기 때문입니다. 데이터는 안전하게 보관되었으며(stored securely) 연구 인력만 접근할 수 있었습니다. 본 연구는 PSCOM 인간 대상 보호 사무국(Human Subjects Protection Office)의 검토를 거쳤으며, 연방 규정(federal regulations)에 정의된 인간 대상 연구(human subjects research)에 해당하지 않는 것으로 결정되었습니다. 따라서 기관생명윤리위원회(institutional review board)의 추가 검토 및 승인은 필요하지 않았습니다.

 

질적 데이터 분석 (Qualitative data analysis)

 

문헌 고찰(Review of the literature)은 코드북(codebook) 개발에 대한 우리의 귀납적 접근(inductive approach)에 정보를 제공했습니다(informed). 전체 데이터셋(n = 3,409)에서 20개의 서사를 무작위로 선정(randomly selected)하여 코드북을 파일럿 테스트(pilot test)했습니다. 추가 수정 없이 만족스러운 성능(satisfactory performance)을 보인 후, 전체 데이터셋에서 4번째 서사마다 체계적으로 표집(systematically sampled)하여 852개의 서사를 추가로 얻었습니다. 초기 20개의 서사가 우리의 주 표본 세트(primary sample set)와 동일한 코드북으로 코딩되었음을 감안하여, 이 서사들도 표본에 추가되어 최종적으로 총 872개의 코딩된 서사(coded narratives)가 되었습니다.

 

데이터는 3명의 독립적인 질적 코더(independent qualitative coders)가 DeDoose 코딩 소프트웨어를 사용하여 코딩했습니다. 평가자 간 신뢰도(Interrater reliability)는 통합 코헨 카파(pooled Cohen κ)를 계산하여 측정했는데, 이는 코더 간의 쌍별 일치도(pairwise agreement)를 평가한 다음 그 비교들을 하나의 전체 값으로 평균 낸 것입니다. 본 연구의 통합 코헨 카파는 0.77로, 상당한 일치(substantial agreement)를 나타냈습니다. 비록 질적 연구의 전통적인 기준인 0.8보다는 낮았지만, 이 값은 대규모 데이터셋을 코딩하는 데 내재된 어려움(challenges inherent)을 반영하는 것이며 여전히 상당한 일치를 위한 허용 범위(acceptable range) 내에 있었습니다.

 

귀납적 접근(inductive approach)을 사용하여, 우리는 유사한 코드와 범주(categories)를 초기 주제(initial themes)와 하위 주제(subthemes)로 군집화(clustered)했습니다. 분석이 체계적으로(systematically) 수행되도록 보장하기 위해, 우리는 코드를 해당 하위 주제 아래에 조직화하고 전반적인 구조적 균형(structural balance) (즉, 코드가 3가지 핵심 주제에 고르게 분포되었는지)과 완전성(completeness) (모든 코드가 사용되었는지)을 확인했습니다. 우리는 주제 간에 명확하고 식별 가능한 구분(clear and identifiable distinctions)이 있는지 확인하기 위해 주제를 검토했으며, 연구자들이 코드와 데이터가 유의미하게 보고(reported meaningfully)되고 데이터의 본질(essence of the data)을 대변한다고 동의할 때까지 주제의 문구(wording)를 반복적으로(iteratively) 작업했습니다.

 

결과 (Results)

 

우리의 연구 결과는 3가지 핵심 주제(key themes)를 밝혀냈습니다:

  • (1) 도전적이고 실질적인 학습 기회(challenging and practical learning opportunities)는 학생들에게 성장의 원천(source of growth)으로 받아들여졌습니다(embraced);
  • (2) '팀의 일원(part of the team)'으로 포함되고 가치 있게 여겨지는 것은 학습자가 기여하고(contribute), 자율성을 발휘하며(exercise autonomy), 동료로서(as a colleague) 다른 사람들과 함께 일하도록 장려했습니다;
  • (3) 교육과 환자 진료에 대한 열정(enthusiasm)을 보여주는 것과 역할 모델링(role modeling)에 대한 인본주의적 접근(humanistic approach)이 결합된 모습은 학생들에게 영감을 주었습니다(inspirational).

각 주제는 이를 뒷받침하는 하위 주제(supporting subthemes)로 특징지어졌습니다(Table 1).

 

표 1 - 의학 교육에서의 탁월한 교사의 주제 및 뒷받침 행동, Penn State 의과대학, 2017년~2022년 (Table 1 - Themes and Supporting Behaviors of Exceptional Teachers in Medical Education, Penn State College of Medicine, 2017 to 2022)

주제 (Theme) 하위 주제 (Subthemes)
도전적이고 실질적인 학습 기회는 학생들에게 성장의 원천으로 받아들여졌다

(Challenging and practical learning opportunities were embraced by students as a source of growth)
• 지지를 받는다고 느끼는 동시에 점진적인 복잡성으로 도전받기
(Being challenged with progressive complexity while simultaneously feeling supported)


• 자연스러운 학습 기회를 최대한 활용하기
(Making the most of natural learning opportunities)


• 신중하고, 실행 가능하며, 빈번한 피드백으로부터 성장하기
(Growing from judicious, actionable, and frequent feedback)
팀의 일원으로 포함되고 가치 있게 여겨지는 것은 학습자가 기여하고, 자율성을 발휘하며, 동료로서 함께 일하도록 장려했다

(Being included and valued as part of the team encouraged learners to contribute, exercise autonomy, and work alongside others as a colleague)
팀의 일원으로 받아들여지고 통합되기
(Being accepted and integrated as part of the team)


환자 진료의 상호작용 및 책임에 있어 지도하에 자율성을 부여받기
(Receiving guided autonomy in interactions and responsibilities with patient care)


팀원이자 미래의 동료로서 존중받는다고 느끼기
(Feeling respected as a teammate and future colleague)
교육과 환자 진료에 대한 열정을 보여주는 것과 역할 모델링에 대한 인본주의적 접근의 결합은 학생들에게 영감을 주었다

(Demonstrating enthusiasm for teaching and patient care, combined with a humanistic approach to role modeling, was inspirational to students)
교육과 학생을 돌보는 것에 대한 열정을 목격하기
(Witnessing passion for teaching and caring for students)


진정성 있는 역할 모델링으로부터 영감을 얻기
(Drawing inspiration from authentic role-modeling)

 

 

1 도전적이고 실질적인 학습 기회는 학생들에게 성장의 원천으로 받아들여졌다

(Challenging and practical learning opportunities were embraced by students as a source of growth)

 

도전을 경험하는 것(Experiencing challenges)은 성장을 개선하고, 결과적으로 응용 학습(applied learning)을 돕습니다. 이 그룹의 학생들은 어려운 질문(difficult questioning)지식 및 기술의 한계를 탐구(exploring the limits)하는 것을 통해 배우는 기회를 높이 평가했습니다(appreciated). 3가지 하위 주제가 학생의 관점에서 도전과 새로운 학습 기회(novel learning opportunities)가 어떻게 받아들여졌는지를 규명했습니다:

  • 지지를 받는다고 느끼는 동시에 점진적인 복잡성으로 도전받기(being challenged with progressive complexity while simultaneously feeling supported),
  • 자연스러운 학습 기회를 최대한 활용하기(making the most of natural learning opportunities), 그리고
  • 신중하고 실행 가능하며 빈번한 피드백으로부터 성장하기(growing from judicious, actionable, and frequent feedback).

1-1 지지를 받는다고 느끼는 동시에 점진적인 복잡성으로 도전받기 (Being challenged with progressive complexity while simultaneously feeling supported).

 

학생들은 이전 경험과 현재 지식을 바탕으로 쌓아 올려주는(built on) 강사를 선호한다고 밝혔습니다(indicated a preference):

"[의사 선생님]은 우리를 가르칠 때 우리의 강점과 약점을 고려해주시는데(takes into consideration), 이는 더 맞춤화된 접근(more tailored approach)을 제공합니다" (학생 [S] 1583).

 

기초를 확립한 후, 이러한 교육자들은 "임상 추론(clinical reasoning)에 있어 점진적으로 증가하는 수준의 복잡성(progressively increasing levels of complexity)"을 적용합니다(apply) (S1592).

 

탁월한 교사들은 학생들이 현재의 잠재력(potential)을 넘어설 수 있도록 독려했습니다(pushed). 교사들은 학생들이 도전을 느끼면서도 "오답을 말하거나 질문하는 것을 편안하게(comfortable to get answers wrong)" 느끼는 환경을 조성했습니다(fostered). 여러 학생이 언급했듯이, 탁월한 교사들은 학생들을 밀어붙이는 것과 벼랑 끝으로 내몰지 않는 것 사이에서 균형을 잡았습니다(struck a balance):

[의사 선생님]은 서브 인턴(sub-I) 경험을 계속해서 '자신의 역량을 확장할 수 있는 안전한 공간(safe place to stretch)'이라고 칭하며 내 최대 능력치(maximum capacity)로 임하도록 격려했습니다. (S1222)

존중하는 태도와 친근한 학습 환경 속에서, 선생님은 진심으로 나를 안전지대(comfort zone) 밖으로 밀어내셨고 작은 세부 사항에 주의를 기울이면서도 큰 그림(bigger picture)을 생각하는 법을 가르쳐 주셨습니다. 선생님은 지도 전문의(attending) 이상이었고, 멘토였습니다. (S1901)

[지도 전문의]는 학생인 나에게 높은 기대치(high expectations)를 가지고 있었고, 이는 환자를 만날 때마다(patient encounter) 내가 더 나아질 것을 요구했습니다. ... 선생님은 의대생이 아니라 진짜 의사가 되는 법을 가르치고 계셨습니다. 선생님은 나에게 도전을 주셨고(challenged me), 몇 번 안 되는 세션이었지만 나는 엄청나게 성장했습니다. 선생님은 훌륭한 교육자(remarkable educator)이며, 나의 프리셉터(preceptor)로 배정된 것에 감사합니다. (S738)

 

1-2 자연스러운 학습 기회를 최대한 활용하기 (Making the most of natural learning opportunities).

 

탁월한 교사들은 실제 환자와 함께하는(with real patients) 실시간(in real time) 학습 기회를 찾아냈는데, 실제 환자가 항상 교과서의 전형을 보여주는(model the textbook) 것은 아니기 때문에 이는 학생들에게 도전이 될 수 있었습니다. 이러한 교사들은 "하루의 모든 측면을 잠재적인 교육의 순간(potential teaching moment)으로" 대했습니다(treat) (S1126). 그들은 경험이 생생할(fresh) 때 환자와의 만남 전, 도중, 또는 직후의 공간에서 가르쳤습니다. 수련생들은 실제 환자를 통한 학습의 효과가 "우리가 이전에 배운 개념과 새로운 임상 지식을 더 잘 통합(integrate)할 수 있도록 전체적인 임상 상황(whole clinical picture)을 이해하는 데" 도움이 되었다고 설명합니다 (S1566). 한 수련생이 말했듯이,

[전공의]는 매일 서비스(service/진료과)에 있는 모든 학생에게 새로운 임상 기술 및/또는 지식을 가르치는(그리고 강화하는[reinforcing]) 것을 중시했고(made a point of), 능동적 지도(active instruction)와 환자 진료로부터 배우는 분위기를 조성하는 데 있어 리더로서 두각을 나타냈습니다. (S1402)

 

수련생들은 이론적 지식인 "시험을 위해 알아야 할 정보"와 실무적 적용(practical applications)인 "임상적으로 알아야 할 것들"을 연결해 주는 교육자를 선호했습니다 (S1136). 한 학생은 단순히 정보를 아는 것을 넘어 다음 단계로 나아가도록 도전받았을 때(challenged to take the next step) 느낀 감사를 묘사했습니다: "[그분은] 우리가 알아야 할 자료를 학습하고 우리의 지식을 새로운 상황(novel situations)에 적용하도록 끊임없이 독려합니다(pushes)." (S1566).

 

 

1-3 신중하고, 실행 가능하며, 빈번한 피드백으로부터 성장하기 (Growing from judicious, actionable, and frequent feedback).

 

본 연구의 학생들은 피드백을 받는 것에 수용적(receptive)이었으며, "우리가 무엇을 잘못하고 있는지 지적하고(point out) 그에 따라 수정해 주려는" 의지가 있는 강사들을 높이 평가했습니다 (S978). 정보를 덜 주려는(less forthcoming) 교육자들과 비교할 때, 탁월한 교사들은 "정확하고 정직한 피드백(accurate honest feedback)을 주는 것을 두려워하지 않았기 때문에" 돋보였는데(stood out), 학생은 "일부 전공의들은 이를 피하는(shy away from) 경향이 있다"고 느꼈습니다 (S1003).

 

수련생들은 "매 세션이 끝날 때마다 효과적이고 실행 가능한 피드백(effective, actionable feedback)"을 제공하는 발전된 형태를 통해 자신의 성장에 종단적 역할(longitudinal role)을 한 탁월한 교사들을 묘사했습니다. 피드백은 빈번했으며(frequent), 교육자들은 일관성 있게 전달했습니다(consistently delivered). 한 학생이 언급했듯이,

[의사 선생님]은 4주 동안 수련생으로서의 나의 성장(growth)에 매우 신경을 써주셨습니다(mindful). 선생님은 생산적인 피드백(productive feedback)을 적극적으로 주셨고, 실습(rotation) 기간 동안 내가 향상된 자율성(increased autonomy)과 기술을 지속적으로 개발할 수 있도록 매주 우리의 목표를 재평가(reassessed)했습니다. (S2229)


2 팀의 일원으로 포함되고 가치 있게 여겨지는 것은 학습자가 기여하고, 자율성을 발휘하며, 동료로서 함께 일하도록 장려했다 (Being included and valued as part of the team encouraged learners to contribute, exercise autonomy, and work alongside others as a colleague)

 

경험적 학습(Experiential learning)은 성장과 발전의 강력한 촉매제(potent catalyst)였습니다. 서사(Narratives)는 탁월한 교사들이 어떻게 처음부터(from the onset) 학생들을 팀의 조직(fabric) 속으로 일관성 있게 엮어 넣었는지(weaved)를 강조했습니다. 3가지 하위 주제는 포함(inclusion)을 통해 학습 경험이 어떻게 향상되는지를 보여줍니다:

  • 팀의 일원으로 받아들여지고 통합되기(being accepted and integrated as part of the team),
  • 환자 진료의 상호작용 및 책임에 있어 지도하에 자율성을 부여받기(receiving guided autonomy in interactions and responsibilities with patient care), 그리고
  • 팀원이자 미래의 동료로서 존중받는다고 느끼기(feeling respected as a teammate and future colleague).

2-1 팀의 일원으로 받아들여지고 통합되기 (Being accepted and integrated as part of the team).

 

서사들은 팀의 일원이 되는 것의 긍정적인 영향(positive impact)을 기술했습니다. 탁월한 교사들은 학생들의 초기 팀 통합(early team integration)에 대한 성향(propensity)을 보였습니다.

"첫날부터, 선생님은 내가 팀의 일원인 것처럼 느끼게 해주셨고 회진(rounds) 때 발표하도록 격려하고 환자 진료의 일상적인 업무(routine tasks)를 돕게 함으로써 나의 교육을 위해 적극적으로 시간을 내주셨습니다." (S887).

 

탁월한 교사들은 때때로 실습(clerkship)이 시작되기 전에 먼저 연락을 취했습니다(initiated contact). 이는 학생들이 수많은 미지(unknowns)의 상황을 헤쳐나가는 데(navigate) 도움이 되었습니다. 한 학생이 말했습니다,

[그분은] 내가 서비스(service)를 시작하기 전에 내가 어디로, 언제 가야 하는지, 그리고 [수술실]에서 어떤 케이스에 들어가게 될지를 이메일로 보내주셨습니다. 또한 컨퍼런스에서 내가 어떤 케이스를 발표하게 될지도 알려주셨습니다. (S1327)

 

탁월한 교사들은 환자 진료에 직접적으로 기여하는(directly contributed to) 참여를 장려하는 업무를 위임했습니다(delegated tasks):

"그분은 학생에게 의미 있는 업무(meaningful tasks)를 주었고 학생을 환자 진료에 완전히 참여시켰습니다(fully involved)" (S863).

 

수련생들은 팀의 책임(responsibilities)에 포함되는 것의 효과를 "길 잃은 새로운 3학년 의대생이 아니라 팀의 기여하는 일원(contributing member)으로 느끼는 것"이라고 회상했습니다 (S863).

 

서사들은 포용의 문화(culture of inclusivity)를 조성한 강사들을 묘사합니다:

"[전공의]는 나를 참여시키기 위해 무리해서라도 애써주셨고(went out of his way) 많은 책임과 업무를 믿고 맡겨주셨습니다(entrusted). 내가 팀의 일원인 것처럼 느끼게 해주셨습니다" (S1112).

 

한 학생은 탁월한 특징이 단순히 "[의대생들을] 지도 전문의 및 환자와의 논의(discussions)에 포함시키는 것"이었던 전공의를 묘사했습니다 (S633).

 

2-2 환자 진료의 상호작용 및 책임에 있어 지도하에 자율성을 부여받기 (Receiving guided autonomy in interactions and responsibilities with patient care).

 

탁월한 교사들은 지도하의 자율성(guided autonomy)을 촉진했습니다(facilitated). 서사들은 학생들에게 독립적으로(independently) "환자를 보고 회진 때 발표하며", "병력 청취(take a history)와 신체검사를 수행하고", "타과 자문(consults)을 요청"하도록 격려한 교육자들을 묘사했습니다 (S629). 환자 진료의 일상적인 측면조차도 수련생의 기여를 위한 통로(avenue)를 제공했습니다:

"그분은 내가 처방(orders)을 넣고, 경과 기록(notes)을 쓰고, 자문을 위해 호출기(pager)를 가지고 다니는 등 인턴처럼 기능하도록(function as an intern) 허용해주셨습니다" (S941).

 

한 학생이 언급했듯이,

선생님은 나에게 약국에 다녀오거나, 수액 세트(IV sets)를 준비하고, 수액을 준비하는 등 더 많은 방법으로 환자 진료에 나를 참여시키기 위해 최선을 다하셨습니다. 선생님과 함께 [수술실]에서 보낸 시간이 정말 즐거웠습니다. (S1836)

 

팀의 일원이라고 느끼는 것 외에도, 자율성을 발휘하는 것(exercising autonomy)은 학생들이 기술을 연습할 수 있게 해주었습니다—"그렇게 해도 안전한 환경(safe environment) 속에서 비상하고(soar) 또 비틀거려(stumble) 볼 수 있는" 기회였습니다 (S1399). 수련생들은 실수로부터 배웠고 연습과 성찰(reflection)의 순환을 통해 향상되었습니다:

"[자문을 요청할 때] 나는 타과의 다른 의사들에게 보고할 때 간결하지만 상세한 [병력 및 신체검사]의 중요성을 배웠습니다" (S926).

 

2-3 팀원이자 미래의 동료로서 학생에게 보여준 존중 (Respect shown for students as a teammate and future colleague).

 

수련생들은 동등한 존재(equal)로 여겨질 때 학습에 미치는 긍정적인 효과를 강조했습니다. 기여하는 팀원으로서, 학생들은 미래의 동료(future colleague)로서 가치 있게 여겨진다고 느꼈습니다:

"[그분은] 내 발표, 특히 나의 평가(assessment)와 계획(plans)에 주의를 기울여 주셨고, 내가 매우 지지받고 있다고 느끼게 해주셨으며 마치 전공의 수준에서 활동하고 있는(operating on the level of a resident) 것처럼 느끼게 해주셨습니다" (1006).

 

또 다른 학생은 말했습니다,

[의사 선생님]은 학생인 나와 인간적인 연결(human connection)을 형성해 주셔서, 나는 단순한 귀찮은 존재(nuisance)나 '따라다니는 사람(tag along)'이 아니라 후배 동료(junior colleague)처럼 느꼈습니다. 나의 교육과 우리가 축복받게도 돌볼 수 있는 지역사회를 위한 그분의 지속적인 봉사에 감사드립니다. (S1399)

 

팀원으로서 학생에 대한 지지는 정서적 웰빙(emotional well-being)을 보장하는 형태를 띠기도 했습니다. 탁월한 교사들은 정기적으로 학습자의 상태를 확인(checking in)함으로써 이를 보여주었습니다:

"선생님이 우리의 기분이 어떤지 확인하실 때, 나는 그녀가 진심으로 신경 쓰고 있으며(genuinely cares) 단순히 할 일 목록(list)을 지우기 위해 묻는 게 아니라는 것을 압니다" (S1586).

 

또 다른 학생은 이렇게 논평했습니다,

우리는 실습 중에 꽤 힘든 상황(tough situations)을 몇 번 목격했는데, 선생님은 내가 모든 것을 괜찮게 감당하고 있는지 확인하기 위해 일상적으로 나와 디브리핑(debriefed/사후 검토)을 했고, 비슷한 경험에 대처하는 법(cope with)을 어떻게 배웠는지에 대한 제안을 주셨습니다. (S894)

 

게다가, 지지는 때로 더 겸손하지만 심오했습니다(profound): "그분은 나를 한 인간(person)으로 대우해 주셨습니다" (S1352).

 


3 교육과 환자 진료에 대한 열정을 보여주는 것과 역할 모델링에 대한 인본주의적 접근의 결합은 학생들에게 영감을 주었다 (Demonstrating enthusiasm for teaching and patient care, combined with a humanistic approach to role modeling, was inspirational to students)

 

임상 지식을 습득하는 것(acquiring clinical knowledge)을 넘어, 학생들은 탁월한 교사들과의 경험을 지속적으로 처리하고 있었으며, 그에 따라 초기 단계의 전문직 정체성(nascent professional identities)을 조각해 나갔습니다(sculpting). 수련생들이 탁월한 교사들에게서 어떻게 영감을 받았는지를 특징짓는 두 가지 하위 주제가 나타났습니다:

  • 교육과 학생을 돌보는 것에 대한 열정을 목격하기(witnessing passion for teaching and caring for students)와
  • 진정성 있는 역할 모델링으로부터 영감을 얻기(drawing inspiration from authentic role-modeling).

3-1 교육과 학생을 돌보는 것에 대한 열정을 목격하기 (Witnessing passion for teaching and caring for students).

 

탁월한 교사들은 교육에 대한 강한 열정(strong passion)을 보였으며 학생들에게 추가적인 시간을 투자함(investing extra time)으로써 이를 입증했습니다:

"[전공의]는 또한 매일 시간을 내어 우리가 그날 보게 될 영상(imaging)과 다른 신경학 주제들을 검토해 주었습니다" (S696).

 

학생들은 이러한 시간 투자를 자신들의 교육에 대한 헌신(commitment)으로 인식했습니다. 더욱이, 수련생들은 학생에게 시간을 투자하는 것을 교육자가 관심을 갖고 있다는 신호(sign that the educator cared)로 받아들였습니다. 한 수련생은 썼습니다,

"나는 그분이 우리를 가르치는 데 얼마나 많은 시간을 썼는지 깊이 감사드립니다. 그분은 의대생 교육과 우리의 전문성 개발(professional development)에 대해 명백히 많은 신경을 쓰고 계십니다" (S1566).

 

서사들은 탁월한 교사들이 "믿을 수 없을 만큼 친절하고... 환대하는(welcoming)" (S911); "항상 우리를 위로하고, 지지하며, 진심으로 아껴준(genuinely cared for)" (S922); 그리고 지속적으로 "각 학생이 가능한 최상의 미래를 가질 수 있도록 보장하는" (S884) 사람들이라고 묘사했습니다. 한 학생이 표현했듯이, 각 학생에게 일상적으로 투자하는 교육자의 영향력은 강한 유대(bond)라는 결과를 낳을 수 있습니다:

"그분은 교육과 경력에 있어 우리의 발전을 조성해주시며(fosters), 의대에서의 내 경험과 학습에 대해 지속적으로 관심을 가져줄 것이라고 내가 의지할 수 있는(rely on) 유일한 분입니다" (S978).

 

추가적으로, 서사들은 "우리 각자의 이름을 알기 위해 열심히 노력하는 것(work[ing] hard to know us each by name)" (S1482)과 같은 단순한 제스처들이 수련생들에 의해 인식되고, 존중받으며, 높이 평가된다는 점을 자주 강조했습니다. 한 학생은 주목했습니다,

"질문을 하러 처음 다가갔을 때 그분이 내 이름을 알고 계셨는데, 그분이 과정(course)에 대해, 그리고 우리가 실제로 배우고 있는지 확인하는 것에 대해 정말로 신경 쓰고 있음이 명백했습니다(evident)." (S905).

 

 

3-2 진정성 있는 역할 모델링으로부터 영감을 얻기 (Drawing inspiration from authentic role-modeling).

 

서사들은 학생들이 그들 주변에서 일어나는 전문직 사회화(professional socialization)에 매우 민감하게 반응하고 있음(highly attuned)을 보여주었습니다. 그들이 의료 전문직의 규범(norms), 관습(customs), 불문율(unwritten rules)을 배울 때, 탁월한 교사들은 진정성 있는 역할 모델(authentic role models)로서 기능했습니다:

"그분은 주변의 모든 사람(동료, 전공의, 학생, 환자 등)에게 매우 사려 깊으시며(thoughtful), 저에게 훌륭한 역할 모델입니다!" (S973).

 

학생들은 탁월한 교사들의 인격(personalities)이 자신들의 미래 전문직 정체성의 비계(scaffolding/토대)를 세웠다고 묘사합니다:

"그분은 매우 숙련되고 재능 있는 의사/외과의사이지만, 환자를 대하는 매우 독특한 방식(unique way)을 가지고 계시며 100% 공감하고(empathetic), 환자 중심적(patient-centered)이며, 내가 항상 되고자 꿈꿔왔던 바로 그런 유형의 의사입니다." (S1352).

 

동료애(collegiality)환자를 대하는 태도(bedside manner)를 넘어, 서사들은 또한 취약성(vulnerability)을 보고 공유하는 것이 허용되는 것의 중요성을 강조했습니다:

[지도 전문의]는 매일 아침 시간을 내어 환자와 함께 앉아 가능한 한 빨리 간 이식을 받기 위해 노력해야 할 다음 단계들을 설명했습니다. 그러나 그 환자는 [외과 중환자실]에서 갑자기 사망했습니다. [지도 전문의]가 환자의 가족과 이야기하는 모습을 보면서, 환자와 그 가족이 힘든 시간을 헤쳐 나가는 것을 돕는 데 있어 훌륭한 환자 응대 태도(good bedside manner)의 중요성과 영향력을 다시금 깨달았습니다. 또한 선생님은 의사도 인간이며 환자의 죽음에 대해 눈물을 몇 방울 흘리는 것(shedding a few tears)이 치유 과정(healing process)의 일부라는 것을 일깨워 주셨습니다. (S1238)

[지도 전문의]는 자신이 '실패'했던 때에 대해 터놓고 이야기해 주셨는데(opened about), 선생님이 나와서 자신의 침체된 순간(down moments)을 공유할 수 있다는 점이 저에게는 매우 큰 영감(extremely inspiring)이 되었고, 저 또한 똑같이 할 수 있는 학생이자 미래의 의사가 되고자 하는 동기를 실제로 부여했습니다. (S1106)

 

 

고찰 (Discussion)

 

본 연구는 의학 수련생(medical trainee)의 관점에서 탁월한 교육(exceptional teaching)에 대한 서사(narratives)를 분석했습니다. 이 서사들은 긍정적인 학습 경험(positive learning experiences)의 큐레이션을 나타내며, 탁월한 교육에 기여하는 다양한 기법(techniques), 행동(behaviors), 태도(attitudes)를 조명합니다(shedding light on). 이 분석의 결과(outcomes)는 기존 연구와 일치하며(consistent with), 수련생들이 의학 교육자들이 보여주는 비인지적 속성(noncognitive attributes)에 두는 상당한 가치(substantial value)를 강조했습니다(underscored). 본 연구는 현재까지 탁월한 교육에 대한 학생들의 관점을 다룬 가장 큰 규모의 질적 분석(largest qualitative analysis)이라는 점에서 구별됩니다(distinguished). 또한, 우리는 탁월한 교사들이 이러한 특성을 어떻게 구현(embodied)했는지를 의도적으로 조사(intentionally examined)하여, 우리 연구 결과의 실질적 적용(practical application) 가능성을 높였습니다. 문헌의 기존 지식과 이러한 자질의 실행(practice)에 관한 우리 연구 결과의 새로운 통찰(novel insights)을 통합하여 5가지 제언(Five recommendations)이 개발되었습니다.

 

제언 1: 심리적 안전감을 유지하면서 학생들에게 도전 과제 부여하기 (Recommendation 1: Challenge students while maintaining psychological safety)

 

우리의 주요 발견(primary findings) 중 하나는 많은 임상 교수진(clinical faculty)의 지배적인 우려(prevailing concern), 즉 학습자를 밀어붙이는 것(pushing learners)이 부정적인 결과(adverse outcomes)로 이어질 것이라는 두려움과 배치됩니다(runs counter to). 반대로, Sutkin 등은 그들의 검토 논문 68개 중 어느 것도 "도전적인(challenging)"과 같은 특성을 언급하지 않은 것에 대해 놀라움을 표했는데, 정작 그들 자신이 가장 좋아하는 교사들이 이러한 행동을 보였다는 개인적 성찰(personal reflections)에도 불구하고 말입니다. 우리 연구는 수련생들이 심리적 안전감(psychological safety)을 느낀다는 전제하에(provided they experienced), 도전적인 경험을 제공하는 교육자들에게 높은 가치를 둔다는 것을 밝혀냈습니다. 다시 말해, 학생들은 학습 환경(learning environment)에서 안전하다고 느낄 때 위험을 감수하려는 경향(inclined to take risks)이 더 컸습니다. 본 연구는 심리적 안전감이 효과적인 의학 교육의 결정적 구성 요소(critical component)라는 역할을 지지하는 증가하는 증거(increasing body of evidence)에 기여합니다. 더 나아가, 우리 연구는 교육자가 심리적 안전감을 훼손하지 않으면서(without compromising) 어떻게 도전적인 경험을 제공하는지를 상세히 설명합니다(expounds on).

 

탁월한 교사들은 먼저 수련생의 기초 능력(baseline ability)을 평가한 다음, 점진적인 복잡성(progressive complexity)을 서서히 적용합니다. 이러한 접근 방식은 점진적인 단계(incremental steps)를 통해 지식의 구축(construction of knowledge)을 촉진했으며, 학생들이 자신의 능력의 최전선(forefront of their capabilities)에서 활동하게 하는 동시에 그들의 한계(limitations)를 비춰주기도 했습니다. 이런 방식으로, 학생은 자신이 할 수 있는 것과 할 수 없는 것의 지평(horizon)에서 지속적으로 기능했습니다. 반복적인 피드백 세션(Iterative feedback sessions)은 도전적인 과제로 나아갈 준비도(readiness for progression)를 측정하는 데 필수적인 역할을 하여 학습 정체기(learning plateaus)를 예방했습니다. 또한, 이러한 확인 과정(check-ins)명확화(clarification)를 위한 기회를 만들고, 더 강력한 수련생-교사 관계를 조성했으며(fostered), 심리적 안전감을 함양했습니다(nurtured).

 

제언 2: 빈번하고 구체적인 피드백 제공하기 (Recommendation 2: Provide feedback that is frequent and specific)

 

피드백은 학습자가 자신의 강점과 약점을 파악하고(identify), 수행 능력(performance)에 대한 통찰을 얻으며, 개선 방법에 대한 지침(guidance)을 받을 수 있게 해주기 때문에 의학 교육의 필수 불가결한 구성 요소(indispensable component)입니다. 따라서 피드백 제공이 실습 종료 평가(end-of-rotation evaluations)에만 국한되어서는 안 된다는 것(imperative)이 필수적입니다. 선행 연구들은 피드백이 수련생에게 높이 평가된다는 것을 입증했습니다(established). 우리의 연구 결과는 피드백의 빈도(frequency)와 구체성(specificity)에 관한 수련생의 선호도를 상세히 설명합니다(elaborate on).

  • 첫째, 피드백은 빈번해야 합니다(frequent). Irby 등의 연구 결과와 유사하게, 본 연구의 탁월한 교사들은 실질적인 목표(practical goals)를 개략적으로 설명한 다음, 짧은 간격(short intervals)으로 확실하게 후속 조치(reliably followed up)를 했습니다. 매일 또는 매주 피드백을 받은 수련생들은 자신의 진전(progress)을 스스로 인지하고 있었기 때문에(self-aware) 참여도(engagement)가 증가했다고 설명했습니다.
  • 둘째, 피드백은 구체적이어야 합니다(specific). 탁월한 교사들은 사려 깊고(thoughtful), 실행 가능하며(actionable), 빈번한 피드백을 전달했습니다. 흥미롭게도, 본 연구의 수련생들은 탁월한 교사들이 비판적이거나 부정적인 피드백(critical or negative feedback)을 기꺼이 주려는 의지(willingness)를 바람직하고 심지어 존경할 만한(admirable) 것으로 확인했으며, 그렇게 하는 전공의들을 "두려워하지 않는(not afraid)" 사람이라고 묘사하거나 다른 교육자들의 경향(tendencies)과는 다르다고 주목했습니다. 또한, 본 연구의 서사들은 기술적 술기(technical skills)를 정교화하기 위한 즉각적인 교정 피드백(immediate corrective feedback)의 긍정적 연관성과도 일치합니다(concordant with). 이런 방식으로, 피드백은 학습자의 발달 단계에 맞춰(meet the learner where they are) 지속적으로 진화합니다.

 

제언 3: 성장을 위한 자율성 부여하기 (Recommendation 3: Give autonomy for growth)

 

의학 수련생들은 실험(experimentation)과 성찰(reflection)로부터 도식(schemas)을 구축하고 정교화합니다. 우리의 연구 결과는 자율적이고 지지적인 분위기(autonomous and supportive climate)를 조성하는 교육자의 중요성을 강조하는 이전 연구들과 공명합니다(resonate with). 우리는 학생들이 자신의 업무(tasks)에 대한 주인의식(sense of ownership)과 책임감(responsibility)을 느낄 때 더 높은 참여 수준을 보고한다는 것을 알고 있습니다. 탁월한 교육자들은 학습자의 내재적 동기(intrinsic motivation)와 자기 결정성(self-determination)을 키워줍니다. 우리 연구는 탁월한 교사들이 정확히 어떻게 자율성을 부여하는지, 그리고 학생들이 의미 있다고(meaningful) 생각한 책임의 범위(spectrum of responsibility)에 대한 통찰을 제공합니다.

 

탁월한 교사들은 학생들이 독립적으로 환자를 진료하고(see patients independently), 호출기(pagers)를 소지하고 응답하며, 자문(consultations)을 요청하고, 시술을 위한 약물을 준비하도록 격려했습니다. 심지어 일상적인 책임(routine responsibilities)조차도 수련생을 수동적 관찰자(passive observers)에서 능동적 참여자(active participants)로 재구성(recasted)했으며, 팀 내에서의 그들의 역할에 목적(purpose)을 부여했습니다. 더욱이, 자율성은 수련생이 실제 환자와의 유기적인 학습 기회(organic learning opportunities)에 접근하는 정도(proximity)를 심대하게 증가시켰습니다. 자율성을 묘사하는 서사들에 널리 퍼져 있는 요소(pervading element)는 목적 있는 기여(purposeful contribution)에 대한 보편적인 욕구(seemingly universal desire)였습니다. 탁월한 교사들은 확실한 포함(reliable inclusion)을 통해 이러한 기여를 촉진했습니다(facilitated).

 

제언 4: 그들을 팀의 일원으로 만들기 (Recommendation 4: Make them part of the team)

 

본 연구의 수련생들은 관찰(observership)보다 도제(apprenticeship)를 제공하는 탁월한 교사를 선호했습니다. 임상 환경에 들어가기 전부터, 우리의 데이터는 수련생들이 미지의 것들(unknowns) (즉, 어디로 가야 할지, 누구와 이야기해야 할지, 무엇을 해야 할지)로부터 이해할 만한 수준의 불안(understandable level of anxiety)을 가지고 있음을 서술했습니다. 우리는 팀의 일원으로서 조기 포함(early inclusion)이 가치 있게 여겨지며, "그림자(being a shadow)"가 되거나, "방해되는(in the way)" 존재, 혹은 "길 잃은 새로운 3학년 의대생"처럼 느끼는 두려움을 개선하는 데(ameliorate) 도움이 된다는 것을 발견했습니다. 비록 우리의 데이터는 탁월한 교사에 초점을 맞추었지만, 우리는 이전 연구를 통해 이러한 감정들이 학습 기회로부터 배제된(excluded) 과거의 경험에서 기인할 수 있다는 것을 알고 있습니다. 더욱이, 우리 연구는 학생들의 학습이 그들이 팀의 일원이라고 말로 듣는 것(being told)뿐만 아니라 팀의 일원으로서 참여하는 것(participating)에 의해 향상된다는 선행 연구와 일치합니다(aligns with). 우리의 연구 결과는 탁월한 교육자들이 팀 내 학생의 역할을 어떻게 지지하는지를 예시합니다(illustrate).

 

탁월한 교사들은 다양한 방법을 통해 학생들을 자신의 대열(ranks)로 통합했습니다. 본 연구에서, 학생을 팀으로 열렬히 환영하는 것(enthusiastically welcoming)은 소속감(sense of belonging)을 확립했습니다. McClintock 등은 학생들이 첫날(within the first day) 내에 환경을 안전한지 또는 안전하지 않은지로 진단한다는 것을 발견했습니다. 조기 인정(Early acknowledgment)진정한 열정(genuine enthusiasm)은 실습의 나머지 기간 동안 견고한 토대(durable foundation)를 마련하는 데 큰 역할을 했습니다. 게다가, 탁월한 교사들은 환자 진료에 직접적으로 기여하는 책임을 수련생에게 기꺼이 위임했습니다(readily delegated). 중요하게도, 환자 진료에 대한 실질적인 기여(real contribution)는 팀 내 수련생의 위치(position)에 타당성(validity)을 제공하기 때문에 무엇보다 중요했습니다(paramount). 이와 대조적으로(In juxtaposition), 과도한 중복(excessive redundancy)은 업무의 중요성을 약화시키고(undermined) 학생의 역할을 무효화했습니다(nullified). Bates 등은 팀 기여가 학생들에게 "환자에 대한 증가하는 책임과 의료 공동체(health care community)로의 수용(acceptance)에서 파생되는 진전감(sense of progress)"을 제공한다고 설명합니다. 결과적으로, 의미 있는 역할을 수행한 수련생들은 동료(colleagues)로서 가치 있게 여겨진다고 느꼈으며, 팀 내에서 증가된 신뢰(trust), 동료애(camaraderie), 소통(communication)을 보고했습니다.

 

제언 5: 수련생-교사 관계 함양하기 (Recommendation 5: Cultivate the trainee-to-teacher relationship)

 

다수의 연구가 수련생과 교사 사이에 함양된(cultivated) 관계의 중요성을 매우 가치 있는 비인지적 행동으로 일관되게 강조합니다. 우리 연구는 발전하는 관계(evolving relationship)의 중요성이 앞서 언급한 각 제언들 사이에 널리 퍼져 얽혀 있는 실타래(pervasive thread interwoven)이기 때문에 문헌을 확증합니다(corroborates with). 심리적 안전감, 피드백, 자율성, 동료애 중 무엇이든 간에, 신뢰의 양방향 교환(bidirectional exchange of trust)은 무엇보다 중요했습니다. 우리 연구는 탁월한 교사들이 사회적 교환(social exchange)에 기여하는 긍정적인 측면과 그 축적(deposit)이 수련생에게 어떻게 해석되었는지를 분리해 냈습니다(isolated). 예를 들어, 우리는 본 연구의 학생들이 탁월한 교사의 열정과 시간 투자를 의도적인 선택(deliberate choice)으로 간주했으며, 이는 그들의 교육과 그들 개인에 대한 깊은 헌신(deep commitment)을 의미한다고(signifying) 보았습니다.

 

더욱이, 본 연구의 서사들은 인본주의(humanism)를 위해 위계(hierarchy)를 벗어던지는(shed) 교육자에 대한 수련생의 선호도를 강조했습니다. 탁월한 교사들은 감정을 드러내거나(displaying emotion) 실패했던 때(times of failure)를 공유함으로써 취약성(vulnerability)을 모델링했습니다. 의학 교육에서의 역할 모델링(role-modeling)에 관한 수많은 연구 속에 위치한 우리 연구 결과는, 취약성을 역할 모델링하는 것이 수련생에게 심대한 영향(profound impact)을 미치며 향후 전문직 정체성 형성(professional identity formation)에 영향을 줄 수 있음을 보여줍니다.

 

마지막으로, 우리의 분석은 수련생-교사 관계의 공동 창조(cocreation)에 기여하는 작지만 영향력 있는 행동들을 확인했습니다. 수련생들은 인정받는 것(being acknowledged)과 자신의 이름이 기억되는 것(having their name remembered)의 중요성을 강조했습니다. 이 발견은 McClintock 등의 심리적 안전감에 관한 연구의 논평(commentary)을 상기시키는데(echoes), 저자들은 그러한 단순한 행동들이 많은 학습 환경에서 종종 부재하다는 점을 지적했습니다. 표면적으로(On the surface), 이 제언은 직관적인(intuitive) 것처럼 보일 수 있습니다. 그러나, 만약 우리의 서사들이 이름을 기억하는 능력과 친절함(kindness)을 가장 탁월한 특징으로 꼽는 교사들을 묘사하고 있다면, 수련생들은 반대의 경우를 얼마나 자주 경험하고 있는 것일까요?

 

강점 (Strengths)

 

이 연구는 몇 가지 강점을 가지고 있습니다. 첫째, 본 연구의 서사들은 학생의 관점(perspective of the student)에서 경험을 묘사하며 수련생이 가치 있게 여긴 것에 특화되어 있습니다(specific to). 또한, 그들의 서사는 탁월한 교사들이 어떻게 탁월한 자질을 보여주는지에 대한 구체적인 일화적 예시(specific anecdotal examples)를 제공합니다. 둘째, 우리의 데이터셋은 먼 회고적 설명(distant retrospective account)이 아니라 경험 직후의 시간에 유기적으로 큐레이션 되었습니다(curated organically). 셋째, 데이터셋의 규모가 이전의 어떤 보고보다도 견고하고(robust) 컸습니다.

 

한계점 (Limitations)

 

이러한 결과를 해석할 때 몇 가지 한계점을 고려해야 합니다.

  • 첫째, 데이터가 단일 기관(single institution)인 PSCOM에서 수집되었기 때문에, 결과를 다른 학술적 환경(academic settings)으로 이전하는 것(transferability)이 제한될 수 있습니다. 기관 문화, 교육 과정 구조, 교육 규범(teaching norms)은 학술적 환경마다 다르며 탁월한 교육이 인식되는 방식에 영향을 줄 수 있습니다.
  • 둘째, 서사가 단 하나의 개방형 질문(single open-ended prompt)에 응답하여 자발적으로 제출되었기 때문에(submitted voluntarily), 선택 편향(selection bias)의 가능성이 도입되었습니다. 학생들은 특히 기억에 남거나 정서적으로 공명하는(emotionally resonant) 경험을 공유하려는 경향이 더 컸을 수 있으며, 이는 일상적이지만 매우 효과적인 교육 관행은 과소평가(underrepresenting)하는 반면 눈에 띄는 순간들(standout moments)을 과도하게 강조할(potentially overemphasizing) 가능성이 있습니다.
  • 셋째, 일부 서사가 개인적 성장(personal growth)을 묘사했지만, 이는 주관적 성찰(subjective reflections)이었습니다. 이 연구는 확인된 행동들이 측정 가능한 교육적 성과(measurable educational outcomes)로 이어지는지 여부를 결정할 수 없습니다. 선행 연구는 심리적으로 안전하고, 포용적이며(inclusive), 참여를 유도하는 학습 환경이 의학 교육에서의 학습, 동기, 수행 능력을 향상시킨다는 것을 시사합니다. 그러나, 문헌이 이러한 연관성을 지지함에도 불구하고, 우리 연구는 인지된 자질(perceived qualities)이 수행 능력 향상으로 이어지는지를 경험적으로 평가(empirically evaluate)하지는 않습니다.

 

결론 (Conclusions)

 

본 연구의 한계점에 대한 적절한 고려와 함께, 우리는 이 연구가 의학 수련생들이 탁월한 교육을 어떻게 인식하는지에 대한 가치 있는 통찰(valuable insight)을 제공한다고 믿습니다. 앞서 언급한 5가지 제언 중에서, 도전받고자 하는 욕구(desire to be challenged)는 독특한 발견(distinctive finding)으로 두드러집니다. 임상 교육자들은 학습자를 밀어붙이는 것이 부정적으로 인식될까 봐 걱정할 수 있습니다. 그러나, 우리의 데이터는 수련생들이 도전을 환영할(welcome) 뿐만 아니라, 그것이 심리적 안전감에 기반하고 있을 때(grounded in psychological safety) 이를 탁월한 교육의 특징(hallmark)으로 본다는 것을 시사합니다. 이 연구의 가치는 실질적 적용(practical application)에서 그 균형이 어떻게 달성되는지를 탐구하는 데 있습니다.

 

나머지 제언들은 기존 문헌에서 더 친숙한 자질들을 반영합니다: 빈번하고 구체적인 피드백 제공, 자율성 부여, 팀 포함 촉진(fostering team inclusion), 그리고 인본주의적 관계 함양. 본 연구는 겉보기에 단순해 보이는(seemingly straightforward) 이러한 특성들 이면의 복잡성(complexity)을 드러내는 맥락이 풍부한 예시(context-rich examples)를 제공함으로써 그 토대 위에 구축되었습니다(builds on). 그러한 행동들이 일상적인 임상 진료에서 어떻게 실행되는지(enacted)를 예시함으로써, 탁월한 교육에 대한 우리의 이해에 깊이(depth)를 더합니다.

  • 본 연구는 "팀에 있는 것(on the team)"과 "팀의 일부가 되는 것(part of the team)" 사이의 미묘한 차이(nuance)를 설명합니다.
  • 마찬가지로, 이름뿐인 자율성(autonomy in name only)과 수련생이 의미 있게 기여할 수 있도록 장비해 주는(equips) 자율성 사이의 차이를 강조합니다.

비록 데이터가 측정된 성과보다는 인식(perceptions)을 반영하지만, 서사들은 수련생들에게 무엇이 가장 중요한지를 드러냅니다. 종합해 볼 때(Taken together), 이러한 결과들은 교수 개발(faculty development)을 안내하고, 교육 관행을 격상시키며(elevate), 차세대 의학 교육자들을 지원하기 위한 실용적이고 학습자 정보를 기반으로 한 프레임워크(practical, learner-informed framework)를 제공합니다.

 

 

Z Evid Fortbild Qual Gesundhwes. 2022 Aug:172:1-11. doi: 10.1016/j.zefq.2022.04.025. Epub 2022 Jun 17.

Reporting guidelines for Delphi techniques in health sciences: A methodological review

 

 

 

혹시 전문가들의 합의(Consensus)를 도출하기 위해 델파이 기법(Delphi technique)을 사용해 보신 적 있나요? 🤷‍♀️ 델파이는 복잡한 문제에 대해 전문가들의 의견을 모으는 정말 강력한 도구지만, 막상 논문을 쓸 때 "어디까지, 어떻게 보고해야 하지?" 고민해 본 경험 다들 있으실 거예요.

오늘 소개할 논문은 바로 이 고민을 해결하기 위해 기존의 보고 지침들을 싹~ 훑어보고(Review), "우리가 진짜 놓치고 있는 게 무엇인지" 짚어주는 아주 알찬 연구랍니다. 🔍


1. 왜 이 연구가 필요했을까요? 🤔

연구진이 살펴보니, 델파이 연구는 정말 많이 쓰이는데 막상 논문에 보고되는 품질(Reporting quality)은 천차만별이었다고 해요. 어떤 논문은 자세한데, 어떤 논문은 "전문가 몇 명이 합의했다" 정도로 퉁치고 넘어가는 식이죠.

그래서 연구진은 기존에 나와 있는 10개의 보고 지침(Reporting guidelines)을 꼼꼼히 뜯어봤습니다. 그랬더니 '합의(Consensus)'에 대한 내용은 다들 있는데, 정작 중요한 연구의 철학적 배경(인식론)이나 다양한 델파이 변형(Variants)에 대한 고려는 턱없이 부족하다는 걸 발견했어요!

2. 연구진의 핵심 주장: "도대체 어떤 '진리'를 찾고 있는 건가요?" 💡

이 논문에서 제가 가장 무릎을 탁! 쳤던 부분은 바로 인식론(Epistemology)에 대한 지적이에요. 단순히 "합의했다"가 중요한 게 아니라, 이 합의가 "객관적인 정답(Truth)"을 찾은 건지, 아니면 "우리끼리의 사회적 약속(Construction)"을 만든 건지 밝혀야 한다는 거죠.

연구진은 이 부분을 이렇게 강조합니다.

"델파이 기법이 (비판적 합리주의를 따르는) 실재론적 관점에 기초하는지, 아니면 구성주의적 관점에 기초하는지에 대한 질문은 델파이 과정과 그 결과의 품질을 평가하는 데 적절합니다."

"The question of whether the Delphi technique is based on a realist perspective following critical rationalism or on a constructivist perspective is relevant for the evaluation of the quality of a Delphi process and its results."

 

쉽게 말해, 자연과학처럼 "정답은 있고 전문가가 그걸 맞히는 거야(Realist)"라는 입장인지, 사회과학처럼 "정답은 없고 우리가 만들어가는 거야(Constructivist)"라는 입장인지에 따라 연구의 질을 평가하는 잣대가 달라져야 한다는 거예요. 😲

3. 그래서 제안하는 '새로운 델파이 보고 지침' 📋

기존 지침들이 너무 전통적인 델파이에만 머물러 있다고 판단한 연구진은, 15가지 항목으로 구성된 아주 꼼꼼한 새로운 제안(Proposal)을 내놓았습니다. 연구진은 이 지침의 필요성을 이렇게 역설해요.

"포괄적인 보고 지침은 서로 다른 하위 분야별 목적을 가진 델파이 연구들을 품질 측면을 포함하여 비교 가능하게 만들 수 있습니다. 마찬가지로, 이는 가능한 적용의 다양성과 과정의 복잡성을 강조할 수 있습니다."

"A comprehensive reporting guideline could make Delphi studies with different subfield-specific objectives comparable, including in terms of their quality. Likewise, it can highlight the variety of possible applications and complexity of the process."

 

논문에서 제안한 핵심 체크리스트 15개는 대략 이렇습니다. (논문 쓰실 때 꼭 참고해보세요! 👇)

  1. 제목 및 초록 (Title and Abstract): 델파이 연구임을 명시
  2. 인식론 (Epistemology): 연구의 철학적 배경(실재론 vs 구성주의) 밝히기
  3. 공식적 맥락 (Formal Context): 연구팀, 자금 출처 등
  4. 지식 기반 (Knowledge Base): 어떤 근거 자료(Evidence)를 썼는지
  5. 지식 통합 (Knowledge Integration): 서로 다른 지식을 어떻게 합쳤는지
  6. 델파이 변형 (Delphi Variant): 어떤 변형 기법을 썼고, 왜 썼는지
  7. 표본 (Sample): 전문가 패널은 누구이고, 어떻게 모았는지 (가장 중요!)
  8. 조사 도구 (Survey Instrument): 설문지는 어떻게 만들었는지
  9. 델파이 라운드 (Delphi Rounds): 몇 번 했고, 언제 멈췄는지
  10. 피드백 (Feedback): 전문가들에게 어떤 피드백을 줬는지
  11. 평가 (Evaluation): '합의'를 숫자로 어떻게 정의했는지
  12. 결과 (Result): 라운드별 결과와 과정의 변화
  13. 데이터 및 해석의 품질 (Quality of Data): 데이터의 질을 어떻게 보장했는지
  14. 고찰 및 한계 (Discussion & Limitations): 결과의 타당성에 대한 비판적 성찰
  15. 확산 (Dissemination): 결과를 어떻게 활용할 것인지

4. 마치며... 👋

델파이 연구는 단순히 설문조사 몇 번 돌리는 게 아니라, 전문가들의 지혜를 짜내는(Weave) 정교한 과정입니다. 여러분의 연구가 더 빛을 발하고 학술적으로 인정받기 위해서는, 오늘 소개한 이 '투명한 보고(Transparent reporting)'가 필수적일 것 같아요.

앞으로 델파이 논문 쓰실 때, 연구진이 남긴 마지막 조언을 꼭 기억하세요!

"결론적으로 보고 지침은 연구자들이 주요 가정과 방법론적 선택, 그리고 결과가 해석되는 기초가 되는 인식론적 기초를 성찰하고 공개하도록 장려합니다."

"The bottom line is that reporting guidelines encourage researchers to reflect on and disclose key assumptions and methodological choices, as well as the epistemological foundations on which basis results are interpreted."

 

여러분의 탄탄한 연구를 응원합니다! 💪✨

 


서론 (Introduction)

델파이 기법(Delphi techniques)불확실하고(uncertain) 불완전한 지식(incomplete knowledge)이 존재하는 복잡한 문제(complex issues)들을 전문가들(experts)이 반복적이고 구조화된 과정(iterative and structured process)을 통해 평가하는(assessed) 집단 토의 절차(group discussion procedures)이다 [1–4]. 이는 보건 과학(health science)의 다양한 하위 분야(subfields)(예: 임상 환자 진료, 공중 보건 및 건강 증진, 보건 서비스 연구, 의학 교육)에서 수행되며, 특히 합의(consensus)를 도출하기 위해(identify) 수행된다 [5–7]. 증거 기반 지식(Evidence-based knowledge), 실무 지식(practical knowledge), 그리고 때로는 생활 세계 경험(life-world experiences)에 기초한 일상 지식(everyday knowledge)이 구조화된 과정(structured process) 안에서 한데 모인다. 그 목표는 보건 부문(health sector)에서의 의사결정(decision-making)과 조치(action)를 지원하는 데 사용될 합의된 지침(consensual guidelines)이나 표준(standards)을 개발하는 것이다. 방법론적 문헌(methodological literature)에서는 델파이 기법의 다섯 가지 특성(characteristics)을 기술한다 [4,8,9]:

 

  • 1. 특정 지식(specific knowledge)을 가진 전문가들이 인터뷰 되며(interviewed), 대개 그들의 익명성(anonymity)이 보장된다.
  • 2. 조사는 적어도 두 번의 델파이 라운드(Delphi rounds)로 수행되며, 3회 이상의 델파이 라운드는 예외적이다.
  • 3. 조사 도구(survey instrument)는 대개 표준화된 설문지(standardized questionnaire)이며, 주장(arguments)과 추론의 범위(reasoning horizons)를 포착하기 위해(capture) 종종 개방형 질문(open-ended questions)을 포함한다.
  • 4. 통계적 분석(statistical analysis)은 대개 기술적 계산(descriptive calculations)에 기초한다.
  • 5. 두 번째 델파이 라운드부터 전문가들은 설문지와 더불어 이전 라운드의 결과에 대한 피드백(feedback)을 받으며, 자신의 판단(judgments)을 재고하거나 수정(reconsider or revise)할 수 있다.

전통적인 델파이 접근법(traditional Delphi approach) 외에도 다른 델파이 변형들(Delphi variants)이 있다. 가장 중요한 변형들은 다음과 같다:

  • 실시간 델파이(Real-time Delphi): 전문가의 판단이 온라인상에서 실시간으로(in real time) 다시 반영된다(reflected back). 즉, 응답자들은 자신의 판단을 여러 번 내릴 수 있으며, 별도의 개별적인 델파이 라운드가 없다 [10].
  • 정책 델파이(Policy Delphi): 혁신(innovations)이나 해결책(solutions)에 대한 광범위한 판단(wide range of judgments)이나 접근 방식(approaches)을 명시적으로 포착하는 데 관여한다 [11].
  • 논쟁적 델파이(Argumentative Delphi): 표준화된 판단에 대한 질적 추론(qualitative reasoning)에 초점을 맞춘다 [12]. 이는 현재 대부분 실시간으로 이루어지는 동적 논쟁적 델파이(dynamic argumentative Delphi, DAD)로 수행된다.
  • 그룹 델파이(Group Delphi): 전문가들이 초대되어 엇갈리는 판단(divergent judgments)에 대한 논거를 공개적으로 토론(openly discuss)한다. 이는 전문가들의 익명성을 제거한다 [4].
  • 퍼지 델파이(Fuzzy Delphi): 전문가 패널 내 판단 간의 거리(distance)를 결정하기 위해 삼각측량 통계(triangulation statistics)를 활용한다 [13].

델파이 과정(Delphi process)을 통해, 엇갈리는 전문가의 평가(diverging expert assessments)와 의견(opinions)은 투명해지고(transparent), 궁극적으로 – 적어도 주장에 따르면(at least this is the claim) – 해결되어 합의(resolved and consented upon)된다. 이는 특히 임상 지침(clinical guidelines) [14], 정의 및 용어(definitions and terminologies) [15], 백서(white papers) [16], 보고 지침(reporting guidelines) [17], 치료법 또는 건강 관련 중재(treatment methods or health-related interventions) [18], 정책 입안자(policy-makers)나 기타 사회적 행위자(societal actors)를 위한 행동 권고(recommendations for action) [19], 그리고 건강 관련 중재를 위한 품질 지표(quality indicators) [20]에 적용된다. 델파이 연구(Delphi studies)의 결과(findings)는 종종 건강과 환자 진료(patient care)에 광범위한 영향(far-reaching consequences)을 미친다. 특히, 순수하게 지식 혹은 경험에 기반한 담론(knowledge- or experience-based discourse)이라는 인식론적 주장(epistemic claim)은 의료 현장(healthcare practice)에서 결과가 비교적 크게 수용될 확률(probability of a relatively large acceptance)을 결정한다. 델파이 과정과 결과 생성(generation of results)에 대한 투명하고 비판적인 제시(transparent and critical presentation)는 품질 보증(quality assurance)과 델파이 기법의 수용성 증대(increasing the acceptance)에 상당히 기여할 수 있다.

델파이 기법의 보고 품질 (Reporting quality of Delphi techniques)

델파이 기법의 실행(implementation)과 데이터 품질(data quality)은 인식론적(epistemologically), 방법론적(methodologically) 또는 경험적(empirically)으로 거의 논의되거나 평가되지 않는다 [8,20–23]. 현재까지 일반적인 델파이 과정의 품질을 평가하기 위한 기준(criteria) [7]은 존재하지만, 과학 출판물(scientific publications)에서 델파이 기법의 어떤 측면(aspects)이 보고되어야 하는지는 여전히 크게 불명확하다(remains largely unclear). Niederberger와 Spranger [5]는 12개의 체계적 문헌 고찰(systematic reviews)(총 883편의 출판물 포함)에 대한 개요(overview)를 통해 보건 과학 분야 델파이 연구의 일반적인 출판 관행(publication practice)을 기술한다. 이 개요는 대부분의 출판물이 델파이 기법의 중심적인 측면들, 즉 전문가 선정(selection of experts), 합의의 정의(definition of consensus), 라운드 횟수(number of rounds) 및 응답률(response rates)에 대해 보고하고 있음을 보여준다. 그러나 이는 보고 품질(reporting quality)에 있어 일정한 이질성(certain heterogeneity) 또한 드러낸다.

  • 예를 들어, 적용된 델파이 변형(applied Delphi variant)에 대한 명확한 진술은 검토된 델파이 논문 중 61%에서 88% 사이에서만 발견되었다.
  • 또한 참가자의 전문성(expertise)이나 선정 전략(selection strategy)에 대한 정보의 가용성(availability)도 다양했다. 완화 의료(palliative field) 분야의 체계적 문헌 고찰에서는 거의 3편 중 1편의 논문이 설문지 개발(questionnaire development) 제시에 결함(deficiencies)을 보였다 [21].
  • 보건 과학 부문의 다른 리뷰에서는 그 수치가 93%로 훨씬 더 높았다 [20]. 델파이 과정 중 항목(items)의 수정(modification) 또는 적응(adaptation)은 검토된 출판물의 59% [8]에서 100% [24] 사이에서 보고되었다.
  • 피드백 설계(feedback design)에 대한 언급은 체계적 문헌 고찰 내 논문의 38% [2]에서 55% [25] 사이에서 발견된다.

이러한 보고 품질 차이의 가능한 이유(Possible reasons)는 아직 체계적으로 조사되지 않았다. 이는 아마도 분야별 관행(field-specific practices), 출판사 요구사항(publisher requirements), 그리고 델파이 기법을 사용하는 연구를 위한 포괄적이고 일반적으로 수용되는 보고 지침의 부재(lack of a comprehensively and generally accepted reporting guidelines) 때문일 것이다.

보건 과학 분야 델파이 절차를 위한 보고 지침 (Reporting guidelines for Delphi procedures in the health sciences)

경험적 연구(empirical studies)의 보고를 표준화(standardize)하고 개선(improve)하기 위해 보건 과학 분야에서 보고 지침(Reporting guidelines)이 점점 더 자리를 잡아가고 있다. 이들은 전형적으로 특정 연구 방법(particular research method)에 기초하여 보고서에서 다루어야 할 기준 목록(list of criteria)을 포함한다. 특히, EQUATOR (Enhancing the QUAlity and Transparency Of health Research) 네트워크는 보고 지침 모음(collection of reporting guidelines)을 제공함으로써 보건 과학 분야 과학 출판물의 품질을 향상시키기 위해 착수했다. 현재 다양한 유형의 연구에 대한 보고 지침이 존재하며 그 적용은 국제적으로 확립되었다(예: CONSORT, CONsolidated Standards of Reporting Trials [26]). 또한 보고 지침이 경험적 연구의 보고 품질을 상당히 개선한다는 증거(evidence)도 있다 [27].

 

델파이 기법의 목적(objective)(예: 합의 형성[15,17] 또는 예측[11])은 보건 과학의 하위 분야 간에(그리고 내에서도) 다양하며, 델파이 과정의 설계(design), 예를 들어 그룹 크기(group size)와 이질성의 수준(level of heterogeneity) 또는 지식의 유형(type of knowledge)(전문성의 수준)과 그것이 질문되는 방식(how it is asked for)을 결정한다 [28]. 보건 과학 부문의 델파이 연구를 위한 보고 지침에 대해 다양한 제안이 있다; 하나는 이미 EQUATOR 네트워크에 게시되었다 [21]. 그러나 이러한 지침들이 하위 분야의 경계(subfield boundaries)를 넘어 적용 가능한지, 예를 들어 영양학(nutrition science)과 같은 더 자연과학적인 분야(natural science fields)와 건강 사회학(sociology of health)과 같은 더 사회과학적인 분야(social science fields)를 생각할 때 적용 가능한지는 여전히 불분명하다. 이전에 게시된 한 보고 지침은 오직 완화 의료(palliative care) 연구와 그들의 주된 목적인 합의 형성(consensus building)에만 기초하고 있다 [21]. 하위 분야별 차이(Subfield-specific differences)는 델파이 과정의 다른 매개변수(parameters), 예를 들어 합의 수준(level of consensus) 결정에서도 관찰될 수 있다. 의학 지침(medical guidelines)을 개발할 때는 합의 수준이 정의되지만 [29], 다른 목적과 분야에서는 합의 지표(consensus indicators)에 대한 권고가 존재하지 않는다 [4]. 보건 과학에서 합의는 주로 백분율 일치(percentage agreement) 측면에서 정의되지만, 중심 경향(central tendency), 공식적인 일치도 척도(formal measure of agreement)(예: 크론바흐 알파 Crohnbach’s alpha, 켄달의 W Kendal’s W) 또는 여러 척도의 조합(combination of several measures)으로 정의되기도 한다 [7,8].

 

보건 과학 전반에 걸쳐 방법(질적 또는 양적)의 사용(use) 및 평가(valuation)와 데이터 분석(analysis of data)(예: 척도 길이에 따른 통계적 검정, 개방형 질문 응답 분석 절차)과 관련하여 광범위한 변이(broad variation)가 존재한다 [30]. 이러한 서로 다른 연구 접근법(research approaches)들은 서로 다른 과학 이론(theories of science)과 지식 문화(knowledge cultures)(예: 자연과학 대 사회과학)에 고정되어(anchored) 있기 때문에 인식론적 기반(epistemological grounding)에서도 차이가 난다 [31–34]. 이는 델파이 기법에도 동일하게 적용된다. 일반적으로 델파이 기법은 서로 다른 인식론적 전통(epistemological traditions)에 뿌리를 두고 있으며, 이러한 인식론적 기반은 적용되는 델파이의 특정 유형(specific type)에 따라 달라진다 [23,32,35]. 따라서 보고 지침은 이러한 다양성(diversity)을 고려해야 한다. 이 연구의 목표(aim)는 기존 보고 지침들의 유사점(similarities), 차이점(differences), 그리고 특히 인식론적 및 방법론적 측면(epistemological and methodological aspects)에 관한 가능한 단점(possible shortcomings)을 식별하고, 보건 과학 부문에서 포괄적으로 적용 가능한(comprehensively applicable) 보고 지침을 위한 초기 제안(initial proposal)을 초안하는 것이다.

방법론적 접근 (Methodical approach)

우리는 보건 과학 분야 델파이 기법에 대한 기존 보고 지침을 분석하기 위해 방법론적 검토(methodological review)를 수행했다. 이에 대해 아직 게시된 보고 지침이 없으므로, 우리는 보고를 위한 지침(guidance)으로 PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-analysis) 성명서를 사용했다 [36]. 이 리뷰는 사전 등록(pre-registered)되지 않았으며 연구 프로토콜(study protocol)은 이용할 수 없다. 우리의 방법론적 검토를 위해 PRISMA 성명서에 포함된 모든 주제와 제안된 분석(데이터 항목의 사전 정의, 연구 비뚤림 위험 평가, 효과 척도, 정량적 합성 방법 및 결과(예: 민감도 또는 하위 그룹 분석, 요약 척도, 메타 회귀), 확실성 평가, 등록 및 프로토콜)을 적용하는 것은 불가능했는데, 이는 주로 검토된 데이터 유형(datatypes), 귀납적 접근(inductive approach), 그리고 연구의 방법론적 초점(methodological focus)에 대한 지침의 적합성(accuracy of fit) 때문이었다.

문헌 검색 - 보고 지침의 식별 (Literature search - Identification of the reporting guidelines)

보건 과학 분야 델파이 기법에 대한 기존 보고 지침의 식별(identification)은 다섯 가지 다른 방식으로 이루어졌다. 표 1은 개요(overview)를 제공한다.

 

  • 1. 델파이 연구의 보고 관행(reporting practices)에 대한 개요 [5]를 작성하기 위해, 저자 중 두 명(MN, JS)은 2019년에 보건 과학 분야 델파이 연구의 체계적 문헌 고찰을 식별했다. 이번 연구를 위해, 개요에 포함된 리뷰들(n=12)을 저자 중 두 명(MN, JS)이 독립적으로 전문 스크리닝(full text screening)을 사용하여 보고 지침에 대해 검색했다. 보고에 대한 권고(recommendations on reporting)가 없는 리뷰는 제외되었다.
  • 2. 한 명의 저자(JS)가 보충 검색(supplemental search)을 수행했다. 초기 검색에서 139건의 결과(hits)가 나왔고, 이를 한 명의 저자(JS)가 제목과 초록(titles and abstracts)을 바탕으로 연구의 방법론적 초점과 델파이 연구 보고에 대한 권고 여부를 스크리닝했다. 자신의 델파이 과정 결과(results of their own Delphi process)만 보고하는 것으로 보이는 일차 연구(Primary studies)는 제외되었다. 잠재적으로 관련성이 있다고 간주된 문헌들의 전문(full texts)은 한 명의 저자(JS)가 델파이 연구에 대한 보고 지침 여부를 스크리닝했다.
  • 3. 2021년 4월 21일, 과학적 델파이 전문가 네트워크(scientific Delphi expert network) (https://delphi.ph-sg.de/)는는) 사회 및 보건 과학을 위한 중앙 데이터 자원(Scopus, MEDLINE, CINAHL, Epistemonikos)에서 델파이 연구에 대한 문헌 검색을 수행했다. 독일어권 과학 네트워크 DeWiss는 다양한 하위 분야와 인식론적 배경을 가진 20명의 연구자로 구성되어 있으며, 인식론적 기초(epistemological foundations), 방법론적 이슈(methodological issues), 그리고 델파이 연구의 실행 및 보고를 위한 지침에 초점을 맞춘다. 문헌 검색의 목표는 1) 델파이 일차 연구(Delphi primary studies)와 2) 델파이 기법에 관한 방법론적 연구(methodological studies)에 대한 두 개의 데이터 자원(data resources)을 생성하는 것이었다. 데이터 자원 구축을 위한 포함 기준(inclusion criteria)은 아래에 간략히 기술되어 있다. 델파이 연구가 포함된 원저 논문(Original papers)들은 6명의 연구자(MN, SD, JS)와 델파이 네트워크의 연구원들(MT, LS, XS)이 제목-초록 스크리닝(title-abstract screening)을 통해 두 번째 검토자(second reviewer)의 검증 없이 두 데이터 자원에 배정했다. 총 155편의 논문이 방법론적 연구 데이터베이스(2)에, 7,044편의 논문이 델파이 일차 연구 데이터 자원(1)에 배정되었다. 이번 연구에서는 두 데이터 자원에서 하위 분석(sub-analysis)이 수행되었다. 방법론적 연구 데이터 자원(2)은 연구원(MT)이 델파이 연구 보고에 대한 권고 여부를 제목-초록 스크리닝을 통해 검색했고, 잠재적으로 관련성이 있다고 간주된 문헌의 전문은 저자 중 한 명(JS)이 스크리닝했다. 필터링된 델파이 일차 연구 데이터 자원(1)(표 1 참조)은 n=1,683편의 논문으로 산출되었다. 잠재적으로 관련성이 있다고 간주된 논문의 제목, 초록, 전문은 저자 중 한 명(JS)과 연구원(XS)이 독립적이지 않게(not independently) 보고 권고 사항에 대해 스크리닝했다. 자신의 델파이 과정 결과만 보고하는 것으로 보이는 연구는 제외되었다.
  • 4. 추가로, 저자들은 EQUATOR 네트워크 데이터 자원 검색을 수행했다. 한 명의 저자(JS)가 델파이 연구 보고에 대한 권고 여부를 확인하기 위해 검색 결과(hits)를 스크리닝했다.
  • 5. 우리는 또한 델파이 전문가 네트워크(DeWiss) 회원들이 자신의 연구 과정이나 과학적 네트워크를 통해 알게 된(come to attention) 논문들을 스크리닝 과정에 포함했다. 모든 저자가 제안된 논문들의 전문을 델파이 연구 보고에 대한 권고 여부를 확인하기 위해 스크리닝했다.

기존 보고 지침의 내용 분석 (Content analysis of existing reporting guidelines)

우리는 원고(manuscripts)에 포함된 모든 보고 권고 사항(reporting recommendations)을 포함하는 내용 분석(content analysis)을 수행했다 [37]. 이를 통해 우리는 두 가지 목표를 추구했다: 1) 보고 지침 내 차원(dimensions)의 범위(range)에 대한 개요를 제공하는 것; 2) 언급된 차원의 빈도(frequencies)를 드러내는 것. 여기서 내용 분석은 결과의 질적(qualitative) 및 양적(quantitative) 평가와 제시 모두에 적합하다 [37].

  • 첫 번째 단계에서, 두 명의 연구자(JS, AH)가 독립적으로 원문(original text)에 가깝게 모든 관련 텍스트 구절을 의역(paraphrased), 요약(summarized), 구조화(structured)했다. 그들은 텍스트 자료로부터 의역문(paraphrases)을 형성하고 그것들로부터 범주(categories)를 귀납적으로 결정(inductively determined)했다. 독립적인 절차는 가능한 한 많은 상호 주관성(intersubjectivity)을 달성하기 위한 것이었다 [36].
  • 두 번째 단계에서, 세 번째 연구자(MN)가 두 연구자의 범주 체계(category systems)를 비교하고 코딩이 엇갈리는 경우(divergent coding) 연구자들 간의 교환을 중재(moderated)했다. 목표는 두 범주 체계를 하나의 통합된 체계(unified system)로 합의하여 병합(consensually merge)하는 것이었다.
  • 세 번째 단계에서, 모든 의역문을 다시 검토하여 범주 체계에 분류(classified)했다. 또한 각 의역문이 어떤 출판물(publications)에 배정될 수 있는지도 기록했다. 일부 의역문은 특정 범주에 명확하게 배정될 수 없음이 드러났다. 이러한 경우, 연구 팀(JS, AH, MN)은 배정에 대해 담론적으로 합의(discursively agreed)했다. 빈도(frequency) 제시를 위해, 우리는 각 하위 범주(subcategory)(차원)에 대해 적어도 하나의 진술(의역문)을 포함하는 출판물의 수를 결정했다.

델파이 보고 지침을 위한 제안 (Proposal for a Delphi reporting guideline)

기존 보고 지침의 합성(synthesis)에 기초하고 델파이 기법의 인식론적 기초에 대한 델파이 전문가 네트워크의 토론을 배경으로 하여, 우리는 변형(variant), 목적(objective) 또는 하위 분야(subfield)에 관계없이 적용 가능한(applicable regardless of) 초기 델파이 보고 지침 제안(initial proposal for Delphi reporting guidelines)을 초안했으며, 분석된 델파이 연구 보고 권고 사항들의 가능한 한계점(limitations)을 성찰했다. 델파이 전문가 네트워크의 과학자들이 이 제안을 검토하고 동의(consented)했으며 보건 과학 내 하위 분야들에 대한 적용 범위(coverage)를 성찰했다.

 

결과 (Results)

문헌 검색 (Literature search)

우리는 보건 과학 부문(health science sector)에서 델파이 연구를 위한 보고 지침(reporting guidelines)이 담긴 총 10편의 논문을 식별했다(표 2 참조). 그림 1은 문헌 검색 결과의 개요를 보여준다.

 

개요 [5]에 포함된 12개의 리뷰 중 4개는 델파이 결과 보고에 대한 구체적인 권고 사항(specific recommendations)을 포함하고 있었다. 보충 검색(supplemental search)을 통해 하나의 추가 연구를 포함할 수 있었다. 델파이 전문가 네트워크의 두 가지 데이터 자원 내 검색을 통해 4편의 논문이 포함될 수 있었다. EQUATOR 네트워크 검색에서는 더 이상의 결과(hits)가 탐지되지 않았다. 표 2는 명시적으로 공식화된 보고 지침(explicitly formulated guidelines for reporting)을 포함하는 모든 출판물에 대한 개요를 제공한다. 델파이 연구 보고에 대한 권고 없이 자신의 델파이 과정 결과(results of their own Delphi process)만을 보고하는 연구들은 제외되었다(예: [38]).

내용 분석 (Content analysis)

우리는 귀납적으로(inductively) 9개의 주요 범주(main categories)를 형성했다:

  • 정당성(Justification), 전문가 패널(Expert panel), 설문지(Questionnaire), 조사 설계(Survey design), 과정 규제(Process regulation), 분석(Analyses), 결과(Results), 고찰(Discussion), 방법 성찰 및 윤리(Methods reflection & Ethics).

각 주요 범주는 2개에서 5개의 하위 범주(subcategories)를 가졌다. 의역(paraphrasing) 결과 하위 범주 내 측면(aspects)들의 범위가 상당히 다르다는 것을 보여준다.

 

빈도(frequencies)는 일부 하위 범주가 단일 보고 지침에 의해서만 다루어지고 있음을 보여준다(ID 번호는 표 2에 나열된 출판물 순서를 나타냄):

  • 참가자 모임(meeting of participants) (ID1),
  • 조사 방법의 진행(proceeding with the survey method) (ID7),
  • 결과의 이전(transfer of the results) (ID7),
  • 타당성 검증(validation) (ID7),
  • 비뚤림 방지(prevention of bias) (ID7).
  • 오직 “합의(consensus)”라는 하위 범주만이 검토된 10개의 모든 출판물에서 언급되었다.
  • 대부분의 보고 지침은
    • 연구 목적(study objective) (n=6 (ID1, ID3, ID4, ID6, ID7, ID9)),
    • 전문가 패널(expert panel) (전문가 선정 n=9 (ID1 제외한 모두) 및 패널 크기와 구성 n=9 (ID2 제외한 모두)),
    • 설문지 개발(development of the questionnaire) (n=7 (ID1, ID4-ID9)),
    • 라운드의 횟수 및 설계(number and design of rounds) (n=7 (ID1, ID3-ID7, ID10)),
    • 피드백 설계(feedback design) (n=7 (ID1, ID4-ID9)),
    • 응답률(response rate) (n=6 (ID3, ID4, ID6-ID9)), 그리고
    • 결과가 제시되는 형식(form in which the results are presented) (n=7 (ID1, ID3, ID4, ID6-ID9))을 언급한다.
  • 그러나 델파이 기법의 인식론적 기초(epistemological foundations)에 대한 성찰은 오직 하나의 출판물(ID7)에서만 언급되며, 그마저도 델파이 기법의 구성주의적 성격(constructivist character)에 대한 사소한 언급(minor reference)에 불과하다(표 3 참조).

표 3 범주 체계 (Category system). 1 이 하위 범주가 언급된 출판물(표 2)의 수를 나타냄; 2 ID 번호는 표 2에 나열된 출판물 순서를 나타냄.

Table 3: 범주 체계 (Main Category 및 상세 내용)

I. 정당성 (Justification)
  • 내용: 보고 지침은 연구 질문이나 델파이 기법의 목적, 근거 기반(evidence base)이 어떻게 고려되었는지에 대한 질문, 그리고 델파이 기법을 선택한 정당성에 대한 공개를 요구한다.
  • 하위 범주: 근거(Rationale), 연구 목적(Study objective), 델파이 방법 설명(Explanation of the Delphi method), 주제에 대한 증거(Evidence on the topic)
II. 전문가 패널 (Expert panel)
  • 내용: 전문가 선정, 구성, 표본 크기, 접근 방식, 익명성 처리 및 필요한 배경 정보에 대해 보고할 것이 권장된다.
  • 하위 범주: 전문가 선정(Expert selection), 전문가 모집(Expert recruitment), 익명성(Anonymity), 패널 크기 및 구성(Panel size and composition), 제공된 자료(Provided materials)
III. 설문지 (Questionnaire)
  • 내용: 조사 도구를 기술할 것이 권장된다. 이는 구조, 범위, 그리고 항목(item)이 공식화된 기초가 되는 연구 질문에 관한 것이다.
  • 하위 범주: 설문지 개발(Questionnaire development), 설문지 데이터(Questionnaire data)
IV. 조사 설계 (Survey design)
  • 내용: 라운드 횟수의 표시와 피드백 설계의 제시가 권장되며, 부분적으로는 델파이 절차의 기간(소요 시간)과 종료 기준도 권장된다.
  • 하위 범주: 라운드(Rounds), 참가자 모임(Meeting of participants), 피드백 설계(Feedback design), 중단 기준(Stopping criterion), 기간(Duration)
V. 과정 규정 (Process regulation)
  • 내용: 부분적으로 조사 방식(survey mode)과 항목 개발을 위한 기준이 공식화된다. 일부 보고 지침은 다양한 델파이 라운드에 대한 전문가 패널의 성찰, 특히 반대 의견(dissent)의 관점에서의 성찰과 사전 테스트(pretest)에 대한 정보를 나열한다.
  • 하위 범주: 사전 테스트(Pretest), 데이터 수집(Data collection), 항목 진행(Proceeding with items), 무응답자 처리(Proceeding with non-responders), 조사 방법의 진행(Proceeding with the survey method)
VI. 분석 (Analyses)
  • 내용: 모든 보고 지침은 합의(consensus)의 정의와 처리를 요구한다.
  • 하위 범주: 데이터 분석 방법(Methods of data analysis), 합의의 정의 및 처리(Definition and dealing with consensus), 반대 의견 처리(Dealing with dissent)
VII. 결과 (Results)
  • 내용: 보고 지침은 응답률의 공개와 다양한 델파이 라운드에 따라 차별화된 결과의 제시를 요구한다. 흐름도(flowchart)와 같은 그래픽 형태의 방법론적 절차 제시도 권장된다.
  • 하위 범주: 응답률(Response rate), 결과 보고(Reporting results), 전체 과정 보고(Reporting the overall process)
VIII. 고찰 (Discussion)
  • 내용: 데이터가 해석되고 다른 용도가 논의된다. 결과의 확산(dissemination)과 추가 연구의 필요성이 식별되어야 한다.
  • 하위 범주: 결과 해석(Interpretation of results), 결과의 이전/적용(Transfer of the results), 확산 계획(Dissemination plan), 추가 연구(Further research)
IX. 방법론적 성찰 및 윤리 (Methods reflection & Ethics)
  • 내용: 결과는 데이터의 품질과 가능한 한계 또는 비뚤림(biases)과 관련하여 논의되어야 한다. 일부 보고 지침에서는 보고서에 응답자의 익명성이 어떻게 처리되었는지, 그리고 조사 과정에서 윤리적 측면이 고려되었는지를 공개할 것을 권장한다.
  • 하위 범주: 타당성 검증(Validation), 타당도/신뢰도(Validity/Reliability), 한계점 고찰(Discussion of limitations), 비뚤림 방지(Prevention of bias), 추가적 윤리 문제(Further ethical issues)

 

델파이 보고 지침을 위한 제안 (Proposal for a Delphi reporting guideline)

포괄적인 델파이 보고 지침(comprehensive Delphi reporting guideline)을 준비하는 데 있어 과제는 델파이 변형(Delphi variants)의 다양성과 델파이 기법의 각각의 수정 사항(modifications)을 고려하는 것이다. 우리는 델파이 전문가 네트워크의 다른 과학자들을 참여시켜, 인식론적 논의(epistemological discussion)와 기존 보고 지침의 합성(synthesis)을 바탕으로 그림 2에 델파이 보고 지침을 위한 초기 제안(initial proposal)을 공식화했다. 이 기준들은 변형, 목적 또는 하위 분야에 관계없이(regardless of variant, objective or subfield) 델파이 연구를 보고하는 데 있어 핵심적인(central) 것으로 보인다.

 

그림 2 보건 과학 분야 델파이 기법에 대한 보고 지침 제안 (Proposal for reporting guidelines on Delphi techniques in the health sciences).

그림 2. 보건 과학 분야 델파이 기법에 대한 보고 지침 제안 (Proposal for reporting guidelines on Delphi techniques in the health sciences).

  • I. 제목 및 초록 (TITLE AND ABSTRACT): 
    • 이것은 제목과 초록에서 연구를 델파이 과정(Delphi process)으로 식별하는 것(identification)과 연구의 구조화된 요약(structured summary)을 포함한다.
  • II. 인식론 (EPISTEMOLOGY): 
    • 이것은 과학 이론(theory of science)의 특정 흐름(specific strand)(실재론자(realist) 또는 구성주의자(constructivist))에 대한 위치 선정(positioning)과 목적(objective)의 공식화(formulation) 및 예비 가정(preliminary assumptions)에 대한 진술(statement), 예를 들어, 가능한 상충하는 관점(conflicting perspectives)에 대한 진술을 의미한다(refers to).
  • III. 공식적 맥락 (FORMAL CONTEXT): 
    • 이것은 프로젝트를 수행하는 연구팀(research team)에 대한 정보와 프로젝트 배경(project background)(예: 자금 제공자(funder) 또는 프로젝트 맥락의 목적(objective of the project context), 연구 프로토콜(study protocol), 윤리 위원회 표결(ethics committee vote))에 대한 기타 핵심 정보(key information)를 포함한다.
  • IV. 지식 기반 (KNOWLEDGE BASE): 
    • 이것은 현재 연구 상태(current state of research), 즉 증거 기반(evidence base)의 고려(consideration) 또는 통합(integration)에 대한 정보를 포함한다. 또한 지정된 응답자들(designated respondents)이 그것을 인지하고 있는지(aware of it), 혹은 그들이 필요한 맥락(necessary contexts)을 인지하고 있는지 어떻게 보장할 수 있는지(how it can be ensured), 또는 그들이 그것에 대해 정보를 받았는지(informed about them), 그리고 그들이 어떤 사회적 맥락(social context)에 위치해 있는지도 표시되어야 한다(indicated).
  • V. 지식 및 지식 통합 (KNOWLEDGE AND KNOWLEDGE INTEGRATION): 
    • 이것은 특히, 각각의 연구 질문(respective research question)에 답하기 위해 어떤 종류의 지식 축적(knowledge stocks)과 경험(experiences)이 적절한지(relevant), 어떤 관점(perspectives)이 필요한지(necessary)에 대한 명세(specification)와, 서로 다른 지식 축적들이 잠재적으로 어떻게 가중치(weighted)가 부여되고 어떻게 함께 결합되는지(brought together)에 관한 것이다.
  • VI. 델파이 변형 및 연구 과정에서의 역할 (DELPHI VARIANT AND ROLE IN RESEARCH PROCESS): 
    • 어떤 델파이 변형(Delphi variant) 또는 어떤 수정(modification)이 선택되었는지(chosen)와 그것들이 연구 과정(research process)에 어떻게 위치하는지(situated)에 대한 진술(Statement)  정당화(justification).
  • VII. 표본 (SAMPLE): 
    • 이것은 식별(identification), 모집(recruitment), 지식 기반(knowledge base), 사회인구학적 데이터(sociodemographic data), 사례 수(number of cases)(라운드별 포함)와 관련된 전문가 패널(expert panel)에 대한 포괄적인 기술(comprehensive description)을 포함하며, 필요한 경우 거부자(refusers)나 중도 탈락자(dropouts)를 모집하거나 다루는 방법(dealing with)을 포함한다. 익명성(anonymity)의 처리(handling) 또한 보고되어야 한다.
  • VIII. 조사 도구 (SURVEY INSTRUMENT): 
    • 조사 도구는 범위(scope), 구조(structure), 질문 또는 항목(questions or items)의 도출(derivation)  테스트(testing), 개방형 및 폐쇄형 질문(open and closed questions)의 비율(ratio), 통합된 척도 유형(integrated scale types), 그리고 그래픽 디자인(graphic design) 측면에서 기술되어야 한다.
  • IX. 델파이 라운드 (DELPHI ROUNDS): 
    • 이것은 델파이 라운드의 횟수(number of Delphi rounds)뿐만 아니라 종료 기준(termination criterion)의 공개(disclosure)를 포함한다.
  • X. 피드백 (FEEDBACK): 
    • 피드백의 통계적 및 그래픽적 표현(statistical and graphic representation)의 공개(라운드별 포함).
  • XI. 평가 (EVALUATION): 
    • 이것은 합의(consensus)의 정의(definition)  다루기(dealing with), 그리고 양적 및 질적 평가 전략(quantitative and qualitative evaluation strategy)의 공개, 그리고 또한 이 두 가지 측면이 어떻게 가중치(weighted)가 부여되고 결합되는지(combined)를 포함한다.
  • XII. 결과 (RESULT): 
    • 델파이 과정(Delphi process)(응답(response), 절차(procedure), 수정(modifications))과 개별 델파이 라운드의 결과(results)가 제시되어야 한다. 필요한 경우, 과정 중에 특정 요소(specific elements)가 왜 변경되었는지(changed) 이유(reasons)가 제시되어야 한다. 전체 절차(complete procedure)는 흐름도(flowchart) 등으로 그래픽적으로(graphically) 제시되어야 한다.
  • XIII. 데이터 및 해석의 품질 (QUALITY OF DATA AND INTERPRETATION): 
    • 이것은 데이터 수집(data collection) 및 평가 과정(evaluation process)의 품질에 대한 성찰(reflection)을 포함한다. 양적 또는 질적 연구를 위한 품질 기준(Quality criteria)은 인식론적 위치(epistemological positioning)와 특정 델파이 변형(specific Delphi variant)에 따라 적용되어야 한다(applied).
  • XIV. 고찰 및 결과의 한계점 (DISCUSSION AND LIMITATIONS OF THE FINDINGS): 
    • 이것은 인식론적 기반(epistemological basis)에 따라 결과(findings)의 타당성 주장(validity claim)에 대한 비판적 성찰(critical reflection)을 의미한다(refers to).
  • XV. 확산/배포 (DISSEMINATION): 
    • 델파이 연구 이후(beyond the Delphi study) 결과가 어떻게 가공되거나(processed) 사용될지(used)에 대한 진술.

 

고찰 (Discussion)

여기서 분석된 보고 지침은 보건 과학 분야의 델파이 연구와 관련이 있다. 식별된 어떤 보고 지침도 전체 델파이 과정(entire Delphi process)이나 델파이 변형의 스펙트럼(spectrum of Delphi variants) 또는 다양한 보건 과학 하위 분야에서의 가능한 적용(possible applications)을 포괄한다고 주장하지 않는다. 결과적으로 기준들은 엇갈리며(divergent), 오직 합의(consensus)라는 측면만이 모든 보고 지침에서 나타난다. 어떤 경우에는 보고 지침의 정보가 정보가 델파이 기법의 시작(beginning), 과정(process) 또는 결과(results) 중 어디를 참조하는지 명시되지 않아 부정확하게 공식화(imprecisely formulated)되어 있다. 특히 전문가 패널이나 설문지에 대한 정보는 델파이 연구 도중에 변경될 수 있다. 때로는 방법론적 결정(methodological decisions)이 언제 내려지거나 정의되어야 하는지가 불분명한 채로 남아있다. 이는 특히 선험적(a priori) 또는 후험적(a posteriori)으로 이루어질 수 있는 합의 정의(consensus definition)와 관련된다.

 

검토된 보고 지침들은 익명성 유지(maintaining anonymity)나 다수 완료된 라운드(multiple completed rounds)와 같은 보다 전통적인 접근법(traditional approach)을 따르는 델파이 연구들을 기초로 개발되었다. 따라서 서론 부분에서 기술된 델파이 변형의 다양성(variety of Delphi variants)은 충분히 고려되지 않았다. 이는 그룹 델파이(group Delphi)에서의 익명성이나 실시간 델파이(real-time Delphi)에서의 라운드 기반 원칙(round-based principle)과 같은 델파이 기법의 핵심 특성(core characteristics)을 일부 델파이 변형들이 해체(break up)하기 때문에 비판적이다. 즉, 어떤 경우에는 서로 다른 델파이 변형들에 대해 다른 측면들이 보고되어야 함을 의미한다 [9,21]. 그러나, 예를 들어 의학 분야의 고전적인 델파이 연구(classical Delphi studies) [7]에서조차 델파이 기법이라고 명명된 연구들에서 반복적인 라운드(iterative rounds)와 피드백 수령(receiving of feedback)과 같은 델파이 과정의 기본적인 방법론적 특성이 항상 주어지는 것은 아니다. 연구 목표(research goal)와 관련하여, 의료 분야에서 델파이 연구는 특히 합의를 도출하기 위해 수행되지만 [5–7], 서론에서 기술된 바와 같이 델파이 기법은 다양한 목적(variety of objectives)에 적용 가능하다 [5,28]. 포괄적인 보고 지침은 서로 다른 하위 분야별 목적을 가진 델파이 연구들을 품질(quality) 측면을 포함하여 비교 가능하게(comparable) 만들 수 있다. 마찬가지로, 이는 가능한 적용의 다양성과 과정의 복잡성(complexity of the process)을 강조할 수 있다. 델파이 과정은 준비(preparing), 수행(conducting), 분석(analyzing)의 여러 단계를 포함하므로 단일 단계 조사 절차(single-stage survey procedures)보다 더 복잡하고 시간이 많이 소요된다. 따라서 델파이 과정에만 최소 16주가 권장되며, 과학 원고(scientific manuscript) 작성을 위해 추가로 6주에서 10주가 소요된다 [28].

 

또한, 델파이 기법 전반에 대한, 그리고 특정하게 적용된 델파이 변형에 대한 인식론적 기초(epistemological foundations)에 관한 논의는 종종 무시되며(neglected) 기존 보고 지침에서 적절하게 고려되지 않는다(표 3 참조). 한 가지 이유는 실무적 시사점(practical implications)이 직접적으로 도출되지 않기 때문일 수 있다. 그러나 델파이 기법이 비판적 합리주의(critical rationalism)를 따르는 실재론적 관점(realist perspective)에 기초하는지, 아니면 구성주의적 관점(constructivist perspective)에 기초하는지에 대한 질문은 델파이 과정과 그 결과의 품질 평가(evaluation of the quality)에 적절하다(relevant). 우리는 비판적 합리주의가 자연과학(natural sciences)에서 더 널리 퍼져 있고, 구성주의가 사회과학(social sciences)에서 더 널리 퍼져 있다고 가정한다. 이는 다음을 의미한다:

  • 비판적 합리주의 [34]에 따르면, 델파이 기법은 응답자 그룹의 피드백을 통해 편향되었을 가능성이 있는(possibly biased) 전문가 판단을 수정함으로써 "참된" 혹은 객관적 지식(“true” or objective knowledge)의 근사치(approximation)를 산출할 수 있어야 한다. 따라서 참가자들 간의 합의는 "참된" 지식의 근사치로 해석될 수 있다.
  • 구성주의적 관점 [33]에서는 "참된" 지식은 없으며, 사회적 상호작용(social interactions) 속에서 생산되고, 적용되며, 더 발전되는 "상황에 위치한" 지식(“situated” knowledge)만이 존재한다.

예를 들어, Campbell [39]은 델파이 기법에 대한 방법론적 연구에서 일차 정신 건강 관리(primary mental health care) 분야의 서로 다른 이해관계자 패널(stakeholder panels)이 "진료 품질(quality of care)에 대해 다양한 견해(diverse views)를 가지고 있으며 이러한 차이가 품질 지표(quality indicators)를 평가하는 방식으로 이어진다" [39]는 것을 보여주었다. 구성주의적 관점에서 볼 때 이는 놀라운 일이 아니며 문제로 간주되지도 않을 것이다. 그러나 비판적 합리주의 관점에서는 이것이 합의를 수립하고 "참된" 값에 근접하는 것과 관련하여 실패(failure)로 간주될 수 있다. 따라서 인식론적 관점(epistemological perspective)에 따라, 각각의 델파이 결과의 품질에 대해 정반대의 결론(opposite conclusions)에 도달할 수 있다.

 

결론적으로 보고 지침은 연구자들이 주요 가정(key assumptions)방법론적 선택(methodological choices), 그리고 결과가 해석되는 기초가 되는 인식론적 기초를 성찰하고 공개(disclose)하도록 장려한다. 새롭게 개발된 델파이 보고 지침 제안(그림 2 참조)의 기준들은 서로 완전히 독립적인 것으로 보여서는 안 된다. 방법론적 관점에서 그것들은 밀접하게 상호 연관되어 있으며(closely interrelated) 일관된 틀(coherent frame)을 형성해야 한다. 이는 특히 인식론적 위치(epistemological positioning)의 적합성(fit), 질적 또는 양적 측면의 가중치(weighting), 그리고 품질 기준(quality criteria)과 관련이 있다. 모든 기준과 관련하여, 델파이 기법 중 정의(definition) 또는 결정(determination)의 시점(time)을 공개하는 것 또한 중요하다. 더 나아가, 모든 기준은 개별 델파이 라운드 전체에 걸쳐 반영되어야 한다.

한계점 (Limitations)

이 연구와 관련하여 적어도 세 가지 잠재적 한계점(potential limitations)이 있으며, 여기서 언급되어야 한다.

  • 논문의 스크리닝과 포함은 부분적으로 단일 연구자(single researcher)의 결정에 기초했다. 자원상의 이유(resource reasons)로 인해, 내용 분석에 적용되었던 것과 같은 다수 연구자의 독립적인 평가(independent assessment)가 모든 단계에서 가능하지는 않았다. 델파이 전문가 네트워크로부터의 추가적인 권고 포함은 이러한 한계를 고려하고 연구 분야에서 놓쳤을 가능성이 있는 주요 논문들에 주의를 환기해야 한다.
  • 또한, 이 델파이 보고 지침 제안은 국제적 대표성(international representativeness) 측면에서 가정될 수 없다. 분석된 지침이나 델파이 전문가 네트워크 모두 이러한 요건을 충족할 수 없었다. 그러나 저자 그룹 및 델파이 전문가 네트워크는 델파이 기법 적용(예: 다양한 델파이 변형과 관련하여)에 있어 다양한 하위 분야와 경험 범위를 가진 전문가들로 구성되어 있다. 이 점에 있어서 전문성의 이질성(heterogeneity of expertise)은 고려되었다.
  • 마지막으로, 방법론적 검토(methodological reviews)를 위한 적절한 보고 지침과 사전에 게시된 연구 프로토콜(a priori published study protocol)이 있었다면 연구의 보고 및 수행이 개선되었을 수 있다.

결론 (Conclusion)

이 방법론적 검토는 보건 과학 분야 델파이 연구에 대한 기존 보고 지침의 개요를 제공한다. 내용 분석은 기준(criteria)과 상세 수준(level of detail) 모두에서 지침들이 매우 다양하다(vary widely)는 것을 보여준다. 대부분의 보고 지침은 합의 정의, 전문가 패널, 응답(response), 피드백 설계, 그리고 라운드 횟수에 대한 보고를 명시적으로 다룬다. 그러나 예를 들어 서로 다른 델파이 변형 및 목적과 관련하여 차별화(differentiation)가 부족하다. 특히 절차의 품질을 평가하고 수집된 데이터를 분류하는 데 핵심적임에도 불구하고, 인식론적 원칙(Epistemological principles)은 지금까지 무시되어 왔다. 기존 보고 지침의 합성과 인식론적 질문을 특별히 고려한 다양한 하위 분야 전문가들과의 토론을 바탕으로, 우리는 보건 과학을 위한 포괄적인 보고 지침(comprehensive reporting guideline)의 초기 제안을 개발했다. 우리의 방법론적 검토 결과는 최종적인 보고 지침을 제공하는 것은 아니지만, 델파이 기법의 품질을 향상시키는 데 있어 중요한 단계(important step)이다. 서로 다른 기준들은 (전문가 담론(expert discourse) 안에서) 더 차별화될 필요가 있다.

 

 

Acad Med2017 Oct;92(10):1491-1498. doi: 10.1097/ACM.0000000000001812.

The Use of the Delphi and Other Consensus Group Methods in Medical Education Research: A Review

 

 

안녕하세요! 오늘은 의학 교육 연구자라면 한 번쯤은 들어보셨거나, 직접 사용해보셨을 '합의 그룹 방법(Consensus Group Methods)'에 대한 아주 중요한 리뷰 논문을 소개해드리려고 해요. 연구를 하다 보면 명확한 근거(Empirical evidence)가 부족할 때가 있죠? 그럴 때 전문가들의 의견을 모으는 델파이 기법(Delphi method)이나 명목 집단 기법(NGT)을 많이 활용하시는데요.

과연 우리는 이 방법들을 '제대로' 사용하고 있을까요? 🤔

1. 왜 이 연구를 했을까요? 🧐

의학 교육 분야는 '집단 지성'이 필요한 경우가 참 많아요. 교육과정을 개발하거나 역량을 정의할 때 특히 그렇죠. 그래서 합의 방법(Consensus methods)이 인기가 많습니다. 하지만 연구진은 의문을 가졌습니다. "다들 많이 쓰긴 하는데, 표준화(Standardization)는 되어 있나? 보고는 제대로 하고 있나?" 하고요.

연구진은 총 257편의 논문을 분석했습니다. 그리고 꽤 놀라운(혹은 걱정스러운) 결과들을 발견했죠.

2. 무엇이 문제였을까요? 🚧

논문에서 지적한 주요 문제점들을 콕콕 집어 드릴게요.

① 용어가 뒤죽박죽이에요 😵

연구마다 사용하는 용어가 제각각이었습니다. 수정 델파이(Modified Delphi), 델파이(Delphi), NGT 등이 혼재되어 있고, 심지어 초록과 본문에서 다른 용어를 쓰는 경우도 있었다고 해요. 가장 심각한 건, 델파이의 핵심은 '반복(Iteration)'인데, 설문 조사를 딱 한 번만 하고서 델파이라고 부른 연구가 3분의 1이나 되었다는 점입니다. 연구진은 이에 대해 단호하게 말합니다.

"우리는 이러한 연구 설계는 합의 그룹 방법으로 간주되어서는 안 된다고 주장합니다. 왜냐하면 반복은 합의 방법의 핵심 특징이기 때문입니다."

"We argue that such a study design should not be considered a consensus group method, as iteration is a key feature of consensus methods."

② 기본적인 정보가 빠져 있어요 📝

연구의 신뢰도를 높이려면 투명한 과정 공개가 필수죠. 하지만 많은 논문에서 다음 내용들이 누락되었습니다.

  • 참가자에게 준 배경 정보(Background information): 연구 시작 전 전문가들에게 어떤 자료를 줬는지 설명한 논문은 27.2% 뿐이었어요.
  • 문헌 고찰(Literature review): 설문 문항을 만들기 위해 문헌 고찰을 했다고 밝힌 논문은 약 70%였습니다. 나머지 30%는... 글쎄요?

③ 참가자가 사라져요? (응답률 미기재) 👻

1라운드, 2라운드를 거치면서 참가자가 얼마나 남았는지 알려줘야 하는데, 2라운드 참가자 수를 보고한 논문은 겨우 50.2%였습니다. 누가 합의에 참여했는지 모르면 결과를 신뢰하기 어렵겠죠.

④ '합의'의 기준이 없어요 🚩

이게 가장 큰 문제일 수 있는데요. 도대체 몇 퍼센트가 동의해야 '합의'된 것으로 볼 것인지 사전에 정의(defined a priori)한 논문은 43.2%밖에 없었습니다. 기준이 없으면 연구자가 입맛대로 결과를 해석할 위험이 있으니까요.


3. 연구진의 핵심 메시지 📢

결과적으로 연구진은 의학 교육 연구에서 합의 방법이 다소 엉성하게 보고되고 있다고 지적합니다. 이들의 쓴소리를 직접 들어볼까요?

"의학 교육 연구들은 사용된 방법에 관한 충분한 세부 사항을 일관되게 제공하지 않아 과학적 신뢰성 결여로 이어집니다."

"Medical education studies do not consistently provide sufficient detail regarding the methods used, leading to a lack of scientific credibility."

 

그렇다면 우리는 어떻게 해야 할까요? 연구진은 명확한 해법을 제시합니다.

"합의 방법에 대한 합의의 부재는 연구자들이 자신들이 사용한 방법에 대해 명확하고 상세한 보고를 제공하고 이러한 선택을 정당화하는 것을 필수적으로 만듭니다."

"The lack of consensus on consensus methods makes it imperative that researchers provide clear and detailed reporting of the methods they used and that they justify these choices."


💡 요약 및 제언

앞으로 델파이 기법이나 합의 그룹 방법을 사용하여 논문을 쓰실 계획이라면, 이 논문이 지적한 체크리스트를 꼭 확인해보세요!

  • 반복(Iteration) 과정을 거쳤는가? (단발성 설문 X)
  • 문헌 고찰과 참가자에게 제공한 배경 정보를 명시했는가?
  • ✅ 각 라운드별 참가자 수(응답률)를 투명하게 공개했는가?
  • ✅ 익명성(Anonymity)과 피드백(Feedback) 절차를 기술했는가?
  • ✅ 무엇을 '합의'로 볼 것인지 사전 정의(Pre-determined definition)를 했는가?

방법론이 탄탄해야 연구 결과도 빛이 나는 법이니까요! ✨

 


합의 그룹 방법(Consensus group methods)은 비즈니스, 공공 정책, 과학 및 기술, 그리고 의학, 간호학, 보건 서비스 분야의 보건 의료 연구(health care research)를 포함한 여러 탐구 분야(fields of inquiry)에서 광범위하게 사용됩니다. 이러한 방법들의 인기에도 불구하고, 의학 교육 연구(medical education research)에서 이들이 어떻게 사용되는지에 대해서는 비판적 관심(critical attention)이 거의 기울여지지 않았습니다. 추가적인 분석 없이는, 우리는 이러한 방법들이 적절하게 사용되고 있는지 알 수 없습니다. 합의 방법(Consensus methods)은 합의를 측정하고 개발하기 위한 체계적인 수단(systematic means)으로 정의됩니. 이들은 경험적 증거(empirical evidence)가 부족하거나, 제한적이거나, 모순될 때 특히 유용합니다. 합의 방법은 전문가 패널(panel of experts)에게 자문을 구하고 그룹의 합의(group consensus)를 수용함으로써 정확하고 신뢰할 수 있는 평가를 가장 잘 달성할 수 있다는 전제(premise)에 기초합니다. 의학 교육(medical education)에는 높은 수준의 불확실성(high levels of uncertainty)과 제한적인 증거 기반 문헌(evidence-based literature)으로 인해 어려움을 겪는 몇 가지 중요한 탐구 영역이 있습니다. 결과적으로, 합의 방법은 의학 교육자들에게 특히 관련이 깊은데, 이는 종종 암묵적(tacit)이고 말로 표현하거나 공식화하기 어려운 직업적 집단 지성(collective knowledge)을 추출할 수 있는 추정된 능력 때문입니다.

 

흔히 사용되는 두 가지 합의 방법은 델파이 기법(Delphi method)명목 집단 기법(nominal group technique, NGT)입니다. RAND Corporation과 UCLA David Geffen 의과대학에서 개발한 세 번째 방법인 RAND는 델파이와 NGT 방법의 하이브리드(hybrid)입니다. Table 1은 이 세 가지 접근 방식 간의 차이점 중 일부를 강조합니다.

 

 

델파이 기법(Delphi method)은 6단계를 포함합니다:

  • (1) 연구 문제(research problem) 식별,
  • (2) 문헌 검색(literature search) 완료,
  • (3) 진술 설문지(questionnaire of statements) 개발,
  • (4) 익명의 반복적 우편 또는 이메일 설문 라운드(anonymous iterative mail or e-mail questionnaire rounds) 수행,
  • (5) 라운드 간 개인 및/또는 그룹 피드백(feedback) 제공,
  • (6) 결과 요약.

이 과정은 최선의 합의 수준(best possible level of consensus)에 도달하거나 미리 정해진 라운드 횟수가 완료될 때까지 반복됩니다. 참가자들은 결코 직접 만나거나 상호작용하지 않습니다. 델파이 기법의 장점은 지리적으로 분산된(geographically dispersed) 많은 수의 참가자를 포함할 수 있는 능력, 상대적으로 최소한의 지원 구조 필요성(따라서 비용이 상대적으로 저렴함), 그리고 익명성(anonymity)을 통해 특정 개인에 의한 부당한 지배(undue dominance)를 방지한다는 점입니다. 반대로, 델파이 기법에 적용될 수 있는 수정(modifications)의 수는 그 적용과 결과(outcomes)를 둘러싼 상당한 혼란을 야기했습니다.

 

NGT는 보통 5~12명의 참가자가 참여하는 구조화된 대면 상호작용(structured face-to-face interaction)입니다. 이는 다음 단계들을 갖습니다:

  • (1) 명목 질문(nominal question)의 공식화 및 제시,
  • (2) 개인적 아이디어 생성(private idea generation),
  • (3) 각 아이디어를 기록하기 위한 그룹 구성원들의 라운드 로빈 피드백(round-robin feedback),
  • (4) 숙련된 중재자(skilled moderator)와의 구조화된 그룹 토론,
  • (5) 후속 개인 순위 매기기(private ranking),
  • (6) 전체 그룹에 대한 익명 피드백.

합의에 도달하기 위해 필요한 경우 추가적인 그룹 토론과 비공개 투표(private voting)가 이루어질 수 있습니다. NGT의 주요 장점은 합의가 부족한 주제를 논의하고 토론할 수 있는 잠재력과 더 강력한 아이디어 생성(more robust idea generation)의 기회입니다. 단점은 참가자 수가 적다는 것과 지배적인 참가자(dominant participants)가 그룹에 부당하게 영향을 미칠 수 있다는 점입니다.

 

RAND 접근법은 델파이 기법처럼 시작하지만 이후에 대면 회의(face-to-face meeting)를 포함하는 하이브리드(hybrid)입니다.

  • 장점으로는 지리적으로 분산된 그룹을 조사할 수 있는 잠재력과 명확화 및 토론(clarification and discussion)의 기회가 모두 포함되지만, 이 단계에서의 NGT와 마찬가지로 참가자 수가 제한적이고 지배적인 참가자가 그룹을 좌우할(sway) 수 있음을 인지해야 합니다.

 

합의 방법에는 변형이 있지만, 이들은 모두 구조화된 상호작용(structured interactions)으로 간주되며 비공식적 합의 회의(informal consensus meetings)와 구별되는 몇 가지 기본 원칙(foundational principles)을 공유합니다. 이러한 기본 원칙에는

  • 익명성(anonymity),
  • 반복(iteration),
  • 통제된 피드백(controlled feedback),
  • 통계적 그룹 반응(statistical group response), 그리고
  • 구조화된 상호작용(structured interaction)이 포함됩니다.

익명성은 지배적인 개인이 그룹을 좌우하는 것을 방지합니다. 반복, 통제된 피드백, 통계적 그룹 반응은 개인이 자신의 선택과 관련하여 다른 그룹 구성원의 응답을 보고 선택할 경우 항목의 순위를 다시 매길(re-rank) 수 있게 합니다. 이러한 원칙들은 개인이 다른 참가자의 의견을 보고 자신의 원래 결정을 재고할 수 있게 함으로써 합의를 촉진하거나 불일치를 강조(facilitating consensus or highlighting disagreement)하는 데 중요합니다.

 

합의 그룹 방법의 광범위한 사용에도 불구하고, 이러한 연구 접근 방식은 여러 분야에서 표준화가 미흡하고(poorly standardized) 일관성 없게 사용 및 기술(inconsistently used and described)되고 있습니다.

  • 많은 저자가 방법의 정의에 대한 낮은 일치도(poor agreement)계속 늘어나는 수정 목록을 지적했습니다; 예를 들어, 델파이 기법은 현재 고전적 델파이(classical Delphi), 정책 델파이(policy Delphi), 의사결정 델파이(decision Delphi), 수정 델파이(Modified Delphi), 반복 델파이(iterative Delphi) 등 몇 가지만 예로 들어도 여러 수정 버전을 가지고 있습니다.
  • 또한, 비평가들은 항목 생성(generating items), 항목 수 줄이기, 또는 참가자와 공유할 피드백 유형 결정에 사용된 프로세스와 관련하여 출판된 연구에 세부 사항이 놀라울 정도로 부족함(surprising lack of detail)을 기술했습니다. 최근의 몇몇 검토와 보고서는 여러 연구 분야에서 델파이 기법의 방법론 및 보고에 있어 상당한 결함(significant deficiencies)을 더욱 강조합니다. 이러한 검토들은 연구들이 종종
    • 참가자의 선정 및 기술,
    • 프로세스 시작 시 참가자에게 제공된 정보,
    • 모든 라운드의 응답률(response rates),
    • 그룹 평가의 공식적인 피드백,
    • 시행된 익명성의 수준,
    • 반복 라운드 전반에 걸친 참가자 이탈률(participant attrition rates),
    • 각 라운드 후의 결과, 그리고
    • 종료 시점 결정(end-point decisions)(즉, 합의가 달성되었다고 결정된 방식)을 기술하는 데 실패한다는 점을 관찰했습니다.

요약하면, 합의 방법 보고(consensus methods reporting)에는 표준화가 미흡하고 세부 사항이 불충분(poor standardization and insufficient detail)합니다. 이러한 접근 방식이 의학 교육 연구에서 사용되고 있지만, 그 사용의 범위와 품질은 알려져 있지 않습니다. 이 연구의 전반적인 목표는 의학 교육 연구에서 합의 방법의 사용을 기술하고 이러한 방법 및 결과의 보고 품질(reporting quality)을 평가하는 것이었습니다.

방법 (Method)

이러한 연구 목표를 달성하기 위해, 우리는 스코핑 고찰 방법(scoping review methods)에 의존했습니다. 우리는 Arksey와 O'Malley가 기술한 프레임워크를 사용했으며 Levac과 동료들의 권장 사항을 포함했습니다. 따라서 우리는 4단계 프로세스를 따랐습니다.

1단계: 연구 질문 식별 (Step 1: Identifying the research question)

Levac과 동료들이 제안한 바와 같이, 우리는 광범위한 연구 질문(research question)을 더 정밀하게 표현된 탐구 범위(scope of inquiry)와 결합하고, 목적을 결정하는 데 도움이 되도록 연구 시작 시 의도된 결과물의 내용과 형식을 구상했습니다. Boulkedid와 동료들 및 Sinha와 동료들의 이전 연구가 이러한 구상을 가능하게 했습니다. 우리 연구는 두 가지 광범위한 목적을 가졌습니다:

  • (1) 의학 교육 연구에서 합의 방법의 사용을 기술하는 것, 그리고
  • (2) 이러한 방법 및 결과의 보고 품질(reporting quality)을 평가하는 것.

더 구체적으로, 우리는 다음 네 가지 질문을 다루었습니다:

  • (1) 의학 교육 연구에서 합의 방법이 얼마나 광범위하게 사용되는가?
  • (2) 이 문헌에서 어떤 유형의 합의 방법이 사용되는가?
  • (3) 합의 방법을 사용하는 연구의 목적은 무엇인가?
  • (4) 합의 방법의 적용에 표준화(standardization)가 존재하는가?

2단계: 관련 논문 식별 및 논문 선정 (Step 2: Identifying relevant articles and article selection)

우리는 이 조사의 시작 시점에 의학 교육에서의 합의 방법과 관련된 모든 논문을 검토에 포함하기로 결정했습니다. 의학 사서(medical librarian) (L.U.)가 프로젝트를 위한 모든 문헌 검색을 완료했습니다. 초기 파일럿 키워드 검색은 2013년 8월 Medline과 Embase 데이터베이스에서 의학 교육 및 "Delphi", "RAND", "nominal group", "consensus group methods"라는 키워드에 초점을 맞춰 2003년부터 2013년까지의 기간에 대해 완료되었습니다. 이 키워드들은 출판된 문헌의 검토를 기반으로 선정되었으며 149개의 초록을 산출했습니다.

 

다음으로 합의 방법이 이 문헌에서 연구 방법으로서 언제 두각을 나타냈는지 확인하기 위해 계량서지학적 분석(bibliometric analysis)이 수행되었습니다. 분석은 Medline, Embase, PsycInfo 데이터베이스를 사용하여 수행되었습니다. 합의 방법을 기술한 의학 교육 문헌의 본체는 1955년까지 나타나지 않았습니다. 분석 결과, 파일럿 키워드 검색에서 사용한 합의 방법에 대한 검색 용어는 2000년까지 연간 10편 미만의 논문에 등장했습니다. 관련 결과의 60% 이상이 2009년과 2013년 사이에 출판되었습니다. 연간 논문 수는 27편(2009년), 25편(2010년), 29편(2011년), 43편(2012년), 22편(2013년)이었습니다. 우리는 가장 최근의 문헌이 합의 방법 연구에 관심이 있는 의학 교육자들에게 더 관련성이 높다고 생각했으며, 2009년부터 현재까지의 문헌 검토가 우리의 연구 질문을 다루기에 충분한 논문 표본(sufficient sampling of articles)을 제공할 것이라고 느꼈습니다.

 

우리는 세 번째 검색을 Medline, Embase, PsycInfo, PubMed, Scopus, ERIC 데이터베이스에서 2009년부터 검색이 수행된 2014년 1월까지의 기간에 대해 키워드와 통제 어휘(controlled vocabulary) 용어의 조합을 사용하여 실행했습니다. 연구 책임자(principal investigator, S.H.M.)와 그녀의 감독 하에 있는 연구 보조원이 모든 제목과 초록을 검토했습니다. 본 연구에 포함되기 위해서, 논문은 영어로 작성되어야 했으며; 모든 보건 직종(health profession)의 교육과 관련되어야 했고; 제목이나 초록에 델파이 기법, 델파이 기법의 수정, NGT, 또는 모든 "합의" 방법론을 포함한 합의 그룹 방법(consensus group method(s))의 사용을 명시해야 했습니다. 이 단계에서는 모든 보건 직종을 포함했습니다. 모호한 초록은 전문(full-text) 검토 대상에 포함되었습니다.

 

5명의 팀원(S.H.M., L.V., T.J.W., C.G., L.U.)과 1명의 연구 보조원이 각각 5편의 전문(full-text) 논문을 검토하고, 반복적인 과정(iterative process)을 통해 포함/배제 기준(inclusion/exclusion criteria)을 명확히 했습니다. 팀은 완료된 연구의 전문 논문만 포함하고 논평(commentaries), 사설(editorials), 합의 컨퍼런스 프로시딩(consensus conference proceedings)은 배제하기로 결정했습니다. 논문은 또한 교육에 초점을 맞춰야 했습니다. 업데이트된 문헌 검색은 2016년 6월에 수행되었습니다.

3단계: 데이터 차팅 (Step 3: Charting the data)

데이터 추출 양식(data extraction form)첫 번째 버전은 문헌을 기반으로 개발되었습니다. 여러 팀원(S.H.M., L.V., T.J.W., C.G., L.U.)과 1명의 연구 보조원이 각각 다른 5편의 논문을 검토하여 총 30편의 논문을 검토하고 추출 양식의 사용을 시험했습니다. 전체 팀이 만나 반복적인 과정을 통해 추출할 각 데이터 유형의 정의를 다듬고 추출 양식의 두 번째 버전을 만들었습니다. 이 단계에서 그들은 포함/배제 기준도 명확히 하고 확정했습니다. 그 후 두 명의 팀원이 추출 양식의 두 번째 버전을 사용하여 13편의 논문을 검토했습니다. 보고된 라운드(rounds) 수를 정의하는 방법을 제외한 모든 데이터 추출 항목에 대해 완전한 일치(complete agreement)가 이루어진 또 다른 팀 회의가 열렸습니다. 이 불일치는 합의 그룹 방법의 광범위한 변형을 부각시켰으며, 연구의 "진정한 합의 그룹(true consensus group)" 부분에서의 라운드 수를 세기로 결정했습니다. 예를 들어, 합의 방법은 종종 비공식 회의나 포커스 그룹(focus groups)과 같은 다른 방법과 결합하여 사용되었습니다. 따라서 우리는 합의 방법 자체에 대한 라운드 수만 계산했습니다. 이 회의에서 팀은 데이터 추출 양식의 세 번째이자 최종 버전을 완성했습니다.

 

최종 추출 양식은 두 부분으로 구성되었습니다.

  • 첫 번째 부분은 사용된 합의 그룹 방법, 저널 유형, 연구 목적, 관련 전문 분야(specialty), 목표 훈련 수준(level of training), 초점 영역(국가 또는 국제)과 같은 논문 인구통계 정보를 수집했습니다.
  • 두 번째 부분은 연구의 엄격성(rigor)을 나타낼 수 있는 항목들을 포함했습니다. 다음 질문들이 포함되었습니다:
    • (1) 문헌 고찰이 수행되었는가?
    • (2) 참가자에게 배경 정보가 제공되었는가?
    • (3) 합의 방법이 항목 생성(item generation), 순위 매기기(ranking), 또는 둘 다를 위해 사용되었는가?
    • (4) 몇 명의 참가자가 포함되었는가?
    • (5) 우편/이메일 투표 또는 대면 질문이 사용되었는가?
    • (6) 개인적 결정(private decisions)이 수집되었는가?
    • (7) 공식적인 피드백(formal feedback)이 제공되었는가? 그렇다면 피드백은 기술되었는가?
    • (8) 몇 번의 라운드가 수행되었는가?
    • (9) 라운드 수는 사전에(a priori) 결정되었는가?
    • (10) 합의에 대한 미리 정해진 정의(predetermined definition of consensus)가 있었는가? 그렇다면 무엇이었는가?
    • (11) 합의가 강요되었는가(forced)?

이러한 각 질문에 대해, 검토자들은 해당 항목의 유무와 질문이 다루어졌는지 여부뿐만 아니라, 그것들이 명시적으로 진술되고 충분히 상세하게 기술되었는지(explicitly stated and described in sufficient detail)도 살펴보았습니다.

 

이 데이터 추출 도구를 사용하여 각 팀원은 첫 번째 검색(2009-2014)에서 나온 25~30편의 논문에 대한 전체 검토를 완료했습니다. 모호한 항목이 있으면 연구 책임자(S.H.M.)가 해당 논문을 검토하여 최종 결정을 내렸습니다. 나머지 논문들은 한 명의 팀원(S.H.M., L.V., T.J.W., T.F., C.G.)이 검토했습니다.

 

2016년 6월 업데이트된 검색 후, 8편의 논문이 검토를 위해 두 명의 다른 팀원에게 각각 배정되었습니다. 이 논문들을 논의하기 위해 두 번의 팀 회의가 열렸습니다. 나머지 논문들은 각 팀원(S.H.M., K.M., T.J.W., C.G., T.F., C.W.)이 코딩했습니다. 모호한 항목은 논의를 거쳐 합의가 이루어졌습니다. 이 단계에서 우리는 구체적으로 의학 교육(medical education)(모든 수준의 의사 교육)에 초점을 맞추었으며, 간호 교육에서 합의 방법 사용에 관한 논문이 최근에 출판되었기 때문에 간호학, 치의학, 수의학 또는 관련 보건(allied health) 교육을 다루는 논문은 제외했습니다.

4단계: 결과 통합, 요약 및 보고 (Step 4: Collating, summarizing, and reporting results)

우리는 Levac과 동료들이 제안한 세 가지 별도 데이터 분석 단계를 따랐습니다. 첫째, 우리는 양적 또는 수치적 접근 방식(SPSS Statistics 24, IBM, Armonk, New York을 사용하여 계산)을 사용하여 데이터를 분석했습니다. 우리는 이 결과를 표 형식으로 보고합니다. 그런 다음 전체 팀이 수치 요약을 검토하여 결과에 의미를 적용했습니다. 팀의 전문성은 결과의 의미를 고려하기 위한 여러 관점을 제공했습니다 - 측정 배경지식을 가진 양적 연구자, 질적 방법(qualitative methods)에 광범위한 경험을 가진 질적 연구자, 간호학 박사 학위를 가진 연구자, 그리고 의학 교육 연구에 적극적으로 참여하는 여러 임상 교육자들(clinician educators). 스코핑 고찰 방법은 전통적으로 질적 내용 분석(qualitative content analysis)을 사용하여 연구 결과에 대한 주제 분석(thematic analysis)을 포함하지만, 우리 연구의 일차적 목표는 논문의 결과(findings)가 아니라 논문에서 사용되고 보고된 방법(methods)을 분석하는 것이었습니다. 결과적으로 우리는 보고된 결과에 대한 주제 분석을 수행하지 않았습니다.

결과 (Results)

우리의 문헌 검색 결과와 논문 선정 과정(literature search results and article selection process)은 Figure 1에 예시되어 있습니다. 334편의 전문 논문(full-text articles)을 검토한 후, 257편의 논문이 우리 연구에 포함되었습니다. 이 논문들의 전체 참고문헌 목록은 http://links.lww.com/ACADMED/A461 의 Supplemental Digital Appendix 1을 참조하십시오.

 

 

논문 인구통계 (Article demographics)

 

Table 2는 우리 검토에 포함된 257편의 논문에서 추출한 인구통계 정보를 나열합니다. 이 논문들에서, 저자들은 자신들이 채택한 합의 방법을 기술하기 위해 매우 다양한 용어를 사용했습니다. 수정 델파이 기법(Modified Delphi method) (105/257; 40.8%), 델파이 기법(Delphi method) (91/257; 35.4%), 그리고 NGT (23/257; 8.9%)가 가장 흔하게 명명된 합의 방법이었습니다. 그러나 많은 논문이 방법의 조합(combination of methods)을 사용했습니다.

  • 대부분의 논문(148/257; 57.6%)은 의학 저널(예: Surgery)에 출판되었으나, 3분의 1 이상(88/257; 34.2%)은 의학 교육 저널(예: Academic Medicine)에 출판되었습니다.
  • 합의 그룹 방법을 사용하는 가장 흔한 목적은 새로운 교육과정 개발 또는 개편(new curriculum development or reform) (68/257; 26.5%), 평가 도구 개발(assessment tool development) (55/257; 21.4%), 그리고 역량 정의(defining competencies) (43/257; 16.7%)였습니다.
  • 합의 그룹 방법은 지역적(local) (72/257; 28.0%), 국가적(national) (104/257; 40.5%), 그리고 국제적(international) (56/257; 21.8%) 문제를 다루기 위해 사용되었습니다.
  • 25편의 논문(9.7%)에서는 초점이 지역적, 국가적, 또는 국제적인지 불분명했습니다. 연구들은 매우 다양한 전문 분야(specialties)에서 수행되었습니다(Table 2 참조).

 

 

 

합의 방법 적용의 표준화 (Standardization in the application of consensus methods)

우리는 Table 3에 사용된 접근법의 전체 목록을 제시합니다. 아래에, 우리는 특히 주목할 만한 발견(noteworthy findings)을 강조합니다.

 

문헌 고찰, 참가자를 위한 배경 정보, 연구 목적 (Literature review, background information for participants, study purpose)

검토한 257편의 논문 중 180편(70.0%)이 설문지 준비를 위해 문헌 고찰(literature review)이 수행되었음을 기술했습니다. 단 70편(27.2%)의 논문만이 연구 시작 시 참가자에게 어떤 배경 정보(background information)가 제공되었는지 기술했습니다. 합의 방법의 목적은 대다수의 논문(230/257; 89.5%)에 명시되어 있었으며,

  • 그중 55편(23.9%)은 아이디어 생성(idea generation)을 위해,
  • 81편(35.2%)은 순위 매기기(ranking)를 위해,
  • 94편(40.9%)은 아이디어 생성과 순위 매기기 모두를 위해 사용되었다고 나타냈습니다.

참가자 (Participants)

합의 그룹을 구성한 참가자의 유형(Table 2 참조)은 주로 의사(physicians) (101/257; 39.3%)였으며, 그다음으로 의사와 관련 보건 전문가 같은 전문직 간 그룹(interprofessional groups) (34/257; 13.2%), 그리고 전문가 그룹(groups of experts) (34/257; 13.2%)이 뒤를 이었습니다. 우리는 참가자에게 요구되는 전문성의 유형(type of expertise)이 대개 명확하게 기술되지 않았음을 확인했습니다. Table 3은 합의 개발 라운드 전반에 걸쳐 참가자 수와 응답률(response rates)을 보고한 논문의 수를 나열합니다. 검토한 257편의 논문 중 215편(83.7%)이 연구 시작 시 초대된 참가자 수를 나열했습니다. 그러나 1라운드의 응답률을 나열한 연구 수는 170편(66.1%)으로 떨어졌습니다. 더 나아가, 단 129편(50.2%)의 논문만이 합의 개발의 2라운드 참가자 수를 보고했습니다.

합의 방법 특징 (투표, 익명성, 피드백, 라운드 수) (Consensus method features (polling, anonymity, feedback, number of rounds))

투표 또는 그룹 상호작용(Polling, or group interaction)은 검토한 257편의 논문 중 180편(70.0%)에서 기술되었습니다. 이는 우편 또는 이메일(117/180; 65.0%), 대면(face-to-face) (34/180; 18.9%), 또는 이 두 가지 접근 방식의 조합(29/180; 16.1%)으로 완료되었습니다. 익명성 또는 개인적 결정의 수집(Anonymity, or the collection of private decisions)은 103편(40.1%)의 논문에서 기술되었으며; 나머지 154편(59.9%)의 논문은 개인적 결정을 기술하지 않았거나 수집하지 않았습니다. 우리는 피드백에 대한 접근 방식과 참가자가 자신의 순위를 변경하거나 항목을 추가할 수 있는 능력을 검토했습니다. 단 97편(37.7%)의 논문만이 그룹 평가(group ratings)에 대한 공식적인 피드백(formal feedback)이 참가자와 공유되었다고 언급했습니다.

 

반복(iteration)은 합의 방법의 정의적 특징(defining feature)으로 간주되므로, 2회 이상의 데이터 수집 라운드가 필요합니다. 각 연구의 라운드 수는 0회에서 14회까지 다양했습니다. 전체적으로, 검토한 257편의 논문 중 단 197편(76.7%)만이 2회 이상의 라운드를 가졌다고 기술했습니다. 나머지 60편(23.3%)은 합의 방법을 사용한다고 선언했으나 단일 데이터 수집 세션(single data collection session)만을 가졌습니다. 2회 이상의 데이터 수집 라운드를 기술한 연구 중 대부분은 2라운드(111/257; 43.2%)를 가졌지만, 3라운드(66/257; 25.7%)나 4라운드(13/257; 5.1%)를 가진 연구도 여럿 있었습니다. 나머지는 5라운드(4/257), 7라운드(2/257), 14라운드(1/257)였습니다. 47편(18.3%)의 논문에서는 라운드 수가 사전에 결정(predetermined)되었으나, 210편(81.7%)의 논문에서는 라운드 수가 사전에 결정되지 않았거나 기술되지 않았습니다.

합의 수립 (Establishing consensus)

검토한 257편의 논문 중 111편(43.2%)에서 합의의 정의가 사전에 결정되었습니다(definition of consensus was predetermined). 합의의 정의가 제공되었을 때, 그 설명은 매우 다양했습니다. 일부 논문에서는 합의가 20% 이상의 동의로 정의되었고, 다른 논문에서는 90%에서 100%의 동의로 정의되었습니다. 검토한 논문 중 100편(38.9%)이 합의가 강요되었는지(forced) 여부를 보고했으며, 27편(10.5%)은 강요되었다고, 73편(28.4%)은 그렇지 않았다고 나타냈습니다. 157편(61.1%)의 논문에서는 합의 강요 여부가 기술되지 않았습니다.

고찰 (Discussion)

우리 연구는 의학 교육 연구에서 이전에 수행된 적이 없는 합의 그룹 방법을 탐구하기 시작했다는 점에서 독특합니다. 우리는 2009년에서 2016년 사이에 합의 방법을 사용하여 출판된 상당수의 논문(substantial number of articles) (n = 257)을 발견했습니다. 델파이 및 수정 델파이 기법이 이 논문들에서 보고된 합의 방법의 75% 이상을 차지했습니다. 수정 델파이(Modified Delphi)라는 용어를 사용한 40.8%의 논문 외에도, 많은 다른 논문들이 델파이 기법을 다른 합의 그룹 방법과 결합하여 사용하거나 수정 델파이 기법을 다른 방법과 함께 사용한다고 기술했습니다. 일부 논문은 동일한 논문의 초록과 방법 섹션에서 서로 다른 용어를 사용하는 등, 자신들의 방법을 설명하기 위해 델파이와 수정 델파이 용어를 모두 사용하기도 했습니다. 특히, 약 3분의 1의 논문이 데이터 수집에서 반복(iteration)의 사용을 기술하지 않았습니다; 다시 말해, 이 연구들에서는 단일 설문 조사가 참가자들에게 발송되었습니다. 우리는 반복(iteration)이 합의 방법의 핵심 특징(key feature)이기 때문에 이러한 연구 설계는 합의 그룹 방법으로 간주되어서는 안 된다고 주장합니다. 다른 연구와 일관되게, 우리의 결과는 의학 교육 문헌에서 사용되는 합의 방법 용어가 매우 다양하다는 것을 나타냅니다.

 

우리가 검토한 논문의 거의 40%는 의사만 포함했으나, 몇몇 논문은 보건 직종 전반의 그룹을 포함했습니다. 우리는 이러한 선택의 적절성을 평가하지는 않았습니다. 그러나 우려스러운 점은 여러 논문에서 참가자가 누구인지 파악할 수 없었다는 것입니다.

 

우리의 결과는 의학 교육 연구에서 합의 방법의 보고 품질(reporting quality)과 표준화(standardization)가 매우 다양함을 시사합니다. 다음 영역들은 특히 문제가 있는 것으로 보였으며 검토한 논문에서 자주 누락되거나 부실하게 기술되었습니다:

  • 합의 방법에 정보를 제공하기 위한 문헌 고찰 수행;
  • 참가자에게 배경 정보 제공;
  • 각 라운드 후 참가자 수 보고;
  • 연구에 사용된 익명성 수준 기술;
  • 참가자에게 그룹 평가에 대한 피드백 제공; 그리고
  • 연구에 사용된 합의의 정의 명시.

우리가 검토한 논문의 약 70%가 문헌 고찰을 완료했다고 보고했습니다.

  • 나머지 30%가 기술하지 않은 채 문헌 고찰에 참여했을 수도 있지만, 우리는 이 중요한 단계가 반드시 기술되어야 한다고 제안합니다. 유사한 결과가 이전에 보고된 바 있습니다.

 

합의 구축 과정 시작 시 참가자에게 배경 정보(background information)를 제공하는 것 또한 동등하게 중요합니다.

  • 참가자가 진정한 전문가라면 이 단계는 덜 관련될 수 있지만, 배경 정보는 참가자에게 영향을 미칠 수 있으므로 어떤 정보가 어떤 형식으로 제공되었는지에 대한 명확한 기술이 중요합니다. 우리가 검토한 논문의 단 27.2%만이 이 정보를 기술했습니다.

 

우리는 또한 각 데이터 수집 라운드의 응답률(response rates) 보고를 조사했습니다.

  • 분석한 논문의 단 83.7%만이 연구 시작 시 초대된 참가자 수를 보고했고, 66.1%는 데이터 수집 1라운드의 참가자 수를, 50.2%는 2라운드의 참가자 수를 보고했습니다. 합의 방법 연구에 대한 다른 분석들도 데이터 수집의 모든 라운드에 대해 응답률을 보고한 연구가 7%에서 39%에 불과하다는 유사한 부실 보고를 발견했습니다. 우리는 이 정보가 연구 결과의 해석에 영향을 미칠 수 있다고 믿으므로, 이를 포함하는 것이 타당합니다.

익명성 또는 개인적 의사 결정(Anonymity or private decision making) 또한 고품질 합의 그룹 방법에 필수적인 것으로 간주됩니다.

  • 불행히도, 우리가 심사한 논문의 절반 미만이 참가자의 익명성이 유지되었음을 명시적으로 보고하거나 방법 섹션에서 이를 명확히 알 수 있을 만큼 충분한 정보를 제공했습니다. 저자들은 독자들이 익명성이 연구 설계의 일부임을 이해할 것이라고 가정했을지 모르지만, 수정된 합의 방법(modified consensus methods)으로 명명된 접근 방식들의 변동성을 고려할 때 우리는 그들이 이를 명시해야 한다고 제안합니다.

합의 그룹 방법의 또 다른 중요한 특징은 통계적 그룹 반응과 정성적 정보를 포함한 참가자에 대한 피드백(feedback to participants)입니다.

  • 이 정보는 참가자들이 타인의 응답을 기반으로 항목의 순위를 다시 매길 수 있게 합니다. 우리는 피드백이 검토한 논문의 약 3분의 1에서 보고되었음을 발견했습니다. 다른 연구자들도 익명성과 참가자에 대한 피드백이 합의 방법 기술에서 자주 보고되지 않는다는 점을 강조했습니다.

마지막으로, 우리가 식별한 가장 우려스러운 문제는 합의가 종종 사전에 정의되지 않았다는 것(not defined a priori)이었습니다.

  • 우리가 검토한 논문의 단 43.2%만이 연구 시작 시 합의의 정의를 보고했습니다. 이 문제는 합의 방법에 대한 다른 분석에서도 강조되었으며, 단 28%에서 52%만이 합의의 정의를 보고했습니다.

이 검토의 범위를 벗어나는 일이지만, 합의 방법 자체에 대한 연구가 최소한으로 이루어졌다는 점은 여전히 주목할 가치가 있습니다. 그룹 의사 결정에 대한 이론적 기반에 관한 논문이 최근 출판되었으며, 이전의 연구는 합의 그룹 방법의 결과에 영향을 미치는 요인들에 초점을 맞추었습니다.

 

우리 연구에는 몇 가지 한계가 있습니다. 첫째, 모든 전자 데이터베이스와 연도를 검색하지 않았으므로 일부 연구가 우리 연구에 포함되지 않았을 가능성이 있습니다. 또한, 우리는 분석을 위해 스코핑 고찰 방법을 수정했습니다; 그러나 우리는 우리의 접근 방식이 연구 질문에 대한 방어 가능한 해답을 산출했다고 믿습니다.

결론 (Conclusions)

의학 교육 문헌의 합의 그룹 방법에 관한 우리의 결과는 다른 학문 분야의 결과를 반영하며 연구 전반에 걸친 상당한 변동성(considerable variability)을 강조합니다. 의학 교육 연구들은 사용된 방법에 관한 충분한 세부 사항을 일관되게 제공하지 않아 과학적 신뢰성 결여(lack of scientific credibility)로 이어집니다. 합의 방법이 모범 사례(best practices)에 정보를 제공하려면, 엄격하게 수행되어야 합니다. 합의 방법에 대한 합의(consensus on consensus methods)의 부재는 연구자들이 자신들이 사용한 방법에 대해 명확하고 상세한 보고(clear and detailed reporting)를 제공하고 이러한 선택을 정당화하는 것을 필수적으로 만듭니다.

그 목적을 위해, 이 검토의 결과는 이미 합의 그룹 방법 권장 사항 개발에 정보를 제공했습니다. 그러나 궁극적으로 이론적 기반과 합의 과정의 변형이 합의 결과(consensus outcomes)에 어떻게 영향을 미치는지에 대한 것을 포함하여, 방법 자체(methods themselves)에 대한 더 많은 연구가 필요합니다.

 

 

 

 

Med Teach. 2025 Oct 24:1-20. doi: 10.1080/0142159X.2025.2569623. Online ahead of print.

Formative assessment and feedback in medical education: A practical guide: AMEE Guide No. 189

 

 

 

📝 [의학교육] 학생을 성장시키는 평가와 피드백의 정석 (AMEE Guide No. 189 요약)

1. 왜 지금 '형성평가'인가요?

과거에는 시험을 통해 등수를 매기는 것이 중요했다면, 이제는 학생이 필요한 역량을 갖췄는지 확인하고 도와주는 것이 중요해졌어요. 연구진은 이 변화의 핵심을 이렇게 설명합니다.

"이러한 변화의 중심에는 형성평가와 피드백의 결정적인 역할이 놓여 있으며, 이는 학습을 지원하고 학생들의 발전을 핵심 역량에 대한 필수 숙달 수준 달성으로 이끄는 근본적인 기제로 작용합니다."

(At the heart of this change lies the critical role of formative assessment and feedback, which serve as fundamental mechanisms for supporting learning and guiding student progress toward achieving required levels of mastery for key competencies.)

 

즉, 평가는 끝이 아니라 지속적인 과정(Continuous process)이어야 한다는 것이죠!


2. 효과적인 형성평가의 원칙 (Principles) 🎯

형성평가(Formative assessment)가 제대로 작동하려면 몇 가지 원칙이 필요해요.

  • 지속적이고 정기적인 평가 (Continuous and regular assessment): 한 번의 큰 시험보다는 빈번한 저부담 퀴즈(Low-stakes quizzes)가 장기 기억에 훨씬 효과적입니다.
  • 학습 목표와의 연계 (Alignment): 평가가 우리가 가르치고자 하는 학습 목표(Learning objectives)와 딱 맞아떨어져야 해요.
  • 포용성과 공정성 (Inclusivity and fairness): 모든 학생이 공평하게 기회를 얻고, 심리적 안전감(Psychological safety)을 느끼며 실수로부터 배울 수 있어야 합니다.

3. 피드백, '샌드위치'는 이제 그만? 🥪

피드백은 시기적절(Timely)하고 구체적(Specific)이어야 해요. 그런데 우리가 흔히 쓰는 '칭찬-비판-칭찬'의 피드백 샌드위치(Feedback sandwich) 방식에 대해 연구진은 흥미로운 의견을 내놓았습니다.

"연구에 따르면 피드백 샌드위치는 명확성을 희석시키고 덜 진실되거나 실행 가능하지 않은 것처럼 보이게 만듦으로써 건설적 피드백의 효과성을 약화시킬 수 있습니다."

(Research suggests that the feedback sandwich may weaken the effectiveness of constructive feedback by diluting its clarity and making it seem less sincere or actionable.)

 

빙빙 돌려 말하기보다는, 개선이 필요한 영역과 강점을 직접적이고 구체적으로 이야기해 주는 것이 학생 성장에 훨씬 도움이 된다고 합니다.


4. 평가의 방법들 (Methods) 🛠️

단순한 시험지 외에도 다양한 방법이 있어요.

  • 동료 평가 (Peer assessment): 서로 평가하며 비판적 사고를 기릅니다.
  • 시뮬레이션 (Simulations) & OSCE: 안전한 환경에서 실수할 기회를 줍니다. 즉각적인 디브리핑이 핵심이죠.
  • 서면 및 구두 피드백: 기록으로 남는 서면 피드백과, 즉각적인 소통이 가능한 구두 피드백을 섞어 쓰면 효과 만점!

5. 교수자와 학생, 역할이 바뀝니다 🤝

교수님은 더 이상 지식 전달자가 아니라 코치(Coach)이자 촉진자(Facilitator)가 되어야 해요. 학생은 수동적인 수용자가 아니라, 스스로 목표를 세우는 자기 조절 학습자(Self-regulated learner)가 되어야 합니다.

"형성평가는 교수자와 학습자가 학습 과정에서 능동적 협력자로 참여할 때 가장 효과적입니다."

(Formative assessment is most effective when instructors and learners engage as active collaborators in the learning process.)


6. 기술과 AI의 활용 🤖

데이터 분석(Feedback analytics)을 통해 학생들이 어디서 헤매는지 파악하고, AI 도구를 이용해 개인화된 피드백을 줄 수 있어요. 단, 윤리적 사용(Ethical use)이 정말 중요합니다. AI는 인간의 판단을 대체하는 게 아니라 보완하는 도구여야 하니까요.


💡 마치며: 평가는 도구가 아니라 '과정'입니다

이 논문은 결국 평가를 하나의 '이벤트'로 보지 말고, 교육과정 전체에 흐르는 문화로 만들라고 조언합니다. 마지막으로 연구진의 결론을 인용하며 마칠게요.

"결론적으로, 형성평가는 단순히 특이한 평가 도구가 아니라 학생의 학습과 성장을 지원하는 역동적인 과정입니다."

(To conclude, formative assessment is not merely an idiosyncratic evaluative tool but a dynamic process that supports student learning and growth.)

 

우리 모두 학생들을 더 훌륭한 의료 전문가로 키워내기 위해, 오늘부터 '성장형 평가'를 시작해 보는 건 어떨까요? 🌱

 


서론 (Introduction)

의학교육의 지형(landscape)은 전통적인 시간 기반의 측정 지표(time-based metrics)에서 학습 성과(learning outcomes)와 입증된 역량(demonstrated competencies)을 우선시하는 역량 중심 모델(competency-based model)로 전환되면서 중대한 변화(significant transformation)를 겪고 있습니다 [1–3]. 이러한 변화의 중심(heart)에는 형성평가(formative assessment)와 피드백(feedback)의 결정적인 역할이 놓여 있으며, 이는 학습을 지원하고(supporting learning) 학생들의 발전(student progress)을 핵심 역량(key competencies)에 대한 필수 숙달 수준(required levels of mastery) 달성으로 이끄는 근본적인 기제(fundamental mechanisms)로 작용합니다. 이러한 교육학적 도구들(pedagogical tools)은 의학교육 기관들이 현대 의료(modern healthcare)의 복잡한 요구(complex demands)를 충족시킬 수 있는 준비된 의사(well-prepared physicians)를 양성하기 위해 노력함에 있어 특히 중요합니다 [4,5].

 

평가(evaluation)와 조정(adjustment)의 지속적인 과정(continuous process)으로 특징지어지는 형성평가(Formative assessment)명확한 학습 목표(learning objectives) 수립, 다양한 평가 방법(diverse assessment methods) 활용, 실행 가능한 피드백(actionable feedback) 제공, 그리고 수집된 데이터(gathered data)에 기반한 수업 조정(adapting instruction) 등 여러 상호 연결된 단계들(interconnected steps)을 포괄합니다 [6,7]. 이러한 체계적인 접근(systematic approach)은 교육자들이 학생의 진전(student progress)을 추적(track)하는 동시에 능동적 학습(active learning)과 역량 개발(competency development)을 촉진할 수 있게 해줍니다. 특히 피드백 구성요소(feedback component)는 그 설계(design)와 전달(delivery)에 있어 신중한 고려가 필요한데, 이는 피드백의 효과성(effectiveness)내용(content)시기(timing)뿐만 아니라 학생들의 수용성(receptivity) 및 제안된 개선사항을 이행할 수 있는 능력(ability to implement)에도 달려있기 때문입니다 [8–10].

 

효과적인 형성평가 및 피드백 시스템(formative assessment and feedback systems)을 구현하는 것의 복잡성(complexity)은 의학교육 프로그램(medical education programs)의 규모(scale)와 다양성(diversity)으로 인해 더욱 증폭됩니다 [11]. 기술의 발전(technological advancements)이 디지털 플랫폼(digital platforms), 고충실도 시뮬레이션(high-fidelity simulations), 간소화된 피드백 기제(streamlined feedback mechanisms)를 통해 유망한 해결책을 제공하지만, 다양한 교육과정(curricula)과의 연계(alignment) 보장, 학생 성장의 종단적 증거(longitudinal evidence) 수집, 그리고 다양한 학습 목표와 일정을 수용할 수 있는 유연한 실행 모델(flexible implementation models) 개발에는 여전히 중대한 과제(significant challenges)가 남아있습니다 [12,13].

 

학습자가 피드백을 어떻게 해석(interpret)하고 그에 따라 행동(act upon)하는지를 이해하는 것은 의학교육 연구의 중요한 개척 분야(crucial frontier)이며, 행동적 결과(behavioral outcomes)뿐만 아니라 피드백에 대한 인지적 및 정서적 반응(cognitive and emotional responses)까지 고려하는 총체적 접근(holistic approach)을 필요로 합니다. 이러한 포괄적인 이해(comprehensive understanding)는 의학교육이 역량 중심 모델(competency-based model)로 지속적으로 변화(transformation)하는 것을 지원할 수 있는 효과적인 평가 및 피드백 관행(practices)을 개발하는 데 필수적입니다 [14,15].

 

이 가이드는 의학교육에서 효과적인 형성평가 및 피드백 관행을 구현하기 위한 증거 기반의 지침(evidence-based guidelines)을 제시합니다. 최신 연구(current research)와 확립된 모범 사례(best practices)를 바탕으로, 우리는 성공적인 구현에 필수적인 핵심 구성요소(key components)를 다루는 포괄적인 프레임워크(comprehensive framework)를 제공합니다. 이 지침들은 6개의 주요 섹션으로 구성되어 있으며, 각 섹션은 학생의 학습과 발달을 최적화(optimize)하기 위해 설계된 형성평가 관행의 중요한 측면(critical aspect)에 초점을 맞추고 있습니다. 각 섹션은 다음과 같습니다 (그리고 Table 1에 요약되어 있음):

 

Table 1. 의학교육에서의 형성평가와 피드백을 위한 지침 (Guidelines for formative assessment and feedback in medical education).

  1. 효과적인 형성평가의 원칙 (Principles of effective formative assessment): 이 섹션은 빈도(frequency), 연계성(alignment), 포용성(inclusivity), 타당도(validity)에 초점을 맞춰 형성평가 설계를 위한 핵심 원칙을 개괄합니다. 우리는 평가가 학습 목표(learning objectives)와 일치하고, 모든 학습자에게 공정성(fairness)을 보장하며, 학생 진전에 대한 타당한 측정(valid measures)을 제공하도록 신중하게 설계되는 방법에 대해 논의합니다.
  2. 효과적인 형성 피드백의 원칙 (Principles of effective formative feedback): 여기서는 학습자의 개선(improvement)을 지원하는 피드백을 제공하는 방법을 탐구합니다. 이 섹션은 학습자가 기술과 지식의 숙달(mastery)을 향해 나아가고 성장 마인드셋(growth mindset)을 개발하도록 안내하는 데 있어 명확하고(clear), 구체적이며(specific), 시기적절한(timely) 피드백의 중요성에 초점을 맞춥니다.
  3. 형성평가와 피드백의 방법 (Methods of formative assessment and feedback): 이 섹션은 동료 평가(peer assessment), 시뮬레이션(simulations), 서면 또는 구두 피드백(written or verbal feedback)을 포함한 다양한 방법들을 강조합니다. 우리는 이러한 전략들이 학생들을 능동적 성찰(active reflection), 협업(collaboration), 실습(hands-on practice)에 참여시킴으로써 어떻게 학습을 풍부하게(enrich) 하는지 논의합니다.
  4. 교수자와 학습자의 역할 (Instructor and learner roles): 이 섹션에서는 형성평가 및 피드백 과정에서 교수자(instructors)와 학습자(learners) 양측의 역할과 책임(roles and responsibilities)을 탐구합니다. 우리는 교수자가 평가를 통해 학습을 촉진(facilitate)하는 방법과 학습자가 목표 설정(setting goals), 진전 추적(tracking progress), 피드백 적용(applying feedback)에서 어떻게 주도적인 역할(active role)을 할 수 있는지 논의합니다.
  5. 기술의 활용 (Leveraging technology): 이 섹션은 신흥 기술(emerging technologies)과 데이터 분석(data analytics)이 형성평가와 피드백을 어떻게 향상시킬 수 있는지 살펴봅니다. 우리는 평가를 개인화(personalize)하고, 참여도(engagement)를 높이며, 실시간 학습 통찰(real-time learning insights)을 지원하기 위해 온라인 도구와 데이터 기반 피드백 시스템(data-driven feedback systems)을 사용하는 방법을 탐구합니다.
  6. 형성평가와 피드백의 교육과정 통합 (Integrating formative assessment and feedback into curriculum): 마지막으로, 우리는 형성평가와 피드백을 더 넓은 교육과정(broader curriculum)에 통합하는 것의 중요성을 논의합니다. 이 섹션은 평가가 교육과정 내에 의미 있게 내재화(meaningfully embedded)되고 학습 목표 및 임상 실습(clinical practice)과 연계되도록 보장하기 위한 보건 전문직 교육 교수진(health professions education faculty)과의 협력 전략(strategies for collaboration)을 강조합니다.

이 6개 섹션 전반에 걸쳐, 우리는 성공적인 실행 전략(implementation strategies)과 잠재적인 함정(potential pitfalls)을 예시하기 위해 의학교육 문헌의 사례(examples)를 통합했습니다. 또한, 우리는 의학 교육자들이 직면하는 일반적인 과제들(common challenges)을 다루며, 다양한 맥락(contexts)에 맞춰 최적화할 수 있는 실용적인 해결책(practical solutions)을 제공합니다. 이 가이드는 교육자들이 교수 효과성(teaching effectiveness)을 높이고 의학교육의 학습 성과(learning outcomes)를 개선하도록 지원하는 것을 목표로 하며, 궁극적으로 더 유능한 보건의료 전문가(healthcare professionals) 양성에 기여하고자 합니다.

용어에 대한 참고 사항 (A note on terminology)

형성평가(formative assessment)가 역량 중심 의학교육(competency-based medical education)의 점차적인 핵심이 되어감에 따라, 용어(terminology)와 개념적 명확성(conceptual clarity)에 대한 질문이 중요하게 대두되었습니다(예: [16]). 가장 끈질기게 논의되는 지점 중 하나는 형성평가(formative assessment)학습을 위한 평가(assessment for learning, AfL)라는 용어 간의 관계입니다. 이 두 용어는 종종 상호 교환적으로(interchangeably) 사용되기도 하지만, 때로는 각각 특정한 이론적 기반(theoretical underpinnings) 및 실무적 적용(practical applications)과 연관되어 별개의 것으로 취급되기도 합니다. 이러한 개념적 분리(conceptual separation)는 교육 정책 담론(educational policy discourse)과 의학교육 학계(scholarship of medical education)에서 특히 두드러지는데, 이곳에서는 평가 관행(assessment practices)의 설계, 목적, 실행을 둘러싼 논쟁이 계속 진화하고 있습니다.

 

이러한 논의들은 형성평가와 AfL을 구분(differentiate)하려는 일련의 문헌들을 만들어냈으며, 때로는 초점(focus)이나 의도(intent)의 차이를 강조하기도 합니다. 이러한 구분이 특정 맥락(specific contexts)에서는 유용한 관점을 제공할 수 있겠으나, 우리는 이것이 더 깊은 수렴(deeper convergence)을 가리고 있다고 주장합니다. 형성평가와 AfL 모두 동일한 중심 목표(central aim)를 공유합니다. 즉, 평가 증거(assessment evidence)체계적으로 사용하여 교수 결정(instructional decisions)을 안내하고 학습자 개선(learner improvement)을 지원함으로써 학생의 학습을 향상시키는 것입니다 [17–22]. 이러한 공유된 목적(shared purpose)을 인식하는 것은 평가 담론에 더 큰 일관성(coherence)을 가져오고 교육 현장 전반에 걸쳐 더 일관된 관행(consistent practices)을 촉진할 수 있습니다.

  • 형성평가의 개념은 프로그램 평가(program evaluation)에 뿌리를 두고 있습니다. Scriven [20]은 교육 프로그램의 개발 또는 실행 중에 정보를 수집하여 이를 개선(improve)하는 과정을 설명하기 위해 형성적 평가(formative evaluation)라는 용어를 처음 도입했습니다. 그의 초점은 학생의 학습 그 자체보다는 교육과정(curriculum)과 교수 설계(instructional design)에 있었습니다.
  • 몇 년 후, Bloom [23]은 이 아이디어를 교실(classroom)로 확장하여, 학생의 오해(misunderstandings)를 진단하고 완전 학습(mastery learning)을 촉진하기 위해 수업을 조정(tailor instruction)하는 데 지속적인 평가(ongoing assessment)를 사용할 것을 강조했습니다. 이러한 변화는 우리가 오늘날 이해하고 있는 형성평가, 즉 역동적이고(dynamic) 학생 중심적인 과정(student-centered process)의 시작을 알렸습니다.
  • 이후 수십 년 동안 이 개념은 정교화되었으며, 이제는 빈번하고 시기적절한 평가(frequent and timely assessment), 학습 목표(learning goals)와의 연계, 실행 가능한 피드백(actionable feedback)의 제공, 그리고 학생의 성찰(reflection) 및 자기 조절(self-regulation) 지원과 같은 관행들과 널리 연관되어 있습니다.

 

이와 병행하여, 특히 평가 개혁 그룹(Assessment Reform Group) [24]의 연구를 통해 AfL(학습을 위한 평가)의 개념이 힘을 얻게(gained traction) 되었는데, 이는 평가를 단순히 학습을 측정(measure)하는 것이 아니라 학습을 향상(enhance)시키는 수단으로 강조하는 용어입니다. 이 프레임워크에 따르면, AfL은

  • 학습 의도(learning intentions)를 명확히 기술하고, 성공 기준(success criteria)을 학생들과 공유하며, 학습에 대한 대화(dialogue)를 촉진하고, 학생들이 미래의 수행(future performance)을 개선하기 위해 사용할 수 있는 피드백을 제공하는 등의 관행을 포함합니다.
  • AfL은 평가 과정에서 학습자의 능동적 역할(active role)을 특히 강조하지만, 그것이 지지하는 전략들은 형성평가 문헌에서 발견되는 것들과 실질적으로 일치(substantively aligned)합니다.

 

형성평가와 AfL 사이에 인지된 구분(perceived distinction)이 지속되는 한 가지 이유는 설계 의도(design intention)실행(implementation)을 분리하려는 노력에서 기인한 것일 수 있습니다.

  • 이 관점에서 볼 때, 형성평가평가 설계에 내재된 목적(purpose), 즉 수업에 정보를 제공(inform instruction)하는 것을 지칭하는 반면, AfL은 학습자가 피드백에 어떻게 관여(engage)하는지에 주목하며 평가가 실제로 어떻게 실행(implemented)되는지를 묘사합니다.
  • 그러나 두 개념 모두 동일한 필수 조건(essential condition), 즉 '학습의 증거가 후속 교수 및 학습 활동(subsequent instructional and learning actions)에 정보를 제공하는 데 사용되어야 한다'는 점에 의존한다는 사실을 고려하면 이러한 구분은 모호해집니다(blurred).
  • 두 경우 모두, 교수자나 학습자에 의해 피드백이 생성되었으나 행동으로 옮겨지지 않는다면(not acted upon), 그 평가는 형성적인 것이 아니게 되며 AfL이나 형성평가 중 어느 정의도 충족하지 못하게 됩니다.

두 용어 사이의 엄격한 분리(strict separation)를 유지하는 것은 실무자와 연구자 모두에게 불필요한 복잡성(unnecessary complexity)을 야기할 수 있습니다. 이는 효과적인 평가 관행을 특징짓는 근본적인 교육학적 통일성(pedagogical unity)을 모호하게 만들고 분절된 실행 노력(fragmented implementation efforts)을 초래할 수 있습니다. 형성평가로 명명하든 AfL로 명명하든, 본질적인 구성요소(essential components)는 동일하게 유지됩니다. 평가 활동교수 과정(instructional process) 내에 내재되고(embedded), 명시적인 학습 목표(explicit learning goals)와 결부되며, 학습자 발달(learner development)을 진전시키는 시기적절하고 유용한 피드백을 생성하는 데 사용됩니다.

 

요약하자면, 우리는 의학교육 분야가 명목상의 구분(nominal distinctions)을 넘어 형성평가와 AfL의 기능적 동등성(functional equivalence)을 받아들일 때 이득을 얻을 것이라고 제안합니다. 서로 다른 전통들이 교사 주도의 수업 조정(teacher-driven instructional adjustments) 대(versus) 학생 중심 학습(student-centered learning)과 같은 특정 측면을 강조할 수는 있지만, 핵심 기제(core mechanism)는 동일합니다. 바로 학습을 지원하고 향상시키기 위해 평가 증거(assessment evidence)를 사용하는 것입니다. 라벨(labels)보다 이러한 공유된 기능(shared function)을 우선시함으로써 개념적 모호성(conceptual ambiguity)을 줄이고, 더 명확한 의사소통을 지원하며, 연구와 실무 모두에서 더 큰 일관성을 보장할 수 있습니다. 어떤 이들은 별개의 용어가 특정한 교육학적 접근이나 가치를 강조하는 데 도움이 된다고 주장할 수 있지만, 그러한 구분은 명확성보다는 혼란(confusion)을 초래하는 경우가 많습니다. 이는 징글-장글 오류(jingle-jangle fallacy) [25,26], 즉 동일한 구성 개념(construct)에 대해 다른 용어를 사용하거나 서로 다른 것에 대해 같은 용어를 사용하는 고전적인 사례를 반영합니다. 우리가 그것을 무엇이라고 부르는지(what we call it)가 아니라 평가가 어떻게 작동하는지(how assessment works)에 초점을 맞춤으로써, 우리는 의학교육에서 더 일관되고 효과적인 관행을 발전시킬 수 있습니다.

 

이러한 토대 위에서, 형성적 접근법(formative approaches)이 더 광범위한 평가 시스템(broader assessment systems) 내에서 어떻게 작동하는지를 고려하는 것 또한 중요합니다. 그러한 프레임워크 중 하나인 프로그램식 평가(programmatic assessment)는 개별적인 교수 상호작용의 범위를 넘어, 평가가 어떻게 학습을 지원하고 결정(decisions)에 정보를 제공하는지에 대한 시스템 수준의 관점(systems-level perspective)을 도입합니다. 의학교육에서 두각을 나타내고 있는(gaining prominence) 프로그램식 평가는 고립된 평가 사건(isolated assessment events)에서 시간이 지남에 따른 다수의 저부담 데이터 포인트(low-stakes data points)의 전략적 수집 및 통합으로 초점을 전환합니다 [16,27]. 형성적이든 총괄적(summative)이든 각각의 증거 조각(piece of evidence)은 학습자 발달을 지원하고 역량(competence)에 대한 고부담 판단(high-stakes judgments)을 안내하기 위해 의도적으로 수집됩니다. 일반적으로 일상적인 교육(day-to-day teaching) 내에 내재된 AfL 및 형성평가와 대조적으로, 프로그램식 평가는 체계적인 집계(systematic aggregation), 전문가 해석(expert interpretation), 그리고 구조화된 멘토링(structured mentoring)에 의존합니다. 이는 피드백과 의사결정을 교육 프로그램의 아키텍처(architecture) 자체에 내재화(embeds)하여, 평가를 역량 중심 의학교육의 목표와 일치시키는 포괄적인 접근 방식을 제공합니다.

 

이러한 기초적인 구분들(foundational distinctions)이 명확해짐에 따라, 우리는 이제 이 가이드의 주된 목적인 의학교육에서 형성평가 및 피드백 관행을 구현하기 위한 증거에 기반한 전략(evidence-informed strategies)을 제공하는 것으로 넘어갑니다. 이러한 평가 접근법의 이론적 배경(theoretical underpinnings)을 더 탐구하고자 하는 독자들을 위해, 우리는 평가 개혁 그룹(Assessment Reform Group) [24], Black과 Wiliam [19,28], Lipnevich 등 [29], Lipnevich와 Smith [9], van der Vleuten 등 [27]의 연구 및 의학교육에서의 피드백과 형성평가에 대한 최근의 종합 연구(syntheses) (예: [30–32])를 포함한 주요 문헌들을 참고할 것을 권합니다.

효과적인 형성평가의 원칙 (Principles of effective formative assessment)

지속적이고 정기적인 평가 (Continuous and regular assessment)

지속적인 평가(Continuous assessment)는 학생의 참여(student engagement)를 유지하고 학습이 효과적으로 진행되도록 보장하는 데 결정적인 역할(critical role)을 합니다. 정기적인 점검 지점(regular checkpoints)을 제공함으로써, 교육자는 이해의 공백(gaps in understanding)을 조기에 파악하고 이를 해결하기 위해 즉각적으로 개입(intervene promptly)할 수 있습니다. 이러한 접근법은 학습의 어려움이 시간이 지남에 따라 가중되는(compounding) 것을 방지할 뿐만 아니라 일관된 기술 발달(consistent skill development)을 촉진합니다. 포괄적인 전략(comprehensive strategy)은 다양한 평가 방법(diverse assessment methods)을 통합하며(아래 섹션 참조), 각 방법은 학습 과정에 고유한 이점(unique benefits)을 기여합니다 [33,34].

 

지속적이고 정기적인 평가와 맥락을 같이하여, Torre와 Schuwirth [16]는 프로그램식 평가(programmatic assessment)의 중요성을 강조하는데, 이는 단순히 성과(outcomes)를 측정하는 것이 아니라 학습을 지원하기 위해 함께 작동하는 응집력 있는 평가 시스템(cohesive system of assessments)을 설계하는 것을 포함합니다. 이 접근법에서 지속적인 평가(continuous assessment)는 단순히 고립된 과제(isolated tasks)의 연속이 아니라, 교육과정 목표(curriculum goals)와 연계되고, 학생 참여(student engagement)를 조성하며, 실행 가능한 피드백(actionable feedback)을 제공하는 전략적으로 계획된 순서(strategically planned sequence)입니다. 프로그램식 평가는 평가가 의미 있고(meaningful), 저부담(low-stakes)이며, 성장에 초점을 맞추도록 보장하여, 학생들이 자신의 진전(progress)을 성찰하고 학습 여정(learning journey)에 대한 주도권(ownership)을 가질 수 있게 합니다. 프로그램식 프레임워크(programmatic framework) 내에 지속적인 평가를 내재화(embedding)함으로써, 교육자는 학생들의 필요(needs)에 적응하고 장기적인 성공(long-term success)을 촉진하는 보다 역동적이고 반응적인 학습 환경(responsive learning environment)을 조성할 수 있습니다.

 

빈번한 저부담 퀴즈(Frequent low-stakes quizzes)는 인출 효과(retrieval effect)를 통해 장기 기억(long-term retention)을 향상시키는 데 특히 효과적이며, 따라서 지식 유지(knowledge retention)를 개선합니다 [35–38]. 의학교육의 맥락에서, Larsen 등 [39]은 해부학(anatomy)에서 시행한 분산 퀴즈(spaced quizzes)가 단일 평가(single assessments)에 비해 시험 성적을 현저하게 향상시킨다는 것을 발견했으며, 이는 시간이 지남에 따른 빈번한 인출 연습(retrieval practice)의 장점을 입증합니다. 마찬가지로, 로테이션(rotations) 중의 구조화된 관찰(structured observations)과 같은 지속적인 평가 방법들은 실시간 피드백(real-time feedback)즉각적인 기술 개선(immediate skill refinement)의 기회를 제공하여, 학생들이 실제 환경(practical settings)에서 일관되게 역량을 개발하고 적용하도록 보장합니다 [40,41].

 

지속적인 평가를 다양한 방법(variety of methods)과 통합함으로써, 교육자는 역동적이고 지지적인 학습 생태계(dynamic and supportive learning ecosystem)를 만들 수 있습니다. 이러한 접근법은 지식 유지와 기술 개발을 향상시킬 뿐만 아니라 학문적 및 전문적 맥락(academic and professional contexts)에서의 성공을 위한 핵심 속성인 성찰(reflection), 협업(collaboration), 그리고 적응 능력(ability to adapt)을 장려합니다.

 

그러나, 형성적 목적(formative purpose)을 수행하는 평가와 더 광범위한 형성평가 과정(formative assessment process)을 구별하는 것은 필수적입니다. 즉, 형성평가특정 유형의 시험이나 도구(tool)로 이해되어서는 안 되며, 오히려 평가에서 나온 증거(evidence)가 수업에 정보를 제공(inform instruction)하고 후속 학습(subsequent learning)을 지원하는 데 사용되는 과정(process)으로 이해되어야 합니다.

 

이러한 구분은 결정적입니다(critical): 단순히 평가를 시행(administering)하는 것만으로는 그것이 형성적이 되지 않습니다. 평가의 형성적 본질(formative nature)은 교육자가 그것이 생성한 데이터(data)를 적극적으로 사용하여 피드백을 제공하고, 수업을 안내하며, 학생 학습을 지원하여 지속적이고 반복적인 피드백 루프(continuous and iterative feedback loop)를 지지할 때 발생합니다. 그러한 목적 지향적인 사용(purposeful use) 없이는, 평가가 형성적인 것으로 잘못 명명될(mislabeled) 위험이 있으며, 따라서 학습 과정에 의미 있게 기여하지 못하게 됩니다. 학습을 개선하기 위해 평가 정보(assessment information)를 사용하는 것을 강조함으로써, 교육자는 자신의 방법이 진정으로 형성적 목적(formative purposes)에 부합하도록 보장할 수 있습니다.

학습 목표와의 연계 (Alignment with learning objectives)

평가와 학습 목표(learning objectives) 간의 연계(Alignment)는 형성적 관행이 목적이 분명하고(purposeful) 효과적으로 표적화(targeted)되도록 보장합니다. 학습 목표가 명확히 정의될 때, 학생들은 자신에게 기대되는 바를 더 잘 이해하고 관련 역량(relevant competencies)을 숙달하는 데 노력을 집중할 수 있습니다. 이러한 연계는 평가의 '무엇(what)'과 '왜(why)'를 교육의 바람직한 성과(desired outcomes)와 연결함으로써 유의미한 학습 경험(meaningful learning experiences)을 배양합니다 [19,28,42–44].

 

미국 대학원 의학교육 인증위원회(ACGME) 마일스톤과 같은 역량 중심 프레임워크(Competency-based frameworks)는 필수 기술, 지식, 태도를 평가하기 위한 구조적 토대(structured foundation)를 제공합니다. 명확한 벤치마크(benchmarks)를 수립함으로써, 이러한 프레임워크는 교육자와 학습자 모두를 목표화된 전문적 성장(targeted professional growth)으로 이끌며, 평가가 핵심 역량(critical competencies)에 집중하도록 보장합니다 [45,46].

  • 예를 들어, 환자 중심 의사소통(patient-centered communication)과 관련된 목표는 학습자가 생활 습관 교정(lifestyle modifications)에 대해 표준화 환자(standardized patients, SPs)를 상담하는 역할극 시나리오(role-play scenarios)를 통해 평가될 수 있습니다. 이러한 경우의 피드백은 의사소통의 명확성, 공감(empathy), 공유 의사결정(shared decision-making)과 같은 핵심 요소에 초점을 맞춰야 하며, 이는 효과적인 임상 진료(clinical practice)에 필요한 대인 관계 기술(interpersonal skills)을 강화합니다 [47,48].

특정 역량에 집중함으로써, 피드백은 학습자가 자신의 진전과 개선이 필요한 영역(areas for improvement)을 이해하도록 돕고, 학습 목표와 실제적인 기술 개발(practical skill development) 사이에 더 깊은 연결을 형성합니다. 이러한 연계는 평가와 피드백이 함께 작용하여 이론적 지식과 임상 적용(clinical application) 사이의 격차를 메우도록(bridge the gap) 보장합니다.

 

의학적 역량(medical competencies)을 포괄적으로 평가하기 위해, 평가는 전문직 수행(professional practice)에 요구되는 지식, 기술, 능력 및 기타 특성(KSAOs: knowledge, skills, abilities, and other characteristics)의 전체 스펙트럼(full spectrum)을 다루어야 합니다. 밀러의 임상 역량 피라미드(Miller’s Pyramid of Clinical Competence) [49,50]는 가치 있는 프레임워크로 작용하며, '아는 것(knows)', '방법을 아는 것(knows how)', '수행해 보이는 것(shows how)', '실제로 수행하는 것(does)'의 네 단계에 걸친 발전을 강조합니다.

  • 예를 들어 외과 전공의 프로그램(surgical residency programs)에서, 이 프레임워크는 여러 도메인(multiple domains)에 걸친 평가 전략을 안내할 수 있습니다. 임상 지식은 필기 또는 구두 시험(written or oral exams)을 통해, 기술적 술기(technical skills)는 모의 시술(simulated procedures)을 통해, 그리고 실제 적용(practical application)은 실제 수술 사례에 대한 직장 기반 평가(workplace-based evaluations)를 통해 테스트될 수 있습니다 [51,52].
  • 이와 같은 층위화되고(layered) 목표 주도적인 접근법(objective-driven approach)은 학습자가 기초적인 이해(foundational understanding)와 실제적인 전문성(practical expertise)을 모두 개발하도록 보장합니다.

 

평가를 학습 목표와 연계하는 데 있어서의 투명성(Transparency)은 신뢰(trust)를 조성하고, 공정성(fairness)을 촉진하며, 학생의 동기(motivation)를 지원합니다. 루브릭(rubrics), 체크리스트(checklists), 또는 미니 임상 평가 연습(Mini-CEX)과 같은 평정 척도(rating scales)와 같은 도구들은 수행 평가를 위한 구조화된 기준(structured criteria)을 제공합니다 [53–55].

  • 루브릭은 기대치(expectations)를 명확히 하여 학생들에게 성공을 위한 로드맵(roadmap for success)을 제공하는 동시에 교육자가 객관성(objectivity)을 유지하도록 돕습니다. 연구에 따르면 명확한 루브릭은 평가 기준에 대한 학생들의 이해를 높일 뿐만 아니라 수행 능력도 향상시킵니다.
  • 예를 들어, Boursicot 등 [56]은 루브릭 기반 평가(rubric-based assessments)가 임상 환경에서 피드백의 질과 학생 성과(student outcomes)를 개선했다고 제안했습니다. 또한, 표준화된 도구(standardized tools)의 사용은 주관성(subjectivity)을 줄여 평가가 공평하고 신뢰할 수 있도록(equitable and reliable) 보장합니다 [57].

 

이러한 연계의 원칙(principles of alignment)을 통합하는 것은 평가가 성찰적(reflective)이고 교훈적인 관행(instructive practices) 모두로 기능하도록 보장합니다. 명확한 목표, 포괄적인 평가 프레임워크, 그리고 투명한 기준은 학생들이 의미 있는 성장(meaningful growth)에 집중할 수 있는 응집력 있는 학습 환경(cohesive learning environment)을 조성합니다. 더욱이, 이러한 관행은 교육자가 표적화된 피드백(targeted feedback)을 제공할 수 있게 하여, 학생들이 학습 목표를 달성하고 초과 달성(exceed)할 수 있게 하는 동시에 의료 현장(medical practice)의 복잡한 요구에 대비하도록 합니다 [58,59].

포용성과 공정성 (Inclusivity and fairness)

포용성(Inclusivity)은 효과적인 형성평가의 기초적인 원칙(foundational principle)으로, 배경(background), 능력(ability) 또는 기타 인구통계학적 특성(demographic characteristics)에 관계없이 모든 학생이 성공할 수 있는 공평한 기회(equitable opportunities)를 갖도록 보장합니다. 의대생들은 다양한 경험, 관점, 학습 요구(learning needs)를 가지고 있으며, 평가는 이러한 다양성을 반영하고 수용하도록(accommodate) 설계되어야 합니다. 포용성에 초점을 맞춤으로써, 교육자는 공정할 뿐만 아니라 모든 학생의 학습 경험을 향상시키는 평가 관행을 의도적으로 창출(intentionally create)할 수 있고 또 그래야 합니다 [60].

 

형성평가는 일회성의 고부담 평가(one-time high-stakes evaluations)보다는

  • 성장(growth), 개별화된 피드백(individualized feedback), 지속적인 개선(ongoing improvement)을 강조하기 때문에 본질적으로 더 공평합니다(inherently more equitable).
  • 학습자가 진전(progress)을 입증할 수 있는 다양한 기회(multiple opportunities)를 제공함으로써, 형성평가는 시험 불안(test anxiety)이나 단 한 번의 저조한 수행과 같은 외부 요인의 영향을 줄여줍니다.
  • 또한, 이는 다양한 학습 요구를 해결하고 성취 격차(achievement gaps)를 좁히는 데 도움이 되는 개인화된 지원(personalized support)을 가능하게 합니다 [61–63].

포용적인 형성평가는 문화적 편향(cultural bias)을 적극적으로 피하고 장애가 있는 학습자를 위한 접근성(accessibility)을 개선합니다. 예를 들어, 시뮬레이션의 시나리오는 연령, 성별, 민족(ethnicity), 사회경제적 지위(socioeconomic status)의 차이와 같은 다양한 환자 인구통계(diverse patient demographics)를 나타내야 합니다. 이러한 접근법은 학생들이 문화적 역량(cultural competence)과 민감성(sensitivity)을 개발하는 데 도움이 되는데, 이러한 기술은 효과적인 의료 수행에 중요하기 때문입니다 [64]. Tervalon과 Murray-García [65]는 환자 진료 개선에 있어 문화적 겸손(cultural humility)의 역할을 강조하며, 형성평가는 학생들이 통제되고 지지적인 환경(controlled and supportive environment)에서 이러한 기술을 연습할 수 있는 귀중한 기회를 제공합니다. 형성평가의 반복적인 특성(iterative nature)은 학습자가 자신의 강점을 인식하고, 도전을 해결하며, 목표를 향해 지속적으로 나아가도록 안내받는 포용적인 환경을 촉진합니다 [7].

 

명확하고 투명한 지침(Clear and transparent instructions)은 포용적인 형성평가의 또 다른 초석(cornerstone)입니다. 과제나 기대치에 있어서의 모호함(Ambiguity)은 의학 용어, 임상 실습 또는 특정 교육적 규범(educational norms)에 대한 노출이 적은 학생들에게 불균형하게 불이익(disproportionately disadvantage)을 줄 수 있습니다. 단계별 지침, 용어집(glossaries of terms), 준비 자료를 제공하는 것모든 학생이 무엇이 요구되는지에 대해 공유된 이해(shared understanding)를 갖도록 보장합니다. 이러한 조치들은 운동장을 평평하게 하고(level the playing field) 불필요한 인지 부하(cognitive load)를 줄여주어, 학생들이 자신의 능력을 입증하는 데 집중할 수 있게 합니다. 평가 명확성(assessment clarity)에 대한 연구는 성과 격차(performance disparities)를 줄이고 공정성을 높이는 데 있어 그 역할을 강조합니다 [66,67].

 

평가 관련 스트레스(assessment-related stress)를 해결하는 것 또한 형성평가 관행에서 포용성을 조성하는 데 중요합니다. 고압적인 환경(High-pressure environments)은 특히 추가적인 외부 또는 내부 압력에 직면할 수 있는 과소대표된 집단(underrepresented groups)의 성과를 저해할 수 있습니다. 저부담의 반복적인 평가를 강조하는 형성평가는 실수가 학습 과정의 필수적인 부분(integral to the learning process)으로 프레임화되는 심리적으로 안전한 공간(psychologically safe spaces)을 조성함으로써 이러한 어려움을 완화하는 데 도움이 됩니다. 예를 들어, 형성적 시뮬레이션 과제 후의 구조화된 디브리핑(structured debriefings)은 오류를 정상화(normalize errors)하고 성찰적 학습(reflective learning)을 장려하여, 실수를 귀중한 교육적 순간으로 변화시킬 수 있습니다. Dong 등 [68]은 심리적으로 안전한 환경이 학습 성과를 개선할 뿐만 아니라 학생의 안녕(well-being)을 향상시킨다는 것을 발견했으며, 이는 의학교육에서 포용적이고 지지적인 형성평가 전략의 중요성을 강화합니다.

 

마지막으로, 포용성은 평가 관행에 대한 지속적인 평가와 적응(ongoing evaluation and adaptation)을 요구합니다. 교육자는 학생들의 경험에 대해 정기적으로 피드백을 구해야 하며(seek feedback), 평가가 그들의 요구에 반응하도록 보장해야 합니다. 이 과정은 포용에 대한 장벽(barriers to inclusion)을 식별하고 지속적인 개선의 문화(culture of continuous improvement)를 촉진하는 데 도움이 됩니다 [69]. 포용성을 우선시함으로써, 형성평가는 다양한 학습자들을 더 잘 지원하여 그들이 의료 현장의 복잡하고 다면적인 세계에서 번창(thrive)할 수 있도록 준비시킬 수 있습니다.

타당도와 효능의 증거 (Evidence of validity and efficacy)

형성평가의 유용성(utility)을 보장하기 위해, 교육자는 타당도(validity)와 효능(efficacy) 모두에 대한 설득력 있는 증거를 수집하고 제공해야 합니다.

  • 타당도 증거(Validity evidence)는 평가가 의도된 구성 개념(intended constructs)을 정확하게 측정한다는 것을 보여주며, 결과에 대한 신뢰의 토대를 제공합니다. 반면,
  • 효능 연구(Efficacy studies)는 이러한 평가가 학습자 성과(learner outcomes)에 미치는 영향을 평가하여, 성장과 발달을 향상시키는 데 있어 그 실용적 가치를 강조합니다.

이 두 구성요소는 형성평가가 교육에서 왜 그리고 어떻게 효과적인 도구가 되는지에 대한 포괄적인 이해를 제공합니다.

 

효능 연구는 형성평가가 학습에 가져올 수 있는 구체적인 이점들을 더욱 명확히 보여줍니다. 예를 들어, Nicol과 Macfarlane‐Dick [70]은 자기 조절 학습(self-regulated learning)을 촉진하는 데 있어 형성적 피드백(formative feedback)의 역할을 강조했습니다. 피드백을 통해 학생들은 자신의 강점과 개선이 필요한 영역에 대한 더 명확한 이해를 얻게 되며, 이는 지속적인 발전을 위한 목표와 전략을 설정하도록 힘을 실어줍니다. 의학교육에서, 시뮬레이션 기반 평가(simulation-based assessments)는 형성적 접근법의 힘을 전형적으로 보여줍니다.

 

형성평가의 효능이나 영향을 평가할 때, 잠재적인 부정적 영향이나 의도하지 않은 결과(unintended consequences)를 신중하게 고려하는 것 또한 동등하게 중요합니다. 예를 들어, 너무 자주 시행되는 평가는 학생들을 압도하여(overwhelm) 스트레스와 불안을 고조시킬 수 있습니다. 이 점은 효능이 평가 도구 자체의 속성이 아니라, 의도된 사용 및 목적을 위한 평가 과정의 효과성(effectiveness of the assessment process)(평가 도구뿐만 아니라 실행 모델을 포함하여)을 특성화한다는 사실을 강조합니다(타당도의 개념화와 유사함) [71]. 마찬가지로, 모호하거나 일관성이 없는 피드백은 학습자의 동기를 꺾어(demotivate), 어떻게 개선해야 할지에 대해 불확실하게 만들 수 있습니다. 이러한 과제를 해결하기 위해, 교육자는 학생들의 반응에 주의를 기울이고(remain attuned), 평가 경험에 대한 피드백을 수집하며, 반복적인 개선(iterative refinements)을 수행해야 합니다. 평가의 빈도, 명확성, 관련성의 균형을 맞춤으로써, 교육자는 학습에 미치는 긍정적 영향을 극대화하면서 부정적인 부작용을 최소화할 수 있습니다. 이러한 지속적인 조정 과정은 형성평가가 효과적이면서도 학습자의 다양한 요구에 반응하도록(responsive) 보장합니다.

실천 포인트 (Practice points)

지속적이고 정기적인 평가 (Continuous and regular assessment)

  • 진전을 모니터링하기 위해 빈번한 저부담 평가(low stakes assessments)를 일정을 잡아 시행하십시오.
  • 다양한 학습 성과를 포착하기 위해 다양한 평가 방법(variety of assessment methods)을 사용하십시오.

학습 목표와의 연계 (Alignment with learning objectives)

  • 평가가 의도된 학습 목표(intended learning goals)를 직접 측정하도록 보장하십시오.
  • 목표를 반영하는 루브릭(rubrics)이나 기준(criteria)을 사용하십시오.

포용성과 공정성 (Inclusivity and fairness)

  • 모든 학습자가 접근 가능한(accessible) 평가를 설계하십시오.
  • 명확하고 객관적인 기준(objective criteria)을 사용하여 편향(biases)을 피하십시오.

타당도와 효능의 증거 (Evidence of validity and efficacy)

  • 평가 도구가 의도한 바를 측정하고 있는지, 그리고 의도된 학습자 성과(intended learner outcomes)를 낳고 있는지 확인하기 위해 정기적으로 검토하십시오.
  • 평가를 개선(refine)하기 위해 학생과 교수자로부터 피드백을 수집하십시오.

 

효과적인 형성적 피드백의 원칙 (Principles of effective formative feedback)

시기적절한 피드백 (Timely feedback)

피드백은 형성평가(formative assessment)의 초석(cornerstone)으로서, 학습자에게 자신의 수행(performance)에 대한 필수적인 통찰(essential insights)을 제공하고 발달을 안내합니다 [8,72]. 시기적절하고 구체적인 지도(timely and specific guidance)를 제공함으로써, 피드백은 학습자가 의미 있는 조정(meaningful adjustments)을 할 수 있도록 돕고, 학생들이 자신의 학습 과정에 능동적으로 참여할 수 있는 지지적인 학습 환경(supportive learning environment)을 조성합니다. 평가 중에 전달되는 즉각적인 피드백(prompt feedback)은 학생들이 피드백을 자신의 수행과 즉시 연결할 수 있도록 보장하여, 경험이 생생하게 남아있는 동안(while the experience remains fresh) 교정 조치(corrective measures)를 적용할 수 있게 합니다. 이러한 즉시성(immediacy)은 이론을 실제(practice)와 직접 연결함으로써 피드백의 관련성(relevance)을 강화하고 학습을 지원할 수 있습니다 [73]. 예를 들어, Svendsen 등 [74]은 시뮬레이션 직후의 즉각적인 디브리핑(immediate debriefing)이 술기 역량(procedural competence)의 유의미한 향상으로 이어짐을 발견했으며, 이는 고부담 학습 환경(high-stakes learning environments)에서 시기적절하고 표적화된 피드백(targeted feedback)의 변혁적 잠재력(transformative potential)을 강조합니다. 그러나 일반 교육학 [75] 및 산업-조직 맥락(industrial–organizational contexts) [76]의 연구들은 즉각적인 피드백이 항상 필수 조건(requirement)은 아님을 시사합니다; 사실, 어떤 과제들은 학습자 성과에 미치는 영향 측면에서 지연된 피드백(delayed feedback)으로부터 이득을 보기도 하는데, 이는 학습자에게 자기 성찰(self-reflection)과 자신의 수행에 대한 더 깊은 처리(deeper processing) 기회를 제공하기 때문입니다.

 

피드백의 최적의 타이밍(optimal timing)은 과제의 복잡성(complexity)과 본질(nature)에 달려있습니다 [75].

  • 더 단순하고 기술 기반의 과제(skill-based tasks)의 경우, 즉각적인 피드백이 종종 학습 효율성(learning efficiency)을 높입니다.
  • 대조적으로, 임상 추론(clinical reasoning)과 같이 더 복잡한 과제의 경우, 지연된 피드백이 더 효과적일 수 있습니다.

지연(예: 며칠 간의)은 학습자가 자신의 수행을 성찰할 시간을 허용하여, 더 깊은 인지적 처리(deeper cognitive processing)와 기저 원리(underlying principles)에 대한 더 철저한 이해를 촉진합니다. Van der Kleij 등 [77]은 이러한 성찰 기간(reflective period)이 학습자가 자신의 추론을 비판적으로 평가하고 피드백을 미래의 실습에 의미 있게 통합하는 능력을 향상시킬 수 있다고 강조합니다. 따라서, 과제와 학습자의 요구(learner needs)에 맞춘 피드백 타이밍에 대한 미묘한 접근(nuanced approach)은 교육적 영향을 극대화하는 데 필수적입니다.

구체적인 피드백 (Specific feedback)

피드백에서의 구체성(Specificity) 또한 동등하게 중요합니다(critical). '잘했음(Good job)'이나 '개선이 필요함(Needs improvement)'과 같은 일반적인 코멘트(General comments)는 의미 있는 변화를 이끌어낼 가능성이 낮습니다. 대조적으로, 구체적인 오류(specific errors)를 짚어내고 교정 전략(corrective strategies)을 제안하는 상세한 피드백(detailed feedback)은 개선을 촉진합니다. Shute [72]는 오류의 본질과 실행 가능한 제안(actionable suggestions)을 명시하는 표적화된 피드백(targeted feedback)이 학습자 성과를 향상시키는 데 있어 모호하거나 지나치게 일반적인 코멘트보다 훨씬 더 뛰어난 성과를 냈음을 입증했습니다. 예를 들어, 객관구조화진료시험(OSCEs)에서 학생이 환자 병력 청취(patient history-taking) 연습 중에 어려움을 겪는다면, 효과적인 피드백은 단서 식별의 어려움(difficulties identifying cues)이나 조기 종결(premature closure)과 같은 정밀한 문제(precise issues)를 식별하고, 이를 해결하기 위한 실용적인 전략을 제안할 것입니다 [78]. 이러한 수준의 구체성은 기대치(expectations)를 명확히 할 뿐만 아니라 개선할 수 있다는 능력에 대한 학습자의 자신감(confidence)을 구축합니다 [79,80].

개선할 영역과 강점 모두에 대한 포괄 (Coverage of both areas for improvement and strengths)

효과적인 피드백은 근본적으로 미래 지향적(future-oriented)입니다; 이는 학습자에게 어떻게 개선할지에 대한 명확한 지침을 제공함으로써 현재의 수행과 바람직한 학습 목표 사이의 격차를 메우는 것(bridge the gap)을 목표로 합니다 [81]. 단순히 오류나 과거의 결점(shortcomings)을 지적하거나 수행을 칭찬하는 것보다는, 피드백은 학습자가 지식과 기술을 발전시키기 위해 다음에 어떤 조치를 취해야 할지(what steps to take next) 이해하도록 돕는 데 초점을 맞춰야 합니다 [82]. 이러한 미래를 내다보는 관점(forward-looking perspective)은 복잡한 역량(complex competencies)의 지속적인 개발이 끊임없는 성찰과 조정을 필요로 하는 의학교육에서 매우 중요합니다.

 

이러한 이해에도 불구하고, 일부 의학교육 문헌은 여전히 '피드백 샌드위치(feedback sandwich)'와 같은 구조화된 피드백 모델을 지지합니다 [83,84]. 이 접근법은 동기를 유지하고 비판을 부드럽게 하려는(softening criticism) 의도로 두 겹의 긍정적인 코멘트 사이에 비판적 피드백(critical feedback)을 전달하는 것을 포함합니다. 그러나 연구에 따르면 피드백 샌드위치는 명확성을 희석시키고(diluting its clarity) 덜 진실되거나(less sincere) 실행 가능하지 않은 것처럼 보이게 만듦으로써 건설적 피드백(constructive feedback)의 효과성을 약화시킬 수 있습니다 [29]. 학생들은 또한 초반의 칭찬 진술(praise statement)에 고착(anchor)되어 자신의 수행을 과대평가하게 되고, 결과적으로 의미 있는 개선의 기회를 제한할 수 있습니다. 연구는 학생들이 인위적인 프레임(artificial framing) 없이 개선이 필요한 영역에 초점을 맞춘 직접적이고 구체적인 피드백으로부터 더 많은 이득을 얻는다는 것을 보여줍니다 [29,85]. 이러한 접근법은 학습자가 자신의 진전에 대한 주도권(ownership)을 갖도록 장려하고 교수자와 학생 간의 더 의미 있는 대화를 조성합니다.

 

궁극적으로, 효과적인 피드백은 타이밍, 구체성, 그리고 강점과 개선할 영역 모두에 대한 포괄을 신중하게 고려해야 하는 역동적인 과정(dynamic process)입니다. 그러나 일부 출판물에서 여전히 권장되는 피드백 샌드위치와 같은 구조는 최적의 접근법이 아닐 수 있습니다. 학습자의 요구와 과제의 복잡성에 피드백을 맞춤화하고(tailoring), 피드백 제시 순서(order of feedback presentation)에 대한 기존 연구를 활용함으로써, 교육자는 그 영향을 극대화하여 즉각적인 수행 개선(immediate performance improvement)과 장기적인 기술 개발(long-term skill development) 모두를 지원할 수 있습니다.

실천 포인트 (Practice points)

시기적절한 피드백 (Timely feedback)

  • 피드백 타이밍은 과제 복잡성(task complexity)과 학습자 요구(learner needs)를 모두 고려해야 합니다.
  • 객관적 평가(objective assessments)에 대한 빠른 회신(quick turnaround)을 위해 자동화 도구(automated tools)를 사용하십시오.

구체적인 피드백 (Specific feedback)

  • 일반적인 코멘트보다는 실행 가능한 통찰(actionable insights)에 집중하십시오.
  • 학생의 작업물에서 구체적인 예시(specific examples)를 강조하십시오.

개선할 영역과 강점 모두에 대한 포괄 (Coverage of both areas for improvement and strengths)

  • 건설적 비판(constructive criticism)과 긍정적 강화(positive reinforcement)의 균형을 맞추십시오.
  • 무엇이 잘 수행되었고 무엇이 개선될 수 있는지를 식별함으로써 성장(growth)을 장려하십시오.

형성평가와 피드백의 방법 (Methods of formative assessment and feedback)

동료 평가 (Peer assessment)

동료 평가(Peer assessment)는 형성평가 접근법의 일부로 널리 사용됩니다. 이는 학생들이 서로를 평가하고 서로로부터 배우게 함으로써 협력 학습(collaborative learning), 비판적 사고(critical thinking), 그리고 전문적 성장(professional growth)을 배양합니다. 명확한 지침(clear guidelines)과 적절한 훈련(adequate training)과 함께 실행될 때, 이는 교수자 주도 평가(instructor-led evaluations)에 대한 가치 있는 보완책(valuable complement)이 되며, 학습 과정에 대한 능동적 참여(active engagement)를 촉진하는 동시에 수행에 대한 다양한 관점(diverse perspectives)을 제공합니다 [86,87]. Lovink 등 [88]은 동료 피드백이 학생들의 의사소통 기술(communication skills)을 향상시키는 동시에 지지적이고 동료적인 학습 환경(supportive and collegial learning environment)을 유지한다는 것을 발견했습니다.

 

예를 들어, 약리학(pharmacology)에 대한 팀 기반 학습(team-based learning) 세션에서, 학생들은 서로가 제안한 치료 계획(treatment plans)을 평가할 수 있습니다. 이 연습은 학습자들이 자신의 추론(reasoning)을 분명히 표현하고, 접근법을 비교하며, 대화와 비평(dialogue and critique)을 통해 이해를 정교화(refine)하도록 장려합니다 [89,90]. Topping [91]의 연구는 특히 초인지적 인식(metacognitive awareness)과 대인 관계 기술(interpersonal skills)에 미치는 긍정적인 효과 측면에서 동료 평가의 이점을 강조합니다. 동료 피드백에 참여하는 것은 수신자(receiver)에게 이익이 될 뿐만 아니라 제공자(provider)에게도 상당한 가치를 제공합니다. 학생들은 단순히 자신들이 피드백을 받는 것보다 다른 사람의 과제를 평가함으로써 자신의 기술 개발과 이해에 대해 종종 더 깊은 통찰(deeper insights)을 얻습니다 [92]. 동료 평가에 참여함으로써, 학생들은 비판적 자기 성찰 능력(critical self-reflection abilities)을 개발하는 동시에 다양한 관점(diverse viewpoints)을 존중하는 법을 배우며, 더 풍부한 학습 경험을 조성합니다 [93].

 

이러한 장점에도 불구하고, 동료 평가에 어려움이 없는 것은 아닙니다. 잠재적 편향(potential bias), 솔직한 비평을 제공하는 것에 대한 불편함(discomfort), 또는 피드백 품질의 불일치(inconsistency in feedback quality)와 같은 문제들은 선제적으로 해결(addressed proactively)되어야 합니다. 구조화된 훈련(Structured training)은 필수적이며, 학생들에게 건설적이고(constructive), 존중하며(respectful), 객관적 기준(objective criteria)에 근거한 피드백을 전달하는 방법을 가르쳐야 합니다. 체크리스트(checklists)나 루브릭(rubrics)과 같은 도구는 과정을 표준화(standardize)하고 신뢰성(reliability)을 높일 수 있습니다. 예를 들어, 학생들이 임상 추론(clinical reasoning)이나 의사소통과 같은 특정 역량(specific competencies)에 집중하도록 안내하는 것은 그들의 비평이 관련성 있고 실행 가능하도록(relevant and actionable) 보장합니다 [94].

 

의학교육의 맥락에서, 동료 평가는 학생들이 헬스케어의 협력적 본질(collaborative nature)에 대비하도록 합니다. 효과적인 팀워크와 의사소통은 다학제적 진료(multidisciplinary care)에 필수적이며(integral), 동료 평가에 대한 조기 노출(early exposure)은 학생들이 이러한 필수 역량을 갖추도록 합니다. Cestone과 Michaelsen [95]은 임상 훈련에서의 동료 평가가 대인 관계 기술을 향상시키고 팀 기반 환경(team-based environments)에 대한 준비도(readiness)에 기여함을 입증했습니다.

 

구조화되고 실제적인(authentic) 동료 평가 관행은 실천 기반 학습 및 개선(practice-based learning and improvement)에 있어 학부 의학교육을 위한 기초 역량(Foundational Competencies for Undergraduate Medical Education) [96]과 밀접하게 일치합니다. 이는 수행 향상을 위해 피드백을 적극적으로 구하고 통합하는 것, 성장 기회를 식별하기 위해 성찰적 실천(reflective practice)에 참여하는 것, 그리고 학습 목표를 설정하고 재평가하는 것 등을 포함합니다. 이러한 관행은 또한 학생들이 증거를 비판적으로 평가(critically appraise)하고 종합(synthesize)하도록 장려하여, 탐구(inquiry)와 평생 학습(lifelong learning)을 촉진하는데, 이는 환자 중심 진료(patient-centered care)를 제공하기 위한 필수 기술입니다.

 

구조화되고 실제적인 동료 평가 관행을 활용함으로써(leveraging), 교육자는 책무성(accountability), 성찰, 그리고 상호 존중(mutual respect)을 장려하는 지지적이면서도 도전적인 학습 환경을 조성할 수 있습니다. 이는 개인의 성과를 향상시킬 뿐만 아니라 의료 환경(healthcare settings)에서의 성공에 필요한 협력 기술을 배양합니다.

시뮬레이션과 실습 연습 (Simulations and practical exercises)

객관구조화진료시험(Objective Structured Clinical Examinations, OSCEs)은 임상 기술을 체계적으로 평가하기 위해 구조화되고 표준화된 환경을 제공함으로써 의학교육의 초석(cornerstone)이 되었습니다 [79,80,97]. 예를 들어, 심장 검진(cardiac examination)에 초점을 맞춘 OSCE 스테이션에서, 학생들은 환자 병력, 신체 검진 소견(physical examination findings), 진단적 추론을 일관된 임상적 판단(coherent clinical judgments)으로 종합하는 능력을 평가받습니다. 이러한 평가 후의 즉각적인 피드백(Immediate feedback)은 매우 귀중한데(invaluable), 이는 교육자가 오해를 명확히 하고(clarify misconceptions), 올바른 기술을 강화하며(reinforce), 학생들을 더 높은 수준의 숙련도(proficiency)로 이끌 수 있게 하기 때문입니다. 이러한 구조화된 피드백 루프(structured feedback loop)는 학습이 능동적이고 반응적(responsive)이 되도록 보장하며, 개인의 요구에 적응하게 합니다 [98,99].

 

시뮬레이션(Simulations)은 학습자가 임상 기술, 의사결정, 팀워크를 개발하고 정교화할 수 있는 통제되고 위험 없는 환경(risk-free environments)을 제공합니다. 이러한 시나리오는 형성평가에 특히 가치가 있으며, 교육자에게 학습자가 활동하는 것을 관찰하고 즉각적이고 표적화된 피드백을 제공할 기회를 제공합니다. 실제 환자에게 위험을 주지 않으면서 실제 세계의 도전(real-world challenges)을 복제함으로써, 시뮬레이션은 안전하면서도 현실적인(safe, yet realistic) 환경에서 기술 습득(skill acquisition)과 자신감 구축을 지원합니다 [100,101].

 

예를 들어, 심정지 시나리오의 고충실도 시뮬레이션(high-fidelity simulation)은 학생들이 역동적이고 상호작용적인 방식으로 전문 심장 소생술(Advanced Cardiac Life Support) 프로토콜을 연습할 수 있게 합니다. 교육자는 흉부 압박(chest compressions)의 깊이와 타이밍 같은 기술적 술기(technical skills)뿐만 아니라 팀 의사소통 및 리더십과 같은 비기술적 술기(non-technical skills)도 평가할 수 있습니다. 종종 시뮬레이션의 비디오 녹화로 지원되는 디브리핑 세션(Debriefing sessions)은 성찰과 피드백을 위한 필수적인 기회를 제공합니다. 이러한 즉각적인 검토 과정(immediate review process)은 학습을 강화하고, 학생들이 개선해야 할 구체적인 영역을 식별하도록 도우며, 올바른 기술과 프로토콜을 공고히 합니다(solidifies) [102,103].

 

시뮬레이션 기반 학습의 효능(efficacy)은 증거에 의해 잘 뒷받침됩니다. Mazzone 등 [104]의 메타 분석은 시뮬레이션 기반 훈련이 전통적인 교수법에 비해 임상 역량(clinical competence)을 유의미하게 향상시킨다는 것을 입증했습니다. 시뮬레이션 중의 즉각적인 피드백은 이러한 개선의 결정적인 요인(crucial factor)으로 확인되었으며, 학습자가 오류를 즉시 수정하고 나쁜 습관이 형성되는 것을 피할 수 있게 합니다.

 

시뮬레이션은 마네킹 기반 시나리오(mannequin-based scenarios)에만 국한되지 않습니다. 환자 역할을 연기하도록 훈련된 배우인 표준화 환자(Standardized patients, SPs)는 의사소통, 진단적 추론, 전문직업성(professionalism)을 개발하고 평가하는 데 광범위하게 사용됩니다. 예를 들어, 나쁜 소식 전하기(breaking bad news) 기술을 가르치기 위해 설계된 SP와의 만남에서, 학생들은 공감(empathy)과 명확성을 가지고 어려운 정보를 전달하는 것을 연습합니다. SP와 교수자 양쪽으로부터의 피드백은 이중 관점(dual perspective)을 제공하여, 학습자가 정서 지능(emotional intelligence)과 전문직업성을 향상시키는 동시에 의사소통 접근법을 정교화하도록 돕습니다 [105,106]. 또한, 인공지능(AI) 기반 시뮬레이션(artificial intelligence (AI)-driven simulations)이 의학교육에서 가치 있는 도구로 부상하고 있습니다. 이러한 시뮬레이션은 높은 수준의 현실감(realism)으로 복잡한 환자 시나리오를 복제할 수 있으며 즉각적인 데이터 기반 피드백(data-driven feedback)을 가능하게 합니다. AI 시뮬레이션은 학습자의 수행에 적응하여, 학생들이 통제되고 위험 없는 환경에서 임상 기술을 연습하고, 의사결정을 정교화하며, 진단적 추론을 개선하도록 돕는 개인화되고 역동적인 피드백(personalized, dynamic feedback)을 제공할 수 있습니다 [107].

 

시뮬레이션은 또한 학제 간 협력(interdisciplinary collaboration)을 촉진하여 학생들이 팀 기반 의료의 복잡성에 대비하도록 합니다. 예를 들어, 간호대생, 약대생, 의대생이 환자 사례에 대해 함께 작업하는 전문직 간 시뮬레이션 연습(interprofessional simulation exercises)은 상호 존중, 공유 의사결정(shared decision-making), 조정된 진료(coordinated care)를 개발하는 데 도움이 됩니다. 연구들은 그러한 경험이 팀워크 역량과 실제 의료 환경에 대한 준비도를 향상시킨다는 것을 보여주었습니다 [108].

 

시뮬레이션을 형성평가에 통합하는 것은 기술적 및 비기술적 술기를 향상시킬 뿐만 아니라 지속적인 학습(continuous learning)과 성찰의 사고방식(mindset)을 주입합니다. 현실적인 시나리오를 시기적절한 피드백 및 성장 기회와 혼합함으로써, 시뮬레이션은 학습자가 훈련에서 임상 실습으로 자신감 있게 전환(transition)하도록 힘을 실어줍니다.

서면 및 구두 피드백 (Written and verbal feedback)

피드백의 형식(format)과 전달(delivery)은 의학교육 내 형성평가에서의 효과성에 상당한 영향을 미칩니다.

  • 서면 피드백(Written feedback)은 학생들이 다시 방문할 수 있는 지속적인 참조(durable reference)를 제공하여, 더 깊은 성찰과 장기적인 학습을 촉진합니다.
  • 대조적으로, 구두 피드백(verbal feedback)은 즉각적인 명확화(clarification)와 대화를 용이하게 하여, 학생들이 질문을 하고, 오해를 해결하며, 핵심 개념에 대한 이해를 심화시킬 수 있게 합니다.
  • 결합되었을 때, 이러한 접근법들은 성찰과 실시간 상호작용(real-time interaction)의 균형을 맞춤으로써 피드백의 전반적인 영향을 향상시킵니다.

예를 들어, Veloski 등 [109]은 서면 및 구두 요소를 종종 통합하는 다면 피드백(multisource feedback)이 의대생들의 대인 관계 기술과 임상 추론을 향상시켰음을 입증했으며, 이는 피드백 전달에 있어 다중 모드 접근법(multimodal approach)의 가치를 강조합니다.

 

임상 술기 평가에서, 서면 피드백과 구두 피드백을 통합하는 것은 특히 효과적인 것으로 입증되었습니다. 예를 들어, 학생은 정보 수집, 가설 생성, 증례 발표(case presentation)와 같은 영역에 초점을 맞춘 자신의 진단적 추론 접근법에 대해 상세한 서면 피드백을 받을 수 있습니다. 그 후 이 서면 피드백은 적극적 경청(active listening)이나 환자 중심 질문하기와 같은 효과적인 의사소통 기술을 교수자가 모델링하는 구두 피드백으로 보완될 수 있습니다. 서면 피드백의 지속성(durability)과 구두 피드백의 즉시성(immediacy) 및 개인화(personalization)를 결합함으로써, 교육자는 미묘한 학습(nuanced learning)과 지속적인 개선을 지원하는 피드백 시스템을 만듭니다 [110].

실천 포인트 (Practice points)

동료 평가 (Peer assessment)

  • 학생들에게 동료에게 건설적인 피드백(constructive feedback)을 제공하도록 훈련시키십시오.
  • 일관성을 보장하기 위해 구조화된 지침(structured guidelines)이나 루브릭을 사용하십시오.

시뮬레이션과 실습 연습 (Simulations and practical exercises)

  • 응용 기술(applied skills)을 평가하기 위해 실제 세계 시나리오(real world scenarios)를 통합하십시오.
  • 시뮬레이션 중이나 후에 즉각적인 피드백(immediate feedback)을 제공하십시오.

서면 및 구두 피드백 (Written and verbal feedback)

  • 상세하고 문서화된 통찰(documented insights)을 위해 서면 피드백(written feedback)을 사용하십시오.
  • 명확성과 참여도(engagement)를 위해 구두 피드백(verbal feedback)으로 보완하십시오.

교수자와 학습자의 역할 (Instructor and learner roles)

학생 자기성찰 기회의 제공자로서의 교수자 (Instructors as providers of student self-reflection opportunities)

자기성찰(Self-reflection)은 평생 학습(lifelong learning)의 초석이자 의학 분야의 전문직업성 개발(professional development)에 있어 결정적인 요소(critical element)입니다. 형성평가에 자기성찰의 기회를 통합함으로써, 학습자들이 자신의 수행을 비판적으로 평가하고, 개선이 필요한 영역을 식별하며, 자신의 임상 의사결정 과정(clinical decision-making processes)에 대한 더 깊은 이해를 발전시킬 수 있도록 돕습니다. 이러한 관행은 역동적이고 종종 예측 불가능한 헬스케어 분야에서 필수적인 기술인 적응성(adaptability)을 지원합니다. 이는 또한 자신의 지식과 기술을 지속적으로 평가하고, 피드백을 구하며, 환자 진료의 진화하는 도전(evolving challenges)을 충족시키기 위해 의도적 연습(deliberate practice)에 참여하는 마스터 적응적 학습자(Master Adaptive Learner)의 개념과도 일치합니다 [111].

 

성찰 일지(reflective journals), 가이드된 자기평가 양식(guided self-assessment forms), 주석이 달린 모범 사례(annotated exemplars)와 같은 구조화된 도구들은 자기성찰 과정을 효과적으로 비계 설정(scaffold)할 수 있습니다 [8,112,113]. 예를 들어, 증례 기반 시뮬레이션(case-based simulation)을 완료한 후, 학생들은 자신의 진단적 추론 접근법(diagnostic reasoning approach)을 평가하기 위해 루브릭(rubric)을 사용하여 강점과 정교화가 필요한 영역(areas for refinement)을 모두 식별할 수 있습니다. 모범적인 접근법과 차선(suboptimal)의 접근법을 예시하는 주석이 달린 모범 사례는 학습자가 품질 벤치마크(quality benchmarks)를 인식하고 효과적인 임상 실습의 뉘앙스를 이해하도록 추가로 안내할 수 있습니다 [114]. 이러한 도구들은 집중적이고 생산적인 성찰을 위한 구체적인 프레임워크(tangible framework)를 제공합니다.

 

의학교육에서 자기성찰의 이점은 잘 입증되어 있습니다(well-documented). Schön [115]은 성찰적 실천(reflective practice)을 '행위에 대한 사고(thinking on action)'와 '행위 중 사고(thinking in action)'로 특징지었으며, 이는 전문가들이 자신의 경험을 분석하고 복잡한 임상 시나리오에 적응할 수 있게 하는 과정입니다. 이 토대 위에서, Mamede와 Schmidt [116]는 자기성찰이 의대생들, 특히 미묘한 임상 추론(nuanced clinical reasoning)을 요하는 어려운 증례에서 진단 정확도(diagnostic accuracy)를 유의미하게 향상시켰음을 입증했습니다. 이러한 발견들은 이론적 지식과 실제 적용(practical application)을 연결하고 역량(competence)과 자신감(confidence)을 모두 높이는 데 있어 자기성찰의 역할을 강조합니다.

 

교육자는 내성(introspection)과 개방적 대화(open dialogue)를 장려하는 환경을 조성함으로써 자기성찰을 촉진하는 데 중요한 역할(vital role)을 합니다 [117]. 개방형 질문(open-ended questions)을 중심으로 피드백 토론을 구성하면 학습자가 자신의 사고 과정을 명확히 표현하고 자신의 성장에 대한 주도권(ownership)을 갖도록 유도할 수 있습니다. 예를 들어:

  • 이 과제의 어떤 측면이 가장 성공적이었다고 느끼나요?
  • 어떤 어려움에 직면했으며, 그 원인이 된 요인은 무엇인가요?
  • 유사한 상황에 직면한다면, 어떻게 다르게 접근하겠습니까?

그러한 질문들은 학습자가 표면적인 수준의 평가(surface-level evaluations)를 넘어 자신의 수행에 대한 더 깊은 분석(deeper analysis)에 참여하도록 장려합니다. 이 접근법은 이해를 높일 뿐만 아니라 자신의 전문적 개발에 대한 책무성(accountability)을 배양합니다.

 

궁극적으로, 자기성찰을 형성평가에 내재화(embedding)하는 것은 학습자에게 경력 전반에 걸쳐 지속적으로 개선할 수 있는 기술을 갖추게 합니다. 비판적 사고(critical thinking), 자기인식(self-awareness), 그리고 성장에 대한 헌신(commitment to growth)을 향상시킴으로써, 자기성찰적 관행은 의료 전문가들이 환자 진료의 가장 높은 표준을 유지하면서 해당 분야의 진화하는 도전에 맞설 준비가 되도록 보장합니다.

코치 및 촉진자로서의 교수자 (Instructors as coaches and facilitators)

형성평가는 교수자와 학습자가 학습 과정에서 능동적 협력자(active collaborators)로 참여할 때 가장 효과적입니다. 이 협력적 프레임워크에서, 교수자는 학생들을 평가 과정 내내 안내하는 촉진자(facilitators) 역할을 하며, 학습자는 개인 목표(personal goals)를 설정하고 자신의 진전을 모니터링함으로써 자신의 개발에 대한 주도권(ownership)을 갖습니다. 이러한 파트너십은 피드백이 능력에 대한 판단(judgment)이 아니라 지속적 개선(continuous improvement)과 성장을 위한 도구로 간주되는 환경을 조성합니다.

 

교수자는 효과적인 피드백 관행을 모델링(modeling)함으로써 결정적인 역할을 합니다. 그들은 건설적인 피드백을 제공할 뿐만 아니라 그것을 해석하고 미래의 수행에 통합하는 방법을 시연해야 합니다. 예를 들어, Cilliers와 Terblanche [118]는 교수자가 피드백 적용 방법에 대한 구체적 예시(concrete examples)를 제공했을 때, 학생들이 정보를 더 잘 내재화(internalize)하고 후속 과제에서 수행을 향상시키는 데 사용할 수 있었음을 발견했습니다. 이러한 모델링은 학생들이 피드백을 일회성 사건이 아니라 학습과 개발의 역동적 과정(dynamic process)으로 이해하도록 돕습니다.

 

교수자 주도 피드백(instructor-guided feedback) 외에도, 학습자는 자신이 받은 피드백에 기반하여 개인 학습 목표(personal learning goals)를 설정하도록 장려되어야 합니다. 이 관행은 학생들이 자신의 학습 궤적(learning trajectory)에 대해 책임을 지는 자기 조절 학습(self-regulated learning)의 개념과 일치합니다. Zimmerman [119]은 목표 설정, 진전 모니터링, 전략 조정을 통해 자기 조절에 참여하는 학생들이 그렇지 않은 학생들보다 더 뛰어난 성과를 내는 경향이 있다고 강조합니다. 자기성찰은 자기 조절에 정보를 제공하는 기초적인 초인지 기술(metacognitive skill)로 작용하여, 학생들이 개선을 위한 구체적인 조치를 취하기 전에 자신의 수행을 사려 깊게 평가할 수 있게 합니다. 개인 학습 목표를 설정하는 것은 학생들이 자신의 개발을 주도(take charge)하도록 힘을 실어주어, 피드백이 단순히 과거 수행에 대한 평가가 아니라 미래의 개선을 이끄는 성찰적 도구(reflective tool)가 되도록 보장합니다.

 

이 협력적 과정의 필수적인 구성요소는 교수자와 학습자 간의 지속적인 대화(ongoing dialogue)입니다. 피드백은 반복적(iterative)이어야 하며, 학생들이 정기적으로 목표를 다시 방문하고 진전을 평가해야 합니다. 이러한 지속적인 교환은 더 깊은 성찰을 촉진하여, 학생들이 시간이 지남에 따라 학습 전략을 조정하고 기술을 정교화할 수 있게 합니다. 더욱이, 이러한 접근법은 피드백을 구하고, 받고, 적용하는 능력이 지속적인 전문적 개발에 필수적인 의료 현장에서 학습자들이 평생 학습자(lifelong learners)로서의 미래 역할을 준비하도록 합니다.

 

이러한 지속적이고 협력적인 과정을 통해, 형성평가는 단순히 학생 성과를 평가하는 도구 이상의 것이 됩니다. 이는 자기인식, 비판적 사고, 개인적 책임(personal responsibility)을 배양하는 강력한 기제가 되어, 궁극적으로 의학교육에서 학문적 성장과 전문적 성장을 모두 향상시킵니다.

학습 과정의 능동적 참여자로서의 학생: 자기평가와 성찰 (Students as active participants in the learning process: Self-assessment and reflection)

자기평가(Self-assessment)는 의대생들이 자신의 강점과 약점에 대해 더 깊은 이해를 얻도록 힘을 실어주는 강력한 도구입니다. 형성평가 모델에 통합될 때, 자기평가는 학습 자료에 대한 비판적 관여(critical engagement)를 장려하고, 학생들이 자신의 작업을 성찰하며 자신의 학문적 및 임상적 발달에 대해 더 자기 인식적(self-aware)이 되도록 격려합니다 [120,121]. 학습자에게 자신의 수행을 평가할 수 있는 루브릭, 지침, 또는 구조화된 프레임워크를 제공함으로써, 교수자는 더 정확한 자기평가를 촉진할 수 있으며, 학생들이 자신의 인식을 객관적 기준(objective criteria) 및 기대치와 일치시키도록 보장할 수 있습니다.

 

자기평가의 핵심 이점은 효과적인 임상 추론 및 문제 해결 능력 개발에 필수적인 초인지 기술(metacognitive skills)을 배양한다는 점입니다. Sargeant 등 [122]의 연구는 정기적으로 자기평가를 실천한 의대생들이 향상된 임상 수행 능력을 보였음을 입증했습니다. 이러한 개선은 주로 지식의 공백(gaps in knowledge)을 식별하고 해결하는 능력에 기인하며, 이를 통해 가장 주의가 필요한 영역에 학습 노력을 집중할 수 있었습니다. 자신의 사고 과정과 학습 패턴을 성찰함으로써, 학생들은 의학 분야의 평생 학습과 전문적 역량(professional competence)에 중요한 자기 조절(self-regulation) 능력을 개발합니다.

 

이러한 이점들에도 불구하고, 연구는 정보가 부족한 포괄적 자기평가(uninformed global self-assessments), 특히 구체적인 표준을 참조하지 않고 이루어진 자기평가는 종종 부정확하며 직장 기반 교육과정(workplace-based curricula)에서 제한적인 가치를 가진다는 것을 일관되게 보여주었습니다. 지침이나 피드백 없이 순수하게 개인적 판단에만 근거한 자기평가는 수행에 대한 과대평가(overestimation) 또는 과소평가(underestimation)로 이어질 수 있습니다. 그 효과성을 높이기 위해, 학습자는 자신의 자기인식(self-perceptions)을 효과적인 형성평가 시스템의 핵심 구성요소인 알려진 벤치마크(known benchmarks) 및 학습 목표에 맞춰 보정(calibrating)하는 데 지원이 필요합니다. 학생들이 내부 성찰 및 외부 데이터와 함께 명확히 정의된 수행 표준(performance standards)을 통합할 때 정확도가 향상됩니다.

 

의학교육에서, 몇 가지 전략이 자기평가의 가치를 높일 수 있습니다. 여기에는 자기평가를 위한 적절한 콘텐츠 선택, 명시적 평가 기준(explicit assessment criteria) 제공, 피드백 추구 행동(feedback-seeking behaviors) 장려, 성장 마인드셋(growth mindset) 지원, 그리고 지지적인 환경 내에서 고품질의 피드백 제공이 포함됩니다. 이러한 접근법들은 자기평가의 정확성을 높일 뿐만 아니라 성찰에 대한 더 깊은 관여와 피드백에 대한 반응으로 더 의미 있는 행동(meaningful action)을 촉진합니다 [123–125].

 

자기성찰 모델(Self-reflection models)은 자기성찰 일지나 비디오 검토 연습(video review exercises)과 같은 구조화된 도구를 통해 형성평가에 통합될 때 특히 효과적입니다. 예를 들어, OSCE를 완료한 후, 학생들은 루브릭을 사용하여 자신의 수행을 검토하고 강점과 개선이 필요한 영역을 식별하는 논평(commentary)을 작성할 수 있습니다. 이 과정은 학습자가 수행 표준을 내재화하고, 개발에 대한 주도권을 가지며, 시간이 지남에 따라 자신의 진전을 추적하도록 돕습니다.

 

형성평가 모델에 자기평가를 통합하는 것은 궁극적으로 학생들의 초인지적 인식(metacognitive awareness)을 개선하고 지속적인 자기 개선(continuous self-improvement) 능력을 향상시킵니다. 학습자가 자신의 진전을 평가하고 수행에 대해 비판적으로 성찰하도록 장려함으로써, 자기평가는 임상 기술, 책무성(accountability), 그리고 전문직 표준(professional standards)에 대한 확고한 이해의 발달을 지원하며, 이는 의학교육과 실습에서의 성공에 필수적인 기술입니다 [123,126].

실천 포인트 (Practice points)

학생 자기성찰 기회의 제공자로서의 교수자 (Instructors as providers of student self-reflection opportunities)

  • 학생들이 자신의 수행을 성찰하고 목표를 설정하도록 장려하십시오.
  • 성찰 일지(reflective journals)나 자기평가 도구(self-assessment tools)를 사용하십시오.

코치 및 촉진자로서의 교수자 (Instructors as coaches and facilitators)

  • 단순히 내용을 전달하는 것이 아니라 학습 과정을 통해 학생들을 안내(Guide)하십시오.
  • 성장과 실험(experimentation)을 위한 지지적인 환경(supportive environment)을 조성하십시오.

학습 과정의 능동적 참여자로서의 학생 (Students as active participants in the learning process)

  • 학생들이 자신의 학습에 대한 주도권(ownership)을 갖도록 장려하십시오.
  • 평가 기준(assessment criteria)과 목표 설정에 그들을 참여시키십시오.

기술의 활용 (Leveraging technology)

온라인 평가 도구 및 역량 (Online assessment tools and capabilities)

의학교육이 지속적으로 진화함에 따라, 형성평가(formative assessment)에서의 기술 통합(integration of technology)은 학습 경험을 향상시키는 데 있어 점점 더 결정적인 역할(crucial role)을 하고 있습니다. 온라인 플랫폼(Online platforms), 학습 관리 시스템(learning management systems, LMSs), 그리고 디지털 도구들은 더 효율적인 피드백 전달을 가능하게 하고, 실시간 진전 추적(real-time progress tracking)을 용이하게 하며, 개인화된 학습(personalized learning) 및 피드백을 위한 기회를 제공합니다. 이러한 기술들은 또한 다양한 학습 선호도(diverse learning preferences)를 충족시킬 수 있는 상호작용적이고 참여를 유도하는 평가 경험(interactive and engaging assessment experiences)을 발전시켜, 학생들이 지속적으로 참여하고 동기를 부여받도록 보장합니다 [127,128].

 

형성평가에서 가장 널리 채택된 기술 활용 중 하나는 온라인 퀴즈(online quizzes)입니다. 이러한 디지털 평가는 즉각적인 피드백(immediate feedback)을 제공하여, 학생들이 학습 자료가 머릿속에 생생할 때(while the material is still fresh) 개선이 필요한 영역을 식별할 수 있게 합니다. 연구에 따르면 온라인 퀴즈는 기억 유지(retention)와 학생 성과를 유의미하게 향상시킬 수 있습니다. 예를 들어, Brown 등 [129]과 Thomas 등 [130]의 연구는 빈번한 저부담 퀴즈(frequent, low-stakes quizzes)가 지식의 장기 기억(long-term retention)을 향상시킬 수 있음을 입증했습니다. Bennett 등 [131]의 연구는 이러한 발견을 추가로 뒷받침하며, 즉각적인 피드백이 있는 온라인 퀴즈를 치른 의대생들이 진단 기술(diagnostic skills)과 기초 과학 개념(basic science concepts)의 이해에서 뚜렷한 개선을 보였음을 보여주었습니다. 이러한 즉각적인 강화(immediate reinforcement)는 학습자가 이해를 공고히 하고(solidify) 중요한 정보를 더 효과적으로 기억하도록 돕습니다.

 

이 리뷰의 이전 섹션에서 언급했듯이, 시뮬레이션(simulations), 특히 고충실도(high-fidelity) 시뮬레이션은 기술이 상당한 영향을 미치고 있는 또 다른 영역입니다. 가상 현실(Virtual reality, VR) 기술은 실제 경험을 필요로 하는 복잡한 의학적 시나리오를 시뮬레이션하기 위한 강력한 도구로 부상하고 있습니다. 예를 들어, VR은 복잡한 수술(intricate surgeries)이나 응급 의료 상황을 복제(replicate)하여, 학생들이 실제 임상 환경과 관련된 물류적 어려움이나 위험 없이(without the logistical challenges or risks) 절차를 연습하고 실시간 피드백(real-time feedback)을 받을 수 있게 합니다. 연구들은 VR을 포함한 시뮬레이션 기반 훈련이 임상 수행 능력(clinical performance)을 유의미하게 향상시킨다는 것을 입증했습니다 [132]. 이러한 기술을 사용하는 학생들은 안전하고 지지적인 환경(safe and supportive environment)에서 기술적 술기(technical skills)를 반복적으로 연습할 기회를 가지며, 고부담 상황(high-stakes situations)에 적용하기 전에 능력을 연마할 수 있습니다.

 

기술이 형성평가에서 제공하는 상당한 이점에도 불구하고, 교육자들은 이를 자신의 교수법에 사려 깊고 의도적으로 통합(integrate it thoughtfully and intentionally)해야 합니다. 기술은 대면 평가(in-person evaluations)나 직접 관찰(direct observations)과 같은 전통적인 평가 관행을 대체하는 것이 아니라 보완(complement, not replace)해야 합니다. 교수자들이 이러한 디지털 도구를 효과적으로 사용하는 데 필요한 적절한 훈련을 받아, 그 사용이 교육학적 목표(pedagogical goals)와 일치하고 전반적인 학습 경험을 향상시키도록 보장하는 것이 필수적입니다. 또한, 기술이 평가의 확장성(scalability)과 접근성(accessibility)을 높여주지만, 이것이 교육 기회의 불평등(inequities)을 악화시키지 않도록(exacerbate) 보장하는 것이 중요합니다. 모든 학습자가 이러한 발전으로부터 동등하게 혜택을 받을 수 있도록 적절한 인프라, 접근성 기능, 그리고 디지털 리터러시(digital literacy)가 고려되어야 합니다 [133].

피드백 분석 (Feedback analytics)

데이터 분석(Data analytics)은 학생 수행에 대한 상세한 통찰(detailed insights)을 제공하여 형성평가를 변화시키고 있으며, 이를 통해 더 개인화되고 효과적인 교수 전략(personalized and effective teaching strategies)을 가능하게 합니다 [134]. 수행 데이터의 분석을 통해, 교수자는 학생 학습의 패턴과 추세(patterns and trends)를 감지하고, 코호트(cohorts) 전반에 걸친 어려움이 있는 영역을 식별하며, 교수법을 개선하기 위해 데이터 기반 조정(data-driven adjustments)을 할 수 있습니다.

 

예를 들어, 피드백 분석(feedback analytics)은 학생들이 지속적으로 어려움을 겪는(consistently struggle) 공통 영역을 드러내어 교수자가 조기에 개입(intervene early)할 수 있게 합니다. 이러한 접근법은 학생들이 종종 복잡한 임상 과제(complex clinical tasks)나 추상적인 의학 개념(abstract medical concepts)을 숙달하는 데 어려움을 겪는 의학교육에서 특히 유익합니다. 연구들 [135,136]은 피드백 데이터 분석이 교수자가 학생들의 술기 능력(procedural skills)에 있는 격차를 정확히 찾아내는(pinpoint gaps) 데 어떻게 도움이 되었는지 입증했습니다. 이러한 식별은 더 표적화된 개입(targeted interventions)과 학습 성과 개선으로 이어져, 학생들이 특정 어려움 영역을 해결하는 데 필요한 지원을 받도록 보장했습니다.

 

더욱이, 데이터 분석은 맞춤형의 개인화된 피드백(tailored, personalized feedback)의 더 효과적인 전달을 가능하게 합니다. 시간의 흐름에 따른 개별 성과(individual performance)를 추적함으로써, 교수자는 각 학생의 고유한 강점 및 개선 영역과 일치하는 피드백을 제공할 수 있습니다. 이러한 개별화된 접근법(individualized approach)은 차별화된 수업(differentiated instruction) [137,138]에 대한 연구에 의해 뒷받침되는데, 이는 코호트 내의 다양한 학습 요구(diverse learning needs)를 인식하고 해결하는 것의 중요성을 강조합니다. 데이터 기반 피드백(data-driven feedback)을 통해, 교육자는 각 학생이 학습을 최적화하는 데 필요한 구체적인 지도를 받도록 보장할 수 있습니다.

 

개별 피드백을 개선하는 것 외에도, 피드백 분석은 교육과정 설계(curriculum design)에 정보를 제공할 수 있습니다 [139]. 다양한 코호트와 과정 전반에 걸친 학생 성과의 추세를 분석함으로써, 교육자는 학생들이 지속적으로 저조한 성과를 내는(underperform) 영역을 식별할 수 있습니다. 이러한 데이터는 교육과정 개발자가 이러한 격차를 해결하기 위해 내용, 교수 전략, 평가 방법을 정교화(refine)할 수 있게 합니다. 평가, 수업, 교육과정 설계 간의 이러한 지속적인 피드백 루프(ongoing feedback loop)는 지속적인 개선(continuous improvement)을 촉진하여, 교육 경험이 학생의 요구와 진화하는 모범 사례에 반응(responsive)하도록 유지합니다.

 

결론적으로, 형성평가에서 데이터 분석의 사용은 학생 진전을 모니터링하고, 문제를 조기에 식별하며, 개인화된 피드백을 제공하는 교육자의 능력을 향상시킵니다. 수행 데이터를 활용함으로써(leveraging), 교수자는 교수 전략을 미세 조정(fine-tune)하고, 맞춤형 지원을 제공하며, 교육과정 조정에 정보를 제공할 수 있어, 궁극적으로 향상된 학습 성과와 더 효과적인 의학교육으로 이어집니다.

AI의 윤리적 사용 (Ethical use of AI)

AI가 교육에 더욱 통합됨에 따라, 형성평가에서의 AI 사용은 학습을 향상시키면서 동시에 공정성(fairness), 투명성(transparency), 개인정보 보호(privacy)를 보호하도록 보장하기 위해 윤리적 원칙(ethical principles)에 의해 안내되어야 합니다. 자동 채점 시스템(automated grading systems)이나 피드백을 위한 챗봇(chatbots)과 같은 AI 도구들은 개인화된 평가(personalized assessments)를 확장(scale)할 잠재력을 제공하지만, 그 윤리적 함의(ethical implications)는 신중하게 고려되어야 합니다 [140–142].

 

주요 윤리적 우려 중 하나는 투명성(transparency)입니다. 형성평가에 사용되는 AI 시스템은 어떻게 결정을 내리는지에 대한 명확한 설명을 제공해야 합니다. 학생들은 자신의 수행이 AI에 의해 어떻게 평가되는지 이해할 필요가 있으며, 정확할 뿐만 아니라 의미 있고 실행 가능한(meaningful and actionable) 피드백에 접근할 수 있어야 합니다. Binns 등 [143]의 연구에 따르면, AI가 신속한 피드백을 전달할 수 있지만, 편향(bias)을 피하기 위해 공정성과 정확성을 염두에 두고 설계되어야 함을 발견했습니다. 특히, AI는 학생들이 이해하고 개선을 위해 사용할 수 있는 방식으로 자신의 추론을 설명할 수 있어야 하며, 이를 통해 학생들이 피드백 과정(feedback process)을 신뢰하도록 보장해야 합니다.

 

개인정보 보호와 데이터 보안(Privacy and data security) 또한 가장 중요합니다(paramount). 학생 수행 데이터의 민감한 본질(sensitive nature)을 고려할 때, AI 시스템은 학습자의 개인 정보를 보호하고 개인정보 보호법 및 윤리적 표준을 준수해야 합니다. 윤리적 지침(Ethical guidelines)은 데이터가 수집, 저장, 사용되는 방식을 규정하여, 그것이 착취되거나 오용(exploited or misused)되지 않도록 보장해야 합니다. 평가에서 AI의 역할은 인간 교수자를 대체하는 것이 아니라 보완(complement, not replace)해야 하며, 특히 의사소통이나 대인 관계 기술 평가와 같이 인간의 판단(human judgment)과 정서 지능(emotional intelligence)이 필수적인 영역에서는 더욱 그렇습니다. AI는 확장 가능한(scalable) 피드백을 제공함으로써 지원할 수 있지만, 특히 복잡한 시나리오에서 AI가 부족할 수 있는 미묘한 통찰(nuanced insights)을 제공하기 위해 인간 교수자가 계속 관여해야 합니다.

 

결론적으로, AI는 형성평가를 향상시킬 상당한 잠재력(significant promise)을 가지고 있지만, 그 사용은 투명성, 공정성, 개인정보 보호, 그리고 학습 과정에서 인간 관여(human involvement)의 지속적인 중요성을 우선시하는 윤리적 표준을 준수해야 합니다 [16].

실천 포인트 (Practice points)

온라인 평가 도구 및 역량 (Online assessment tools and capabilities)

  • 실시간 평가(real-time assessment)를 위해 퀴즈, 투표(polls), 상호작용 모듈과 같은 플랫폼을 사용하십시오.
  • 효율성을 위해 채점과 피드백을 자동화(Automate)하십시오.

피드백 분석 (Feedback analytics)

  • 공통적인 과제와 추세를 식별하기 위해 피드백 데이터(feedback data)를 분석하십시오.
  • 수업과 지원을 맞춤화(tailor)하기 위해 통찰(insights)을 사용하십시오.

AI의 윤리적 사용 (Ethical use of AI)

  • AI 도구가 투명하고 편향이 없도록(free from bias) 보장하십시오.
  • AI를 인간의 판단을 대체하는 것이 아니라 보충(supplement)하기 위해 사용하십시오.

형성평가와 피드백의 교육과정 통합 (Integrating formative assessment and feedback into curriculum)

다양하고 관련성 있는 헬스케어 관점의 포함 (Inclusion of diverse and relevant healthcare perspectives)

의학교육에서의 형성평가 관행(Formative assessment practices)은 더 넓은 보건 전문직 공동체(health professions community)와의 협력을 통해 개발되어야 합니다. 다양한 헬스케어 분과(healthcare disciplines)의 교수진을 참여시키는 것은 평가 방법이 관련성 있고 신뢰할 수 있을(relevant and reliable) 뿐만 아니라 현재의 임상 관행(current clinical practices)과 일치하도록 보장합니다. 협력은 평가를 위한 공유된 표준(shared standards)과 프레임워크의 생성을 촉진하여, 다양한 헬스케어 도메인 전반에 걸친 학생 진전 평가에 대한 더 총체적이고 일관된 접근(holistic and consistent approach)을 조성합니다.

 

예를 들어, 의과대학과 임상 실습 현장(clinical practice settings) 간의 협력적 노력은 형성평가가 학생들이 미래의 경력에서 직면하게 될 실제 임상 과제(real-world clinical challenges)에 기반을 두도록 보장할 수 있습니다. Hauer 등 [144]의 연구는 학계 및 임상 교수진 모두가 참여하는 교육과정 설계가 실습 준비도(readiness for practice)를 더 잘 포착할 수 있는 더 견고한 평가(robust assessments)를 낳았음을 입증했습니다. 이론적 지식과 실제 적용(practical application)을 통합함으로써, 이러한 평가는 학생의 전반적인 역량(overall competency)에 대한 더 정확한 표현(accurate representation)을 제공합니다.

실천 공동체 및 전문성 개발 (Communities of practices and professional development)

게다가, 협력적 접근은 모범 사례(best practices) 공유의 기회를 창출하여, 평가가 시간이 지남에 따라 진화하고 개선되도록 보장합니다. 분과 간 협력(Cross-disciplinary collaboration)은 통합된 사례 기반 평가(integrated case-based assessments)의 개발로 이어질 수 있으며, 이는 복잡한 실제 시나리오에서 임상 지식과 대인 의사소통 기술(interpersonal communication skills)을 모두 적용하는 학생의 능력을 테스트합니다. 그러한 평가는 학생들이 기술적 전문성(technical expertise)을 입증할 뿐만 아니라 환자 및 동료들과 효과적으로 의사소통할 것을 요구하며, 이는 헬스케어 실무의 다면적 본질(multifaceted nature of healthcare practice)을 반영합니다. Lurie 등 [145]의 다기관 연구(multi-institutional study)는 대학과 헬스케어 조직 간의 공동 평가(joint assessments)가 어떻게 더 일관되고 의미 있는 평가로 이어져, 궁극적으로 학생들을 임상 실습에 대해 더 효과적으로 준비시키는지 강조했습니다.

 

학문적 환경 내의 공식적인 협력 외에도, 이 모델은 교육자들이 형성평가 및 피드백에 대한 경험을 공유할 수 있는 보건 전문직 교육 컨퍼런스(health professions education conferences)나 워크숍으로 확장됩니다. 이러한 모임은 다양한 배경을 가진 교육자들이 통찰을 교환하고 평가에서 직면하는 과제를 논의하는 역동적인 실천 공동체(dynamic community of practice)를 형성할 기회를 제공합니다. 서로에게서 배우고 동료 피드백(peer feedback)을 제공함으로써, 교육자들은 형성평가에 대한 접근법을 지속적으로 개선할 수 있으며, 자신의 관행을 향상시킬 뿐만 아니라 의학교육에서의 형성평가 전략의 전반적인 발전(overall advancement)에 기여하도록 보장합니다.

통합적, 총체적, 종단적 접근 (Integrated, holistic, and longitudinal approach)

더욱이, 이러한 협력은 형성평가와 총괄평가(summative assessments)를 연계하는 통합된 평가 접근법(integrated assessment approach)을 위한 토대를 제공합니다. 분과와 기관을 넘어 함께 작업함으로써, 교수진은 학생들이 헬스케어 환경에서 성공하는 데 필요한 이론적 지식과 실제 기술을 모두 평가하는 응집력 있는 평가 포트폴리오(cohesive assessment portfolio)를 만들 수 있습니다. 이 통합된 접근법은 학생들이 총체적으로 평가받도록(assessed holistically) 보장하며, 지식과 임상 역량 모두가 실제 실무의 요구(demands of real-world practice)를 반영하는 방식으로 평가됩니다.

 

요약하자면, 교육자, 행정가, 보건 전문가 간의 협력을 배양하는(cultivating collaboration) 것은 형성평가가 의미 있고, 실제 관행을 반영하며, 국가 및 글로벌 헬스케어 역량 표준(healthcare competency standards)과 일치하도록 보장합니다. 이 협력적 프레임워크는 학생 학습뿐만 아니라 헬스케어 교육의 전반적인 개선을 지원합니다. 공유된 책무(shared responsibility)와 집단적 전문성(collective expertise)을 촉진함으로써, 이 모델은 평가의 질(quality of assessment)을 높여, 미래의 헬스케어 전문가들이 현대 의료 현장의 과제에 맞설 준비가 잘 되도록 보장합니다.

실천 포인트 (Practice points)

다양하고 관련성 있는 헬스케어 관점의 포함 (Inclusion of diverse and relevant healthcare perspectives)

  • 다양한 헬스케어 맥락(healthcare contexts)의 사례 연구(case studies)와 예시를 통합하십시오.
  • 평가가 실제 세계의 과제(real world challenges)와 시나리오를 반영하도록 보장하십시오.

실천 공동체 및 전문성 개발 (Communities of practice and professional development)

  • 모범 사례를 공유하기 위해 교수자 간의 협력(collaboration)을 조성하십시오.
  • 효과적인 평가 및 피드백 방법에 대한 지속적인 훈련(ongoing training)을 제공하십시오.

통합적, 총체적, 종단적 접근 (Integrated, holistic, and longitudinal approach)

  • 시간이 지남에 따라 서로 쌓여가는(build on each other) 평가를 설계하십시오.
  • 피드백이 누적적(cumulative)이고 장기적인 성장을 지원하도록 보장하십시오.
  • 교육과정과 일치하는 프로그램식 평가 접근법(programmatic assessment approach)을 채택하여, 학생 학습에 대한 총체적이고 종단적인 관점(holistic and longitudinal perspective)을 보장하십시오.

결론 (Conclusions)

효과적인 형성평가 및 피드백 관행의 통합은 학습자들을 현대 헬스케어 실무의 과제에 대비시키는 데 결정적입니다(crucial). 평가가 지속적(continuous)이고, 학습 목표와 연계되며, 포용적이고, 타당도와 효능의 건전한 증거(sound evidence)에 기초하도록 보장함으로써, 의학 교육자들은 학생 학습에 기여하고 전문적 성장(professional growth)을 촉진하는 가치 있는 피드백을 제공할 수 있습니다.

 

효과적인 형성평가는 사용되는 다양한 평가 방법(variety of assessment methods)에 대한 세심한 주의를 필요로 하며, 이것들이 의료 수행에 필요한 역량의 전체 스펙트럼(full spectrum)을 다루도록 보장해야 합니다. 이는 또한 자기 성찰(self-reflection)과 비판적 사고를 촉진하면서 시기적절하고, 구체적이며, 실행 가능한(actionable) 피드백을 제공하는 것을 포함합니다. 서면 및 구두 피드백을 결합하고, 동료 평가 기회(peer assessment opportunities)를 통합하며, 기술을 활용함으로써(leveraging technology), 교육자는 깊은 관여(deep engagement)를 장려하고 지속적인 개선을 지원하는 풍부한 학습 환경을 조성할 수 있습니다.

 

더욱이, 평가 과정에서 교수자와 학습자 양쪽의 역할을 고려함으로써, 의학 교육자들은 협력적이고 자기 조절 학습 환경(self-regulated learning environment)을 만들 수 있습니다. 데이터 기반 통찰(data-driven insights)과 결합된 자기평가(Self-assessment)와 성찰은 학습자가 자신의 진전에 대한 주도권(ownership)을 갖고 임상 기술을 더욱 발전시키는 데 도움을 줄 수 있습니다.

 

의학교육이 지속적으로 진화함에 따라, 형성평가가 교육과정에 매끄럽게 통합되고 국가 역량 프레임워크(national competency frameworks)와 연계되는 것이 필수적입니다. AI의 책임감 있는 사용(responsible use of AI)을 포함한 윤리적 표준(ethical standards)을 준수하고 보건 전문직 공동체와의 협력을 촉진함으로써, 교육자는 임상 실습의 요구를 진정으로 반영하고 학생들이 효과적이고 연민 있는(compassionate) 헬스케어 전문가가 되도록 준비시키는 평가를 개발할 수 있습니다.

 

결론적으로, 형성평가는 단순히 특이한(idiosyncratic) 평가 도구(evaluative tool)가 아니라 학생의 학습과 성장을 지원하는 역동적인 과정(dynamic process)입니다. 이러한 지침들을 실행함으로써, 의학 교육자들은 학생들이 의료 현장의 과제에 맞설 준비가 될 뿐만 아니라 헬스케어에서의 평생 학습(lifelong learning)과 지속적인 개선에 필요한 기술, 지식, 태도를 갖추도록 보장할 수 있습니다.

 

1. 효과적인 형성평가의 원칙 (Principles of effective formative assessment)

  • 지속적이고 정기적인 평가 (Continuous and regular assessment)
  • 학습 목표와의 연계 (Alignment with learning objectives)
  • 포용성과 공정성 (Inclusivity and fairness)
  • 타당도와 효능의 증거 (Evidence of validity and efficacy)

2. 효과적인 형성적 피드백의 원칙 (Principles of effective formative feedback)

  • 시기적절한 피드백 (Timely feedback)
  • 구체적인 피드백 (Specific feedback)
  • 개선할 점과 강점 모두를 포함 (Coverage of both areas for improvement and strengths)

3. 형성평가와 피드백의 방법 (Methods of formative assessment and feedback)

  • 동료 평가 (Peer assessment)
  • 시뮬레이션 및 실습 연습 (Simulations and practical exercises)
  • 서면 및 구두 피드백 (Written and verbal feedback)

4. 교수자와 학습자의 역할 (Instructor and learner roles)

  • 학생 자기성찰 기회의 제공자로서의 교수자 (Instructors as providers of student self-reflection opportunities)
  • 코치 및 촉진자로서의 교수자 (Instructors as coaches and facilitators)
  • 학습 과정의 능동적 참여자로서의 학생 (Students as active participants in the learning process)

5. 기술 활용 (Leveraging technology)

  • 온라인 평가 도구 및 기능 (Online assessment tools and capabilities)
  • 피드백 분석 (Feedback analytics)
  • AI(인공지능)의 윤리적 사용 (Ethical use of AI)

6. 형성평가와 피드백의 교육과정 통합 (Integrating formative assessment and feedback into curriculum)

  • 다양하고 관련성 있는 보건의료 관점의 포함 (Inclusion of diverse and relevant healthcare perspectives)
  • 실천 공동체 및 전문성 개발 (Communities of practices and professional development)
  • 통합적, 총체적, 종단적 접근 (Integrated, holistic, and longitudinal approach)

 

 

Adv Health Sci Educ Theory Pract2025 Feb;30(1):69-85. doi: 10.1007/s10459-024-10358-8. Epub 2024 Aug 26.

More, better feedback please: are learning analytics dashboards (LAD) the solution to a wicked problem?

 

 

 

📊 "더 많고, 더 나은 피드백을 주세요!" LAD는 과연 정답일까요?

안녕하세요! 오늘은 의학교육(Health Professions Education)에서 뜨거운 감자인 학습 분석 대시보드(LAD)에 대해 아주 날카로운 질문을 던지는 논문 하나를 함께 살펴보려고 해요. 논문 제목부터 심상치 않죠?

"More, better feedback please: are learning analytics dashboards (LAD) the solution to a wicked problem?"

 

우리는 흔히 "학생들에게 데이터를 시각화해서 보여주면(LAD), 자기 주도적으로 학습하고 성적도 오르겠지?"라고 기대하잖아요. 그런데 이 연구진은 "잠깐, 그렇게 단순한 문제가 아니야"라고 말합니다.

🧐 기술 사회(Technological Society)의 눈으로 본 LAD

이 논문의 핵심은 LAD를 단순한 '도구'가 아니라, 학생들을 통제하고 형성하는 '정치적 기술(Political Technology)'로 바라본다는 점이에요. 좀 어렵게 들릴 수 있지만, 쉽게 말해서 "대시보드가 학생들에게 은근히 압박을 주고, 정해진 모범생처럼 행동하게 만든다"는 뜻이죠.

연구진은 LAD가 본질적으로 정치적이라고 말합니다.

"이 렌즈를 사용하면, LAD는 본질적으로 정치적인 것으로 개념화되며, 개인이 스스로를 처신할 수 있는 가능성의 조건을 창출한다는 푸코적인 의미에서 통치의 기술로 기능합니다."

"Using this lens, a LAD is conceptualised as being inherently political, and functions as a technology of governing in the Foucauldian sense of creating the conditions of possibility in which individuals can conduct themselves."

👁️ 전자 판옵티콘(Electronic Panopticon): 나를 지켜보는 눈

LAD는 학생의 성적, 출석, 클릭 수까지 보여줍니다. 이게 마치 감옥의 판옵티콘(Panopticon)처럼 학생들을 감시하고, 다른 학생들과 비교하게 만들어서 '정상적인(Normal)' 범주에 들어가도록 압박한다는 거예요. 학생들은 "아, 내가 로그인을 덜 했네? 빨리 접속해서 성실한 학생임을 증명해야지"라고 생각하게 되죠. 연구진은 이것을 일종의 정규화(Normalization) 과정이라고 봅니다.

🤖 블랙박스(Blackbox)가 된 알고리즘

더 큰 문제는 AI나 머신러닝이 도입되면서 피드백 과정이 '블랙박스(Blackbox)'가 되어버린다는 점이에요. 왜 내 성적이 위험군(At-risk)인지, 왜 이 공부를 더 하라고 추천(Recommendation)하는지 학생은 알 길이 없어요. 그냥 기계가 시키는 대로 따르게 되죠.

 

연구진은 이 부분에 대해 아주 강력하게 경고합니다.

"본질적으로, LAD 피드백 기능의 완전 자동화 사례에서, 선진 자유주의 기술 사회의 '전문가' 역할은 맥락에 기반한 해석이 배제된 비인간 알고리즘인 자동화된 피드백 기능에 위임되고 있습니다."

"In essence, in instances of the full automation of the feedback function in the LAD the role of ‘expert’ in advanced liberal Technological society is being delegated to the automated feedback functions, to non-human algorithms divorced of interpretation informed by context."

 

이렇게 되면 학생들은 비판적인 사고 없이 기계의 추천을 맹신하거나, 반대로 자신의 현실과 맞지 않는 데이터 때문에 시스템을 불신하게 될 수도 있습니다.

💡 결론: 기술적 해결책(Technical Fix)은 없다

그래서 결론이 뭐냐고요? LAD를 쓰지 말자는 게 아닙니다. 다만, 기술이 모든 걸 해결해 줄 거라는 '기술적 해결책(Technical Fix)'의 환상에서 벗어나야 한다는 거죠.

이 논문의 가장 핵심적인 메시지를 인용하며 마무리할게요. 우리가 고민해야 할 건 '더 많은 피드백'이 아니라 '적절한 피드백'입니다.

"피드백에 관한 핵심적이고 진행 중인 질문은 더 많은 피드백이라는 문제에 대한 '기술적 해결책'을 만드는 것이 아니라, 학습자와 그들의 학습 상황에 대한 적절한 피드백의 본질, 타이밍 및 배포에 우리의 관심이 집중되어야 합니다."

"The core and ongoing question concerning feedback does not concern the creation of a ‘technical fix’ to the problem of more feedback..., rather our attention should be focused on the nature, timing and deployment of appropriate feedback to the learner and their learning situation."

 

결국 우리는 시스템을 설계하는 게 아니라, 미래의 의사라는 '사람을 설계(Designing of people)'하고 있다는 사실을 잊지 말아야겠습니다. 🏥


 

서론 (Introduction)

 

효과적인 피드백(Effective feedback)은 오랫동안 효과적인 학습(effective learning)을 위한 근본적인 촉매제(fundamental catalyst)로 인식되어 왔습니다(Butler & Winne, 1995; Hattie & Timperley, 2007). 그러나 고등교육(higher education) 및 보건의료전문직교육(health professions education, HPE)의 학습자들은 지속적으로 피드백에 불만족(dissatisfied)해하며 피드백 제공이 불충분하다고 보고하는데, 이는 지도교수(supervisors)들에 의해 지속적으로 반박되는 개념이자 피드백 전달(feedback delivery)을 개선하기 위한 많은 개입(interventions)들이 이를 바로잡는 데 완전히 성공하지 못했다는 것을 의미합니다(Boud & Molloy, 2013; Carless, 2006; Deeley et al., 2019; Ossenberg et al., 2019).

 

교육 기술(educational technologies)과 학습 데이터 분석(learning data analytics)의 발전은 학습자에게 개별화된 피드백(personalised feedback)을 효율적으로 구조화하고 전달할 수 있는 새로운 기회를 제공합니다. 실제로 지난 수십 년 동안, 고등교육 문헌은 교육 기술이 강사(lecturers)와 학생(students) 사이의 관계를 재구성하고 학생 학습의 학습 행동(learning behaviour) 자체를 변화시킬 잠재력이 있으며 이미 변화시키고 있다는 비판적 논평과 연구로 특징지어졌습니다(Kitto, 2003). 고등교육 및 보건의료전문직교육(HPE)에서 학습 분석(learning analytics), 머신 러닝(machine learning), 인공지능(artificial intelligence, AI)과 같은 교육 기술의 잠재력은 낙관적인 주의(optimistic caution)로 다루어지고 있습니다(Kitto et al., 2024). 그러나 이 문헌에서 주로 부재한 것은 이러한 기술적 도구(technological tools)들의 본질을 사회 질서(social order)의 조직, 더 구체적으로는 보건의료전문직교육(health professions education) 그 자체의 수행(conduct) 내에서 그것들이 갖는 더 큰 역할의 관점에서 이론화(theorization)하는 것입니다.

 

우리의 초점은 학생 대면형(student-facing), 기술 매개형(technology-mediated) 학습 분석 대시보드(learning analytics dashboards, LADs)라는 하나의 특정 학습 기술(learning technology)에 있습니다. 고찰(Reflections) 기고문으로서, 이 논문은 서론, 방법, 결과 및 고찰이라는 전통적인 과학적 형식(scientific format)을 따르지 않습니다. 대신 이것은 오랜 시간에 걸쳐 이루어진 많은 논의의 요약이며, 광범위한 문헌을 참조하고 우리가 국지적으로 LAD를 개발하고 구현하는 과정의 일부로서 씨름해 온 많은 고려 사항들을 담고 있습니다.

 

LAD는 문헌 내에서 피드백 개입(feedback intervention)으로 위치 지어지며(Clow, 2013), 일반적으로 다음과 같이 제시됩니다: "학습자, 학습 과정 또는 학습 맥락에 대한 다양한 지표(indicators)를 하나 또는 여러 시각화(visualizations)로 집계한 단일 디스플레이(single displays)"로서 정보를 한눈에 모니터링할 수 있도록 합니다(Schwendimann et al., 2017).

  • 가장 기본적인 형태의 LAD는 학습자의 진척도(progress)에 대한 개요를 제공하기 위해 기술적 분석(descriptive analytics)을 사용하는 반면,
  • (이 논문 작성 시점의) 최신 LAD는 여러 데이터 소스(예: 평가(assessment), 출석(attendance), 임상 술기 체크리스트 데이터(clinical skills checklists data) 등)와 여러 분석 수준(analytical levels)을 통합합니다(e.g., (Few, 2007); see also (Boscardin et al., 2018), 추후 논의됨).

 

우리가 LAD를 무엇으로 정의하는지 설명하기 위해, 우리는 문헌에서 발견된 그림과 설명, 그리고 가능한 LAD 설계 가능성의 혼합물(amalgam)로 우리가 만든 '사례 연구(case study)' 예시들을 조합하여 활용했습니다(LAD의 예시는 Fig. 1 참조).

 

Fig. 1 학생 진척도에 대한 포괄적이고 시각적인 개요를 제시하는 의학교육에서의 학습 분석 대시보드(LAD) 예시 (Boscardin et al., 2018)

 

  • 학습자들에게 LAD는 시각화(visualization)를 통해 자기 성찰적 학습(self-reflective learning)을 촉진하고, 주요 수행 순간(key performance moments)을 강조하며, 종종 개인의 성과를 학급 평균(class averages)과 비교하는 것으로 가정됩니다(Susnjak et al., 2022).
  • 교수자(instructors)들에게 LAD는 학습자의 성과와 진척도에 대한 통찰력(insights)을 구성하여 학업 지도(academic advising) 및 학습 계획 개발을 지원합니다(Gutiérrez et al., 2020). 일부 LAD는 예측 머신 러닝 알고리즘(predictive, machine learning algorithms)을 사용하여 위험군(at-risk)임을 나타내는 잠재적으로 문제가 있는 행동을 감지하고, 식별된 학업 문제를 기반으로 한 교정(remediation) 제안과 같은 학업적 권장 사항(academic recommendations)을 생성하기도 합니다.
  • 기관 수준(institutional level)에서, LAD로부터 수집된 데이터는 규제(regulatory) 또는 인증(accreditation) 요구를 충족시키는 교육 전략의 맞춤화(customisation)를 지원할 수 있습니다.

요약하자면, 학생 성과에 대한 여러 데이터 소스와 분석 수준을 통합함으로써 LAD는 학생들의 학습 과정에 대한 더 깊은 이해와 더 나은 촉진(facilitation)을 제공하고, 의사소통을 강화하며, 의사결정(decision-making)을 지원하고, 학습자와 교수자 모두를 위한 학업 성과(academic outcomes)를 향상시키도록 되어 있습니다(Bodily & Verbert, 2017; Masiello et al., 2024). 간단히 말해, LAD는 질 높은 피드백(high quality feedback)을 제공하거나 제공한다고 주장됩니다.

 

일반적으로 LAD 문헌은 대시보드 아키텍처 및 구성 요소(Bodily et al., 2018), 설계 및 기술적 고려 사항, 구현에서 얻은 교훈(Durojaiye et al., 2018; Herodotou et al., 2019)에 초점을 맞추어 꽤 제한적이었습니다. 또한 LAD의 정확성과 효과성을 향상시키기 위해 대시보드 콘텐츠 및 시각화와 학습 과학(learning science) 개념을 연결하는 필요성과 방법(Sedrakyan et al., 2019; Teasley, 2018), 그리고 보건의료전문직교육(HPE)에서의 LAD 개발 및 구현(Boscardin et al., 2018)에 집중해 왔습니다. 더 넓은 문헌에는 최근 몇 가지 예외가 있지만(e.g., (Paulsen & Lindsay, 2024)),

  • 전체적으로 볼 때 현재까지의 이 연구 분야는 LAD의 가능성을 도구적이고 기계적인 방식(instrumental mechanistic manner)으로, 즉 피드백에 대한 효율적이고 다소 무해한(benign) 기술적 접근 방식(technological approach)으로 프레임화하는 경향이 있습니다(Banihashem et al., 2022).
  • LAD가 학습자의 성과와 동료, 교수자 또는 그들이 등록된 교육 기관과의 관계에 어떤 역할과 영향(role and effects)을 미칠 수 있는지에 대한 비판적 분석(critical analyses)은 거의 전무합니다.
  • 오히려 문헌은 유혹적인 어조(seductive tone)를 띠며, 피드백(Deeley et al., 2019)과 같은 교육적 '사악한(wicked)' 문제(Rittel, 1973)들이 의도하지 않은 결과(unintended consequences) 없이 기술적 인공물(technological artifact, 즉 LAD)의 적용을 통해 해결될 수 있다는 믿음에 기반하여, LAD가 '기술적 해결책(technical fix)'의 모든 약속을 제공할 수 있음을 시사합니다(Robins & Webster, 1989).

우리는 기술 사회(technological society)라는 렌즈(lens)를 사용하여 문헌의 이러한 공백을 해결하고자 합니다(Barry, 2001). Barry의 발견적 프레임워크(heuristic framework)를 LAD와 의학교육의 통치(governing) 사이의 관계를 탐구하기 위한 개념적으로 일관된 수단으로 사용하여, 우리는 LAD가 가질 수 있는 역할과 영향, 그리고 그것들이 학생과 교수자에게 어떻게 직접적으로 작용할 수 있는지에 대한 논의를 엽니다.

  • 먼저, 우리는 기술 사회(Technological Society)의 개념을 개괄하고 이를 정보 기술, 이 경우에는 LAD를 통한 의대생들의 자기 통치(self-governance)를 장려하려는 명시적인 의제(explicit agenda)와 연결합니다.
  • 우리는 이 개념적 프레임워크를 사용하는 것이 의대생 집단에 대한 LAD의 기능 및 배포(deployment) 이면에 있는 가정(assumptions)들의 잠재적 영향을 풀어내는 데 어떻게 기여할 수 있는지 보여줄 것입니다.
  • 구체적으로, 우리는 기술적 장치(technical device)로서의 LAD가 기술, 학생, 강사 간의 학습 관계를 형성하는 데 있어 어떻게 정치적 기술(political technology)로 작용하는지(뒤에서 설명), 그리고 이렇게 재형성된 관계가 학생 행동에 미칠 수 있는 파급 효과(downstream effects)를 고려할 것입니다.
  • 그렇게 하기에 앞서, 우리는 이 주제에 대한 우리의 관심에 대해 성찰합니다.

 

우리의 위치성 (Our positionality)

 

위치성(Positionality)은 "연구자가 주어진 연구 내에서 채택하기로 선택한 위치를 반영"합니다(Savin-Baden & Major, 2013, p.71). 이는 연구가 수행되는 방식, 그 성과(outcomes), 그리고 결과(results) 모두에 영향을 미칩니다(Rowe, 2014). 이 연구는 초기에 의학 학부 학위 프로그램(MBBS)에 프로그램 기반 평가(programmatic assessment, PA)(Schuwirth & Van der Vleuten, 2011)를 도입하고 다양한 소스에서 수집된 평가 정보를 LAD를 통해 학습자에게 제시하는 것에 대한 지속적이고 국지적인 논의에서 개발되었습니다. 이 과정의 일환으로 우리는 LAD에 관한 광범위한 문헌에 접근했으며, 그 비판성(criticality)과 이론화(theorization)의 결여에 놀랐습니다.

 

우리는 이 문헌에 대한 우리의 위치와 관계, 그리고 (이 기사 초안 작성 당시 아직 완료 및 평가되지 않은) 국지적 목적을 위해 LAD를 개발하는 초기 단계의 "현장(on-the-ground)" 경험을 우리의 학문적 배경(심리학이지만 의학교육 분야 종사 [JC], 사회학 [SK], 공학 [ON], 영어 [MC]), 보건의료전문직교육의 평가 및 피드백, 그리고 학습 분석에 대한 지식 수준과 관점에 비추어 지속적이고 비판적으로 고려했습니다. 예를 들어, ON의 역할 중 상당 부분은 지역적으로 LAD의 개발 및 구현을 지원하는 것이었으므로, 그녀는 학습 분석 및 그 시각화의 가능성과 한계에 대한 많은 이해를 가져왔습니다. JC, MC, SK는 기술적 전문 지식은 적었지만 더 "외부자적(etic)"이고 비판적인 견해를 가지고 있었습니다.

 

 

기술 사회 내에 LAD 위치시키기 (Positioning LADs within a technological society)

 

정보 기술(information technologies)과 현대 서구 사회의 통치(governing) 사이의 관계는 널리 탐구되어 왔습니다. 30여 년 전, 현대 사회에서의 권력 작동에 관한 미셸 푸코(Michel Foucault)의 아이디어와 저작에 영감을 받아, 피터 밀러(Peter Miller)와 니콜라스 로즈(Nikolas Rose)(Miller & Rose, 1990; Rose & Miller, 1992)는 정치적 합리성(political rationalities)과 통치 기술(technologies of government)의 본질에 대한 설명을 통해 정보 기술의 인프라적 성격(infrastructural nature)을 암시했습니다. 정치적 합리성은 권력이 행사되고 그 권력 행사에 대한 도덕적 정당화(moral justifications)가 이루어지는 담론(discourses)입니다(Rose & Miller, 1992). 통치의 문제가 되는 측면(예: 피드백의 질과 양에 대한 학생의 불만)이 식별되면, 정치적 합리성은 사회 부문을 바람직하고 구현 가능한 형태로 형성하는 통치 기술(technologies of government)로 번역됩니다(Miller & Rose, 1990). 이러한 기술을 통해, 권위(authority)는 자신의 목표와 욕망(예: 피드백이 전달되는 방식을 지시하기 위해 특정 방식으로 LAD를 설계하거나, 학습자가 직장에서 유능한 전문가가 되기 위한 지식과 기술을 습득하기 위해 대시보드와 상호작용하는 방식)을 달성하면서 "타인의 처신(conduct), 사고, 결정 및 열망을 형성, 정규화(normalize) 및 도구화(instrumentalize)"하려고 합니다(Miller & Rose, 1990, p.8).

 

앤드류 배리(Andrew Barry)의 기술 사회(Technological Society) 개념은 정보 기술을 통치의 중심에 두는데, 여기서 시민들은 이제 자신의 삶의 수행에 있어 선택(choices)을 극대화하고 숙달(mastery)과 자기 책임(self-responsibility)을 증명하기 위해 기술을 능동적으로 사용하고 상호작용해야 합니다(Barry, 2001). 이 렌즈를 사용하면, LAD는 본질적으로 정치적(political)인 것으로 개념화되며, 개인이 스스로를 처신할 수 있는 가능성의 조건(conditions of possibility)을 창출한다는 푸코적인 의미에서 통치의 기술로 기능합니다(Foucault, 1991; Hamann, 2009). 기술 사회에 LAD를 위치시키는 것은 그 이중적 본질(dual nature)을 강조합니다:

‘…물질적 또는 비물질적 인공물로 생각되는 기술적 장치(technical device)이자, 고립된 장치뿐만 아니라 그것의 사용을 가능하게 하는 지식의 형태, 기술(skill), 도표(diagrams), 차트, 계산 및 에너지를 지칭하는 개념인 기술(technology)’ (Barry, 2001, p.9) (see also (Akrich, 1992; Deleuze, 1988)).

 

기술적 역량(통치적)을 가진 도구적 물질 대상으로서의 기술적 장치라는 이 개념과 그것이 행동으로 번역될 때의 가변성(mutability)은 교육 전달의 사회-기술적 구성(socio-technical configurations), 교수진의 사용, 그리고 고등교육 부문 내 학생들의 수용 및 사용을 연구하는 데 활용되어 왔습니다. 이러한 연구들은 기술적 장치의 의도하지 않은 효과들을 발견했는데, 그 범위는 학습 및 평가

  • 과정에서의 학생들의 부도덕한 행동(purportedly unethical behaviour),
  • 학생·교수진·대학 간 관계의 재조직(re-organisation),
  • 교육 기술과 관련된 학생 자유의 반어적 수행(ironic performances), 그리고
  • 때로는 학생 행동의 부정적 재현(adverse re-representation)과 그에 수반되는 학생 주체성(subjectivity)(즉, '착한' 또는 '나쁜')의 구성에까지 이릅니다(Kitto, 2003; Kitto & Higgins, 2003, 2009, 2010; Kitto & Saltmarsh, 2007).

예를 들어, 1990년대 후반 고등교육 부문에서 온라인 교육의 도래를 생각해 보십시오.

  • 거리의 폭정(tyranny of distance)을 극복하여 교육을 민주화하고 성인 학습자들의 평생 학습(lifelong learning)을 촉진하기 위해 설계된 온라인 교육은 고등교육 전달에 영향을 미치는 사회의 많은 변화들(세계화의 위협, 교육 전달을 위한 정보 기술 사용 증가, 평생 학습 강조, 인구 통계 변화, 학생들의 요구/선택)에 대한 해결책으로 위치 지어졌습니다. 이전에 권리를 박탈당했던 학습자들(풀타임 근로자, 시골 빈곤층)은 이제 자신의 시간 프레임에 맞춰 더 비용 효율적으로 원거리에서 최상위권 고등교육에 접근할 수 있게 되었습니다(Robins & Webster, 2002).
  • 그러나 그러한 기술적 장치들은 원거리에서 정치적 프로그램을 실행(enact)할 수 있는 반면, 의도한 정치적 목표에 반하는 결과를 초래할 수도 있습니다(Barry, 2001). 온라인 교육 부문에서 이것은 평판이 나쁜 '디지털 학위 공장(digital diploma mills)'(Noble, 1998)의 부상이라는 형태를 취했으며, 이는 여전히 전 세계적으로 해당 부문을 괴롭히는 평판 손상(reputational damage)으로 이어졌습니다.

 

보건의료전문직교육에서의 학습 분석 대시보드 (Learning analytics dashboards in health professions education)

 

LAD는 학습자의 허브(hub)에서 시각화된 평가 데이터 포인트(assessment data points)를 통합하여 학습자의 진척도에 대한 전체론적 관점(holistic view)을 제공한다고 여겨집니다(Boscardin et al., 2018). 주장은 LAD가 평가(총괄평가 및 형성평가), 출석, 임상 술기 체크리스트 데이터 등을 통합함으로써 학습자와 교육자가 개별 학습자의 성과를 더 잘 이해하도록 촉진한다는 것입니다. 역량(competencies)과 평가(assessment) 사이의 연결을 시각화할 수 있는 능력은 표면적으로는 인증(accreditation) 요구에 기반한 교육 전략의 맞춤화(customisation)를 가능하게 합니다(Chan et al., 2018). 이러한 능력은 기술적(descriptive), 진단적(diagnostic), 예측적(predictive), 처방적(prescriptive) 분석을 포함한 다양한 수준의 학습 분석을 통해 가능해지며, 각 수준은 데이터 패턴에 대한 고유한 통찰력을 제공하고 정보에 입각한 의사결정을 촉진합니다. 우리는 이러한 다양한 수준의 학습 분석을 차례로 논의합니다.

 

 

진단적 및 기술적 분석: 기술 사회 내의 판옵티콘적 기법 (Diagnostic and descriptive analytics: a panoptic technique within a technological society)

 

피드백의 가장 일반적이고 단순한 기능과 형태는 기술적 분석(descriptive analytics)입니다. 예를 들어, (Han et al., 2021)은 학생들에게 그들의 참여 수준(engagement levels)과 동료와의 상호작용을 알려주는 학생 대시보드를 개발했습니다. 진단적 분석(diagnostic analytics)은 일반적으로 데이터 내의 패턴과 추세를 식별하여 어떤 일이 왜 발생했는지에 대한 통찰력을 제공함으로써 기술적 분석에 추가적인 차원을 더한다고 여겨집니다. 예를 들어, (Aljohani et al., 2019)은 학습 관리 시스템(LMS)의 로그 데이터(log data)를 활용하여 학생의 행동 패턴과 태도를 밝혀내는 LAD를 제시했습니다. 이는 각 학생의 참여 수준을 동료들의 수준과 비교하여, 학급 평균 및 최상위 성과 동료들과의 비교와 함께 개인화된 학습 통계를 제공함으로써 자기 인식(self-awareness)을 증진하고 성과 평가를 지원했습니다.

 

이러한 기능들에 기술 사회(technological society) 렌즈를 적용하면 세 가지 정치적 기능과 통치 기법(techniques of government)의 발현이 강조됩니다:

  • (1) 기술 사회에서 학생들이 기술적 수단을 통해 자기 통치적(self-governing) 방식으로 상호작용(interact)할 것이라는 개념은 핵심적인 정치적 합리성입니다.
  • (2) 이러한 상호작용을 통해 그들은 스스로를 작업(work on themselves)하기 위해 기술적 중개자(technological intermediaries)를 통해 자신을 알게 될 것으로 기대됩니다.
  • (3) 이를 위해 그들은 다른 사람들, 기관들, 그리고 지식의 형태들과의 확장된 연결망(web of connections) 속에 자신을 위치시킴으로써 그 상호작용을 지시해야 합니다(Barry, 2001).

이 경우, LAD는 진단적 기능과 기술적 기능을 결합함으로써 이미 그들을 그러한 연결망 속에 위치시킵니다. 학생의 성과에 대한 소위 고충실도(high-fidelity) 데이터가 분석되고, 편집되며, 시각적 형태로 (재)현((re)represented)되어 개별 성과와 그들의 진척도가 학생 집단(class of students)과의 관계 속에서 어디에 위치하는지를 보여줍니다(Fig. 2 참조).

 

이러한 측면에서, LAD는 푸코적 판옵티콘(panopticon), 즉 '전자 판옵티콘(electronic panopticon)'의 모든 특징을 포함하고 있습니다(Kitto, 2003):

그것은 개별 행동을 비교의 장(field of comparison)이자, 구별의 공간(space of differentiation)이며, 따라야 할 규칙의 원칙인 전체(whole)로 참조합니다. 그것은 개인들을 서로 구별합니다…. 그것은 개인의 능력, 수준, '본성'을 양적 용어로 측정하고 가치의 측면에서 위계화(hierarchises)합니다. 그것은 이 '가치 부여(value-giving)' 척도를 통해 달성해야 할 순응(conformity)이라는 제약을 도입합니다.. 그것은 비교하고, 구별하고, 위계화하고, 균질화(homogenizes)하고, 배제(excludes)합니다. 요컨대, 그것은 정규화(normalizes)합니다. (Foucault, 1977, p.182–183).

 

1. "개별 행동을 비교의 장이자, 구별의 공간이며... 전체로 참조합니다."

  • 쉬운 뜻: "너 혼자 공부하는 게 아니다. 너의 점수는 **'우리 반 전체 평균'**이라는 거대한 기준 속에서만 의미가 있다."
  • 상황: 대시보드에 내 점수만 나오는 게 아니라, **'학급 평균'**이나 **'상위 10%의 그래프'**가 같이 뜹니다. 내 행동은 이제 나만의 것이 아니라, 남들과 비교당하는 데이터가 됩니다.

2. "개인들을 서로 구별합니다... 양적 용어로 측정하고 위계화합니다."

  • 쉬운 뜻: "너는 1등, 쟤는 꼴등. 너는 출석률 90%, 쟤는 50%. 숫자로 **등급(위계)**을 매긴다."
  • 상황: 학생의 성격, 창의성, 잠재력 같은 복잡한 '본성'은 싹 무시되고, 오로지 **점수, 접속 횟수, 과제 제출률 같은 '숫자(양적 용어)'**로만 평가받습니다. 이 숫자로 우등생과 열등생이 **계급(위계)**처럼 나뉩니다.

3. "순응이라는 제약을 도입합니다... 균질화하고... 정규화합니다."

  • 쉬운 뜻: "남들만큼은 해야지? 튀지 말고 **표준(Normal)**에 맞춰라."
  • 상황: 내가 만약 평균보다 로그인 횟수가 적다면? 불안해서 괜히 더 접속하게 됩니다. 반대로 너무 튀는 행동을 하기도 어렵습니다. 결국 학생들은 대시보드가 보여주는 '이상적인 학생의 모습'에 맞춰 비슷비슷해집니다(균질화).
  • 정규화(Normalizes): 여기서 'Normal'은 '평범하다'는 뜻이 아니라, **'정상 범주(규범) 안에 들어오게 만든다'**는 뜻입니다. 시스템이 정한 '정상 학생'의 기준에 나를 끼워 맞추게 된다는 거죠.

4. "배제합니다."

  • 쉬운 뜻: "기준에 못 미치면 넌 아웃이야."
  • 상황: 이 숫자 기준(정규 분포)에 들어오지 못하는 학생(예: 성적은 낮은데 창의적인 학생, 접속은 안 하지만 혼자 공부 잘하는 학생)은 **'위험군(At-risk)'**이나 **'부적응자'**로 낙인찍혀 시스템 밖으로 밀려납니다.

 

Fig. 2 가상의 LAD에 제시된 개인 - 코호트 비교 (Individual - Cohort comparison)

 

LAD는 의과대학 대표자들이 필요할 때 학생 개입(interventions)을 수행할 수 있도록 이러한 유형의 '정규화 시선(normalising gaze)'을 제공함과 동시에, 학생에게는 코호트 내에서의 자신의 '정상성(normality)'에 대한 그림을 제공하도록 설계될 수 있습니다(Fig. 2 참조). LAD, 혹은 더 정확하게는 LAD에 의해 제시된 데이터는, 학교에 의한 개입, 학생 스스로에 의한 고립된 개입, 또는 학생 성과를 향상시키기 위해 서로 협력하는 개입의 출발점으로 작용할 수 있습니다.

 

학생 인구 집단을 정규화하기 위해 기술적 수단을 통해 교육에 판옵티콘적 기법을 구성한다는 이 개념은 학문적으로 잘 다져진 길입니다(Foucault, 1977; Kitto, 2003). 여기서 새로운 점은 기술 사회 렌즈를 통해 볼 때, 기술 사회에서의 정보 통신 기술(information communication technologies)을 통한 통치 조건 하에서 판옵티콘적 기법들의 결합이 갖는 문제적 측면이 명백해진다는 것입니다. 이제 여러 형태의 데이터가 연결되어 학생 시험 성적뿐만 아니라 교과 과정 활동 내에서의, 그리고 LAD 자체와의 상호작용성(interactivity) 수준에 대한 '진단(diagnosis)'을 제공합니다.

  • 학생들이 모든 활동을 완료하고 있는가?
  • 그들은 자기 개선(self-improvement)을 추구하는 훌륭한 상호작용적 기술 학생-시민(interactive technological student-citizen)임을 증명하기 위해 충분한 빈도로 LAD와 상호작용하고 있는가(학생 로그 데이터로 가시화됨)? (Fig. 3 참조).

 

Fig. 3 가상의 LAD를 통해 시각화된 학생 로그 데이터 및 완료율



LAD는 푸코적인 규율 사회(disciplinary society)의 단순한 기법(너는 이것을 해야만 한다)이 아닙니다. 통치적인 기술 사회에서, 그것들은 규제된 선택(regulated choices)을 통해 학생들의 자기 통치 역량(self-governing capacities)(너는 이것을 할 수도 있다)을 창출하고자 하는 선진 자유주의 기술(advanced liberal technologies)입니다. 최적의 자기 통치(optimal self-governance)를 위한 가능성의 조건(Rose, 1993)은 학습자를 특정 방식으로 관리하고 형성함으로써 LAD에 의해 제공됩니다. 물론 LAD의 데이터가 통치하는 자들에 의해 어떻게 사용되는지는 의과대학 자체의 국지적인 문화적, 구조적 특이성(리더들의 성향, 인증 압력 등)에 달려 있습니다. 예를 들어, 술기 체크리스트를 완료하지 않은 '반항적인(recalcitrant)' 학생들에게 권장되는 교정 세션(remediation sessions)을 생각해 보십시오. 그러한 권장의 임계값(threshold)과 정확히 무엇이 권장되는지는 기관마다 다를 것입니다: 기술적 수단을 통한 통치는 항상 맥락에 구속(context bound)됩니다(Barry, 2001).

 

LAD에서의 예측적 및 처방적 분석 (Predictive and prescriptive analytics in LADs)

 

두 가지 기능 - 예측적(predictive) 처방적(prescriptive) 분석 - 은 복잡성의 층위를 더하며, LAD를 학생 인구와 개별 행동을 형성하는 단순한 판옵티콘적 기법 이상의 것으로 만듭니다. 그것들은 또한 학생-시민이 자기 통치를 할 수 있는 최적의 조건을 제공하는 방법에 대한 사고방식으로 포화되어 있으며, 학생-시민들은 적절히 자기 통치하기 위해 이를 탐색하는 법을 배워야 합니다.

 

선진 자유주의 통치(advanced liberal government) 하에서, '자유로운' 시민은 아이러니하게도 항상 자신의 성과뿐만 아니라 기관의 성과를 평가하는 기준을 설정하는 통치의 결합체(assemblages of governing) 내에서 시공간적으로 묶여 있습니다(의과대학 인증 기준 및 관행을 생각해 보십시오). 이를 위해서는 개인/기관이 적절히 자기 통치할 수 있는 탐색 시스템이 필요하며, 전문 지식(expertise)과 전문가(experts)가 필요합니다:

자신의 존재를 수행하는(conducting) 특정한 문명화된 방식들이 정상적인 것으로 식별되며, 동시에 그 기준(norm)을 정의하고 개인들에게 정상성을 성취할 삶의 방식들을 지도할 '인간 영혼의 엔지니어(engineers of the human soul)'들에게 묶여야 한다. (Rose, 1999, p.76).

 

예측적 및 처방적 분석을 통해 이 관계는 매우 복잡해집니다.

  • 예측적 분석은 현재 또는 과거의 데이터를 사용하여 미래의 결과를 알립니다 – 종종 머신 러닝 알고리즘(machine learning algorithms)을 통해. 단순히 원시 로그 데이터(raw log data)를 제시하는 대신, 많은 대시보드는 머신 러닝 모델이나 알고리즘을 사용하여 이 정보를 처리하여 통찰력을 제공합니다(Afzaal et al., 2021; Gutiérrez et al., 2020).
    • 예를 들어, Herodotou et al. (2019)은 LMS 로그 데이터를 사용하여 학생의 과제 제출 및 과정 완료를 예측하고, "위험군(at risk)"으로 간주되는 학생들을 식별했습니다(see also (Gutiérrez et al., 2020; Mavrikis et al., 2019)) (이 마지막 항목은 선진 자유주의 사회에서의 지속적인 선점 관심사입니다).
  • 처방적 분석(Prescriptive analytics)은 어떤 조치를 취해야 할지 결정하기 위한 해결책을 제공하는 것을 목표로 합니다. 그들은 종종 긍정적인 결과로 이어지는 잠재적인 조치를 추론하기 위해 예측적 분석을 활용하며, 주로 LMS와 같은 다양한 소스에서 수집된 데이터를 기반으로 한 권장 사항(recommendations)의 형태를 취합니다. 예로는 (Bodily et al., 2018)과 (Sansom et al., 2020)이 도입한 실시간 추천형(recommender-type) 대시보드가 있습니다.

앞서 언급했듯이, 기술 사회에서 선진 자유주의 통치 방식의 핵심 측면은 개인의 능동적이고 자기 책임적인(self-responsiblized) 처신을 위한 가능성의 조건을 창출할 수 있는 통치 프로그램(programmes of government)을 제정하는 것입니다(Barry, 2001). LAD의 예측적 및 처방적 기능과 통치 기술로서의 설계에 대한 위의 설명에서 흥미로운 점은, 이것이 겉보기에는 사회 조직의 두 가지 핵심 도표(diagrams)인 판옵티콘(panopticon)(Foucault, 1977)과 올리고옵티콘(oligopticon)(Latour, 2005) 사이의 모순적인 상호작용의 토대를 마련한다는 것입니다. 앞서 설명한 바와 같이,

  • 판옵티콘분류(classification)와 판단(judgement)으로 특징지어지는 지속적이고 명확한 감시 시스템을 통해 개인화하고 정규화하는 정치적 기술입니다. 그것은 순응(compliance)을 주입하고 개인의 사회적, 경제적 효용(utility)을 극대화하기 위해 개인의 역량을 최적화함으로써 인구 집단을 통치합니다(Rose, 1999). 판옵티콘의 파노라마적 시야(panoramic view)(그리고 관찰당하는 자가 그 존재를 아는 것)는 올리고옵티콘과 극명하게 대조됩니다.
  • 올리고옵티콘은 가장 작은 혼란에도 눈이 멀 수 있는 복잡하고 연결된 풍경에 대한 여러 개의 좁은 시야들(multiple narrow views)로 구성됩니다(Gad & Lauritsen, 2009). 본질적으로 취약한(fragile) "그들은 너무 적게 보지만… 그들이 보는 것은 잘 본다… (연결된) 전체에 대한 견고하지만 극도로 좁은 시야들은 연결이 유지되는 한 가능하다(Latour, 2005, p.181). 정보 기술 맥락에서, 올리고옵티콘적 '감시의 성공은 인간과 비인간(nonhumans)을 포함하는 상황에 위치한(situated), 협력적인 작업의 결과이다. 효과적인 감시는 개별 행위자에 의해 확립되는 것이 아니라 네트워크에 의해 수반된다'(Gad & Lauritsen, 2009, p.53).

LAD가 피드백의 메커니즘으로 배포될 때 이러한 연결의 취약성은 항상 존재합니다(everpresent). LAD의 소통 채널(communication channel) 또는 피드백 메커니즘 이면에 있는 논리를 좀 더 자세히 살펴봅시다. 목표는 피드백 프로세스의 전체 또는 부분 자동화(full or partial automation)와 간소화를 통해 개인화된 학습(personalized learning)을 향상시키는 것입니다. 일반적으로 목표는 의대 학위 과정과 같은 학습 프로그램 전체에 걸쳐 이를 종단적으로(longitudinally) 제도화하는 것이며, 레지던트 과정(대학원) 및 선발 과정으로 확장될 가능성도 있습니다. 아이디어는 이것이 자신의 의학교육 여정에 대한 재현(representation)을 제공하여 학생들이 자신과 자신의 교육적 필요를 이해하는 데 도움을 줄 것이라는 점입니다. 이것은 기술 사회에서의 통치 기술의 특징인데, 여기서 개인 시민들의 활동을 조직하는 핵심 메커니즘 뒤에 있는 정치적 합리성은 기술적으로 매개된 "지속적인 형태의 피드백"에 의해 지원되는 자기 주도적 평생 학습(self-directed lifelong learning)입니다(Barry, 2001). 그러나 모든 통치 기술과 마찬가지로, 그것은 '선천적으로 실패하는 작동(congenitally failing operation)'(Miller & Rose, 1990)이며, 따라서 "맥락, 장소(locale) 또는 지식의 다른 문제들이 고려되어야 할 것입니다"(Barry, 2001, p.16).

 

LAD는 역량과 평가 사이의 연결을 시각화할 수 있습니다(Fig. 2 참조). 교육자들에게는 매혹적인 제안이지만, 이 가정은 학생들이 스스로의 '전문가'가 될 수 있는 시각적 디스플레이(visual displays)를 형성하는 연결을 누가 또는 무엇이 만들고 있는지를 조사하는 데 실패합니다. 디스플레이의 힘은 데이터를 해석하고 연결에 의미를 부여하는 알고리즘(algorithms)에 의해 명백해지며, 이는 대시보드와의 상호작용을 통해 학생 자신에 의해, 때로는 피드백 형태의 교수진의 도움으로 학생의 신체(body) 내에 위치하게 됩니다. 이것은 복잡한 사회-기술적 결합체(socio-technical assemblage)인데, 왜냐하면 그것은 신체와 기계 사이의 관계를 포함하고 있으며, 이는 다음과 같은 여러 피드백 수행(performances)의 순간들 속에서 다중 번역 지점(multiple translation points)으로 작용할 수 있기 때문입니다 -

  • (1) 자신의 성과를 '평가'하고 자동화된 피드백을 해석하기 위해 LAD와 상호작용하는 개별 학생
  • (2) 학생의 성과를 '평가'하고 자동화된 피드백의 추가적인 해석에 참여하기 위해 LAD와 상호작용하는 임상 강사
  • (3) 성과에 대한 '평가'의 시각적 디스플레이와 자동화된 권장 학습 필요에 대한 공유된 의미(shared meaning)를 구성하기 위해 LAD와 함께 상호작용하는 학생과 강사.

1. "완벽한 자율주행"을 꿈꾸지만, "태생적으로 고장 난" 내비게이션

  • 원문 내용: "목표는 피드백의 자동화... 자기 주도적 평생 학습... 그러나 선천적으로 실패하는 작동... 맥락이 고려되어야..."
  • 쉽게 풀이:
    • 학교의 꿈: 학교는 학생들이 의대 입학부터 레지던트가 될 때까지, 교수님이 일일이 잔소리하지 않아도 LAD(데이터)만 보고 "아, 내가 부족하네?" 하고 알아서 공부하는(자기 주도적 평생 학습) 사람이 되길 원합니다. 이것이 이 기술을 도입하는 **정치적 목적(통치 기술)**입니다.
    • 현실의 한계: 하지만 이 시스템은 **"태생적으로 실패할 운명(Congenitally failing operation)"**을 타고났습니다. 왜냐고요? 기계는 **'맥락(Context)'**을 모르기 때문입니다.
    • 예시: 학생이 도서관에 안 갔다는 데이터가 잡혔습니다. 기계는 "불성실함"이라고 판단하겠죠. 하지만 사실 그 학생이 집에서 밤새 논문을 읽었다면? 기계는 그 '맥락'을 놓칩니다. 그래서 이 시스템은 항상 **취약(Fragile)**합니다.

2. "누가 이 그래프를 그렸는가?" (보이지 않는 손)

  • 원문 내용: "시각적 디스플레이를 형성하는 연결을 누가 또는 무엇이 만들고 있는지를 조사하는 데 실패... 알고리즘에 의해 명백해지며..."
  • 쉽게 풀이:
    • 우리는 화면에 예쁜 그래프가 나오면 "와, 이게 나구나!" 하고 맹신하게 됩니다. 하지만 연구진은 질문을 던집니다. "이 점수와 저 역량을 연결한 건 누구지?"
    • 그건 교수님도, 학생도 아닌 **'알고리즘(기계의 논리)'**입니다.
    • 우리는 알고리즘이 왜 그렇게 판단했는지도 모른 채, 기계가 보여주는 화면(Display)을 나의 진짜 모습(Body, 신체)으로 받아들이게 됩니다. 즉, **"기계가 정의한 나"**를 **"진짜 나"**로 착각하게 되는 위험이 있습니다.

3. "번역이 필요한 세 가지 순간" (사회-기술적 결합체)

  • 원문 내용: "사회-기술적 결합체... 다중 번역 지점... (1) 개별 학생 (2) 임상 강사 (3) 학생과 강사"
  • 쉽게 풀이: LAD는 그냥 기계 덩어리가 아니라, 사람과 기계가 뒤엉킨 **복잡한 실타래(사회-기술적 결합체)**입니다. 여기서 데이터라는 '외계어'를 '의미'로 **번역(해석)**해야 하는 세 가지 어색한 순간이 발생합니다.
    • 상황 (1) 학생 vs 기계 (나 혼자 볼 때):
      • 학생: "내 성실성 점수가 40점? 나 쓰레기인가?"
      • (기계의 숫자를 보고 스스로를 '번역'하며 자괴감에 빠지거나 맹신함)
    • 상황 (2) 교수님 vs 기계 (교수님이 나를 볼 때):
      • 교수님: "데이터를 보니 김철수 학생은 환자 공감 능력이 떨어지는군."
      • (실제 철수를 보지 않고, 기계의 데이터를 통해 철수를 '번역'하고 평가함)
    • 상황 (3) 학생 + 교수님 + 기계 (셋이 같이 볼 때):
      • 교수님 & 학생: (화면을 같이 보며) "그래프가 이렇게 나왔네? 이걸 어떻게 해석해야 할까? 네 생각은 어때?"
      • (기계가 던져준 숙제를 놓고, 두 사람이 합의점을 찾기 위해 '번역' 싸움을 함)

🍎 한 줄 요약

"LAD는 학생을 '자동 성장 머신'으로 만들고 싶어 하지만, 기계는 맥락을 모르는 '바보'일 수 있습니다. 그런데도 우리는 기계가 만든 그래프를 맹신하게 되고, 결국 학생, 교수, 기계 셋이 모여서 '이 그래프가 도대체 무슨 뜻이냐'며 눈치 게임(번역)을 하게 됩니다."

 

사회-물질적(socio-material) 용어로 볼 때, 이러한 사회-기술적 결합체의 수행은 학생의 신체적 수행(bodily performance)에 대한 재현을 생성하지만, '사회적 행위자[학생]는 결코 신체에만, 그리고 신체 단독으로 위치하지 않습니다'(Law, 1992, p.382–384), 그들은 사이보그(cyborgs), 즉 인간과 비인간의 혼종(hybrids)(Harraway, 1991)이며, 시공간의 다른 지점에서 인간 또는 기술적인 것으로 안정화되고 '정화(purified)'(Latour, 1993)됩니다. 종종 그들은 '[우리가] 그들의 혼종성(hybridity)에 대해 심문할 기회를 갖기도 전에 정화됩니다'(Michael, 1998, p.134). 이것은 실제 신체적 수행에서 추상화된 데이터베이스(databases)를 통한 인간 실천의 번역과 해석이(see (Lyon, 2001)), 기술 사회 내에서 인구 통치와 개인 훈련 과정에서 어떻게 형성되고 사용되는지에 직접적인 영향을 미칩니다(Barry, 2001; Deleuze, 1992; Poster, 1990). 학생의 성과가 신체들의 배열, 데이터베이스, 텍스트 및 시각적 디스플레이와 같은 재현 장치(representational devices), 그리고 실제 현장의(in situ) 오프라인 수행(LAD에 반영되지 않는)의 결과물이라면, 문제는 학생의 성과가 정확히 어디에 위치하는가에 대한 것입니다. 그리고 실패의 경우, 책임은 누구에게 있는가 - 기계인가 인간인가?

 

실제로, 예를 들어 의과대학 맥락 내에서, 우리는 이것이 학생, LAD, 강사 간의 관계 수행(performance of the relationship)에 있어서 '권력의 미시물리학(microphysics of power)'(Foucault, 1977)의 구성을 통해 상호작용 속에서 해결될 가능성이 높다고 주장합니다. LAD는 의과대학의 판단(judgement)의 중재자(mediator)로 서 있도록 배포되며, 이는 때때로 강사의 해석에 의해 보완됩니다. 표시된 데이터는 학생 그 자체(is the student)입니다. 그러나 학생의 성과를 더욱 구성하는 다양한 형태의 데이터 간의 연결을 생성하는 알고리즘의 역할은 어떻습니까? 이것이 선진 자유주의 기술 사회 내의 새로운 '전문가(expert)' Rose (1999)입니까? 주류 LAD 문헌 내에서 LAD의 이러한 측면은 '블랙박스화(blackboxed)'(Akrich, 1992; Callon, 1990, 1992; Callon & Latour, 1982; Callon & Law, 1989)된 것으로 보이며, 이전 가능(transfer ready)한 보건의료전문직 교육 인프라의 자연스러운 일부일 정도로 정규화되었습니다. 이것은 다음의 문제입니다:

'…그 역사가 아무리 논란이 많더라도, 내부 작동이 아무리 복잡하더라도, 그것들을 지탱하는 상업적 또는 학술적 네트워크가 아무리 거대하더라도, 오직 그것들의 입력(input)과 출력(output)만이 중요하다' (Latour, 1987, p.3).

 

1. 나는 '인간'인가, 아니면 '데이터 덩어리(사이보그)'인가?

  • 원문 내용: "사회적 행위자는 결코 신체에만 위치하지 않습니다... 그들은 사이보그, 즉 인간과 비인간의 혼종이며..."
  • 쉬운 풀이:
    • 우리는 보통 "나는 나, 컴퓨터는 컴퓨터"라고 생각합니다. 하지만 학교 시스템 안에서 '나'라는 존재는 내 몸뚱이 하나로 증명되지 않습니다.
    • 학교 속의 나 = (내 육체) + (학번) + (로그인 기록) + (과제 제출 파일) + (성적 데이터)
    • 이 모든 게 합쳐져야 비로소 '학생'으로 인정받습니다. 연구진은 이것을 '사이보그(Cyborg)' 또는 **'혼종(Hybrid)'**이라고 부릅니다.
    • 문제점(정화, Purification): 그런데 사람들은 자꾸 이걸 분리하려고 합니다. 대시보드 화면(데이터)을 보고서는 "이게 너야"라고 말하죠. 데이터는 내 복잡한 삶의 일부일 뿐인데, 마치 **'순수한 나'**인 것처럼 취급받습니다(정화됩니다).

2. 내가 실패한 걸까, 기계가 실패한 걸까? (책임의 소재)

  • 원문 내용: "학생의 성과가 신체... 데이터베이스... 오프라인 수행의 결과물이라면... 실패의 경우 책임은 누구에게 있는가?"
  • 쉬운 풀이:
    • 만약 학생이 시험을 망쳤다고 칩시다. 그런데 그 이유가 학생이 공부를 안 해서가 아니라, 마우스 클릭을 잘못했거나, 인터넷이 끊겼거나, 대시보드의 점수 산정 방식이 이상해서였다면?
    • 이 '성적(성과)'은 학생의 머리에서 나온 걸까요, 아니면 컴퓨터 시스템에서 나온 걸까요?
    • LAD 환경에서는 이 경계가 모호합니다. 하지만 대시보드는 무조건 **"네 점수가 낮으니 네 책임이야"**라고 말합니다. 진짜 책임이 기계에 있을 수도 있는데도 말이죠.

3. '블랙박스'가 된 새로운 권력자 (입력과 출력만 중요해!)

  • 원문 내용: "데이터 간의 연결을 생성하는 알고리즘의 역할은 어떻습니까?... 블랙박스화된 것으로 보이며... 오직 입력과 출력만이 중요하다."
  • 쉬운 풀이:
    • 예전에는 교수님이 권력자였습니다. "너 점수 왜 이래?" 하고 물어보면 변명이라도 할 수 있었죠.
    • 이제는 **'알고리즘'**이 새로운 권력자(전문가)가 되었습니다. 대시보드가 "너는 위험군이야"라고 판결을 내립니다.
    • 블랙박스(Blackbox): 학생이 "왜 제가 위험군이에요? 어떤 계산식으로 나온 거죠?"라고 물어도, 아무도 대답해 주지 않습니다. 그 계산 과정(내부 작동)은 깜깜한 상자(블랙박스) 속에 숨겨져 있거든요.
    • 입력과 출력(Latour의 명언): 학교는 그 복잡한 계산 과정에는 관심이 없습니다.
      • 입력(Input): 학생이 로그인을 했는가?
      • 출력(Output): 그래서 점수가 몇 점인가?
      • 이 두 가지만 중요하게 여깁니다. 그 과정에서 학생의 사정이나 기계의 오류는 무시됩니다.

🍎 한 줄 요약

"학교 시스템 안에서 학생은 '인간+데이터(사이보그)'로 존재합니다. 그런데 학교는 '데이터'만 쏙 뽑아서 그게 진짜 너라고 믿습니다. 그 데이터를 만든 건 속을 알 수 없는 '알고리즘(블랙박스)'인데도 말이죠. 결국, 기계가 뱉어낸 결과(출력)가 곧 학생의 운명을 결정하는 절대적인 권력이 되어버립니다."


 

보건의료전문직교육에서의 LAD의 경우, 입력은 학생의 상호작용성(interactivity)(기술 사회의 사회 조직 도표(Barry, 2001))이고, 출력은 그들의 학습 성과에 대한 계산(calculation)입니다. 여담으로, 이러한 종류의 입력과 출력은 단순한 사건(events)(예: 수업 출석)에 대해서는 실행 가능할지 모르지만, 전문직간 교육(interprofessional education)이나 직업전문성(professionalism)과 같은 복잡하고, 상황에 위치하며, 해석적인 학습 과정(processes)어떻게 어느 정도의 충실도(fidelity)를 가지고 정량화 가능하고 비교 가능한 척도로 '평탄화(flattened)'될 수 있는지 이해하기 어렵습니다.

 

본질적으로, LAD 피드백 기능의 완전 자동화(full automation) 사례에서, 선진 자유주의 기술 사회의 '전문가' 역할은 맥락에 기반한 해석이 배제된(divorced of interpretation) 비인간 알고리즘인 자동화된 피드백 기능에 위임되고 있습니다. 시각적 디스플레이에 재현된 학생 성과의 계산과 권장 사항은 학생이 혼자서는 풀어낼 수 없는 '블랙박스(blackbox)'입니다(예시 Fig. 4 참조). 학습 권장 사항의 출처와 진실성(veracity)은 의심될 수 없으며, 협상될 수 없습니다. 인공지능(Artificial Intelligence, AI)이 LAD에 표시되는 데이터 해석의 중심이 되는 가까운 미래의 맥락에서, 의심할 수 없고 협상할 수 없는 LAD 권장 사항이라는 문제적 상황은 학생과 강사에게 전달되는 AI 환각(AI hallucinations)의 가능성, 즉 의심스러운 학습 교정 권장 사항(learning remediation recommendations)의 형태로 인해 더욱 악화될 수 있습니다.

 

Fig. 4 가상의 LAD 피드백 시각적 디스플레이 (Hypothetical LAD Feedback Visual Display)



우리의 입장에서 볼 때, 의학교육에서 LAD 피드백의 완전 자동화는 세 가지 잠재적 결과를 초래할 수 있습니다.

  • 첫째, Kitto et al. (2024)이 개략한 바와 같이 교육 및 훈련 단계에 따라 학습자는 LAD 유형의 머신 러닝 지도(guidance)에 더 성향적으로 기울어질(predisposed) 수 있습니다(학부 의학교육(UGME)의 첫 임상실습(clerkship) 년도로 전환하는 시기를 생각해 보십시오).
    • 끊임없이 진화하는 헬스케어 지식과 기술에 대한 숙달(mastery)의 불가능성에 대한 불안과 불확실성, 자신의 격차(gaps)와 지식에 대한 불확실성, 그리고 임상 강사의 진료 및 교육 스타일의 다양성에 대한 불확실성에 직면하여, 학위를 통해 진보할 방법에 대한 확실성을 찾는 학생들은 비판 없이 LAD 지도를 받아들이기 위해 서두를 수 있습니다.
    • 이러한 경향에 대항하기 위해, 보건의료전문직 학생 학습의 사회-문화적 맥락(socio-cultural context)을 삽입하는 것이 LAD 학습 권장 사항과 학생들의 순응(compliance) 간의 연결을 강화하는 방법이 될 수 있습니다. 문제는 이것을 어떻게 고충실도(high-fidelity) 방식으로 수행할 것인가, 이것이 사회-기술적 결합체로서 LAD에 어떻게 내장될 수 있는가 하는 것입니다.
    • '환각(hallucination)' 우려를 감안할 때, 학생들에게 잘못된 학습 행동(erroneous learning behaviour)을 피하기 위해(Kitto, 2024) 초기 단계의 머신 러닝 도구들의 환각 및 기타 결함의 가능성을 설명하는(account for) 방법을 가르치는 것, 그리고 이 경우 잘못된 정보를 바탕으로 한 LAD 학습 권장 사항에 순응하는 것을 피하는 방법을 가르치는 것이 중요합니다.
    • 그러나 (인간에 의해 중재되지 않는) 완전 자동화된 LAD 학습 권장 알고리즘이 배포되는 경우, LAD에서 생성된 지도의 출처가 블랙박스화되어 있고(blackboxed), 불투명하며(opaque), 불변하기(immutable) 때문에 이는 불가능합니다.
  • 둘째, 반대로 학생 집단 내의 신뢰 붕괴(breakdown in trust) 가능성과, "학생이 분류기(classifier)를 조금 불신할 근본적인 이유를 제공받았을 때 비판적 질문(critical questioning)이 일어날 가능성이 더 높다"(Kitto et al., 2018, p.455)는 가능성이 있습니다.
    • 우리는 이것이 분류 체계(classification schemas)가 어떻게 어떤 방식으로는 세계관을 형성하고 인간 상호작용을 질서 잡으면서(order), 동시에 다른 방식으로는 그것들을 무질서하게(disorder) 만들 수 있는지에 대한 문제뿐만 아니라, 분류기 자체가 얼마나 불완전할 수 있는지에 대한 문제를 아직 추구하지 않은 학습 분석 커뮤니티 내에서 발생할 가능성이 높다고 제안합니다(see (Bowker & Star, 2000)). 다시 말해, 학생의 학습 성과에 대한 생생한 현실(lived reality)이 LAD에 의해 이루어진 계산과 불일치(mis-aligned)하는 경우, 그들의 생생한 경험(lived experience)이 LAD의 판단과 권장 사항을 이기고(trump) 불신과 비순응적인 학습 행동으로 이어질 수 있습니다.
  • 셋째, 데이터와 분석이 중립적(neutral)이고 객관적(objective)이며 "무슨 일이 일어날지에 대한 증거(evidence)"(Prinsloo, 2017)로 간주되고 칭송받을 때, 학생들은 데이터 분석이 제공하는 것이 현실의 많은 재현(representations) 중 하나일 뿐임에도 불구하고 현실의 단 하나의 버전만 있다고 배우게 됩니다.
    • 이것은 의학과 헬스케어 분야에서 증거 기반 의사결정(evidence-based decision making)에 이미 부여된 무게를 감안할 때 보건의료전문직교육에서 특히 문제가 됩니다. 의학과 헬스케어 분야 밖에서는, 비평가들이 이미 증거 기반 경영(evidence-based management)을 교육에 이식하는 것이 제한적이라는 것을 인식하고 있습니다:

1. 불안한 학생들의 "맹신" (Blind Faith) → "AI 님, 시키는 대로 다 할게요. 제발 정답만 알려주세요."

  • 원문 내용: "불안과 불확실성에 직면하여... 비판 없이 LAD 지도를 받아들이기 위해 서두를 수 있습니다... 출처가 블랙박스화되어 있고 불투명하며..."
  • 쉬운 풀이:
    • 상황: 의대 공부는 양이 엄청나고, 이제 막 병원 실습(임상실습)을 나가면 학생들은 엄청나게 불안합니다. "내가 환자를 죽이면 어떡하지? 뭘 공부해야 하지?"
    • 부작용: 이때 AI가 "너 이거 공부해, 저거 해"라고 딱 정해주면, 학생들은 너무 불안한 나머지 비판적 사고 없이 넙죽 받아먹게 됩니다.
    • 위험성: 만약 AI가 오류(환각, Hallucination)를 일으켜서 엉뚱한 조언을 했다면? 학생은 그게 왜 나왔는지 알 수 없습니다(블랙박스). 그런데도 불안하니까 "기계가 시켰으니 맞겠지" 하고 틀린 지식을 맹신하며 따라가는 위험한 상황이 벌어집니다.

2. 현실과 다를 때의 "손절" (Total Distrust) → "기계가 내 현실을 모르는구만. 에이, 안 믿어!"

  • 원문 내용: "학생의 생생한 현실이 LAD 계산과 불일치하는 경우... 불신과 비순응적인 학습 행동으로 이어질 수 있습니다."
  • 쉬운 풀이:
    • 상황: 반대로, 학생은 오늘 병원에서 환자와 라포(공감)를 잘 형성했다고 느꼈습니다(생생한 현실). 그런데 대시보드를 보니 "당신의 소통 점수는 30점입니다"라고 뜹니다(LAD의 계산).
    • 부작용: 학생은 "뭐야, 기계가 내가 오늘 얼마나 잘했는지 알지도 못하면서!"라고 생각하게 됩니다.
    • 위험성: 내 **진짜 경험(현실)**이 기계의 **판단(데이터)**을 이겨버립니다(Trump). 결과적으로 학생은 시스템 전체를 불신하게 되고, 대시보드가 아무리 좋은 조언을 해도 "웃기고 있네"라며 무시해버리는 '비순응' 상태가 됩니다.

3. 시야가 좁아지는 "데이터 맹신주의" (Distorted Reality) → "숫자로 안 나오는 건 중요한 게 아니야."

  • 원문 내용: "현실의 단 하나의 버전만 있다고 배우게 됩니다... 증거 기반 의학에 내재된 실증주의적 경향을 악화시킬 수 있으며..."
  • 쉬운 풀이:
    • 상황: 의학은 원래 **'증거(Evidence)'**를 중시합니다. 그런데 교육까지 "데이터 증거가 없으면 무의미해"라고 가르치면 어떻게 될까요?
    • 부작용: 학생들은 **"데이터로 찍히는 것(점수, 등수, 효율성)"**만이 유일한 현실이자 진리라고 착각하게 됩니다.
    • 위험성: 교육적으로 정말 중요한 가치(예: 윤리, 소명의식, 따뜻한 마음)는 데이터로 측정하기 어렵습니다. 학생들은 이런 측정 불가능한 가치는 무시하고, 오로지 숫자로 증명되는 '효과성'만 쫓는 **'기술만능주의자(Technocrat)'**가 되어버립니다. 비판적인 질문을 던지는 능력은 사라지고, 정답(데이터)만 찾는 기계가 되는 거죠.

 

 

연구 측면에서, 증거 기반 교육(evidence-based education)은 교육적 수단과 기법의 효과성(effectiveness)에 대한 질문만이 유일하게 관련된 연구 질문이라고 가정하는 기술관료적 모델(technocratic model)을 선호하는 것처럼 보이며, 무엇보다도 '효과적'인 것으로 간주되는 것은 교육적으로 바람직한 것(educationally desirable)에 대한 판단에 결정적으로 달려 있다는 것을 잊고 있다. 실천 측면에서, 증거 기반 교육은 교육 실천가들이 그들 자신의 맥락화된 설정(contextualized settings)에 민감하고 적절한 방식으로 그러한 판단을 내릴 기회를 심각하게 제한하는 것처럼 보인다(Biesta, 2007, p.5).

 

학습에 대한 기술관료적 접근 방식에 의해 촉진되는 보건의료전문직교육은 증거 기반 의학(evidence-based medicine)에 내재된 실증주의적 경향(positivist tendency)을 악화시킬 수 있으며, 아마도 학생의 비판적 탐구(critical inquiry)의 지평을 축소시킬 수 있습니다. 현실에 대한 '객관적' 재현을 생성하기 위해 데이터와 지표에 의존하는 대신(재현주의적 관점(representationalist view)이라고도 함), 우리는 "증거, 데이터 및 분석에 대한 거래적 관점(transactional view)[이] 불완전성(incompleteness), 한계(limitations), 그리고 분석에서 생성된 통찰력이 기껏해야 잠정적(provisional)이라는 가능성을 인정한다"(Prinsloo, 2019)는 점을 살펴볼 수 있습니다.

1. "효과적(Effective)"인 것과 "바람직한(Desirable)" 것은 다르다.

  • 원문 핵심: "증거 기반 교육은 오직 '효과성'만 따지는 기술관료적 모델을 좋아한다... 무엇이 교육적으로 '바람직한' 것인지는 잊어버린다."
  • 쉬운 풀이:
    • 상황: 어떤 교육 프로그램(LAD)을 썼더니 학생들의 시험 점수가 20점 올랐다고 칩시다.
    • 기술관료적 관점(Technocratic): "와! 점수 올랐네? **효과적(Effective)**이다! 무조건 이거 쓰자!" (오로지 결과와 효율성만 따짐)
    • 비판(Biesta의 주장): "잠깐만, 점수는 올랐지만 학생들이 기계적으로 암기만 하게 된 거라면? 그게 과연 훌륭한 의사를 키우는 데 바람직한(Desirable) 방향이야?"
    • 문제점: 데이터는 '점수를 올리는 기술'은 알려주지만, '어떤 의사를 키워야 하는가'라는 가치 판단은 해주지 못합니다. 그런데 데이터 만능주의에 빠지면, 선생님들이 "이 상황에서는 점수가 좀 떨어져도 토론을 하는 게 맞아"라고 자신의 소신(판단)을 발휘할 기회를 박탈당하게 됩니다.

2. "지도는 영토가 아니다." (데이터를 맹신하지 마라)

  • 원문 핵심: "실증주의적 경향을 악화시키고... 비판적 탐구를 축소시킨다... '객관적 재현' 대신 '거래적 관점'을 가져야 한다."
  • 쉬운 풀이:
    • 실증주의(Positivist)의 위험: 의학은 원래 "증거(데이터) 없으면 믿지 마"라는 분위기(증거 기반 의학)가 강합니다. 그런데 교육까지 이렇게 되면, 학생들은 **"데이터로 안 찍히는 건 존재하지 않는 거야"**라고 믿게 됩니다.
    • 비판적 탐구의 실종: "왜요?" "이게 정말 맞나요?"라고 질문하는 능력(비판적 탐구)은 사라지고, "데이터에 그렇게 나와 있으니까요"라고 답하는 기계적인 학생만 남게 됩니다.
    • 재현주의 vs 거래적 관점:
      • ❌ 재현주의(Representationalist): "LAD 그래프가 곧 너의 실력이야." (데이터 = 현실 그 자체라고 믿음. 오만함.)
      • ⭕ 거래적 관점(Transactional): "이 데이터는 너의 실력을 보여주는 **불완전한 쪽지(잠정적 통찰)**일 뿐이야. 틀릴 수도 있고, 다르게 해석될 수도 있어." (데이터 = 현실을 이해하는 하나의 도구일 뿐임을 인정함. 겸손함.)

 

 

미래를 내다보며 (Looking forward)

 

그렇다면, 문헌에 대한 우리의 지식과 이 지점까지 제시된 성찰들을 바탕으로, 우리는 이러한 유형의 분석 주도형 피드백(analytics-driven feedback)을 어떻게 받아들여야 할까요? 자동화되었든 부분적으로 자동화되었든, LAD는 모든 이해관계자들에 의해 본질적으로 불완전한(imperfect) 것으로 이해되어야 하며, 따라서 모든 이해관계자들, 특히 학생들은 수동적인 수용자(passive recipients)가 되기보다는 데이터 기반 피드백에 생산적으로 참여할 수 있도록 권한을 부여받아야(empowered) 합니다(Kitto et al., 2018). 그렇다면 질문은 다음과 같습니다: LAD와 관련하여 이 학생 '권한 부여'의 조건은 어떻게 구성될 것인가? 이와 같은 질문에 대한 숙고는 '기술은 다른 옵션을 차단하는 시스템을 만들기도 하고, 새롭고 예측 불가능하며 실로 생각할 수 없는(unthinkable) 옵션을 생성하기도 한다'(Callon, 1992)는 지식을 가지고 다루어져야 합니다.

 

이러한 주의사항(caveats)은 우리가 이 주제 영역에서 더 사려 깊은 경험적 연구(empirical research)를 하도록 이끌어야 합니다. 분명히, 서로 다른 LAD의 상황에 위치한 수행(situated performances)은 서로 다른 재현과 콘텐츠, 서로 다른 교육학적 및 인프라적 조건과 제약(constraints)을 생산할 것입니다. 이러한 뉘앙스는 중요합니다: 우리의 요점은 LAD의 설계, 맥락 및 수행이 예측 가능하고 예측 불가능한 (비)의도적 효과((un)intended effects)를 가질 것이라는 점입니다. 따라서 LAD가 학습자의 성과와 동료, 강사 또는 그들이 등록된 교육 기관과의 관계에 미칠 수 있는 역할과 영향, 그리고 그에 따른 LAD의 특정 발현(manifestations)이 갖는 함의에 대한 경험적이고 비판적인 분석이 시급히 필요합니다.

 

우리는 LAD를 정보 기술이 밀집되어 있고 고도로 정치적인 기술 사회(Technological Society) 내에 위치한 것으로 명시적으로 인식함으로써 교육적 효과를 매핑(map out)하는 한 가지 방법을 제시했습니다. 보건의료전문직교육을 위한 LAD를 설계할 때, 기술적이고 도구적인 것을 넘어 사람, 이 경우에는 헬스케어 전문가를 설계(designing of people)하는 데 있어 자신의 역할을 고려해야 합니다. 이들은 이제 기술적 시민(technological citizens)이며, 정보 기술이 밀집된 헬스케어 시스템에서 운영할 수 있고, 지속적인 피드백을 받고 적응할 수 있는 평생 학습자가 되도록 기대받습니다. 상호작용적인 유형의 시민을 창출하는 피드백 시스템을 생산하기 위해 기술적 수단을 사용하는 것의 위태로움(precariousness)과 씨름하는 것은, 그리고 앞으로도 계속, 끊임없는 성찰을 요구하는 '사악한(wicked)' 문제가 될 것입니다.

 

결론 (Conclusion)

 

결론적으로, 우리는 피드백에 관한 핵심적이고 진행 중인 질문은 더 많은 피드백이라는 문제에 대한 '기술적 해결책(technical fix)'(학생과 교육자들이 종종 잘못하여 부르짖는)을 만드는 것이 아니라, 학습자와 그들의 학습 상황에 대한 적절한(appropriate) 피드백의 본질, 타이밍 및 배포에 우리의 관심이 집중되어야 한다는 마지막 주장을 펼치며 마칩니다. 더욱 결정적으로, 피드백 콘텐츠와 시스템의 생성은 그것들의 잠재적인 수많은 의도하지 않은 학습 결과(unintended learning consequences)를 인식하는 방식으로 설계되어야 하며, 그래야만 가능할 때와 장소에서 그것들을 제한(delimit)하려고 노력할 수 있습니다. 우리는 기술 사회(Technological Society)의 렌즈를 통해 보는 것이 이러한 의제를 도울 수 있으며, 이를 통해 LAD와 같은 인공물들이 미래의 헬스케어 전문가를 구성하는 데 있어 기술적으로나 정치적으로 더 비판적이고 신중하게 관여될 수 있다고 제안합니다.

 

1. 우리는 단순히 '프로그램'을 만드는 게 아니라, '사람'을 설계하고 있다.("Designing of people")

  • 원문 맥락: "LAD를 설계할 때, 우리는 단순히 기술적 도구를 만드는 게 아니라 헬스케어 전문가라는 **'사람을 설계(Designing of people)'**하고 있다는 사실을 기억해야 합니다."
  • 쉬운 풀이:
    • 대시보드를 만드는 사람들은 보통 "어떻게 하면 데이터를 예쁘게 보여줄까?"를 고민합니다.
    • 하지만 연구진은 더 큰 그림을 보라고 합니다. 이 시스템을 통해 길러지는 의사들은 **"평생 동안 데이터 피드백을 받고, 기술과 상호작용하며 살아갈 '기술적 시민(Technological Citizens)'"**이 될 것이기 때문입니다.
    • 즉, 우리는 소프트웨어를 코딩하는 게 아니라, 미래 의사의 '인격'과 '태도'를 코딩하고 있다는 책임감을 가져야 합니다.

2. 이건 정답이 없는 '사악한 문제'다. ("Wicked Problem")

  • 원문 맥락: "피드백 시스템을 만드는 것은 끊임없는 성찰을 요구하는 **'사악한 문제(Wicked problem)'**입니다."
  • 쉬운 풀이:
    • 여기서 **'사악한(Wicked)'**이라는 말은 나쁘다는 뜻이 아니라, **'도무지 정답을 알 수 없고, 상황에 따라 계속 변해서 해결하기 지독하게 어려운 문제'**라는 학술 용어입니다.
    • "LAD 하나 도입하면 피드백 문제 끝!" 같은 깔끔한 해결책은 없다는 겁니다. 기술은 새로운 문제를 또 만들어낼 테니까요. 그러니 "다 해결됐다"고 자만하지 말고 계속 고민하고 고쳐나가야 합니다.

3. '양(More)'보다 '질(Appropriate)'이 중요하다. ("Technical Fix" vs "Appropriate Feedback")

  • 원문 맥락: "학생들이 잘못 요구하는 '더 많은 피드백'을 위한 **'기술적 해결책(Technical fix)'**을 만드는 게 핵심이 아닙니다. 우리의 관심은 '적절한(Appropriate)' 피드백의 본질과 타이밍에 집중되어야 합니다."
  • 쉬운 풀이:
    • 학생들은 종종 불평합니다. "피드백 좀 더 많이(More) 주세요!"
    • 학교는 "그래? 그럼 AI로 피드백을 100개씩 자동으로 뿌려줄게(기술적 해결책)"라고 답하기 쉽습니다.
    • 하지만 연구진은 이게 틀렸다고 말합니다. 무조건 많이 주는 게 능사가 아니라, **"학생이 받아들일 수 있는 타이밍에, 학생의 상황에 딱 맞는(Appropriate) 피드백"**을 주는 게 진짜 목표여야 한다는 것입니다.
    • 기술로 때우려(Fix) 하지 말고, 교육의 본질을 고민하라는 뼈 있는 조언입니다.

 

 

 

 

 

 

 

 

 

 

 

Acad Med. 2024 Apr 1;99(4S Suppl 1):S71-S76. doi: 10.1097/ACM.0000000000005606. Epub 2023 Dec 18.

Navigating the Landscape of Precision Education: Insights From On-the-Ground Initiatives

 

 

의학 교육의 혁신, 정밀 교육(Precision Education)이 온다! 🏥🎓

안녕하세요! 오늘은 의학 교육 분야에서 정말 핫한 키워드인 '정밀 교육(Precision Education, PE)'에 대한 흥미로운 논문을 소개해드리려고 해요. 환자에게 딱 맞는 치료를 제공하는 '정밀 의료'처럼, 교육도 이제 학습자 개개인에게 딱 맞춘 '정밀 교육'의 시대로 가고 있답니다. 오늘 함께 살펴볼 논문은 "Navigating the Landscape of Precision Education: Insights From On-the-Ground Initiatives" 입니다.

이 논문에서는 실제 현장에서 이루어지고 있는 세 가지 흥미로운 프로젝트를 통해 정밀 교육이 어떻게 구현되고 있는지 보여주고 있어요. 자, 그럼 함께 살펴볼까요? 🔍


💡 정밀 교육(PE)이란 무엇일까요?

연구진은 정밀 교육의 목표를 아주 명쾌하게 정의하고 있습니다.

"올바른 학습자에게 올바른 시간에 올바른 교육적 개입을 효율적으로 제공하는 것"

“the efficient delivery of the right educational intervention to the right learner at the right time.”

 

과거에는 모든 전공의에게 똑같은 교육을 제공했다면, 이제는 데이터 과학(Data Science)과 기술(Technology)을 활용해 개인의 강점과 약점을 파악하고 맞춤형 교육을 제공하겠다는 것이죠. 이 논문에서는 PE 수명주기(PE Lifecycle)라는 개념을 사용해요.

  1. 데이터를 모으고 (Inputs)
  2. 분석해서 통찰을 얻고 (Insights)
  3. 개입하고 (Interventions)
  4. 성과를 확인하는 (Outcomes) 이 과정이 계속 반복되면서 교육이 발전한다는 것이죠.

그럼 실제 사례 3가지를 보러 가실까요?


1️⃣ 전공의 교육 연구실 (GEL): 데이터로 보는 수련 환경 📊

첫 번째 사례는 내과 전공의들을 대상으로 한 GEL(Graduate Medical Education Laboratory) 프로젝트입니다.

  • 무엇을 했나?: 전공의들에게 실시간 위치 추적 서비스(RTLS) 배지를 달게 했어요. 그리고 웰니스 설문조사와 신체 검진 평가(APECS) 데이터를 모았죠.
  • 무엇을 발견했나?: 놀랍게도 인턴들이 환자 방에 머무르는 시간은 전체의 13.4% 밖에 안 됐다고 해요! 침상 옆 회진(Bedside rounds)을 늘려야 한다는 통찰을 얻었죠.
  • 핵심 포인트: 위치 데이터, 전자 건강 기록(EHR) 데이터, 그리고 임상 기술 평가를 연결해서 전공의가 '어디서 무엇을 하는지', 그리고 그것이 '실력과 소진(Burnout)'에 어떤 영향을 주는지 분석했습니다.

2️⃣ 전공의 전환 이점 프로그램 (TRA): 코칭으로 잇는 다리 🌉

두 번째는 의대생에서 전공의로 넘어가는 힘든 시기를 돕는 TRA(Transition to Residency Advantage) 프로그램입니다. NYU에서 진행되었어요.

  • 무엇을 했나?: 의대 시절의 포트폴리오를 전공의 프로그램에 넘겨주는 "따뜻한 인계(Warm Handoff)"를 도입했어요. 그리고 전문 코치와 정기적으로 만나 목표를 설정하게 했죠.
  • 무엇을 발견했나?: 코칭을 받은 전공의들은 그렇지 않은 그룹보다 직업적 성취감(Professional Fulfillment)과 회복탄력성(Resilience)이 더 높았습니다.
  • 핵심 포인트: 여기서는 AI보다는 사람 간의 상호작용(Human Analytics)에 집중했습니다. 단순히 지식만 채우는 게 아니라, 자기 주도적으로 성장하는 법을 가르친 거죠.

3️⃣ 교육 공학을 위한 마취 연구 그룹 (TARGET): AI가 추천하는 맞춤형 공부 📱

세 번째는 마취과 전공의를 위한 TARGET 프로젝트입니다.

  • 무엇을 했나?: 퀴즈 결과, EHR 기록, 평가 데이터 등을 모아 "학습자의 디지털 표현(Digital Representation)"을 만들었어요.
  • 어떻게 작동하나?: 만약 제가 '당뇨병 환자' 수술 경험이 부족하다면? 시스템이 알아서 제 스마트폰 앱으로 당뇨병 환자 관리에 대한 논문이나 강의 영상을 띄워줍니다! 넷플릭스 추천 알고리즘이랑 비슷하죠?
  • 핵심 포인트: 자연어 처리(NLP)와 같은 AI 기술을 활용해 학습자의 부족한 부분, 즉 근접 발달 영역(Zone of Proximal Development)을 정확히 타격해서 교육 콘텐츠를 제공합니다.

🧐 정리하며: 기술보다 중요한 것은?

이 논문은 정밀 교육의 화려한 기술만을 이야기하지 않습니다. 연구진은 기술 도입 시 발생할 수 있는 데이터 프라이버시, AI의 편향(Bias) 문제를 신중하게 다뤄야 한다고 경고해요. 마지막으로 연구진이 강조한, 우리가 꼭 기억해야 할 핵심 메시지를 공유하며 글을 마칩니다. 교육의 혁신은 결국 환자를 위한 것이니까요.

"PE 이니셔티브는 교육적 개입이 학습자에게 공평하게 제공되고, 그러한 개입의 하류에서 제공되는 의료 서비스가 환자에게 공평하게 제공되도록 보장해야 합니다."

“PE initiatives need to ensure that educational interventions are delivered equitably to learners and that health care delivered downstream from those interventions is provided equitably to patients.”


오늘의 포스팅 요약:

  • 정밀 교육(PE)은 데이터와 기술로 '딱 맞는 교육'을 제공하는 것!
  • GEL: 위치 추적 등으로 수련 환경 분석
  • TRA: 의대-전공의 전환기 코칭 및 멘토링
  • TARGET: AI 기반의 개인 맞춤형 콘텐츠 추천
  • 주의점: 기술도 좋지만, 윤리와 공평성(Equity)을 잊지 말자!

 

정밀 교육(Precision Education, PE)의 목표는 “올바른 학습자에게 올바른 시간에 올바른 교육적 개입을 효율적으로 제공하는 것(the efficient delivery of the right educational intervention to the right learner at the right time)”입니다. 개별 학습자의 강점과 약점에 맞춰 학습 기회를 조정(tailoring)한다는 아이디어는 새로운 것이 아닙니다. 그러나 수련생의 경험에 대한 방대한 양의 정보를 제공하는 데이터 과학(data science)과 기술의 발전은 의학 교육을 위한 새로운 접근 방식을 촉발했습니다.

  • 예를 들어, 전공의 프로그램(residency programs)은 전자 건강 기록(electronic health record, EHR)에 있는 데이터를 사용하여 전공의의 임상 경험을 추적하고 역량(competency)을 파악할 수 있습니다.

이러한 발전은 개별화된 학습(individualized learning)을 지원하는 시스템을 구축하게 하며, 이는 학습자, 더 나아가 환자를 위한 성과(outcomes)를 극대화하려는 의도를 가집니다. 동시에, PE는 데이터의 수집과 해석, 그리고 개별 수련생과 교육 프로그램에 유의미한 통찰(meaningful insights)을 가장 잘 전달하는 방법과 관련하여 독특한 과제들을 제시합니다.

 

PE 이니셔티브는 개인 및 프로그램 수준에서 의학 교육의 연속체(continuum) 전반에 걸쳐 가치를 더할 수 있습니다. 이니셔티브를 개발하고 평가할 때, 본 Academic Medicine 보충호에서 Desai 등이 기술한 PE 수명주기(PE lifecycle)를 고려하는 것이 도움이 됩니다. 이 주기는

  • 입력을 수집하고(gathering inputs),
  • 분석(analytics)을 사용하여 통찰을 생성하고(generate insights),
  • 개입(interventions)을 계획 및 실행하고,
  • 성과(outcomes)를 학습 및 평가하며,
  • 학습한 교훈을 사용하여 주기를 수정하는 반복적인 과정(iterative process)입니다.

우리는 의학 교육 연속체의 서로 다른 지점에서 발생하며 다양한 전문 분야의 학습자가 참여하는 3가지 PE 이니셔티브를 설명할 것입니다. PE 주기를 사용하여, 우리는 공통된 주제와 학습한 교훈을 도출하여 PE의 도전 과제와 잠재력을 보여줄 것입니다.

PE 이니셔티브 1: 전공의 교육 연구실 (PE Initiative 1: The Graduate Medical Education Laboratory (GEL))

배경 (Background)

졸업 후 의학 수련생(Graduate medical trainees)들은 현대 병원에서 환자와 직접 접촉하는 시간이 12%에 불과합니다. 이는 임상 기술(clinical skills)의 저하, 의료 오류(medical errors)의 증가, 의료 제공자 사이의 소진(burnout) 증가와 동시에 발생했습니다. 전공의 교육 연구실(The Graduate Medical Education Laboratory, GEL)은 졸업 후 의학 수련생(즉, 전공의, 그림 1 참조)의 임상 기술과 직업적 성취감(professional fulfillment)을 향상시키기 위해 헌신하는 4개 내과 전공의 프로그램(존스 홉킨스 병원, 존스 홉킨스 베이뷰 의료 센터, 스탠포드 대학교, 앨라배마 대학교 버밍엄)의 네트워크입니다. GEL의 목표는 다음과 같습니다:

 

그림 1: 전공의 교육 연구실(GEL) 프로그램에 적용된 정밀 교육(PE) 주기는 입력(inputs)에서 시작하여 시계 방향으로 각 단계를 따라가는 것으로 가장 잘 볼 수 있습니다. 실시간 위치 추적 서비스(RTLS) 배지 데이터와 웰니스(wellness) 및 임상 기술에 대한 종단적 평가(longitudinal assessments)와 같은 입력은 개별 학습자와 전공의 프로그램 모두에 대한 통찰을 제공합니다. 이러한 통찰은 임상 기술과 직업적 성취감을 향상시키기 위해 설계된 개입(interventions)으로 이어질 수 있습니다. 개입에서 얻은 교훈은 다시 PE 주기로 피드백될 수 있습니다.

  • 측정(Measure). 학습 환경, 임상 기술, 직업적 성취감을 설명하는 포괄적이고, 종단적이며, 확장 가능한 데이터 지표 세트를 구현합니다.
  • 연관(Associate). 학습 환경의 요소들을 전공의의 웰니스 및 임상 기술과 연결하는 모델을 생성합니다.
  • 개입(Intervene). 전공의의 웰니스와 임상 기술을 향상시키기 위한 개입을 개발, 실행 및 평가합니다.

입력 (Inputs)

참여하는 GEL 전공의들은 3초마다 적외선 신호를 방출하는 실시간 위치 추적 서비스(RTLS) 배지를 착용합니다. 이를 통해 기존의 시간-동작 연구(time-in-motion studies)보다 몇 자리수(orders of magnitude) 더 높은 규모로 업무 흐름(workflow)에 대한 정보를 수집할 수 있습니다. 예를 들어, i-Compare 연구는 시간-동작 설계를 사용하여 약 2,200시간의 전공의 위치 데이터를 수집한 반면, GEL RTLS 연구에서는 거의 100,000시간을 수집했습니다. RTLS 데이터는 웰니스, 소진(burnout), 회복탄력성(resiliency)에 대한 월간 설문조사와 연결하여, 특정 활동 패턴(activity signatures)이 개인 및 프로그램 수준에서 더 높은 성취감이나 증가된 소진과 연관되어 있는지 확인할 수 있습니다.

 

RTLS 및 웰니스 데이터는 임상 기술의 지표와도 연결될 수 있습니다. 임상 기술, 특히 신체 검진 기술(physical exam skills)에 대한 직접 관찰은 학부 의학 교육 과정에서는 드물며 전공의 수련 기간에는 더욱 드뭅니다. 3개의 GEL 현장에서는 수련생들이 실제 소견을 가진 실제 환자를 만나는 형성 평가 활동인 신체 검진 및 의사소통 기술 평가(Assessment of Physical Exam and Communication Skills, APECS)를 도입했습니다. 수련생들은 7개 임상 영역에 걸쳐 평가를 받고, 임상 기술을 향상시키기 위해 교수진으로부터 실시간 실습 피드백(hands-on, real-time feedback)을 받습니다.

 

각 GEL 전공의가 매일 EHR에서 보내는 시간과 다양한 활동(예: 기록 작성, 처방 입력)에 소비하는 시간의 내역이 전향적으로 수집됩니다. 이 데이터는 RTLS, 웰니스, 임상 기술 데이터와 연결되어 특정 EHR 패턴(EHR signatures)이 특정 성과와 연관되어 있는지 파악할 수 있습니다.

통찰 (Insights)

견고한 데이터는 개인 및 프로그램 수준 모두에서 통찰을 제공합니다. 존스 홉킨스 병원에서 수행된 44명의 인턴을 대상으로 한 RTLS 연구에서, 인턴들은 시간의 13.4%만을 환자 병실에서 보냈습니다. 또한 침상 옆(bedside)에서 보내는 시간에 있어 전공의 간 상당한 편차(8.8%에서 18.8%까지)가 있었습니다. 전체 근무일과 비교했을 때, 침상 옆 시간은 오전 회진 중 일부 임상 서비스(특히 치프 레지던트 및 종양학 서비스)에서는 더 높았지만 중환자실(intensive care unit) 및 세부 전문 분야 서비스에서는 더 낮았습니다. 이는 침상 회진(bedside rounds)이 의사들이 병원에서 환자와 시간을 보내는 방식을 혁신할 수 있는 영역임을 시사합니다. 개인 및 서비스 수준의 변동성을 이해하는 것은 환자와 함께하는 시간이 직업적 성취감과 임상 기술에 어떤 영향을 미치는지 조명해 줄 수 있습니다.

 

200명 이상의 내과 인턴들이 APECS에 참여했습니다. APECS 중에 관찰된 신체 검진 기술은 정확한 신체 징후 및 진단을 식별하는 것과 유의미한 상관관계가 있었습니다. 말기 간 질환을 앓고 있는 동일한 환자를 검진한 29명의 인턴 중 절반 이상이 신체 검진 기술에서 "개선 필요(needs improvement)" 점수를 받았으며, 대부분이 간비대(hepatomegaly)와 비장비대(splenomegaly)를 인지하지 못했습니다. 이러한 데이터는 개인 및 전공의 프로그램 수준에서 특정 신체 검진 기술을 향상시킬 수 있는 기회를 강조합니다.

개입 (Interventions)

졸업 후 의학 수련 환경의 구성 요소를 임상 기술 및 웰니스와 연결하는 모델에서 얻은 통찰은 전공의 프로그램 및 개별 학습 활동에 정보를 제공할 수 있습니다. 예를 들어,

  • 침상 옆 시간을 늘리기 위해 오전 회진을 수정하고 이것이 임상 기술과 소진에 미치는 영향을 측정하는 것을 상상해 볼 수 있습니다.
  • 몇 가지 개입은 이미 진행 중입니다.
    • 매년 전공의들은 APECS 교수진과 개별적으로 만나 자신의 성과를 검토합니다. 그들은 함께 개별화된 학습 계획(individualized learning plan)을 개발하며, 여기에는 임상 기술을 향상시키기 위한 실제 환자 만남이 포함됩니다.
    • APECS 데이터에 대응하여, 실제 자원봉사 환자를 활용한 1시간짜리 위장관계 신체 검진 워크숍이 GEL 현장 중 한 곳의 외래 커리큘럼에 추가되었습니다.

성과 (Outcomes)

교육 환경의 특정 구성 요소를 임상 기술 및 직업적 성취감과 연결하는 강력한 모델을 개발하기에는 아직 충분한 데이터가 없지만, 다수의 중요한 도구들(예: RTLS, APECS, EHR 데이터, 웰니스 설문조사)이 배치되었습니다. 형성적 임상 기술 평가 프로그램(formative clinical skills assessment program)의 실행은 참여 현장에서 현장 진료 초음파(point-of-care ultrasound)를 포함한 침상 옆 임상 검진에 대한 관심을 새롭게 불러일으켰습니다.

과제 (Challenges)

GEL 입력 중 일부는 수련생의 적극적인 참여를 필요로 합니다. 이로 인해 설문조사, RTLS 배지, EHR 데이터를 동시에 보유한 수련생의 수가 제한되었습니다. APECS는 자원 집약적(resource intensive)이며 종단적 데이터를 제공하지 않아, 서로 다른 개입이 임상 기술에 미치는 영향을 평가하는 능력을 제한합니다. 또한 서로 다른 의료 시스템 전반에 걸쳐 EHR 척도를 표준화하는 것도 어려웠습니다.

PE 이니셔티브 2: 전공의 전환 이점 프로그램 (PE Initiative 2: The Transition to Residency Advantage (TRA) Program)

배경 (Background)

의과대학에서 전공의 과정(residency)으로의 전환은 학습자의 발전과 안녕(well-being)을 위협하는 힘든 시기입니다. 수련생들이 점차 다양해짐에 따라, 천편일률적인 접근 방식(one-size-fits-all approach)은 학습 요구의 폭넓은 편차를 지원할 수 없습니다. 의과대학은 학생의 성과에 대한 풍부한 포트폴리오를 수집하지만, 선발 과정 중이나 그 이후에 졸업 후 수련 프로그램(graduate training programs)에 제공되는 정보는 거의 없습니다. NYU의 전공의 전환 이점(Transition to Residency Advantage, TRA) 프로그램은 전공의 과정으로의 전환을 개선하기 위해 코칭(coaching)에 기반을 둔 PE 접근 방식을 사용합니다(즉, 브리지 코칭; 그림 2 참조).

 

그림 2: NYU 전공의 전환 이점(TRA) 프로그램에 적용된 정밀 교육(PE) 주기는 입력에서 시작하여 시계 방향으로 각 단계를 따라가는 것으로 가장 잘 볼 수 있습니다. 초기 코칭 미팅에서, 의과대학은 졸업하는 수련생에 대한 심층적인 데이터를 그들의 새로운 전공의 프로그램에 제공합니다. 이는 개별 학습자에 대한 통찰로 이어지며, 이는 개인화된 학습 목표가 설정되는 지속적인 코칭 미팅의 실질적인 내용을 구성합니다(inform). 개별 수련생의 진척도는 학습 포트폴리오와 종단적 미팅을 통해 추적되며, 이는 다시 PE 주기에 추가적인 입력으로 제공됩니다.

입력 (Inputs)

TRA는 의과대학이 학습자를 새로운 전공의 프로그램에 대면으로 소개하는 것으로 시작합니다. 이 “따뜻한 인계(warm handoff)”는 TRA 모델의 첫 번째 입력이며 환자를 새로운 의료 제공자에게 의뢰하는 선호되는 방식을 반영합니다. 인계 과정 동안, TRA는 학습자의 의과대학 포트폴리오를 전공의 프로그램에 제공합니다. 학습자와 GME 코치 간의 지속적인 미팅은 코칭 상호작용의 성격과 실질적 내용을 알리는 추가적인 입력을 제공합니다. 입력에는 순환 근무 성과 평가, 임상 역량 마일스톤(milestone) 평가, 학생에 의한 교육 평가, 목표 설정에 대한 성찰 연습 등의 데이터가 포함됩니다.

통찰 (Insights)

코치는 수련 첫해 동안 분기별로 학습자와 만납니다. 미팅은 학습자의 의제(agenda)에 기반하여 반구조화(semistructured)되어 있으며, 학습자가 목표를 설정하고 전문성 개발의 발판(scaffold)을 마련하도록 돕는 것을 목표로 합니다. 코치와 수련생은 수련생에 대한 평가와 객관적인 데이터를 봅니다. 이러한 미팅에서 얻은 통찰은 학습 및 개발 우선순위에 대한 선택에 정보를 제공합니다. 전공의들은 이전 미팅에서 설정한 목표와 공식 및 비공식 절차를 통해 수집된 피드백에 비추어 자신의 수련 경험을 성찰합니다.

개입 (Interventions)

TRA는 매칭 데이(match day)부터 전공의 초기 과정까지 이어져 전공의의 자기 주도성(self-direction)과 직업적 자율성을 강화합니다. 참가자들은 자체 개발한 웹 기반 기술 애플리케이션을 사용하여 미팅 일정을 잡고 추적하며, 학습 목표에 대해 소통하고, 코칭 도구에 접근하며, 학습 포트폴리오를 사용함으로써 코칭 만남을 지원합니다. 미팅 중에 코치는 학습자가 자신의 우선순위, 흥미, 과거 경험에 기반하여 목표를 개발하도록 유도합니다. 목표는 종종 지식 및 기술 구축, 연구, 경력 계획, 성찰적 실천(reflective practice), 안녕(well-being)에 초점을 맞춥니다.

 

코치들은 코칭의 기초, 신규 인턴의 필요, 코칭 프로그램의 실질적인 측면, 그룹 코칭 기술 시험에 초점을 맞춘 9회 세션의 워크숍 시리즈에 참여합니다. 코치들은 월간 실천 공동체(community of practice) 모임에 참여하여 코칭 시나리오를 고려하고 학습자의 어려움에 반응하는 최적의 방법을 논의합니다.

성과 (Outcomes)

각 개별 학습자에 대한 성과는 학부 의학 교육에서 전공의 과정으로 전환하는 동안의 수행 능력입니다. 진척도는 각 후속 코칭 미팅에서 검토되며, 이 데이터는 새로운 통찰과 목표를 알리는 입력으로서 PE 주기로 다시 들어갑니다.

 

TRA 파일럿에는 내과, 산부인과, 응급의학과, 정형외과, 병리과의 인턴 96명이 포함되었습니다. 졸업하는 의대생들은 현실적이고 달성 가능한 목표를 설정하는 능력을 보여주었지만, 해당 목표에 도달하기 위한 전략은 덜 발달되어 있었습니다. 코칭을 받은 전공의들은 지식, 기술, 안녕, 직업 정체성과 관련된 다양한 영역에서 구체적인 목표를 설정하는 능력이 향상되었음을 보여주었습니다. 코칭을 경험한 44명의 2년 차 전공의와 그렇지 않은 전년도의 44명 전공의를 비교했을 때, 코칭 그룹은 더 큰 직업적 성취감, 회복탄력성, 경력 자기 효능감(career self-efficacy)을 보고했으며, 목표를 설정할 시간이 있고 프로그램의 지원을 받고 있다는 느낌을 지지했습니다. 코칭에 참여한 전공의들은 역량을 증명하기보다는 학습 지향적인(oriented toward learning) 목표를 설정할 가능성이 더 높았으며 목표 설정에 대한 장벽을 더 적게 보고했습니다. 코칭은 전공의들이 자기 주도적 학습(self-directed learning)을 인식하는 방식의 변화를 지원할 수 있으며, 이는 PE에 대한 참여를 보장하는 필수 요소입니다.

 

전공의 전환 과정을 통한 코칭은 직업적 성장과 개발을 위한 명시적인 커리큘럼에 정보를 제공할 잠재력이 있습니다. 코칭 경험은 학습자의 참여, 코치와 학습자 간의 관계, 코칭을 지원하기 위해 마련된 구조에 의해 강하게 영향을 받습니다. 코칭은 다양한 유형의 목표 전반에 걸친 학습의 통합을 허용하며, 긴급한 임상 업무에 집중해야 하는 GME(졸업 후 의학 교육)의 압박과는 대조적으로 성찰을 위한 공간을 만듭니다. 이는 전문성 개발이 임상 기술 외에도 팀워크 기술, 시간 관리, 일과 삶의 통합(work-life integration), 스트레스가 많은 경험 처리 및 기타 영역을 포괄한다는 생각을 표준화합니다.

과제 (Challenges)

TRA 참가자들이 직면한 한 가지 과제는 학습에 대한 성찰과 미래 학습에 대한 계획이 전공의 과정의 핵심 업무(core work)로 간주되지 않는다는 점입니다. TRA의 향후 반복(iterations)에서는 임상 기술과 직업적 성취감을 향상시키기 위해 학습에 대한 성찰의 가치를 강조함으로써 이 문제를 명시적으로 다룰 것입니다.

PE 이니셔티브 3: 교육 공학을 위한 마취 연구 그룹 (PE Initiative 3: The Anesthesia Research Group for Educational Technology (TARGET))

배경 (Background)

교육 공학을 위한 마취 연구 그룹(The Anesthesia Research Group for Educational Technology, TARGET)은 마취과 전공의에게 개별화된 교육을 제공하기 위한 자동화 도구를 개발하는 것을 목표로 하는 다기관 컨소시엄입니다. TARGET 팀은 Triola와 Burk-Rafel이 제시한 P4 프레임워크에 기반하여 이 PE 플랫폼의 개념적 설계를 공식화했으며, 여기에는 능동성(proactivity), 개인화(personalization), 참여(participation), 성과의 예측(prediction of outcomes) 원칙이 포함됩니다. 이 프레임워크는 PE 주기를 사용하여 실행됩니다(그림 3 참조).

 

그림 3: 교육 공학을 위한 마취 연구 그룹(TARGET) 프로그램에 적용된 PE 주기는 입력에서 시작하여 시계 방향으로 각 단계를 따라가는 것으로 가장 잘 볼 수 있습니다. 퀴즈 뱅크, 전자 건강 기록(EHR), 프로그램 평가에서 개별 학습자에 대한 정보를 수집하여 지속적으로 업데이트되는 학습자의 디지털 표현(digital representation)을 생성합니다. 그런 다음 우선순위 지정 모델(prioritization model)이 학습자의 경험과 지식을 향상시킬 콘텐츠를 선택합니다. 업데이트된 데이터는 학습자의 디지털 표현을 정교화(refines)하며, 이는 학습자의 자신감, 기술 및 실무 준비를 향상시킬 수 있는 추가적인 개인화된 콘텐츠로 이어집니다.

입력 (Inputs)

TARGET 도구의 첫 번째 구성 요소는 (1) 현재 지식, (2) 핵심 기술 및 행동에 대한 역량, (3) 임상 경험을 포착하는 학습자의 디지털 표현(digital representation of the learner)이 될 것입니다. 모델의 지식 부분은 미국 마취과 위원회(American Board of Anesthesiology)의 콘텐츠 개요에 기반합니다. 주요 지식 입력은 마취과 전공의들 사이에서 많이 활용되는 학습 도구인 퀴즈 뱅크 문항에 대한 학습자 수행 능력입니다. 위임 가능한 전문 활동(entrustable professional activities, EPAs), 절차적 기술, 비기술적 기술(nontechnical skill) 평가를 통합한 작업장 기반 평가 도구(workplace-based assessment tool)의 데이터가 학습자의 기술 및 행동에 대한 정보를 제공하는 데 활용될 것입니다. 학습자의 임상 경험에 대한 데이터는 순환 근무 일정과 예정된 환자 만남(encounters)으로 나타낼 것입니다. 또한 임상 경험을 나타내기 위해 현재 시술명(current procedure technology, CPT) 코드국제 질병 분류(International Classification of Diseases, ICD) 코드를 포함한 EHR의 데이터를 사용할 것입니다. 학습자가 수련에 참여함에 따라 모델은 다양한 소스에서 데이터를 수집하고 학습자의 현재 상태에 대한 업데이트된 표현을 제공할 것입니다.

통찰 (Insights)

학습자의 표현을 생성하고 유지 관리하려면 위의 각 입력이 정기적인 간격으로 업데이트되어야 하며, 이는 능동성(proactivity) 및 개인화(personalization)라는 정밀 교육 원칙과 일치하는 관행입니다. 데이터 포인트의 집계는 시스템이 학습자가 상당한 경험과 높은 수준의 역량을 가진 영역뿐만 아니라 역량이 낮고 경험이 적은 영역을 정확히 찾아낼 수(pinpoint) 있게 해줍니다. 이 정보는 개별 학습자와 전공의 프로그램에 귀중한 통찰을 제공할 수 있습니다.

개입 (Interventions)

학습자 모델이 개발되면, TARGET 앱은 특정 영역의 지식과 역량을 향상시키기 위해 개인화된 콘텐츠를 제공합니다. TARGET은 저널 논문, 강의, 슬라이드 세트, 비디오, 팟캐스트, 개요를 포함하여 2,000개 이상의 큐레이팅된 교육 콘텐츠 항목이 있는 콘텐츠 데이터베이스를 구축했습니다. 콘텐츠 데이터베이스의 각 노드는 학습자 모델의 해당 노드에 매핑되어 있어, 특정 학습 요구가 식별되면 해당 영역에 콘텐츠를 타겟팅할 수 있습니다. 콘텐츠 데이터베이스는 새로운 콘텐츠로 업데이트될 수 있으며, 이는 능동성(proactivity) 원칙과 일치하는 접근 방식입니다. 초기 콘텐츠 항목 및 매핑은 PubMed의 논문으로 훈련된 오픈 소스 모델인 자연어 처리(NLP) 모델(prtiamdeka/s-PubMedBert-MS-MARCO)을 사용하여 임베딩되었습니다. 가중치 규칙 기반 우선순위 지정 알고리즘(weighted rules-based prioritization algorithm)은 학습자가 이미 본 콘텐츠, 절차나 의학적 진단에 대한 학습자의 이전 경험, 그리고 현재 역량 수준을 활용하여 목록의 우선순위를 정합니다.

  • 예를 들어, 학습자가 당뇨병 환자를 만나고 이것이 시스템으로 하여금 당뇨병 환자의 수술 중 관리에 대한 논문을 추천하도록 유도하는 경우, 학습자가 이미 유사한 만남을 상당히 많이 가졌다면 우선순위 알고리즘은 이 콘텐츠의 표시 순위를 낮출 것입니다.

이를 통해 우선순위 엔진은 학습자의 근접 발달 영역(zone of proximal development)—역량이 가장 낮거나 경험이 가장 적은 영역—내에 있는 콘텐츠를 제안할 수 있습니다.

 

콘텐츠는 모바일 스마트폰 애플리케이션을 통해 학습자에게 제공됩니다. 앱 내에서 학습자는 제안된 콘텐츠를 보고 개인 라이브러리에 추가할 수 있습니다. 학습자가 콘텐츠 추천을 받을 때마다 유용성과 품질에 대한 실시간 피드백을 제공할 수 있습니다. 이 기능은 참여(participation)라는 PE 원칙을 TARGET 도구에 추가로 통합합니다.

성과 (Outcomes)

TARGET 프로젝트는 아직 개발 초기 단계에 있습니다. 학습자 성과에는 수련 효율성의 향상과 궁극적으로 실무 준비(preparation for practice)의 향상이 포함되기를 희망합니다. 다른 성과로는 빈도가 낮고 위험이 높은 케이스에 대한 수련생의 자신감 증가, 시뮬레이션 성과 향상, ACGME 설문조사 결과 개선, 시험 점수 향상 등이 있을 수 있습니다. 궁극적으로 더 효율적이고 목표 지향적인 교육은 더 나은 환자 성과와 유해 사례 감소로 이어질 수 있습니다.

과제 (Challenges)

TARGET은 여러 기관의 정보를 학습자 데이터의 국가 저장소(national repository)로 수집할 것입니다. 이 과정에는 새로운 기관이 EHR 데이터를 추출하여 저장소로 보내는 데 활용할 수 있는 소프트웨어 라이브러리 개발이 포함됩니다. 과제에는 의료 시스템과의 통합 및 데이터 개인정보 보호 우려, 특히 EHR 정보를 공유할 때의 문제가 포함됩니다. 조사를 위한 한 가지 우선순위는 학습자 모델의 타당성(validity)을 평가하는 것입니다. 모델을 사용하여 식별된 수련생의 학습 격차를 전통적인 방법(예: 임상 역량 위원회)으로 식별된 것과 비교함으로써 준거 관련 공존 타당도(criterion-related concurrent validity)를 평가할 것입니다.

고찰 (Discussion)

위의 예시들은 개별 학습자뿐만 아니라 프로그램 수준의 학습 환경에 영향을 미칠 수 있는 PE의 잠재력을 보여줍니다. 프로그램들은 임상 역량에 집중할 수 있지만 웰니스, 회복탄력성, 목표 설정과 같은 다른 의미 있는 성과로도 확장할 수 있습니다. PE 이니셔티브는 의학 수련의 모든 단계에 있는 학습자를 포함할 수 있으며, 한 단계에서 다음 단계로의 전환을 개선하는 메커니즘을 제공하여 보다 연속적인 교육 여정을 가능하게 합니다. 입력을 분석하여 통찰을 이끌어내고, 개입을 개발하며, 성과를 측정하는 PE 주기(PE cycle)는 특정 이니셔티브를 개발하고 평가하기 위한 프레임워크를 제공합니다.

 

3가지 프로그램은 형성적 평가와 총괄적 평가 모두를 제공하기 위해 PE 프로세스에서 사용될 수 있는 잠재적 입력 및 분석의 엄청난 범위를 보여줍니다. 설명된 여러 이니셔티브는 종종 최소한의 능동적 관여만으로(예: RTLS 추적 배지 데이터, 환자 일정 데이터, EHR 데이터 등) 학습자에 대한 실시간의 풍부한 데이터를 수집합니다. 이는 현재 교육 환경의 주요 과제 중 하나를 해결합니다; 환자 진료의 긴급성은 종종 평가, 자기 성찰, 미래 학습 계획에 대한 수련생의 참여를 무색하게 만듭니다. GEL과 TARGET 프로그램이 통찰을 이끌어내기 위해 증강 지능(augmented intelligence, AI)을 배치하는 반면, TRA 프로그램은 개별 목표와 개입을 개발하기 위해 디지털 분석과 인간 분석(human analytics) 모두에 의존합니다. 통찰과 개입은 또한 다른 그룹을 포함할 수 있습니다. 우리 예시의 타겟 청중에는 개별 수련생, 교수 지도자(faculty preceptors), 전공의 프로그램이 포함됩니다. 규모가 확대되면, 이 프로세스는 의과대학이나 의료 시스템의 관행에도 정보를 제공할 수 있습니다. GEL 프로그램의 임상 기술 데이터나 TARGET의 임상 노출 데이터에서 식별된 주제는 프로그램 또는 기관 수준에서 격차를 해결하기 위한 훈련을 개발하는 데 사용될 수 있습니다.

 

PE 이니셔티브에는 몇 가지 핵심 과제가 있습니다.

  • 학습자와 수련 환경에 대한 대량의 데이터를 수집, 조직 및 분석하는 것은 의과대학 학장실이나 전공의 프로그램의 일반적인 범위를 넘어서는 엄청난 과정일 수 있습니다.
  • PE 이니셔티브가 평가를 위한 데이터 수집 프로세스를 개선하는 반면, 통찰을 생성하기 위해 관련 데이터 포인트를 식별하고 적절한 분석 방법을 선택하기 위해서는 AI 전문가를 포함한 데이터 과학자와의 파트너십이 필요합니다.
  • 이는 AI의 성장하는 역량을 활용할 기회를 제시하지만, 기계 학습 알고리즘을 사용할 때 도입될 수 있는 잠재적 편향(potential biases)에 대한 인식 또한 요구합니다. AI를 통해 도출된 개입이나 모델은 또한 더 전통적인 방법에 대해 검증될 필요가 있습니다.

PE 시스템이 여러 의료 기관의 학습자, 그리고 잠재적으로 환자에 대한 데이터를 활용하려고 시도할 때 데이터 표준화, 보안, 거버넌스(governance), 개인정보 보호를 둘러싼 여러 문제가 있습니다. 이러한 구조적 문제 중 일부는 공통 데이터 원칙 및 표준을 사용하여 개선될 수 있습니다.

  • 예를 들어, 국가 COVID 코호트 협력(National COVID Cohort Collaborative, N3C)은 관찰 의료 성과 파트너십(Observational Medical Outcomes Partnership, OMOP)과 같은 공통 데이터 모델을 사용하여 수십 개의 학술 의료 시스템의 데이터를 결합해 COVID-19에 대한 질문에 답했습니다.

PE를 위한 새로운 사용 사례(use cases)는 학습자 및 환자 데이터와 관련하여 보안 및 개인정보 보호에 대한 논의를 필요로 할 것입니다.

 

임상 행동 및 기술의 종단적 변화를 추적하기 위해 EHR 데이터를 사용할 수 있는 엄청난 잠재력이 있지만, EHR은 그러한 속성을 포착하도록 설계되지 않았다는 점에 유의하는 것이 중요합니다. EHR은 또한 의사소통 및 공감과 같은 임상 기술을 식별할 수 없으며, 이는 전반적인 역량을 판단하는 유일한 지표로서의 사용을 제한합니다. APECS와 같은 평가를 포함한 직접 관찰은 임상 기술 및 행동에 대한 풍부한 데이터를 제공할 수 있지만 자원 집약적이며 규모에 맞게 실행하기 어렵습니다. 이는 지속적인 개선을 위해 종단적 입력을 필요로 하는 PE 주기에서의 유용성을 제한합니다. PE 이니셔티브는 잠재력을 달성하기 위해 기술과 전통적인 교육적 개입 사이의 적절한 균형을 찾아야 합니다. 현재 우리가 대면 평가에 의존하고 있는 속성을 평가하기 위해 EHR 데이터를 사용하는 방법에 대한 연구는 PE의 영향력을 높이기 위한 필수적인 단계입니다.

 

자기 성찰, 설문조사, 지식 평가에 대한 학습자 참여와 같은 다른 잠재적 PE 주기 입력들은 환자 진료 문제가 “더 부드러운(softer)” 기술 및 활동보다 우선시되는 의학 수련의 분주한 본질에 희생될 수 있습니다. PE 이니셔티브는 참가자들에게 잠재적 이점을 인식시키고, 학습자 기술 및 환자 성과에 영향을 미치기 위해 PE 주기로 피드백될 활동에 참여하도록 인센티브를 제공하기 위해 참가자들을 직접 관여시켜야 합니다.

 

마지막으로, 윤리적 개발을 보장하고, 규모에 따른 효용을 극대화하며, 잠재적 편향으로부터 보호하기 위해 PE 혁신을 위한 원칙과 표준에 대한 합의를 개발할 필요가 있습니다. 이는 학습자에 대한 통찰을 도출하기 위해 AI를 사용하는 PE 이니셔티브에 확실히 적용되지만, 인간 분석에 의존하는 이니셔티브에도 적용됩니다. Academic Medicine의 이 보충호에서 Schumacher와 동료들이 개요를 서술한 바와 같이, 공평한 환자 진료(equitable patient care)에 초점을 맞추고 교육적 개입 및 평가를 환자 성과와 더 명시적으로 연결해야 할 긴급한 필요성이 있습니다. PE 이니셔티브는 교육적 개입이 학습자에게 공평하게 제공되고, 그러한 개입의 하류(downstream)에서 제공되는 의료 서비스가 환자에게 공평하게 제공되도록 보장해야 합니다.

 

PE는 의학 교육 및 의료 서비스 제공을 변화시킬 잠재력이 있습니다. PE 이니셔티브를 개발하고 평가하기 위해 공통 프레임워크를 사용하여 지속적인 혁신을 지원하는 것은 그 영향에 대한 더 명확한 이해로 이어지고, 잠재적 위험을 완화하는 데 도움이 되며, PE의 영향을 극대화하기 위해 성공적인 관행을 배치할 수 있게 할 것입니다.

 

 

Figure 1: 전공의 교육 연구실 (GEL)

Legend 번역

그림 1: 전공의 교육 연구실(GEL) 프로그램에 적용된 정밀 교육(PE) 주기는 입력(inputs)에서 시작하여 시계 방향으로 각 단계를 따라가는 것으로 가장 잘 볼 수 있습니다. 실시간 위치 추적 서비스(RTLS) 배지 데이터와 웰니스(wellness) 및 임상 기술에 대한 종단적 평가(longitudinal assessments)와 같은 입력은 개별 학습자와 전공의 프로그램 모두에 대한 통찰을 제공합니다. 이러한 통찰은 임상 기술과 직업적 성취감을 향상시키기 위해 설계된 개입(interventions)으로 이어질 수 있습니다. 개입에서 얻은 교훈은 다시 PE 주기로 피드백될 수 있습니다.

Figure 설명

이 그림은 GEL 프로그램이 어떻게 데이터를 수집하고 활용하여 전공의 교육을 개선하는지 순환 구조로 보여줍니다.

  • 입력 (Inputs):
    • 전공의의 위치와 업무 흐름에 대한 RTLS 데이터.
    • 임상 기술 평가(Clinical skills assessments).
    • 소진(burnout), 회복탄력성(resiliency), 웰니스에 대한 설문조사.
  • 통찰 (Insights):
    • 입력된 데이터를 분석(Analytics)하여 수련 환경, 임상 기술, 웰니스 사이의 연관성에 대한 일반적인 주제를 도출합니다.
  • 개입 (Interventions):
    • 도출된 통찰을 바탕으로 기획(Planning) 단계를 거쳐, 임상 기술이나 웰니스의 특정 측면을 향상시키기 위해 설계된 검증 가능한 가설(Testable hypotheses)을 수립하고 실행합니다.
  • 성과 (Outcomes):
    • 학습 및 평가(Learning & Assessing)를 통해 임상 기술, 소진, 회복탄력성, 웰니스에 미치는 영향을 확인합니다. 이 결과는 조정(Adjusting) 단계를 거쳐 다시 새로운 입력 데이터로 순환됩니다.

 

 

Figure 2: 전공의 전환 이점 프로그램 (TRA)

Legend 번역

그림 2: NYU 전공의 전환 이점(TRA) 프로그램에 적용된 정밀 교육(PE) 주기는 입력에서 시작하여 시계 방향으로 각 단계를 따라가는 것으로 가장 잘 볼 수 있습니다. 초기 코칭 미팅에서, 의과대학은 졸업하는 수련생에 대한 심층적인 데이터를 그들의 새로운 전공의 프로그램에 제공합니다. 이는 개별 학습자에 대한 통찰로 이어지며, 이는 개인화된 학습 목표가 설정되는 지속적인 코칭 미팅의 실질적인 내용을 구성합니다(inform). 개별 수련생의 진척도는 학습 포트폴리오와 종단적 미팅을 통해 추적되며, 이는 다시 PE 주기에 추가적인 입력으로 제공됩니다.

Figure 설명

이 그림은 TRA 프로그램이 의과대학에서 전공의 과정으로 넘어가는 전환기(transition)를 어떻게 코칭(coaching)을 통해 지원하는지 보여줍니다.

  • 입력 (Inputs):
    • 학습자가 주도하여(Learner-directed) 의과대학(UME) 포트폴리오를 GME 코치와 공유.
    • 학습자가 주도하여 전공의 수련 경험을 공유.
  • 통찰 (Insights):
    • 분석(Analytics)을 통해 초기 포트폴리오와 진행 중인 전공의 경험으로부터 현재 진척도(current progress)에 대한 통찰을 도출합니다.
  • 개입 (Interventions):
    • 기획(Planning)을 거쳐 분기별 반구조화된 미팅(Quarterly semi-structured meetings)을 진행합니다. 여기서 우선순위와 가치에 대한 성찰, 강점 식별, 목표 구체화(refining goals), 미래 구상이 이루어집니다.
  • 성과 (Outcomes):
    • 학습 및 평가(Learning & Assessing)를 통해 전환 과정을 통과하는 전공의의 전반적인 진척도를 확인합니다. 여기에는 향상된 회복탄력성(resilience), 직업적 성취감(professional fulfillment), 경력 자기 효능감(career self-efficacy)이 포함됩니다.

 

Figure 3: 교육 공학을 위한 마취 연구 그룹 (TARGET)

Legend 번역

그림 3: 교육 공학을 위한 마취 연구 그룹(TARGET) 프로그램에 적용된 PE 주기는 입력에서 시작하여 시계 방향으로 각 단계를 따라가는 것으로 가장 잘 볼 수 있습니다. 퀴즈 뱅크, 전자 건강 기록(EHR), 프로그램 평가에서 개별 학습자에 대한 정보를 수집하여 지속적으로 업데이트되는 학습자의 디지털 표현(digital representation)을 생성합니다. 그런 다음 우선순위 지정 모델(prioritization model)이 학습자의 경험과 지식을 향상시킬 콘텐츠를 선택합니다. 업데이트된 데이터는 학습자의 디지털 표현을 정교화(refines)하며, 이는 학습자의 자신감, 기술 및 실무 준비를 향상시킬 수 있는 추가적인 개인화된 콘텐츠로 이어집니다.

Figure 설명

이 그림은 TARGET 프로그램이 기술(technology)과 데이터 분석을 활용하여 마취과 전공의에게 자동화되고 개인화된 교육을 제공하는 과정을 보여줍니다.

  • 입력 (Inputs):
    • 평가, 퀴즈 뱅크, 순환 근무 일정(rotation schedules), EHR로부터 수집된 정보.
  • 통찰 (Insights):
    • 분석(Analytics)을 통해 입력 데이터로부터 학습자의 표현(Representation of learner)을 개발합니다. (학습자의 지식 및 역량 상태를 디지털로 모델링함)
  • 개입 (Interventions):
    • 전달(Delivery) 시스템을 통해 스마트폰 앱으로 학습자에게 개별화된 교육 콘텐츠(Individualized educational content)를 제공합니다.
  • 성과 (Outcomes):
    • 학습 및 평가(Learning & Assessing)를 거쳐 시험 점수 향상, 시뮬레이션 수행 능력 향상, 대면 평가 점수 향상 등의 결과를 도출합니다. 이 데이터는 다시 조정(Adjusting)되어 학습자 모델을 업데이트하는 데 쓰입니다.
Acad Med2024 Apr 1;99(4S Suppl 1):S35-S41. doi: 10.1097/ACM.0000000000005600. Epub 2023 Dec 18.

Finding Medicine's Moneyball: How Lessons From Major League Baseball Can Advance Assessment in Precision Education

 

 

 

 

⚾️ 의학교육의 '머니볼'을 찾아서: 메이저리그가 알려주는 평가의 미래

안녕하세요! 오늘은 의학교육(Medical Education)의 평가 방식에 대해 아주 흥미로운 통찰을 주는 논문 한 편을 소개해드리려고 합니다. 혹시 브래드 피트 주연의 영화 <머니볼(Moneyball)> 보셨나요? 직감과 주관에 의존하던 야구계에 '데이터'와 '통계'를 도입해 판을 뒤집은 이야기죠. 오늘 소개할 논문은 "우리가 의사를 평가할 때도 야구의 '머니볼' 같은 혁신이 필요하지 않을까?"라는 질문에서 출발합니다. 바로 정밀 교육(Precision Education, PE)을 실현하기 위해서 말이죠.

💡 혁신은 낯선 만남에서 시작된다: 메디치 효과

이 논문의 저자들은 '메디치 효과(The Medici Effect)'를 언급하며 이야기를 시작해요. 서로 다른 분야가 만날 때 혁신이 터져 나온다는 뜻이죠. 15세기 메디치 가문이 예술가, 과학자, 철학자를 한데 모아 르네상스를 꽃피웠던 것처럼요.

저자들은 혁신에 대해 이렇게 말합니다.

"...새로운 아이디어는 기존 아이디어들의 조합이다..."
“… new ideas are combinations of existing ideas …”

 

그래서 의학교육도 이제 프로 스포츠(Professional Sports), 그중에서도 메이저리그(MLB)의 데이터 분석 진화 과정을 벤치마킹해야 한다고 주장합니다.


🔍 야구와 의학교육의 평행이론: 3단계 진화

논문에서는 야구의 평가 방식이 진화해 온 3가지 단계를 의학교육의 현주소와 비교합니다. 이 부분이 아주 흥미로워요.

1. 관찰의 시대 (The Observation Epoch) : 스카우트 vs. 전통적 평가

  • ⚾️ 옛날 야구: 스카우트(Scout)들이 직감으로 선수를 뽑았습니다. "쟤는 폼이 좋네", "투지가 있어 보여" 같은 주관적 판단이었죠.
  • 🏥 의학교육: 지금의 직무 기반 평가(Workplace-based Assessment, WBA)와 비슷합니다. 교수님이 전공의를 관찰하고 점수를 매기지만, 평가자마다 기준이 다르고 편향(Bias)이 생길 수 있죠.

2. 분석의 시대 (The Analytics Epoch) : 머니볼 vs. 학습 분석

  • ⚾️ 머니볼(세이버메트릭스): 타율(Batting Average)보다 승리에 진짜 기여하는 출루율(On-base Percentage) 같은 데이터를 중시하기 시작했습니다.
  • 🏥 의학교육: 이제 막 학습 분석(Learning Analytics)을 시작하는 단계입니다. 전자의무기록(EHR) 데이터 등을 활용해 수련생의 실력을 객관적으로 보려고 노력 중이죠.

3. 기술의 시대 (The Technology Epoch) : 스탯캐스트 vs. ?

  • ⚾️ 스탯캐스트(Statcast): 경기장에 레이더와 카메라를 설치해 공의 회전수(Spin Rate), 타구 속도, 선수의 반응 속도까지 실시간으로 측정합니다. 결과(안타냐 아웃이냐)가 아니라 과정(Process) 그 자체를 정밀하게 분석해서, 운이나 환경 탓을 배제하고 선수 고유의 실력을 봅니다.
  • 🏥 의학교육: 바로 우리가 가야 할 미래입니다. 수술실 블랙박스(OR Black Box), 웨어러블 기기, AI 영상 분석 등을 통해 수련생의 술기나 의사소통을 실시간으로 정밀하게 분석하는 것이죠.

🚀 진정한 '정밀 교육'을 위한 제언

야구 선수들이 타석에 들어설 때마다 태블릿으로 자신의 스윙 궤적을 확인하고 교정하듯, 우리 의대생과 전공의들도 실시간으로 피드백을 받을 수 있다면 어떨까요? 저자들은 진정한 정밀 교육(PE) 시스템을 구축하기 위해 가장 중요한 원칙을 이렇게 강조합니다.

"지도 원칙으로서, 우리는 쉽게 찾을 수 있는 데이터를 사용하는 것에서 학습자와 환자에게 진정으로 중요한 데이터를 사용하는 것으로 나아가야 합니다."
“As a guiding principle, we need to move from using easily found data to data that truly matter for our learners and patients.”

 

단순히 구하기 쉬운 점수나 숫자가 아니라, 환자의 예후와 수련생의 성장에 진짜 영향을 미치는 데이터를 찾아야 한다는 것이죠.


⚠️ 주의해야 할 점: 경쟁이냐 협력이냐

하지만 스포츠와 의료는 결정적인 차이가 있습니다. 스포츠는 상대를 이겨야 하는 경쟁(Competition)이지만, 의료는 환자를 살리기 위한 협력(Cooperation)이 핵심이니까요. 무턱대고 데이터로 줄 세우기를 해서는 안 된다는 우려 섞인 조언도 잊지 않았습니다.

"만약 우리가 세이버메트릭스 스타일의 접근 방식을 의학에 도입한다면, 우리는 데이터를 사용하여 경쟁에서 협력으로 전환하고 학습자가 단순히 성과에 집중하기보다는 숙달과 성장을 위해 데이터를 사용하도록 돕는 방법을 결정해야 할 것입니다."
“If we adopt a sabermetrics-style approach ... into medicine, we will have to determine how to use the data to shift from competition to cooperation and help learners use the data for mastery and growth rather than focusing simply on performance.”

📝 마치며

메이저리그가 데이터와 기술을 통해 선수의 잠재력을 폭발시켰듯, 의학교육도 새로운 데이터 흐름(New data streams)을 만들어내야 할 시점입니다. 의료계의 '스탯캐스트'는 과연 어떤 모습일까요? 인공지능(AI), 웨어러블(Wearables), 동작 추적(Motion Tracking) 기술이 의사 양성 과정을 어떻게 바꿀지 기대됩니다. 물론 그 중심에는 '환자의 안전'과 '학습자의 성장'이라는 본질이 있어야겠죠? 😊

 


 

정밀 교육(Precision Education, PE)환자, 학습자, 그리고 시스템 수준의 성과(outcomes)를 개선하기 위해 종단적 데이터(longitudinal data)와 분석(analytics)을 활용하여 교육적 개입을 맞춤화하는 것입니다.[1] 현재 의학교육 프로그램 중 이 목표를 달성할 수 있는 곳은 거의 없는데, 이는 PE의 지도 원칙(guiding principles)을 충족하지 못하기 때문입니다. 그 원칙이란 교육이

  • 선제적(proactive, 시의적절하고 지속적인 데이터)이고,
  • 개별화(personalized, 각 수련생에게 맞춤)되어야 하며,
  • 참여적(participatory, 공동 생산)이고,
  • 예측 가능(predictive, 의미 있는 미래의 교육 및 임상 성과에 대해)해야 한다는 것입니다.[1]

PE가 매력적인 청사진을 제시하고는 있지만, 프로그램들은 수련생의 학습과 프로그램 개선을 이끌어내기 위해 분석을 통해 변환된 새로운 데이터 흐름(new data streams)을 개발해야 합니다. 이 목표를 실현하기 위해 의학교육은 정밀 지향적 평가 전략(precision-oriented assessment strategies)을 실현하는 데 있어 더 앞서 있는 다른 분야로부터 영감을 얻어야 합니다.

2004년, 미국의 기업가 프란스 요한슨(Frans Johansson)은 『메디치 효과: 코끼리와 전염병이 혁신에 대해 가르쳐 줄 수 있는 것(The Medici Effect: What Elephants & Epidemics Can Teach Us About Innovation)』이라는 책을 출간했습니다.[2] 그는 교차적 창의성(intersectional creativity)이 혁신을 주도한다고 주장하며, 이는 새로운 아이디어가 종종 서로 다른 분야, 산업, 문화의 융합(convergence)에서 발전한다는 것을 의미합니다. "메디치 효과(Medici effect)"라는 용어는 15세기 피렌체의 메디치 가문이 예술가, 과학자, 철학자, 경제학자를 한데 모음으로써 르네상스를 촉발하는 데 도움을 주었던 방식에서 유래했습니다. 혁신을 촉발하는 메커니즘은 "...새로운 아이디어는 기존 아이디어들의 조합(combinations of existing ideas)..."[2]이라는 것이며, 교차성(intersectionality)은 이전에 결합되지 않았던 아이디어들이 서로를 발견할 가능성을 높여줍니다.

 

학문적 교차성(Disciplinary intersectionality)은 의학교육에서 새로운 개념이 아닙니다. 이 분야는 광범위한 학문 분야의 아이디어, 철학, 방법론에 의해 깊이 형성되어 왔습니다.[3] 예를 들어, 의학교육은 질 향상(quality improvement, 예: 개선 모델, 린, 6시그마)[4], 항공 안전(aviation safety)[5], 다양성/형평성/포용성(diversity/equity/inclusion)[6], 코칭 운동(coaching movements)[7] 등의 아이디어를 흡수해 왔습니다. 이 논문에서 우리는 PE를 추구함에 있어 현대 프로 스포츠 분석(professional sports analytics) 및 기술로부터 통찰력을 얻어, 평가 업무가 어떻게 메디치 효과를 활용할 수 있는지 탐구합니다.

프로 스포츠로부터 배우는 사례 (The Case for Learning From Professional Sports)

의학교육은 의료팀의 리더이자 구성원으로서 안전하고 질 높은 진료를 제공하는 의사를 양성하고자 합니다.[8,9] 프로 스포츠 팀은 높은 성과를 내는 팀(high-performing teams)을 구성하기 위해 선수 선발과 개발을 통해 개인의 잠재력을 극대화합니다. 두 분야 모두 다중 모드 전략(multimodal strategies)을 필요로 하는 복잡한 구성 개념(complex constructs)을 평가하지만, 고부담 결정(high-stakes decisions)을 내리기 위해 개인의 성과 평가에 크게 의존합니다.

  • 의학교육은 개인의 역량(individual competencies, 예: 의학 지식, 환자 진료, 직종 간 의사소통)[10], 신뢰성(trustworthiness)[11], 적응적 전문성(adaptive expertise)[12]을 평가합니다.
  • 스포츠 팀은 운동 능력, 기술, 투지(grit), 지능, 팀워크를 평가합니다.

두 분야 모두에서 이러한 구성 개념들은 무형적이고, 복잡하며, 다면적일 뿐만 아니라 팀 내에서 일하는 개인(즉, 수련생 또는 선수)을 포함하기 때문에, 성과의 원인을 단일 수련생이나 선수에게 돌리는 것(attribution of outcomes)이 어렵습니다. 의학교육에서는 팀 기반의 임상 진료와 복잡한 시스템 요인들로 인해 대부분의 환자 결과(patient outcomes)를 단일 개인에게 온전히 귀속시키는 것이 불가능합니다.[13] 마찬가지로 스포츠에서도 대부분의 관찰 가능한 결과는 여러 인과적 투입 요소(causal inputs)를 가지고 있어 단일 선수에게 귀인(attribution)하는 것을 어렵게 만듭니다.

 

두 분야가 성과 평가와 관련하여 여러 유사점을 공유하고 있지만(표 1 참조), 프로 스포츠는 창의적인 혁신과 개선을 위해 거의 무제한에 가까운 자원을 보유했던 반면[14,15], 의학교육 연구는 종종 자금 부족으로 제약을 받습니다.[16,17] 프로 스포츠에서 선수 평가가 어떻게 진화했는지 살펴보는 것은 의학교육의 현재 및 잠재적인 미래 평가 전략에 대한 거울이자 수정구슬(mirror and a crystal ball) 역할을 합니다.

 

표 1 - 의학교육과 프로 스포츠 평가의 수렴 및 발산 주제 (Convergent and Divergent Themes of Assessment in Medical Education and Professional Sports)

주제 의학교육 (Medical education) 프로 스포츠 (Professional sports)
수렴하는 주제 (Convergent themes)
발전 목표 (Developmental goal) 안전하고 질 높은 진료를 제공할 수 있는 의사 배출; 학습자의 성장 마인드셋(growth mindset) 높은 성과를 내는 팀에 기여할 수 있도록 선수 선발 및 개발을 통해 개인의 잠재력 극대화; 선수의 성장 마인드셋
평가 구성 개념 예시 (Example assessment constructs) 의학 지식, 의사소통, 신뢰성, 적응적 전문성 지능, 팀워크, 운동 능력, 기술, 투지
귀인과 기여의 난제 (Challenges with attribution and contribution) 수련생은 팀, 시스템, 사회 및 환자 요인의 영향을 받는 결과와 함께 다직종 팀에서 근무함 선수는 팀, 상대방, 경기 상황 및 환경 요인의 영향을 받는 결과와 함께 팀 내에서 정의된 역할을 수행함
발산하는 주제 (Divergent themes)
궁극적 목표 (Ultimate goal) 정의하기 어렵고, 맥락 의존적이며, 동시에 여러 목표가 존재함 정의하기 쉽고, 맥락 전반에 걸쳐 목표가 일관됨
평가자 전문성 (Rater expertise) 가변적임. 임상가는 팀 리더, 코치, 스카우트(평가자) 역할을 동시에 수행함 높음. 전문 스카우트가 전문 평가자임
데이터 보안 (Data security) 환자 및 학습자 성과 정보에 대한 엄격한 규제 성과가 공개적으로 이용 가능하며 논의됨

 

프로 스포츠와 의학교육에서 성과 평가의 진화 (The Evolution of Performance Assessment in Professional Sports and Medical Education)

 

우리는 관찰, 통계 분석 및 기술의 발전을 보여주는 선수 평가 진화의 사례 연구로서 북미의 메이저 리그 베이스볼(MLB)을 살펴볼 것입니다. MLB는 다른 많은 스포츠보다 앞서 새로운 접근 방식을 수용하며 선수 평가 측면에서 선구자였기 때문에 이를 선택했습니다. 그러나 유사한 진화가 모든 수준(대학, 프로, 국제)과 모든 성별의 스포츠에서 일어났습니다.

관찰(스카우팅) 시대 (The Observation (Scouting) Epoch)

프로 야구 초창기에는 선수 평가가 MLB 팀에 고용된 스카우트(scouts)라고 불리는 훈련된 관찰자의 주관적 판단(subjective judgments)에 크게 의존했습니다. 스카우트들은 실제 경기에서 선수를 지켜보고 속성, 기술, 그리고 직업 윤리(work ethic), 리더십, 투지(grit)와 같은 무형의 요소를 평가하기 위해 광범위하게 이동했습니다.[18] 정규 시즌 경기가 전국적으로 방송되기 시작한 1953년부터 스카우트들은 같은 목적으로 MLB 경기 녹화본을 검토하기도 했습니다. 이러한 형태의 관찰 평가는 선수의 능력에 대한 어느 정도의 이해를 제공한다는 점에서 가치가 있었지만, 인간의 판단(human judgment)에 흔한 편향과 결함 있는 평가에 취약했습니다. 명백히 잘못된 스카우팅 리포트를 근거로 초기 경력에서 외면당했던 명예의 전당 헌액 선수들의 사례는 무수히 많습니다.

 

스카우팅 시대는 타율(batting average)이나 투수 방어율(earned run average)과 같이 경기 중에 발생하는 결과를 정량화하는 기초적이고 포착하기 쉬운 통계(basic, easy-to-capture statistics)에 의존했습니다(표 2 참조). 이러한 통계는 100년도 더 전에 개발되었으며, MLB의 궁극적 목표인 미래의 선수 성과나 팀 승리를 예측하는 데 있어 각 지표의 유용성에 대한 타당도 근거(validity evidence)가 거의 없는 경우가 많았습니다.[18] 이러한 지표들은 경기 상황(예: 타자가 주자가 있는 상태에서 타석에 들어서는 기회), 구장 효과(ballpark effects), 다른 선수의 성과가 미치는 영향(예: 수비수의 능력)과 같이 결과에 영향을 미치는 무수한 맥락적 요인(contextual factors)들을 무시했습니다. MLB 통계 지표의 전체 목록은 https://www.mlb.com/glossary 에서 확인할 수 있습니다.

 

표 2 - 선수 평가를 개선한 2가지 고전 야구 지표와 2가지 세이버메트릭스 접근법의 비교 (A Comparison of 2 Classic Baseball Metrics With 2 Sabermetric Approaches That Improved Player Assessment)

고전 지표 (Classic metric) 조작적 정의 (Operational definition) 한계점 (Limitations) 개선된 세이버메트릭스 접근법 (Improved sabermetric approach) 조작적 정의 (Operational definition) 고전 지표 대비 장점 (Advantage over classic metric)
타율 (Batting average, BA) 안타 수 / 총 타수 볼넷이나 몸에 맞는 공 등 선수가 출루할 수 있는 다른 방법의 가치를 고려하지 않음. 또한 일부 안타(예: 홈런)가 다른 안타(예: 단타)보다 더 가치가 있음에도 모든 안타를 동일하게 평가함. 출루율 (On base percentage, OBP) 출루 횟수 / 총 타석 수 안타 이외의 수단으로 출루하는 것의 가치를 고려함.
방어율 (Earned run average, ERA) 투수가 9이닝당 허용하는 평균 자책점 팀 수비의 질과 같이 실점에 기여하는 맥락적 요인을 고려하지 않음. 수비 무관 투구 (Fielding independent pitching, FIP) 삼진, 볼넷, 몸에 맞는 공, 홈런만을 기반으로 한 방어율 추정치 팀 수비의 질이 미치는 영향을 제거함.

 

현재 의학교육은 MLB의 스카우팅 시대와 매우 유사하게 직무 기반 평가(workplace-based assessment, WBA) 형태의 관찰 데이터에 크게 의존하고 있습니다.[19,20] 평가자들은 임상 업무 중인 수련생을 관찰하고 서술형 코멘트와 함께 미리 정해진 척도(scales)를 사용하여 점수를 매깁니다. 결과적으로, 이러한 척도의 점수들은 평가자 전반에 걸쳐 합산되어 전체적인 성과에 대한 대략적인 추정치를 제공합니다. WBA는 실제 임상 업무 중에 성과를 평가한다는 장점이 있지만, 초기 야구와 마찬가지로 종종 가변적인 평가자 준거 틀(variable rater frames of reference)을 가진 몇 가지 광범위하고 대표성이 부족한 지표에 초점을 맞춥니다.[21,22] MLB 스카우트들은 전문적으로 훈련받고 직접 또는 비디오로 경기를 관찰하는 반면, 의학교육의 WBA는 직접적인 수련생 관찰 부족(lack of direct trainee observation)[23], 불일치하거나 비효과적인 평가자 훈련[24], 또는 암묵적 편향(implicit bias)[6]으로 인해 어려움을 겪을 수 있습니다. 그럼에도 불구하고, WBA는 의학교육의 프로그램적 평가(programmatic assessment)에서 중요한 부분으로 남아 있습니다.

분석(세이버메트릭스) 시대 (The Analytics (Sabermetrics) Epoch)

1970년대는 MLB에 세이버메트릭스(sabermetrics)라 불리는 고도화된 분석이 도래한 시기였습니다. 이 용어는 이 운동의 선구자인 통계학자 빌 제임스(Bill James)가 만들었으며, 책과 이후 영화로 제작된 『머니볼(Moneyball)』[25]을 통해 대중화되었습니다. 세이버메트릭스는 기존 데이터를 사용하여 어떤 통계가 선수 평가에 가장 유용한지 경험적으로 식별하고, 어떤 선수가 팀 승리라는 궁극적인 목표에 기여했는지 결정했습니다. 스카우팅 시대와 동일한 관찰 결과 데이터가 사용되었지만, 이러한 데이터를 분석하는 새로운 방법(novel methods)은 새로운 통찰력을 제공했습니다(표 2 참조). 세이버메트릭스는 개별 선수 평가에 대한 더 정밀한 접근 방식으로 이어져 팀의 승리 경쟁 능력을 향상시켰습니다.[25]

 

의학교육은 이제 막 더 발전된 학습 분석(learning analytics, LA)을 수련생 평가에 적용하기 시작했지만, 이러한 접근 방식은 프로그램 전반에 걸쳐 여전히 상대적으로 드뭅니다.[26,27] 세이버메트릭스와 유사하게, LA는 어떤 유형의 데이터와 분석이 의미 있는 통찰력을 개발하는 데 가장 유용한지 명확히 합니다.[27] 예를 들어, LA는 평가자 성향, 순환 근무 순서, 또는 연중 시기와 같은 맥락적 요인이 점수에 어떻게 영향을 미치는지 이해하려고 노력함으로써 기존 WBA 데이터의 의미를 파악하는 데 도움을 줄 수 있습니다.[28,29] 머신 러닝 알고리즘과 자연어 처리(natural language processing)는 질적 평가 데이터의 신속한 분석을 가능하게 합니다.[30,31] 기존의 전자의무기록(EHR) 정보를 사용하여 수련생 평가를 위해 전공의 민감 질 지표(Resident-Sensitive Quality Measures, RSQMs)[32–35] 및 수련생 귀속 및 자동화 가능 실시간 진료 평가(Trainee Attributable and Automatable Care Evaluations in Real-time, TRACERs)[36]와 같은 임상 진료 지표가 개발되고 있으며, 이는 학습에 정보를 제공하는 새로운 유형의 평가 데이터를 생성합니다. EHR 메타데이터(즉, 클릭 수, 클릭 패턴, 타임스탬프 등 임상의가 EHR을 사용하는 방식에 대한 정보)는 워크플로우 관행(workflow practices)에 대한 평가를 가능하게 할 수 있습니다.[37]

 

LA, RSQMs, TRACERs는 대부분의 프로그램에 이미 존재하는 데이터에서 가치를 찾기 위해 새로운 전략을 사용하며, 이는 MLB의 세이버메트릭스 시대에 얻은 발전과 유사합니다. 그러나 이러한 접근 방식은 여전히 성과 지표에서 귀인과 기여(attribution and contribution)의 문제를 해결해 나가는 과정에 있습니다.[13] WBA, RSQMs, TRACERs에서 등급(ratings)은 개별 수련생에게 귀속됩니다. 이상적으로 LA는 프로그램이 팀 성과와 궁극적으로는 환자 결과에 중요한 개별 수련생 성과의 측면에 대한 통찰력을 개발하도록 도와야 합니다.

기술(스탯캐스트) 시대 (The Technology (Statcast) Epoch)

MLB의 관찰 가능한 결과는 종종 맥락적 요인(예: 날씨, 구장 크기, 다른 선수의 기여)에 의존하며, 이는 의학 수련생의 임상 성과가 상호 의존적인 현상(interdependent phenomenon)인 것과 같습니다.[38,39] 팀들은 이러한 귀인/기여의 난제(attribution/contribution conundrum)를 해결하기 위해 새로운 선수 평가 전략을 모색했고, 다음 단계의 도약은 다른 분야의 기술 혁신을 채택함으로써 메디치 효과의 또 다른 사례와 함께 이루어졌습니다. 2003년 덴마크의 Trackman이라는 회사는 이전에 발사체 무기를 추적하는 데 사용되었던 군사 기술을 기반으로 골프 스윙과 공의 궤적을 분석하는 방법을 개발했습니다. 이 기술은 빠르게 MLB로 확산되었습니다. 2006년 Sportvision은 유사한 기술을 사용하여 PITCHf/x를 개발했는데, 이는 MLB 포스트시즌에서 투구의 궤적, 속도, 회전수(spin rate), 브레이크(즉, 수직 및 수평 움직임), 위치를 추적할 수 있었습니다.

 

PITCHf/x는 타자, 수비수, 경기 상황의 영향을 받는 플레이 결과와 독립적으로 투수의 성과를 더 깊이 이해할 수 있게 해주었습니다. 처음으로 팀들은 투수가 효과적인 공(예: 높은 구속, 정확한 위치 및 움직임)을 던졌지만 나쁜 결과(예: 안타)를 얻었을 때를 측정할 수 있었는데, 이는 원치 않는 결과에도 불구하고 높은 성과(high performance)를 반영하는 것입니다. 즉, PITCHf/x는 개인에게 고도로 귀속될 수 있는 행동을 측정함으로써 선수 성과의 여러 측면을 팀이나 맥락 효과로부터 분리(disentangled)해냈습니다.

 

2000년대 후반, 분석가들은 타자의 타구 속도(exit velocity), 발사 각도(launch angle) 및 야수(position players)를 위한 기타 타격 데이터를 유사하게 추적할 수 있었습니다. 2015년 MLB는 모든 경기장에 스탯캐스트(Statcast)라는 새로운 시스템을 설치했습니다. 스탯캐스트는 도플러 레이더와 고화질 비디오를 사용하여 경기장에서 선수와 물체의 물리적 움직임과 관련된 10가지 변수[40]를 측정했습니다. 배트 속도, 전력 질주 속도, 반응 속도와 같이 고도로 귀속 가능한 선수 성과(highly attributable player performance)에 대한 정확한 측정은 이전 시대의 고도화된 분석 접근 방식과 결합되어 전례 없는 선수 성과 평가로 이어졌습니다.[41] 팀들은 더 이상 수비 위치 선정, 구장 크기, 날씨 조건과 같은 교란 변수(confounders)가 선수의 성과 여부를 흐릴 때 플레이 결과(예: 안타 또는 아웃)에 의존할 필요가 없게 되었습니다. 예를 들어, 어떤 선수가 90%의 구장에서는 홈런이 될 만큼 강하게 공을 쳤지만, 우연히 기상 조건이 나쁜 큰 구장에서 경기하고 있을 수 있습니다. 이것은 훌륭한 선수 성과이지만, 상황에 따라 그 성과가 홈런이 아닌 아웃이라는 결과로 이어질 수 있습니다.

 

즉, 스탯캐스트와 고도화된 분석은 고도로 귀속 가능한 데이터의 정밀도와 밀도(precision and density)를 향상시킴으로써 평가 중 맥락(context)과 비선수 변수(즉, 교란 변수)의 영향을 이해할 수 있게 해줍니다. 그러한 데이터는 매우 세분화되고 정밀하지만, 단 하나의 데이터 포인트가 선수에 대한 전체 진실을 말해주지는 않습니다. 그러나 서로 다른 성과 측면에 대한 대량의 데이터를 결합하여 성과에 대한 더 상세한 그림을 그릴 수 있습니다. PE는 의학 수련생을 위해 유사한 방식으로 기술을 활용할 기회를 제공하며, 다음 섹션에서는 이것이 어떻게 전개될 수 있는지 탐구합니다.

정밀 교육: 의학교육의 스탯캐스트를 발전시키는 엔진 (Precision Education: The Engine for Advancing Medical Education’s Statcast)

그렇다면 평가에 대한 접근 방식을 발전시키기 위해 스포츠의 교훈을 활용하는 PE 시스템을 어떻게 설계해야 할까요? 어떻게 의학교육의 스탯캐스트를 구축할 수 있을까요? 강조했듯이, 데이터 수집 방법(methods of data acquisition)을 발전시키는 것이 핵심이 될 것입니다. MLB가 새로운 데이터 수집 방법을 찾아낸 것처럼, 우리도 환자 진료와 결과에 대한 기여도와 관련하여 유사하게 의미 있는 개인 수준의 데이터(individual-level data)를 식별해야 합니다(표 3). 지도 원칙으로서, 우리는 쉽게 찾을 수 있는 데이터를 사용하는 것에서 학습자와 환자에게 진정으로 중요한 데이터(data that truly matter)를 사용하는 것으로 나아가야 합니다.

 

표 3 - 의학교육과 메이저 리그 베이스볼 평가의 3가지 시대별 이점, 함정 및 예시 (Benefits, Pitfalls, and Examples in the 3 Epochs of Assessment of Medical Education and Major League Baseball)

시대 (Epoch) 이점 (Benefits) 함정 (Pitfalls) 의학교육의 예시 (Examples in medical education) 야구의 예시 (Examples in baseball)
1. 관찰 (Observation) • 단순하고 즉시 사용 가능
• 다양한 출처와 관점 가능
• 평가자 편향
• 제한된 평가 범위
• 제한된 객관적 지표
• 평가자 업무량
• 직무 기반 평가(WBA) • 스카우팅
• 경기 필름
2. 분석 (Analytics) • 증거 기반 및 목표 지향적
• 객관적이고 정량화 가능
• 이론에 기반함
• 신뢰할 수 있는 대량의 데이터 필요
• 무형의 요소를 포착하기 어려움
• 학습 분석(LA)
• RSQM
• TRACERs
• EHR 메타데이터
• OBP (출루율)
• 장타율 (Slugging percentage)
• WAR (대체 선수 대비 승리 기여도)
3. 기술 (Technology) • 기초 기술(fundamental skills) 평가
• 외부 요인의 교란 감소
• 맥락적 수정 변수를 고려하면서 개인에게 직접 귀인 가능
• 신뢰할 수 있는 대량의 데이터 필요
• 무형의 요소를 포착하기 어려움
• 기술 비용
• 추가 훈련 필요
• 오디오/비디오 녹화
• 웨어러블 기기
• 모션 캡처 기술
• 투구 회전수 (Pitch spin rate)
• 타구 발사 각도 (Hit launch angle)
• 선수 전력 질주 속도 (Player sprint speed)
         

약어: RSQM, resident-sensitive quality measures (전공의 민감 질 지표); TRACERs, trainee attributable and automatable care evaluations in real-time (수련생 귀속 및 자동화 가능 실시간 진료 평가); OBP, on-base percentage (출루율); WAR, wins above replacement (대체 선수 대비 승리 기여도); EHR, electronic health record (전자의무기록).

 

술기 능력(procedural skills)의 평가는 스탯캐스트와 의학교육 사이의 명백한 번역 지점입니다. 수술 성과를 측정하는 기술은 OR 블랙박스(OR Black Box)[42]와 같이 이미 존재합니다.

  • 이 시스템은 시청각 정보(예: 수술실 내 비디오, 복강경, 로봇, 조명 장착 또는 웨어러블 카메라를 통해 수집된 체내 비디오), 환자와 의료 전문가 모두의 생리학적 파라미터, 그리고 다수의 다른 센서 및 장치와 같은 여러 수술 중 데이터 소스를 지속적으로 획득하고 동기화합니다.
  • 이러한 데이터를 통해 팀은 수술 단계, 방해가 되는 환경 및 조직적 요인, 팀의 기술적 및 비기술적 술기(technical and nontechnical skills), 외과의사의 생리학적 스트레스, 수술 중 오류 및 사건을 검토할 수 있습니다.
  • 예를 들어, 한 연구에서는 대부분의 복강경 수술 오류가 수술 과제를 수행할 때 불충분한 힘을 가하거나 목표 조직까지의 거리를 과소평가했기 때문에 발생했다는 것을 발견했습니다.[43] 다른 연구들은 리더십 스타일, 팀워크, 의사소통 행동, 의사 결정과 같은 비기술적 술기를 평가할 수 있는 능력을 입증했습니다.[44,45] 이 예에서 수술팀은 환경 및 조직적 요인과 상호작용하면서 기술적 및 비기술적 술기와 관련된 실시간 데이터를 제공하는 무수한 입력값을 가진다는 점에서 MLB 팀과 유사합니다.

그러나 새로운 기술이 수술실이나 술기 평가에만 국한될 필요는 없습니다. 유사한 기술이 모든 교육 또는 임상 환경에서 구현될 수 있습니다.

  • 인공지능(artificial intelligence) 및 대규모 언어 모델(large language models)과 같은 새로운 분석 방법을 통한 오디오 및 비디오 녹화는 모든 임상 진료(clinical encounter)에 대한 지속적이고 상세한 평가로 이어질 수 있습니다.[46,47]
  • 웨어러블 기기모션 트래킹 시스템은 이전에는 상상할 수 없었던 방식으로 임상 워크플로우, 시술 성과, 미세한 신체 동작 및 효율성에 대한 데이터를 제공할 수 있습니다.[48–55]
  • 시선 추적 기술(Eye tracking technology)은 수련생이 임상 데이터를 검토하거나, 방사선 사진 또는 심전도를 판독하거나, 시험을 치르는 방식을 평가할 수 있습니다.[56,57]
  • 인간의 관찰에 의존하지 않는 이러한 컴퓨터 기반 평가는 선택적 주의(selective attention) 및 가변적인 평가자 전문성을 포함한 WBA의 한계를 해결할 가능성을 제공합니다.

과거의 MLB 팀들이 투구 회전수와 타구 속도를 실시간으로 정확하게 측정할 수 있는 세상을 상상할 수 없었던 것처럼, 우리도 모션 트래킹, 실시간 녹화, 인공지능이 의학교육에서 흔한 일이 되는 것을 상상하지 못할 수 있습니다. 뇌-컴퓨터 인터페이스(brain-computer interfaces)가 공상 과학 소설처럼 보일지 모르지만[58], 어쩌면 그것들도 머지않은 미래 의학교육의 스탯캐스트의 일부가 될지 모릅니다.[59–61]

 

플레이 직후, 프로 스포츠 선수들은 실시간으로 자신의 타격 자세, 발사 각도, 스윙 궤적, 타격 지점, 구장 정보를 검토하여 다음 타석을 개선할 수 있습니다. 유사한 온디맨드 데이터 분석(on-demand data analytics)이 소생술, 나쁜 소식 전하기, 또는 수술 사례 등 주어진 환자 진료 상황에서의 성과와 관련하여 의료 환경의 수련생과 개원의들에게 제공되어야 합니다. 언어의 명확성이나 공유 의사 결정(shared decision making)과 같은 의사소통 기술조차도 녹음 및 대규모 언어 모델 분석을 통해 실시간으로 평가 가능할 수 있습니다.[62] 데이터는 맥락에 맞게 조정되고 개인 또는 팀의 학습 목표에 집중될 수 있습니다. PE와 함께 스탯캐스트 같은 기술을 활용하면 실제 사례 수행(live case performance)의 실시간 데이터를 다음 소생술, 사례, 환자 진료 등을 위한 진료 개선에 사용할 수 있게 될 것입니다.

 

고도화된 분석과 새로운 기술이 의학교육 평가에 존재하는 모든 문제를 해결하거나 인간의 판단을 불필요하게 만들지는 않을 것입니다. 이는 세이버메트릭스와 스탯캐스트가 선수 평가의 모든 문제를 해결하거나 스카우팅을 없애지 못한 것과 같습니다. 평가 데이터의 통합과 건전한 의사 결정은 수련생에 대한 방어 가능한 결정(defensible decisions)에 도달하기 위해 여전히 인간의 인지(human cognition)와 이론에 기반한 그룹 프로세스를 필요로 할 것입니다. 분석이든 새로운 기술이든 새로운 평가 전략은 그 사용으로 인한 해석과 결정에 대한 타당도 논거(validity arguments)를 필요로 할 것이며[63], 여기에는 그러한 접근 방식이 어떻게 형평성을 증진하고 편향을 최소화하는지에 대한 증거가 포함됩니다.[64] 학습자, 프로그램, 환자를 포함한 모든 이해관계자에 대한 후속 결과(Downstream consequences)도 그러한 타당도 논거에 포함되어야 합니다.[65]

유추의 제약 (The Constraints of Analogy)

모든 유추에는 위험이 따르며[66], 우리는 우리의 유추가 어디에서 깨지는지, 그리고 이러한 교차적 아이디어로부터 이익을 얻기 위해 무엇을 해야 하는지 검토해야 합니다.

  • 관찰 평가를 사용할 때 평가자 전문성(Rater expertise)은 MLB와 의학교육 간에 크게 다를 가능성이 높습니다. 스카우트는 많은 양의 훈련을 받는 전문 평가자인 반면,
    • 의학교육의 평가자는 반드시 평가에 대한 전문성을 기준으로 선택되는 것은 아닙니다.
  • 스포츠에서는 궁극적인 결과로서의 승패가 명확한 반면, 의료는 결과가 최악에서 최선까지의 스펙트럼을 가지거나 결과에 대한 명확한 이해가 전혀 없는 경우와 대조됩니다.
    • 예를 들어, 사망은 종종 나쁜 결과로 간주되지만, 많은 환자에게 삶의 마지막에는 양(quantity)보다 질(quality)이 더 중요합니다. 측정하기에 의미 있는 환자 및 학습자 결과가 무엇인지 결정하기 위해 많은 작업이 필요할 것입니다.
  • 마지막으로, MLB 팀은 고정되고 일관된 규칙과 환경 세트를 가지고 있을 뿐만 아니라 일반적으로 재정 자원에 대한 보편적인 접근이 가능하여, 새로운 기술과 분석을 대규모로 구현하는 것이 더 실현 가능합니다.
    • 대조적으로, 의학은 방대한 전문 분야, 임상 환경, 역량을 가지고 있으며 프로그램 전반에 걸쳐 자원이 불균일하여 새로운 접근 방식의 광범위한 구현과 검증을 매우 어렵게 만듭니다.

스포츠에서 선수들은 모든 수준에서 서로 경쟁하며, 오직 소수만이 정상에 오릅니다. 실제로, 고도화된 스포츠 분석의 가장 중요한 기능은 선택된 소수를 식별하는 것이라고 주장될 수 있습니다. 의학에서는 일단 학생들이 학교와 레지던트에 입학하면 훌륭한 진료를 생산하기 위해 협력(cooperation)의 가치를 두는 시스템에서 훈련받아야 하며, 데이터의 가장 중요한 목표는 모든 사람이 임상적으로 중요한 최소한의 기준을 충족하도록 보장하는 것이어야 합니다. 만약 우리가 세이버메트릭스 스타일의 접근 방식이나 햅틱 측정(haptic measures)을 의학에 도입한다면, 데이터를 사용하여 경쟁에서 협력으로(from competition to cooperation) 전환하고 학습자가 단순히 성과에 집중하기보다는 숙달(mastery)과 성장을 위해 데이터를 사용하도록 돕는 방법을 결정해야 할 것입니다. 마지막으로, 고도화된 분석과 세이버메트릭스는 아직 선수의 프라이버시나 성장 마인드셋에 대한 광범위한 우려를 촉발하지 않았습니다. 만약 첨단 기술이 의학교육에서 모든 말, 상호작용, 움직임을 모니터링한다면, 환자와 수련생의 프라이버시(privacy)를 보호하고 평가받는다는 압박감 없이 임상 실습을 할 수 있는 공간을 허용하기 위해 확실한 안전장치(guardrails)가 필요할 것입니다.

결론 (Conclusions)

MLB는 새로운 분석과 기술에 의해 주도되는 평가 접근 방식의 가속화를 겪었습니다. 의학교육은 PE의 비전을 보다 완전히 실현할 수 있는 기회와 함께 유사하고 전례 없는 가속화에 직면하고 있지만, 여전히 해야 할 일이 많습니다. 메디치 효과(Medici effect)를 활용하고 이미 평가와 사정에 새로운 분석 및 기술을 통합한 산업으로부터 배움으로써, 의학교육은 미래의 의사를 양성하기 위해 더욱 빠르게 혁신할 수 있습니다.

 

 

 

 

 

 

 

Acad Med. 2023 Jul 1;98(7):775-781. doi: 10.1097/ACM.0000000000005227. Epub 2023 Apr 3.

Precision Medical Education

 

 

🩺 의학 교육의 미래, '정밀 의학 교육(PME)'이 온다!

혹시 '정밀 의학(Precision Medicine)'이라고 들어보셨나요? 환자의 유전자, 환경, 생활 습관 같은 데이터를 분석해서 환자에게 딱 맞는 치료법을 제공하는 거죠. '정밀 의학 교육(PME)'도 똑같습니다! 💡 환자 대신 학습자(Trainee)를, 진료 대신 교육(Education)을 대입해 보세요. 학생 개개인의 데이터를 분석해서 딱 맞는 학습법과 코칭을 제공하는 것이죠.

연구진은 PME를 이렇게 정의하고 있습니다.

"종단적 데이터(longitudinal data)와 분석(analytics)을 통합하여 개별 학습자의 필요와 목표(needs and goals)를 지속적이고, 시기적절하며, 순환적인 방식으로 다루는 정밀한 교육적 개입(precise educational interventions)을 주도하고, 궁극적으로 의미 있는 교육적, 임상적, 또는 시스템적 성과(outcomes)를 향상시키는 체계적인 접근 방식."

"A systematic approach that integrates longitudinal data and analytics to drive precise educational interventions that address each individual learner’s needs and goals in a continuous, timely, and cyclical fashion, ultimately improving meaningful educational, clinical, or system outcomes."

 

말이 조금 어렵나요? 간단히 말해 데이터와 AI를 활용해 학생에게 딱 필요한 교육을 제때 제공하자는 뜻입니다!

🎯 PME는 왜 필요할까요?

기존의 맞춤형 교육도 좋지만, 데이터가 너무 많아지면서 교수님들이나 코치들이 모든 걸 분석해서 학생을 지도하기가 힘들어졌어요. 😓 PME는 이 복잡한 과정을 기술(AI, 분석 도구)로 해결하려 합니다.

연구진은 PME의 근본적인 목표를 이렇게 강조합니다.

"PME의 근본적인 목표는 올바른 교육적 개입을 올바른 학습자에게 올바른 시기에 효율적으로 전달하는 것이다."

"The fundamental aim of PME is the efficient delivery of the right educational intervention to the right learner at the right time."

🧩 PME를 지탱하는 4가지 기둥: P4 프레임워크

이 논문에서는 정밀 의학의 개념을 빌려와 'P4 의학 교육 프레임워크(P4 Medical Education Framework)'를 제안합니다. 이게 PME의 핵심 엔진이에요! ⚙️

  1. 선제적 (Proactive): 학생이 실패할 때까지 기다리는 게 아니라, 데이터를 통해 미리미리 챙겨줍니다.
    1. "선제적 접근 방식은 교육 경로를 전형적으로 보여주는 반응적 관점(reactive lens)에서 벗어나는 것이다."
      "A proactive approach moves away from the reactive lens that typifies educational pathways."
  2. 맞춤형 (Personalized): AI와 분석 도구로 각 학생의 강점과 약점을 파악해 맞춤형 학습 자료와 평가를 제공합니다.
  3. 참여적 (Participatory): 학생은 수동적으로 교육받는 게 아니라, 자신의 데이터와 목표를 함께 공유하는 공동 생산자(Co-producer)가 됩니다.
  4. 예측적 (Predictive): 단순히 시험 점수만 보는 게 아니라, 이 학생이 나중에 어떤 의사가 될지, 환자 치료 결과는 어떨지 미래의 성과(Outcomes)를 예측합니다.

🚀 성공적인 PME를 위해 필요한 것들

PME가 제대로 작동하려면 학교와 수련 병원은 무엇을 준비해야 할까요?

  • 유연한 교육 경로 (Flexible Pathways): 모든 학생이 똑같은 시간을 들여 졸업할 필요는 없겠죠? 역량이 갖춰지면 빨리 다음 단계로 넘어가는 유연함이 필요합니다.
  • 종단적 데이터 (Longitudinal Data): 특히 학생이 진료한 환자의 전자의무기록(EHR) 데이터까지 교육에 활용한다면 훨씬 더 정밀한 평가가 가능해집니다.
  • 분석 도구 (Analytic Tools): 대시보드나 AI 같은 기술이 교수진의 시간을 아껴주고 더 정확한 통찰력을 줘야 합니다.

⚠️ 주의할 점도 있어요!

물론, 모든 기술에는 그림자가 있죠. 연구진은 PME가 멘토링을 대체해서는 안 된다고 경고합니다.

"PME는 교육생과 교수진 간의 직접적인 상호작용을 강화하고 심화시켜야 하며, 멘토링이나 코칭을 자동 제안 및 컴퓨터 생성 피드백으로 대체해서는 안 된다."

"PME should enhance and deepen direct interactions between trainees and faculty, and it should not replace mentorship or coaching with automatic suggestions and computer-generated feedback."

 

또한, AI 알고리즘이 가질 수 있는 데이터 편향(Bias) 문제도 꼼꼼히 살펴야 한다고 조언합니다.


📝 요약하자면...

PME는 단순한 유행이 아니라, 데이터와 AI 시대에 의학 교육이 나아가야 할 필연적인 방향처럼 보입니다. 더 효율적이고, 더 개인화되고, 더 미래 지향적인 의사 양성 시스템!

연구진의 마지막 멘트로 포스팅을 마칠게요.

"궁극적으로, PME는 변화의 속도가 빨라지고 교육과정 시간과 교수진의 가용성이 제한된 시기에 의학 교육 및 코칭에 상호작용적인 지속적 개선 역량(interactive continuous-improvement capacity)을 가져온다."

"Ultimately, PME brings an interactive continuous-improvement capacity to medical education and coaching at a time when the pace of change is accelerating and the amount of curricular time and faculty availability are constrained."

 

여러분의 생각은 어떠신가요? 데이터가 이끄는 의학 교육의 미래, 기대되지 않나요? 😊

 


 

미국의 의과대학과 전공의 수련(residency) 프로그램들은 역량 바탕 의학 교육(Competency-Based Medical Education, CBME)과 같은 새로운 의학 교육 모델을 점점 더 많이 받아들이고 있습니다. 이 모델들의 핵심은 각 의학 교육생(trainee)이 고유하며 서로 다른 목표, 강점, 그리고 성장 영역을 가지고 있다는 점을 인식하는 것입니다.[1] 이에 따라, 교육 훈련 프로그램들은 의과대학[2,3] 및 전공의 수련[4–6] 단계에서 점점 더 경로 중심적(pathway driven)이고 개인 맞춤화된(personalized) 교육을 제공하고 있습니다. 일부 학교들은 교육 단계를 압축하여 비전통적인 트랙을 통해 조기 졸업을 가능하게 하는 새로운 교육과정 모델을 탐구하고 있습니다.[7] 또한 수련 프로그램들은 각 졸업생이 다음 단계의 훈련이나 지도 감독 없는 진료(unsupervised practice)를 수행할 준비가 되도록 교육의 내용과 기간을 개별 교육생에게 맞추는 시간 가변적 진급(time-variable progression)을 실험하기 시작했습니다.[8–10] 의사가 되는 단계들 사이의 급격한 변화를 완화하기 위해, 개별화된 교육 포트폴리오의 인계(handoffs)와 맞춤형 코칭 개입(bespoke coaching interventions)을 활용하는 시범 사업들이 진행 중입니다.[11,12] 진료 현장에 있는 의사들 또한 맞춤형 평가와 피드백을 포함하는 면허 유지(maintenance of certification)를 위한 새롭고 유연한 종단적 모델을 경험하고 있습니다.[13,14]

 

하지만 이러한 성공에도 불구하고, CBME와 여타 개인 맞춤형 교육 개입들은 널리 채택되는 데 있어 여러 가지 도전에 직면해 있습니다. CBME는 학생과 코치가 개인화(personalization), 가속(acceleration), 감속(deceleration)에 대한 결정을 내릴 수 있도록 돕는 시기적절하고 효율적인 통찰력(insights)을 필요로 합니다. 이러한 통찰력을 실제 행동으로 옮기는 것은 증가하는 평가 데이터의 양과 역량 프레임워크(competency frameworks)의 복잡성으로 인해 실용적이고 물류적인 과제들을 수반합니다.[15] 수련 프로그램들이 CBME의 요구를 충족하기 위해 교육생에 대한 더 많은 평가 데이터를 수집할 수 있다 하더라도, 코칭, 감독, 승진 결정을 위해 데이터를 활용해야 하는 교수진(faculty)은 상당한 임상 및 행정적 압박을 받고 있어 가용 시간이 침해받고 있습니다.[16,17] 게다가 교수진과 학습자 모두 개별 학습 계획(individualized learning plans), 포트폴리오, 코칭 모델과 같은 CBME의 프로그램적 요소들을 채택하는 데 어려움을 겪고 있습니다.[18]

 

이러한 과제들을 해결할 솔루션이 없다면, CBME나 가속 훈련 경로(accelerated training pathways)와 같은 노력들은 복잡성, 데이터 및 평가의 과부하 문제, 그리고 교육생과 코치에게 시기적절한 통찰력을 제공할 도구의 부재로 인해 속도가 늦춰질 것입니다. 의과대학과 전공의 수련 프로그램들은 이러한 복잡성을 효율적으로 관리하고, 교육생과 코치가 변화하는 의학 교육 환경에서 번성하는 데 필요한 도구를 갖추도록 할 솔루션이 필요합니다.[19]

 

이 논문에서 우리는 이러한 과제들에 대한 잠재적 해결책을 정밀 의학 교육(Precision Medical Education, PME)이라는, 떠오르고 있지만 아직 정의가 명확하지 않은 패러다임에서 찾을 수 있다고 주장합니다. 우리는 PME의 정의를 제안하고, 영향력 있고 일반화 가능한 접근 방식을 육성하기 위한 PME 혁신 개발의 공유된 프레임워크(shared framework)를 제시하며, 수련 프로그램들이 PME 기반의 CBME 및 교육과정 혁신을 지원하기 위해 개발을 고려해야 할 역량(capacities)과 자원들을 제안합니다.

PME: 떠오르는 패러다임 (PME: An Emerging Paradigm)

정밀 의학(Precision medicine)은 각 환자가 고유한 유전형(genotype), 환경, 표현형(phenotype)을 가지고 있기 때문에 모든 검사나 치료가 동일한 역할을 하지 않을 것임을 인식하고, 환자의 특성에 따라 진단 및 치료 접근 방식을 조정합니다.[20] PME(정밀 의학 교육)는 이와 유사한 접근 방식을 취하여 학습, 평가, 코칭을 개별 학습자에게 맞춤화합니다. 떠오르는 패러다임으로서 PME는 아직 널리 받아들여진 정의가 없습니다.[21,22] 여기서 우리는 PME를 다음과 같이 정의할 것을 제안합니다:

"종단적 데이터(longitudinal data)와 분석(analytics)을 통합하여 개별 학습자의 필요와 목표(needs and goals)를 지속적이고, 시기적절하며, 순환적인 방식으로 다루는 정밀한 교육적 개입(precise educational interventions)을 주도하고, 궁극적으로 의미 있는 교육적, 임상적, 또는 시스템적 성과(outcomes)를 향상시키는 체계적인 접근 방식."

 

PME의 근본적인 목표는 올바른 교육적 개입올바른 학습자에게 올바른 시기에 효율적으로 전달하는 것입니다.[23]

 

의학 교육은 대체로 획일적인 교육과정 위에 개인 맞춤형 학습(personalized learning) 요소를 항상 포함해 왔습니다.[24] 때로는 "개별화 학습(individualized learning)"이라고도 불리는 "개인 맞춤형 학습"이라는 용어는 전통적으로 개인화된 피드백, 목표 중심 코칭(goal-driven coaching), 교육 경로를 안내하는 개별 학습 계획을 포함하는 학습자 중심 교육 모델을 지칭해 왔습니다.[25] PME는 개인 맞춤형 학습 개념을 기반으로 하되, 임상 및 시스템 수준과 같은 확장된 성과(outcomes) 세트에 의해 정보를 얻는 시기적절한 학습 및 평가 개입 주기에 초점을 맞춘 체계적이고 지속적인 접근 방식을 도입합니다.

 

PME는 수련 프로그램들이 CBME의 일환으로 수집하고 있는 증가된 평가 및 교육 성과 데이터뿐만 아니라, 교육생의 전자의무기록(EHR) 증례 및 기여 가능한(attributable) 임상 성과와 같은 다른 출처에서 수집된 데이터도 통합합니다.[26,27] 이러한 데이터는 분석(analytics) 및 인공지능(AI)에 의해 통합되고 체계적으로 평가되어 개별 학습자 수준에서 시기적절한 통찰력을 도출합니다. 새로운 통찰력은 후속 분석에 정보를 제공하고 특정 개인을 위한 추가적인 교육 성과 수집을 주도합니다.

 

AI와 같은 기술을 활용한다는 것은 성과 데이터가 아무리 방대하거나 복잡하더라도, 또는 얼마나 많은 교육생이 관련되어 있더라도 통찰력이 시기적절(timely)하다는 것을 의미합니다. 이러한 통찰력은 대시보드, 교육 의사결정 지원 도구(educational decision support tools), 또는 자동화된 제안을 통해 교육생과 코치에게 명시적으로 드러나며, 후속 교육 경로 결정 및 성과로 이어집니다.[19] 교육생의 성공을 촉진하는 것으로 밝혀진 통찰력들은 미래의 교육생들을 위한 후속 분석 주기 및 제안에 통합되어, 각기 다른 경로를 밟는 다양한 학습자들로부터 얻은 더 많은 성과를 바탕으로 개선되는 학습 시스템(learning system)을 생성합니다.

 

다수의 시범 프로젝트들이 PME의 필수 요소들을 입증해 왔지만, 그중 어느 것도 "정밀 의학 교육"이라 명명되거나 우리가 구상하는 PME의 지속적이고 반복적인 체계적 순환을 완전히 실현하지는 못했습니다. 여러 프로젝트가 개별 학습자 수준에서 새로운 통찰력을 생성하기 위해 교육생의 교육 참여(engagement), 경험, 성과에 대한 데이터를 활용하는 실험을 했습니다.

  • 예를 들어, 2개의 시범 프로젝트는 대면 세미나 이전에 온라인 학습 및 평가 도구에 대한 학생들의 참여로부터 수집된 과제 수행 시간(time-on-task) 데이터를 사용하여, 대면 학습 방식에서 가장 큰 혜택을 받을 개별 학습자와 세션의 하위 주제에 대해 학생들이 달성한 숙달 수준을 교수진에게 알렸습니다.[28,29] 이러한 시기적절한 통찰력 덕분에 교사들은 개인 맞춤형 대면 학습 및 교육과정 계획에 대해 미묘한 차이를 둔 접근(nuanced approach)을 취할 수 있었습니다.
  • 밴더빌트 의과대학(Vanderbilt University School of Medicine)의 VSTAR 시스템퀴즈 성적, 과제 적시성(timeliness), 시스템 로그인 횟수 데이터를 사용하여 학생들이 정의된 시간 내에 목표를 달성하지 못할 때 코치에게 자동 알림을 제공하고, 참여하지 않거나 진척이 없는 학생들을 교사에게 알립니다.[19]
  • 다른 시범 사업들은 교육 자원(educational resources)과 관련하여 교육생에게 개인 맞춤형, 컴퓨터 생성 제안을 제공하는 방법을 모색했습니다. 한 기관은 학생과 전공의를 위한 학습용 영상의학과 증례 파일 시스템을 구축했는데, 이는 영상 판독 학습에 있어 행동주의 이론 모델을 지원하기 위해 AI를 사용합니다.[30] 이 접근 방식은 학습자가 교수진과 함께 검토한 임상 연구들을 통합하여 기술 습득을 최적화할 교육용 증례를 자동으로 선택합니다.

NYU 그로스만 의과대학(NYU Grossman School of Medicine)에서 우리는 EHR(전자의무기록)에 존재하는 방대한 데이터를 PME 이니셔티브에 활용하는 방법을 모색해 왔습니다.

  • 한 시범 사업은 학생들의 환자 증례 진단명을 사용하여 관련 임상 주제에 대한 추천 교육 비디오 및 의학 문헌 형태의 교육적 넛지(educational nudges)를 제공합니다.
  • 두 번째 시범 사업은 AI 알고리즘을 사용하여 전공의들의 입원 기록(admission notes)에 있는 임상 추론 기록에 대한 피드백을 제공하는데, 모든 기록에 대해 개인 맞춤형 분석을 전달하고 전공의와 코치가 받는 실행 가능한 피드백의 양을 획기적으로 늘렸습니다.[31]

요약하자면, 디지털 학습 도구의 보편화, 더 많은 학습 성과를 수집할 수 있는 능력의 증대, 그리고 CBME에 수반되는 평가, 코칭, 역량 측정의 증가에 힘입어 PME 혁신은 가속화되고 있습니다. 그러나 혁신적임에도 불구하고, 이러한 시범 사업들은 지금까지 단일 기관 및 단일 훈련 단계에서 PME의 개별 요소들만을 기술했을 뿐, 우리가 PME를 위해 구상하는 훈련의 경계를 넘나드는 체계적이고 반복적인 접근 방식(systematic, iterative approach)을 아직 보여주지 못했습니다. 합의된 PME 정의의 부재는 PME 프로젝트를 식별하고 비교하는 것을 어렵게 만들며, CBME, 코칭, 전환(transitions), 교육과정 변화라는 지역적 과제를 해결하기 위해 PME를 어떻게 최선으로 구현할 수 있는지 수련 프로그램들이 이해하는 능력을 제한해 왔습니다. 학교와 전공의 수련 프로그램들이 CBME와 교육과정 변화의 요구를 충족하기 위해 시간, 인력, 기술에 투자함에 따라, PME를 위한 모범 사례(best practices), 핵심 기능, 구현 전략에 대한 공유된 이해가 필요하며, 이는 합의된 PME 원칙과 언어가 있을 때만 가능할 것입니다. 이러한 상황은 CBME의 평가 및 일반화를 제한했던 역량, 개입, 성과에 대한 일관성 없는 정의라는 과제를 극복하기 위해 공유된 프레임워크가 확인될 때까지 CBME가 직면했던 도전들과 유사합니다.[15,32]

지도 원칙: P4 의학 교육 프레임워크 (Guiding Principles: P4 Medical Education Framework)

정밀 의학(precision medicine)의 교훈은 PME 지도 원칙 개발에 정보를 제공할 수 있습니다. 정밀 의학의 P4 의학 프레임워크(P4 medicine framework)는 질병의 예방(prevention)과 조기 검진에 초점을 맞추고, 개별 환자의 유전형과 표현형에 맞춤화(personalized)되며, 환자의 능동적이고 참여적(participatory)인 역할을 포함하고, 환자의 위험과 질병 궤적을 예측(predictive)하는 변혁적이고 효과적인 의료를 위한 핵심 요소들을 설명합니다.[33,34] 우리는 이 프레임워크를 기반으로 유사한 P4 의학 교육 프레임워크(P4 medical education framework)를 통해 PME를 안내할 것을 제안합니다 (그림 1).

 

P4 의학 교육 프레임워크에서, PME는 선제적/주도적(proactive)이어야 하며, 교육생과 프로그램에 진척도, 강점, 필요한 성장 영역에 대한 시기적절하고 지속적인 통찰력을 제공하기 위해 노력해야 합니다. 선제적 접근 방식은 교육 경로를 전형적으로 보여주는 반응적 관점(reactive lens)에서 벗어나는 것입니다. 이는 가변적 길이의 의학 교육 경로와 역량 바탕 진급의 시대에 특히 중요한데, 여기서 가속 또는 감속 기회의 조기 및 빈번한 식별은 각 교육생의 성공을 보장하는 열쇠입니다.[10] 선제성(Proactivity)은 위에서 제안한 정의에서 설명한 대로 PME 시스템이 지속적이고, 시기적절하며, 순환적이 되기 위한 핵심 특성입니다. 선제적 PME는 종단적 교육생 경험, 평가된 역량, 성과, 필요, 목표에 대한 데이터의 지속적 수집에 달려 있습니다. 디지털 학습 시스템은 교육 성과를 모니터링하고 변경 사항을 교육생과 코치에게 실시간으로 알림으로써 선제성을 촉진할 수 있습니다.[35] 앞서 설명한 2개의 시범 사업에서와 같이, 학생의 참여와 숙달을 모니터링하는 선제적이고 자동적인 접근 방식은 교수진이 코스가 끝나고 성과가 검토될 때까지 기다리는 대신, 코스가 진행되는 동안 변경을 가할 수 있게 해줍니다.[28,29]

 

교육 경험과 평가 또한 각 교육생이 최대 잠재력에 도달할 수 있도록 돕기 위해 각자의 필요와 목표에 맞춤화(personalized)되어야 합니다. 이는 우리 PME 정의의 핵심 기능입니다. 각 교육생은 고유한 필요와 목표를 다루도록 설계된 학습, 평가, 코칭을 받아야 합니다. 개인화는 예측 모델링(predictive modeling),[36–38] AI,[30,39] 의사결정 지원 도구[29,40,41]와 같은 분석(analytics)을 각 교육생의 선제적으로 수집된 종단적 데이터 및 성과에 적용함으로써 달성됩니다.

 

이러한 분석에서 얻은 통찰력을 바탕으로 교육 리더들은 학습 자원을 조정하고, 평가의 내용이나 시기를 수정하고, 코칭의 초점과 양을 조절하거나, 교육생의 교육 경로를 구조적으로 변경함으로써 정밀 개입(precision interventions)을 설계할 수 있습니다.[9] 이러한 개입의 구현은 참여적(participatory)이어야 하며, 교육생이 공동 생산자(co-producers)로서 개입이 가치를 제공하고 진정성 있으며 신뢰할 수 있음을 보장해야 합니다.[42] 개별 학습자는 의과대학, 전공의, 펠로우십, 그리고 실제 진료를 관통하는 변함없는 연결 고리입니다. 이 접근 방식의 전반적인 성공을 위한 열쇠는 학습자와 코치 간의 파트너십을 통해 PME 통찰력을 이해하고 이를 일상적이고 순환적으로 교육적 결정에 활용하는 것입니다.[11]

 

정밀 개입의 설계는 그것들이 의미 있는 미래의 교육적, 전문적, 환자 중심적, 또는 시스템/인력 성과를 예측(predictive)할 수 있다는 증거에 기반해야 합니다.[43] 예측적 PME는 학업 및 교육과정 계획을 교육생, 프로그램, 환자에게 중요한 성과를 중심으로 재구성합니다.[36] 예측 분석은 교육 및 진료의 각 단계에서 성공과 상관관계가 있는 요인을 결정하고자 하는 의학 교육 연구의 초점이 되어 왔습니다.[36,44–46] PME 모델에서, 맞춤형 개입은 교육생과 코치가 쉽게 이용할 수 있는 미래 성과(예: 시험 성적, 임상 기술 평가, 전공의 매칭 성공)의 예측을 기반으로 설계되어 단기 학습 및 평가와 장기 교육 계획 모두에 정보를 제공할 수 있습니다. 예측적 교육은 또한 교육생에게 학습을 조절하는 방법과 개인적 목표를 위해 최상의 성과를 달성하는 데 도움이 될 자원이나 경험이 무엇인지에 대한 통찰력을 줄 수 있습니다.[45]

 

요약하면, PME를 구현하는 것은

  • 학습자와 교육적 맥락에 대한 포괄적인 종단적 데이터선제적으로 수집하기 위해 P4 의학 교육 프레임워크를 적용하고;
  • 데이터에 기반한 통찰력을 생성하기 위해 AI를 포함한 분석을 적용하며;
  • 학습 자원의 개인 맞춤형 추천, 맞춤형 평가, 시기적절한 코칭과 같은 정밀 개입을 만들되, 그 과정 전반에 걸쳐 교육생이 중심적인 참여 역할을 맡도록 하고;
  • 의미 있는 교육, 전문적, 임상 및 보건 시스템 성과를 예측하는 것을 포함합니다.
  • 이러한 개입이 교육생의 성과에 미치는 영향지속적, 반복적, 체계적으로 평가되며 미래의 정밀 개입에 영향을 미칠 것입니다.

기초 역량 및 자원 (Foundational Capacities and Resources)

P4 의학 교육 프레임워크는 학교와 전공의 수련 프로그램이 기존의 강점을 활용하고, 어떤 경우에는 새로운 역량과 자원을 개발할 것에 의존합니다. 이러한 역량은 PME의 영향력에 있어 핵심입니다. 시범 사업에서 일상적인 사용으로 나아가기 위해서는 수련 프로그램 전반에 걸쳐 이러한 역량의 보편화(ubiquity)가 필요할 것입니다. 우리는 공유된 프레임워크가 수련 프로그램들이 내부 역량과 그들의 교육 프로그램이 영향력을 갖도록 보장하기 위해 필요할 수 있는 새로운 투자를 조정하는 것을 고려할 때 도움이 될 것이라고 주장합니다.

유연한 교육 경로 및 프로그램 (Flexible educational pathways and programs)

PME와 CBME를 완전히 실현하려면 개인의 유연성역동적인 역량 바탕 진급을 지원하는 반응적이고 민첩한 교육 환경이 필요합니다.[3] 이는 의학 교육의 많은 측면이 시간에 고정되어 있고 의료 시스템이 환자 진료에 교육생의 예측 가능한 참여를 원한다는 점을 고려할 때 어려운 과제입니다. 전형적인 예로는 의대생 임상실습(clerkship)과 전공의 순환(rotation) 일정이 있는데, 둘 다 일반적으로 훨씬 전에 고정되지만 진화하는 수행 능력, 필요, 전문 분야 관심사에 의해 주도되는 역동적인 개인 맞춤형 진급(dynamic personalized progression)을 받아들일 잠재력이 있습니다.[47]

 

PME 접근 방식의 한 예는 교육생이 1년을 진행하면서 의도한 전공의 변경이나 특정 임상 기술에서 입증된 역량에 따라 교육생의 순환 일정을 수정하는 것입니다. 'Education in Pediatrics Across the Continuum(EPAC)' 컨소시엄은 역량이 달성되었을 때 전공의 과정으로 전환되는 종단적 소아과 임상실습 모델을 사용했습니다.[3] 기간보다는 진료와 교육과정의 연속성(continuity)에 기반한 임상실습 구조, 예를 들어 종단적 통합 임상실습(longitudinal integrated clerkships)은 충분한 종단적 환자 노출을 보장하기 위해 개별 학생 수준에서 유연성과 역동적 일정을 내장하고 있습니다.[48,49]

종단적 교육생 데이터 및 성과 (Longitudinal trainee data and outcomes)

정밀 의학 개입과 마찬가지로, PME 개입은 학습자와 그들의 경험, 평가된 역량, 성과에 대한 포괄적인 종단적 데이터(longitudinal data)로부터 얻은 통찰력을 필요로 합니다 (그림 1). 의과대학들은 종종 다양한 출처의 교육 및 성과 데이터를 통합하기 위해 데이터 웨어하우징 접근 방식을 취하며, 임상 EHR(전자의무기록) 데이터의 통합을 늘리고 있습니다.[43,50] EHR 데이터는 교육생이 시간이 지남에 따라 진료하는 고유한 환자 집단과 진단명을 정량화하므로 엄청난 잠재적 가치를 가집니다. EHR 데이터에 존재하는 성과는 교육적 개입과 그것이 환자 및 보건 의료 시스템 성과에 미치는 영향 간의 연결을 가능하게 합니다.[3,38,51] 이러한 데이터를 학습자와 교수진이 더 쉽게 접근하고 실질적으로 유용하게 만들며, 교육생 역량 평가에 사용하는 것을 정당화하기 위한 필수적인 타당도 근거(validity evidence)를 수집하는 작업이 필요합니다.[37]

그림 1: P4 의학 교육 프레임워크. 정밀 의학 교육(PME)은 종단적 데이터와 분석을 통합하여 개별 학습자의 필요와 목표를 지속적이고, 시기적절하며, 순환적인 방식으로 다루는 정밀한 교육적 개입을 주도하고, 궁극적으로 의미 있는 교육적, 임상적, 또는 시스템적 성과를 향상시키는 체계적인 접근 방식이다.

제안된 P4 의학 교육 프레임워크(정밀 의학의 확립된 P4 의학 프레임워크[33,34]에서 수정됨)에서 PME는 다음과 같은 반복적인 접근 방식이다:
(1) 교육생의 경험, 역량, 필요, 목표에 대한 고밀도 종단적 데이터가 선제적(proactively)으로 수집된다;
(2) 정밀 분석(인공지능 및 의사결정 지원 도구 포함)이 이 데이터에 적용되어 각 교육생 수준에서 시기적절한 맞춤형(personalized) 통찰력을 생성한다;
(3) 정밀 교육 개입(예: 학습, 평가, 코칭, 경로)은 교육생이 수련 프로그램과 공동 생산자가 되어 참여적(participatory) 방식으로 설계된다;
(4) 개입은 의미 있는 교육, 임상, 또는 시스템 성과를 예측(predictive)한다.

 

중요한 점은, 교육생에게 귀속될 수 있는(trainee-attributable) EHR 데이터에 기반한 새로운 환자 참조 평가(patient-referenced assessments)가 표준화 시험, 직무 바탕 평가(work-based assessments), 객관구조화진료시험(OSCE)과 같은 기존의 교육생 참조 평가(trainee-referenced assessments)를 보완하여 견고한 평가 프로그램을 형성할 것이라는 점입니다. 이러한 환자 참조 데이터는 의료 팀의 맥락과 환자로부터의 피드백을 포함할 수 있으며, 둘 다 임상 진료에 대한 교육생의 기여를 측정하는 중요한 척도입니다.[52] 다양한 출처의 데이터를 통합하고 기관, 조직, 인증 위원회의 경계를 넘어 데이터를 원활하게 전송하기 위해서는 상호 운용성(interoperability)과 데이터 표준이 필요합니다.[53]

 

PME는 교육적 요인(예: 노출, 개입, 평가)과 후속 교육적, 전문적, 환자 또는 보건 의료 시스템 관련 성과 간의 관계를 평가하는 중개 의학 교육(translational medical education) 및 교육 성과 연구의 이전 작업을 활용함으로써 이익을 얻을 것입니다.[54] 전통적인 중개 연구(translational research)의 패러다임과 마찬가지로,[55] 중개 의학 교육의 학술적 발견은 교육생과 수련 프로그램에 다시 피드백되어 의미 있는 개선을 주도하도록 보장해야 합니다. P4 의학 교육 프레임워크는 반복적이고 순환적인 방식으로 정밀 개입을 성과 예측에 연결함으로써 이러한 중개 의학 교육 개념을 통합합니다.

분석 도구 및 기술 (Analytic tools and technology)

교육생 데이터와 성과를 각 학습자를 위한 교육 및 평가의 의미 있는 변화로 변환하려면 새로운 분석(analytics) 및 교육 도구가 필요할 것입니다. 이는 학습자와 코치에게 개별 성과 데이터를 보여주는 대시보드컴퓨터 기반 교육 시스템으로 구성될 수 있습니다.[56,57] 이러한 교육생 및 교수진용 애플리케이션 이면에는 각 교육생의 이전 교육 경험, 성과, 필요, 목표에 의해 자동으로 트리거되고 적응하는 교육적 개입을 제안하는 알고리즘이 있습니다. 의과대학과 대학병원의 임상 정보학 및 데이터 분석 팀 간의 파트너십은 학교가 이러한 새로운 PME 기술을 개발하는 데 도움이 될 수 있습니다. 특히 그 팀들은 유사한 방법을 사용하여 병행적인 정밀 의학 개입을 작업하고 있을 가능성이 높기 때문입니다. 일단 구축되면, 이러한 기술 기반 솔루션은 플립 러닝(flipped classroom) 방법론을 사용한 이전 시범 사업들에서처럼 상당히 많은 자원이나 교수진의 시간을 추가로 요구하지 않으면서 고품질의 PME 노력을 확장(scale)할 수 있습니다.[28,29]

 

도구의 공유 생태계(shared ecosystem)를 개발하기 위해 협력하는 기관들은 기술에 널리 퍼져 있는 확장성(scalability)을 활용하고 자원이 제한된 기관들이 이러한 도구를 개발할 때 직면할 수 있는 어려움을 개선할 수 있습니다. 의과대학에 디지털 학습 솔루션을 제공하는 소프트웨어 회사들은 자체적인 PME 솔루션을 적극적으로 개발하고 있으므로 주요 파트너가 될 것입니다.[40,58]

문화와 참여 (Culture and engagement)

PME는 데이터 기반 의사결정을 지원하는 지속적인 개선 주기(continuous cycles of improvement)의 문화, 교육생 간의 자기 주도적 학습(self-directed learning), 그리고 교수진, 프로그램, 인증기관의 유연한 접근 방식 내에서 개발되지 않는다면 그 영향력이 제한적일 것입니다.[59] 이러한 문화의 중요한 요소에는 정밀 분석에 어떤 교육생 성과가 사용되는지에 대한 투명성(transparency), 이러한 PME 프로그램의 설계 및 감독에 교육생의 참여, 정밀 개입의 성과를 정기적으로 평가하는 거버넌스 프로세스가 포함됩니다. 정밀 추천(precision recommendations)을 사용하여 개인 학습 계획을 수립하고 데이터 기반 코칭을 하는 것은 의도적인 교육생 및 교수진 개발(faculty development)을 필요로 하는 새로운 기술입니다. 의학 교육에서 임상 성과에 더 큰 초점을 맞추려면 그것의 귀속(attribution)과 그것이 포착되는 교육적 맥락에 대해 특별한 주의가 필요할 것입니다.[27,60]

PME의 함정 예상 (Anticipating Pitfalls of PME)

새로운 역량과 자원을 개발하는 것 외에도, PME의 광범위한 구현은 추가적인 과제에 직면해 있습니다. 개인 맞춤형 교육, 맞춤형 평가(bespoke assessments), 구조와 길이가 다양한 다양한 교육 경로는 학교, 교수진, 코치, 학습자에게 엄청난 복잡성을 초래합니다. 이러한 복잡성을 조절하는 데 도움을 주기 위해 자원 집약적인 교육생 및 교수진 개발 노력이 필요할 것입니다. PME는 교육생과 교수진 간의 직접적인 상호작용을 강화하고 심화시켜야 하며, 멘토링이나 코칭을 자동 제안 및 컴퓨터 생성 피드백으로 대체해서는 안 됩니다. 각 기관은 학습자에게 제공되는 지원이 그들의 교육만큼이나 개인 맞춤화되도록 보장해야 합니다. PME가 교육과정 계획, 교육 기간, 등록금에 미치는 영향은 신중하게 고려되고 집단적으로 다루어져야 합니다. 의과대학들이 단축된 교육과정 단계나 훈련 기간을 고려함에 따라, PME에서 얻은 통찰력의 주기가 학업 계획, 평가의 개인화, 시기적절한 코칭에 정보를 제공할 수 있는 충분하고 빈번한 기회가 있도록 보장하는 것이 중요할 것입니다.[10,61]

 

PME의 구현은 궁극적으로 인간의 과정이지만, PME의 핵심에 있는 일부 분석 및 AI 시스템은 비교적 최근의 발명품이며 그것들을 만드는 데 사용된 데이터에 존재하는 편향(biases)에 취약합니다.[62] 역사적으로 의학계에서 과소 대표된(underrepresented) 교육생 그룹은 데이터에서도 마찬가지로 과소 대표될 것입니다. 새로운 교육 경로는 미래의 교육생을 위한 제안을 맥락화할 수 있는 이전 졸업생들의 성과가 거의 없을 것입니다. PME 개입이 생성되고 평가될 때, 이러한 편향을 완화하기 위해 주의를 기울여야 합니다.[63] P4 의학 교육 프레임워크와 같은 공유된 프레임워크의 사용은 수련 프로그램 전반에 걸쳐 유사한 개입을 통합(pooling)하는 것을 용이하게 하여, 이러한 새로운 분석이 개발됨에 따라 더 큰 힘(power)과 대표성을 구축할 것입니다.

결론 (Conclusions)

PME는 떠오르는 패러다임입니다. 이는

  • 각 교육생이 고유하다는 인식의 증가,
  • 교육 및 훈련의 개인 맞춤화 증가,
  • 의학 교육이 양과 출처 모두에서 증가하는 성과의 시대에 진입하고 있다는 점, 그리고
  • 의학 교육자들이 이제 실행 가능한 교육 통찰력을 도출할 수 있는 새로운 분석 및 AI 도구를 갖게 되었다는 점에 의해 주도됩니다.

이 논문에서 제안된 PME 정의와 P4 의학 교육 프레임워크는 프로그램들이 교육적으로 선제적(proactive)이고, 점진적인 자기 주도적 학습을 지원하기 위해 각 교육생에게 맞춤화(personalized)되며, 교육생을 적극적인 참가자로 참여(engage)시키도록 설계되고, 의미 있는 미래 성과를 예측(predicting)하는 데 초점을 맞춘 정밀 교육 전략을 개발하고 구현할 때 안내할 수 있습니다.

 

완전히 실현된 PME는 교육생에 대한 종단적 성과 및 임상 데이터의 큐레이션을 지원하기 위한 새로운 기초 역량 및 자원, 영향력 있는 개입을 위한 근거 기반을 구축하기 위한 학술 연구(scholarship), 의미 있는 추천을 주도할 필수 기술 및 분석의 공유 개발, 교육생이 맞춤형 교육을 경험할 수 있는 유연한 경로, 그리고 교육 및 훈련에 대한 이러한 새로운 관점을 육성하는 문화를 필요로 할 것입니다. 동시에, 교육생과 교수진을 준비시키지 않은 채 교육의 복잡성을 증가시키거나 예측의 편향을 전파하는 것과 같은 PME의 잠재적 함정들은 의도적으로 다루어져야 합니다.

 

PME 개입은 체계적이고 지속적이며, 분석에 의해 정보를 얻지만 교육생과 그들의 코치에 의해 실행됩니다. PME가 완전히 실현되면, 학교와 전공의 수련 프로그램들은 이를 사용하여 CBME 및 가속 교육과정과 관련된 과제를 극복하고 새로운 요구를 해결할 수 있을 것입니다. PME는 수련 프로그램들이 지역 교육과정의 맥락에서 각 교육생의 고유한 요구를 최우선으로 두고, 역사적 및 예측된 성과에 기반하여 중대한(high-stakes) 가속 또는 감속 결정을 내리는 데 사용할 도구와 통찰력을 제공합니다. 가속 또는 시간 가변적 프로그램을 구현하는 프로그램들의 경우, PME는 더 큰 효율성을 가능하게 하고, 적시성(timeliness)을 가져오며, 각 학생이 성공하는 데 도움이 될 것은 더 많이, 필요하지 않은 것은 덜 얻도록 할 수 있습니다. PME 도구는 또한 임상 EHR 및 AI 예측 성과와 같은 출처에서 나오는 증가된 양과 유형의 성과 데이터를 다루는 데 필수적입니다. 궁극적으로, PME는 변화의 속도가 빨라지고 교육과정 시간과 교수진의 가용성이 제한된 시기에 의학 교육 및 코칭에 상호작용적인 지속적 개선 역량(interactive continuous-improvement capacity)을 가져옵니다.

 

그림 1: P4 의학 교육 프레임워크 (P4 medical education framework).

정밀 의학 교육(Precision Medical Education, PME)은 종단적 데이터와 분석을 통합하여 개별 학습자의 필요와 목표를 지속적이고, 시기적절하며, 순환적인 방식으로 다루는 정밀한 교육적 개입을 주도하고, 궁극적으로 의미 있는 교육적, 임상적, 또는 시스템적 성과를 향상시키는 체계적인 접근 방식입니다. 제안된 P4 의학 교육 프레임워크(정밀 의학의 확립된 P4 의학 프레임워크[33,34]에서 수정됨)에서 PME는 다음과 같은 반복적인 접근 방식입니다:

  1. 교육생의 경험, 역량, 필요, 목표에 대한 고밀도 종단적 데이터가 선제적(proactively)으로 수집됩니다.
  2. 정밀 분석(인공지능 및 의사결정 지원 도구 포함)이 이 데이터에 적용되어 각 교육생 수준에서 시기적절한 맞춤형(personalized) 통찰력을 생성합니다.
  3. 정밀 교육 개입(예: 학습, 평가, 코칭, 경로)은 교육생이 수련 프로그램과 공동 생산자가 되는 참여적(participatory) 방식으로 설계됩니다.
  4. 개입은 의미 있는 교육, 임상, 또는 시스템 성과를 예측(predictive)합니다.

2. Figure 1 상세 설명

이 그림은 정밀 의학 교육(PME)이 어떻게 순환적이고 체계적으로 작동하는지를 시각화한 것입니다. 그림은 중심의 핵심 개념(P4)과 그를 둘러싼 4가지 실행 단계로 구성된 원형 구조를 띠고 있으며, 시계 방향으로 순환하는 흐름을 보여줍니다.

 

중심부: P4 정밀 의학 교육 (P4 PRECISION MEDICAL EDUCATION) 이 프레임워크의 핵심 4가지 원칙(P4)이 안쪽 고리에 위치하며, 바깥쪽 고리의 구체적인 실행 요소들과 1:1로 대응됩니다.

 

1단계: 선제적 (PROACTIVE) - 상단

  • 연결 요소: 교육생 맥락 & 종단적 데이터 (TRAINEE CONTEXT & LONGITUDINAL DATA)
  • 설명: 교육이 문제가 발생한 후 반응하는 것이 아니라, 미리 준비하고 계획하기 위해 데이터를 수집합니다.
    • 세부 내용: 교육생의 경험(Experiences), 평가된 역량(Assessed Competence), 필요와 목표(Needs & Goals) 등 방대한 데이터를 지속적으로 모으는 단계입니다.

2단계: 맞춤형 (PERSONALIZED) - 우측

  • 연결 요소: 분석 (ANALYTICS)
  • 설명: 수집된 데이터를 각 개인에게 딱 맞는 형태로 가공합니다.
    • 세부 내용: 예측 모델링(Predictive Modeling), 인공지능(Artificial Intelligence), 의사결정 지원(Decision Support) 도구를 사용하여 데이터를 분석하고, 이를 통해 개별 학습자에게 특화된 통찰력을 도출합니다.

3단계: 참여적 (PARTICIPATORY) - 하단

  • 연결 요소: 개입 (INTERVENTIONS)
  • 설명: 분석된 결과를 바탕으로 실제 교육적 행동을 취하되, 학습자가 주도적으로 참여합니다.
    • 세부 내용: 학습 자원(Learning Resources), 평가(Assessment), 코칭(Coaching), 유연한 경로(Flexible Pathways) 등을 제공합니다. 이때 중요한 것은 교육자가 일방적으로 지시하는 것이 아니라, 학습자가 공동 생산자(co-producer)로서 자신의 교육 과정에 능동적으로 참여한다는 점입니다.

4단계: 예측적 (PREDICTIVE) - 좌측

  • 연결 요소: 성과 (OUTCOMES)
  • 설명: 이러한 개입이 단순히 현재의 학습에만 그치지 않고, 미래의 결과를 예측하고 개선하는 데 기여합니다.
    • 세부 내용: 교육적(Educational), 전문적(Professional), 임상/환자(Clinical/Patient), 보건 의료 시스템(Health Care System)의 성과를 예측하고 향상시킵니다.

순환 구조 (Iterative Cycle) 이 그림의 화살표가 보여주듯, 성과(Outcomes) 데이터는 다시 종단적 데이터(Longitudinal Data)로 축적되어 다음 주기의 선제적(Proactive) 분석을 위한 밑거름이 됩니다. 즉, PME는 일회성 이벤트가 아니라 끊임없이 데이터를 쌓고, 분석하고, 개입하고, 결과를 예측하며 발전하는 지속적인 순환 시스템임을 나타냅니다.

Acad Med. 2025 Jun 1;100(6):655-660. doi: 10.1097/ACM.0000000000005980. Epub 2025 Jan 31.

Precision Medical Education: Institutional Strategies for Successful Implementation

 

 

[의학교육 트렌드] AI와 데이터로 완성하는 '정밀 의학교육(PME)' 성공 전략 5가지 🎓🏥

 

🤔 정밀 의학교육(PME)이 정확히 뭐죠?

환자에게 딱 맞는 치료를 하는 '정밀 의료(Precision Medicine)'처럼, 학생 개개인의 데이터에 기반해서 맞춤형 교육을 제공하는 것을 말해요. 연구진은 PME를 이렇게 정의하고 있습니다.

"의미 있는 교육적, 임상적, 또는 시스템적 성과를 궁극적으로 개선하기 위해, 종단적 데이터와 분석을 통합하여 각 개별 학습자의 요구와 목표를 지속적이고, 시의적절하며, 순환적인 방식으로 다루는 정밀한 교육적 개입을 주도하는 체계적인 접근 방식."

"a systematic approach that integrates longitudinal data and analytics to drive precise educational interventions that address each individual learner’s needs and goals in a continuous, timely, and cyclical fashion, ultimately improving meaningful educational, clinical, or system outcomes."

 

쉽게 말해, 학생의 데이터를 쭈욱 모아서(종단적 데이터), 지금 이 학생에게 딱 필요한 게 뭔지 분석하고, 적절한 타이밍에 도움(개입)을 줘서, 결국엔 훌륭한 의사로 성장시키는 시스템인 거죠!

이 시스템이 성공하려면 P4 프레임워크를 기억해야 해요.

  1. Proactive (선제적): 데이터를 미리미리 확보하고
  2. Personalized (개별화된): 분석을 통해 개인 맞춤형 통찰을 주고
  3. Participatory (참여적): 학생도 함께 참여하며
  4. Predictive (예측적): 미래의 성과를 예측할 수 있어야 합니다.

그럼, 이걸 어떻게 실현할까요? 연구진이 제안한 5가지 전략입니다.


Strategy 1. 교육 데이터를 큐레이션 하세요 (Curate Educational Data) 📊

가장 기본은 '데이터'겠죠? 시험 성적뿐만 아니라 시뮬레이션 결과, 진료 기록(EHR) 로그 등 학생과 관련된 모든 데이터를 모아야 합니다. 하지만 그냥 쌓아두기만 하면 안 돼요. 연구진은 흩어진 데이터를 한곳에 모으는 '교육 데이터 웨어하우스(Education Data Warehouse)'의 중요성을 강조합니다.

"P4 프레임워크에 따르면, 이러한 시스템에서 데이터를 선제적으로 사용하는 것이 학습자의 교육적 노출, 진척도, 요구를 이해하는 열쇠입니다."

"As per the P4 framework, proactive use of data from these systems is the key to understanding learners’ educational exposures, progress, and needs."


Strategy 2. 데이터를 '통찰'로 바꾸는 분석 역량을 키우세요 (Analytics) 💡

데이터가 준비됐다면, 이제 분석(Analytics)을 해야죠. 대시보드나 리포트 같은 도구를 통해 교수님과 학생이 "아, 내가 이 부분이 부족하구나"라고 깨닫게 해줘야 합니다. 이때 중요한 건, 분석을 단순한 행정 업무로 보면 안 된다는 거예요.

"분석 이니셔티브는 단순한 보고 및 규정 준수 기능이 아니라, 혁신의 중심으로 간주되어야 합니다."

"Analytics initiatives must be viewed as a center of innovation, not just as a reporting and compliance function."

 

학생과 교수님들이 데이터(Data)와 분석 결과를 이해할 수 있도록 데이터 리터러시(Data Literacy) 교육을 하는 것도 필수입니다!


Strategy 3. 거버넌스를 구축하세요 (Governance) 🤝

"내 성적 데이터를 누가 볼 수 있지?", "AI가 나를 평가하는 게 공정한가?" 이런 걱정, 당연히 들겠죠? 그래서 데이터 소유권과 윤리적 사용을 결정할 거버넌스(Governance) 그룹을 초기에 만들어야 합니다. 연구진은 투명성과 신뢰를 특히 강조했어요.

"거버넌스투명성은 정밀 분석 또는 개입의 최종 사용자(즉, 학습자, 교수진, 또는 프로그램)와 이니셔티브를 감독하는 교육 리더 간의 양방향 신뢰에 뿌리를 둔 참여적인 PME 이니셔티브에 필수적입니다."

"Governance and transparency are essential for a participatory PME initiative rooted in bidirectional trust between the end-users of precision analytics or interventions (i.e., learners, faculty, or programs) and educational leaders overseeing the initiative."


Strategy 4. 타당도를 검증하세요 (Validation) ✅

우리가 도입한 맞춤형 교육이 진짜 효과가 있을까요? 이걸 증명해야 합니다. PME가 정말로 학생의 역량을 키우고, 나아가 환자 진료 결과까지 좋게 만드는지(예측적 성과) 확인하는 과정이 필요해요.

"PME 패러다임은 정밀 개입이 의미 있는 학습자 또는 환자 성과를 예측할 수 있어야 한다고 주장합니다."

"the PME paradigm asserts that precision interventions should be predictive of meaningful learner or patient outcomes."


Strategy 5. 변화를 주도하세요 (Lead Change) 🚀

마지막이자 가장 중요한 전략! 바로 리더십(Leadership)입니다. 기술과 시스템만 바꾼다고 되는 게 아닙니다. 학교의 '문화'가 바뀌어야 해요. 연구진은 'PME 운영 그룹'을 만들어서 강력하게 변화를 이끌어야 한다고 조언합니다.

"변화 리더십은 이행 준비 상태를 달성하는 데 핵심이며, 이것 없이는 기관들이 PME를 이행하려다 혼란에 빠질 위험이 있습니다."

"Change leadership is key for achieving this implementation readiness, and without it, institutions risk falling into chaos as they try to implement PME."


📝 요약하며

결국 정밀 의학교육(PME)의 성공은 데이터(Data), 기술(Technology), 사람(People), 그리고 문화(Culture)가 얼마나 잘 어우러지느냐에 달려 있는 것 같습니다. 우리 학교는 지금 어떤 단계에 와 있을까요? 데이터를 모으는 단계? 아니면 분석을 시도하는 단계? 이 5가지 전략을 나침반 삼아, 미래의 의사들을 위한 더 나은 교육 환경을 고민해 보면 좋겠습니다. 😊


의학교육은 단축 과정(accelerated pathways),1 보건 의료 시스템 과학(health systems science),2 코칭(coaching),3 및 현장 진급 시범 사업(promotion-in-place pilots)4과 같은 과감한 교육과정의 혁신을 포함하여 근본적인 변화를 겪고 있습니다. 또한, 전통적인 접근법과 새로운 접근법을 결합한 정교해진 평가 프로그램(programs of assessment),5–8 오랫동안 미루어왔던 웰빙(well-being)과 다양성(diversity)에 대한 관심,9,10 그리고 예측 분석(predictive analytics)11,12 및 인공지능(AI)13의 사용 증가와 같은 변화도 일어나고 있습니다. 이러한 이니셔티브의 기저에는 역량 바탕 의학 교육(competency-based medical education, CBME)14,15에 뿌리를 둔 사고의 전환이 자리 잡고 있으며, 이는 특정 학습자의 교육이 그들의 개별적 성장과 그들이 현재 또는 미래에 담당할 환자와 지역사회에 고품질의 공평한 진료를 제공하는 능력에 어떻게 기여하는지를 고려하는 것입니다.

 

이 개념을 체계화하기 위해, 우리는 이전에 정밀 의학교육(precision medical education, PME) 패러다임을 다음과 같이 정의하여 제안했습니다.

의미 있는 교육적, 임상적, 또는 시스템적 성과(outcomes)를 궁극적으로 개선하기 위해, 종단적 데이터(longitudinal data)와 분석(analytics)을 통합하여 각 개별 학습자의 요구(needs)와 목표(goals)를 지속적이고, 시의적절하며, 순환적인 방식으로 다루는 정밀한 교육적 개입(educational interventions)을 주도하는 체계적인 접근 방식.16

 

Desai와 동료들과 함께,17 우리는 PME의 개념을 개인, 프로그램, 조직을 아우르도록 확장하였으며, 평생 학습(lifelong learning)의 관점을 적용했습니다.17 이론적 관점에서 우리는 P4 의학교육 프레임워크(P4 medical education framework)를 제안했는데, 이는 PME가 다음과 같아야 함을 주장합니다.

  • (1) 훈련생(trainee)의 데이터를 획득하고 사용하는 데 있어 선제적인(proactive) 접근을 취해야 한다.
  • (2) 정밀 분석(인공지능 및 의사결정 지원 도구 포함)을 통해 시의적절한 개별화된(personalized) 통찰을 생성해야 한다.
  • (3) 훈련생을 공동 생산자(co-producers)로서 중심에 두고 참여적인(participatory) 방식으로 정밀 교육적 개입(학습, 평가, 코칭, 경로)을 설계해야 한다.
  • (4) 개입이 의미 있는 교육적, 전문적, 또는 임상적 성과를 예측할 수 있도록(predictive) 보장해야 한다.16

이러한 P4 개념적 프레임워크를 실천으로 옮기고 훈련생 및 교수진과 함께 PME 개입을 실용적으로 이행하는 것은 많은 기관 및 보건 전문직 훈련 프로그램의 리더들에게 여전히 벅찬 일(daunting)로 남아 있습니다. 이행을 위한 핵심 질문들은 다음과 같습니다:

  • 훈련 프로그램이 PME를 시작하기 위해 필요한 역량(capacities)은 무엇인가?
  • 훈련생에 대한 방대한 원시 데이터(raw data)를 의사결정을 주도하는 의미 있고 실천 가능한 통찰(actionable insights)로 변환하기 위해 무엇이 필요한가?
  • 프로그램은 PME 개입에 필요한 타당도 증거(validity evidence)를 어떻게 수집할 수 있는가?

이 논평(Commentary)에서 우리는 모든 기관 수준에서 성공적인 PME 이행이 직면한 이러한 과제들을 다룹니다. 구체적으로, 우리는 고등교육에서의 이전 경험과 학습 분석(learning analytics) 관행을 활용하여, 교육 리더들이 PME를 구축하기 위해 동시에 사용할 수 있는 P4 프레임워크(그림 1)와 연계된 4가지 구체적인 전략을 개괄합니다:

  • (1) 교육 데이터 큐레이션(curate educational data);
  • (2) 데이터를 통찰로 변환하는 분석 역량 구축(build analytic capabilities);
  • (3) PME의 원칙 있는 사용을 보장하기 위한 거버넌스 수립(establish governance);
  • (4) 타당도를 뒷받침하는 성과를 지속적으로 수집(continuously collect outcomes); 그리고
  • 이 4가지 전략 모두를 관통하는 (5) PME를 추진하기 위한 변화 주도(lead change)입니다.
그림 1: 정밀 의학교육(PME)을 성공적으로 이행하기 위해, 프로그램과 기관은 P4 의학교육 프레임워크(선제적[proactive], 개별화된[personalized], 참여적[participatory], 예측적[predictive])16와 연계된 전략 1부터 4를 동시에 적용할 수 있습니다. 변화 리더십(Change leadership)(전략 5)은 교차적(crosscutting)인 요소로, PME를 기관 문화로 이끄는 시스템과 프로세스의 채택을 촉진합니다.

전략 1: 교육 데이터 큐레이션 (Curate Educational Data)

PME의 기초 통용 화폐는 투입(inputs, 예: 교육과정 콘텐츠, 환자 진단명 같은 교육적 노출), 산출(outputs, 예: 시험, 신뢰할 수 있는 전문 활동[EPAs], 역량), 또는 성과(outcomes, 예: 훈련 중 또는 후의 환자 성과, 전문직 배치, 인력 구성)와 같은 교육 데이터(educational data)입니다.18 교육 데이터는 학습 관리 시스템(LMS), 시뮬레이션 센터, 전자의무기록(EHRs), 외부 기관 등 다양한 출처에서 나옵니다. P4 프레임워크에 따르면, 이러한 시스템에서 데이터를 선제적으로(proactive)16 사용하는 것이 학습자의 교육적 노출, 진척도, 요구를 이해하는 열쇠입니다. 그러나 이러한 데이터는 종종 결합하기 어렵거나 특정 애플리케이션이나 데이터베이스 내에 고립(siloed)되어 있습니다. Weil과 동료들19은 통찰(insights)을 생성하는 데 필수적인 데이터 수집의 8가지 기본 원칙을 기술한 프레임워크를 제안했습니다: 관련성(relevant), 신뢰성(trusted), 일관성(consistent), 적시성(timely), 접근성(accessible), 상호작용성(interactive), 연계성(connected), 실천 가능성(actionable). 여기서 우리는 보건 전문직 훈련 프로그램의 리더들이 데이터를 큐레이션하기 위해 물어야 할 질문으로 이 원칙들을 수정하고, 이에 답하기 시작하는 방법에 대한 권장 사항을 제공합니다.

  1. 관련성(Relevant): 데이터가 귀 기관의 가장 시급하고 중요한 질문에 대한 통찰을 제공합니까? 학습자, 교수진, 그리고 전체 교육 프로그램에 가장 중요한 데이터가 무엇인지 정의하십시오. 평가 항목을 핵심 역량(core competencies) 및 교육과정 우선순위 영역에 매핑하고, 포괄성을 확인하며 중복을 제거하십시오.
  2. 신뢰성(Trusted): 데이터의 품질 보증(quality assurance)과 정확성을 위해 지속적이고 의도적으로 모니터링됩니까? 앞으로 수집해야 할 누락된 데이터 영역을 식별하고, 특히 서술형 코멘트(narrative comments)와 같은 데이터를 정기적으로 감사하여 편향(bias)의 증거를 확인하십시오.
  3. 일관성(Consistent): 데이터 요소가 표준화되어 정의되고 계산되며, 신뢰할 수 있고 중앙 집중화된 방식으로 수집됩니까? 훈련생의 진척도를 종단적으로(longitudinally) 추적할 수 있도록 평가 데이터를 수집하는 데 사용되는 프레임워크와 척도(scales)를 개선하십시오.
  4. 적시성(Timely): 통찰이 실행 가능하도록 필요한 정기성을 가지고 데이터가 업데이트됩니까? 종이 기반 또는 스프레드시트 기반 프로세스를 실시간 통합이 가능한 웹 기반 애플리케이션으로 전환하십시오.
  5. 접근성(Accessible): 적절한 이해관계자가 적시에 통찰을 이용할 수 있습니까? 분석 도구와 대시보드를 기존 워크플로우(workflows)에 구축하십시오.
  6. 상호작용성(Interactive): 이해관계자가 데이터를 탐색하고 직접 통찰을 얻을 수 있습니까? 개인 및 집단(cohort) 수준의 성과를 모두 탐색할 수 있는 대화형 대시보드(interactive dashboards)를 만드십시오.
  7. 연계성(Connected): 측정치들이 훈련의 연속체(continuum) 전반에 걸쳐 통합되어 있습니까? 학부 및 졸업 후 의학교육 훈련 데이터를 한곳에 통합하십시오.
  8. 실천 가능성(Actionable): 모든 데이터 요소가 통찰에 기여하고 전략에 정보를 제공합니까? 보고서와 대시보드를 개별 목표 설정 및 학습 계획 수립뿐만 아니라, 기관의 교육 설계 및 품질 보증 프로세스에도 사용하십시오.

데이터 수집의 우선순위를 정하고 조직한 후에는, 데이터 소스들을 교육 데이터 웨어하우스(education data warehouse)—각 학습자의 데이터를 시간 흐름에 따라, 그리고 그들에 관한 데이터를 수집하는 다수의 시스템과 측정치 전반에 걸쳐 보여주는 동적 데이터베이스—로 통합하십시오.20 교육 데이터 웨어하우스는 원시 데이터를 실천 가능한 통찰로 변환하는 데 기초가 되며, EHR과 같은 임상 학습 환경의 데이터 스트림과의 통합을 가능하게 합니다.21

 

교육 데이터 웨어하우스를 구축하려면 계획, 자원, 거버넌스, 그리고 귀 기관에서 교육 외 프로젝트를 위해 유사한 시스템을 구축하고 있을 수 있는 현지 정보 기술(IT) 리더들과의 협력이 필요합니다. 사용 가능한 기술과 플랫폼에 따라 데이터를 웨어하우스로 큐레이션하고 통합하는 데는 많은 기술적 측면이 있을 것입니다. IT 리더들과의 조기 협력은 인프라가 데이터와 함께 확장(scale)되고, 가족 교육 권리 및 개인정보 보호법(FERPA)22,23과 같은 지역, 주, 연방 정책을 준수하며 안전하게 유지되도록 보장할 것입니다.


전략 2: 데이터를 통찰로 변환하는 분석 역량 구축 (Build Analytic Capabilities to Turn Data Into Insights)

위의 8가지 원칙을 준수하는 고품질 데이터를 큐레이션하는 것은 필요하지만, PME를 실현하는 데는 충분하지 않습니다. 정밀 분석(Precision analytics)—원시 데이터를 분석, 요약, 보고하는 방법—은 PME 이니셔티브를 지원하는 시의적절한 개별화된(personalized)16 통찰을 생성하는 데 필수적입니다. PME를 이행하는 것은 학습자, 교수진, 프로그램이 각 학습자에게 맞춤화되고 이전보다 더 많은 데이터에 기반한 더 미묘한(nuanced) 교육적 결정을 내리도록 요구하는 것을 의미합니다. 학습자와 교수진은 이를 잘 수행하고 그들이 내리는 정밀한 선택의 영향을 이해하기 위해 새로운 도구가 필요할 것입니다.

 

정밀 분석은 PME를 확장하는 데 핵심입니다. 분석 이니셔티브는 "단순한 보고 및 규정 준수 기능이 아니라, 혁신의 중심(center of innovation)으로 간주되어야 합니다."19 분석 결과가 스코어카드나 대시보드24,25를 통해 공유되든 간에, 보고 과정은 통찰을 전략적 가치로 변환하고 지속적인 교육 품질 개선 시스템을 구축하는 데 중요합니다. 사려 깊은 보고는 코칭 개입(coaching interventions)26 중에 학습자를 위해 복잡한 데이터에 생명력을 불어넣고, 평가를 사용하여 학습을 개선27하는 데 필수적입니다. 정밀 분석 개발은 탄탄한 학습 분석(learning analytics) 문헌28의 교훈을 바탕으로 구축되어야 합니다.

 

기존 파트너십 및 자원 활용 (Leverage existing partnerships and resources)

  • 귀 기관의 분석 역량을 개발하는 데 도움을 줄 수 있는 인력과 파트너십을 식별하는 것으로 시작하십시오. 교육 데이터 웨어하우스와 마찬가지로, 분석 접근 방식에는 데이터 분석에 숙련된 직원, 분석 소프트웨어 시스템, 데이터 시각화 및 대시보드 플랫폼을 포함한 현지의 전담 자원과 전문 지식이 필요합니다.
  • 이들은 아마도 귀하의 기관 내에 존재할 것이며, 특히 "과학, 정보학, 인센티브, 문화가 지속적인 개선과 혁신을 위해 정렬되는" 학습 보건 시스템(learning health system) 모델29을 중심으로 점점 더 조직화되고 있는 정보학(informatics) 및 데이터 과학 동료들 사이에 있을 가능성이 큽니다.
  • 가능하다면, 혁신적인 기술들—전사적 시각 분석 플랫폼(enterprise-wide visual analytics platforms), 고성능 컴퓨팅, 보호된 정보의 사용을 허용하는 보안 생성형 AI 인스턴스—을 교육 데이터 웨어하우스에 연결하십시오. 기관 자체 평가 도구30,31를 사용하여 더 높은 수준의 분석 역량을 향한 진척도를 주기적으로 벤치마킹하십시오.

 

데이터 리터러시 증진 (Promote data literacy)

  • 개별화된 학습 및 평가 계획을 극대화하려면, 학습자와 교수진은 데이터 분석 과정을 이해해야 합니다.32 PME 이니셔티브의 목표를 명확하게 소통하는 것으로 시작하십시오. 교수진, 코치, 조언자(advisors)를 대상으로 기초 기술 평가를 수행하여 그들이 데이터와 분석을 사용하여 학습자를 지도하는 데 얼마나 익숙한지 파악하십시오. 그런 다음, 학습자와 교수진에게 PME 접근 방식을 소개하는 훈련 세션을 개최하십시오. 여기에는
    • 결과를 개별 학습자에게 적용하고 맥락화(contextualize)하는 방법,
    • 통계적 검정력(statistical power) 문제를 탐색하는 방법,
    • 부정확한 예측의 위험을 고려하는 방법,
    • 편향(bias) 및 공정성(fairness)과 관련된 경계를 촉구하는 방법,
    • AI 기반 통찰을 둘러싼 고유한 우려 사항을 논의하는 방법 등이 포함됩니다.

이러한 세션은 또한 교수진과 학습자의 진화된 역할과 기대를 전달할 기회를 제공합니다.


전략 3: PME의 원칙 있는 사용을 보장하기 위한 거버넌스 수립 (Establish Governance to Ensure Principled Use of PME)

통합된 교육 데이터와 정교한 분석은 PME 노력을 가능하게 하지만, 동시에 각 기관이 거버넌스(governance)에 대한 합의 기반 접근 방식을 사용하여 초기에 해결해야 할 문제들을 제기합니다.

  • 데이터의 소유자는 누구인가?
  • 결과 분석을 볼 수 있는 권한은 누구에게 있는가?
  • 데이터와 성과는 의학교육의 연속체 전반에 걸쳐 통합되어 있는가?
  • 정밀 개입의 공정성과 형평성을 보장하기 위해 어떤 감독(oversight)이 존재하는가?

거버넌스와 투명성은 정밀 분석 또는 개입의 최종 사용자(즉, 학습자, 교수진, 또는 프로그램)와 이니셔티브를 감독하는 교육 리더 간의 양방향 신뢰(bidirectional trust)에 뿌리를 둔 참여적인(participatory)16 PME 이니셔티브에 필수적입니다. 교육 거버넌스 그룹은 2차적으로 "발견된(found)" 데이터 사용의 적절성을 포함하여 현지 데이터가 어떻게 사용되는지 검토할 수 있습니다.33 빅데이터AI와 관련하여, 거버넌스 그룹은 편향과 기타 의도치 않은 결과(unintended consequences)의 의도적인 완화(mitigation)를 보장할 수 있습니다.34 그러나 보건 시스템 전반에 걸친 생성형 AI 도구의 빠른 배포는 가장 민첩한 교육 거버넌스 그룹조차도 어렵게 만들 수 있습니다. AI 자문 위원회에 학습자와 교육자를 포함하면 AI 도구의 의도치 않은 교육적 결과를 방지할 수 있습니다. 거버넌스 그룹은 또한 기관의 정책 및 법무 팀과의 파트너십을 통해 지역, 주, 연방 정책(예: FERPA)의 준수를 보장합니다. 그들은 데이터 큐레이션 및 분석에 대한 통일된 접근 방식을 표준화함으로써 PME 노력과 기존의 학습 보건 시스템, 품질 개선, 또는 가치 기반 의학(value-based medicine) 프로젝트 간의 연결을 촉진할 수 있습니다. 거버넌스 그룹은 의학교육 연구 등록소(medical education research registries)와 같이 신속하고 윤리적으로 수행되는 연구를 촉진하는 접근 방식을 통합하여, 의학교육 연구에서 PME 통찰을 사용하는 것에 대한 원칙과 감독을 정의해야 합니다.23,35

 

교육 데이터 웨어하우스를 만드는 과정 초기에 거버넌스 그룹을 구성하여 시작하십시오. 정책 및 전략 결정이 기술 및 데이터 아키텍처에 정보를 제공할 수 있기 때문입니다. 공식적인 거버넌스 그룹은 어떤 데이터가 PME에 사용되고 어떻게 분석되는지에 대해 교육 커뮤니티에 투명성을 제공하는 메커니즘이 될 수 있습니다. 거버넌스 그룹은 먼저 기존 교육 데이터 소스 및 분석에 대한 인벤토리를 검토해야 합니다. 이후의 정밀 개입이 참여적이 되도록 보장하기 위해, 의학교육 연속체 전반의 훈련생을 포함하여 광범위하게 대표되는 이해관계자들을 거버넌스 과정에 참여시키십시오.36 거버넌스 구조는 데이터의 윤리적 사용, PME의 공동 생산자로서 훈련생의 적극적인 참여, 그리고 데이터 기반 의사결정을 위한 응집력 있는 기관 전략을 촉진해야 합니다.37


전략 4: 타당도를 뒷받침하는 성과를 지속적으로 수집 (Continuously Collect Outcomes Supporting Validity)

보건 전문직 교육에서 타당도(validity)를 확립하는 것은 청중의 가치와 기준을 고려하여 증거에 기반한 논거(arguments)를 구성하고 평가하는 것을 포함합니다.38 PME를 이행하기 위한 핵심 논거는, 표적화된(targeted) 학습 경험이 천편일률적인(one-size-fits-all) 교육 접근 방식보다 역량 도달을 더 효율적으로 이끈다는 것입니다. 더 나아가, PME 패러다임은 정밀 개입이 의미 있는 학습자 또는 환자 성과를 예측할 수 있어야(predictive)16 한다고 주장합니다. 이러한 주장을 뒷받침할 타당도 증거를 수집하는 것은 PME 이니셔티브가 달성하고자 하는 구체적인 학습자, 프로그램, 환자 성과를 명확히 정의하는 것에서 시작됩니다. 이러한 프로그램 평가 성과는 귀 기관의 목표 및 학습자의 요구와 일치하는 평가 프로그램(program of assessment)을 직접적으로 형성해야 합니다.

 

다양한 증거 수집 (Gather varied evidence)

  • 각 학습자에 대한 더 명확한 그림을 얻기 위해 형성적(formative) 및 총괄적(summative), 인간 평가자 기반 및 AI 기반,42 그리고 학습자 지향적 및 환자 지향적 평가를 포함한 다양한 평가를 수행하여 시작하십시오.39–41 타당도 증거를 수집하는 과정은 지속적인 노력, 끊임없는 개선의 문화, 그리고 실수로부터 배우려는 열망을 필요로 합니다.
  • 다행히도, PME 이니셔티브를 위해 개발된 기초적인 데이터 및 분석 역량은 타당도 증거의 수집 및 분석—이상적으로는 자동화되고 확장 가능한 방식—도 지원합니다. 또한, 모든 이해관계자로부터 질적 피드백(qualitative feedback)을 수집하는 것은 PME 이니셔티브가 명시된 목표에 대비해 모니터링하여, 목표와 일치하고 이해관계자의 요구에 적응하도록 보장하는 데 필수적입니다.
  • 거버넌스와 마찬가지로, 투명성과 책임성(accountability)에 전념하여 이니셔티브가 시간이 지남에 따라 개선되고 학습자와 기관에 긍정적인 영향을 미치고 있음을 입증하십시오.

 

예측적 연결고리 연구 (Study predictive linkages)

  • PME 개입과 성과 사이의 예측적 연결고리를 결정하는 것은 다수의 수반되는 노출, 교란 변수(confounding), 통계적 검정력 문제로 인해 어렵습니다.43 가능하다면 인과 추론(causal inference) 접근 방식을 적용하는 연구 설계 및 통계 분석을 사용하십시오.44
  • 예를 들어, 학습자의 임상 추론을 개선하고 진단 오류를 줄이는 데 관심이 있는 프로그램은 교수진 평가, 시뮬레이션, EHR 기록45의 다중 모드(multimodal) 평가를 통합하여 진단 영역별로 계층화된 각 학습자의 동적 프로필을 생성할 수 있습니다.
  • 환자 또는 로테이션 수준에서 무작위 배정(randomization)으로 배포된 PME 개입은 각 학습자의 결핍을 표적으로 삼을 수 있습니다. 개선된 학습자 성과(예: 더 높은 총괄 평가 성적)와 환자 성과(예: 초기 진단과 최종 진단 공식화 간의 더 높은 일치도)는 PME 접근 방식에 대한 강력한 타당도 증거를 제공할 것입니다.

전략 5: PME를 추진하기 위한 변화 주도 (Lead Change to Drive PME Forward)

변화 관리(change management) 또는 리더십(leadership)46은 PME 이니셔티브를 이행할 때 결정적인데, 이는 기관의 목표, 프로세스, 기술의 변혁(transformation)을 다루는 체계적인 접근을 보장하기 때문입니다. 대부분의 보건 전문직 프로그램과 기관은 급격한 혁신에 대해 위험 회피적(risk averse)이며, 특히 외부 인증기관들이 과감한 변화보다 안정성을 우선시한다는 점을 고려할 때 더욱 그렇습니다. PME의 기술적, 시스템적 혁신을 성공적으로 이행하려면 강력한 이행 풍토(implementation climate)47가 필요합니다. 변화 리더십은 이러한 이행 준비 상태(readiness)를 달성하는 데 핵심이며, 이것 없이는 기관들이 PME를 이행하려다 혼란에 빠질 위험이 있습니다.48 변화 리더십은 P4 프레임워크와 연계된 전략 1에서 4를 관통합니다.

 

PME 운영 그룹 구성 (Assemble a PME steering group)

  • 전략 1~4를 감독하는 훈련생, 의학교육 리더, 데이터 과학 및 AI 전문가를 포함한 영향력 있는 이해관계자들의 구심점 연합(guiding coalition)인 PME 운영 그룹(steering group)을 구성하십시오. 운영 그룹의 일부 구성원은 공식 PME 거버넌스 그룹에서 활동할 수도 있지만, 운영 그룹은 PME 이행의 전반적인 전략과 과정을 주도해야 합니다.
  • 운영 그룹은 PME 접근 방식을 통해 해결할 수 있는 교육 프로그램의 격차를 식별하고 부각시켜 PME 이니셔티브에 대한 긴박감(urgency)을 조성해야 합니다. 교육과정, 평가 프로그램, 지도(advising) 프로그램의 미래에 대한 명확한 비전(vision)을 개발하고, 이 비전을 모든 이해관계자에게 효과적으로 전달하십시오.
  • PME 이니셔티브 이행을 방해할 수 있는 장애물을 식별하여 해결하고, 단기적인 성과(short-term wins)를 축하하여 모멘텀을 구축하십시오. 지속적으로 새로운 개선 기회를 식별하고 필요에 따라 변화 리더십 전략을 조정하십시오.
  • 변화가 기관의 문화에 통합되고 일상적으로 수행되는 방식의 일부가 되도록 보장하십시오. 여기에는 정책 업데이트, PME 이행 마일스톤의 정기적 검토, 성과에 대한 책임성 개발이 포함될 수 있습니다. 전체 PME 전략과 분석, 통찰, 개입이 이해관계자, 특히 학습자의 의견을 반영하여 설계되는 공동 창조(co-creation)49,50의 문화를 조성하십시오.36

 

집단적 역량 확보 (Ensure collective competence)

  • 마지막으로, PME 이니셔티브를 이행하려면 데이터 웨어하우징, 대시보드 제작, 분석, 정보학, AI 기술을 갖춘 전문가를 모집해야 합니다. 이 모든 기술을 갖춘 개인은 거의 없습니다. 대신, 기관은 데이터 웨어하우스를 큐레이션 및 유지 관리하고, 분석 및 데이터 시각화를 생성하며, 개입의 타당도와 영향을 평가하고, 전반적인 PME 이니셔티브를 관리할 수 있는 집단적 역량(collective competence)을 갖춘 팀을 구성해야 합니다.
  • 적합한 인력을 구성하는 것은 자원, 조직 구조, 사용 가능한 내부 협력자에 따라 달라질 것입니다. 내부 기술 전문가들은 프로그램의 교육 사명과 데이터에 익숙하지 않을 수 있으므로, 현지의 맥락, 가치, 목표에 대해 교육하십시오. 동시에, 이러한 전문가들이 PME를 운영하기 위해 사용할 접근 방식에 대해 현지 교수진 리더들을 교육할 기회를 만드십시오.

결론 (Conclusion)

PME의 성공적인 이행은 데이터 큐레이션, 분석 역량 구축, 원칙 있는 거버넌스, 지속적인 성과 평가, 효과적인 변화 리더십을 아우르는 포괄적인 기관 전략을 요구합니다. 프로그램과 관련된 원칙 및 우선순위와 일관되게 교육 데이터를 통합하기 위한 로드맵을 만드는 것은 중요한 출발점입니다. 분석, 시각화, 대시보드 제작에서 기관의 역량을 개발하려면 세심한 계획, 교육 및 정보학 리더 간의 긴밀한 협력, 그리고 자원이 필요합니다. PME 이니셔티브 초기에 거버넌스를 수립하면 전략이 현지 목표와 일치하고, 정책을 준수하며, 실행 가능성을 유지하고, 학습자를 공동 창조자(co-creators)로 참여시키도록 보장할 것입니다. 의미 있는 성과의 엄격한 측정은 PME 접근 방식에 대한 타당도 논거를 뒷받침하고 추가 자원을 옹호(advocate)하기 위해 필요합니다. 마지막으로, 이 각 전략은 PME를 포용하는 문화를 구축하기 위해 변화 리더십에 의존합니다. 일단 운영되면, PME는 학습자에 대한, 그리고 학습자에 의한 정밀하고 증거에 기반한 의사결정(evidence-informed decision-making)을 가능하게 하여, 학습자의 역량 도달 경로를 최적화하고 교수진, 코치, 교육 리더들을 지원할 것입니다.

 

 

그림 1 번역 (Figure 1 Translation)

P4 프레임워크 요소 전략 및 세부 실행 방안
선제적(Proactive) 전략 1: 데이터 큐레이션 (Data Curation)
• 8가지 데이터 원칙 적용
• 교육 데이터 웨어하우스(EduDW)에 종단적 데이터(longitudinal data) 통합
개별화된(Personalized) 전략 2: 분석 (Analytics)
• 필요한 자원 및 기술 식별
• EduDW를 대시보딩(dashboarding)AI에 연결
• 이해관계자를 대상으로 데이터 리터러시(data literacy) 교육
참여적(Participatory) 전략 3: 거버넌스 (Governance)
• 거버넌스 그룹을 조기에 구성
• 훈련생(trainees)을 포함한 모든 이해관계자를 투명하게 참여시킴
예측적(Predictive) 전략 4: 타당도 검증 (Validation)
• 평가 프로그램(program of assessment)을 PME 이니셔티브의 목표와 일치시킴
• 개입(interventions)을 성과(outcomes)와 연결

오른쪽 측면 (전체를 포괄하는 요소):

  • 전략 5: 변화 리더십 (Change Leadership)

하단 캡션 번역:

그림 1: 정밀 의학교육(PME)을 성공적으로 이행하기 위해, 프로그램과 기관은 P4 의학교육 프레임워크(선제적[proactive], 개별화된[personalized], 참여적[participatory], 예측적[predictive])16와 연계된 전략 1부터 4를 동시에 적용할 수 있습니다. 변화 리더십(Change leadership)(전략 5)은 교차적(crosscutting)인 요소로, PME를 기관 문화로 이끄는 시스템과 프로세스의 채택을 촉진합니다.


그림 설명 및 요약

이 그림은 논문에서 제안하는 정밀 의학교육(PME) 구현을 위한 로드맵을 시각적으로 보여줍니다. 구조는 다음과 같이 이해할 수 있습니다.

  1. 왼쪽 (P4 Framework): PME가 갖춰야 할 4가지 핵심 속성(Proactive, Personalized, Participatory, Predictive)을 나열하고 있습니다. 이는 PME의 '이론적 기반'입니다.
  2. 중앙 (Strategies 1-4): 각 P4 속성을 달성하기 위한 구체적인 '실행 전략'을 매칭했습니다.
    • 선제적(Proactive)이기 위해서는 데이터를 미리 잘 정리하고 모아야 하므로 데이터 큐레이션 필요합니다.
    • 개별화(Personalized)하기 위해서는 데이터를 해석하여 개인에게 맞는 통찰을 줘야 하므로 분석(Analytics) 역량이 필요합니다.
    • 참여적(Participatory)이기 위해서는 데이터 사용의 규칙을 정하고 모두가 신뢰할 수 있어야 하므로 거버넌스(Governance)가 필요합니다.
    • 예측적(Predictive)이기 위해서는 교육적 개입이 실제로 결과로 이어지는지 확인해야 하므로 타당도 검증(Validation)이 필요합니다.
  3. 오른쪽 (Strategy 5): 변화 리더십(Change Leadership)이 가장 오른쪽에 큰 괄호처럼 배치되어 1~4번 전략 전체를 감싸고 있습니다. 이는 기술적/절차적 전략(1~4번)만으로는 부족하며, 조직 문화를 바꾸고 이니셔티브를 지속 가능하게 만드는 리더십이 모든 단계에 걸쳐 필수적으로 작용해야 함을 의미합니다.

 

 

 

Acad Med. 2024 Apr 1;99(4S Suppl 1):S1-S6. doi: 10.1097/ACM.0000000000005609. Epub 2023 Dec 18.

Foreword: The Next Era of Assessment and Precision Education

 

 

[의학교육 트렌드] '머니볼'이 의대로? 정밀 교육(Precision Education)과 평가의 새로운 시대 🏥📊

안녕하세요! 오늘은 의학 교육계에서 아주 뜨거운 화두를 던지고 있는 논문 하나를 소개해드리려고 해요. 바로 "평가와 정밀 교육의 다음 시대(The Next Era of Assessment and Precision Education)"라는 서문(Foreword)입니다. 지금까지 의대에서의 '평가'가 단순히 합격과 불합격을 가르는 관문이었다면, 앞으로는 완전히 다른 모습으로 진화할 거라는 전망인데요. 핵심 키워드는 바로 정밀 교육(Precision Education, PE)입니다.


1. 평가는 왜 하는 걸까요? (Why Assessment?) 🤔

가장 먼저 저자들은 평가의 목적부터 다시 정의합니다. 단순히 지식을 테스트하는 게 아니라, 환자에게 질 높고 공평한 진료를 제공할 수 있는지 확인하는 것이 평가의 본질이라는 거죠.

연구진은 이렇게 강조합니다.

"이 증보판은 의학 교육 평가의 다음 시대에 대한 비전을 제시하며, 그 핵심은 평가가 왜 수행되는지에 있습니다. 즉, 학습자들이 고품질의 형평성 있는 환자 진료를 제공할 준비가 되도록 학습 성과를 달성하게 보장하는 것입니다."

"This supplement offers a vision for the next era of medical education assessment that centers on why assessment is done, namely, to ensure that learners achieve the learning outcomes that prepare them to provide high-quality, equitable patient care."

 

여기서 형평성 있는 진료(Equitable Care)란 환자의 성별, 인종, 사는 곳, 재산에 상관없이 똑같이 좋은 진료를 받는 것을 말해요. 이게 바로 정밀 교육이 지향하는 '북극성(North Star)'입니다. ⭐


2. 정밀 교육(Precision Education), 그게 뭐죠? 🎯

환자마다 유전자에 맞춰 치료하는 '정밀 의학'처럼, 교육도 학습자 개개인에게 딱 맞춘 정밀 교육(PE)이 필요하다는 개념입니다.

어떻게 가능하냐고요? 바로 데이터(Data)기술(Technology) 덕분입니다.

"이 증보판은... 데이터와 기술을 활용하여 개인화, 효율성, 그리고 학습자 주도성을 향상시킴으로써 평생 학습을 변화시키는 정밀 교육(PE) 시스템의 개발과 구현을 중심으로 하는 평가의 시대를 제안합니다."

"...this supplement proposes an era of assessment that centers around developing and implementing a precision education (PE) system that uses data and technology to transform lifelong learning by improving personalization, efficiency, and learner agency."


3. 야구의 '머니볼'처럼! 데이터가 핵심 통화 ⚾💰

이 논문에서 아주 재미있는 비유가 나옵니다. 바로 메이저리그 야구(MLB) 이야기인데요. 예전에는 스카우터의 '감'으로 투수를 평가했다면, 지금은 회전수, 공의 궤적 등 고밀도 데이터(High-density data)를 센서로 측정해서 평가하잖아요? 의학 교육 평가도 이렇게 바뀌어야 한다는 겁니다.  단순히 교수님의 주관적인 관찰 평가를 넘어, 전자의무기록(EHR) 메타데이터나 웨어러블 기기, 햅틱 센서 등을 활용해 학습자의 수행 능력을 아주 정밀하게 측정해야 한다는 거죠.

"PE 모델에서 데이터는 필수적인 통화입니다."

"In the PE model, data are the essential currency."


4. AI와 빅데이터의 만남 🤖📈

이렇게 모인 방대한 데이터는 인간이 혼자 분석하기 힘들죠. 그래서 인공지능(AI)과 거대 언어 모델(LLMs)의 역할이 필수적입니다.

예를 들어, 앰비언트 리스닝(Ambient Listening) 기술을 써서 학생이 환자와 어떻게 소통하는지 분석하거나, AI가 실시간으로 피드백을 주는 방식이 가능해질 것입니다. 물론 이 과정에서 AI가 편향된(Biased) 판단을 하지 않도록 감시하는 것도 중요하고요!


5. 넘어야 할 산: '기술적 문제'가 아니라 '적응적 도전' 🏔️

하지만 이 멋진 비전을 실현하려면 돈도 많이 들고, 사람들의 생각도 바뀌어야 합니다. 저자들은 이것을 단순한 기술적 문제(Technical Problem)가 아니라, 훨씬 복잡하고 해결하기 어려운 적응적 도전(Adaptive Challenge)이라고 말합니다.

"이 작업은 전문가의 명령으로 이루어질 수 없으며, 대신 신념, 역할, 관계 및 접근 방식의 변화로 인해 제기되는 도전을 해결하는 데 있어 이해관계자와 자원의 합심한 투자를 필요로 합니다."

"This work cannot be done by the edict of experts but instead requires concerted investment of stakeholders and resources in addressing the challenges posed by changes in beliefs, roles, relationships, and approaches."


🚀 마치며: 변화를 위한 행동 촉구 (Call to Action)

결국 이 논문은 우리에게 "지금의 시스템으로는 부족하다, 과감하게 투자하고 변화하자"라고 외치고 있습니다.

의대 학장님들, 교수님들, 그리고 정책 입안자들에게 보내는 강력한 메시지로 글을 마무리해 봅니다.

"우리 학습자의 궤적과 그들이 제공하는 진료는 고품질의 형평성 있는 평가에 대한 헌신으로 변화될 수 있습니다."

"The trajectory of our learners and the care they provide can be transformed with a commitment to high-quality equitable assessment."

 


 

이 증보판(supplement)은 의학 교육 평가의 다음 시대에 대한 비전을 제시하며, 그 핵심은 평가가 수행되는지에 있습니다. 즉, 학습자들이 고품질의 형평성 있는 환자 진료(high-quality, equitable patient care)를 제공할 준비가 되도록 학습 성과(learning outcomes)를 달성하게 보장하는 것입니다.1 여기서 형평성 있는 진료(equitable care)란 성별, 인종, 거주 지역, 사회경제적 지위와 같은 개인적 특성으로 인해 진료의 질이 달라지지 않는 것을 의미합니다.2 이러한 학습 성과를 달성하기 위해, 이 증보판은 데이터와 기술을 활용하여 개인화(personalization), 효율성(efficiency), 그리고 학습자 주도성(learner agency)을 향상시킴으로써 평생 학습을 변화시키는 정밀 교육(precision education, PE) 시스템의 개발과 구현을 중심으로 하는 평가의 시대를 제안합니다.3 이 증보판에 실린 논문들은 다음의 3가지 주제 영역을 탐구합니다:

  1. 개인화되고, 지지적이며, 고품질이고, 형평성 있는 평가와 환자 진료에 대한 비전;
  2. 효율적이고 효과적인 평가와 평생 학습을 변화시키고 개인화하기 위해 데이터와 기술을 활용하는 기반(foundations); 그리고
  3. 효율적이고 효과적인 평가와 학습을 변화시키고 개인화하기 위해 데이터와 기술을 활용하는 사례들.

역량 바탕 의학 교육의 요구에 응답하며 (Answering the Call of Competency-Based Medical Education)

 

역량 바탕 의학 교육(Competency-based medical education, CBME)은 최근 제한적인 의미 있는 시범 운영4–6과 함께 이루어지던 이론적 논의의 우세에서 벗어나, 여러 국가와 전문 분야에서 다수의 대규모 국가적 이행 노력으로 전환되었습니다.7,8 핵심적으로 CBME는 환자 중심(patient-focused)과 학습자 중심(learner-centered)이라는 두 가지 개념으로 정의될 수 있습니다.9–11 CBME는 '끝(목표)'을 염두에 두고 시작합니다. 즉, 환자와 인구 집단이 무엇을 필요로 하는가? 이에 대한 답을 바탕으로, CBME는 그러한 환자의 요구와 일치하는 훈련 성과(training outcomes)를 정의하고, 그러한 훈련 성과가 충족되도록 보장하는 교육과정과 평가를 설계합니다.10 교육과정과 평가—사실상 훈련 프로그램 전체—는 CBME 안에서 학습자 중심이어야 하며, 학습자들이 자신의 교육 과정을 통제할 수 있게 해야 합니다. 그들이 학습하는 환경은 시간의 흐름에 따라 역량과 기술을 의도적으로 순서화하여, 그들이 발달의 다음 단계로 나아가도록 도와야 합니다.9,11

 

이러한 숭고한 목표에도 불구하고, 개인들은 환자가 필요로 하는 진료를 제공하는 기본적인 능력에 격차(gaps)를 가진 채 훈련 프로그램을 졸업하고 있으며,12–15 이는 저품질(low-quality)16,17 및 불평등한 진료(inequitable care)18로 이어집니다. 현재의 의학 교육 상태와 CBME의 목표 사이의 이러한 괴리(chasm)에는 훈련 프로그램의 자원 부족, 학습자 중심이 아니며 원치 않는 변동성을 가진 평가 관행의 사용 등 여러 근본 원인이 있습니다.19,20 학습자들이 환자가 필요로 할 진료를 제공하기 위해 자신의 발달 과정에서 확실하고 연속적인 단계들을 밟아나가도록 보장하기 위해서는 근본적으로 다른 평가 시스템이 필요합니다.

 

평가와 정밀 교육(PE)의 다음 시대 구상 (Envisioning the Next Era of Assessment and PE)

 

이전 연구21를 바탕으로, Desai와 동료들은 다양한 양식의 데이터 입력(multimodal data inputs)에 고급 분석(advanced analytics)을 적용하여 통찰(insights)을 생성하고, 이를 통해 정밀 개입(precision interventions)을 주도하는 PE의 개념적 프레임워크를 발전시킵니다.3

  • 성과는 끈기 있게 평가되고, 격차는 재평가되며, "주기(cycle)"는 반복됩니다.
  • 이러한 주기는 개인, 팀, 프로그램 또는 조직 등 여러 수준(levels)22에서 발생할 수 있으며,
  • 이는 성과 평가와 시스템 사고(systems thinking)에 대한 현대적 개념화를 반영합니다.23–25

 

만약 PE가 달인 적응 학습자(master adaptive learner, MAL) 주기나 지속적 질 향상(continuous quality improvement)26,27과 같은 다른 개선 모델들과 처음 보기에 비슷하게 들린다면, 그것은 의도된 것입니다. PE는 이러한 검증된 프레임워크들과 시스템 과학(systems science)을 바탕으로 구축되어, 입력, 통찰, 개입, 성과의 주기를 통해 학습자가 제공하는 진료를 개선하고자 의도적으로 노력합니다. 초기의 PE 프레임워크가 진화함에 따라, 이는 의학 교육 커뮤니티로부터 지속적인 강화와 개선을 필요로 할 것입니다. 동시에, PE는 이 증보판의 저자들이 설명하는 여러 대담하고 새로운 방향으로 의학 교육을 이끌고 있으며, 우리는 다음으로 이를 주제별로 탐구합니다.

 

고품질의 형평성 있는 학습자 평가를 통한 고품질의 형평성 있는 진료 (High-quality equitable care through high-quality equitable learner assessment)

 

의학 교육 평가의 이전 시대가 평가가 어떻게(how) 수행되는지에 의해 정의되었다면, Schumacher와 동료들은 평가의 다음 시대는 평가가 왜(why) 수행되는지에 의해 정의되어야 한다고 주장합니다: 바로 고품질의 형평성 있는 환자 진료를 보장하기 위해서입니다.1 우리는 고품질 진료는 형평성 있는 진료(high-quality care is equitable care)라는 점에 동의해야 하며, 이것을 PE의 북극성(North Star)으로 삼아야 합니다. PE 주기의 모든 요소 전반에 걸쳐 건강 형평성(health equity)을 전면에 내세우는 것은 의학에 깊이 뿌리 박힌 구조적 인종차별과 해로운 편향 및 불평등에 대한 비판적 재평가를 요구할 것입니다.28 우리의 관점에서 모든 불평등은 불공정하고 부당하며 반드시 해결되어야 합니다.

 

불행하게도, 해로운 편향과 불평등은 평가 노력의 "직물(fabric)"에도 너무 자주 짜여 있습니다.29–32 따라서 고품질의 형평성 있는 학습자 평가가 필요합니다. 이는

  • "모든 [학습자]가 의학 분야에서의 미래 성공을 예측하는 성취 입증에 근거하여 학습하고, 평가받고, 코칭받고, 등급이 매겨지고, 진급하고, 졸업하고, 후속 기회에 선발될 공정하고 치우치지 않은 기회를 가지며, 학습 경험이나 평가가 학습자나 평가자의 개인적 또는 사회적 특성과 관련된 구조적 또는 대인 간 편향에 의해 부정적인 영향을 받지 않는 것"입니다.33

Marcotte와 동료들은 평가 개발 및 실행에서의 투명성(transparency)이 이 목표를 달성하는 중요한 수단이라고 언급합니다.34 새롭게 부상하는 평가 노력의 직물에 형평성을 짜 넣기 위해서는 개념부터 설계, 실행, 유지 관리에 이르기까지 학습자와의 공동 창조(cocreation)가 필요할 것입니다.34,35 마찬가지로, 평가를 환자 진료 중심으로 고정하려면 환자와 가족을 참여시켜야 하지만, 평가 노력에 환자와 가족의 의미 있는 참여를 상세히 기술한 노력은 소수에 불과합니다.36–38

 

형평성이 PE 시스템에 어떤 영향을 미치는지 더 잘 이해하기 위해, 우리는 이 증보판에 논문을 기고하는 모든 저자에게 형평성을 전면에 내세우고 훈련생(trainees)을 논문 공동 개발에 참여시키도록 요청했습니다. 이는 가변적으로 달성되었는데, 이는 의학 교육 내 과소 대표성(underrepresentation), 다양성·포용성·소속감을 증진하는 동료들의 고립(siloing), 그리고 훈련생들을 그들을 위하고 그들에 관한 바로 그 작업으로부터 소외시키는 것과 같은 구조적 도전을 반영하는 상존하는 한계와 어려움을 상기시켜 주었습니다. 한 분야로서, 의학 교육은 갈 길이 멉니다.

 

평가 프로그램에 대한 구조적 접근 방식을 재고하고 다양한 학습자와 환자를 공동 생산(coproduction)에 참여시키는 것만으로는 해로운 편향, 불평등 또는 공정성 결여가 발생하는 사건을 예방할 수 없습니다. 적절한 예로, 임상 실습 학생에 대해 젠더나 인종에 기반한 편향이나 불평등을 영속화하는 언어를 사용하여 서술형 코멘트(narrative comments)를 입력하는 일선 임상 교육자와, 이러한 코멘트가 학생들의 전공의 지원서로 전파되는 경우를 들 수 있습니다. 이를 해결하기 위해, Thoma와 동료들은 잠재적으로 편향된 언어가 감지될 때 실시간으로 평가자에게 알림(prompt)을 줄 수 있는 강력하고 새로운 인공지능(AI) 도구가 어떻게 부상하고 있는지 언급합니다.39 이러한 접근 방식은 우선순위가 되어야 하며 자원이 지원되어야 합니다.

 

확장 가능한 정밀 평가: 고밀도, 학습자 귀속 성과 데이터 (Scalable precision assessment: high-density, learner-attributable performance data)

 

PE 모델에서 데이터는 필수적인 통화(currency)입니다. 학습자와 환자는 자신의 데이터를 소유하며, 이는 훈련이나 임상 진료의 임의적인 사일로(silos)를 넘나들어야 합니다. 윤리적 원칙을 수립하고 상호운용성 표준(interoperability standards)을 시행함으로써, 학습자와 환자 데이터는 파편화된 의학 교육 생태계에 존재하는 다양한 주체와 제품을 가로질러 흐를 수 있습니다.3,40

 

고품질의 형평성 있는 진료를 예측하는 선제적이고 표적화된 개입을 주도하는 데 필요한 정밀성을 달성하기 위해서는, 우리가 학습자에 대해 수집하는 데이터의 밀도(양)와 품질이 증가해야 합니다. 기존의 CBME 이행 노력들이 학습자 중심성보다는 학습자의 해악이나 부담을 초래하는 평가라는 경고성 사례를 제공하기 때문에, 이러한 전망은 벅차게 느껴집니다.20,41 그러나 이러한 경고성 사례들은 인간 평가자에게 과도하게 의존하지 않는, "발굴된(found)" 데이터와 목적에 맞는(fit-for-purpose) 데이터를 포함한 새로운 신뢰할 수 있는 평가 데이터 소스를 식별할 필요성을 더욱 강조합니다. 가장 중요한 것은, 데이터가 피드백과 개선을 위해 사용될 수 있는 학습자에 대한 의미 있는 통찰을 이끌어내야 한다는 것입니다.

 

Kinnear와 동료들은 유익한 비유를 상세히 설명합니다: 프로 스포츠(구체적으로 메이저 리그 야구)가 인간의 스카우팅에만 전적으로 의존하던 것에서 개별 성과의 가장 세분화된 단위를 평가하기 위해 첨단 기술을 사용하는 것으로 어떻게 변화했는지에 대한 것입니다.42 예를 들어 투구 성과는 한때 스카우팅 평가와 승/패와 같은 다요인적인 경기 수준의 결과로만 측정되었습니다. 이러한 측정치들은 여전히 중요하지만, 기술의 혁신은 속도, 움직임, 회전수 등과 같은 정교한 투구 수준의 측정으로 이어졌습니다. 투수는 이러한 새로운 측정치들에 대해 완전한 통제권을 가지며(즉, 타자의 성과, 심판의 콜, 또는 구장 구조에 영향을 받지 않음), 이는 인간의 개입 없이 평가됩니다. 이 비유는 개인 및 팀 성과의 객관적 지표를 식별하는 의학 훈련 평가의 모델을 보여줍니다.

 

물론, 실제 임상 학습 환경에서 학습자를 평가하는 것은 규칙, 환경, 목표가 모두 (대체로) 정적인 야구 경기와는 매우 다릅니다. 그럼에도 불구하고, 인간 평가자 유래 평가를 보강하기 위해 현대 기술을 사용하여 개별 성과에 대한 훨씬 더 고밀도의 측정치를 포착하는 야구의 진화는 시사하는 바가 큽니다. 전공의 민감 품질 지표(Resident Sensitive Quality Measures, RSQMs) 실시간 훈련생 귀속 및 자동화 가능 진료 평가(TRainee Attributable & Automatable Care Evaluations in Real-time, TRACERs)43–46와 같은 의학 교육의 새로운 성과 측정치들은, 단일 학습자에 대한 상당한 귀속성(attribution)을 가지면서도 그 자체로 환자 진료에 의미가 있는 측정치에 초점을 맞춤으로써 이러한 방향으로 나아가는 발걸음을 내딛고 있습니다.

 

그러나 전자의무기록(EHR) 메타데이터, 모션 캡처, 웨어러블 및 햅틱 장치 등을 통한 훨씬 더 세분화된(granular) 측정치 또한 필요합니다. 당연히 이러한 노력은 투명성뿐만 아니라 동의(consent), 승낙(assent) 또는 해당 상황에서 선택 해제(opt out)할 수 있는 능력과 함께 이루어져야 할 것입니다.

  • Garibaldi와 동료들은 실시간 위치 서비스 배지를 사용하여 전공의들의 침상 옆, 의국, 또는 회진 시 시간을 정량화하는 다기관 노력을 설명합니다.40 이러한 기술은 학습자에 대해 자릿수가 다른(orders of magnitude more) 데이터(43명의 전공의에 대해 1년 동안 95,000시간 이상)를 포착하여, 임상적으로 의미 있는 전공의 간 차이를 드러냅니다.47
  • 이 증보판의 두 논문은 갑상선 또는 유방 촉진에 대한 객관구조화진료시험(OSCEs)과 같은 기존의 표준화된 임상 과제 수행 중 훨씬 더 세분화된 성과 평가를 달성하기 위해 햅틱(haptics)을 사용하는 접근 방식을 설명합니다.48,49 유방을 촉진하는 데 사용된 측정된 힘은 단독으로는 규범적으로만 해석될 수 있지만, 의미 있는 환자 결과(예: 종괴 탐지에 대한 양성 우도비)와 연결될 때, 그러한 측정치는 성과 평가와 적시 피드백을 위한 강력하고 정밀한 도구가 됩니다.

개별 학습자에 대한 평가의 밀도와 정밀성을 높이려는 이러한 노력은 평가의 다음 시대를 위한 필수적인 구성 요소입니다. 추가적으로, Sebok-Syer와 동료들이 탐구하듯이, 상호의존적인 팀 기반 효과(interdependent team-based effects)를 이해하고 측정하는 것이 필수적일 것입니다.50 상호의존성이 훈련 전반에 걸쳐 학습자 성과를 어떻게 형성하는지 측정하는 것은 팀 성과를 측정하는 것뿐만 아니라, 상호의존성에 의해 주도되는 것으로 보이는 학습자의 미래 진료 패턴을 지속적으로 형성할 중요한 시기를 식별하는 데 특히 영향력이 있을 수 있습니다. 프로그램 수준의 성과를 설명하기 위해 팀들이 어떻게 뭉치는지 이해하기 위해 한 단계 더 "고리(ring)" 밖으로 나가는 것 또한 근본적으로 다른 사고를 필요로 할 것입니다.22

 

AI: 빅데이터에서 통찰을 수집하기 위한 분석의 동력 (AI: powering analytics to gather insights on big data)

 

새롭게 부상하는 고밀도 평가 데이터 스트림은 "빅데이터"의 6V: 규모(Volume), 속도(Velocity), 다양성(Variety), 정확성(Veracity), 가변성(Variability), 가치(Value)와 관련된 시기적절한 통찰을 생성하는 데 있어 도전 과제들을 수반합니다.51 점점 더 복잡해지고 종종 다수준 모델(multilevel models)로 내포된(nested) 이러한 측정치들을 설명하는 통계적 접근 방식이 최근 기술되었으며, 평가자 효과(rater effects)를 통제하기 위해 평가를 조정하는 접근 방식도 기술되었습니다.52,53 우리는 이러한 접근 방식들을 팀, 상대방, 구장 효과를 설명하는 분석법을 성공적으로 개발한 야구의 사례와 유사하다고 봅니다.

 

AI는 확실히 필수적일 것입니다. 생성형 AI 및 기타 기술의 숨 막히는 변화 속도를 인식하며, Turner와 동료들은 AI가 이러한 데이터 스트림을 수집, 분석 및 개입하는 데 어떻게 사용될 수 있는지에 대한 비전을 공유합니다.54 이전에 "블랙박스"였던 모델의 설명 가능성(explainability)과 관련된 문제들이 빠르게 해결되고 있는 반면, 편향의 전파에 대한 관심 증가는 중요한 원칙과 가드레일(guardrails)로 이어졌습니다. Thoma와 동료들은 "발굴된(found)" 데이터에 AI 모델을 적용하는 것의 약속과 위험을 더 깊이 탐구하며, 타당도(validity), 동의, 원치 않는 편향과 관련된 위협을 강조합니다.39

 

ChatGPT와 같은 기술이 기반을 둔 거대 언어 모델(LLMs)은 빠르게 발전하고 있습니다. 우리는 LLM이 오디오 및 텍스트와 같이 이전에는 분석하기 어려웠던 데이터 유형에 대한 정교한 분석을 향후 몇 년 내에 의학 교육에서 일반적인 것으로 만들 것이라고 예상합니다. 임상 환경에서의 LLM 배포는 의심할 여지 없이 이전에는 지지될 수 없었던 학습자 평가에 사용될 수 있는 새로운 데이터 스트림을 생성할 것입니다. 예를 들어 앰비언트 리스닝(ambient listening) 도구에서 나오는 환자-의사 의사소통 패턴과 같은 것입니다.55 이러한 데이터가 우리 학습자에 대한 고품질의 형평성 있는 평가를 제공하고, 나아가 우리 졸업생들이 고품질의 형평성 있는 진료를 제공하도록 보장하는 데 어떻게 사용될 수 있는지를 고려하는 것이 중요할 것입니다. 마찬가지로, Segment Anything56과 같은 새로운 AI 도구들은 컴퓨터 비전(computer vision)을 변화시켰으며, 결국 컴퓨터 보조 비디오 분석을 통해 "관찰 가능한" 전문 활동(observable professional activity)이 무엇인지를 증강시킬 수 있습니다.57

 

초학제적 협력을 통한 이론에 기반한 이행 (Theory-grounded implementation through transdisciplinary collaboration)

 

고립된 평가 혁신을 넘어 정밀 평가 시스템을 완전히 실현하기 위해서는 이론에 기반한 이행(theory-grounded implementation) 노력과 초학제적 협력(transdisciplinary collaboration)이 필요할 것입니다.

  • Drake와 동료들은 여러 PE 개입과 이행 노력이 검증된 접근 방식에 기반하도록 하기 위해 적용된 기저 이론 및 디지털 도구들을 설명합니다.58
    • 그들이 검토한 이론들(MAL, 전환 학습, 자기 결정) 외에도,
      • PE에 적용 가능한 다른 이론으로는 인지 부하 이론(예: 개별 학습자의 인지 부하 용량에 맞춰 경험을 개인화),59,60 상황 인지 이론(예: 맥락을 평가에 통합),61 그리고 사회 학습 이론(예: 지속적인 고품질 진료 패턴을 위해 전문직 간 상호작용을 평가하고 활용하는 방법 이해)62,63 등이 포함될 수 있습니다. 마찬가지로,
    • 대시보드와 넛지 전략 외에도 PE를 발전시킬 도구에는
      • 디지털 건강 기기(예: 웨어러블64 및 센서65), 적응형 학습 플랫폼, 가상 및 증강 현실(VR/AR),66,67 게이미피케이션(gamification),68 그리고 LLM 챗봇 기반 튜터 및 코치(예: https://hpe-bot.com)69가 포함될 것입니다.
  • Garibaldi와 동료들은 PE의 구성 요소를 활용하여 PE 개념적 프레임워크를 적용하는 것이 개인 수준이든 프로그램 수준이든 PE 이행 주기의 강점과 격차를 어떻게 명확히 할 수 있는지 보여줍니다.40 Warm과 동료들은 프로그램이 진정한 PE를 달성하기 위해 반드시 AI를 사용할 필요는 없음을 보여줍니다; 학습자에게 평가된 성과 및 시간 경과에 따른 개선과 관련된 성과 목표를 제공하는 원칙적인 접근 방식을 취함으로써 성과 스펙트럼 전반에 걸친 학습자들이 성장 마인드(growth minded)를 유지하도록 보장합니다.70
  • Kinnear와 동료들은 소위 "메디치 효과(Medici effect)"71—변혁적 혁신은 종종 서로 다른 아이디어와 접근 방식이 수렴하는 학문적 교차성(즉, 초학제적 협력)에서 발생한다는 것—를 강조합니다.42 프로 스포츠의 선수 성과 평가에 대한 그들의 비유는, 불완전하더라도 매우 교훈적이며, 의학 교육이 다른 분야의 평가 전문가들을 참여시키는 데 더 적극적이어야 하는지에 대한 질문을 던집니다. 햅틱 분야는 공학, 의학, 촉각 과학에서 등장했습니다; 마찬가지로, 우리는 다른 분야에서 측정을 수행하는 사람들의 전문 지식을 활용해야 합니다.
  • 마지막으로, 캐나다의 CBME 이니셔티브인 "Competency by Design"은 물류, 업무 흐름 중단, 평가 번아웃(burnout)과 관련된 도전에 시달려 왔습니다.20,72–74 비록 이 증보판에서 깊이 있게 다루지 않았지만, 이행 과학(implementation science)은 PE가 혁신에서 광범위한 이행으로 나아가기 위해 적용해야 할 필수적인, 개인, 팀 또는 조직 수준에서 변화를 실행하기 위한 여러 구성체(constructs)75, 예를 들어 통합 이행 연구 프레임워크(CFIR)76,77와 같은 것들을 가지고 있습니다.

평가의 다음 시대에 대한 위협 대처 (Tackling Threats to the Next Era of Assessment)

 

이 증보판의 여러 저자가 강조한 수많은 도전 과제는 평가와 PE의 다음 시대 실현을 위협합니다. 보건 의료 전문직 교육에 투입되는 자원—금전적 및 인적 자원 모두—은 불충분합니다. 전 세계 보건 의료 지출의 오직 2%만이 보건 의료 전문직 교육(즉, 의학, 간호학, 조산사, 공중 보건)에 사용됩니다.10 보잘것없는 자금 지원으로는 이 증보판에 제시된 대담한 비전을 실현하기 어렵습니다. 미국의 경우, 현재 연간 160억 달러를 초과하는 졸업 후 의학 교육(GME) 자리를 위한 연방 자금의 일부를 의학 교육 혁신과 연구에 할당한다면 변혁적일 것입니다.78

 

그러한 자금 흐름의 부재는 복잡한 데이터 입력, 데이터 수집을 위한 신기술, AI 분석 등으로 가득 찬 PE 시스템을 개발할 전망을 솔직히 벅차게 만듭니다. 놀랍지 않게도, 기존의 PE 혁신은 일반적으로 분석 지원과 데이터 과학자를 포함하여 더 많은 자원을 가진 기관에서 발생했습니다. 합심한 노력이 없다면, 이 혁신 격차(innovation disparity)는 더 벌어지기만 할 것입니다. PE는 초기 투자를 필요로 하겠지만, 우리는 이러한 투자가 우리 의료 시스템에 심오한 배당금을 지불할 것이라고 진정으로 믿습니다. Richardson과 동료들이 논의한 바와 같이, 고립된 혁신에서 PE의 광범위한 이행으로 확장하기 위해서는 인간 게놈 프로젝트(Human Genome Project)나 캔서 문샷 이니셔티브(Cancer Moonshot Initiative)와 유사한 자금 지원 및 구조를 갖춘, 평가의 다음 시대를 위한 조직적인 접근이 필요할 것입니다.22 의대 졸업생의 질을 보장함으로써 의학의 사회적 계약을 존중하라는 요구는 점점 더 커지고 있지만, 어떤 단일 주체도 그 문제를 "소유"하고 있지 않습니다. 여러 주체가 함께 협력하고 자원을 모아 문제를 해결하는 꿈은 더욱 열망적(aspirational)입니다.

 

이러한 도전들을 더욱 복잡하게 만드는 것은, 우리가 이 증보판에서 제시된 비전이나 환자와 학습자에게 더 나은 서비스를 제공하고자 하는 다른 비전을 실현하기 위해 의학 교육에 필요한 변화들이 기술적 문제(technical problem)가 아닌 적응적 도전(adaptive challenge)으로 간주되어야 한다는 점입니다.79,80

  • 기술적 문제는 문제와 해결책이 명확하고, 전문가에 의해 작업이 관리되며, 초점이 해결을 가속하는 데 있는 경우입니다. 반면,
  • 적응적 도전은 명확한 문제나 해결책을 제시하지 않습니다.
    • 적응적 도전은 식별하기 어려울 수 있으며—부정하기 쉽습니다.
    • 예를 들어, 형평성 있는 평가와 환자 진료를 달성해야 하는 도덕적 의무에도 불구하고, 이들은 갈등, 불확실성, 역동적인 긴장, 맥락적 영향에 대한 민감성으로 특징지어지는 "사악한(wicked)" 문제들입니다.33
    • 적응적(또는 사악한) 도전을 해결하려면 실험과 새로운 발견이 필요합니다.
    • 이 작업은 전문가의 명령으로 이루어질 수 없으며, 대신 신념, 역할, 관계 및 접근 방식의 변화로 인해 제기되는 도전을 해결하는 데 있어 이해관계자와 자원의 합심한 투자를 필요로 합니다. 이행 과학, AI, 공학 같은 분야를 의학, 의학 교육, 그리고 학습자 및 환자 커뮤니티와 함께 모으는 초학제적 협력이 필수적일 것입니다.

 

행동 촉구 (Call to Action)

 

우리의 현재 보건 의료 전문직 교육 시스템은 고품질의 형평성 있는 진료를 일관되게 제공할 수 있는 졸업생을 배출하는 데 실패하고 있습니다. 이 증보판에 제시된 평가의 다음 시대에 대한 비전은 대담한 행동(bold action)을 요구합니다. 이 증보판의 편집자로서, 우리는 여기에 제시된 논문들을 시작점—즉, PE와 평가의 새로운 시스템을 통해 현재 시스템의 격차를 해결하기 위한 행동 촉구—으로 간주합니다. 우리는 의과대학 학장, 전공의 및 전임의 과정 책임자, 주임 교수, 자금 지원 기관, 국가 규제 기관들에 이 비전을 포용하고 필요한 자원을 투자할 것을 요청합니다. 학습자, 환자, 지역사회는 파트너로서 참여해야 합니다. 이행 노력은 검증된 프레임워크를 활용하는 동시에 앞에 놓인 깊은 적응적 도전을 인식해야 합니다. 실패도 발생하겠지만 심오한 성공도 있을 것입니다. 우리 학습자의 궤적과 그들이 제공하는 진료는 고품질의 형평성 있는 평가에 대한 헌신으로 변화될 수 있습니다.

 

우리가 놓친 것은 무엇입니까? 누구를 놓쳤습니까? 우리에게 연락하고 대화에 참여해 주십시오. 우리는 대화를 계속 성장시키고 실천 공동체(community of practice)를 구축하기 위해 2024년 봄에 팟캐스트를 개최할 예정입니다. 그 결과는 환자가 마땅히 받아야 할 진료—형평성 있고, 환자 중심적이며, 최고 품질의 진료—를 제공할 권한을 부여받은 미래의 의사 인력이 될 것입니다.

 

 

 

Acad Med2024 Apr 1;99(4S Suppl 1):S30-S34. doi: 10.1097/ACM.0000000000005604. Epub 2023 Dec 19.

A Theoretical Foundation to Inform the Implementation of Precision Education and Assessment

 

 

🏥 의학 교육의 미래, '정밀 교육(PE)'을 제대로 실현하려면? (이론과 실제)

안녕하세요! 오늘은 최근 의학 교육계의 화두인 '정밀 교육(Precision Education, 이하 PE)'에 대해 깊이 있는 이야기를 나눠보려고 해요. 요즘 병원 현장은 정말 치열하죠. 환자들은 복잡해지고, 업무는 압축적으로 몰아치는데(workload compression), 배워야 할 의학 지식은 말 그대로 폭발(explosion of clinical knowledge)하고 있습니다. 시간은 없는데 공부할 건 산더미인 상황, 어떻게 해결할 수 있을까요?

 

여기서 등장한 개념이 바로 정밀 교육(PE)입니다. 이 논문의 저자들은 PE의 목표를 이렇게 정의합니다.

"본질적으로 PE는 '적절한 학습자에게 적절한 시기에 적절한 교육적 개입'을 제공하고자 합니다." "In essence, PE seeks to offer 'the right educational intervention to the right learner at the right time.'"

 

그럴듯하죠? 하지만 단순히 데이터만 모으고 분석한다고 저절로 교육이 되는 건 아닙니다. 오늘은 이 PE를 성공시키기 위해 무엇이 필요한지, 아주 탄탄한 이론적 배경과 실제 사례를 통해 알아보겠습니다. 🧐


1. 왜 '이론(Theory)'이 중요할까요? 💡

많은 곳에서 AI다, 빅데이터다 하며 새로운 시스템을 도입하고 있지만, 저자들은 우려 섞인 목소리를 냅니다. PE가 반짝하고 사라지는 유행(hype cycle)에 그치지 않으려면 '어떻게(How)' 구현할지에 대한 뼈대가 필요하다는 거죠.

"정밀 교육(PE) 전략의 구현을 뒷받침하기 위해서는 견고한 이론적 토대가 필요합니다; 이러한 기반 없이는 PE를 구현하려는 시도가 우리가 기대하는 결과를 낳지 못할 수도 있습니다."
"A solid theoretical foundation is needed to support the implementation of PE strategies; without this grounding, the attempts we make to implement PE may not yield the outcomes we expect."

 

즉, 기술(Tech)만 있어서는 안 되고, 교육학적 원리(Pedagogy)가 받쳐줘야 한다는 뜻입니다.


2. PE를 지탱하는 두 가지 기둥 🏛️🔨

저자들은 성공적인 PE 구현을 위해 두 가지 핵심 요소가 만나야 한다고 강조합니다.

첫 번째 기둥: 학습 이론 (Learning Theories) 📚 데이터를 보고 학습자가 어떻게 반응하고 성장하는지 설명해 주는 이론들입니다.

  • 마스터 적응형 학습(Master Adaptive Learning, MAL): 계획하고, 배우고, 평가하고, 조정하는 과정을 통해 스스로 성장하는 힘을 기르는 모델이에요.
  • 전환 학습 이론(Transformative Learning Theory): 충격적인 경험(예: 진료 실수)을 비판적으로 성찰하면서 행동을 근본적으로 바꾸는 과정입니다.
  • 자기 결정 이론(Self-Determination Theory): 자율성(Autonomy), 유능감(Competence), 관계성(Relatedness)이 충족될 때 스스로 공부하고 싶어 진다는 이론이죠.

두 번째 기둥: 디지털 도구 (Digital Tools) 💻 이론을 현실로 만들어주는 도구들입니다.

  • 감사 및 피드백 대시보드(Audit and Feedback Dashboards): 내 성적표와 진료 데이터를 한눈에 보여주는 판.
  • 넛지 전략(Nudge Strategy): 자연스럽게 행동 변화를 유도하는 부드러운 개입.

3. 이론을 현실로! 실제 병원 적용 사례 (The 'How') 🏥

그럼 이 이론과 도구가 실제 수련 과정(내과 전공의)에서 어떻게 쓰이고 있을까요? 논문에서 소개한 구체적인 시나리오 3가지를 소개합니다.

🅰️ 사례 1: '나만의 맞춤형 코칭' (MAL + 대시보드)

전공의들은 '감사 및 피드백 대시보드(Audit and Feedback Dashboards)'를 통해 내가 어떤 환자를 얼마나 봤는지 데이터를 확인합니다. 하지만 그냥 숫자만 던져주지 않아요. 교수님(코치)과 함께 보며 마스터 적응형 학습(MAL) 과정을 거칩니다.

  • "어? 내가 호흡기 환자는 많이 봤는데 신장 환자는 별로 안 봤네?" (평가)
  • "다음 당직 때는 신장 내과 환자 입원을 맡아봐야지." (계획/조정)

🅱️ 사례 2: '실수에서 배우기' (전환 학습 + 성찰)

환자가 퇴원했다가 30일 이내에 재입원하는 건 의사에게 꽤 충격적인 사건(disorienting event)입니다. 이를 '전환 학습 이론(Transformative Learning Theory)'에 적용합니다. 전공의는 대시보드에서 재입원 케이스를 확인하고, "왜 다시 입원했지? 아, 퇴원 약 처방 때 흡입기를 빼먹었구나!" 하고 깊이 반성(critical reflection)하게 됩니다. 이 과정이 있어야 진짜 행동 변화가 일어납니다.

🅾️ 사례 3: 'AI가 떠먹여 주는 쪽집게 과외' (자기 결정 이론 + 넛지)

간부전 환자를 딱 입원시키는 순간! '넛지(Nudge)'가 들어옵니다. 이메일로 관련 논문 요약본, 팟캐스트, 퀴즈가 배달되죠. 이건 '자기 결정 이론(Self-Determination Theory)'을 건드립니다.

  • 내가 필요할 때 골라 본다 (자율성)
  • 퀴즈를 풀며 내용을 익힌다 (유능감)
  • 팀원들과 함께 공유한다 (관계성)

4. 마치며: 패러다임의 전환을 향해 🚀

결국 정밀 교육(PE)은 단순히 "성적표를 전산화해서 보여주는 것"이 아닙니다. 학습 이론이라는 뿌리 위에 디지털 기술이라는 줄기를 세워, 학습자 개개인에게 최적화된 성장을 돕는 것입니다. 연구진은 논문을 마무리하며 이렇게 확신합니다.

"PE는 의학 교육의 패러다임 전환을 대표할 잠재력이 있습니다—점점 더 격렬해지는 임상 환경에서 학습의 효율성을 획기적으로 향상시킴으로써 말이죠."
"PE has the potential to represent a paradigm shift in medical education—dramatically improving the efficiency of learning in the ever-intensifying clinical environment."

 

우리나라 의학 교육 현장에도 이런 이론에 기반한 정밀 교육 시스템이 더 많이 도입되어, 힘든 수련 환경 속에서도 훌륭한 의료진이 더 효율적으로 양성되기를 기대해 봅니다! 💪

 


현대 임상 환경의 학습자들은 환자의 복잡성 증가, 업무량 압축(workload compression), 그리고 임상 지식의 폭발(explosion of clinical knowledge)에 직면해 있습니다. 본질적으로 배워야 할 것은 더 많은데 그것을 할 시간은 더 적습니다. 정밀 교육(Precision education, PE)은 각 학습자의 고유한 요구와 목표를 지원하는 혁신적인 개인화된 개입을 통해 이 복잡한 시대에 더 효율적인 평생 학습(lifelong learning)을 가능하게 할 잠재력이 있습니다. 본질적으로 PE는 "적절한 학습자에게 적절한 시기에 적절한 교육적 개입(educational intervention)"을 제공하고자 합니다.

 

정밀 교육(PE) 전략의 구현을 뒷받침하기 위해서는 견고한 이론적 토대(solid theoretical foundation)가 필요합니다; 이러한 기반 없이는 PE를 구현하려는 시도가 우리가 기대하는 결과를 낳지 못할 수도 있습니다. PE는 현재 '하이프 사이클(hype cycle)'의 초기 단계를 지나고 있는 신생 분야이며, 만약 초기 구현 노력이 기대에 미치지 못한다면, PE는 부정적인 과장 광고(negative hype)의 함정에 빠져 '환멸의 골짜기(trough of disillusionment)'에 갇혀 더 이상의 수용과 혁신이 저해될 수 있습니다. 현재의 임상 환경에서 이러한 전략들이 어떻게 활용되고 적용되어야 하는지를 안내할 PE를 위한 이론적 토대는 아직 구축되지 않았습니다. 이러한 토대를 마련함으로써 교육자들은 학습자에게 가장 의미 있는 인지 과정(cognitive processes)을 활용하고, 기존 PE 도구의 잠재력을 최대한 끌어내며, 새롭고 지속 가능한 PE 접근 방식을 설계하기 위한 기반을 제공할 수 있게 될 것입니다. 이 글에서 우리는 PE를 위한 이론적 토대를 소개하고 논의한 다음, 필수적인 학습 이론과 행동 변화를 위한 잘 확립된 디지털 도구를 기반으로 PE가 어떻게 구현될 수 있는지에 대한 구체적인 예시를 통해 이론에서 실무로 나아갈 것입니다.

 

PE를 위한 이론적 토대: PE의 이유 (The Why of PE)

 

기존의 PE 모델에서는 네 가지 상호 연결된 단계가 기술됩니다:

  • 데이터 입력에
  • 고급 분석(advanced analytics)을 적용하여 통찰력을 생성하고,
  • 이를 사용하여 목표화된 교육적 개입(targeted educational interventions)을 형성하며,
  • 궁극적으로 개인, 중간(프로그램), 거시(시스템) 수준에서 학습 및 결과 향상을 이끕니다.

이러한 모델들은 PE가 무엇(what)인지에 대한 형태를 제공하지만, 의미 있는 변화를 이끌어내기 위해 PE 전략을 가장 효과적으로 구현하는 방법(how)을 안내하기 위해서는 이론적 토대 또한 필요합니다. 우리가 제안하는 PE 구현을 위한 이론적 토대는 그림 1에 묘사되어 있습니다.

그림 1: 정밀 교육(PE) 구현을 위한 이론적 토대. PE 구현을 위한 이론적 토대는 확립된 학습 이론(established learning theories)과 증거 기반의 디지털 도구(evidence-based digital tools)로 구성됩니다. 이 토대는 학습을 극대화하고 의미 있는 행동 변화를 만들기 위해 PE가 어떻게 가장 효과적으로 활용될 수 있는지를 알려줍니다.

 

경험으로부터 학습이 어떻게 일어나는지를 설명하는 다수의 학습 이론이 존재하며, 특히 경험이 "성찰(reflection), 일반화(generalization), 개념 검증(concept testing)에 의해 증강될 때" 더욱 그러합니다. PE의 이론적 토대에 실질적으로 기여하는 세 가지 이론은 마스터 적응형 학습(master adaptive learning, MAL) 모델, 전환 학습 이론(transformative learning theory), 그리고 자기 결정 이론(self-determination theory)입니다. 이 섹션에서는 이들 이론에 대해 간략히 설명하고, PE 노력을 운영하는 데 현재 사용되는 2가지 디지털 도구(감사 및 피드백 대시보드(audit and feedback dashboards)넛지 전략(nudge strategies))에 대해 논의할 것입니다.

 

 

학습 이론 (Learning theories)

 

마스터 적응형 학습자(MAL) 모델은 의사와 수련생들이 기존 지식을 활용하면서 동시에 어떻게 혁신하고, 변화에 적응하며, 새로운 문제가 발생했을 때 이를 해결하는지를 설명하기 위해 여러 학습 이론을 차용합니다.

  • 이 모델은 학습을 계획(planning), 학습(learning), 평가(assessing), 그리고 궁극적으로 미래의 진료를 안내하기 위해 조정(adjusting)하는 노력이 필요한 과정으로 특징짓습니다.
  • PE 전략은 적응형 전문성(adaptive expertise)을 함양하기 위해 MAL 원칙을 훈련 프로그램에 더욱 통합할 수 있는 독특한 기회를 제공합니다.
  • 지도전문의(supervisor)의 코칭(coaching)과 결합될 때, 동료나 프로그램의 기대치와 비교한 전공의 귀속 환자 결과(resident-attributed patient outcomes)와 같은 개인 수준의 임상 경험 및 성과 데이터를 보여주는 대시보드는 수련생들이 격차를 파악하고 진전을 추적(평가)하는 데 도움을 줄 뿐만 아니라, 추가적인 개선을 위한 목표를 설정(계획/조정)하는 데 도움을 줄 수 있습니다.

 

전환 학습 이론(Transformative learning theory)혼란스러운 사건(disorienting event)에 대한 비판적 성찰(critical reflection)을 통해 학습자의 준거 틀(frame of reference)이 어떻게 변경될 수 있는지를 설명합니다.

  • 혼란스러운 경험은 구조화된 비판적 성찰과 의도적으로 결합될 때, 기존의 이해를 뒤흔들고 행동에 지속적인 변화를 만들어낼 잠재력이 있습니다.
  • PE 데이터와 분석은 수련생의 경험 이력 내에서 잠재적으로 전환적인 경험을 식별하고 비판적 성찰에 대한 새로운 접근 방식을 촉진하는 데 활용될 수 있습니다. 예를 들어, 특정 수련생을 개별 환자와 연결하는 귀속 방법(attribution methods)과 임상 결과에 대한 그들의 기여도를 측정하는 것은 수련생의 결정이 실제 환자의 결과에 어떤 영향을 미치는지에 대한 강력한 통찰력을 제공할 수 있습니다.
  • 이러한 유형의 지표가 포함된 교육용 대시보드를 가이드된 자기 성찰 활동의 기초로 사용하는 것은 수련생들을 위한 전환 학습 과정(transformative learning process)을 크게 향상시킬 잠재력이 있습니다.

 

자기 결정 이론(Self-determination theory, SDT)은 수련생들이 학습 활동을 추구하도록 동기 부여되는 메커니즘을 특징짓는 여러 학습 이론 중 하나입니다. SDT에서 학습자는 자율성(autonomy), 유능감(competence), 관계성(relatedness)이라는 3가지 핵심 심리적 욕구의 충족을 통해 외재적, 인센티브 주도적 동기 과정에서 더 내재적인 동기의 소재(intrinsic locus of motivation)로 이동합니다.

  • PE 개입은 이러한 각각의 심리적 욕구를 촉진하여 수련생을 더 내재적인 동기 소재로 전환하고 학습 성과 향상에 기여할 수 있습니다. 예를 들어, 수련생이 개인화된 진료 습관 데이터를 사용하여 유능감을 키우고 싶은 영역을 식별하고 학습 노력을 직접 지시할 수 있을 때 더 큰 자율성(autonomy)을 느낄 가능성이 높습니다. 또한, 팀원 모두에게 그들이 돌보고 있는 환자의 진료와 관련된 리소스를 제공함으로써 팀 내에서 관계성(relatedness)을 증진시킬 수 있습니다.

 

디지털 도구 (Digital tools)

 

위에서 설명한 학습 이론들이 PE의 이론적 토대에 기여하는 한편, 디지털 도구(digital tools) 역시 PE를 운영하는 데 중요합니다. 앞서 언급했듯이,

 

감사 및 피드백 대시보드(audit and feedback dashboards)는 특정 벤치마크나 목표와 비교하여 개인의 성과 데이터를 표시함으로써, 수련생과 임상의가 자신의 진료 습관 및 결과 데이터로부터 직접 학습할 수 있게 합니다. 임상 환경에서 감사 및 피드백 대시보드는 행동 변화의 동인(drivers of behavior change)이 될 잠재력이 있습니다. 예를 들어, 이러한 대시보드의 사용은 향상된 항생제 스튜어드십(antibiotic stewardship), 가이드라인에 부합하는 처방, 그리고 가치가 낮은 진료(low-value care)의 감소와 관련이 있었습니다. 질 향상(quality improvement) 분야의 연구에 따르면 감사 및 피드백 도구(성적표(report cards) 또는 벤치마킹(benchmarking)이라고도 함)는 증거 기반의 비교 대상(evidence-based comparators)을 포함하고, 상당한 인지 부하(cognitive load) 없이 시기적절하고 집중적인 피드백을 제공하며, 실행 가능한 행동 계획과 연결될 때 가장 효과적이라고 제안합니다. 의사들은 종종 자신의 단점보다는 가장 관심 있는 분야에 집중하는 경향이 있으므로, 코칭(Coaching)은 이러한 대시보드의 영향을 강화합니다. 개별 학습자를 위한 교육용 대시보드도 비슷한 잠재력을 가지고 있습니다. 벤치마크와 함께 개인화된 교육 성과 및 진료 습관 데이터를 역량 기반 표준(competency-based standards)에 집계하고 표시함으로써, 이러한 PE 도구는 수련생과 지도전문의에게 개별화된 목표 설정뿐만 아니라 목표화된 피드백(targeted feedback) 및 코칭을 위한 기회를 제공할 수 있습니다.

 

넛지 전략(Nudge strategy)은 개인의 의사 결정에 영향을 미치기 위해 행동 심리학과 시스템 공학을 통합하며, (본질적으로 "마음을 바꾸려고" 노력하기보다는) 변화에 유리한 조건이나 환경을 만드는 것을 추구합니다. 이는

  • 프라이밍(priming, 잠재의식적 단서 제공),
  • 기본값 구조화(structuring defaults, 미리 설정된 옵션의 흐름을 따르는 경향),
  • 규범 재정의(redefining norms, 타인이 하는 행동의 영향력 활용),
  • 현저성(salience, 새롭고 관련성 있는 것에 주의를 기울임) 등 다양한 기법을 통해 달성됩니다.

넛지 개입은 많은 분야에서 채택되어 왔으며, 의료 분야 내에서는 임상의들의 가이드라인 지시적 의학 요법(guideline-directed medical therapies) 이행 등을 증가시키는 것으로 나타났습니다. 전자의무기록(EHR) 기반 넛지는 특정 임상 환경 내에서 시기적절한 권장 사항과 리소스를 제공할 수 있습니다. 넛지 전략은 수련생들의 학습과 행동 변화에 영향을 미치기 위해 PE에 채택될 수 있습니다. 예를 들어, 임상 실습(clinical rotations) 중인 수련생들에게 그날 그들이 돌본 환자와 밀접하게 관련된 적시 리소스(just-in-time resources)를 제공하거나, 수련 중 시험(in-training exam) 성적의 격차나 환자 진료 노트에 기록된 임상 추론을 기반으로 내용별 리소스를 받을 수 있습니다. 이것들은 학습 이론에 기반을 두고 개별화된 임상 및 교육 데이터에 고정된 디지털 도구가 어떻게 수련생의 선택에 영향을 미치고, 행동 변화(behavior change)를 주도하며, 학습을 가속화할 잠재력을 가지는지에 대한 몇 가지 예시에 불과합니다.

 

이론을 실무에 적용하기: PE의 방법 (Putting Theory Into Practice: The How of PE)

 

이 섹션에서는 우리 학술 의료 센터에서 정밀 교육(Precision Education, PE) 전략이 현재 구현되고 있는 몇 가지 방법을 설명하고, 앞서 설명한 이론적 토대가 우리가 정밀 개입(precision interventions)을 통합하는 방식에 대한 선택에 어떤 정보를 제공하는지 논의할 것입니다. 그림 2는 이 논의에 대한 시각적 종합을 제공합니다.

그림 2: 이론적 토대 및 디지털 도구와 함께 제시된 정밀 개입 예시. 확립된 학습 이론에 기반하고 행동 변화를 위한 증거 기반 디지털 도구(evidence-based digital tools)를 통해 운영되는 정밀 교육 개입의 사용 사례.

 

우리의 내과 전공의 프로그램(internal medicine residency program)에서, 우리는 전공의들에게 의학적 콘텐츠 영역(medical content area)별로 특성화된 개인 수준의 임상 진료 및 결과 데이터를 표시하는 EHR 기반 감사 및 피드백 대시보드(EHR-based audit and feedback dashboard)에 대한 접근 권한을 제공합니다 (Supplemental Digital Appendix 1 참조: https://links.lww.com/ACADMED/B498). 전공의 프로그램의 책임자(C.B.D., D.J.S.)로서 우리는 일 년에 두 번 반기별 검토(semiannual review)를 위해 각 수련생과 만납니다; 이 세션에서 우리는 대시보드를 사용하여 각 수련생이 현재까지 다양한 콘텐츠 영역에 노출된 폭과 깊이를 검토합니다. 우리는 마스터 적응형 학습(MAL) 모델을 통해 계획(planning), 평가(assessing), 조정(adjusting)이 경험으로부터 학습하는 과정의 핵심 구성 요소임을 알고 있기 때문에, 그리고 이러한 정보는 MAL 모델과 그 맥락에서 이러한 유형의 대시보드를 사용하는 방법에 대한 통찰력을 제공할 수 있는 코치나 조언자(coach or advisor)의 지원과 함께 전달될 때 가장 효과적이라고 느끼기 때문에 이 대시보드를 반기별 상담 세션에 통합하기로 결정했습니다. 예를 들어, 우리는 수련생이 어떤 병리 및 환자 집단에 다소간 노출되었는지를 환기시켜 맞춤형 실행 계획(personalized action plans)을 수립할 수 있게 합니다; 이는 임상 노출의 격차를 메우고 경험의 균형 잡힌 분포를 함양하거나, 향후 예상되는 진료 분야에서의 경험을 증폭시키도록 설계될 수 있습니다.

 

우리 전공의 프로그램에서 이 대시보드를 사용하는 또 다른 방법은 환자 진료 전환(patient care transitions)에 초점을 맞춘 로테이션 내에서입니다. 이 로테이션의 핵심 과제는 상급 전공의(senior residents)가 대시보드를 사용하여 최근 자신이 돌본 환자의 결과를 평가하는 가이드된 성찰 활동(guided reflective exercise)입니다; 그들은 계획되지 않은 30일 재입원(unplanned 30-day readmission)을 식별하고 이 유해 사례(adverse event)에 대한 자신의 팀의 기여를 비판적으로 평가하는 임무를 맡습니다. 전환 학습 이론(Transformative learning theory)은 우리가 이 과제를 로테이션에 포함시키는 선택을 안내했습니다: 우리는 그들 자신의 진료에서 발생한 혼란스러운 사건(disorienting event, 즉 잘못된 퇴원)을 강조한 다음, 환자 결과에 미치는 영향에 대한 통찰력을 심화하기 위해 유도된 비판적 성찰(guided critical reflection)을 촉진합니다. 전공의는 이 과제를 완료하면서 자신의 팀이 퇴원 시 환자의 유지 흡입기(maintenance inhalers) 리필을 소홀히 하여 천식 악화로 인한 재입원을 초래했다는 사실을 발견할 수 있습니다. 이 발견을 바탕으로, 전공의는 향후 재입원을 방지하기 위해 앞으로 팀과 함께 퇴원 약물 조정(discharge medication reconciliations)을 더욱 신중하게 검토하겠다고 결심할 수 있습니다. 우리는 후속 반기별 회의에서 해당 팀의 30일 재입원율 추세를 검토함으로써 그들의 노력을 지원할 수 있습니다.

 

우리가 임상 환경에서 PE를 구현하기 위해 사용하는 또 다른 감사 및 피드백 대시보드는 수련생의 임상 추론(clinical reasoning)에 대한 피드백을 제공합니다: 인공지능(AI) 알고리즘이 입원 기록(admission notes)에 나타난 임상 추론의 질을 평가하고, 벤치마킹 및 시각화가 가능한 객관적이고 표준화된 성과 평가를 수련생에게 제공합니다. 역사적으로 야간 당직 시 환자를 입원시키는 전공의들은 감별 진단(differential diagnoses)을 생성하는 과정에서 자신의 임상 추론의 질에 대해 제한적인 피드백을 받는다고 언급해 왔습니다; 우리는 이제 로테이션 전 목표 설정(prerotation goal setting)을 위해 이 임상 추론 대시보드의 사용을 장려합니다. 이는 수련생이 거의 실시간으로 자신의 성과를 모니터링할 수 있게 함으로써 전공의의 MAL을 촉진하고, 측정 가능한 목표를 설정하고, 진전을 추적하며, 코치와 함께 역량을 향상시키도록 힘을 실어줍니다. 수련생은 류마티스 내과 및 호흡기 내과 진단에 대한 임상 추론은 질이 높지만 신장 내과에서의 성과는 낮다는 것을 발견할 수 있습니다; 그렇다면 그들은 신장 질환 환자의 입원을 모색하고 야간 당직 지도전문의와 케이스를 논의함으로써 신장 내과 임상 추론을 개선하기 위해 노력할 수 있습니다. 로테이션 후, 향후 개선 사항은 대시보드를 통해 다시 추적할 수 있습니다. 수련생은 또한 대시보드를 사용하여 자신의 기록에 나타났을 수 있는 잠재적인 인지적 또는 정체성 기반 편향(cognitive or identity-based biases)에 대한 평가를 검토할 수도 있습니다.

 

EHR 기반 PE 넛지(EHR-based PE nudges) 또한 학생, 전공의 및 교수진에게 제공됩니다. 이러한 넛지는 EHR의 환자 진단을 활용하여 관련 교육 자료를 의료팀에게 푸시(push)함으로써, 수련생들이 관리 중인 질환에 대해 더 많이 학습하도록 장려하고 임상 환경에 팀 기반 학습(team-based learning)의 기회를 내장합니다 (Supplemental Digital Appendix 2 참조: https://links.lww.com/ACADMED/B498).

  • 예를 들어, 내과 팀이 간부전 환자를 입원시킬 때, 그들은 이메일을 통해 환자 진료와 관련된 다양한 디지털 리소스에 대한 링크가 포함된 넛지를 받을 수 있습니다: 팟캐스트, 대표적인 객관식 질문, 간 손상의 임상 양상 및 위험 계층화를 논의하는 기사, 그리고 PubMed에서 소싱된 몇 가지 최신 리뷰 등입니다. 생성형 AI(Generative AI)가 큐레이팅된 PubMed 문헌을 요약하기 위해 넛지에 통합되어 있습니다.

이 개입의 현재 반복(iterations)은 팀과 임상 콘텐츠를 공유하는 데 중점을 두고 있지만, 향후 버전은 노출이 부족한 진단을 중심으로 개인화하거나, EHR의 다른 환자 특성을 활용하여 환자 진료와 관련될 수 있는 사회적 건강 결정 요인(social determinants of health)을 강조하는 데 초점을 맞출 수 있습니다. 이 PE 개입은 적어도 부분적으로는 자기 결정 이론(self-determination theory)의 핵심 심리적 욕구를 충족시키기 때문에 효과적입니다: 학습자가 자신의 필요와 관심에 가장 적합한 리소스 유형을 결정하고 가장 필요한 시기(전달 시점 또는 나중에 검토할 시간이 있을 때)에 리소스에 액세스할 수 있도록 함으로써 자율성(autonomy)을 증진합니다. 또한, 의도적으로 팀을 위한 학습 기회를 제공함으로써 이러한 개입은 공동 학습(shared learning)의 수단을 제공하고 팀 간의 관계성(relatedness)을 함양합니다. 이 개입은 또한 참여를 극대화하기 위해 특정 환자의 진료와 관련된 최신 문헌의 새로운 생성형 AI 요약을 포함하는 등 넛지의 현저성(salience) 원칙을 활용합니다. 마지막으로, 적절한 수준의 도전(예: 부담이 적은 퀴즈)이 포함된 넛지는 전공의의 성취감과 유능감(competence)을 높여 학습 동기를 더욱 부여할 수 있습니다.

 

결론 (Conclusion)

 

PE는 끊임없이 심화되는 임상 환경에서 학습의 효율성을 획기적으로 향상시킴으로써 의학 교육의 패러다임 전환(paradigm shift)을 대표할 잠재력이 있습니다. 구현 노력의 최전선에 견고한 이론적 토대(strong theoretical foundation)를 유지하는 것은 PE 접근 방식의 잠재력을 완전히 실현하는 데 매우 중요할 것입니다. 이 기사에서 우리는 PE와 특히 관련된 학습 이론 및 디지털 도구를 설명하고 PE의 구현을 안내하기 위한 새로운 이론적 토대를 소개했습니다. 위의 예시들은 이론에 기반한(theory-grounded) PE가 개별 학습자의 경험과 교육적 결과에 대한 우리의 이해를 증강시킬 수 있는 다양한 방법을 보여주며, 이를 통해 환자 및 의료 시스템의 결과를 개선한다는 궁극적인 목표를 가지고 효율적이고 효과적인 학습을 촉진하는 개인화된 교육 계획(personalized educational plans)을 수립할 수 있게 합니다.

 

1. 상단: 정밀 교육의 흐름 (Process Flow)

정밀 교육이 데이터에서 시작하여 최종 결과로 이어지는 4단계의 순환 과정을 화살표로 나타내고 있습니다.

  • Data/Inputs (데이터/입력): 학습자에 대한 데이터 수집 단계입니다.
  • Analytics/Insights (분석/통찰): 수집된 데이터에 고급 분석을 적용하여 의미 있는 정보를 도출합니다.
  • Interventions (개입): 분석된 통찰을 바탕으로 개인화된 교육적 조치를 취합니다.
  • Outcomes (결과): 개입을 통해 개인, 프로그램, 시스템 차원의 학습 성과 및 결과 향상을 이룹니다.

2. 하단: 이론적 토대 (Theoretical Foundation)

상단의 PE 프로세스가 효과적으로 작동하기 위해 필요한 두 가지 핵심 기반을 보여줍니다.

왼쪽: Learning Theories (학습 이론)

  • 아이콘: 벽돌담 (견고한 기반을 의미)
  • 내용: PE가 왜(Why) 그리고 어떻게(How) 작동해야 하는지에 대한 교육학적 원리입니다.
    • Master adaptive learner (마스터 적응형 학습자)
    • Transformative learning (전환 학습)
    • Self-determination (자기 결정 이론)
    • Others (기타)

오른쪽: Digital Tools (디지털 도구)

  • 아이콘: 망치와 못 (실제 구현을 위한 도구를 의미)
  • 내용: PE를 실제 현장에서 *운영(Operationalize)*하기 위한 기술적 수단입니다.
    • Audit & feedback dashboards (감사 및 피드백 대시보드)
    • Nudge strategies (넛지 전략)
    • Others (기타)

요약

이 그림은 "데이터 기반의 정밀 교육(PE) 프로세스(상단)가 성공하기 위해서는, 확립된 '학습 이론'과 효과적인 '디지털 도구'라는 두 가지 토대(하단)가 필수적으로 뒷받침되어야 한다"는 논문의 핵심 주장을 도식화한 것입니다.

 

 

이 그림은 세로로 3개의 기둥(Column)으로 구성되어 있으며, 왼쪽에서 오른쪽으로 흐름이 이어집니다:

  1. Precision Interventions (정밀 개입): 실제로 수행하는 교육 활동 (과녁 아이콘)
  2. Theoretical Foundations (이론적 토대): 해당 활동의 기반이 되는 학습 이론 (벽돌담 아이콘)
  3. Digital Tools (디지털 도구): 이를 구현하는 기술적 도구 (망치 아이콘)

각 행(A, B, C)에 대한 상세 설명은 다음과 같습니다.


A. 개인화된 코칭 (Personalized Coaching)

  • 개입 내용: 개인의 진료 습관 데이터와 AI가 평가한 임상 추론 기록에 대한 코칭을 제공합니다.
  • 이론적 토대 (마스터 적응형 학습자 이론, MAL):
    • 계획 및 학습 (Planning & Learning): 패널 관리 및 문서화 교육.
    • 평가 (Assessing): 코치와 함께 대시보드의 지표 검토.
    • 조정 (Adjusting): 실행 계획(Action plan) 수립.
  • 디지털 도구 (감사 및 피드백 대시보드):
    • 적시성 (Timeliness): 거의 실시간으로 데이터 제공.
    • 낮은 인지 부하 (Low cognitive load): 단순하고 이해하기 쉬운 프레젠테이션.

B. 가이드된 피드백 (Guided Feedback)

  • 개입 내용: 퇴원 계획 및 재입원을 포함한 환자 인계(transitions of care) 과정에 대한 가이드된 피드백을 제공합니다.
  • 이론적 토대 (전환 학습 이론, Transformative Learning Theory):
    • 비판적 성찰과 결합된 혼란스러운 사건 (Disorienting event paired with critical reflection): '잘못된 퇴원(discharge gone wrong)' 사례를 식별하고 검토함으로써 기존의 인식을 전환.
  • 디지털 도구 (감사 및 피드백 대시보드):
    • 증거 기반 비교 대상 (Evidence-based comparators): 표준 기준(criterion standard) 및 동료 집단(peer cohort)과 비교.

C. 목표화된 교육 리소스 (Targeted Educational Resources)

  • 개입 내용: 최근 환자의 진단을 바탕으로 진료 팀에게 교육 자료를 전달합니다.
  • 이론적 토대 (자기 결정 이론, Self-Determination Theory):
    • 자율성 (Autonomy): 원할 때 스스로 리소스를 선택.
    • 유능감 (Competence): 적절한 난이도로 큐레이팅된 객관식 질문 제공.
    • 관계성 (Relatedness): 팀과 함께 학습을 공유.
  • 디지털 도구 (넛지 전략, Nudge Strategy):
    • 기본값 구조화 (Structuring defaults): 콘텐츠 검토를 위한 미리 설정된 옵션 제공.
    • 규범 재정의 (Redefining norms): 팀에게 "일상적인(usual)" 진료의 일부로 전송.
    • 현저성 (Salience): 최근 환자의 진단과 직접 연결되어 있어 주목도를 높임.

요약

이 그림은 단순히 데이터를 보여주는 것을 넘어, "어떤 학습 이론을 근거로(Why)", "어떤 디지털 도구를 사용하여(How)", "어떤 교육적 개입(What)"을 할 것인가에 대한 구체적인 청사진을 제시하고 있습니다.

 

 

 

 

챕터 9: 문서 디자인 📄

시작점

인쇄물 및 온라인 자료는 명확하고 단순하게 작성되어야 할 뿐만 아니라, 독자들이 매력적이고 흥미를 느끼도록 디자인되어야 합니다1. 문서 디자인이란 독자들이 읽기 시작하고 계속 읽도록 장려하기 위해 단어와 이미지를 결합하는 기술을 의미합니다2.

실습 사례: 텍스트와 그래픽에 대한 정서적 반응

정보 디자인 전문가이자 중요한 자료인 Dynamics in Document Design: Creating Texts for Readers¹의 저자인 Karen Schriver, PhD는 문서 디자인의 중요성을 강조했습니다3.

 

그녀는 "독자들이 존중받고 가치 있게 여겨지는 것은 두 가지 상황에서 발생할 수 있습니다"라고 말했습니다4. "첫째는 텍스트를 이해할 때입니다. 즉, 단어와 그래픽을 통해 전달되는 내용을 실제로 '파악'할 때입니다. 둘째는 텍스트 자체가 감정적으로 그들에게 반응한다고 느낄 때입니다"5.

 

Schriver는 "사람들이 혼란스러운 텍스트를 볼 때, 그들은 존중받는다고 느끼지 못합니다. 왜냐하면 자신에게 말하는 것이 아니라 단지 말을 걸고 있다고 느끼기 때문입니다"라고 설명했습니다6. 그녀는 어려운 단어, 복잡한 문장, 그리고 끝없이 이어지는 단락으로 구성된 팸플릿의 예를 들었습니다7. Schriver는 "좋은 정보 디자인은 독자가 텍스트와 그래픽에 보일 수 있는 정서적 반응을 고려합니다. 수년간의 연구를 통해 우리는 독서가 단순히 지적인 인지 활동이 아니라 정서적인 활동이기도 하다는 것을 알고 있습니다"라고 설명했습니다8.

전략, 아이디어 및 제안

  • 적절한 글꼴 유형을 선택하십시오. 어떤 글꼴을 사용해야 할까요? 많은 사람들이 Times New Roman과 같은 장식적 획(serif)이 있는 "세리프 글꼴"을 사용해야 하는지, 아니면 Arial과 같은 획이 없는 "산세리프(sans serif)" 또는 "블록" 글꼴을 사용해야 하는지 묻습니다9. 저는 Karen Schriver에게 이에 대해 물어봤고, 그녀는 다음과 같이 답했습니다. "종이에 디자인하는 경우, 일반적으로 본문 텍스트에는 세리프 글꼴을 사용하는 것이 좋습니다. 웹 디자인의 경우, 일반적으로 산세리프 글꼴이 더 깨끗하고 뒤에서 빛이 투사될 때 훨씬 보기 쉽기 때문에 사용하는 것이 좋습니다"10.
    • 적절한 글꼴 크기를 사용하십시오. 최소 12포인트 글꼴 크기를 사용하는 것을 습관화하십시오11. 이 크기는 대부분의 독자가 보기에 충분히 큽니다12. 노인이나 시력 문제가 있는 사람들을 위해 작성할 때는 최소 14포인트 글꼴 크기로 "키우는" 것이 좋습니다13. 큰 활자의 표준은 16~18포인트 글꼴입니다14.
  • 제목과 소제목을 만드십시오. 제목은 주요 섹션을 식별하는 반면, 소제목은 그 안의 주제를 표시합니다15. 둘 다 독자들이 원하는 정보를 더 쉽게 찾을 수 있도록 돕습니다16. 예를 들어, 이 챕터에는 "문서 디자인(Document Design)"이라는 제목이 있습니다17. 그런 다음 "전략, 아이디어 및 제안(Strategies, Ideas, and Suggestions)," "실습 사례(Story from Practice)," "인용 출처(Cited Sources)," 및 "더 알아볼 자료(Sources to Learn More)"와 같은 여러 소제목이 있습니다18. 이 책 전체에서 볼 수 있듯이, 일부 요소는 들여쓰기, 음영, 아이콘 및 굵은 글씨를 사용하여 나머지 텍스트와 구별됩니다19.
  • 대문자와 소문자를 조합하십시오. 모든 글자를 대문자로 사용하면 소리 지르는 것처럼 보이기 때문에 사용하지 말라는 말을 들어봤을 수도 있습니다20. 저는 이것이 사실인지 아닌지 알지 못합니다21. 하지만 대문자와 소문자를 조합해야 할 최소한 하나의 설득력 있는 이유가 있습니다. 그것은 소문자가 높낮이가 다양하여 중요한 시각적 단서를 제공하기 때문입니다22. 예를 들어, 제가 아프리카 여행에 대해 쓰고 있다고 가정해 봅시다23. 자세히 보지 않고도 다음 단어들을 인식할 수 있습니까? ELEPHANTS AND GIRAFFES. 같은 크기의 글자는 바깥 모양이 단순한 직사각형이므로 모양만으로는 이 단어들을 파악하기 어려울 수 있습니다24. Elephants and giraffes에서 글자 "p"와 "g"가 아래로 내려가고 (descend), "l," "h," "t," 그리고 "f"가 위로 올라갈 때 (ascend), 이 단어들의 의미에 대한 시각적 단서가 생깁니다25. 여기에 이 단어들의 맥락(제가 아프리카 여행에 대해 쓰고 있다는 사실)을 이미 알고 있다는 사실을 더하면, 모양만으로 이 단어들을 파악할 가능성이 더욱 높아집니다26.
  • 왼쪽 여백을 정렬하십시오. 독자들이 각 줄의 같은 곳에서 읽기 시작할 수 있도록 본문 텍스트를 왼쪽으로 정렬(justify)하십시오27.
  • "적절한" 여백을 유지하십시오. 하지만 무엇이 적절할까요? 저의 건방진 대답은 보면 안다는 것입니다28. 좀 더 분석적인 대답은 적절한 여백이란 각 페이지에서 인쇄된 영역과 인쇄되지 않은 영역이 약 50/50 비율로 섞여 있다는 것을 의미합니다29.
  • 짧은 목록을 사용하십시오. 이 책의 디자인에서 볼 수 있듯이, 저는 목록을 선호합니다30. 하지만 저는 어느 정도의 절제를 촉구합니다31. 너무 많은 목록이나 각 목록에 너무 많은 항목으로 독자를 압도하지 마십시오32. 대신, 목록을 8개 이하의 항목으로 제한하도록 노력하십시오33. 그보다 더 많은 항목이 필요한 경우, 목록을 하위 그룹으로 나누십시오34. 예를 들어, 15가지 유형의 과일을 하나의 긴 목록으로 나열하는 대신, 다음과 같이 더 짧은 목록으로 나눌 수 있습니다35:
감귤류 과일: 멜론: 열대 과일:
자몽 캔털루프 바나나
레몬 카사바 망고
라임 허니듀 파파야
오렌지 머스크멜론 파인애플
수박 석류
     

실습 사례: 정보 디자인

Josiah Fisk은 평이한 언어와 정보 디자인을 결합하여 단순화된 사용자 중심 문서를 만드는 회사인 More Carrot의 창립자이자 사장입니다37. 우리는 2013년에 정보 디자인의 원칙에 대해 이야기했습니다38.

 

Fisk은 정보 디자인그래픽 디자인의 차이점을 설명했습니다39. 둘 다 동일한 도구를 많이 사용하지만, 목적은 다릅니다40. 그는

  • 그래픽 디자인은 문서의 느낌을 전달하기 위해 서체, 색상 또는 삽화 등을 사용하여 주의를 끄는 것에 더 가깝다고 설명했습니다41.
  • 정보 디자인은 동일한 요소들을 많이 사용할 수 있지만, 그 목적은 기능을 향상시키는 것입니다42.

Fisk은 "사람들이 '정말 멋지게 디자인된 양식이나 문서네'라고 말하기를 원하지 않습니다. 우리는 그들이 '양식을 작성하는 것이 생각보다 쉬웠다'라고 말하기를 원합니다"라고 말했습니다43.

 

Fisk은 디자인이 의료 문서의 기능을 개선할 수 있는 방법의 예시를 들었습니다44. 그는 "당신이 선 위에 써야 할지 아니면 선 아래에 써야 할지 확신할 수 없는 경우가 꽤 많다는 것이 놀랍습니다"라고 말했습니다45. Fisk은 어떤 줄에 써야 할지 또는 어떤 상자에 체크해야 할지를 명확하게 하기 위해 디자인을 사용할 것을 권장합니다46. 또 다른 권장 사항은 우편 주소와 같은 경우에도 얼마나 많은 정보가 필요한지에 대한 시각적 단서를 제공하는 것입니다47. "우편번호를 위한 공간이 전체 나머지 주소 공간만큼이나 크다면, 사용자는 양식이 어떤 정보를 요구하는지 확신할 수 없습니다"48.

 

챕터 35: 기술: E-헬스 💻

시작점

건강에 대해 소통하고 대면 방식 외의 방법으로 치료를 제공하는 데 있어 최근 많은 발전이 있었습니다49. 여기에는 원격 의료(telemedicine), 이메일, 환자 포털(patient portals) 및 오픈 노트(open notes)가 포함됩니다50. 저는 이것들을 총칭하여 E-헬스라고 부릅니다51. 아래에는 몇 가지 이야기, 예시, 그리고 실천 방법 제안이 있습니다52.

원격 의료 (Telemedicine)

"원격 의료"와 "원격 건강(telehealth)"이라는 용어는 임상 정보를 원격으로 소통하는 비슷하지만 정확히 같지는 않은 방식을 의미합니다53. 이는 종종 전화나 화상 회의를 통해 이루어집니다54. 주제는 일반적인 건강 문제이든 더 집중적인 임상 만남이든 다양할 수 있습니다55. 단순화를 위해 저는 둘 다 "원격 의료"라고 부릅니다56.

 

원격 의료는 대면 접촉을 줄여야 하는 긴급한 필요성을 촉발한 COVID-19 팬데믹으로 인해 2020년에 크게 확대되었습니다57. 이러한 변화는 갑작스러웠습니다58. 임상의들은 원격 의료를 수행하면서 동시에 최선의 방법을 배우고 있었습니다59.

 

가정의학과 의사이자 보건 문해력 연구자이자 옹호자인 Cliff Coleman, MD, MPH는 2021년에 우리가 대화했을 때 원격 의료의 장점과 단점, 그리고 이 새로운 형태의 건강 커뮤니케이션을 최대한 활용하는 방법에 대한 논문을 막 작성한 참이었습니다60.

 

Coleman은 팬데믹 기간 동안의 가치 외에도 원격 의료의 많은 이점을 보고 있습니다61. "수십 년 동안 많은 1차 진료 방문이 실제로 누군가를 대면할 필요가 없다는 것이 알려져 왔습니다"62. 그는 당뇨병 자가 관리의 예를 공유했습니다6363. "우리가 정말로 필요로 하는 것은 환자의 혈당이 왜 잘 조절되지 않는지에 대한 30분 간의 논의입니다. 그것이 반드시 그 사람을 물리적으로 만지는 것을 요구하지는 않습니다"64646464.

 

하지만 원격 의료 방문에는 단점도 있을 수 있습니다65. Coleman은 몸을 앞으로 숙이거나, 좋은 눈맞춤을 하거나, 비판단적인 표정을 짓는 것과 같이 대면 만남에서 공감과 비판단적 태도를 표현하기가 훨씬 더 쉽다고 말했습니다66. 그러나 이러한 비언어적 전략은 전화로만 소통할 때는 물론 불가능합니다67. Coleman은 이것들이 양방향 화상 통신에는 어떻게 적용되는지 아직 알려지지 않았다고 말합니다68.

 

보건 문해력 모범 사례를 바탕으로, Coleman은 원격 의료에서 다음과 같은 전략이 도움이 된다는 것을 발견했습니다69:

  • 명확한 안건을 가지십시오. Coleman은 환자에게 무엇이 중요한지 사전에 아는 것이 중요하다고 말했습니다70. 그는 환자들이 논의하고 싶어 하는 것을 파악한 다음, 그들이 이러한 주제들의 우선순위를 정하도록 돕는 것을 권장했습니다71. 그는 "저는 그것을 하는 데 필요한 만큼 시간을 씁니다"라고 말했습니다72. "그렇지 않으면 방문 시간이 할당된 시간을 훨씬 초과하고 환자들이 가장 염려하는 것에 도달하지 못할 수 있다는 것을 발견했습니다. 이것은 환자 만족도에 좋지 않으며, 제공자의 만족도에도 좋지 않습니다"73.
  • 의미 있는 방식으로 대화를 마무리하십시오.
    • 환자의 안건에 있는 모든 것을 다룬 후, Coleman은 핵심 사항을 요약합니다74.
    • 또한 그는 환자들에게 명확히 할 기회질문할 기회를 제공합니다75.
  • 이해를 확인하기 위해 티치백(teach-back)을 사용하십시오. Coleman은 항상 환자들이 방금 논의된 주제를 이해했는지 확인하고 싶어 합니다76. 원격 의료 통화에서 그는 "제가 여러분과 함께 있지 않기 때문에, 제가 잘 설명했는지 확인하고 싶습니다. 환자분의 말로 계획이 무엇인지 저에게 말씀해 주시겠어요?"라고 시작할 수 있습니다77. Coleman은 티치백이 통신 모드에 관계없이 중요한 전략이라고 말했습니다78.

이메일

이메일은 환자들이 임상의와 직접 소통하는 방법으로 사용이 증가하고 있는 것으로 보입니다79. 많은 이점이 있습니다80. 사람들은 편리한 시간에 응답할 수 있고, 메시지를 인쇄하고 저장할 수 있으며, 하이퍼링크를 추가하여 사람들이 더 많은 정보를 얻기 위해 클릭하기만 하면 됩니다81.

 

그러나 이메일은 또한 개인 정보 보호 및 보안에 대한 우려를 가져옵니다82. 예를 들어, 컴퓨터를 공유하는 사람들은 때때로 다른 사람을 위한 메시지에 접근할 수 있으며, 고용주는 직원들이 개인 계정을 사용하더라도 직장에서 보낸 개인 메시지를 읽을 수 있습니다83.

 

다음은 실습에 사용할 수 있는 몇 가지 제안입니다84:

  • 이메일을 의료 응급 상황에 사용해서는 안 된다는 점을 명확히 하십시오. 환자들은 이 통신 방식이 응급 상황을 위한 것이 아니라는 점을 완전히 이해해야 합니다85. 제공자가 메시지를 충분히 빨리 볼 것이라는 보장이 없으며, 환자가 필요한 조치를 취할 만큼 제때 응답을 읽을 것이라는 확신도 없습니다86. 보다 즉각적인 건강 문제에 대해서는 무엇을 해야 할지 환자들과 미리 이야기하십시오87.
  • 평이한 언어를 사용하십시오. 이메일 메시지를 읽기 쉽게 만드십시오88. 이것은 일반적인 1~2음절 단어, 최대 15단어의 짧은 문장, 그리고 2~3개의 문장으로 된 짧은 단락과 같은 평이한 언어 원칙을 사용하는 것을 의미합니다89. 이러한 원칙은 철자, 구두점, 어휘 오류가 많은 환자의 이메일에 회신할 때 훨씬 더 중요합니다90. 그러한 오류는 작성자가 문해력, 언어 또는 기술에 문제가 있다는 징후일 수 있습니다91.
  • 메시지에 회신하십시오. 환자들에게 언제 답장을 받을 수 있는지 알려주십시오. 예를 들어, 24시간 이내 또는 1~2일 이내 등입니다92. 메시지를 받았음을 환자들에게 알리고 도움을 받을 수 있는 전화번호가 포함된 자동 응답을 설정하는 것이 도움이 됩니다93.
  • 가장 적절한 응답 방식을 고려하십시오. 환자들이 이메일 메시지를 보낸다고 해서 반드시 같은 방식으로 회신할 필요는 없습니다94. 예를 들어, 나쁜 소식을 전달하거나 복잡한 치료 옵션을 논의할 때는 이메일을 사용하고 싶지 않을 수 있습니다95. 대신, 이러한 문제에 대해 더 이야기하기 위해 후속 전화 통화나 대면 약속을 주선하기 위해 이메일을 보낼 수 있습니다96.

환자 포털 (Patient Portals)

환자 포털은 환자들이 원할 때마다 개인 건강 정보에 쉽게 접근할 수 있는 보안 웹사이트입니다97. 여기에는 최근 방문, 약물 및 검사 결과에 대한 정보가 포함됩니다98. 이러한 쉽고 빠른 접근은 도움이 될 수 있지만, 임상의의 해석 없이 환자들이 검사 결과를 볼 때와 같이 문제가 될 수도 있습니다99.

 

Brian J. Zikmund-Fisher, PhD는 건강 데이터를 보다 직관적으로 의미 있게 만들기 위해 새로운 커뮤니케이션을 설계하고 평가하는 교수이자 연구원입니다100. 여기에는 환자 포털을 통해 접근하는 검사 결과를 환자들이 이해하는 데 도움이 되는 시각적인 방법이 포함됩니다101. 우리는 2018년에 대화했습니다102.

 

Zikmund-Fisher는 "대부분의 환자들은 결과를 해석하는 경험이 없으며, 얼마나 걱정해야 할지 모릅니다"라고 말했습니다103. 그의 연구는 환자들이 결과를 더 쉽게 이해하고 조치하는 데 도움이 되는 다양한 시각 자료 사용 방법을 확인했습니다104.

 

특히, 그는 단순히 표준(정상) 범위를 제공하는 것만으로는 충분하지 않으며, 환자들에게 더 많은 맥락이 필요하다고 언급했습니다105. 예를 들어, 효과적인 검사 결과 커뮤니케이션은 다음을 수행해야 합니다106:

  • 표준 범위 밖의 공간을 경계선 또는 고위험과 같이 위험 정도로 세분화하십시오107.
  • 환자들이 조치를 취해야 할 때의 명확한 기준점 제공하십시오108.
  • 환자의 실제 결과가 표준 범위를 벗어날 때 목표 범위를 보여주십시오109. 예를 들어, 2형 당뇨병 진단을 받은 사람의 경우, Alc (혈당 측정치) 결과 범위가 표준 범위를 벗어나더라도 그럼에도 불구하고 목표로 해야 하는 범위일 수 있습니다110.

Zikmund-Fisher가 배운 바와 같이, "시각적 디스플레이를 사용하는 것이 환자들이 검사 결과를 이해하고 너무 많이 걱정하지 않도록 돕는 데 차이를 만들 수 있다는 증거가 꽤 명확합니다"111.

오픈 노트 (Open Notes)

2021년 4월, 미국은 21세기 치유법(21st Century Cures Act)을 시행했습니다112. 이 법은 환자들이 안전한 웹사이트나 스마트폰 앱을 사용하여 8가지 유형의 임상 기록을 포함한 대부분의 개인 전자 건강 정보에 무료로 접근할 수 있도록 규정하고 있습니다113. 이는 환자들이 자신의 의료 기록에서 임상 기록에 접근할 수 있는 방식인 "오픈 노트"의 형태를 취할 수 있습니다114.

 

Susan Woods, MD, MPH는 일반 내과 의사이자 소비자 건강 정보학 전문가입니다115. 그녀의 연구는 오픈 노트를 포함하여 환자와 그 가족을 건강 및 건강 관리에 참여시키는 기술에 중점을 두고 있습니다116.

 

Woods와 저는 2016년에 대화했습니다117. 그녀는 처음에는 오픈 노트에 대해 회의적이었음을 인정했습니다118. 그녀는 이제 열렬한 지지자입니다119. 그녀는 이러한 변화가 환자와 제공자 모두의 관점을 이해하는 데서 비롯되었다고 말했습니다120.

 

Woods는 오픈 노트에 대한 환자들의 생각을 다룬 많은 설문조사와 연구를 살펴보았습니다121. "압도적인 비율의 사람들이 '네, 전적으로, 제 정보에 접근할 수 있기를 바랍니다'라고 말합니다"122.

 

우리는 일부 의사들이 처음 오픈 노트에 어떻게 반응했는지 논의했습니다123. Woods는 일부 의사들이 특정 정보가 환자들을 걱정하게 만들 수 있다고 우려했다고 말했습니다124. 이에 대한 그녀의 반응은 "그들에게 말해야 하지 않을까요? 그것을 전달해야 하지 않을까요?"였습니다125.

 

Woods는 환자들이 오픈 노트의 일부 의학 용어를 이해하는 데 어려움을 겪을 수 있음을 인정했습니다126. 그녀가 동료 의료진에게 한 조언은 "환자나 가족 구성원도 이것을 검토할 것이라는 점을 항상 염두에 두십시오. 그들에 대해 쓰는 것이 아니라, 그들에게 쓰십시오"였습니다127.

 

챕터 36: 기술: 온라인 교육 및 비디오 게임 🎮

시작점

기술은 원격 교육 및 온라인 게임 플레이와 같은 놀라운 일들을 가능하게 합니다128. 또한 기술은 텍스트, 애니메이션, 비디오, 음악 및 음성 요소를 사용하여 정보를 제시함으로써 멀티미디어를 가능하게 합니다129. 새로운 기술의 급속한 발전으로 인해 건강 교육에 기술을 사용할 수 있는 수많은 옵션이 있을 것입니다130. 이 챕터는 시작점입니다131.

온라인 교육

환자든 직원이든 교육은 가상 컨퍼런스 및 온라인 웨비나와 같이 원격으로 점점 더 많이 이루어지고 있습니다132. 이러한 방식으로 교육하는 것에는 분명히 이점이 있습니다133. 참가자들은 지역적 범위를 벗어날 수 있습니다134. 그들은 실시간으로 참여하거나 나중에 세션 녹화본을 시청하는 등 개인적으로 편리한 시간에 참석할 수 있습니다135.

 

솔직히 단점도 있습니다136. 적절한 기술에 접근할 수 없거나 기술 사용에 익숙하지 않은 사람들은 참여할 수 없을 수 있습니다137. 강사들은 멀리서 가르칠 때 청중의 관심과 참여 수준을 "읽을" 수 있는 방법이 제한적입니다138. 이로 인해 참가자의 비언어적 반응을 기반으로 콘텐츠나 속도를 조정하기가 어렵습니다139.

전략, 아이디어 및 제안: 온라인 교육

Mark Hagerty는 교육 설계자이자 학습 전문가입니다140. 우리는 2020년에 그가 "당신과 청중 또는 학생 사이에 기술의 장벽이 있을 때"를 위해 웨비나 및 기타 교육 프로그램을 만드는 것에 대해 이야기했습니다141.

 

Hagerty는 온라인 교육 프로그램 설계를 위한 권장 사항을 공유했습니다:

  • 팀과 함께 프로그램을 설계하십시오. 콘텐츠 전문가와 함께 프로그램을 설계하는 것 외에도, 프로듀서 역할을 할 다른 사람을 포함시키는 것이 좋습니다142. 프로듀서는 프로그램을 설계하는 데 도움을 줄 뿐만 아니라, 프로그램이 진행되는 동안 지켜보며 참가자의 기술적 질문에 응답할 수도 있습니다143.
  • 시간, 속도, 흐름을 고려하십시오. 분명히 온라인 교육은 대면 교육과 같지 않습니다144. Hagerty는 온라인 프로그램이 2시간을 넘지 않아야 하며, 가급적 1시간 미만이어야 한다고 권장했습니다145. 그는 속도, 흐름, 그리고 이야기, 슬라이드, 상호작용 기회를 언제 삽입할지를 고려한 개요를 작성하도록 권장했습니다146.
  • 슬라이드에 대해 결정하십시오. 정말로 모든 단어 기반 슬라이드가 필요합니까147? 저만이 그렇게 생각하는 것은 아닐 것입니다148. 대부분의 참가자들이 시각 자료를 좋아하지만, 어떤 종류와 얼마나 많은 것을 사용할지는 당신의 선택입니다149. 건강 문해력에 대해 가르칠 때, 저는 단어 기반 슬라이드보다는 시각적 슬라이드를 사용하는 것을 선호합니다150. 저는 이를 위해 그래픽 아티스트와 함께 작업합니다151. 청중의 피드백을 기반으로, 이러한 슬라이드는 보는 재미가 있을 뿐만 아니라 핵심 요점을 더 명확하게 만듭니다152.
  • 상호작용을 허용하십시오. 참가자들은 단순히 사실과 지침을 수동적으로 받는 사람이 아니라 참여하는 것을 좋아합니다153. 많은 온라인 교육 플랫폼은 채팅, 퀴즈, 투표 및 기타 형태의 상호작용을 위한 기능을 갖추고 있습니다154. 또한 참가자들이 연습 및 토론을 위해 소그룹으로 나뉠 수 있는 옵션도 있을 수 있습니다155.

온라인 게임

Nick Bowman, PhD는 비디오 게임 및 기타 대화형 미디어의 사용과 효과에 대해 가르치고, 연구하고, 글을 씁니다156. 2020년에 우리는 건강과 관련하여 온라인 게임에 대해 이야기했습니다157.

 

Bowman은 온라인 게임에는 능동적인 캐릭터 중심의 게임뿐만 아니라 브리지나 기타 카드 게임과 같은 활동을 포함하여 여러 유형이 있다고 설명했습니다158. 이러한 다양한 유형의 게임이 공통적으로 가지는 것은 각각 규칙과 정의된 목표 또는 결과를 가지고 있다는 것입니다159.

 

Bowman은 온라인 게임이 장점과 단점 모두를 가지고 있음을 인정했습니다160. 장점은 다음과 같습니다:

  • 스트레스 관리. Bowman은 비디오 게임이 정신적으로 건강하거나, 수행하거나, 편안함을 느끼는 능력을 손상시키는 스트레스 또는 기타 "유해한 기분 상태"를 경험하는 사람들을 어떻게 도울 수 있는지 연구했습니다161. Bowman은 "비디오 게임은 놀라울 정도로 몰입적입니다"라고 말했습니다162. "당신은 정보를 처리하고, 상대방에 대해 생각하고, 전략을 짜고, 기본적으로 많은 정신적 메모를 해야 합니다"163. 그는 "그렇게 하면서 동시에 스트레스를 받기는 어렵습니다"라고 덧붙였습니다164.
  • 주의력 증가. Bowman은 게임을 하는 것이 시각적 주의력과 정신적 회전을 필요로 한다는 것을 발견했습니다165. 그는 "당신은 2차원 화면을 보고 있지만, 종종 당신이 생각하는 것은 3차원입니다"라고 말했습니다166. "당신이 깨닫든 깨닫지 못하든, 당신은 그러한 근육을 연습하고 있는 것입니다. 땀을 흘리지는 않겠지만, 주의력이 증가하는 것을 발견할 수 있습니다"167.
  • 사회화. 온라인 게임은 종종 한 사람이 컴퓨터 앞에서 혼자 플레이하지만, 게임은 사회화를 촉진할 수 있다고 Bowman은 말했습니다168. 일부 초기 비디오 게임은 두 명 이상의 플레이어를 필요로 했습니다169. Bowman은 이것이 게임이 여러 컴퓨터의 구성 요소를 필요로 했기 때문이라고 말했습니다170. 나중에 사람들은 술집이나 아케이드와 같은 사교 공간에서 온라인 게임을 하기 시작했습니다171. 이제 채팅과 같은 내장된 상호작용 기능 덕분에 플레이어들은 원격으로 서로 상호작용할 수 있습니다172. Bowman이 발견한 바와 같이, "사람들은 비디오 게임을 하는 만큼 인생에 대해 서로 이야기하는 데 많은 시간을 보냅니다"173.

온라인 게임에는 단점도 있을 수 있습니다174. 여기에는 원래 계획했던 것보다 이 활동에 더 많은 시간을 보내는 것이 포함됩니다175. 저는 온라인 브리지를 많이 플레이하면서 시간이 휙 지나가고, 최선의 의도에도 불구하고 멈추기 전에 여러 시간이 지나간다는 것을 알고 있습니다176. Bowman은 이것을 사람들이 본질적으로 동기 부여되는 활동에 몰두할 때의 "몰입 상태(flow state)"라고 부른다고 말했습니다177. 또 다른 중요한 우려는 평소에 상호작용하지 않을 사람들이 온라인 게임을 함께 할 때 괴롭힘의 가능성입니다178.

 

온라인 게임은 건강에 대해 가르치는 도구로 점점 더 많이 사용되고 있습니다179. MedlinePlus는 온라인 건강 게임을 검색하기 시작하기에 좋은 장소가 될 수 있습니다180. 이 목록에는 아동 영양, 약물 사용 및 중독, 시력 손상과 같은 주제에 대한 광범위한 대화형 게임이 포함되어 있습니다181.

 

챕터 37: 기술: 소셜 미디어 및 팟캐스트 📱🎧

시작점: 소셜 미디어

디지털 콘텐츠에는 블로그, 트윗, 팟캐스트 및 다양한 형태의 소셜 미디어가 포함됩니다182. 일부 기술 전문가들은 이러한 방식으로 콘텐츠를 공유하는 것이 인쇄술, 라디오 및 텔레비전의 발명만큼이나 커뮤니케이션의 중요한 이정표라고 믿습니다183. 그러나 물론 이것은 개인 정보 보호 및 신뢰성과 같은 매우 현실적인 우려와 같은 위험도 가져옵니다184.

 

오늘날 디지털 콘텐츠는 건강 커뮤니케이션을 포함하여 우리 삶의 모든 측면에서 사용되고 있습니다185. Pamela Katz Ressler, MS, RN, HNB-BC는 소셜 미디어를 포함하여 회복력을 구축하는 전문가이자 간호사입니다186. 2017년 인터뷰에서 Ressler는 환자 교육의 보조 수단 및 동료 지원을 위한 포럼으로 소셜 미디어를 사용하는 예시를 공유했습니다187:

  • 환자 블로그. Ressler는 환자 블로그를 자신의 질병 경험에 대한 표현으로 생각합니다188. 그녀는 블로그가 환자들이 덜 외롭다고 느끼고 질병이나 간병 상황을 더 잘 통제하는 데 도움이 될 엄청난 잠재력을 제공한다고 말했습니다189.
  • 동료 간 온라인 건강 커뮤니티. 이것들은 환자들이 동일하거나 유사한 질병을 가진 다른 사람들과 경험을 공유할 수 있는 포럼을 제공합니다190. 여러 면에서 동료 간 온라인 커뮤니티는 전통적인 대면 지원 그룹과 같습니다191. Ressler는 온라인 만남의 이점에 대해 열광했습니다192192. "우리가 예전에 식탁이나 뒷마당 울타리를 사이에 두고 했던 것과 크게 다르지 않습니다"라고 그녀는 말했습니다193193193. 단, 이제 "우리는 이것을 글로벌 디지털 커뮤니티에서 하고 있습니다"194.
  • 트윗. 트윗은 소셜 네트워크 Twitter에 게시되는 매우 짧은 통신 내용입니다195. 이는 특정 질병이나 건강 상태에 대한 최신 뉴스와 정보를 신속하게 공유하는 효과적이고 효율적인 방법이 될 수 있습니다196.
  • 트윗 채팅. 이것은 많은 Twitter 사용자가 동일한 해시태그를 사용하여 같은 주제의 트윗을 연결하면서 같은 시간에 특정 주제에 대한 정보를 공유하는 것입니다197. Ressler는 "아름다운 점은 많은 다른 목소리가 나오고 있다는 것입니다. 단점은 소방호스에서 물을 마시는 것과 같을 수 있다는 것입니다"라고 말했습니다198. 실시간으로 참여할 수 없는 사람들은 해당 해시태그를 검색하여 나중에 트윗 채팅에 접근할 수 있습니다199.

실습 사례: 소셜 미디어는 개인적인 연결을 만듭니다

Pam Ressler의 소셜 미디어에 대한 관심은 간호사로서가 아니라 엄마로서의 역할에서 시작되었습니다200. 2001년에 그녀의 14세 아들 Nick이 진행성 암으로 입원했습니다201. 블로그와 소셜 미디어가 아직 발명되지 않았지만, Nick은 IM(인스턴트 메시징, 오늘날의 문자 메시지와 유사)으로 학교 친구들과 연락하는 것을 좋아했습니다202. Ressler는 비공식적인 대화에서 "Nick은 자신의 암 진단이 전면에 나오지 않는 아이가 되기를 원했습니다"라고 말했습니다203. 그녀는 친구들과 IM을 함으로써 Nick이 그의 엄청나게 어려운 상황에도 불구하고 정상적인 감각을 유지할 수 있었다고 말했습니다204.

 

슬프게도 Nick은 세상을 떠났습니다205. 그러나 기술을 통한 연결에 대한 그의 열정은 계속되고 있습니다206. Ressler는 그때나 지금이나 소셜 미디어를 사용하여 사람들이 진단이나 한계에 관계없이 연령에 적합하고 번거로움 없는 방식으로 놀랍고 개인적인 연결을 만들 수 있는 엄청난 잠재력을 보고 있습니다207.

전략, 아이디어 및 제안: 소셜 미디어

건강을 위한 온라인 커뮤니케이션의 사용은 빠르게 변화하고 있습니다208. 모범 사례에 관해서는 아직 알아내야 할 것이 많다는 것은 인정합니다209. 다음은 도움이 될 수 있는 두 가지 예시입니다210.

  • 디지털 전략을 가지십시오.
    • Leigh Curtin-Wilding, MSc는 마케팅 커뮤니케이션 전문가입니다211. 그녀는 또한 보스턴 대학교 대학원 보건 커뮤니케이션 프로그램의 책임자이자 강사입니다212. 2018년에 그녀와 저는 디지털 전략을 갖는 것의 중요성에 대해 이야기했습니다213. Curtin-Wilding은 이 전략이 사용자가 누구인지, 그들이 어떻게 정보에 도달했는지, 무엇을 위해 사용하고 있는지, 그리고 디지털 콘텐츠에 얼마나 오랫동안 참여하고 있는지를 더 잘 이해하기 위한 로드맵 역할을 할 수 있다고 말했습니다214214214214. 그녀는 많은 디지털 플랫폼에 민첩하고 적응 가능한 콘텐츠를 만들 것을 권장했습니다215. 여기에는 트윗이나 기타 소셜 메시징에 적용될 수 있는 헤드라인, 사용자에게 던지는 질문, 짧은 정보 폭발이 포함됩니다216.
  • 정보 요구 사항에 맞게 콘텐츠를 선별하십시오.
    • Andy Rosenberg는 만성 또는 희귀 질환을 가진 사람들을 위해 선별된 콘텐츠를 제공하는 온라인 교육 도구인 Responsum Health를 설립했습니다217. 2017년에 Rosenberg와 저는 환자들이 만성 질환 여정의 어느 단계에 있는지에 따라 정보를 제공하는 것의 중요성에 대해 이야기했습니다218. 그는 이 여정의 단계에는 증상을 알아차리는 것, 진단을 받는 것, 연구하는 것, 치료를 받는 것, 그리고 질병을 안고 살아가는 것이 포함된다고 설명했습니다219. 사람들은 이러한 각 단계에서 매우 다른 정보 관심사와 요구 사항을 가질 수 있습니다220.

시작점: 팟캐스트

여러 면에서 팟캐스트는 라디오 쇼와 같습니다221. 청취자들은 집중된 주제에 대한 인터뷰를 포함하여 그들이 관심 있는 것을 들을 수 있기 때문입니다222. 그러나 라디오와 달리 청취자들은 자신의 오디오 장치를 사용하여 원할 때마다, 원하는 방식으로 팟캐스트에 접근합니다223.

전략, 아이디어 및 제안: 팟캐스트

저는 오랫동안 팟캐스터였습니다224. 2008년에 저는 팟캐스트 시리즈 Health Literacy Out Loud (HLOL)을 만들었고, 그 프로듀서와 호스트를 계속하고 있습니다225. 시작부터 저는 Adam Weiss와 오디오 편집자로 함께 일해 왔습니다226. 그는 또한 팟캐스트 및 미디어 컨설턴트이기도 합니다227. 다음은 팟캐스트 시리즈를 시작하는 것에 대한 저희의 몇 가지 권장 사항입니다228:

  • 팟캐스트 형식을 선택하십시오. 가장 일반적인 세 가지 형식은 다음과 같습니다229:
  1. 고도로 제작된 라디오 쇼. 이것들은 종종 나중에 함께 믹싱되는 여러 개의 개별 세그먼트로 구성됩니다230. Ira Glass의 This American Life가 한 예입니다231.
  2. 강의 형식. 이것은 한 사람만이 이야기하는 것입니다232. 그러나 특별히 잘 만들어지거나 주제가 매우 흥미롭지 않다면, 사람들은 긴 강의 형식의 팟캐스트를 듣는 것을 지루하게 느낄 수 있습니다233.
  3. 인터뷰. 이것을 잘 하려면 인터뷰 진행자는 뛰어난 질문자 및 청취자여야 하며, 호스트보다 게스트가 더 빛나도록 하는 데 전념해야 합니다234. 그것이 제가 목표로 하는 것입니다235.
  • 시간에 대해 결정하십시오. 여기에는 각 팟캐스트의 길이와 새로운 에피소드의 빈도가 포함됩니다236. HLOL 에피소드의 상한선은 약 25분이며, 이는 종종 누군가의 통근 시간이나 운동 시간 범위에 맞습니다237. 최소한 매월 하나의 새로운 팟캐스트를 게시하도록 노력하십시오238. 그렇게 하면 청취자들이 다음 에피소드를 언제 들을 수 있는지 예상할 수 있습니다239.
  • 필요한 기술을 습득하십시오. 요즘 많은 팟캐스트는 스튜디오나 대면 방식보다는 전화로 녹음됩니다240. 가능하다면, 각 사람의 목소리가 별도의 트랙에 녹음되는 스테레오 소프트웨어를 사용하십시오241. 이것은 편집할 때 도움이 됩니다242. 좋은 품질의 오디오를 위해서는 휴대폰이나 컴퓨터에 내장된 마이크 대신 플러그인 마이크를 사용하는 것이 가장 좋습니다243.
  • 팟캐스트를 편집하십시오. 물론 직접 편집할 수 있는 소프트웨어가 있지만, 저는 경험 많은 오디오 편집자와 함께 작업하는 것을 선호합니다244. 각 HLOL 녹음 후, 저는 Weiss에게 오디오 파일과 함께 편집 메모를 보냅니다245. 여기에는 불필요한 소음을 줄이거나 잘못 발음된 단어를 올바른 단어로 대체하는 것과 같은 구체적인 요청이 포함됩니다246. Weiss는 또한 "음"이나 "어"와 같이 반복되지만 불필요한 단어들을 정리합니다247. 그러나 제가 특별히 요청하지 않는 한 어떠한 콘텐츠도 삭제하거나 변경하지 않습니다248. Weiss는 자신이 오디오 편집자로서 하는 일을 "저는 당신이 당신처럼 들리게 하지만, 더 좋게 만듭니다"라고 설명합니다249.

 

챕터 38: 유니버설 디자인 ✨

시작점

유니버설 디자인장애를 가진 사람들의 구체적인 요구 사항뿐만 아니라 모든 사람이 나이가 들면서 직면하는 보다 보편적인 변화를 고려하여 제품, 환경 및 커뮤니케이션을 설계하는 개념을 설명합니다250.

 

인도에 있는 경사로(curb cuts)는 건축 환경에서의 유니버설 디자인의 한 예입니다251. 그것들은 휠체어를 탄 사람들에게 도움을 주고, 유모차를 끄는 부모들과 바퀴 달린 여행 가방을 가진 여행자들에게도 유용합니다252. 마찬가지로, 건강 커뮤니케이션에서 유니버설 디자인은 모든 사람에게 도움이 될 수 있습니다253. 여기에는 거의 모든 사람이 보고, 이해하고, 사용할 수 있는 읽기 쉬운 소책자사용하기 쉬운 웹사이트가 포함됩니다254.

 

여러분이 병원이나 클리닉에 처음 온 환자나 방문객이라고 상상해 보십시오255. 여러분은 아프거나 두렵고, 아마도 가야 할 곳을 찾는 데 어려움을 겪고 있을 수 있습니다256. 건강 이해에 영향을 미치는 것은 단순히 서면 자료, 웹사이트 및 구두 커뮤니케이션만이 아닙니다257. 돌봄 환경도 중요합니다258.

전략, 아이디어 및 제안: 건강 커뮤니케이션

Valerie Fletcher는 매사추세츠주 보스턴에 있는 인적 중심 디자인 연구소(Institute for Human Centered Design, IHCD)의 전무이사입니다259. 그녀와 저는 2001년과 2010년에 건강 커뮤니케이션에 적용되는 유니버설 디자인에 대해 이야기했습니다260.

 

Fletcher는 유니버설 디자인이 특별하거나 분리된 디자인 없이 가장 광범위한 상황에서 작동하는 가장 광범위한 사람들을 중심으로 장소, 물건 및 정보를 디자인하는 프레임워크라고 말했습니다261. 그녀는 "디자인이 장애를 가진 사람에게 잘 작동한다면, 아마도 모든 사람에게 더 잘 작동할 것입니다"라고 말했습니다262.

 

Fletcher는 사람들이 더 오래 살거나 심각한 질병과 사고에서 살아남으면서 종종 직면하는 기능적 한계에 대해 이야기했습니다263. 그녀는 이것들을 장애나 결함보다는 "능력의 다양성"으로 생각하는 것을 선호합니다264. 이것들은 반드시 명확하게 드러나지는 않습니다265. Fletcher는 약간의 청력 손실이 있는 환자가 자신의 의료 제공자가 말하는 핵심 요점을 놓칠 수 있는 예를 들었습니다266. 그녀는 "제공자도 환자도 이러한 일이 일어나고 있다는 것을 인지하지 못할 가능성이 매우 높습니다"라고 말했습니다267.

 

Fletcher는 건강 커뮤니케이션에서의 유니버설 디자인을 위한 몇 가지 전략을 공유했습니다:

  • 중요한 정보를 중복되는 방식으로 제시하십시오. 이것은 서면 형식과 함께 비디오 또는 삽화로 동일한 정보를 제공하는 것일 수 있습니다268.
  • 지나치게 양식화되지 않은 글꼴을 선택하십시오. 일부 사람들은 글자에 작은 "발"이나 "날개"가 있는 세리프 글꼴을 선호합니다269. Times New Roman이 한 예입니다270. 다른 사람들은 그러한 날개가 없는 산세리프 글꼴(때때로 "블록 글자"라고도 함)을 선호하며, Arial이 그 예입니다271. 어떤 유형의 글꼴이 가장 좋은지에 대해서는 아직 디자인 전문가들 사이에 합의가 거의 없습니다272.
  • 일반 텍스트에는 12에서 16포인트 사이의 글자 크기를 사용하십시오. Fletcher는 12포인트보다 작은 글자는 대부분의 사람들이 보기 어렵다고 말했습니다273. 16포인트보다 큰 글자는 대부분의 사람들이 읽고 싶어 하지 않는 더 많은 페이지를 초래할 수 있습니다274.
  • 배경과 글자 사이에 충분한 대비를 두십시오. 종종 이것은 흰색 또는 밝은 색 배경에 어두운 글자입니다275. 그러나 일부 사람들은 "역대비(reverse contrast)"를 선호하며, 이는 어두운 배경에 밝은 인쇄입니다276. Fletcher는 디자인의 중요한 요소에서 두 가지 선호도를 모두 수용할 수 있는 방법을 찾도록 권장했습니다277. 제목과 제목에는 역대비를 사용하고, 본문 텍스트에는 표준 글자를 사용하는 것이 한 예입니다278.
  • 평이한 언어로 작성하십시오. 이것은 독자들이 이미 알고 있는 단어와 용어를 사용하고, 중요한 새로운 용어를 그들이 이해할 수 있는 방식으로 설명하는 것을 의미합니다279.
  • 웹사이트 사용자에 대해 폭넓게 생각하십시오. 여기에는 시력 손실이 있는 사람들의 요구 사항뿐만 아니라 인지적 또는 학습 장애가 있는 사용자도 포함됩니다280. Fletcher는 사용자들이 온라인 정보를 더 쉽게 찾고 사용할 수 있도록 하는 많은 방법이 있다고 말했습니다281. 그녀는 웹 접근성 이니셔티브(Web Accessibility Initiative)에서 더 많이 배울 것을 권장했습니다282.
  • 독자와 웹사이트 사용자를 대표하는 사람들의 의견을 구하십시오. 인쇄물 및 온라인 정보를 디자인할 때 그들의 피드백을 요청하십시오283. 필요한 변경을 할 때 그들의 권장 사항을 고려하십시오284. 그런 다음 여러분의 자료가 매력적이고, 사용 가능하며, 이해하기 쉬운지 확인하기 위해 다시 그들의 피드백을 요청하십시오285.

실습 사례: 동물원이 내비게이션에 대해 가르쳐 줄 수 있는 것

이상하게도, 제가 시카고 동물 학회(Chicago Zoological Society)의 브룩필드 동물원(Brookfield Zoo)에 있는 코끼리 우리를 방문했을 때 건강 문해력이 떠올랐습니다286. 저는 전시물에 대해 질문이 있었고, 갑자기 바로 앞에 있는 표지판에서 답을 발견했습니다287. 그것은 너무 잘 배치되어 있어서 의료 분야에 종사하는 우리가 동물원으로부터 무엇을 배울 수 있을지 궁금하게 만들었습니다288.

 

알아보기 위해 저는 당시 시카고 동물 학회의 기획 및 지역 사회 관계 담당 부사장이었던 Jo-Elle E. H. Mogerman, PhD와 학회의 공공 프로그램 관리자였던 Andre Copeland에게 연락했습니다289. 그들은 동물원 방문객들이 가고 싶어 하는 곳으로 가고 그곳에 가는 동안 배울 수 있도록 돕는 데 있어 표지판의 디자인, 문구 및 배치의 역할에 대해 설명했습니다290.

 

Mogerman과 Copeland는 또한 매슬로우의 욕구 단계에 대해 이야기했으며, 방문객에게 특정 시점에서 가장 중요한 것이 무엇인지 염두에 둔다고 말했습니다291. 예를 들어, 사람들이 브룩필드 동물원에 입장할 때 종종 화장실과 식사할 곳의 위치에 대해 먼저 묻습니다292. Mogerman과 Copeland의 의견과 저의 의견으로는, 환자와 가족에게 가장 중요한 것이 무엇인지 고려하는 것이 의료 시설에서도 똑같이 효과적일 수 있습니다293.

전략, 아이디어 및 제안: 돌봄 환경

많은 사람들이 다양한 관점에서 돌봄 환경에 대한 우리의 지식에 기여했습니다294. 아래 제안은 건강 문해력, 건축 및 유니버설 디자인 전문가들과의 인터뷰 및 대화를 기반으로 합니다295.

 

건강 이해는 우리가 말하거나 하는 것뿐만 아니라 우리가 다른 사람들과 만나는 환경에도 달려 있습니다296. 여러분이 일하는 건축 환경을 비판적으로 살펴보십시오297. 고려해야 할 몇 가지 측면은 다음과 같습니다:

  • 외부 입구. 병원과 클리닉은 사람들이 온갖 문으로 들어오고 나가는 바쁜 장소입니다298. 환자와 방문객이 어떤 문을 사용해야 할지 어떻게 결정하는지 고려하십시오299. 때로는 "Ambulatory Entrance"와 같은 표지판이 혼란을 가중시킵니다. 왜냐하면 환자들은 이 입구가 환자(patients)를 위한 것이 아니라 구급차(ambulances)를 위한 것이라고 생각할 수 있기 때문입니다300. 대신, "Patient Entrance"와 같이 더 단순하고 익숙한 문구를 사용하십시오301.
  • 내비게이션(Navigation). 이것은 처음 온 사람들이 어디로 가야 할지 빠르고 정확하게 파악할 수 있다는 것을 의미합니다302. 직관적이지 않다면, 단순히 서면 표지판이 아닌 직원들이 있는 "도움 데스크"를 두는 것과 같이 내비게이션을 더 쉽게 만들 방법을 찾으십시오303.
  • 지도. 글꼴 크기가 사람들이 볼 수 있을 만큼 충분히 큰지 확인하십시오304. 지도가 마지막으로 발행된 이후로 부서가 이동하지 않았는지 확인하십시오305. 사람들이 알고 찾고 있는 것과 일치하는 문구를 사용하십시오. 예를 들어, "Women's Health" 대신 "Mammogram"과 같이 사용하십시오306. 그리고 지도가 이러한 모든 기준을 충족하더라도, 지도를 사용하지 못하거나 선호하지 않는 사람들이 항상 있을 것임을 아십시오307.
  • 표지판(Signage). 사용하는 단어를 일관성 있게 유지하십시오. 예를 들어, 식사할 곳을 항상 "coffee shop" 또는 "cafeteria"라고 부르십시오308. 이 동일한 문구를 출입구 표지판, 시설 지도 및 구두 안내에서 사용하십시오309.
  • 음향. 환자들과 만나는 방에 시끄러운 에어컨이 있습니까310? 그렇다면 유지 보수 담당자에게 배경 소음을 줄이도록 요청하십시오311. 또는 음향 방해가 적은 다른 곳에서 만나십시오312.
  • 조명. 방은 사람들이 서로를 명확하게 볼 수 있도록 충분히 밝아야 합니다313. 청력 손실이 확인되지 않은 사람이라도 말하는 단어에 대한 추가 단서를 얻기 위해 여러분의 얼굴을 볼 수 있습니다314. 또한 적절한 조명은 사람들이 읽는 것을 더 잘 보는 데 도움이 됩니다315.
  • 둘러보기 및 감사(Audits). 돌봄 환경이 내비게이션하기 쉬운지 알아보는 가장 좋은 방법 중 하나는 처음 온 사람과 동행하여 그들이 시설 주변을 돌아다니는 것을 지켜보는 것입니다316. 그들의 경험이 다른 사람의 경험과 같을 것이라고 확신할 수는 없지만, 이러한 유형의 둘러보기는 잠재적인 문제에 대한 인식을 높일 수 있습니다317.

챕터 39: 시각 자료 🖼️

시작점

시각 자료에는 픽토그램, 아이콘, 사진, 해부학적 다이어그램, 만화 및 행동이나 아이디어를 전달하는 기타 이미지가 포함됩니다318. 많은 사람들이 시각 자료를 즐기고 배웁니다319. 여기에는 시각적 학습자(보는 것, 읽는 것 또는 보여주는 것을 통해 가장 잘 배우는 사람들)뿐만 아니라 단순히 단어가 아닌 삽화를 통해 도움을 받는 제한된 문해력 또는 언어 능력을 가진 사람들도 포함됩니다320.

 

항공 산업은 각 좌석에 그림 기반의 비상 지침을 제공함으로써 이를 잘 수행하는 한 예입니다321. 동일한 원칙이 단일 페이지 사실 정보지, 접는 소책자 또는 다중 페이지 지침과 같은 건강 자료에도 적용될 수 있습니다322.

실습 사례: 시각 자료는 환자의 이해를 돕습니다

여기에 한 동료가 저에게 공유해 준 이야기가 있습니다323. 66세의 일반 계약자인 Herb은 몇 년 전 심각한 심장마비를 겪었습니다324. 그의 의사는 심장 혈관과 심실을 검사하기 위해 응급 관상동맥 조영술을 시행했습니다325. 시술 후, Herb의 의사는 무슨 일이 일어났는지 설명하고 심장과 동맥의 간단한 선 그림을 그에게 주었습니다326. 그녀는 그의 각 동맥이 막힌 곳에 색을 칠하고 옆에 얼마나 막혔는지 적었습니다327.

 

무엇이 잘못되었는지 너무나 명확하게 보았기 때문에 Herb은 심장 재활 프로그램에 참여하고 식단과 운동 습관을 바꾸는 데 기꺼이 동의했습니다328. 사실, Herb은 너무 잘해서 심혈관 질환으로 방금 진단받은 다른 환자들과 이야기해 달라는 요청을 받았습니다329.

 

Herb이 놀랍고 실망스럽게도, 그가 이야기한 100명이 넘는 사람들 중 단 한 명도 그가 받은 것과 같은 "심장 그림"을 받은 적이 없었습니다330. 그들은 종종 Herb의 의사가 그에게 준 것과 같은 그림이 자신의 진단과 치료 계획을 더 잘 이해하는 데 어떻게 도움이 될 수 있었을지 언급했습니다331.

전략, 아이디어 및 제안

  • 필요한 삽화를 구하십시오. 필요한 삽화를 구하는 방법에는 여러 가지가 있습니다332. 무료 또는 저렴한 시각 자료를 온라인에서 찾아보는 것으로 시작할 수 있습니다333. 저는 종종 Google 이미지를 통해 검색을 시작합니다334. 마음에 드는 이미지를 찾으면 자유롭게 사용할 수 있는지 확인하거나, 저작권 허가를 얻기 위한 지침을 따르십시오335. 또 다른 방법은 여러분만을 위한 시각 자료를 만들 그래픽 아티스트, 사진작가 또는 만화가를 고용하는 것입니다336. 저는 이렇게 하며, 종종 Rotate Graphics의 Mark Tatro와 함께 작업했습니다337. 물론, 직접 삽화를 만들거나 예술적인 동료나 친구에게 도움을 요청하는 선택권도 항상 있습니다338.
    • 여러분 자신이 아티스트일 때의 몇 가지 조언:
      • 가장 중요한 요소만 포함하십시오. 저의 피부과 의사는 최근 제 발가락에서 제거한 점에 대한 즉흥적인 그림을 그렸습니다339. 그녀는 점이 얼마나 퍼졌는지 보여줄 충분한 세부 사항만 포함했습니다340. 이 그림은 그녀의 말보다 더 저에게 진단이 제가 두려워했던 것만큼 심각하지 않다는 것을 확신시켜 주었습니다341.
      • 환자들에게 여러분의 그림을 보관하고 싶은지 물어보십시오. 여러분의 그림이 특별하지 않다고 생각할 수도 있지만, 환자들은 그것이 매우 도움이 된다고 생각할 수 있습니다342. 환자들이 여러분의 그림을 보관하고 싶은지 물어보십시오. 심지어 여러분이 진찰대 종이에 그림을 그렸더라도 말입니다 (의사가 제 점을 스케치했을 때처럼)343. 그런 다음 환자들이 나중에 이 그림의 의미를 정확하게 기억할 수 있도록 몇 가지 핵심 단어를 추가하십시오344.
      • 정말로 예술적 재능이 부족하다면, 삽화가 있는 시트를 기반으로 사용하고 단어나 숫자를 추가하거나 영역을 강조하여 메시지를 개인화하는 것을 고려하십시오345.
  • 필요한 삽화를 구하십시오.
    • 필요한 삽화를 구하는 방법에는 여러 가지가 있습니다332. 무료 또는 저렴한 시각 자료를 온라인에서 찾아보는 것으로 시작할 수 있습니다333. 저는 종종 Google 이미지를 통해 검색을 시작합니다334. 마음에 드는 이미지를 찾으면 자유롭게 사용할 수 있는지 확인하거나, 저작권 허가를 얻기 위한 지침을 따르십시오335. 또 다른 방법은 여러분만을 위한 시각 자료를 만들 그래픽 아티스트, 사진작가 또는 만화가를 고용하는 것입니다336. 저는 이렇게 하며, 종종 Rotate Graphics의 Mark Tatro와 함께 작업했습니다337. 물론, 직접 삽화를 만들거나 예술적인 동료나 친구에게 도움을 요청하는 선택권도 항상 있습니다338.
  • 민감성과 존중을 보이십시오.
    • 현실적이고 사람들이 가장 좋은 모습을 보여주는 시각 자료를 선택하십시오346. 예를 들어, 일반적인 건강 문제에 대해 작성할 때는 단순히 아프거나 허약한 사람이 아닌 활동적인 사람들을 포함하십시오347. 가능하다면, 청중의 문화를 대표하십시오348. 이는 야구 모자뿐만 아니라 베레모나 터번을 쓴 남성들의 사진을 포함하는 것일 수 있습니다349. 포괄적인 사진을 위한 자료로는 Black Illustrations와 The Gender Spectrum Collection이 있습니다350.
  • 주제에 적합한 시각 자료를 선택하십시오.
    • 예를 들어, 유아 관리에 대해 작성할 때는 유머러스하고 만화 같은 캐릭터를 사용할 수 있지만, 심각한 진단에 대한 소책자에는 더 차분한 삽화를 사용할 수 있습니다351. 용지의 색상도 고려하십시오352. 저는 아직도 밝은 갈색 종이에 인쇄된 대장 내시경에 대한 사실 정보지가 생각납니다353. 제 겸손한 의견으로는 좋은 색상 선택이 아닙니다354.
  • 신체 부위만이 아닌, 사람들을 전체적으로 보여주십시오.
    • 비장과 같이 신체의 한 부분에 대해서만 소통할 때, 해부학의 이 측면만을 보여주고 싶은 유혹이 있습니다355. 비장이 어디에 있고 신체 내에서 어떻게 맞는지를 독자들이 볼 수 있도록 비장이 명확하게 레이블링된 전신 사진을 최소한 하나 이상 포함하는 것이 좋습니다356. 또한 이는 일부 사람들, 특히 폭력이나 전쟁으로 트라우마를 입은 사람들이 불쾌하게 느낄 수 있는 "분리된 신체 부위"를 보여주는 것을 피할 수 있습니다357.
  • 그림과 텍스트를 결합하십시오.
    • 특히 복잡한 정보를 설명할 때는 시각 자료만으로는 거의 충분하지 않습니다358. 이해를 높이기 위해 각 시각 자료 아래에 간단한 문구의 캡션을 포함하십시오359. 캡션은 독자들이 무엇을 보고 있는지 아는 데 도움이 될 뿐만 아니라, 핵심 아이디어와 행동을 강화합니다360.
  • 상징이 항상 이해되는 것은 아님을 인식하십시오.
    • 상징은 다른 유형의 시각 자료와 마찬가지로 해석의 대상입니다361. 예를 들어, 칼과 포크 옆에 있는 약병 그림은 약을 식사와 함께 복용해야 함을 보여주기 위한 것일 수 있습니다362. 그러나 공동의 서빙 그릇에서 손으로 음식을 먹는 국가 출신인 사람들에게는 이 상징이 같은 의미나 관련성을 갖지 않을 수 있습니다363.
  • 시각 또는 인지 장애가 있는 사람들의 요구를 고려하십시오.
    • 많은 대비를 두어 시각 자료를 보기 쉽게 만드십시오364. 일반적으로 이것은 흰색, 상아색, 황갈색 또는 기타 밝은 색 용지에 검은색 잉크를 의미합니다365. 메시지를 전달하기 위해 화려한 인쇄나 삽화에 의존하지 마십시오366. 일부 사람들은 같은 색상의 두 가지 색조를 구별하지 못하거나 색상을 전혀 보지 못할 수 있습니다367. 또한, 사람들이 주의를 집중할 곳을 어렵게 만드는 워터마크와 같은 장식적인 배경은 피하십시오368.
  • 이해를 확인하십시오.
    • 모든 형태의 커뮤니케이션과 마찬가지로, 독자들이 시각 정보를 이해하고 사용할 수 있는지 확인하십시오369. 인쇄물 및 웹사이트 자료의 경우, 삽화, 색상 및 상징이 매력적이고 유익한지에 대한 피드백을 요청하십시오370. 대면 만남에서 그림을 스케치하는 경우, "제가 얼마나 그림을 잘 그리는지 봅시다. 이 그림은 당신에게 무엇을 의미합니까?"와 같이 가벼운 마음으로 시작할 수 있습니다371.

실습 사례

시각 자료에 대한 하나의 올바른 선택은 없습니다372. 어떤 시각 자료를 사용할지 결정할 때 청중의 요구 사항과 여러분의 창의적인 관심, 재능 및 자원을 고려하십시오373.

  • 픽토그램. 2020년에 저는 CommunicateHealth의 그래픽 디자이너인 Mareika Phillips와 건강 커뮤니케이션에서 픽토그램을 사용하는 것에 대해 이야기했습니다374. Phillips는 픽토그램이 아이디어를 단순하거나 문자 그대로의 방식으로 표현하는 그림 또는 이미지라고 설명했습니다375. 그들은 인지 장애, 읽기 문제가 있거나 스트레스를 느끼는 사람들에게 특히 도움이 될 수 있습니다376. Phillips는 건강 자료에서 픽토그램을 사용하는 팁을 공유했습니다:
    • 픽토그램이 전달하려는 콘텐츠를 지원하는지 확인하십시오. 단지 시각 자료를 포함하기 위해 시각 자료를 포함하지 마십시오377.
    • 일관된 시각적 스타일을 사용하십시오. 
      • 하나의 문서에 여러 픽토그램을 포함할 때 Phillips는 일관성을 권장합니다378. "하나에는 실루엣을 사용하고, 다른 하나에는 윤곽선을 사용하고, 그다음에는 완전히 채색된 픽토그램을 사용하지 마십시오"379.
    • 추상적인 상징주의를 피하십시오. 
      • 이것은 다양한 청중과 소통할 때 특히 중요합니다380. 독자들은 특정 상징에 익숙하지 않을 수 있으며 그것이 무엇을 의미하는지 모를 수 있습니다381.
    • 눈, 입 또는 코가 없는 공백으로 남겨두기보다는 캐릭터의 얼굴 특징을 보여주십시오. 
      • Phillips는 얼굴 특징이 인지 장애가 있는 사람들을 포함하여 모든 사람이 이 시각 자료가 사람을 나타낸다는 것을 이해하는 데 도움이 된다고 말했습니다382.
    • 하지 말아야 할 것보다는 해야 할 것에 초점을 맞추십시오. 
      • Phillips는 "손을 씻으세요"라는 메시지의 예를 들었습니다383. 그녀는 픽토그램이 "집에 오면 손을 씻으세요"를 전달해야 하며, "집에 오면 손 씻는 것을 잊지 마세요"를 전달해서는 안 된다고 말했습니다384.
  • 시각적 은유(Visual metaphors). Alex Thomas, MD Gary Ashwal, MA는 Booster Shot Media의 공동 창립자입니다385. 그들은 각각 의사와 건강 커뮤니케이션 전문가로서의 결합된 경험을 적용하여 복잡한 건강 주제에 대해 모든 연령대의 사람들에게 가르치는 시각적 프로젝트를 제작합니다386. 2018년에 우리는 그들이 "시각적 은유"라고 부르는 개념에 대해 이야기했습니다387. Thomas와 Ashwal은 시각적 은유가 너무 교훈적이거나 지루해 보이지 않으면서 잠재적으로 복잡한 의학적 개념을 표현하는 방법이라고 설명했습니다388. 그들은 성인과 어린이 모두에게 도움이 될 수 있습니다389.
    • 그들은 Iggy and the Inhalers라는 제목의 만화책에서 한 가지 예시를 공유했습니다390390390. 목표는 아이들에게 천식의 병태생리학뿐만 아니라 다양한 유형의 흡입기에 대해서도 가르치는 것이었습니다391. 그들은 이 메시지의 은유로서 캐릭터를 만들었습니다392.
      • "Coltron the Controller"는 흡입 스테로이드를 구현합니다393. Thomas는 그가 "염증을 줄이기 위해 소화기 팔을 기도 안으로 쏘는 크고, 목소리가 낮고, 느리게 움직이지만 강력한 로봇으로, 마치 불을 끄는 것과 같습니다"라고 설명했습니다394.
      • "Broncho the Bronchodilator"는 속효성 흡입기를 구현합니다395. 그는 "기관지 수축을 일으키는 기도 밖의 근육 띠를 느슨하게 하는 올가미를 가진 빠르게 말하는 카우보이입니다"396.
  • 이 만화 캐릭터를 사용한 연구는 그들이 독자들이 이 두 가지 약물의 다른 메커니즘을 이해하는 데 도움이 된다는 것을 보여주었습니다397. Thomas는 "당신이 단순히 이야기와 캐릭터를 이해한다면, 종이 한 장에서 사실을 암기한다는 느낌 없이 당신의 약물을 더 직관적으로 이해하게 될 것입니다"라고 말했습니다398.
  • 만화. MK Czerwiec은 자신이 간호학 학위와 간호 배경을 바탕으로 만화를 만드는 간호사라고 설명합니다399. Czerwiec은 만화와 의학 담론의 교차점을 다루는 웹사이트 www.GraphicMedicine.org¹³를 공동 운영합니다400. 우리는 2014년에 대화했습니다401.
  • Czerwiec은 만화가 내러티브를 전달하는 순차적 예술이라고 설명했습니다402. 그것들은 종종 텍스트를 포함하지만, 그럴 필요는 없습니다403. 그녀는 "사람들이 만화를 영화에 비유하여 생각했으면 좋겠습니다. 그것은 하나의 매체이며, 그 매체 안에는 많은 장르가 있습니다"라고 말했습니다404. 만화의 장르에는 물론 슈퍼히어로가 포함됩니다405. 만화에는 또한 아이들이 즐기는 애니메이션 영화와 성인을 위한 그래픽 노블도 포함됩니다406.
  • Czerwiec은 사람들이 관련 만화를 찾는 것뿐만 아니라 직접 만들어 볼 것을 권장합니다407. 그녀는 "두어 개의 상자를 만들고, 몇 단어를 추가하고, 그 단어를 보완할 몇 이미지를 넣은 다음, 다른 상자를 만드십시오"라고 말했습니다408. "상자의 순차적인 특성은 내러티브를 이끌어내고 이야기를 전달하는 데 도움이 되는 무언가가 있습니다"409.

챕터 40: 웹 글쓰기 🌐

시작점

많은 사람들이 건강 정보를 찾기 위해 웹사이트를 방문합니다410. 이 "웹 사용자"(또는 간단히 "사용자")들은 정말로 의료 서비스를 받아야 하는지에 대한 정보를 찾기 위해 웹사이트에 접속할 수 있습니다411. 그렇다면 그들은 그것을 제공하는 시설을 온라인에서 검색할 수 있습니다412. 그 후, 사용자들은 자신의 진단 및 치료에 대한 추가 정보를 온라인에서 찾을 수 있습니다413. 그들은 또한 온라인 채팅 및 환자 포럼과 같은 추가 지원을 찾을 수도 있습니다414.

 

실습 사례: 제한된 문해력 사용자를 위한 웹사이트

Stacy Robison, MPH, CHES는 공인 건강 교육자이자 컨설팅 회사 CommunicateHealth의 공동 창립자입니다415. 그녀가 참여했던 한 프로젝트는 주로 제한된 문해력이나 제한된 온라인 경험을 가진 사람들을 위한 웹사이트인 MyHealthfinder였습니다416. 우리는 2010년에 이것에 대해 이야기했습니다417.

 

Robison은 일부 사람들이 제한된 문해력을 가진 사람들이 온라인에서 건강 정보를 찾을지 의문을 제기한다고 인정했습니다418. Robison은 이것이 자기 충족적 예언이 될 수 있다고 말했습니다419. "만약 우리가 온라인에서 이해하기 쉽거나 사용하기 쉬운 건강 정보를 가지고 있지 않다면, 제한된 문해력 기술을 가진 사람들은 건강 정보를 검색하기 위해 인터넷을 사용하기 시작하지 않을 것입니다"420.

 

그녀는 제한된 문해력 기술을 가진 성인들은 웹 검색에 대한 훈련이나 경험이 거의 없을 수 있다고 말했습니다421. 그들은 단어를 읽는 것뿐만 아니라 웹사이트를 탐색하는 데도 어려움을 겪을 수 있습니다422. Robison은 도움이 될 수 있는 몇 가지 방법을 제안했습니다:

  • 가장 먼저 기본 정보에 집중하십시오.
    • Robison은 사람들이 가장 알고 싶어 하는 것은 전략과 행동이라고 말했습니다423. 그 정보를 제시한 후, 사용자들에게 그들이 원하는 콘텐츠로 더 깊이 파고들 수 있는 옵션을 제공하십시오424.
  • 독립적인 텍스트 섹션을 만드십시오.
    • 이것은 사용자들이 페이지 주변을 이동하면서도 전체 정보를 얻을 수 있도록 합니다425. "우리는 제한된 문해력 기술을 가진 많은 사용자들이 전체 사이트를 훑어보는 데 어려움을 겪는다는 것을 발견했습니다. 그들은 그냥 건너뛰거나 전체 텍스트 덩어리를 건너뛸 것입니다"426.
  • 텍스트를 작은 그룹, 목록 또는 조밀한 문구를 피하기 위한 모든 것으로 나누십시오.
    • Robison은 사용자들이 세 줄 이상의 텍스트가 있을 때 단락을 건너뛴다는 것을 발견했다고 말했습니다427. "이것은 문장이 아니라, 실제 텍스트 줄입니다"428.
  • 사용자들과 함께 웹사이트를 테스트하여 그들이 어디에서 막히는지 확인하십시오.
    • 그들이 정보를 찾을 수 있습니까429? 버튼을 클릭하는 방법을 알고 있습니까430? Robison은 "만약 그들이 찾고 있는 것을 찾지 못하거나 작업을 수행할 수 없다면, 다시 처음부터 시작하여 고치십시오"라고 말했습니다431. "웹 작가와 디자이너의 임무는 웹사이트를 명확하고 사용하기 쉽게 만드는 것입니다"432.

전략, 아이디어 및 제안

Janice (Ginny) Redish, PhD는 평이한 언어 및 웹 글쓰기 전문가입니다433. 그녀는 또한 Letting Go of the Words: Writing Web Content That Works라는 책의 저자입니다434. Redish는 사람들이 인쇄물과 웹에서 정보를 다르게 접근한다고 말했습니다435. 그녀는 웹사이트 탐색을 전화 통화에 비유했습니다436. Redish는 온라인 접속을 동적이고 상호작용적인 대화로 설명했습니다437. 사용자들은 특정 주제를 검색한 다음, 관련성이 있다고 생각하는 링크를 클릭합니다438. 이것은 독자들이 저자가 구성한 정보의 흐름을 따르는 인쇄된 정보와 대조됩니다439.

 

다음은 Redish 및 다른 사람들이 웹 글쓰기에 대해 제안하는 몇 가지 전략입니다440:

  • 대부분의 사용자가 기대하는 표준 관례를 포함하십시오. 여기에는 다음이 포함됩니다441:
     
    • 내비게이션 바(Navigation bar). 목차와 마찬가지로, 내비게이션 바는 클릭 가능한 핵심 주제 및 페이지 목록입니다442. 일반적으로 각 웹페이지의 왼쪽이나 상단을 따라 위치합니다443.
    • "회사 소개(About Us)" 페이지. 사용자들이 정보의 출처와 신뢰성을 확인할 수 있는 곳입니다444. 웹사이트를 만들거나 후원한 핵심 인물의 이름과 자격을 포함해야 합니다445.
    • "문의하기(Contact Us)" 페이지. 후원 회사 및 더 큰 웹사이트의 경우 기술 지원을 위한 연락처 정보를 포함해야 합니다446.
    • 제목(Headings). Redish는 사람들이 찾고 있는 정보와 연결되는 질문, 진술 또는 동사 구문을 사용할 것을 권장합니다447. "인후염(strep throat)이란 무엇입니까?"라는 제목이 한 예입니다448.
  • 레이아웃 및 디자인을 고려하십시오.
    • 하이퍼텍스트(링크)를 밝거나 대비되는 색상으로 명확하게 만드십시오. 파란색은 일반적으로 하이퍼링크에 사용되며, 보라색은 클릭된 링크에 사용됩니다449. 또한 색맹이거나 시력이 제한된 사람들에게 하이퍼링크를 명확하게 하는 상징이나 텍스트를 포함할 수도 있습니다450.
    • 인쇄물에서 사용할 수 있는 단어 수의 약 절반을 사용하십시오. 내용이 길어서 줄일 수 없거나 줄여서는 안 되는 경우, 사용자가 온라인에서 읽는 것보다 쉽게 페이지를 인쇄할 수 있도록 정보를 포맷하십시오451.
  • 사이트를 접근 가능하게 만드십시오. 장애가 있는 사람들의 요구 사항뿐만 아니라 오래된 컴퓨터나 느린 연결을 가진 사람들의 요구 사항도 고려하십시오452. 다음은 몇 가지 방법입니다:
    • 더 느리거나 오래된 기기에서 웹사이트를 "시험 운전"하십시오. 공용 컴퓨터(예: 도서관이나 노인 센터)에서 온라인에 접속하여 웹사이트가 얼마나 잘 작동하는지 확인할 수 있습니다453.
    • 단순한 사진, 삽화, 다이어그램 또는 기타 그래픽을 사용하십시오. 더 복잡한 디자인은 다운로드하는 데 시간이 오래 걸리거나 페이지 간 이동 과정을 늦출 수 있습니다454.
    • 의도된 청중과 함께 테스트하십시오. 사용자들이 여러분의 정보를 이해하고 활용할 수 있습니까455? 한 섹션에서 다른 섹션으로 쉽게 이동할 수 있습니까456? 이러한 질문과 다른 많은 질문에 대한 답은 유용성 테스트를 통해 배울 수 있습니다457. 이는 청중을 대표하는 사람들이 여러분의 웹사이트를 사용해 보는 것을 지켜보는 것을 의미합니다458.
    • 웹사이트를 접근 가능하게 만드는 것에 대해 더 알아보십시오. 훌륭한 자료 중 하나는 웹 접근성 이니셔티브(Web Accessibility Initiative)입니다459.

 

 

 

챕터 1: 건강 정보 이해 능력에 대하여 (About Health Literacy)

건강 정보 이해 능력에 대하여

건강 정보 이해 능력은 건강 정보를 명확하게 전달하고 그것을 정확하게 이해하는 것에 관한 것입니다. 건강 정보 이해 능력은 진료 연속체의 모든 지점에서 관련이 있습니다. 이는 건강 관리 및 건강 증진부터 질병 예방 및 조기 발견, 진단 및 의사 결정, 그리고 치료 및 자가 관리까지 포함합니다.

 

건강 정보는 다양한 방식으로 소통됩니다. 여기에는 일대일 대화서면 자료가 포함됩니다. 건강 소통은 또한 웹사이트, 문자 메시지, 팟캐스트, 그림, 영상, 전화 통화, 수업, 소셜 미디어 등 다른 형태를 취하기도 합니다. 소통이 어떻게 이루어지든 관계없이, 일관된 목표는 건강 이해입니다.

건강 정보 이해 능력이란 무엇인가?

건강 정보 이해 능력의 정의는 수년 동안 발전해 왔습니다. 제가 전적으로 지지하는 가장 최신의 정의는 미국 공중 보건 이니셔티브인 Healthy People 2030에서 나옵니다. 이 정의는 두 부분으로 구성되어 있습니다.

  •  
  • 개인적 건강 정보 이해 능력은 개인이 자신과 다른 사람들을 위한 건강 관련 결정 및 조치에 정보를 제공하기 위해 정보와 서비스를 찾고, 이해하고, 사용하는 능력을 갖는 정도입니다.
  • 조직적 건강 정보 이해 능력은 조직이 개인들이 자신과 다른 사람들을 위한 건강 관련 결정 및 조치에 정보를 제공하기 위해 정보와 서비스를 찾고, 이해하고, 사용하는 것을 공평하게 가능하게 하는 정도입니다.

이 정의는 이전 정의를 기반으로 합니다. 수년 동안 미국에서 가장 널리 사용된 정의는 건강 정보 이해 능력이 "개인이 적절한 건강 결정을 내리는 데 필요한 기본적인 건강 정보와 서비스를 획득하고, 처리하고, 이해하는 역량을 갖는 정도"라는 것이었습니다.

 

다른 사람들은 건강 정보 이해 능력을 진료 환경에서의 이해 요구라는 측면에서 틀을 잡았습니다. 또 다른 정의는 개인(individuals)이 아닌 인구 집단(populations)에 초점을 맞추어 지역사회에 도움이 되는 공중 보건 결정을 살펴보았습니다. 또 다른 정의는 건강 정보 이해 능력이 임상적 위험(clinical risk)인지 개인적 자산(personal asset)인지에 대해 의문을 제기했습니다. 같은 해, 캘거리 건강 정보 이해 능력 교육과정 연구소(Calgary Institute on Health Literacy Curricula) 참가자들은 정보의 제공자와 구하는 사람 모두를 포함하는 건강 정보 이해 능력의 정의와 교육과정 개발 및 평가를 위한 일련의 핵심 원칙을 제안했습니다.

 

저의 실질적인 건강 정보 이해 능력에 대한 정의는 처음부터 같았습니다. 인정하건대, 이는 특정 의료 환경이나 인구 집단보다는 결과(outcomes)에 초점을 맞춘 상당히 일반적인 정의입니다. 저에게 건강 정보 이해 능력은 환자 (또는 건강 소통을 받는 쪽의 모든 사람)와 제공자 (또는 건강 소통을 주는 쪽의 모든 사람) 사이의 공동 책임입니다. 각자는 상대방이 이해할 수 있는 방식으로 소통해야 합니다.

건강 정보 이해 능력이 지금 왜 중요한가?

건강 정보 이해 능력은 현재 많은 건강 이니셔티브의 최전선에 있습니다. 하지만 왜 그럴까요? 제 의견으로는, 오늘날 건강 정보 이해 능력이 중요한 몇 가지 이유가 있습니다.

  • 환자들은 제공자와 얼굴을 마주하는 시간이 적기 때문에 건강 정보를 빨리 이해해야 합니다. 여기에는 짧은 진료 예약 시간과 짧은 입원 기간이 포함됩니다.
  • 환자들은 가족 및 다른 간병인들과 함께 다양한 건강 관련 과제들을 정확하게 수행하도록 기대받고 있습니다. 이러한 과제들은 복잡하고 익숙하지 않을 수 있으며, 예를 들어 새로운 기술을 사용하거나 시간에 민감한 일정에 따라 약을 복용하는 것 등입니다.
  • 환자들은 능동적인 학습자여야 합니다. 여기에는 제공자로부터 받은 정보를 읽는 것뿐만 아니라 가족과 친구, 대중 매체, 그리고 인터넷에서 얻은 건강 정보의 신뢰도와 관련성을 평가하는 것도 포함됩니다
  • 환자들은 치료와 보살핌의 수동적인 수혜자라기보다는 능동적인 소비자로 점점 더 인식되고 있습니다. 오늘날 환자들은 종종 핵심적인 건강 결정을 내리도록 요구받고 있으며, 자신을 대신하여 옹호하도록 기대받고 있습니다.
  • 다소 냉소적으로 들릴 수 있지만, 저는 의료 비용을 줄이는 몇 안 되는 방법 중 하나가 환자와 가족이 스스로를 돌보게 하는 것이라고 믿습니다. 이것은 무엇을 해야 하는지, 어떻게 해야 하는지, 그리고 왜 그것이 중요한지를 아는 것을 요구합니다. 다시 말해, 이 높은 수준의 자가 관리는 엄청난 양의 건강 정보 이해 능력을 필요로 합니다.

건강 정보 이해 능력 향상을 위한 국가 행동 계획 (National Action Plan to Improve Health Literacy)

포괄적인 건강 정보 이해 능력 솔루션으로 향하는 움직임이 증가하고 있습니다. 2010년에 미국은 건강 정보 이해 능력 향상을 위한 국가 행동 계획을 발표했습니다. 이 계획에는 건강 정보 이해 능력 향상을 위한 일곱 가지 목표와 수많은 제안된 전략이 포함되어 있습니다. 이 계획이 발표된 이후 수년 동안 많은 의료 기관, 지역사회 서비스, 교육 프로그램 등이 이러한 목표를 향해 노력해 왔습니다. 목표는 다음과 같습니다.

  • 정확하고, 접근 가능하며, 실행 가능한 건강 및 안전 정보를 개발하고 보급합니다.
  • 건강 정보, 소통, 정보에 입각한 의사 결정, 건강 서비스 접근성을 향상시키는 의료 시스템의 변화를 촉진합니다.
  • 보육 및 교육 기관에서부터 대학교 수준까지 정확하고, 표준에 기반하며, 발달적으로 적절한 건강 및 과학 정보와 교육과정을 통합합니다.
  • 지역사회에서 성인 교육, 영어 교육, 문화적 및 언어적으로 적절한 건강 정보 서비스를 제공하기 위한 지역적 노력을 지원하고 확대합니다.
  • 파트너십을 구축하고, 지침을 개발하며, 정책을 변경합니다.
  • 건강 정보 이해 능력 향상을 위한 기초 연구 및 실천과 개입의 개발, 실행, 평가를 늘립니다.
  • 근거 기반의 건강 정보 이해 능력 실천 및 개입의 보급 및 사용을 늘립니다.

이 계획의 요약에서 명시된 바와 같이, "[건강 정보 이해 능력 문제에 집중하고 협력함으로써, 우리는] 의료 접근성, 품질, 안전을 향상시키고, 비용을 절감하며, 미국 내 수백만 명의 건강과 삶의 질을 향상시킬 수 있습니다".

건강 정보 이해 능력 역사의 간략한 요약

건강 정보 이해 능력이 어떻게, 언제, 왜, 그리고 누구에 의해 시작되었는지 궁금하여, 저는 온라인 건강 정보 이해 능력 토론 목록에 질문을 올렸습니다. 사람들이 건강 정보 이해 능력의 역사에 대해 공유한 내용의 간략한 요약은 다음과 같습니다.

  • 1974년. "건강 정보 이해 능력(health literacy)"이라는 용어가 처음 언급된 것은 Scott K. Simonds의 논문 "Health Education as Social Policy (사회 정책으로서의 건강 교육)"에서였습니다. 이 논문에서 건강 정보 이해 능력은 사회 정책의 맥락에서 틀이 잡혔습니다.
  • 1980년대. Len과 Ceci Doak (오늘날 우리가 알고 있는 건강 정보 이해 능력의 창시자로 많은 사람들이 생각하는)는 입원 환자들의 읽기 능력을 연구했습니다. Doaks 부부는 Jane Root와 함께 1985년에 처음 출판된 획기적인 책 Teaching Patients with Low Literacy Skills를 저술했습니다.
  • 1990년대 초반. Harold Freeman(당시 미국 암 학회 회장), Wendy Mettger 등의 작업에 영감을 받아 국립 암 연구소(National Cancer Institute)와 AMC 암 연구 센터의 사람들이 국립 암 및 문해력 실무단(National Work Group on Cancer and Literacy)을 만들었습니다. 이 그룹은 다양한 분야의 전문가들을 모았습니다. 그들 중 다수는 오늘날까지 건강 정보 이해 능력 리더로 활동하고 있습니다.
  • 1990년대 중반. 의사 및 기타 임상의뿐만 아니라 문해 실무자, 교사, 연구원, 건강 커뮤니케이터, 환자 교육자, 의료 사서, 장애 전문가, 사회 정의 및 환경 운동가를 포함한 다른 사람들도 건강 정보 이해 능력 문제와 이니셔티브에 참여했습니다. 일반 대중 (읽기를 배우는 성인인 새 독자 포함)도 건강 정보 이해 능력에 적극적으로 참여하게 되었습니다.
  • 1990년대 후반. 미국 의사 협회(AMA)의 과학 문제 위원회(Council on Scientific Affairs)는 건강 정보 이해 능력에 관한 중요한 논문을 발표했으며, 여기에는 AMA 정책으로 채택된 다섯 가지 권고사항이 포함되었습니다. Joanne Schwartzberg는 AMA에서 건강 정보 이해 능력의 핵심 옹호자였습니다. 건강 정보 이해 능력은 또한 전 세계적인 주목과 행동을 얻었습니다. 리더로는 캐나다의 Irving Rootman과 Linda Shohet, 호주의 Donald Nutbeam, 독일의 Ilona Kickbush가 포함되었습니다. 전 세계적인 인식 제고 행사인 건강 정보 이해 능력의 달(Health Literacy Month)은 1999년에 저(Helen Osborne)에 의해 시작되었습니다.
  • 2000년대 초반. 건강 정보 이해 능력에 대한 관심은 부분적으로 2004년 의학 연구소(Institute of Medicine)의 보고서 Health Literacy: A Prescription to End Confusion의 출판 덕분에 빠르게 증가했습니다. AMA 재단 또한 건강 정보 이해 능력을 옹호하며, 강력한 비디오 "Health literacy and patient safety: help patients understand"가 포함된 교육용 도구 키트를 만들었습니다. 이 무렵, 제약 회사 화이자(Pfizer)도 연구, 도구, 훈련을 위한 보조금을 제공하며 참여했습니다.
  • 2010년경. Howard Koh (당시 미국 보건 복지부 차관보)는 건강 정보 이해 능력이 "티핑 포인트"에 도달했다고 말했습니다. 그는 Plain Writing Act, 건강 정보 이해 능력 향상을 위한 국가 행동 계획, 그리고 Affordable Care Act (ACA, 오바마케어라고도 알려짐)의 시행과 같은 이정표에 공을 돌렸습니다.
  • 오늘날. 미국 전역과 전 세계적으로 수천 개의 건강 정보 이해 능력 연구 논문, 수백 개의 건강 정보 이해 능력 프로그램, 수많은 건강 정보 이해 능력 연합, 그리고 셀 수 없이 많은 건강 정보 이해 능력 이니셔티브가 있습니다. 지난 10년간의 주요 이정표에는 국제 건강 정보 이해 능력 협회(International Health Literacy Association, IHLA)의 결성 , 학술 저널 HLRP: Health Literacy Research and Practice의 출판 , 그리고 건강 정보 이해 능력 전문가 인증 프로그램(Health Literacy Specialist Certificate program)의 개설이 포함됩니다. 저는 건강 정보 이해 능력에 관해 우리 모두가, 혼자서 그리고 함께, 계속해서 무엇을 성취할지 기대됩니다.

실습 이야기: Len과 Ceci Doak에게 큰 감사를 드립니다

Leonard (Len)와 Cecelia (Ceci) Doak은 건강 정보 이해 능력 분야를 선도한 공로로 널리 인정받고 있습니다. 그들의 수상 경력에 빛나는 책 Teaching Patients with Low Literacy Skills는 환자들과 명확하게 소통하기 위한 필수적인 실용 안내서였으며, 지금도 그렇습니다.

 

2009년에 저는 Doaks 부부에게 어떻게 시작하게 되었는지 물었습니다. 그들은 건강 정보 이해 능력에 대한 그들의 관심이 1973년 결혼과 함께 시작되었다고 말했습니다. 그 당시 Len은 문해력 교사였고 Ceci는 건강 교육자였습니다. Ceci는 다음과 같이 설명했습니다. "Len을 만났을 때 그가 읽고 쓸 수 없는 사람들을 위한 교사로 자원봉사한다고 말했을 때, 저는 '맙소사! 글을 잘 읽지 못하는 사람들은 어떻게 의료 조언을 이해할까요? 그들이 의사에게 가면 무슨 일이 생길까요?'라고 말했습니다". Len은 "종종, 그들은 이해하지 못합니다"라고 대답했습니다.

 

그렇게 Doaks 부부의 건강 정보 이해 능력 여정이 시작되었습니다. 당시 그들의 목표는, 오늘날 우리들의 목표와 마찬가지로, 건강 전문가들이 문해력 문제를 "우회"하여 환자들이 진료를 마치고 무엇을 해야 하고 어떻게 해야 하는지를 알게 돕는 것이었습니다.

 


챕터 6: 이해 확인: 티치백 및 피드백 (Confirm Understanding: Teach-back & Feedback)

이해 확인: 시작점

우리가 무언가를 말한다고 해서 , 우리가 그것을 글로 쓴다고 해서, 우리가 이 정보가 중요하다고 안다고 해서 , 우리가 소통하고 있는 사람이 이 정보를 읽고, 공감하고, 따를 수 있다는 것을 의미하지는 않습니다. 건강 커뮤니케이터로서 우리 메시지가 진정으로 이해되었는지 확인하는 것이 중요합니다. 이를 수행하는 두 가지 중요한 방법은 티치백 (구두 전달의 경우)과 피드백 (인쇄 및 웹 정보의 경우)입니다.

  • 티치백 (Teach-back). 때로는 "상호 작용적 소통 순환(the interactive communication loop)" 또는 "복창 시범(return demonstration)"이라고도 불리는 티치백은 대화의 양쪽 (메시지를 전달하는 사람과 메시지를 받는 사람)이 서로를 정확하게 이해했는지 평가하는 데 사용되는 주고받는 구두 교환입니다.
  • 피드백 (Feedback). 피드백을 얻는 방법에는 여러 가지가 있습니다. 여기에는 한 번에 한 사람씩 인터뷰하는 것 , 포커스 그룹에서 여러 사람과 만나는 것 , 또는 사람들이 자료를 사용하는 것을 관찰하는 것이 포함됩니다. 피드백은 초기 아이디어와 계획부터 출판 및 수정에 이르기까지 글쓰기 과정 전반에 걸쳐 도움이 됩니다.

전략, 아이디어 및 제안: 티치백

  • 주제 우선순위 정하기. 환자와 제공자는 많은 주제를 논의할 가능성이 높습니다. 이는 증상이 무엇이며 그 이유, 또는 왜 걱정할 필요가 없는지와 같은 맥락을 포함하는 경우가 많습니다. 주제는 또한 다음 예약 시간과 장소와 같은 후속 조치에 관한 것일 수도 있습니다. 환자와 제공자의 대화 대부분은 약 복용 지침, 의료 기기 사용법, 또는 부작용 인식과 같은 "방법(how-to)" 정보에 관한 것일 가능성이 높습니다. 모든 주제가 도움이 될 수 있지만, 티치백은 몇 가지 중요한 주제에 대해서만 사용하십시오.
  • 파트너십 분위기 조성. 티치백은 전달자인 당신이 명확하게 설명했는지 확인하는 방법입니다. 이것은 상대방이 얼마나 똑똑한지 또는 능숙한지를 시험하는 것이 아닙니다. "제가 이것을 명확하게 설명했는지 확인하고 싶습니다"와 같이 파트너십의 분위기를 조성하며 시작하십시오. 그런 다음 대화적인 방식으로 개방형 질문을 하십시오. 예를 들어, "오늘 집에 가시면 [배우자, 성인 자녀, 또는 간병인]에게 [방금 논의한 핵심 사항]에 대해 무엇을 말씀하실 건가요?" 또는 중요한 행동에 초점을 맞추어 "고섬유질 식품 섭취의 중요성에 대해 이야기했습니다. 다음에 시리얼을 살 때 무엇을 찾아보실 건가요?"라고 말할 수 있습니다.
  • 상대방의 답변에 후속 조치. 상대방이 대답한 후 좀 더 이야기하십시오. 만약 그들이 정확하게 이해했다는 것이 명백하다면, 그것을 인정하고 "당신이 [주제]에 대해 알고 있다는 것이 정말 좋습니다. 그것이 어떻게 도움이 되었는지 듣고 싶습니다"와 같이 조금 더 추가할 수 있습니다. 그러나 환자가 정확하게 또는 완전히 이해하지 못한 것 같다면, 메시지를 더 명확하게 다시 작성하십시오. 그런 다음 환자의 이해 수준을 평가하기 위해 티치백을 다시 사용하십시오. 최선을 다했음에도 불구하고 환자가 여전히 이해하지 못한다면, 그에 따라 당신의 가르침을 조정하십시오. 이는 해당 주제에 대한 영상을 보여주거나 다음 약속에 누군가를 동반하도록 권유하는 것일 수 있습니다.
  • 충분한 시간 할애. 인정하건대, 티치백은 시간이 걸립니다. 하지만, 특히 티치백이 진료의 일상적인 부분이 되면, 당신이 두려워하는 것만큼 오래 걸리지는 않을 수 있습니다. 또한, 환자가 지침을 이해하지 못하고 정확하게 따를 수 없을 경우 나중에 발생할 수 있는 추가 시간을 고려하십시오.

실습 이야기: 티치백 사용하기

Dean Schillinger, MD는 일차 진료 의사, 교수, 연구원, 작가, 그리고 건강 정보 이해 능력의 오랜 옹호자입니다. 2015년에 우리는 구두 이해를 확인하기 위한 티치백 사용에 대해 이야기했습니다.

 

Schillinger는 티치백이 단순히 무언가를 말하고 상대방이 그 말을 되풀이하게 하는 것 이상이라고 설명했습니다. 그것은 진단, 치료 계획 또는 의료 환경에서 발생하는 광범위한 문제에 대해 공유된 의미를 갖는 것에 관한 것입니다. Schillinger는 그의 진료 경험에서 이 이야기를 공유했습니다.

제가 돌보던 환자 한 분이 정말 심한 고혈압을 앓고 계셨습니다. 우리는 좋은 관계를 유지했지만, 그분이 돌아올 때마다 혈압이 매우 높았습니다. 그는 9개 또는 10개의 혈압약을 복용하고 있었는데, 이는 완전히 드문 일은 아닙니다. 하지만 우리가 전혀 진전을 보지 못하고 있다는 것이 저에게는 이상했습니다. 보통 혈압에 약간의 개선을 기대하니까요. 저는 티치백을 했었지만, 이제는 그가 복용하는 것을 정확히 보여주기 위해 모든 약병을 가져오도록 요청하는 '슈퍼 티치백'을 할 예정이었습니다. 환자는 알약 병으로 가득 찬 신발 상자를 가져왔습니다. 그 안에는 제가 10년 넘게 처방하지 않은 약들도 있었습니다. 저는 그에게 아직도 이것들을 복용하고 있는지 물었습니다. 환자는 '선생님, 제가 말씀드리지 않았지만, 저는 그냥 알약을 삼키는 것을 좋아하지 않습니다'라고 대답했습니다. 저는 그가 이 알약들을 10년 동안 복용해 왔다고 가정했었습니다. 하지만 여러 가지 이유로 환자는 저에게 알약을 삼키지 않는다고 말하는 것을 불편해했습니다. 요컨대, 그는 이제 2가지 액체 약을 복용하고 있으며 혈압은 완벽합니다.

 

Schillinger가 잘 알고 있듯이, "오해가 발생하는 이유에는 기하급수적으로 많은 수가 있을 수 있습니다. 알 수 있는 방법은 단 한 가지뿐입니다. 그것은 가정하지 않고 명시적으로 그 사람이 당신에게 보여주거나 말하게 하는 것입니다".

 

전략, 아이디어 및 제안: 피드백

  • 사람들이 의견을 공유하도록 초대. 서면 자료에 대한 피드백을 다른 사람들에게 요청할 때, 그것이 그들의 읽기 또는 이해 능력이 아니라 당신의 글쓰기를 테스트하는 것임을 명확히 하십시오. 시작하는 좋은 방법은 "저를 도와주시겠어요?"라고 말하는 것입니다. 그들에게 당신이 그들의 피드백을 어떻게 사용할 계획인지 알리고, 업데이트된 버전을 공유하겠다고 제안할 수도 있습니다.
  • 글쓰기 과정 전반에 걸쳐 피드백 사용. 피드백을 받기 시작하는 좋은 시점은 프로젝트의 시작입니다. 당신의 의도된 독자들은 포함할 주제에 대해 정말 도움이 될 수 있습니다. 글을 쓰는 동안, 메시지를 명확히 하기 위해 계속해서 피드백을 요청하십시오. 프로젝트가 끝날 때, 다음에 무엇을 다르게 해야 할지 알 수 있도록 다시 피드백을 요청하십시오.
  • 의도된 청중을 파악. 여기에는 그들의 학습 능력과 정보 요구 사항이 포함됩니다. 예를 들어, 특정 의료 절차에 대해 글을 쓸 때 , 어떤 주제를 다루어야 할지 배우기 위해 피드백을 사용할 수 있습니다. 무엇을 해야 하는지 설명하는 것 외에도 , 독자들은 이 절차가 얼마나 드는지 , 통증이 예상되는지 , 회복하는 데 얼마나 걸리는지에 관심이 있을 수 있습니다. 그런 다음 그것에 대해 쓰십시오.
  • 프로젝트 계획에 피드백을 포함. 인정하건대, 독자 피드백을 얻는 데는 시간이 걸립니다. 포커스 그룹, 사용자 테스트 또는 금전적 인센티브와 같은 일부 비용이 발생할 수도 있습니다. 저의 권고는 그렇게 하지 않음으로써 발생할 수 있는 비용을 고려하라는 것입니다. 주제 전문가 및/또는 의료 작가로서, 당신은 내용에 너무 익숙해서 당신의 단어와 개념이 다른 사람들에게 이해되는지 객관적으로 평가할 수 없습니다. 사실, 저는 이 책의 개정판을 쓸 때도 피드백을 많이 사용합니다. 네, 피드백은 그만한 노력의 가치가 있습니다.

다음은 피드백을 얻는 몇 가지 방법입니다.

  • 한 번에 한 사람씩 인터뷰. 이는 일정 조정에 유연성을 제공할 뿐만 아니라 (아마도 읽기 능력 때문에) 당황하는 것을 두려워하거나 다른 사람들 앞에서 말하는 것을 불편해하는 사람들의 의견을 물을 때도 도움이 됩니다.
  • 포커스 그룹. 이는 연령, 문해력, 언어, 문화, 주제에 대한 친숙도 측면에서 청중을 대표하는 6명에서 8명으로 구성된 그룹일 수 있습니다. 포커스 그룹은 종종 질문을 하는 훈련된 진행자와 메모를 하는 기록자가 공동으로 이끌게 됩니다. 둘 이상의 포커스 그룹으로 자료를 테스트하여 응답을 비교할 수 있습니다. 예를 들어, 응급 상황으로 입원한 사람들의 그룹과 계획된 입원을 한 사람들의 그룹으로 임상 서비스에 대한 소책자를 테스트할 수 있습니다.
  • 사용성(또는 사용자) 테스트. 이는 일반적으로 사람들이 실제로 자료를 사용하는 것을 관찰하는 통제된 환경입니다. 웹사이트에서 특정 정보를 찾는 것과 같이 그들이 특정 작업을 완료하는 것을 관찰하십시오. 테스트하는 사람으로서, 당신은 사람들이 어떤 작업을 쉽거나 어렵다고 느끼는지 볼 수 있습니다. 이것을 보면 무엇을 변경해야 하는지 파악하는 데 도움이 됩니다.

챕터 17: 전문 용어, 약어 및 기타 까다로운 단어들 (Jargon, Acronyms, and Other Troublesome Words)

시작점

건강 전문가들은 전문적인 의학 용어를 배우는 데 수년을 보냅니다. 동료들과 소통할 때 이러한 언어를 약식으로 사용하는 것은 일반적으로 매우 효과적입니다. 그러나 환자 및 기타 외부인에게 이러한 전문 용어는 혼란스럽거나 불분명할 수 있습니다.

다음은 몇 가지 까다로운 유형의 단어 예시입니다:

  • 전문 용어(Jargon). 의학 전문 용어는 기술적인 용어와 구, 또는 특수하고 고유한 방식으로 사용되는 단어를 의미합니다. 이러한 용어는 건강 전문가에게는 익숙하고 유용하지만 , 환자와 가족은 전문 용어를 같은 방식으로 이해하지 못할 수 있습니다. 예를 들어, 건강 관리에서 "특이 소견 없음(unremarkable)"이라는 용어는 일반적으로 "괜찮습니다"를 의미하는 반면 , "양성" (예: "혈액 검사 결과 [질병]에 대해 양성이 나왔습니다")이라는 용어는 괜찮지 않다는 것을 의미할 수 있습니다. 일반인들은 당신이 의도한 방식으로 이러한 단어들을 이해하지 못할 수 있습니다.
  • 약어(Abbreviations), 두문자어(acronyms), 및 머리글자어(initialisms). 이것들은 더 길고 복잡한 용어를 줄여서 나타내는 방식을 의미합니다. 동료와 대화하거나 의료 기록에 데이터를 입력할 때 매우 효율적일 수 있습니다. 약어는 보통 "prep"이 "preparation"을 의미하고 "meds"가 "medications"를 의미하는 것과 같이 더 긴 단어의 줄임말입니다. 두문자어와 머리글자어는 일반적으로 구문의 각 단어에서 첫 글자를 따서 새로운 것을 만듭니다. 때로는 "CAT"처럼 친숙하게 들릴 수도 있지만 ("computed/computerized axial tomography"의 약자) , 때로는 "activities of daily living"을 의미하는 "ADL"처럼 새로운 "단어" (실제 단어는 아닌)를 만들기도 합니다.
  • 동음이의어(Homonyms). 이것들은 소리가 같고 철자가 같을 수도 있고 아닐 수도 있지만, 매우 다른 의미를 가진 단어들입니다. 건강 관리에서는 "stool(대변/의자)", "gait(걸음걸이/출입구)", 그리고 "dressing(드레싱/옷 입기)"와 같은 많은 동음이의어를 사용합니다. 환자가 동음이의어를 쉽게 오해할 수 있음을 인지하십시오. 모든 새로운 단어와 마찬가지로, 당신이 정확히 무엇을 의미하는지 명확히 해야 합니다.
  • 관용구(Idioms). 이것들은 실제 단어와는 상당히 다른 의미를 가진 구문입니다. 일반적으로 관용구는 특정 지역이나 문화권 사람들에게 특별한 의미를 갖습니다. 그러나 이 의미는 외부인에게는 익숙하지 않을 수 있습니다. 대부분의 건강 자료는 일반적인 독자를 위해 작성되므로, "feeling blue(우울한)", "heads up(미리 알려주는)", 그리고 "watch your sugar(혈당을 조심하는)"와 같은 관용구 사용을 피하도록 노력하십시오.
  • 그다지 간단하지 않은 "간단한" 단어들. 때로는 "may", "might", "suggest"와 같은 흔한 단어조차 이해하기 어려울 수 있습니다. 이것은 종종 위험을 설명할 때 발생합니다. "this treatment might help (이 치료가 도움이 될 수 있다)"라는 구문이 과학자에게는 결정적인 증거가 없다는 것을 의미할 수 있지만 , 희망에 필사적인 환자에게는 "이 치료가 도움이 될 것이다"라고 해석될 수 있습니다.

실습 이야기: 응급실(ED 또는 ER)의 약어

갑자기 부상을 입거나 아프다고 상상해 보세요. 당신이나 가족 구성원이 911에 전화합니다. EMT가 도착하여 가장 가까운 응급실(ER) 또는 응급의료실(ED)로 데려갑니다. 당신이나 가족 구성원은 HIPAA 통지를 포함하여 많은 서류를 받습니다. 의사와 간호사는 당신에게 IV, MRI, 그리고 CT 스캔이 필요하다고 말합니다. 이 모든 것이 당신이 중환자실(ICU)에 입원하기 전입니다.

 

이제 이 시나리오를 다시 재생해 보십시오. 그리고 이전에 응급 치료가 필요했던 적이 없는 사람이라고 상상해 보십시오. 어쩌면 당신은 이 나라에 처음 왔고 영어를 제한적으로만 구사할 수도 있습니다. 당신은 이제 통증과 불확실성에 대처해야 할 뿐만 아니라 , 건강 관리 약어 (줄인 단어와 구) 및 두문자어 (일반적으로 일련의 단어에서 첫 글자로 만든 새로운 용어)라는 새로운 언어를 완전히 이해해야 합니다.

전략, 아이디어 및 제안

  • 두문자어의 의미가 명확한지 확인하십시오. 상대방에게 이익이 되는 두문자어와 약어만을 선택하십시오. 당신 자신에게만 이익이 되는 것이 아닙니다. 예를 들어, 용어를 한 번만 사용하는 경우 두문자어를 도입할 필요가 없을 수 있습니다. 예를 들어, 청중이 "국립 보건원(National Institutes of Health)"의 두문자어가 "NIH"라는 것을 정말로 알 필요가 있을까요? 필요할 수도 있고 아닐 수도 있습니다. 제 권고는 청중에게 중요한 것을 기반으로 두문자어에 대한 선택을 하는 것입니다. 두문자어가 정말로 필요하다면, 그 의미를 설명하여 도움을 주십시오. 두문자어 또는 전체 용어 중 하나를 다른 것 옆에 괄호 안에 넣으십시오. 예를 들어, "BP (blood pressure)"처럼 말입니다. 일부 편집자들은 동의하지 않을 수 있지만, 명확성과 이해를 위해 저는 각 경우에 전체 단어 형태를 먼저 넣을지 아니면 두문자어를 먼저 넣을지 결정할 것을 권장합니다. 저는 가장 일반적으로 사용되는 용어를 먼저 쓰고, 그 다음 약어나 전체 단어를 쓰는 경향이 있습니다. 독자는 때때로 철자가 풀어진 두문자어보다 명확한 설명으로부터 더 많은 도움을 받을 수 있습니다. 예를 들어, "IV (a needle that goes into your arm)"처럼 말입니다.
  • 두문자어는 사용되는 장소와 방식에 따라 다른 의미를 가질 수 있습니다. 예를 들어, "AAA"는 미국 자동차 협회(American Automobile Association), 지역 노인 기관(Area Agency on Aging), 또는 복부 대동맥류(aortic abdominal aneurysm)를 의미할 수 있습니다. 독자가 당신이 의미하는 두문자어를 판단하는 데 도움이 되도록 맥락을 제공하십시오.
  • 발음에 유의하십시오. 두문자어와 머리글자어는 다르게 발음됩니다. 예를 들어, "HIPAA" (Health Insurance Portability and Accountability Act)는 두문자어이며 하나의 단어처럼 발음됩니다. 하지만 "CHF" (congestive heart failure)는 머리글자어이며 세 개의 뚜렷한 글자로 발음됩니다.
  • 약어 대신 전체 지시 사항을 작성하십시오. 이것은 특히 투여 지침에 중요합니다. 임상의는 QD 또는 SID (하루에 한 번), QOD 또는 EOD (이틀에 한 번), BID (하루에 두 번), TID (하루에 세 번)와 같은 용어의 의미를 알지만 , 환자는 모를 수 있습니다. 해야 할 일을 명확하게 설명하고 , "이 알약을 하루에 두 번, 아침 식사 때 한 알, 저녁 식사 때 한 알 복용하세요"와 같은 지침을 제공하십시오. "오전 8시와 저녁 6시"와 같이 시간을 명시하는 것이 훨씬 더 도움이 될 수 있습니다.

실습 이야기: 일상 진료에서의 의학 전문 용어

Dean Schillinger, MD는 일차 진료 의사, 연구원, 그리고 오랜 건강 정보 이해 능력 옹호자입니다. 2013년에 그와 저는 의학 전문 용어에 대해 이야기했습니다.

 

Schillinger는 전문 용어가 "일반적인 이해에 대한 암묵적인 가정 하에 사용되는 특정 활동이나 그룹의 기술 용어 또는 특징적인 관용구"라고 설명했습니다. 의사, 간호사 및 기타 건강 전문가는 전문 교육의 일환으로 이 전문 용어를 배웁니다. 그러나 환자는 이러한 용어를 같은 방식으로 알거나 이해하지 못할 수 있습니다.

 

Schillinger는 전문 용어를 사용하는 대신 사람들이 이해할 수 있는 방식으로 정보를 설명할 것을 권장했습니다. 그는 이 예시를 공유했습니다. "draw your blood (당신의 피를 뽑다)"라고 말하는 대신, "We're going to take some blood out of your arm (우리는 당신의 팔에서 약간의 피를 뽑을 것입니다)"라고 말할 수 있습니다. Schillinger는 그렇게 말함으로써 잃는 것이 없다고 말했습니다.

 

Schillinger는 또한 이해를 확인하기 위해 티치백 방법을 사용할 것을 권장했습니다. "당신이 전문 용어를 사용했는지 확신이 없거나, 전문 용어를 사용하고 환자가 이해했을 것이라고 암묵적으로 가정했다면, 티치백 방법을 사용할 수 있습니다. 그들이 당신이 방금 말한 것에 대해 이해한 바를 되풀이하도록 하십시오".

 

명확하고 단순한 언어를 옹호하는 우리들은 때때로 이것이 "수준을 낮추는 것(dumbing down)"인지 질문하는 동료들로부터 반발을 받을 수 있습니다. 저는 Schillinger에게 그의 의견을 물었습니다. 그는 "대부분의 사람들, 심지어 매우 정교한 환자들도 명확한 설명을 좋아합니다"라고 말했습니다. Schillinger는 또한 수년간의 임상 실습에서 의사가 너무 명확하게 말한다고 불평하는 환자를 단 한 번도 들어본 적이 없다고 덧붙였습니다.

 


챕터 22: 청중 알기: 문해력 (Know Your Audience: Literacy)

시작점

2003년 성인 문해력 국가 평가(National Assessment for Adult Literacy, NAAL)는 미국 성인의 문해력을 측정한 가장 최근의 포괄적인 조사입니다. NAAL은 문해력을 "사회에서 기능하고, 자신의 목표를 달성하며, 지식과 잠재력을 개발하기 위해 인쇄되고 쓰여진 정보를 사용하는 것"으로 정의했습니다. 이 광범위한 정의 내에는 세 가지 유형의 문해력이 있습니다:

  • 산문 문해력 (Prose literacy). 신문, 잡지, 책과 같은 자료에서 발견되는 텍스트를 이해하고 사용하는 데 필요합니다.
  • 문서 문해력 (Document literacy). 신청서, 일정표, 양식, 지도, 그래프, 표와 같은 항목에 필요합니다.
  • 양적 문해력 (Quantitative literacy). 대출 이자 지불액을 계산하는 데 필요한 것과 같은 산술 연산을 위해 필요합니다.

국제 성인 역량 평가 프로그램 (PIAAC)은 전 세계 문해력에 대한 더 최근의 조사입니다. PIAAC 조사는 전 세계 30개국 이상에서 최소 10년에 한 번씩 실시됩니다. 이는 16세에서 65세 사이의 성인에게서 "간단한 단락 읽기부터 복잡한 문제 해결까지... 인지 및 직장 기술"을 측정합니다. 미국에 대한 가장 최근의 PIAAC 데이터는 2017년에 수집되었습니다.

 

NAAL과 PIAAC는 인정하건대 동일하지 않습니다. 그 차이점은 연구된 인구 집단뿐만 아니라 그들이 측정하는 특정 기술에 관한 것입니다. 저에게 이러한 연구의 건강 정보 이해 능력에 대한 관련성은, 커뮤니케이터로서 우리가 청중 대부분이 이해하고 사용할 수 있는 방식으로 건강 정보를 작성하는 데 있어 여전히 많은 할 일이 남아 있다는 것입니다.


실습 이야기: 왜 어떤 사람들은 읽기에 어려움을 겪는가

Michele Erikson은 Wisconsin Literacy, Inc.의 전무이사입니다. 2015년에 그녀는 왜 어떤 사람들이 읽기에 어려움을 겪는지 설명해 주었습니다.

 

Erikson은 한 가지 이유가 난독증과 같은 학습 장애일 수 있다고 말했습니다. 또 다른 이유는 부모가 아이들이 어릴 때부터 문해력 기술을 쌓기 시작하지 않을 수 있다는 것입니다. Erikson은 "아이가 아주 어린 시절부터 말하거나 구두 문해력에 참여하지 않으면, 부모가 아이에게 말을 걸고, 노래하고, 책을 읽어주고, 참여시키는 아이들만큼 자주 그러한 회로와 연결이 만들어지지 않습니다"라고 말했습니다.

 

성인이 되어서도 사람들은 자신이 읽기에 어려움을 겪는다는 것을 다른 사람들에게 알리고 싶어 하지 않을 수 있습니다. Erikson은 "만약 당신이 성인이고 아직 그 기술이 없다면, 그것은 당신이 정말로 공유하고 싶어 하는 것이 아닙니다"라고 말했습니다.


전략, 아이디어 및 제안

  • 일관된 용어와 일반적인 단어 사용. 일관된 단어를 사용하여 독자가 이해하기 쉽게 만드십시오. 여기에는 "수술(surgery)"과 같은 단어의 동일한 형태를 사용하고 "수술들(surgeries)"이나 "외과적인(surgical)"과 같은 다른 형태를 사용하지 않는 것이 포함됩니다. 항목과 절차를 "실밥(stitch)" 또는 "봉합(suture)"과 같이 매번 동일한 단어로 언급하십시오. 가능하다면 흔한 한두 음절 단어를 사용하십시오. 그러나 "화학 요법(chemotherapy)"이나 "기관지 확장제(bronchodilator)"와 같이 더 복잡한 단어가 정말로 필요할 때는 그것들을 사용하고 이해하기 쉬운 설명을 제공하십시오.
  • 충분히 쉽게 읽을 수 있는 서면 자료 선택. 기초 문해력 수준에서 읽는 사람들을 위해 글을 쓸 때는 보통 5~8학년 읽기 수준으로 자료를 작성하는 것이 권장됩니다. 기초 이하 문해력 기술을 가진 사람들을 위해 글을 쓸 때는 3~5학년 읽기 수준으로 자료를 작성해야 합니다. 그러나 이러한 수준으로 글을 쓰는 것은 종종 매우 어렵습니다.
  • 어려운 문서를 더 쉽게 읽을 수 있도록 만드십시오. 때로는 읽기 어려운 문서만 가지고 있을 수도 있습니다. 그렇다면 독자를 위해 그것들을 더 쉽게 만들 방법을 찾으십시오. 핵심 사항을 강조하거나 동그라미를 쳐서 시각적으로 할 수 있습니다. 또한 독자가 편안할 때, 충분한 시간이 있을 때, 또는 낯선 단어를 설명하는 데 도움을 줄 수 있는 다른 사람들과 함께 있을 때 이러한 자료를 다시 보라고 격려할 수도 있습니다.
  • 비서면 옵션 제공. 여기에는 그림 문자(pictographs), 물건, 비디오와 같은 다른 형태의 교육 도구가 포함됩니다. 또한 온라인 텍스트를 소리 내어 읽어주는 스크린 리더와 같은 보조 기술의 사용을 고려할 수도 있습니다. 이 기술에 대해 더 배우고 유용한 도구와 기술을 찾을 수 있는 좋은 자료는 Web Accessibility Initiative입니다.

실습 이야기: 건강 자료를 읽기 위해 고군분투하는 것

기초 문해력은 서면 건강 정보를 읽고, 이해하고, 사용하는 데 필수적입니다. 저는 사랑하는 동료인 Archie Willard에게서 성인으로서 읽기에 어려움을 겪는다는 것이 어떤 것인지 많이 배웠습니다. 저는 종종 그를 저의 "건강 정보 이해 능력 영웅"이라고 부릅니다.

 

Archie Willard는 건강 정보 이해 능력의 명확하고 열렬한 옹호자였습니다. 그는 건강 정보 이해 능력 컨퍼런스를 조직하고, 미국 의사 협회와 Joint Commission의 건강 정보 이해 능력 패널에 참여했으며, 전국 건강 정보 이해 능력 컨퍼런스의 주요 연설자였습니다. Willard는 54세가 되어서야 읽는 법을 배웠습니다.

 

2008년에 저는 Willard에게 건강 상황에서 그와 다른 "성인 학습자" (읽는 법을 배우는 성인)에게는 어떤 느낌인지 물었습니다. 그는 "읽기 능력이 강하지 않은 사람은 의사 사무실, 클리닉 또는 병원에 가면 항상 자동으로 서류가 건네집니다"라고 말했습니다.

 

저는 그가 건강 기록 양식, 소책자 또는 기타 인쇄된 정보를 언급하는 것인지 물었습니다. Willard는 그 모든 것이라고 말했습니다. "마음속으로 한 발짝 물러서게 됩니다. '이 단어를 어떻게 철자해야 할까? 내가 쓸 수 있을까?' 하는 두려움이 생깁니다"라고 말했습니다.

 


챕터 25: 학습과 교육 (Learning and Teaching)

시작점

모든 건강 관리 만남은 제공자가 환자에게 가르치고, 지식을 교환하며, 상호 학습에 참여할 수 있는 기회입니다. 여기에는 환자에게 진단 및 치료 옵션에 대해 가르치는 것이 포함됩니다. 또한 환자의 증상, 우선순위, 선택에 대해 배우는 것도 포함됩니다.

 

건강 학습 및 교육은 시술 및 검사 직전에 환자와 대화할 때와 같이 비공식적으로 일어날 수 있으며 , 구조화된 교육 상황에서 더 공식적으로 일어날 수도 있습니다.

 

다음은 몇 가지 예시입니다.

  • 일대일 교육 (One-to-one teaching). 전통적으로는 한 명의 건강 전문가와 한 명의 환자의 이인조를 의미했습니다. 그러나 오늘날에는 여러 명의 건강 관리 팀 구성원, 환자의 가족 또는 간병인, 그리고 통역사까지 포함하여 더 많은 사람이 관련될 수 있습니다.
  • 건강 교육 수업 (Health education classes). 이는 보통 건강 전문가가 이끌며 공식적인 교육과정(커리큘럼)과 명확한 목표를 가지고 구조화됩니다. 수업은 질병 및 의료 절차와 같은 특정 주제 또는 건강 및 안전과 같은 더 일반적인 주제에 초점을 맞출 수 있습니다.
  • 지원 및 자조 그룹 (Support and self-help groups). 보통 환자나 소비자가 이끌며, 이러한 유형의 그룹은 참가자의 특정 요구와 관심사를 수용할 수 있는 내장된 유연성으로 인해 상당히 비공식적인 경향이 있습니다.

건강에 대해 가르치는 것은 여러 가지 이유로 도전적입니다. 지침이 복잡하거나 익숙하지 않은 단어나 많은 숫자로 설명될 수 있습니다. 환자는 제한된 문해력이나 언어 능력, 인지 변화 또는 기타 학습 장애가 있을 수 있습니다. 사람들이 새로운 진단에 압도되거나 두려워하거나, 아프거나, 고통스러울 때, 그들은 학습하기 가장 좋은 상태가 아닐 가능성이 높습니다.


실습 이야기: 지식과 기술을 쌓기 전에, 사람들이 무엇을 아는지 알아보십시오

Susan Reid는 뉴질랜드에 거주합니다. Reid는 문해력 교육에 대한 다년간의 경험을 바탕으로 활동하는 숙련된 건강 교육자입니다. 그녀의 성과에는 환자, 가족 및 인력을 위한 건강 정보 이해 능력 연구 및 이니셔티브가 포함됩니다. 우리는 2014년에 그녀와 이야기했습니다.

 

Reid는 건강 지식과 기술을 쌓을 때 중요한 첫 번째 단계는 상대방이 그 주제에 대해 무엇을 알고, 느끼고, 믿는지 알아보는 것이라고 말했습니다. "건강 분야에서, 우리는 종종 사람들이 아무것도 모른다고 가정하고 그래서 그들에게 온갖 것을 말해줍니다. 또는 그들이 모든 것을 안다고 가정하고 충분히 말해주지 않습니다".

 

Reid는 사람들이 이미 알고 있는 것을 물어보는 것이 세 가지 중요한 방식으로 기술과 지식을 쌓는 데 도움이 된다고 말했습니다. "첫째, 사람들이 무엇을 아는지 알아내면 환자에게 의미 있는 방식으로 그 지식에 연결할 수 있습니다. 둘째, 건강 전문가로서 당신이 이 사람에게 더 많은 정보를 줄 수 있는지, 아니면 그들이 너무 기본적인 지식 수준이어서 당신이 염두에 둔 모든 정보를 제공할 수 없는지 결정하는 데 도움이 됩니다". 그녀는 덧붙였습니다. "세 번째는 당신이 그 사람을 위해 그것을 개인화하려고 노력하고 있다는 것을 환자에게 보여주는 것입니다. 그것은 당신이 둥근 구멍에 억지로 밀어 넣으려는 사각형 못이 아닙니다".

 

Reid의 전반적인 조언은 "사람들이 배우는 능력과 관심이 있다고 믿는 것"이었습니다. "때때로 건강 전문가로서 우리는 약간 지쳐서 사람들이 관심이 없다고 생각합니다. 그러나 사람들은 자신의 건강과 약에 대해 배우고 싶어 합니다".


전략, 아이디어 및 제안

  • 사람들이 여러 방식으로 학습한다는 것을 인식. 일부 사람들은 청각 학습자이며 강의를 듣거나 구두 지침을 들을 때 가장 잘 배웁니다. 다른 사람들은 시각 학습자이며 그림을 보거나 책을 읽을 때 더 잘 이해합니다. 또 다른 사람들은 물건을 만지거나 활동을 할 때 정보를 흡수하는 운동 학습자입니다. 종종 사람들은 둘 이상의 스타일을 가지고 있으며 이러한 방식들의 조합을 통해 가장 잘 배웁니다. 다양한 교육 전략을 사용하는 것이 종종 도움이 됩니다. 예를 들어, 천식 진단을 새로 받은 사람에게 가르칠 때, 상태에 대해 이야기하고, 폐 모형을 보여주고, 흡입기 사용을 연습하게 하고, 나중에 읽을 수 있는 인쇄물 자료를 제공할 수 있습니다.
  • 환자가 배울 준비가 되었을 때 가르치십시오. 당신의 교육 시점은 내용만큼이나 중요할 수 있습니다. 환자는 산만하거나 불편할 때 배울 수 없을 수 있습니다. 각 세션에서 얼마나 많은 정보를 제시할지에 대해 환자로부터 단서를 얻으십시오. 예를 들어, 나중에 교육을 계속하기 위해 후속 회의 일정을 잡는 것입니다.
  • 사람들이 능동적인 학습자가 되도록 격려. 사람들은 단순히 정보의 수동적인 수혜자가 아니라 학습 과정에 능동적으로 참여할 때 가장 잘 배웁니다. 사람들에게 무엇을 배우고 싶은지 묻고 함께 의제를 설정하십시오. 학습자가 질문을 하고 우려 사항을 제기할 수 있는 충분한 시간을 가진 상호 작용의 기회를 허용하십시오. 그리고 물론, 더 배우고 싶어 하는 사람들을 위해 인쇄 및 비인쇄 자료(전화번호, 비디오, 조직) 목록을 제공하십시오.
  • 명료한 언어로 지침을 설명하십시오. 여기에는 익숙하지 않지만 필수적인 단어를 정의하고 사람들이 이해하는 데 도움이 되는 예시를 제공하는 것이 포함됩니다. 예를 들어, 환자에게 "5파운드 이상 들지 마십시오"라고 지시하는 대신, 5파운드가 밀가루 한 봉지와 같은 무게라는 것을 알려주십시오. 또한 "하루에 두 번 알약을 복용하십시오"와 같은 지침을 명확히 하십시오. 당신이 이것을 "아침에 한 알, 밤에 한 알 복용"으로 의도했을 수 있지만, 환자는 같은 시간에 두 알을 복용할 수 있다고 가정할 수 있습니다.
  • 당신이 너무 빠르거나 너무 느리게 가고 있다는 신호를 주시. 좋은 방법은 사람들이 "멍해 보이거나" 그들의 몸짓 언어가 지루함을 나타내는지 관찰하는 것입니다. 당신이 좋은 속도로 가르치고 있는지 물어볼 수도 있습니다. 한 번에 한 사람에게 가르칠 때 이러한 단서를 알아차리기가 더 쉽습니다. 그러나 그룹을 가르칠 때도 주기적으로 멈추어 사람들이 질문을 하거나 방금 가르친 행동을 연습할 수 있도록 하여 속도를 확인할 수 있습니다. 참가자들이 당신이 너무 작게 말하거나 인쇄된 정보가 너무 작아서 보거나 읽기 어렵다면 알려달라고 격려하십시오.
  • 이해를 확인. 모든 학습과 교육의 목표는 지식입니다. 사람들이 당신이 제시하는 정보를 진정으로 이해하고 사용할 수 있는지 확인하십시오. 주기적으로 멈추고 학습자가 당신의 속도를 따라가고 있는지 확인하십시오. 그들에게 그들이 이해한 바를 자신의 말로 되풀이하도록 요청하거나, 방금 가르친 행동을 어떻게 할 것인지 보여주도록 요청함으로써 이것을 할 수 있습니다. 지식은 양방향 프로세스이므로, 환자가 당신에게 가르치는 것도 당신이 진정으로 이해했는지 확인하십시오.

 


챕터 28: 수리력: 숫자와 데이터 (Numeracy: Numbers and Data)

시작점

대부분의 건강 정보를 이해하기 위해서는 사람들은 숫자에 대한 실질적인 지식이 필요합니다1. 이는 위험 데이터 파악, 영양 성분표를 읽고 건강한 식품 선택, 비용 추정 및 예산 계산, 그리고 만족도나 통증을 1부터 10까지의 척도로 평가하는 등의 과제를 위해서입니다2. 이와 같은 숫자 기반의 과제는 "건강 수리력(health numeracy)"의 일부로 간주됩니다3.

 

캔자스 대학교 의과대학의 Amanda Golbeck과 그녀의 동료들이 정의한 건강 수리력은 "개인이 효과적인 건강 결정을 내리는 데 필요한 수치적, 양적, 그래프적, 생물통계학적, 확률적 건강 정보접근하고, 처리하고, 해석하고, 소통하며, 행동하는 역량을 갖는 정도"입니다4. 이 정의는 수년 동안 여러 번 인용되었습니다5.

 

Golbeck과 그녀의 동료들은 건강 수리력 기술을 다음과 같이 분류했습니다6:

  • 기초 (Basic). 숫자를 식별하고 양적 데이터의 의미를 파악하는 데 필요한 기술이 포함됩니다7. 이는 알약을 세거나 8, 약속 시간과 날짜를 아는 것과 같은 작업에 사용됩니다9.
  • 계산 (Computational). 숫자를 세고, 양을 측정하고, 계산하고, 조작하는 기술이 포함됩니다10. 하루에 섭취한 탄수화물 총량을 계산하는 것이 예시입니다11.
  • 분석 (Analytical). 추론, 추정, 비율, 백분율 및 기타 높은 수준의 개념을 이해하는 데 필요한 기술입니다12. 콜레스테롤 수치가 정상 범위 내에 있는지 판단하는 것, 기본 그래프를 이해하는 것, 보험 혜택을 비교하는 것이 예시에 포함됩니다13.
  • 통계 (Statistical). 위험 및 무작위화 또는 "맹검" 연구와 같은 개념을 이해하기 위해 양적 정보를 비판적으로 분석하는 데 필요한 기술입니다14.

현재까지 거의 모든 건강 수리력 연구는 일반 대중의 대다수가 숫자를 이해하고 사용하는 데 어려움을 겪는다고 결론지었습니다15. 2003년 (이 조사가 마지막으로 완료된 해)에 성인 문해력 국가 평가(National Assessment of Adult Literacy)는 문해력 기술의 하위 집합으로 양적 문해력을 살펴보았습니다16. 이 조사의 결과는 다음과 같습니다17:

  • 미국 성인의 22%가 기초 이하의 양적 기술을 가졌습니다18.
  • 같은 인구의 33%가 기초 양적 기술을 가졌습니다19.
  • 33%가 중급 양적 기술을 가졌습니다20.
  • 13%가 숙련 양적 기술을 가졌습니다21.

보다 최근에 국제 성인 역량 평가 프로그램(PIAAC)은 유사한 주제에 대한 조사를 실시했습니다22. PIAAC는 16세에서 65세 사이의 사람들을 대상으로 하는 "주요 인지 및 직장 기술에 대한 대규모 국제 연구"이며 23, 이 기술에는 기본 수학 및 계산 방법을 사용할 수 있는 능력이 포함됩니다24. 2012년부터 2015년까지 32개국을 대상으로 한 조사에서, "미국 성인들은 참여국들의 PIAAC 국제 평균보다 문해력에서는 더 높은 점수를 받았지만; 수리력디지털 문제 해결에서는 모두 더 낮은 점수를 받았습니다"25.


실습 이야기: 숫자를 사용하는 이유를 아십시오

당신이 전달하고자 하는 메시지는 무엇입니까? 이 요점을 전달하는 데 숫자가 필수적입니까? 사람들이 숫자를 이해하는 데 어려움을 겪을 수 있음에도 불구하고, 역학자이자 건강 소통 과학자인 David Nelson, MD, MPH는 데이터가 사용되어야 할 때가 있다고 말합니다26. 그는 Making Data Talk: Communicating Public Health Data to the Public, Policy Makers, and the Press를 포함한 수많은 기사와 책의 저자입니다27. 우리는 2012년에 그와 이야기했습니다28.

 

Nelson은 "과학은 숫자에 기반을 두고 있습니다"라고 말했습니다29. "그것들은 우리가 이것이 실제로 우리가 아는 어떤 종류의 연구에 기반을 두고 있다고 말함으로써 우리 자신을 구별하는 방식입니다. 그것은 단지 의견이나 제 믿음에 관한 것이 아닙니다"30.

 

그럼에도 불구하고 Nelson은 일부 상황에서는 데이터를 사용해야 하는지 고려할 것을 조언했습니다31. 그는 허리케인이나 기타 자연 재해 시 대중에게 무엇을 해야 하는지 전달하는 예시를 공유했습니다32. "지하실로 가서 창문에서 떨어져 있는 것이 좋은 생각이라고 말하는 연구를 인용할 필요는 없다고 생각합니다"33. 주요 목적이 부상을 예방하는 방법을 설명하는 것이라면, Nelson은 "과학적 증거와 숫자를 인용할 필요 없이 그냥 대피하라고 말할 것"이라고 조언했습니다34.


전략, 아이디어 및 제안

  • 개념을 이해하기 쉽게 만드십시오. 다음은 몇 가지 방법입니다:
    • 임상의와 과학자는 인구 집단의 관점에서 이야기할 수 있지만 (예: "10,000명 중 2,753명이 [발병할] 가능성이 있습니다") 35, 많은 사람들은 "이것이 나에게 일어날까요?"에 훨씬 더 관심이 있다는 것을 인식하십시오36.
    • 위험이 무엇인지 명확히 하십시오37. 예를 들어, 이 위험이 특정 질병으로 진단받는 것에 대한 것인지, 아니면 그것으로 사망하는 것에 대한 것인지 설명하십시오38.
    • 가능할 때 상대적 위험 (새로운 약이 사람의 위험을 50% 줄인다)이 아닌 절대적 위험 (새로운 약이 사람의 위험을 10명 중 2명에서 10명 중 1명으로 줄인다)으로 위험을 명시하십시오39.
    • 언급된 바와 같이, 결과를 부정적인 용어 (환자의 5%는 개선되지 않거나 악화된다)보다는 긍정적인 용어 (환자의 95%가 개선된다)로 제시하십시오40.
    • 맥락을 제공하십시오41. 예를 들어, 환자의 콜레스테롤 검사 결과가 $220~mg/dL$로 나왔다면 42, 이 수치가 좋은지 나쁜지 판단하도록 도와주십시오43. 한 가지 방법은 높고 낮은 기준이나 작년의 콜레스테롤 수치와 같은 추가 정보를 제공하는 것입니다44.
  • 사람들이 정확하게 측정하도록 도우십시오. 다음은 몇 가지 방법입니다:
    • 마시는 컵을 얼마나 높이 채워야 하는지 표시하십시오45. 또는 채소, 과일, 단백질, 곡물의 적절한 비율을 보여주기 위해 나뉜 접시를 사용하십시오46. 그래픽으로 이를 수행하는 예시는 미국 농무부(United States Department of Agriculture)의 MyPlate입니다47474747.
    • "4온스의 고기플레잉 카드 한 덱 크기와 비슷합니다"와 같이 알려진 양과 비교하십시오48. 또는 "당신은 밀가루 한 봉지와 같은 무게인 5파운드까지 들어 올릴 수 있습니다"49.
    • 리터 대신 또는 그램 대신 온스와 같이 익숙한 측정 단위를 사용하십시오50.
    • 분수를 시연하십시오. 분수는 혼란스러울 수 있습니다51. 일부 사람들은 분수의 어느 한 부분에서 더 큰 숫자가 더 많은 것을 의미한다고 생각할 수 있습니다52. 그러나 더 큰 분모(아래 숫자)는 실제로는 전체에서 더 작은 조각을 의미할 수 있습니다53. 물을 1/3 채운 잔과 1/2 채운 잔을 비교하는 것과 같이 특정 분수가 무엇을 의미하는지 보여줄 수 있습니다54.
  • 계산을 더 쉽게 만드십시오. 완전한 정보를 제공하고 상대방에게 계산을 요구하지 않는 것이 더 좋습니다55. 그러나 때로는 사람들이 그렇게 해야 할 때가 있습니다. 예를 들어, 지방의 총량을 더하거나 레시피를 반으로 나누는 것과 같습니다56. 직접 만나는 경우, 옆에 앉아 함께 계산하십시오57. 글을 쓸 때는 다음과 같이 소수점을 처리하는 방법을 보여주기 위해 숫자를 줄 맞춤하십시오58:
  • 다른 사람들이 당신의 단어와 기호를 어떻게 이해할지 고려하십시오.
    • 중요한 개념을 숫자와 단어 모두를 사용하여 명확히 하십시오59. 예를 들어, 사전 동의 양식에는 종종 "흔한(common)", "흔치 않은(uncommon)", "드문(rare)"과 같은 용어가 포함됩니다60. "흔한 위험은 10명 중 최소 4명에게 영향을 미칩니다"와 같이 이러한 용어가 무엇을 의미하는지 명확히 하십시오61.
    • "적절한(adequate)", "적당한(moderate)", "약간의(some)"와 같이 해석의 여지가 있는 모호한 단어를 피하십시오62.
    • 여러 의미를 가진 단어에 민감하십시오63. 여기에는 "그리고(and)"라는 단어가 포함되며, 이는 "더하다" 또는 "또한"을 의미할 수 있습니다64.
    • 모든 사람이 수학 기호를 이해하는 것은 아님 아십시오65. 여기에는 $<, >, \text{ and } +/-$가 포함됩니다66.
    • 규칙을 융통성 있게 적용하는 것을 기꺼이 하십시오. 실제로, "다섯(five)" 대신 "5"라고 쓰는 것이 괜찮을 때가 많습니다67.
  • 이해를 확인하십시오. 환자가 숫자와 데이터를 진정으로 이해했는지 확인하십시오68. 예를 들어, 환자에게 숫자 기반 정보를 친구나 가족에게 어떻게 설명할 것인지 물어볼 수 있습니다69. 당신도 진정으로 이해했는지 확인하십시오. 건강 전문가라고 해서 숫자 문제에서 면역되는 것은 아닙니다70.

실습 이야기: 숫자에 기반한 정보에 입각한 선택하기

어쩌면 당신은 저와 같아서 신체 부위가 항상 우리가 원하는 대로 작동하지 않는 나이일지도 모릅니다71. 몇 년 전에 저는 심각하지만 치료 가능한 무언가를 진단받았습니다72. Bita Tabesh, MD는 저의 많은 의료 전문가 중 한 명이었습니다73.

 

환자와 제공자가 종종 그렇듯이, Tabesh 박사와 저는 약물에 대해 많이 이야기했습니다74. 그녀는 저의 건강 이력을 가진 여성들을 위한 두 가지 매우 다른 계열의 약물이 있다고 말했습니다75. 그녀는 둘 다 설명하고 저에게 정보에 입각한 선택을 하도록 요청했습니다76. 그녀는 각 약물의 의미를 제가 더 잘 이해하도록 돕기 위해 절대 위험, 상대 위험, 치료 필요 수(numbers needed to treat), 그리고 5년 결과를 포함한 숫자 데이터를 이야기했습니다77.

 

제가 그녀에게 이전에 말하지 않았던 것은 제가 숫자를 "잘 다루지 못한다"는 것이었습니다78. 다행히도 그녀는 제 얼굴의 멍한 표정을 알아차리고 이 숫자들의 의미를 몸짓으로 표현했습니다79. 한 손을 높이 들고, "이 새로운 약이 얼마나 도움이 될 수 있는지"를 보여주었습니다80. 다른 손으로 낮게 몸짓하며 "만약 복용한다면 위험은 이 정도입니다"라고 말했습니다81. 저는 시각적인 사람입니다82. 그녀의 몸짓 덕분에 저는 Tabesh 박사가 말하는 것을 "이해했고" 정보에 입각한 약물 선택을 했습니다83. 이 이야기가 특별한 것은 무엇일까요? 아무것도 없습니다84. 그리고 그것이 중요한 이유입니다85. 모든 제공자가 Tabesh 박사가 저에게 했던 것처럼 숫자를 명확하게 설명한다면 의료가 어떨지 상상해 보십시오86.


챕터 31: 명료한 언어 (Plain Language)

시작점

명료한 언어(Plain language)는 제한된 문해력이나 제한된 영어 능력을 가진 독자뿐만 아니라 모든 사람에게 도움이 됩니다1. PLAIN (Plain Language Association International)에 따르면, "소통이 명료한 언어로 이루어졌다는 것은 그 단어 선택, 구조, 디자인이 의도된 청중이 필요한 것을 쉽게 찾고, 찾은 것을 이해하며, 그 정보를 사용할 수 있을 만큼 명확하다는 것을 의미합니다"2.

 

명료한 언어로 글을 쓰는 것은 과학이자 예술입니다3. "과학" 부분은 확립된 지침을 따르고 입증된 전략을 사용하는 것과 관련이 있습니다4. "예술" 부분은 이해할 수 있을 뿐만 아니라 매력적이고, 흥미롭고, 유용하며, 관련성 있게 정보를 구성하는 것과 관련이 있습니다5.

 

명료한 언어로 글을 쓰는 것이 당신이 해본 일 중 가장 어려운 일은 아닐 것입니다6. 하지만 가장 쉬운 일도 아닐 수 있다는 사실에 놀라지 마십시오7. 저는 다년간의 경험을 통해 단순하게 하는 것이 어려울 수 있다는 것을 배웠습니다8.


실습 이야기: 이전과 이후의 예시

다음은 두 번의 독감 주사가 필요했던 시기에 작성된 독감 백신 정보의 "이전" 버전입니다9. 저는 이것이 명료한 언어로 어떻게 보일 수 있는지에 대한 예시로 "이후" 버전을 작성했습니다10. 독자들이 어떤 버전을 더 쉽게 읽고, 이해하고, 행동으로 옮길 것이라고 생각하십니까11?

 

"이전" 예시 원문12:

65세 이상인 경우 이번 독감 시즌에 알아야 할 사항 및 조치 사항.
독감을 예방하는 가장 좋은 방법은 독감 백신을 맞는 것입니다13. 65세 이상인 사람들에게는 매년 계절 독감 예방 접종이 권장됩니다14. 계절 독감 백신을 아직 맞지 않은 65세 이상인 사람들도 예방 접종을 받아야 합니다. 비록 올해 계절 독감 백신 공급이 조기에 가능해졌고 높은 관심으로 인해 제한적이지만 말입니다15.
65세 이상인 사람들은 이제 2009년 H1N1 바이러스에 대한 예방 접종을 받도록 권장됩니다16. 2009년 H1N1 바이러스에 대한 백신 공급이 극적으로 증가했으며 대부분의 장소에서는 원하는 사람이라면 누구에게나 예방 접종을 받을 수 있도록 개방했습니다17. 이 백신은 2009년 H1N1 팬데믹 바이러스로부터 보호하는 가장 좋은 방법입니다18. 65세 이상인 사람들을 포함하여 2009년 H1N1 백신을 참을성 있게 기다려온 사람들은 이제 예방 접종을 받도록 권장됩니다19.

 

"이후" 예시 (명료한 언어)20:

독감에 대해 무엇을 해야 할지 아십시오. 독감을 예방하는 가장 좋은 방법은 독감 주사를 두 번 맞는 것입니다21. 하나는 계절 독감 (겨울 독감)을 예방하는 주사입니다22. 다른 하나는 H1N1이라는 새로운 독감을 예방하는 주사입니다23. 미국 질병통제센터(CDC)는 65세 이상인 사람들에게 두 주사 모두 맞을 것을 권장합니다24.
이전에 독감 백신이 충분하지 않다는 말을 들었을 수도 있습니다25. 그것은 변화되었으며 이제 독감 주사를 원하는 모든 사람에게 충분한 백신이 있습니다26. 기다릴 필요가 없습니다. 오늘 독감 주사를 맞으십시오27.

전략, 아이디어 및 제안

  • 팀 구성. 읽기 쉬운 문서를 작성하는 데는 이 필요합니다28. 저에게 이 팀은 다음을 포함해야 합니다:
    • 명료한 언어에 능숙하고 독자를 위한 끊임없는 옹호자인 명료한 언어 작가29;
    • 어떤 정보가 반드시 남아 있어야 하고 어떤 정보가 제거될 수 있는지 결정하는 한 명 이상의 내용 전문가30; 그리고
    • 문해력 수준, 언어, 연령, 문화, 주제에 대한 관심 및 친숙도 측면에서 의도된 청중을 대표하는 독자31.
  • 프로젝트 목표 식별. 자신만의 프로젝트를 진행하든 다른 사람을 위해 문서를 작성하든, 시작부터 목표를 식별하십시오32. 저는 독자들이 이 문서를 읽은 결과로 무엇을 알고, 무엇을 하고, 무엇을 느껴야 하는지 물어봄으로써 이를 수행합니다33. 저는 답변을 메모하고, 글을 쓰는 동안 참조하며, 프로젝트가 거의 완료되었을 때 이 목표들을 검토합니다34.
  • 독자에게 의미 있는 방식으로 콘텐츠를 구성.
    • 하나의 주요 메시지를 식별하고 이를 제한된 수의 (보통 3~5개) 핵심 요점으로 뒷받침하십시오35. 명료한 언어로 글을 쓸 때 모든 것을 포함할 수는 없습니다. 왜냐하면 문서가 너무 길어질 것이기 때문입니다36. 대신, 필수가 아닌 "알면 좋은" 배경 정보보다는 독자가 반드시 배워야 하는 "알아야 할" 기술과 행동의 우선순위를 정하십시오37.
    • 독자에게 의미 있는 방식으로 핵심 요점을 구성하십시오 (단지 작가에게만 의미 있는 방식이 아닌)38. 일반적으로 이는 사람들이 이 정보를 왜 읽어야 하는지에 대한 "나에게 무엇이 이득인가"라는 개념으로 시작한다는 것을 의미합니다39. 예를 들어, 새로운 수술 절차에 대해 글을 쓸 때, 의료 시설이 이 절차를 수행하여 받은 상의 수보다는 환자가 이 절차로부터 어떻게 혜택을 받을 수 있는지로 시작하십시오40.
    • 끝에는 핵심 요점을 요약하고 서면 및 온라인 자료뿐만 아니라 비인쇄 자료 (전화번호, 비디오, 조직)를 포함하십시오41.
  • 이해할 수 있는 단어 사용.
    • 흔한 한두 음절 단어를 사용하십시오42. 특히 많은 전문적인 다음절 용어가 있는 의료 정보를 작성할 때 "딱 맞는" 단어를 선택하는 것은 어려울 수 있습니다43. 가능하다면, 사람들이 이미 알고 이해하는 흔한 한두 음절 단어를 사용하십시오44. "고혈압(hypertension)" 대신 "높은 혈압(high blood pressure)"이 예시입니다45.
    • 익숙하지 않지만 필요한 단어와 용어를 정의하십시오46. 더 전문적인 용어가 필요할 때가 분명히 있습니다47. 그럴 경우, 그것을 정의하고, 정확한 발음을 보여주며, 간단하게 작성된 예시나 설명을 포함하십시오48. 예를 들어, "기관지염(Bronchitis), [브롱-카이-티스], 기침을 유발하는 질병"처럼 말입니다49.
    • 매번 정확히 동일한 단어를 사용하여 일관성을 유지하십시오50. 하나의 용어를 선택하고 일관되게 사용하십시오51. 예를 들어, "bandage"를 선택했다면, "gauze", "compress", "dressing"과 번갈아 사용하지 말고 소책자 전체에 걸쳐 그것을 사용하십시오52.
    • "don't"와 "you'll"과 같은 축약어 사용에 주의하십시오53. 이러한 축약어는 친근하고 대화적인 것처럼 들리지만, 읽기 능력이 제한적이거나 영어를 배우는 사람들은 이해하지 못할 수 있습니다54. 대신, "do not"과 "you will"과 같이 전체 단어를 작성하십시오55.
    • 개념, 범주, 가치 판단 단어에 민감하십시오56. 익숙하지만, 독자들이 그 의미를 이해할 틀이 없을 수 있으므로 이러한 유형의 단어들은 어려울 수 있습니다57.
      • 개념 단어는 "건강(wellness)" 및 "건강 상태(health status)"와 같은 일반적이거나 추상적인 아이디어를 설명합니다58.
      • 범주 단어는 닭고기나 칠면조를 명시하기보다는 "가금류(poultry)"와 같은 전체 그룹을 포함합니다59.
      • 가치 판단 단어는 독자가 결정해야 하는 양이나 기준을 나타내며, 예를 들어 "드물게(rarely)"와 "적당한(moderate)" 등이 있습니다60.
  • 간결한 문장 작성.
    • 각 문장에 하나의 주요 아이디어약 15단어 이하만 포함하십시오61. 이렇게 하면 많은 쉼표와 절이 있는 복잡한 문장을 작성할 가능성이 줄어듭니다62. 점선(글머리 기호), 굵은 글꼴, 또는 추가 여백을 사용하여 많은 양의 텍스트를 나눌 수 있습니다63.
    • 문장 길이와 스타일을 다양하게 하십시오64. 명확하고 단순하지만 지루하지 않을 수 있습니다65. 문장 길이와 스타일을 약간 섞으십시오66. 예를 들어,
      • 항상 "아침 식사 전에 알약 4개를 복용하십시오. 아침 식사를 하십시오. 30분 동안 걸으십시오"와 같이 끊기는 문장만 쓰는 대신,
      • "건강한 방식으로 하루를 시작하십시오. 아침 식사를 하기 전에 알약 4개를 복용하십시오. 그런 다음 식사를 마친 후 30분 동안 걸으십시오"라고 쓸 수 있습니다67.
    • 누가 행동을 하는지 식별하십시오68. 능동적인 문장 구조를 사용하여 누가 무엇을 하는지 명확히 하십시오69. 예시는 "Pat은 사과 파이를 굽고 있습니다"입니다. 수동적이고 읽기 어려운 버전은 "사과 파이가 Pat에 의해 구워지고 있습니다"입니다70.
    • 조건부 if/then 문장에 민감하십시오71. 건강 관리는 "if"로 시작하고 중간에 "then"이 있는 많은 "가정적인" 조건부 정보로 가득 차 있습니다72. 그러나 독자는 "if" 절, "then" 절, 그리고 둘 사이의 관계를 이해해야 하므로 이것들은 이해하기 어려울 수 있습니다73.
  • 매력적인 어조 사용.
    • 친근하고 대화적인 어조로 작성하되, 지나치게 수다스럽거나 귀엽지 않게 작성하십시오74. 당신의 어조는 내용과 일치해야 합니다75. 슬프거나 어려운 주제는 가볍게 다루어서는 안 됩니다76.
    • "당신(you)"과 "당신의(your)"와 같은 인칭 대명사를 사용하여 마치 말하는 것처럼 작성하십시오77. 이를 달성하는 한 가지 방법은 글을 쓸 때 소리 내어 읽는 것입니다78.
    • 가능한 한 긍정적인 방식으로 정보를 제시하십시오79. 예를 들어, 사람들이 할 수 없는 것보다는 할 수 있는 것으로 시작하십시오80. 하지만 정직해야 합니다81. 실제로 분필 맛이 나는 약을 "기분 좋은 맛의 음료"라고 언급하지 마십시오82.
    • 명확하고 구체적이어야 하며, 독자에게 추측하거나 가정하도록 요청하지 마십시오83. 예를 들어, "적당히 운동하십시오"보다는 "매일 두 번 10분씩 걸으십시오"라고 작성하십시오84.
  • 형식과 레이아웃 고려.
    • 충분히 커서 볼 수 있는 글꼴 크기로 작성하십시오85. 일반적으로 이것은 12포인트 유형입니다86; 14 또는 16포인트 유형은 고령 독자나 시력이 제한적인 독자를 위해 선호됩니다87. 양식화되거나 이탤릭체 문자는 피하고 Times New Roman 또는 Arial과 같은 더 전통적인 글꼴을 사용하십시오88.
    • 모든 대문자 대신 대문자와 소문자의 조합을 사용하십시오89. 이렇게 하면 독자는 자신이 보는 글자에 대한 시각적 단서를 얻습니다90.
    • 왼쪽에 단어를 정렬하고, 가운데나 오른쪽에 정렬하지 마십시오91. 가운데 정렬된 텍스트는 종종 읽기를 어렵게 만드는 불균일한 간격을 초래합니다92. 또한 모든 줄이 왼쪽의 같은 위치에서 시작할 때 독자는 어디에 먼저 초점을 맞춰야 할지 압니다93.
    • 충분한 여백을 허용하십시오94. 일반적으로 인쇄 영역과 비인쇄 영역 사이에 $50/50$ 분할이 됩니다95. 여백이 최소 1인치 너비가 되도록 하십시오96. 이것은 눈에 편안할 뿐만 아니라 사람들이 메모, 의견, 질문, 낙서를 추가할 공간을 허용합니다97.
    • 글자와 배경 사이에 시각적 대비를 두십시오98. 이것은 일반적으로 비광택 흰색 또는 밝은 색 종이에 검은색 유형입니다99. 복사할 때, 복사본이 명확하고 읽기 쉬운지 확인하십시오100. 때로는 복사본의 복사본은 읽을 수 없을 수 있습니다101.
    • 제목을 사용하여 주요 주제를 식별하십시오102. 종종 가장 유익한 제목은 "당뇨병이란 무엇인가요?"와 같은 질문으로 작성됩니다103.
  • 그래픽을 현명하게 사용.
    • 단순히 장식적이지 않고 유익한 그래픽을 선택하십시오104. 그러나 일부 장식적인 디자인은 매우 매력적이어서 사람들이 읽도록 동기를 부여합니다105. 그럴 경우, 메시지에서 주의를 산만하게 하지 않는 디자인을 선택하십시오106.
    • 오해될 수 있는 추상적인 기호 대신 인식 가능한 이미지를 사용하십시오107. 예를 들어, 가로줄이 있는 빨간색 원은 미국 사람들에게는 일반적으로 "금지"를 의미하는 것으로 이해되지만, 세계의 다른 지역에서 온 사람들에게는 덜 익숙할 수 있습니다108.
    • 그림과 그 아래에 간단하게 작성된 캡션을 포함하여 독자에게 작업을 수행하는 올바른 방법을 보여주고 알려주십시오109. 이것은 일련의 지침에서 각 단계를 보여줄 때와 같이 매우 효과적일 수 있습니다110.
    • 청중에게 문화적으로 관련성이 있고 적절한 그림을 선택하십시오111. 예를 들어, 노인용 브로슈어에 건강하고 활동적인 노인들의 사진을 넣는 것이 될 수 있습니다112.
    • 내부 신체 부위를 전체 신체의 맥락에서 그리십시오113. 이것은 크기와 비율을 전달할 뿐만 아니라, 사람들이 혼란스럽거나 불쾌하게 생각할 수 있는 "분리된 신체 부위"를 피합니다114.
  • 이해 확인. 독자가 이해할 수 있는지 확인하는 가장 좋은 방법은 피드백을 요청하는 것입니다115. 의도된 독자를 대표하는 사람들에게 서면 자료의 초안을 검토하도록 요청하십시오116. 문서의 구성, 단어, 어조, 레이아웃, 그래픽에 대해 어떻게 생각하는지 알아보십시오117. 그들이 방금 읽은 정보를 어떻게 사용할 것인지 물어보십시오118. 필요한 편집을 할 뿐만 아니라 새로운 문제를 도입하지 않았는지 확인하기 위해 다시 피드백을 요청할 충분한 시간을 허용하십시오119.

실습 이야기: 명료한 언어는 수준을 낮추는 것이 아니라 똑똑하게 하는 것입니다

Karen Schriver, PhD는 정보를 명확하고, 설득력 있고, 유용하게 만드는 데 중점을 둔 컨설팅 회사 KSA Communication Design & Research의 사장입니다120. 그녀의 책, Dynamics in Document Design: Creating Text for Readers는 그 분야에서 획기적인 책으로 불려왔습니다121. 우리는 2018년에 그녀와 이야기했습니다122.

 

Schriver는 75년 이상에 걸친 명료한 언어의 발전에 대해 이야기했습니다123. "우리는 단어 선택, 문장 스타일, 문장의 구조 등에 대한 아이디어를 포함하도록 엄청나게 발전했습니다. 우리는 또한 전체 텍스트, 단락, 양적 표시, 시각 자료, 표, 차트, 그리고 오늘날 좋은 소통에 들어가는 모든 것을 보고 있습니다"124.

 

Schriver와 저, 그리고 많은 다른 사람들은 명료한 언어로 글을 쓰는 것에는 많은 이점이 있다는 것을 알고 있습니다125. 그러나 우리는 또한 이 방식으로 글을 쓰는 것이 "수준을 낮추는 것(dumbing down)"인지 질문하는 회의론자가 때때로 있다는 것도 알고 있습니다126. Schriver는 다음과 같이 말하며 이에 대해 언급했습니다. "그러한 반발은 사람들이 명료한 언어가 단지 어려운 단어를 쉬운 단어로 대체하는 것에 관한 것이라고 생각하는 곳에서 비롯됩니다127. 그것은 사람들로 하여금 어려운 단어를 제거하기만 하면 덜 정교하고 비전문적이거나 똑똑하게 들리지 않는 텍스트가 될 수 있다고 생각하게 만듭니다128. 그들은 당신이 그들의 텍스트의 지적 무결성을 앗아가고 있다고 생각할 수 있습니다"129.

 

Schriver는 처음에 명료한 언어에 회의적이었던 고객들과 함께 작업한 프로젝트의 예시를 공유했습니다130. Schriver는 "저는 복잡한 언어를 더 단순하게 만들고 있던 것이 아니었습니다. 저는 복잡한 아이디어를 텍스트의 구조에서 명백하게 만들고 있었습니다"라고 설명했습니다131. 그들이 Schriver가 문서의 초점을 조직의 관점에서 독자의 관점으로 어떻게 옮겼는지 볼 수 있게 되자, 회의론자들은 그들의 꺼림칙함을 극복했습니다132. 그들은 "우리가 독자에게 무엇을 해야 할지 말하는 것을 잊었습니다"라고 인정했습니다133.

 

N Engl J Med. 2025 Oct 23;393(16):1624-1632. doi: 10.1056/NEJMra2408797.

Educational Strategies to Prepare Trainees for Clinical Uncertainty

 

🩺 의사도 '모르겠다'고 말합니다: 의료 현장의 '불확실성'을 다루는 법

안녕하세요! 오늘은 매우 흥미로운 의학교육 논문 한 편을 소개해 드리려고 해요.

우리는 종종 의사 선생님이 모든 것을 알 것이라 기대하죠. 하지만 의료 현장(medical practice)은 사실 '불확실성(uncertainty)'으로 가득 차 있습니다. 환자의 상태는 교과서처럼 딱 떨어지지 않고, 검사 결과가 애매할 때도, 어떤 치료가 최선일지 100% 확신하기 어려울 때도 있습니다.

문제는, 의학계 문화가 이런 불확실성을 '무능함'이나 '극복해야 할 대상'으로 여겨왔다는 점입니다. 하지만 오늘 소개할 논문은 정반대의 이야기를 합니다. 불확실성은 피해야 할 대상이 아니라, 오히려 의료 행위의 본질적인 부분으로 받아들이고 관리하는 법을 배워야 한다는 것이죠.


💡 왜 '불확실성'을 다시 봐야 할까요?

전통적으로 의학 교육은 명확한 분류(clear classifications)와 단 하나의 정답(singular correct answers)을 찾는 훈련에 집중해왔습니다. 그러다 보니 의사나 수련생들은 불확실성을 마주하면 스트레스를 받고, 심지어 이를 숨기려 하기도 합니다.

하지만 이 논문의 저자들은 이런 관점을 바꿔야 한다고 강력하게 주장합니다.

"수련생들이 실전에 대비할 수 있도록, 교사들은 불확실성을 임상 문제를 이해하고 관리하는 방법의 핵심적인 특징(a central feature)으로 재규정할(reframe) 필요가 있습니다."

(To prepare trainees for practice, teachers need to reframe uncertainty as a central feature of how clinical problems are understood and managed.)

 

즉, 불확실성은 없애야 할 버그(bug)가 아니라, 임상 추론(clinical reasoning) 과정 자체의 핵심 기능(feature)이라는 거예요!


🧐 베테랑 의사들은 불확실성을 어떻게 다룰까요?

그렇다면 숙련된 의사들은 이 불확실성을 어떻게 다룰까요? 논문은 두 가지 핵심 전략을 제시합니다.

  1. 선제적 계획 (Forward Planning) 경험 많은 의사는 '만약(if...then...)' 시나리오를 끊임없이 시뮬레이션합니다. "만약 환자 상태가 나빠진다면? 만약 이 치료가 듣지 않는다면?"처럼 앞으로 일어날 수 있는 일들을 예측하고, 안전 계획(safety plans)을 미리 세워두는 거죠.
  2. 모니터링 (Monitoring) 단순히 환자의 활력 징후만 보는 게 아닙니다. 환자의 미묘한 표정, 동료 간호사의 분위기, 심지어 자기 자신의 감정(a sense of unease, 불안감)까지 모든 신호(cues)에 주의를 기울입니다. 그리고 이 신호들을 통합해 '지금 상황이 내가 생각한 대로 가고 있나?'를 끊임없이 재평가합니다.

🎓 수련생들이 불확실성을 관리하게 돕는 4가지 교육 팁

이 논문의 백미는 '그래서 이걸 어떻게 가르칠 것인가?'에 대한 실용적인 제안입니다. 교사(교수)들이 수련생들을 도울 수 있는 4가지 방법을 소개할게요.

1. 불확실성 '설명하기' (Narrating Uncertainty) 🗣️

교수님이 '소리 내어 생각하는(Thinking out loud)' 것이 중요합니다. 단순히 정답을 알려주는 게 아니라, 본인의 고민을 그대로 노출하는 거죠.

"그들(교사)은 '진단이 확실하지 않네요' 또는 '여기서 뭔가 잘못된 것 같습니다'와 같은 감정을 공유할 수 있습니다..."

(They may share sentiments such as “I’m not sure of the diagnosis” or “Something does not feel right here”...)

 

이렇게 교수가 먼저 "나도 모르겠다", "이 부분이 좀 이상하다"고 솔직하게 말하면, 수련생들도 자신의 불확실성을 편안하게 드러내고 도움을 청할 수 있는 안전한 학습 환경이 만들어집니다.

2. 불확실성 '프레이밍하기' (Framing Uncertainty) 🖼️

수련생이 불안해할 때, 그 불확실성의 정체를 파악하게 도와주는 겁니다. 논문은 두 가지 유형을 제시해요.

  • 인식론적 불확실성 (Epistemic uncertainty): 우리가 정보를 더 찾거나 공부하면 해결될 수 있는 불확실성. (예: "이 약물에 대한 최신 연구 결과가 뭐지?")
  • 확률적 불확실성 (Aleatoric uncertainty): 정보가 아무리 많아도 본질적으로 무작위(random)라서 어쩔 수 없는 불확실성. (예: "환자가 드물게 발생하는 약물 부작용을 겪을까?")

이걸 구분하면 "지금 우리가 무엇을 해야 할지"(정보 탐색? 혹은 최악의 시나리오 대비?)가 명확해집니다.

3. 불확실성 '시뮬레이션하기' (Simulating Uncertainty) 🎭

맨날 정답이 정해진 사례로만 공부하면 안 됩니다. 일부러 '정답이 없는(irresolvable dilemmas)' 시나리오를 줘야 한다는 거죠.

예를 들어, 검사 결과가 A 질환과 B 질환 모두와 애매하게 일치하는 환자 사례를 주고, '확정 진단 없이' 어떻게든 다음 단계를 결정하게 하는 겁니다. 중요한 건 '정답'이 아니라, 이 딜레마를 '어떻게 헤쳐나가는지(navigate)' 그 과정을 토론하는 것입니다.

4. 불확실성 '소통하기' (Communicating Uncertainty) 🤝

마지막으로, 이 애매한 상황을 동료, 상사, 그리고 환자에게 어떻게 말할지 가르쳐야 합니다.

특히 환자에게 "저도 잘 모르겠습니다"라고 말하긴 어렵죠. 하지만 연구에 따르면, 그냥 "모르겠다"고 하는 것보다 "가장 가능성이 높은 것은 A이지만, B일 가능성도 고려하고 있습니다"처럼 감별 진단(differential diagnoses)을 포함해 설명하는 것이 환자(보호자)의 선호도가 더 높았다고 해요.


맺음말

이 논문은 불확실성을 '의학의 적'이 아니라 '의학의 본질이자 보람 있는 측면'으로 봐야 한다고 말합니다.

"...불확실성이 주목받고(spotlighted), 전략적으로 관리되며(managed strategically), 의료 행위의 고유하고 보람 있는(inherent and rewarding) 측면으로 받아들여지는(embraced) 교육 문화를 조성하는 것."

(...foster an educational culture in which uncertainty is spotlighted, managed strategically, and embraced as an inherent and rewarding aspect of medical practice.)

 

어쩌면 '모른다'고 인정하는 바로 그 지점에서 진짜 전문가의 '임상 추론'이 시작되는 것 아닐까요? 의료 현장에서 고군분투하는 모든 의료진과 미래의 의료진을 응원하며 오늘 포스팅을 마칩니다!

 


불확실성(Uncertainty)은 의료 행위(medical practice)에 만연해(ubiquitous) 있지만, 종종 견디거나(tolerated) 근절해야(eradicated) 할 유감스러운 현상으로 여겨집니다.1 수련생들(trainees)이 실전에 대비할 수 있도록, 교사들은 불확실성을 임상 문제를 이해하고 관리하는 방법의 핵심적인 특징(a central feature)으로 재규정할(reframe) 필요가 있습니다.

 

임상의는 불확실성을 줄이기 위해 많은 노력을(go to great lengths) 기울일 수 있으며, 종종 이를 위협이나 스트레스의 원천으로 인식합니다. 의학계의 여러 문화적 힘(Multiple cultural forces)이 이러한 경향을 강화합니다.

  • 의사들은 고정된 특성(fixed characterizations)명확한 분류(clear classifications)에 기반한 생의학 과학(biomedical sciences) 분야에서 광범위한 훈련을 받습니다.2
  • 초기 의학 교육은 단일한 정답(singular correct answers)에 도달하기 위해 논리적 인과 경로(logical causal pathways)를 사용하는 사례 기반 토론(case-based discussions)과 표준화된 시험(standardized tests)으로 구성됩니다.3
  • 임상 수련과 실습은 이러한 경향(orientation)을 영속화하며, 동료, 교사, 환자들은 종종 불확실성에 부정적으로 반응하거나 이를 무능함(incompetence)과 동일시합니다.1,3–5
  • 전자 의무 기록(electronic medical record) 및 청구 플랫폼(billing platforms)과 같은 직장 내 구조적 요소(Structural elements)는 임상 문제가 명확히 정의되지 않은(ill-defined) 경우에도 질병이나 치료에 대한 명확한(unambiguous) 특성화를 요구합니다.

불확실성에 대한 혐오(An aversion to uncertainty)는 일상적인 임상 업무 중에 이를 숨기거나, 억압하거나, 최소화하려는 잠재의식적인 노력을 유발할 수 있습니다. 그러나 기술과 치료법의 발전으로 그 경계(frontier)가 이동하더라도, 임상 실습에서 불확실성을 근절할(eradicated) 수는 없습니다.6-9 이러한 확고한 현실(unyielding reality)은 교사들로 하여금 불확실성을 임상 추론(clinical reasoning)의 바람직하지 않은 부산물(undesirable by-product)이 아니라 오히려 그것의 핵심적인 특징(a central feature)으로 규정하도록 요구합니다.

 

본 논문(This review)은 임상의가 실제 현장에서 순간의 불확실성 경험(in-the-moment experiences of uncertainty)을 인식하고 관리하는 방식에 초점을 맞추고, 교사가 수련생의 불확실성 관리 자신감을 구축하는 데 사용할 수 있는 실용적인 전략(practical strategies)을 제공합니다.

 

불확실성의 경험(Experiences of Uncertainty).

 

지식의 철학적 토대(philosophical underpinnings)부터 생물학적 시스템의 고유한 변동성(inherent variability)에 이르기까지 불확실성에 대해 많은 글이 작성되었습니다.2,8 불확실성을 설명하기 위해 여러 관련 용어(related terms)가 사용되어 왔으며, 종종 상충되거나 중복되는 정의를 가집니다 (표 1).2,8,10,15,16

 

표 1 불확실성 및 관련 용어의 잠정적 정의(Working Definitions of Uncertainty and Related Terms).

 


핵심 사항(Key Points) 임상 불확실성에 대해 수련생을 준비시키기 위한 교육 전략(Educational Strategies to Prepare Trainees for Clinical Uncertainty)

  • 불확실성은 의료 행위에 만연합니다(ubiquitous). 불확실성이 없다면, 사회는 판단을 내릴(render judgments) 의사가 필요하지 않을 것입니다.
  • 임상 불확실성을 관리하는 것(Managing clinical uncertainty)은 의사의 기본 기술(foundational skill)이며 효과적인 임상 추론(clinical reasoning)의 핵심입니다.
  • 임상의는 다양한 신호(a range of cues)를 통해 불확실성을 인식하고, 선제적 계획(forward planning) 및 모니터링(monitoring)의 순환 과정(cyclic processes)을 사용하여 이러한 경험을 헤쳐 나갑니다.
  • 교사는 불확실성의 잠재적 원천(sources of uncertainty) (진단, 치료 또는 예후) 및 불확실성의 유형(types of uncertainty) (추가 정보가 불확실성을 재구성하거나 줄일 수 있는 인식론적(epistemic) 불확실성 또는 결과가 본질적으로 변동적인 확률적(aleatoric) 불확실성)에 대한 논의를 장려함으로써 수련생이 불확실성을 관리할 수 있도록 준비시킬 수 있습니다. 이러한 특성화(characterization)는 수련생이 불확실성을 이해하고, 관리하며, 소통하는 데 도움이 될 수 있습니다.
  • 교사는 불확실성을 학습 기회(opportunities for learning)가 있다는 신호로 재규정(reframe)해야 합니다.
  • 기술은 불확실성을 해결하지 못할 것입니다; 단지 불확실성의 소재(locus of uncertainty)를 이동시킬 뿐입니다.

 

수련생들은 자신의 역할과 책임, 동료 및 감독자에게 인식되는 방식, 또는 의사로서의 신흥 정체성(emerging identities)과 관련하여 광범위한 불확실성을 가질 수 있습니다.8,17,18 이러한 불확실성은 본 논문의 범위(beyond the scope of this review)를 벗어납니다. 우리는 임상적 불확실성(clinical uncertainty)에 초점을 맞추며,

  • 이는 임상의가 환자를 돌보는 방법에 대해 불완전한 이해(incomplete understanding)를 가지고 있다고 인식하는16 실무의 순간들을 특징으로 하며, 스스로에게 "무슨 일이지?" 또는 "무엇을 해야 하지?"라고 물을 수 있습니다.19
  • 신체적, 정서적 또는 행동적 신호(Somatic, emotional, or behavioral cues) (예: 무언가 잘못되었다는 직감(a gut feeling) 또는 무언가를 놓치고 있다는 우려)19-22는 임상의가 불확실성을 인식하는 데 도움이 될 수 있습니다.

 

가상의 사례(A hypothetical case)는 외래 진료실에 호흡 곤란(shortness of breath)으로 내원한 환자를 평가하는 동안 1년 차 레지던트가 가질 수 있는 다양한 불확실성을 보여줍니다 (인터랙티브 그래픽(interactive graphic) 참조).

  • 레지던트는 자신이 실제로 팽창된 목 정맥(distended neck veins)을 감지했는지 또는 어떤 초기 치료법을 선택해야 할지 의문을 가질 수 있습니다.
  • 그는 환자의 임상 상태가 갑자기 악화될 경우 어떤 자원이 필요할지, 또는 어디서 도움을 찾을 수 있을지 불확실할 수 있습니다.
  • 이러한 가능성을 고려하면서, 레지던트는 자신의 불편함이 수련 과정에서 익숙하지 않은 문제를 마주하는 예상된 부분인지, 아니면 이러한 반응이 감독자(supervisor)도 공감할 우려를 나타내는 신호인지 궁금해할 수도 있습니다.23

의사들이 임상 문제를 어떻게 사고하는지에 대한 광범위한 문헌(extensive body of literature)이 있습니다.24-26 이러한 통찰력(insights)을 통해 교사들은

  • 지식 구조(knowledge structures) (예: 질병 스크립트(illness scripts) 및 진단 스키마(diagnostic schemas)),27
  • 사고 방식(modes of thinking) (예: 직관적(intuitive) 또는 분석적 추론(analytical reasoning)),24
  • 인지적 경향(cognitive tendencies) (예: 휴리스틱(heuristics) 및 편향(biases)),28,29 그리고
  • 검사 및 치료의 통계적 특성화(statistical characterizations) (예: 근거 기반 의학(evidence-based medicine))30에 대한 아이디어를 활용할 수 있습니다.

이러한 개념들은 수련생과 그들의 교사들이 증상 발현(presentation)부터 진단 및 치료에 이르는 인지적 경로(cognitive path)를 그리는 데 도움을 줍니다.

 

그러나 인터랙티브 그래픽의 사례에서 보듯이, 이 경로를 따라 불확실성이 나타나는(manifested) 순간들을 수련생이 관리하도록 돕기 위해서는 다른 종류의 기술(a different set of skills)이 필요합니다.

  • 불확실성을 헤쳐 나가기(To move through uncertainty) 위해, 임상의는 자신, 환자, 그리고 환경으로부터의 신호(cues)를 사용하여 진행 상황을 모니터링(monitor)하고 실시간으로 접근 방식을 바꿉니다(shift their approaches).11
  • 효과적인 교수는(Effective teaching) 불확실성은 피해야 할 대상이 아니라, 오히려 식별하고 관리할 수 있는(identified and managed) 진료의 현실(reality of practice)임을 전달합니다.
  • 이러한 상황을 통해 수련생을 지도할 때, 교사는 임상적 불확실성의 경험이 어떻게 학습 기회(opportunities for learning)를 신호하는지(signal) 강조할 수 있습니다.31

임상 교사(Clinical teachers)는 동일한 환자를 돌볼 때조차도, 임상적 불확실성에 대한 수련생의 관점(trainees’ perspectives)이 자신들의 관점과 다르다는 것을 주목하는 것이 중요합니다.

  • 이러한 차이는 수련생의 발전 중인 지식이나 기술, 주변의 장비나 전문직 간 팀 구조(interprofessional team structures)에 대한 익숙함의 부족, 또는 실무에서 유사한 상황에 대한 제한된 경험에서 비롯됩니다.8
  • 수련생들은 자신들의 접근 방식이 감독자(supervisor)의 방식과 일치할(align with) 때조차도, 신체검사(physical examination)를 통해 데이터를 수집하거나 불명확한 상황(ill-defined situations)에 대해 판단을 내리는 자신의 능력에 대한 자신감이 부족할 수 있습니다.23
  • 임상 교사는 수련생의 불확실성을 지적하고 명명하며(pointing out and naming), 임상 상황에 대한 이해가 불완전할(incomplete) 때에도 안전하게 진행하는 방법(how to proceed safely)을 보여주는 데 중요한 역할(critical role)을 합니다.

 

특성(Trait) 또는 상태(State)로서의 불확실성

 

사례 발표(Case presentations)는 종종 교사들이 임상 문제에 대한 수련생의 이해도와 불확실성 관리 능력을 탐색(probe)할 수 있는 첫 번째 기회입니다. 예시의 레지던트가 호흡 곤란 환자를 발표할 때, 교사는 레지던트가 제안한 진단에 대해 유보적인 태도(reservations)를 보이거나 계획을 논의할 때 우려(concern) (예: "걱정된다(worried)"라는 단어 사용)를 표명하는 것을 인지할(note) 수 있습니다. 교사는 이 수련생이 임상 실습의 불확실성을 관리하는 데 부적합한(ill-suited) 것인지, 아니면 단순히 익숙하지 않은 상황에 대해 발달 단계에 적절한 반응(developmentally appropriate reaction)을 보이는 것인지 궁금해할 수 있습니다.

 

문헌은 임상의가 불확실성을 마주하고 관리하는 방식에 대해 두 가지 일반적인 관점(two general vantage points)을 제공합니다.

  • 첫 번째 관점은 불확실성을 다루는 의사의 능력을 다양한 경험에 걸쳐 나타나는 안정적인 성격 특성(stable personality trait)으로 취급합니다.
    • 여러 척도(Several scales)가 불확실성의 가상 경험에 대한 의사의 반응을 측정하는 데 사용되어 왔으며,20,32 "환자 치료의 불확실성은 나를 불안하게 만든다" 또는 "나는 환자 치료의 불확실성에 대해 꽤 편안하다"와 같은 진술을 기반으로 "불확실성 인내력(uncertainty tolerance)"의 프로필을 생성합니다.33
    • 이러한 척도에서 낮은 불확실성 인내력은 더 높은 번아웃(burnout) 비율, 더 낮은 직업 만족도, 그리고 특정 전공 선택(specialty choice)과 관련이 있는 것으로 나타났습니다.34-36
  • 불확실성에 대한 두 번째 관점은 그것이 순간적으로(in the moment) (상태(state)로서) 발생한다는 것이며, 이는 지식과 기술이 맥락 속에서(in context) 임상 문제와 교차하는(intersect) 개별적인 방식(idiosyncratic ways)을 반영합니다.11
    • 이 아이디어는 자기 조절(self-regulation) 문헌에서 비롯되었으며, 이는 사람들이 자신과 세상으로부터의 신호(cues)를 사용하여 불확실성을 인식하고 이러한 상황을 처리할 자신의 능력에 대해 판단하는(make judgments) 방법을 설명합니다 (그림 1).37
      • 외과 의사들은 수술 중 불확실성(operative uncertainty) (예: 유착된 종양(adherent tumor)을 마주쳤을 때)에 대한 잠재의식적 반응으로 속도를 늦추는(slow down) 순간을 인식할 수 있으며, 종종 자신의 구체적인 우려를 분명히 말하기(articulate) 전에도 이러한 행동을 알아차립니다.22
    • 이러한 불확실성의 순간을 인식할 때, 전문가는(experts) 환자 안전을 극대화하기 위해 상황에 더 많은 정신적 노력을 기울이고(devote more mental effort), 방해 요소를 최소화하며(minimize distractions), 고조된 경계심(heightened vigilance)으로 과제에 접근합니다.21

 

그림 1 임상의가 임상 불확실성을 관리하는 방법에 대한 개념적 모델(A Conceptual Model of How Clinicians Manage Clinical Uncertainty).

 

불확실성에 대한 수련생의 반응은 특성(trait)과 상태(state) 둘 다로 특징지어질 수 있으며, 교사는 이 두 차원 모두에 영향을 미칠 수 있는 위치에 있습니다. 인터랙티브 그래픽에서 보듯이, 교사는 수련생의 말("‘걱정된다’고 말하는 것을 들었습니다")에 주목(call attention)을 유도하고, 어떻게 감정적 반응(emotional reactions)이 그 상황에 특정한(specific to the situation) 불확실감을 신호할(signal) 수 있는지 강조할 수 있습니다. 관리 전략(management strategies)과 결합된 불확실성에 대한 반복적인 논의는 수련생이 광범위한 문제와 상황에 걸쳐 불확실성을 다룰 수 있는 자신감을 구축하는(build confidence) 데 도움이 될 것입니다.

 

사례 예시에서, 불확실성을 관리하는 수련생의 일반적인 능력(특성(trait))에 대한 교사의 초기 우려는 성급했을(premature) 수 있습니다. 대신, 교사는 수련생의 능력과 상황의 요구(demands of the situation) (상태(state)) 사이에 불일치(misalignment)가 있었음을 인식할 수 있었을 것입니다. 수련생이 불확실성에 기대고(lean into) 그로부터 배우도록(learn from) 장려하는 교사의 능력은 그 순간에 그것을 관리하는 수련생의 능력을 향상시킬 뿐만 아니라, 미래의 임상 불확실성 경험을 위한 일반화 가능한 교훈(generalizable lessons)을 심어줄(instill) 것입니다.

 

숙련된 임상의가 불확실성을 관리하는 방법(How Experienced Clinicians Manage Uncertainty)

 

교사는 자신이 불확실성을 어떻게 관리하는지 시범을 보일(model) 수 있습니다.

  • 호흡 곤란 환자를 평가한 후, 교사는 자신이 생각하고 있는 다양한 가능성(range of possibilities)에 관한 우려를 제기할 수 있습니다. 예를 들어, 폐색전증(pulmonary embolism)을 배제하기(rule out) 위해 신속한 영상 검사(expedited imaging)가 필요한지, 또는 환자가 기관지 확장제 치료(bronchodilator treatments)를 위해 응급실로 가야 하는지 등입니다.
  • 대안으로, 교사는 비록 앞으로 일어날 일에 대해 불확실하더라도, 상황의 특정 측면(specific aspects)이 어떻게 환자의 문제를 외래(outpatient basis)에서 관리할 수 있다는 확신을 주는지 명확히 설명할(articulate) 수 있습니다.

실제 임상의 연구(studies of practicing clinicians)에서 설명된 두 가지 개념(Two concepts)은 교사가 수련생에게 불확실성에 대한 자신의 접근 방식을 설명하는 방법의 예시가 될 수 있습니다.

  • 첫째, 숙련된 임상의는 선제적 계획(forward planning)을 사용하여 문제가 어떻게 전개될지 시뮬레이션(simulate)하고, 자신의 지식과 과거 경험을 활용하여(drawing on) 어떤 일이 일어날지 예측하고(forecast), 만일의 사태(contingencies)를 철저히 생각하며, 안전 계획(safety plans)을 수립합니다.11,22,38
    • 예를 들어, 환자의 호흡 곤란을 관리하기 위한 외래 환자 계획을 수립할 때, 교사는 환자의 사회적 맥락(social context)에서 진단 검사가 실현 가능한지, 환자와 가족에게 교육할 수 있는 경고 징후(warning signs)는 무엇인지, 그리고 다음 날 전화 통화와 같은 추적 관찰 계획(follow-up plans)을 통해 관리 접근법이 제대로 진행되고 있는지(remain on track) 확인하는 방법까지 어떻게 생각하는지 설명할 수 있습니다.
  • 숙련된 임상의는 또한 모니터링(monitoring)을 통해 불확실성을 관리합니다. 이 용어는 일반적으로 임상의가 전개되는 임상 양상(evolving clinical picture)과 치료에 대한 환자의 반응을 지켜보는(watch) 방식을 의미하지만, 더 확장된 모니터링의 정의숙련된 임상의가 환자로부터, 자신의 반응으로부터, 그리고 환경으로부터 오는 더 넓은 범위의 신호(a broader range of cues)에 어떻게 주의를 기울이는지를 포함합니다.
    • 이는 현재 상황(what is going on)상황을 어떻게 처리할지에 대한 자신의 생각을 지속적으로 재검토하기(continually revisit) 위함입니다.11,21,39
    • 예를 들어, 급성기 치료 환경(acute care setting)에서 교사는 자신이 스스로 알아차리고 있는 것(내면의 평온함 또는 걱정 상태(an internal state of calm or worry)) 또는 다른 사람들에게서 알아차리고 있는 것(출입구에서 서성이는(hovering) 호흡기 치료사)을 공유하고, 이러한 신호들(signals)을 상황에 대한 자신의 전반적인 편안함 수준(overall level of comfort)에 어떻게 통합하고(integrating) 있는지 공유할 수 있습니다.11,21,40
    • 교사는 간호사의 확신(reassurance), 진료 중 산소 포화도(oxygen saturation)의 안정성, 그리고 다음 날 원격 의료 서비스(telehealth services)를 통해 환자의 배우자가 상태를 확인할(check in) 수 있다는 사실 등이, 단기 예후(short-term prognosis)가 장기 진단(long-term diagnosis)보다 더 명확한 불확실한 상황을 어떻게 그들이 편안하게 관리할 수 있게 하는지 수련생과 공유할 수 있습니다.

선제적 계획(forward planning)과 모니터링(monitoring)의 순환 과정(cyclical processes) (그림 1)을 시범 보임으로써, 교사는 시간 경과에 따라 진단 및 관리 과정이 전개될(unfold) 때 자신이 어떻게 전개되는 임상 문제에 주의를 기울이고(pay attention) 잠재적 위험(potential risks)에 대비하는지 상세히 설명할(elaborate) 수 있습니다.

  • 인터랙티브 그래픽에서, 교사는 호흡 곤란 환자에 대한 자신의 선제적 계획(forward planning)을 상세히 설명하며, 미래에 상황이 어떻게 잘못될 수 있는지 상상하고(imagining) 그러한 가능성을 줄이거나 대비하기 위해 지금 무엇을 할 수 있는지(what can be done now) 질문할 수 있습니다.41,42
  • 그녀는 환자가 새로 처방된 흡입기(inhalers) 사용법을 이해하지 못해 응급실에 가야 하는 시나리오를 상상(envision)할 수 있습니다. 이 시나리오를 피하기 위해, 교사는 레지던트에게 환자에게 올바른 흡입기 사용 기술(proper technique)을 교육하는 데 추가적인 노력을 기울이도록 독려하고, 환자의 이해 수준을 측정하기(gauge) 위해 티치백 커뮤니케이션(teach-back communication)43을 강조하며, 다음 날 환자와의 화상 통화(check-in video call)를 예약하여 환자의 호흡 곤란(dyspnea)과 흡입기 기술을 평가하도록(assess) 할 수 있습니다.

교사를 위한 제언(Recommendations for Teachers)

 

교사들은 불확실성을 의료 행위의 고유한 상태(inherent state)이자 임상 추론의 핵심적인 측면(core aspect)으로 정상화하기(normalize) 위해 다양한 전략을 사용할 수 있습니다.44 이러한 전략 중 일부는 임상 현장(clinical settings)에 통합될 수 있으며(표 2), 다른 것들은 교실 기반 또는 시뮬레이션 기반 교육에서 사용될 수 있습니다. 이러한 권장 사항 중 다수는 심리학 및 교육학 문헌에 근거하고(grounded in) 있지만, 경험적 검증(empirical validation)이 필요합니다. 불확실성에 대해 가르치는 데 정해진 처방적 경로(prescriptive arc)는 없지만, 이는 종종 인식(recognition), 평가(appraisal), 관리(management), 그리고 성찰(reflection)을 포함합니다.45

 

표 2 수련생이 순간의 임상 불확실성을 관리하도록 돕는 지도 전략(Precepting Strategies to Help Trainees Manage Clinical Uncertainty in the Moment).

 

불확실성 설명하기(Narrating Uncertainty)

 

임상 문제에 대해 소리 내어 생각하는 것(Thinking out loud)은 교사들이 불확실성이 도전적인(challenging) 방식들을 설명(narrate)할 수 있게 합니다. 그들은 "진단이 확실하지 않네요" 또는 "여기서 뭔가 잘못된 것 같습니다"46,47와 같은 감정(sentiments)을 공유하고, 이러한 반응을 계획(planning)과 모니터링(monitoring)에 어떻게 사용하는지 설명할 수 있습니다. 이러한 일상적인 공개(routine disclosures)는 불확실성을 정상화하고 임상 학습 환경(clinical learning environment)의 문화를 향상시켜, 수련생들이 "모르겠습니다"라고 말하고 자신들의 우려를 자유롭게 공유하며, 그들의 교사들도 똑같이 할 것이라는 기대를 갖게 할 수 있습니다.48 교사가 수련생에게 진단이나 계획에 대해 얼마나 확신하는지 확인하는 "불확실성 점검(uncertainty check)"은 임상적 불확실성을 드러내고(revealing) 토론을 촉발하는(prompting) 쉬운 방법입니다.

 

"만약...그렇다면(if…then)" 계획을 명확히 말하는 것(Articulation)은 수련생이 사례에서 가장 주의를 기울여야 할 측면과 도움을 구해야 할(seek assistance) 중단 시점(stopping points)을 강조하는 효과적인 방법입니다.19

  • 예를 들어, 입원전담의(hospitalist)는 "신우신염(pyelonephritis)에 대한 정맥 항생제 치료 첫 1~2일 동안의 발열은 일반적이지만, 72시간 시점에서의 발열은 덜 편안하게 느껴집니다. 그때가 바로 신장결석(nephrolithiasis)이나 신장 농양(renal abscess)을 배제하기(rule out) 위해 CT 스캔을 주문할 때입니다."라고 지적할 수 있습니다.

불확실성 프레이밍하기(Framing Uncertainty)

 

불확실성은 치료의 연속선(continuum of care) 상의 모든 지점에서 발생하며 종종 "불안감(a sense of unease)"21,46으로 잠재의식적으로(subconsciously) 작용하기 때문에, 그 위치(location)와 원천(source)을 규정하는(frame) 것이 도움이 될 수 있습니다. 수련생이 불확실성을 분명히 표현하거나 교사가 수련생의 언어(language)나 행동(behavior)에서 이를 감지한 후, 교사는 수련생이 그 불확실성이 진단(diagnosis), 치료(treatment), 예후(prognosis), 또는 직장 내 역학(workplace dynamics)과 관련이 있는지 성찰하도록(reflect) 지도할 수 있습니다. 교사는 수련생에게

  • 그 문제가 해결될 수 있는(be addressed) 제한된 지식이나 정보(limited knowledge or information)의 문제인지(인식론적 불확실성(epistemic uncertainty)) 또는
  • 그 문제가 생의학 및 보건 시스템의 줄일 수 없는 무작위성(irreducible randomness)을 반영하는지(확률적 불확실성(aleatoric uncertainty))49 고려해 보도록 요청함으로써 불확실성의 기원(origins)을 더 깊이 탐색할(probe) 수 있습니다.

프레이밍(Framing)은 교사와 수련생 간의 대화에 구조를 제공할 수 있습니다. 교사가 임상적 불확실성을

  • 인식론적(epistemic) (예: "코카인 섭취 환자에게 베타 차단제(beta-blockers)의 안전성을 뒷받침하는 근거가 있는가?") 또는
  • 확률적(aleatoric) (예: "환자가 약물 이상 반응(adverse drug reaction)을 일으킬 수 있는가?")으로 분류하는(classify) 것이 유용할 수 있습니다.

복잡한 상황에서는 이러한 구분이 어려울 수 있지만, 다양한 불확실성을 범주화하려는(categorize) 노력은 수련생으로 하여금 다음 단계(next steps)를 계획하도록(map out) 촉발할 수 있으며, 이는 사건의 확률(probability)을 측정하거나(gauging) 예측이 덜 가능하거나(less predictable) 최악의 시나리오(worst-case scenarios)에 대한 만일의 사태(contingencies)를 생각하는 것을 포함할 수 있습니다.

이러한 프레이밍은

  • 교사가 수련생을 위해 불확실성을 직접 해결해 주어야 할지(정보를 전수하거나 과거 경험을 공유함으로써) 또는
  • 이 작업을 수련생이 스스로 탐색하고 알아내도록(figure out) 남겨두어야 할지(예: 온라인 자원을 사용하거나 다른 사람에게 의견을 물음으로써)48 결정하는 데 도움을 줄 수 있습니다.

연습을 통해, 수련생들은 (예: 확률적 불확실성을 탐색하기 위해 치료에 대한 환자의 반응을 모니터링하는 것과 같은) 다양한 전략의 레퍼토리(repertoire of strategies)를 개발하고, 학습의 자연스러운 결과인 불확실성과 임상 현장의 해결 불가능한 불확실성(unresolvable uncertainties)을 구분하는 데 자신감을 쌓을 것입니다.23

 

불확실성 시뮬레이션하기(Simulating Uncertainty)

 

수련생이 불확실성에 대비하도록 하는 한 가지 방법은 임상 환경 밖에서 우리가 실습을 시뮬레이션하는 방식을 재구상하는(reimagine) 것입니다. 사례 기반 컨퍼런스(Case-based conferences)와 시뮬레이션은 종종 진단과 관리의 기초 지식(foundational knowledge)을 전달하기 위해 선형적이고(linear), 논리적이며(logical), 해결 가능하도록(solvable) 구조화됩니다.50 더 높은 수련 단계(advanced training levels)에서, 교사는 사례 컨퍼런스를 다양한 합리적인 선택지(a range of reasonable options)와 여러 해결 불가능한 딜레마(multiple irresolvable dilemmas)가 있는 시나리오로 전환할 수 있습니다.51

  • 예를 들어, 결정성(crystalline) 관절염과 감염성(infectious) 관절염 모두와 호환되는(compatible with) 소견을 보이는 급성 단일 관절염(acute monoarthritis) 사례는 학습자들이 확정적 진단(definitive diagnosis)의 이점 없이 관리의 여러 측면을 탐색하도록(navigate) 유도할 것입니다.
  • 불확실성을 포함하는(involve uncertainty) 사례 형식에서,52 토론은 수련생들이 이러한 딜레마를 실시간으로 어떻게 정의하고 탐색하는지,
    • 예를 들어 활액(synovial fluid)의 세포 수치 임계값(cell-count thresholds)의 비결정적인 본질(nondefinitive nature),
    • 야간에 컨설턴트(consultant)를 참여시키는 것과 관련된 불편함(unease), 또는
    • 환자가 처방된 치료법을 감당할(afford) 수 있는지에 대한 우려(concern)와 같은 방향으로 진행될 것입니다.

임상 경험은 또한 임상의가 현장에서 고심하는(wrestle with) 종류의 불확실성을 재현하는 고충실도 마네킹(high-fidelity manikins)이나 대화형 온라인 사례(interactive online cases)를 사용하여 시뮬레이션될 수 있습니다. 광범위한 불확실성이 있는 시나리오를 통해 작업하면서,

  • 교사는 수련생에게 시간을 멈추고(freeze time) 자신과 타인에게서 감지하고 있는 신호(cues)에 대해 논의하고,
  • 상황에 대해 전개되고 있는 이해(evolving understanding)를 설명하며,
  • 다양한 관리 접근법에 대해 토론하도록 요청할 수 있습니다.53

진짜 경험을 시뮬레이션하는 것(Simulating authentic experiences)은 진단이나 관리의 어려움에 대한 해결책이 심지어 교사에게도 불명확하게(unclear) 남아 있는 사례를 의도적으로 선택(deliberately selecting)할 것을 요구합니다.

  • 그러한 사례 중 하나는 영상 촬영을 위해 평평하게 누울 수 없는(lie flat) 초조해하는 환자(agitated patient)에게 정맥 접근(intravenous access) 없이 경추 고정(cervical spine immobilization)을 어떻게 안전하게 관리할지 고려하도록 수련생에게 촉구할 수 있습니다.54

수련생이 이처럼 명확히 정의되지 않은 문제(ill-defined problems)와 씨름하는(grapple with) 각각의 상황에서, 교사의 역할(the role of the teacher)은 일반적인 사례 컨퍼런스나 시뮬레이션에서의 역할과 다릅니다.

  • 알려진 문제에 대한 답을 제공하는(providing answers) 대신
    • (예: "이 환자는 대동맥 박리(aortic dissection)가 있었고, 그 관리는...으로 구성됩니다"),
  • 교사는 자신의 접근 방식을 교수 도구(teaching tools)로 설명합니다
    • (예: "나도 이와 같이 힘든 사례들을 겪어봤는데, 이것들이 내가 상황을 파악하려(untangle) 애쓰는 동안 도움이 되었던 몇 가지 전략입니다").

수련생과 교사 간의 이러한 대화(dialogue)는

  • 불확실성에 대한 다양한 반응을 강조하고, 교사가 이러한 신호들을 선제적 계획(forward planning)과 모니터링(monitoring)에 어떻게 통합하는지 보여줄 수 있습니다
    • (예: "그의 산소 포화도가 떨어지는 것을 보고 긴장되었고(nervous), 삽관 장비(intubation equipment)를 어디서 찾아야 할지 생각하기 시작했습니다").
  • 교사는 또한 이전에 자신에게 효과가 있었던 것(what has worked for them previously)에 의해 잠정적으로(tentatively) 정보를 얻어(informed) 안전한 관리 단계를 수행하려 노력하는(enact) 모습을 보여주는 과거 경험의 이야기(stories of past experiences)를 공유할 수 있습니다
    • (예: "나는 보통 수액 일시 주입(fluid bolus)을 시도해 보지만, 여기서도 효과가 있을지 지켜볼 것입니다").

 

불확실성 소통하기(Communicating Uncertainty)

 

구조화된 의사소통 도구(Structured communication tools)는 수련생이 감독자, 동료, 환자에게 자신의 불확실성을 전달하는(communicate) 방식을 향상시킬 수 있습니다. 학생들이 질문할 수 있는 단계(예: "환자가 왜 여전히 기침을 하는지 궁금합니다")를 포함하는(embed) 사례 발표 모델(Case presentation models)은 그들에게 불확실한 지점(points of uncertainty)에 대해 감독자에게 질문할(query) 기회를 줍니다.55,56 진료 인수인계(transitions of care) 중 핸드오프 도구(handoff tools)의 사용은 임상의가 동료들과 자신의 진단적 불확실성의 정도(degree of diagnostic uncertainty) (약간의 불확실성, 현저한 불확실성, 또는 높은 정도의 불확실성)를 공유하도록 유도할 수 있습니다.57 수련생에게 환자에게 불확실성을 전달하는 방법을 가르치기 위한 여러 자원(Multiple resources)이 있으며,58,59 여기에는 그것을 설명하는 방법과 그러한 메시지에 대한 환자의 편안함(a patient’s comfort)을 평가하는 방법을 배우는 것이 포함됩니다.60,61 예를 들어, 한 비네트 연구(vignette study)는 가족들이 일반적인 불확실성 표현("무엇이 통증을 유발하는지 확실하지 않습니다")보다 감별 진단(differential diagnoses)을 포함한 진단적 불확실성 커뮤니케이션("통증은 발목 염좌(ankle sprain)일 가능성이 가장 높지만, 통풍(gout)일 가능성도 있습니다")을 선호한다는 것을 보여주었습니다.4

 

결론(Conclusions)

 

불확실성은 임상 실습에 만연하며(ubiquitous), 그것을 관리하는 방법을 배우는 것은 수련 중인 임상의에게 필수적입니다. 이 글에서 설명된 개념과 기법들은 교사들이 불확실성이 주목받고(spotlighted), 전략적으로 관리되며(managed strategically), 의료 행위의 고유하고 보람 있는(inherent and rewarding) 측면으로 받아들여지는(embraced) 교육 문화를 조성하는(foster) 데 도움을 주기 위한 것입니다.

 

 

표 1. 불확실성 및 관련 용어의 잠정적 정의 (Working Definitions of Uncertainty and Related Terms.)

  • 용어: 불확실성 (Uncertainty)
    • 정의: 확신이 없거나(unsure) 의심(doubt)을 갖는 감각; (종종 계산 불가능한) 위험(risk), 모호성(ambiguity), 복잡성(complexity)이 이러한 느낌에 기여합니다.
  • 용어: 임상적 불확실성 (Clinical uncertainty)
    • 정의: 임상 상황(clinical situation)에 대한 이해에 있어 불완전한 확신(Incomplete confidence). 종종 "무슨 일이 일어나고 있는 거지?" 또는 "내가 무엇을 해야 하지?"와 같은 생각이 동반됩니다.
  • 용어: 확률 (Probability)
    • 정의: 미래 사건의 가능성(likelihood).
  • 용어: 위험 (Risk)
    • 정의: 해(harm), 손실(loss) 또는 부정적인 결과(negative outcome)의 가능성(possibility) 또는 확률(probability).
  • 용어: 모호성 (Ambiguity)
    • 정의: 의사 결정(decision making)에 필요하지만 누락되었거나(missing), 부정확하거나(imprecise), 상충되는(conflicting) 정보. 또는 두 가지 이상의 다른 방식(distinct ways)으로 해석될 수 있는 정보 (예: 흉부 X-ray에서 폐침윤(infiltrate)이 존재하는지 여부).
  • 용어: 복잡성 (Complexity)
    • 정의: 예측 불가능한 결과(unpredictable outcomes)나 이해하기 어려운 패턴(patterns that are difficult to understand)으로 이어질 수 있는, 다양한 방식으로 상호작용(interact in diverse ways)하는 상황의 여러 구성 요소(Multiple components).

 

 

 

그림 1. 임상의가 임상적 불확실성을 관리하는 방법에 대한 개념적 모델

[그림 설명 요약] 임상의는 인지적(cognitive), 신체적(somatic), 감정적(emotional), 행동적(behavioral) 단서를 통해 불확실성을 인식하고, 사전 계획(forward planning)과 모니터링(monitoring)의 순환적 과정(cyclic processes)을 통해 시간에 따라 이러한 경험을 관리합니다. 이 과정은 다시 새로운 불확실성을 드러낼 수 있습니다. 이러한 과정들은 매우 역동적(highly dynamic)이며, 변화하는 임상 소견(clinical findings)과 맥락(contexts)에 의해 형성됩니다.


1. 임상적 불확실성 인식하기 (Recognizing Clinical Uncertainty)

임상의는 다음과 같은 네 가지 유형의 단서를 통해 불확실한 상태임을 인지합니다.

  • 인지적 단서 (Cognitive Cues)
    • "무슨 일인지, 무엇을 해야 할지 잘 모르겠다." (I am unsure what is going on or what to do.)
  • 신체적 단서 (Somatic Cues)
    • "속이 '철렁하는'(불편한) 느낌이 든다." (I have a “pit” in my stomach.)
  • 감정적 단서 (Emotional Cues)
    • "뭔가 잘못된 것 같다." (Something does not feel right here.)
  • 행동적 단서 (Behavioral Cues)
    • "내가 (일의 속도를) 늦추고 있음을 알아차린다." (I notice that I am slowing down.)

2. 사전 계획 (Forward Planning)

불확실성을 인지한 후, 임상의는 미래를 예측하며 다음과 같은 계획을 세웁니다.

  • "이 문제가 진행되면 무슨 일이 일어날 수 있을까?" (What might happen as this problem evolves?)
  • "잠재적인 위험은 무엇인가?" (What are the potential risks?)
  • "상황이 악화되면 누구에게 연락해야 하는가?" (Who should I call if things get worse?)

3. 모니터링 (Monitoring)

사전 계획과 동시에, 임상의는 자신, 환자, 그리고 전반적인 상황을 지속적으로 관찰하고 평가합니다.

  • 자신 (Self)
    • "나의 가설은 어떻게 변했는가?" (How have my hypotheses evolved?)
    • "나는 이 상황을 감당하는 데 편안함을 느끼는가?" (Am I comfortable managing this situation?)
  • 환자 (Patient)
    • "어떤 소견이 변했는가?" (What findings have changed?)
    • "환자가 치료 계획을 이해하고 있는가?" (Does the patient understand the treatment plan?)
  • 상황 (Situation)
    • "다른 사람들은 무엇을 걱정하는 것 같은가?" (What do others seem to be worried about?)
    • "나에게 적절한 자원(resources)이 있는가?" (Do I have the right resources?)

💡 모델에 대한 설명

이 개념적 모델은 임상의가 불확실성을 다루는 과정을 보여줍니다.

  1. 시작 (불확실성 인식): 먼저 임상의는 '뭔가 이상하다'는 생각(인지), 불편한 속(신체), '느낌이 안 좋다'(감정), 혹은 자신도 모르게 업무 속도가 느려지는(행동) 등의 단서를 통해 자신이 불확실한 상황에 처했음을 인지합니다.
  2. 순환 과정 (관리): 일단 불확실성을 인지하면, 뇌 그림에 표시된 것처럼 '사전 계획'과 '모니터링'이라는 두 가지 과정이 순환적으로(cyclic) 작동합니다.
    • 사전 계획은 '최악의 경우엔 어떡하지?', '누구에게 도움을 청해야 하나?'처럼 앞으로 일어날 일을 예측하고 대비하는 과정입니다.
    • 모니터링은 '내 가설이 맞나?', '환자 상태가 변했나?', '다른 동료는 어떻게 생각하지?'처럼 자신, 환자, 주변 상황을 계속 주시하며 평가하는 과정입니다.
  3. 결과 (새로운 불확실성): 이 두 과정은 서로 영향을 주며(원형 화살표), 모니터링을 통해 얻은 새로운 정보는 다시 '사전 계획'을 수정하게 만듭니다. 또한, 이 순환 과정 자체가 또 다른 불확실성을 드러내게 하여, 전체 과정이 역동적으로 반복됩니다.

 

 

표 2. 수련생이 순간의 임상적 불확실성을 관리하도록 지도하는 전략 (Precepting Strategies to Help Trainees Manage Clinical Uncertainty in the Moment.)


기술: 불확실성 설명하기 (Narrating uncertainty)

  • 상황 또는 단서: 수련생이 병력 청취 및 신체 검진에서 비롯된 불확실성을 언급하지 않고, 세련되고 명확한(polished and clear-cut) 평가를 제시합니다.
  • 교육적 진단: 수련생이 더 큰 확실성과 자신감을 보여주기 위해 과도하게 단순화(oversimplifying)하고 있을 수 있습니다.
  • 교육적 전략: 작동 가설(working hypotheses)에 대한 의문을 제기하기 위해, 일치하지 않는(discrepant) 병력이나 검진 소견을 다시 통합하도록 합니다.
  • 전략의 예시: "이 발진이 우리의 생각을 어떻게 바꿀 수 있을지 궁금하네요. 우리의 작동 진단과 잘 맞지 않는 것들이 있는 것은 정상입니다."

기술: 불확실성 프레이밍하기 (Framing uncertainty)

  • 상황 또는 단서: 수련생이 진단 및 관리에 대한 특정 질문에서부터 근거나 진료 변이(practice variation)에 대한 광범위한 질문에 이르기까지 광범위한 불확실성을 제시합니다.
  • 교육적 진단: 수련생이 이러한 불확실성을 조직화(organize)하는 전략으로부터 이익을 얻을 수 있습니다.
  • 교육적 전략: 수련생이 문제를 층화(stratify)하도록 돕습니다. 즉, 추가 정보가 불확실성을 재구성하거나 줄일 수 있는 인식론적(epistemic) 불확실성인지, 아니면 결과가 본질적으로 가변적인 우연적(aleatoric) 불확실성인지 구분하도록 돕습니다.
  • 전략의 예시: "이 사례에 대해 몇 가지 중요한 질문을 강조해 주었네요. 이 시점에서 불확실성을 줄이기 위해 우리는 어디에서 정보를 찾아야 할까요? 이 사례의 어떤 측면이 우리가 무엇을 하든 알 수 없거나(unknowable) 예측 불가능하게(unpredictable) 남아있을 것 같나요?"

기술: 사전 계획 (Forward planning)

  • 상황 또는 단서: 수련생이 불리한 결과(adverse outcomes)에 대한 비상 계획(contingencies)을 세우지 않고 환자에 대한 논의를 마무리합니다.
  • 교육적 진단: 수련생이 교수가 염두에 둔 것과 동일한 감별 진단을 생각하고 있지 않거나, 위험에 대한 동일한 우려를 공유하지 않을 수 있으며, 해당 문제에 대한 경험이 부족할 수도 있습니다.
  • 교육적 전략: 사례가 전개될(unfold) 수 있는 다양한 방식과 수련생이 어떻게 대응할지에 대해 생각해보도록 독려(Challenge)합니다.
  • 전략의 예시: "우리가 시행 중인 계획에 대해 잠재적으로 발생할 수 있는 세 가지 다른 결과는 무엇인가요? 그러한 가능성들에 대비하기 위해 지금 당장 무엇을 할 수 있을까요?"

기술: 환자 모니터링 (Patient monitoring)

  • 상황 또는 단서: 수련생이 환자의 경과(course)를 모니터링할 구체적인 계획 없이 환자에 대한 논의를 마무리합니다.
  • 교육적 진단: 수련생이 사례가 진행되거나 치료가 시작될 때 어떤 소견을 찾는 것이 중요한지 모를 수 있습니다.
  • 교육적 전략: 진단과 관리가 올바른 방향으로 가고 있는지(on track) 결정하기 위해 모니터링해야 할 핵심 소견(key findings)을 강조합니다.
  • 전략의 예시: "언제 이 환자를 다시 평가할 계획인가요? 어떤 종류의 신호(signals)를 찾고 있나요? 만약 발열(fever)이 발생한다면 당신의 생각이나 관리가 어떻게 바뀔 수 있을까요?"

기술: 자기-모니터링 (Self-monitoring)

  • 상황 또는 단서: 수련생이 사례 발표 중 걱정(worries)을 표현하거나, 교수가 수련생이 사례에 대해 걱정하거나 불안해(anxious)하고 있음을 시사하는 행동을 알아차립니다.
  • 교육적 진단: 수련생이 감정적(emotional) 또는 신체적(somatic) 단서를 불확실성의 유용한 신호로 인식하지 못할 수 있습니다.
  • 교육적 전략: 수련생의 반응을 탐색(Probe)하고, 그것이 불확실성을 관리하는 데 사용될 수 있는 가치 있는 신호(valuable signals)임을 인정(validate)해줍니다.
  • 전략의 예시: "사례 발표 중에 '걱정'된다고 말하는 것을 들었고, 저도 이 사례에 대해 같은 반응을 보이고 있습니다. 우리 각자를 불확실하게 만들고 우려를 자아내는 요소들이 무엇인지, 그리고 왜 그런지 비교해 봅시다."

기술: 타인-모니터링 (Monitoring others)

  • 상황 또는 단서: 수련생이 상황에 대해 다르게 생각하고 있음을 시사하는 다른 의료 전문가들의 행동이나 언어를 간과합니다(overlooks).
  • 교육적 진단: 수련생이 다른 구성원들이 자신의 우려를 알리려 할 때를 포함하여, 특정 의료팀이 어떻게 협력(works together)하는지 인지하지 못할 수 있습니다.
  • 교육적 전략: 다른 의료 전문가들이 사용하는 행동과 언어에 대한 당신의 해석을 공유합니다.
  • 전략의 예시: "간호사의 목소리 톤(tone of voice)과 잦은 업데이트는 이 환자에 대한 우려를 시사합니다. 간호사의 생각을 탐색하기 위해 어떤 전략을 사용할 수 있을까요?"

기술: 불확실성 소통하기 (Communicating uncertainty)

  • 상황 또는 단서: 교수가 수련생이 환자에게 불확실성을 공개(disclose)하지 않는 것을 알아차립니다.
  • 교육적 진단: 수련생이 불확실성을 드러내는 것이 수련생의 기술에 대한 환자의 신뢰(confidence)를 손상(undermine)시킬 수 있다고 우려할 수 있습니다.
  • 교육적 전략: 환자가 모니터링 계획을 안내하는 데 참여하도록 초대(inviting)하는 것을 포함하여, 당신이 어떻게 환자와 불확실성을 공유하는지 시범(Model)을 보입니다.
  • 전략의 예시: "제가 '진단을 통풍(gout)이라고 생각하지만 대안 진단으로 봉소염(cellulitis)도 계속 고려할 것입니다'라고 말하며 대화를 시작하는 방식에 주목해 보세요. 그런 다음 환자에게 자신의 이해와 우려 사항을 공유하도록 요청할 것입니다. 환자와 저는 우리가 모두 편안하게 느낄 수 있는 계획을 세우는 데 도움이 되도록 다양한 옵션을 논의할 것입니다."

N Engl J Med. 2025 Nov 12. doi: 10.1056/NEJMra2500226. Online ahead of print.

Strategies to Reinvigorate the Bedside Clinical Encounter

 

🩺 의사가 환자를 '직접' 만나는 시간이 고작 13%?

안녕하세요! 여러분, 혹시 의사가 환자와 직접 대면하며 진찰하는 시간이 전체 업무 시간의 13%밖에 되지 않는다는 사실, 알고 계셨나요? 최근 한 논문에 따르면, 안타깝게도 이것이 오늘날 의료 현장의 현실이라고 합니다.

의사들이 환자 곁에 머무는 시간이 줄어들면서, 환자의 말을 경청하고 직접 만져보며 진단하는 '병상 임상 술기(bedside clinical skills)'가 점점 약해지고 있습니다.

이게 그냥 "예전 같지 않네~" 하고 넘어갈 문제가 아닌 게, 이런 현상이 진단 오류(diagnostic error)를 높이고, 환자의 치료 결과를 나쁘게 만들며, 불필요한 검사로 인한 의료비 상승까지 초래한다고 해요. 😲 심지어 의사 본인의 공감 능력 저하나 번아웃(burnout)과도 연결된다고 하니, 정말 심각한 문제죠.

오늘은 이 문제를 정면으로 다룬 흥미로운 논문의 핵심 내용을 쉽고 편하게 공유해 드릴게요.


🕵️‍♀️ 도대체 왜 이렇게 됐을까요?

과거 윌리엄 오슬러와 같은 의학 거장들은 "환자는 우리의 교과서"라며 병상에서의 교육을 무엇보다 중요하게 여겼습니다.

하지만 시간이 흐르면서 상황이 많이 변했습니다.

  1. 기술 의존도 증가: CT, MRI 같은 첨단 영상 장비나 혈액 검사가 의사의 눈, 귀, 손보다 더 정확하고 신뢰할 수 있다는 인식이 생겼습니다.
  2. EHR의 등장: 전자건강기록(EHR, Electronic Health Record)이 도입되면서, 의사들은 실제 환자(patient)가 아닌 컴퓨터 속의 '디지털 환자(iPatient)'를 보는 데 더 많은 시간을 쓰게 되었습니다.
  3. 환경적 압박: 정해진 근무 시간, 병원의 수익 등 경제적 압박이 환자를 여유 있게 진찰하고 교육할 시간을 빼앗아갔습니다.

이런 요인들이 복합적으로 작용하면서, 의사들은 점점 환자 곁을 떠나게 되었고, 자연스럽게 병상에서 가르칠 수 있는 교수진조차 줄어드는 악순환이 시작된 것입니다.


💡 그래도 '병상'이 중요한 이유

연구진은 "그럼에도 불구하고 병상 진료는 여전히 강력하다"고 강조합니다.

  • 한 연구에서는 응급실을 통해 입원한 환자의 약 40%가 오직 병력 청취와 신체 검진만으로 진단이 가능했다고 해요.
  • 경험 많은 의사가 다음 날 아침 직접 환자를 진찰했을 때, 무려 26%의 사례에서 이전에 놓쳤던 결정적인 진단을 새로 발견했다고 합니다.
  • 무엇보다, 환자들 스스로가 의사가 자기 곁에서 회진할 때 더 존중받고, 더 큰 보살핌을 받는다고 느낀다는 점입니다. 💖

🚀 다시, 환자 곁으로! 6가지 전략

그렇다면 이 흐름을 되돌리기 위해 무엇을 해야 할까요? 연구진은 6가지 실용적인 전략을 제안합니다.

  1. 환자 곁으로 가고 '관찰'하기 일단 환자가 있는 '병상'으로 가야 합니다. 그리고 환자의 표정, 자세, 숨소리 등을 세심하게 '관찰'하는 것 자체가 중요한 진단 기술임을 강조합니다.
  2. '가설 기반' 신체 검진 머리부터 발끝까지 기계적으로 훑는 검진이 아니라, 환자의 이야기를 듣고 '가설 기반 신체 검진(hypothesis-driven physical examination)'을 하라고 조언합니다. '이 환자는 혹시 ~가 아닐까?'라는 가설을 세우고, 그것을 확인하기 위한 진찰을 하는 것이죠.
  3. '의도적인 연습' 기회 만들기 교수와 학생이 함께 환자를 보는 시간을 '의도적으로' 만들어야 합니다. 바쁜 회진 중이라도 "5분 모멘트(Five-Minute Moment)" 같은 짧은 교육 도구를 활용해 핵심적인 술기를 가르칠 수 있습니다.
  4. 기술을 '똑똑하게' 활용하기 기술을 무조건 배척하는 게 아닙니다. 오히려 현장 초음파(POCUS, Point-of-care ultrasonography)처럼 환자 곁에서 바로 사용하며 진단하는 기술은 의사를 다시 병상으로 불러옵니다. 인공지능(AI) 역시 서류 작업을 줄여줘서 환자에게 집중할 시간을 벌어줄 수 있죠.
  5. '직접 관찰'하고 피드백 주기 미국에서는 드물지만, 다른 많은 나라에서는 졸업할 때 실제 환자를 진찰하는 모습을 교수가 직접 관찰(direct observation)하고 평가합니다. 이 과정에서 "환자복 위로 청진하지 마세요" 같은 아주 구체적이고 실질적인 피드백이 오갈 수 있습니다.
  6. '진단' 그 이상의 힘을 인정하기 병상 진료는 단순히 병을 찾는 것 이상의 힘이 있습니다. 의사가 환자와 눈을 맞추고 손을 잡는 과정은 불확실성을 함께 헤쳐나가는 '신뢰 관계'를 형성합니다. 이는 의사의 번아웃을 막고, 특히 소외된 환자들의 의료 불평등(health care disparities)을 해소하는 데도 기여합니다.

🗣️ 연구진의 핵심 메시지

이 논문에서 연구진이 특별히 강조하는 두 가지 핵심 의견을 원문과 함께 소개해 드립니다.

"병상에서 AI의 역할이 어떻게 형성되든, AI 상호작용의 결과는 항상 병상에서의 인간의 관찰, 인간의 임상적 의사 결정, 그리고 인간의 소통을 대체하는 것이 아니라 정보를 제공해야 합니다."

"No matter how the role of AI at the bedside takes shape, the results from AI interactions should always inform rather than replace human observation, human clinical decision making, and human communication at the bedside."

"의학은 교실이 아니라 병상에서 배운다. 질병의 징후에 대한 개념을 강의실에서 듣거나 책에서 읽은 단어로부터 얻지 마라. 먼저 보고, 그런 다음 추론하고, 비교하고, 통제하라. 하지만 '먼저 보아라'." (윌리엄 오슬러 경의 말을 인용)

“Medicine is learned by the bedside and not in the classroom. Let not your conceptions of the manifestations of disease come from words heard in the lecture room or read from the book. See, and then reason and compare and control. But see first.”

 

결국 기술이 아무리 발전해도, 의학의 본질은 '사람'에게 있다는 것을 다시 한번 일깨워주는 논문인 것 같습니다. 의사가 환자의 곁을 지킬 때, 비로소 가장 정확한 진단과 따뜻한 치유가 시작되는 것이 아닐까요?


📌 주요 용어 정리

  • 병상 임상 술기 (Bedside clinical skills): 환자 곁에서 직접 보고, 듣고, 만지며 진단하는 임상 기술
  • 진단 오류 (Diagnostic error): 부정확하거나 지연된 진단
  • 전자건강기록 (EHR, Electronic Health Record): 병원 시스템에 기록되는 디지털 환자 정보
  • 디지털 환자 (iPatient): EHR 속 데이터로 존재하는 환자
  • 가설 기반 신체 검진 (Hypothesis-driven physical examination): 특정 진단을 염두에 두고 가설을 검증하기 위해 시행하는 신체 검진
  • 현장 초음파 (POCUS, Point-of-care ultrasonography): 환자가 있는 곳(병상, 진료실 등)에서 바로 시행하는 초음파
  • 직접 관찰 (Direct observation): 교수가 학생의 진료 수행 과정을 실시간으로 지켜보며 평가하는 방식
  • 의료 불평등 (Health care disparities): 사회/경제적 요인으로 인해 발생하는 건강 및 의료 서비스의 격차

 


 

 

오늘날 의료 수련생(medical trainees)은 전체 시간의 13%에 불과한 시간을 환자와의 직접적인 접촉(direct contact with patients)에 사용합니다.1

  • 의사가 환자와 보내는 시간이 줄어들면서, 기초적인 병상 술기(fundamental bedside skills)가 저하됩니다.2
  • 이러한 저하는 진단 오류(diagnostic error), 좋지 않은 임상 결과(poor clinical outcomes), 그리고 의료 비용 증가(increased health care costs)에 기여합니다.3
  • 외래 환자 진단 오류의 절반 이상이 부실한 병력 청취(poor history taking)와 신체 검진(physical examination)의 실수에서 비롯된 것으로 여겨집니다.4
  • 부분적으로는 임상 술기 저하에 기인한 기술에 대한 과도한 의존(overreliance on technology)과잉 검사(overinvestigation)와 비용 상승을 초래합니다.5
  • 환자와의 직접적인 접촉으로부터 멀어지는 현상(drift away from direct contact)은 의대생과 전공의의 공감(empathy) 감소에 기여하며, 현직 의사들의 스트레스와 소진(burnout)을 증가시킵니다.
  • 이는 또한 의사-환자 관계(doctor–patient relationship)를 약화시킵니다.6,7 병상(bedside)에서의 시간 부족은 소외 계층(marginalized groups)에 불균형적으로 영향을 미치며 의료 불평등(health care disparities)을 심화시킵니다.8
  • 병상 술기가 감소함에 따라, 이러한 술기를 편안하게 가르칠 수 있는 교수진(faculty members)의 수도 줄어들었으며, 이는 술기의 쇠퇴(decay)를 더욱 부채질합니다.9

이러한 경향을 뒤집는 데 도움을 주기 위해, 우리는 임상 교육자(clinical educators)들이 현대 의료 환경에서 병상 임상 술기의 교육과 실제(teaching and practice of bedside clinical skills)를 재활성화(reinvigorate)하기 위한 실질적인 제안들을 제공합니다.

 

우리는 어떻게 이 상황에 이르게 되었는가? (How Did We Get Here?)

 

초기 미국 의학 교육은 계층화된 시스템(tiered system)에 의존했는데, 19세기 초의 개별 도제 교육(individual preceptorships)에서 세기 중반의 학위 수여 중심의 강의식 의과대학(didactic, degree-granting medical schools)으로 이어졌습니다. 유럽에서 제공되는 교육을 감당할 수 있는 의사는 거의 없었습니다. 유럽에서는 수련생들이 임상 대가(clinical masters)와 함께 병상에서 배우고, 살아있는 환자에게서 관찰된 임상 징후와 증상(clinical signs and symptoms)을 부검(autopsies) 및 병리학적 검사(pathological examinations) 결과와 연관지었습니다. 이러한 상황은 20세기 초 무렵 변화하기 시작했습니다. 존스 홉킨스 병원(The Johns Hopkins Hospital)의 윌리엄 오슬러 경(Sir William Osler)과 같은 대가적인 임상 교육자(master clinical educators)들이 세운 모범을 따르는 미국 의과대학이 늘어났기 때문입니다. 그의 학생들은 "환자를 진찰하고, 진단을 내리고, 병든 폐의 수포음(crepitant rales)을 듣고, 종양의 이질적이고 비인간적인 대리석 질감(alien and inhuman marble texture)을 촉진했습니다."10

 

주요 사항 (Key Points) 병상 임상 만남을 재활성화하기 위한 전략 (Strategies to Reinvigorate the Bedside Clinical Encounter)

  • 21세기 의료 학습자들은 20세기 학습자들보다 수련 중 환자와 보내는 시간이 더 적으며, 이는 병상 임상 술기에 대한 지식과 실습을 감소시킵니다.
  • 병상 임상 술기의 감소는 진단 오류, 좋지 않은 임상 결과, 의료 비용 증가, 의사 소진으로 이어집니다.
  • 학습자들을 병상으로 데려가는 것은 임상 관찰 기술(clinical observation skills)을 촉진하고, 술기를 연습할 기회를 만들며, 검진 술기에 대한 근거 기반 시연(evidence-based demonstrations)을 가능하게 합니다.
  • 임상 만남에서 현장 진료 기술(point-of-care technology)과 인공지능(artificial intelligence)의 통합은 인간의 관찰, 인간의 임상적 의사 결정(human clinical decision making), 그리고 인간의 소통(human communication)을 보완합니다.
  • 맥락 특이적인 방식(context-specific way)으로 임상 술기에 대한 피드백을 제공할 기회를 찾는 것은 병상에서의 기술(technique)뿐만 아니라, 만남에서 얻은 정보의 해석(interpretation) 능력을 향상시킵니다.
  • 병상 임상 만남에서 얻어지는 진단적 데이터 외에도, 신체 검진은 학습자들이 임상적 불확실성(clinical uncertainty)을 헤쳐나가는 데 도움을 주고, 교사들이 환자와의 상호작용을 모델링(model interactions)하도록 도우며, 의사-환자 소통을 개선하고, 전문직으로서의 성취감(professional fulfillment)을 높이며, 의료 불평등을 해결하는 데 도움을 줍니다.

병상 관찰(bedside observation)과 병리학적 연구(pathological study)를 결합하는 이러한 과학 기반 방법은 의사들이 병상에서 가르치고 배울 수 있도록 준비시키려는 노력을 반영했습니다. 그러나 그러한 열망(aspirations)은 현대 학습자들에게 이어지지 못했습니다.

  • 기술 기반 검사(Technology-based tests)는 진단 과정을 실험실(laboratory)과 영상의학과(radiology suite)로 이동시켰고, 의사가 보고, 느끼고, 듣고, 냄새 맡는 것이 더 이상 정확하거나 신뢰할 수 없다는 잘못된 인상(false impression)을 심어주었습니다.11
  • 전자의무기록(EHR)은 의사들이 실제 사람보다 환자의 디지털 재현(digital representation), 즉 "iPatient"와 더 많은 시간을 보내도록 강요하는 업무 흐름(workflows)을 만듭니다.12
  • 근무 시간(duty hours)의 변화와 경제적 압박(economic pressures)으로 인해, 병상에서의 평가(bedside evaluation) 및 교육보다 처리량(throughput)이 우선시됩니다.13 의사들이 환자와 실제로 보내는 제한된 시간은 점점 더 단편화(fragmented)되고 있습니다.14

일부 의사와 수련생들은 병상에 가는 것이 비효율적(inefficient)이라고 잘못 믿고 있습니다.15

  • 어떤 이들은 환자가 있는 곳에서 진료의 복잡성(complexities of care)을 논의하는 것이 환자에게 불편함이나 혼란(discomfort or confusion)을 야기할 수 있다고 걱정합니다.16
  • 병상에 갈 때 동반되는 불확실성(uncertainty)은 교육자와 학습자 모두에게 위협적(intimidating)일 수 있습니다.17
  • 개인 보호 장비(personal protective equipment, PPE)는 의사와 환자를 감염병 확산으로부터 보호하지만(청진기 발명가인 르네 라에네크(René Laënnec)는 결핵으로 사망했습니다18), 이러한 물리적 장벽(physical barriers)은 회진을 지연시키고, 의사소통, 촉진(palpation), 청진(auscultation)과 같은 활동의 정확성을 감소시키며, 환자와 접촉하는 총 시간을 제한할 수 있습니다.17

이러한 장벽의 결과로, 전통적으로 병상 교육의 보루(bastion of bedside teaching)였던 아침 회진(morning rounds)은 복도(hallway)로 이동했으며, 회진 시간의 20% 미만만이 실제 환자들과 함께 보내집니다.1 이는 병상 임상 술기가 저평가되고(undervalued), 덜 가르쳐지며(undertaught), 덜 사용되는(underused) 악순환을 만들며, 이는 현직 의사와 수련생들 사이에서 술기의 침식(erosion)을 더욱 가중시킵니다.

 

최근 데이터는 병상 만남의 지속적인 가치(enduring value of the bedside encounter)를 뒷받침합니다.

  • 병원 입원으로 이어진 응급실 방문 연구에서, 병력 청취와 신체 검진이 사례의 거의 40%에서 진단으로 이어졌으며, 여기에 간단한 검사(simple investigations)를 추가하여 33%의 진단이 더 이루어졌습니다.19
  • 적절한 신체 검진은 추가적인 진단 검사의 필요성을 배제(obviate)할 수 있지만, 신체 검진과 관련하여 가장 흔하게 보고되는 오류는 단순히 그것을 수행하지 않는 것(simply not performing it)입니다.20
  • 한 연구에 따르면, 밤새 입원한 환자들 중 26%의 사례에서 다음 날 아침 담당 의사(attending physician)가 신체 검진을 수행한 후 결정적인 진단(pivotal diagnosis)을 발견했습니다.21
  • 진료 인계(handoff of care) 후 팀이 병상에 갈 때, 감별 진단(differential diagnosis)이 20%의 경우에서 상당히 변경됩니다.22
  • 병상 회진의 진단적 중요성 외에도, 환자들은 종종 병상 회진을 선호하며(patients often prefer them), 회진이 병상에서 이루어질 때 의료팀이 자신들을 한 개인으로서 더 아낀다고 느낍니다.15,23,24

 

병상 의학 문화를 재활성화하는 방법 (How to Reinvigorate a Culture of Bedside Medicine)

 

대화형 그래픽(interactive graphic)은 임상 교육자들이 흔히 마주치는 시나리오를 묘사합니다. 이 시나리오를 출발점으로 삼아, 우리는 병상 의학의 문화를 재활성화(reinvigorate a culture of bedside medicine)하고 환자, 의사, 학습자의 요구에 부응하는 데 도움이 되는 여섯 가지 전략을 제안합니다 (표 1).

 

표 1 병상 만남을 재활성화하기 위한 전략 (Strategies to Reinvigorate the Bedside Encounter.) 병상으로 가서 관찰하라 (Go to the Bedside and Observe)

 

악명 높은 범죄자 윌리 서튼(Willie Sutton)은 "나는 돈이 있는 곳이기 때문에 은행을 턴다"고 말했다고 합니다.25 의학에 적용된 서튼의 법칙(Sutton’s law)은 전통적으로 "진단을 제공할 가능성이 가장 높은 진단 검사로 즉시 진행하는 것"을 의미했습니다.26 수정된 서튼의 법칙은 병상 임상 술기를 향상시키기 위해서는 환자가 있는 곳, 즉 병상(bedside)으로 가야 한다고 말할 수 있습니다.27 현대의 "병상"은 병실이나 외래 진료실뿐만 아니라 원격 의료(telemedicine encounter) 또는 가정 건강 방문(home health visit)도 포함합니다.

 

어디에서 만남이 이루어지든, 관찰(observation)은 진단을 확립하고 임상 교육을 돕는 가장 중요하면서도 충분히 활용되지 못하는(underused) 임상 술기 중 하나입니다.

  • 제임스 파킨슨(James Parkinson)이 "떨림 마비(shaking palsy)"(역주: 파킨슨병)를 기술한 것은 거의 전적으로 환자에 대한 직접적인 관찰(direct observation)에 의존했습니다.28
  • 침대 발치, 혹은 심지어 복도에서 환자를 관찰하는 것은 진단, 예후, 그리고 환자의 개인적 상황을 이해하는 데 결정적인 단서들을 드러냅니다.29
  • 의도적인 연습(Intentional practice)관찰 기술을 향상시킬 수 있습니다. 본과 전 과정(preclinical years)에서 비의료적 맥락(예: 미술 작품 보기)에서 관찰을 연습하면 임상 영역에서의 관찰력이 향상됩니다.30
  • 학습자들이 임상 만남에 참여하는 것을 관찰하는 것은 그들의 임상 술기를 평가(assessment)하고 피드백(feedback)을 제공할 풍부한 기회를 제공합니다. 임상 술기를 직접 관찰(directly observing clinical skills)하는 교수진의 역량(competence)과 자신감(confidence)은 연습을 통해 향상될 수 있습니다.31

 

신체 검진에 대한 근거 기반 접근법을 실천하고 가르쳐라 (Practice and Teach an Evidence-Based Approach to the Physical Examination)

 

의과대학에서 신체 검진은 종종 임상적 의사 결정에 대한 역치 기반 접근법(threshold-based approach to clinical decision making)의 일부로서가 아니라 머리부터 발끝까지(head-to-toe) 방식으로 가르쳐집니다.32 이러한 전략은 일부 의사들이 신체 검진보다 기술 기반 검사를 우선시하도록 만들 수 있습니다. 이러한 경향을 극복하는 한 가지 방법은 가설 중심 신체 검진(hypothesis-driven physical examination)을 가르치고 실천하는 것입니다.33 이 접근법에서는 다른 진단 검사들과 동일한 방식으로 신체 검진 술기(maneuver)를 고려합니다.

 

이 접근법의 첫 번째 단계는 환자의 병력에서 얻은 단서와 특정 맥락에서의 질병 유병률(prevalence of disease) 지식을 사용하여 진단 가설의 검사 전 확률(pretest probability of diagnostic hypotheses)을 추정하는 것입니다. 때로는 병력만으로 진단이 명확하지만, 추가적인 데이터 수집이 필요하다면 임상의는 의심되는 진단을 겨냥한 적절한 신체 검진 술기를 선택할 수 있습니다. 일부 신체 검진 소견은 해당 질병에 대해 특이적(pathognomonic)입니다 (예: 대상포진의 발진 또는 봉소염(cellulitis)의 외양과 온기). 그러나 많은 경우, 신체 검진 소견의 정확성(accuracy)과 신뢰성(reliability)은 기술 기반 검사(e.g., 박출률 감소 심부전 진단 시 외측으로 변위된 심첨 박동(laterally displaced apical impulse) 및 제3 심음(third heart sound)을 심장초음파도(echocardiogram)와 비교)의 소견과 비교함으로써 확립됩니다.

 

병력과 가설 중심 신체 검진에서 얻은 정보를 사용하여, 임상의는 추가 검사가 필요한지 또는 진단을 내리고 치료 권고를 제공하기에 충분한 정보가 있는지 결정할 수 있습니다.11 그러나 이 접근법은 그러한 검진을 시연하고(demonstrate) 연습할(practice) 기회를 찾아 나설 것을 요구합니다. 대화형 그래픽은 운동성 호흡곤란(exertional dyspnea) 환자에 대한 가설 중심 신체 검진을 보여줍니다.

 

의도적인 연습 기회를 창출하라 (Create Opportunities for Intentional Practice)

 

전용 임상 술기 교육과정(dedicated clinical skills curriculum)의 일부로서의 의도적인 연습(Intentional practice)은 신체 검진 술기를 향상시킵니다.34 환자와 함께하는 것은 병상 술기의 가치와 데이터 수집(즉, 병력 청취 및 신체 검진)이 환자 진료에 즉각적으로 영향을 미치는 방식을 가르쳐줍니다.17 그러나 의도적인 연습은 교수자와 학습자가 장벽을 극복하고 병상으로 돌아갈 수 있도록 힘을 실어주는(empowering) 데서 시작됩니다.

 

회진 중 병상에서 학습자 및 교수자와 함께 수행되는 환자 중심 의학 교육(Patient-centered medical education)효율성을 높이고(increase efficiency) 의사 만족도를 향상시킬 수 있습니다.35 환자 방에서의 회진(Rounding in the patient’s room)은 해결해야 할 즉각적인 문제를 식별하고, 공유된 의료 의제(shared medical agenda)를 구성하는 데 도움을 주며, 검사, 치료, 자문의뢰(consultations)를 신속하게 처리(expedites)합니다. 교수자는 환자와 학습자 모두에게 병상 회진(bedside rounds) 중에 무엇을 예상해야 하는지 준비시켜야 합니다. 이를 위한 한 가지 방법은 의료팀 구성원에게 처방 입력(order entry) 또는 EHR에서 데이터 검색(data retrieval)과 같은 과제를 할당(assigning tasks)하여 병상 상호작용을 연출(choreograph)하는 것입니다. 참여자에게 역할을 할당하는 것은 임상 발표(clinical presentations)에 집중하고, 중요한 병력 데이터를 명확히 할 시간을 확보하며, 신체 검진의 세부 사항을 사례 발표에 통합하는 데 도움이 됩니다. 환자와의 시간을 구조화하는 것(Structuring time)은 또한 교육의 기회를 제공합니다.36

 

1분 지도교수(One-Minute Preceptor)37 및 5분 순간(Five-Minute Moment)38과 같이 효율적인 병상 교육을 돕는 몇 가지 도구(tools)를 사용할 수 있습니다.

  • 5분 순간은 신체 검진 소견과 관련된 기억에 남는 짧은 사례(memorable vignette)를, 검진 중 술기를 올바르게 수행하는 방법에 대한 정보 및 소견의 관련성(relevance of the finding)에 대한 데이터와 결합합니다 (이 기사의 전체 텍스트와 함께 NEJM.org에서 제공되는 보충 부록(Supplementary Appendix)의 그림 S1 참조).
  • 시간이 허락한다면, 여러 대본화된 교육 도구(scripted teaching tools)를 결합하여 환자의 주된 문제(chief concern)에 대한 보다 포괄적인 접근 방식을 만들 수 있습니다.

 

아침 회진 동안 전체 팀이 모든 환자를 보는 것은 종종 불가능합니다.

  • 임상 교육자는 병력이나 신체 검진이 진단을 명확히(elucidating a diagnosis) 하는 데 도움이 될 가능성이 높은 상황을 선택함으로써 학습자와 함께 볼 환자를 우선순위(prioritize)로 정할 수 있습니다.
    • 예를 들어, 집중적인 심폐 검진(focused cardiopulmonary examination)은 만성 호흡곤란 환자에서 만성 폐쇄성 폐질환(chronic obstructive pulmonary disease)과 심부전(heart failure)을 구별하는 데 도움이 될 수 있습니다.39 입원 환자의 상당 부분(substantial proportion)이 심폐 질환(cardiopulmonary disease)으로 인한 것이므로,40 표적화된 심폐 검진(targeted cardiopulmonary examination) 수행 방법을 배우는 것은 대부분의 임상의에게 유용합니다.
  • 교육자는 또한 교육자와 학습자 모두가 임상 술기를 향상시킬 기회를 제공할 수 있는 특정 임상표현(presentations)를 기준으로 볼 환자를 선택할 수도 있습니다. "신경 공포증(neurophobia)"이 의학 수련에서 흔히 기술되는 현상임을 감안할 때,41 신경학적 증상(neurologic symptoms)이 있는 환자를 보는 것은 종종 진단과 교육 모두에 성과가 높은(high-yield) 노력입니다.

 

전통적인 회진과 별도로 학습자를 병상으로 데려가는 것도 가치가 있을 수 있습니다.

  • 예를 들어, 새롭거나 악화되는 임상 상태(new or worsening clinical condition)의 환자를 진찰하는 것은 진단과 임상적 의사 결정에 있어 병상 만남의 가치를 실시간으로(in real time) 보여줄 수 있습니다. 이러한 유형의 "반응적 학습(reactive learning)"은 직장 내 비공식 학습(informal learning in the workplace)의 중요한 부분입니다.42

 

일상적인 환자 진료 외의 전용 신체 검진 및 관찰 세션(Dedicated physical examination and observation sessions) 또한 임상 술기를 구축할 수 있습니다.

  • 저자 중 한 명은 정기적인 세션을 이끄는데, 이 세션에서 수련생들은 교수 및 다른 학습자들에게 알려지지 않은 환자에 대해 탐구하고 싶은 주된 문제나 증상(chief concern or symptom)을 제공합니다. 팀은 병상으로 가서 신체 검진(필요시 초음파검사 포함)을 실시하고, 존재하는 소견에 동의하며, 소견의 잠재적인 임상적 중요성(potential clinical significance)을 논의하고, 이를 영상 연구 및 기타 진단 검사의 가용 결과와 비교(compares)합니다.
  • 이러한 교육 세션은 병상 임상 소견의 가치를 보여주고 검진 기술을 영상 결과로 교정(calibrate)합니다. 이 세션은 또한 수련생들의 발견을 축하하고 병상 검진의 한계를 인정(acknowledge the limitations)하는 기회를 제공합니다 (예: 검진 및 초음파 소견이 진단을 밝혀내지 못할 때).

 

교수자는 임상 술기를 가르치고 연습하기 위해 전통적인 교육 세션(traditional educational sessions)을 활용할 수 있습니다.

  • 예를 들어, 아침 보고(morning report) 발표 후, 팀은 병상으로 가서 집중적인 병력 청취 및 신체 검진(focused history taking and physical examination)을 실시합니다. 이 전략을 사용하면, 병상 소견이 감별 진단을 상당히 변경시킬 수 있습니다 (예: 탈수로 의심되었던 신부전 환자가 비대상성 심부전(decompensated heart failure)으로 밝혀짐).43
  • 전통적인 아침 보고나 다른 컨퍼런스는 또한 표준화 환자(standardized patients)(상태의 증상을 시뮬레이션하도록 훈련받은 사람)나 건강한 지원자를 사용하여 특정 신체 검진 술기를 시연하고 연습하는 데 사용될 수 있습니다.44

병상 세션은 의과대학 초기에 시작되어야 합니다. 습관은 일찍 형성되고 의사 경력 전반에 걸쳐 임상 실습에 영향을 미치기 때문입니다.

  • 실제 환자 및 표준화 환자 모두와 함께 관찰되는 병상 임상 만남(observed bedside clinical encounters)에 참여하는 본과 전 학생(Preclinical students)은 그러한 세션에 참여하지 않은 학생들보다 3학년 임상 실습(third-year clerkships) 말에 더 나은 임상 술기를 보입니다.45
  • 그러나 본과 전 학생들이 임상 순환(clinical rotations)으로 이동하여 의사들이 일상적인 환자 진료에서 병력 청취와 신체 검진을 사용하는 것을 보지 못하면, 그들은 빠르게 EHR과 기술 기반 검사로 초점을 옮깁니다.12

 

임상 검진 술기를 가르치고 강화하기 위해 기술을 사용하라 (Use Technology to Teach and Reinforce Clinical Examination Skills)

 

2세기 전 라에네크(Laënnec)의 청진기(stethoscope) 발명은 의학에서 가장 중요한 기술 발전 중 하나로 남아있습니다.18 새로운 기술은 청진기의 진단 능력을 확장시켰습니다.

  • 디지털 청진기(Digital stethoscopes)스펙트로포노그래프(spectrophonographs)(역주: 음향 분석 그래프)와 심전도(electrocardiograms)의 실시간 시각화(real-time visualization)와 함께 동시 청진(simultaneous auscultation)을 가능하게 합니다 (대화형 그래픽 참조). 인공지능(AI) 알고리즘은 부정맥(arrhythmias)과 판막 심장병(valvular heart disease)의 진단을 돕습니다.46,47
  • 현장 초음파검사(Point-of-care ultrasonography, POCUS)는 전통적인 신체 검진으로는 파악하기 어려운(elude) 진단을 확립할 수 있습니다. POCUS는 학습자들이 검진 소견(examination findings)을 병태생리학적 특징(pathophysiological features)의 실시간 시각화와 연결함으로써 자신들의 신체 검진 술기를 교정(calibrate)할 수 있게 합니다.48 AI 알고리즘은 학습자들의 영상 획득(image acquisition) 및 해석(interpretation)을 도울 수 있습니다.49
  • 그러나 아마도 POCUS의 진정한 힘은 그것이 환자, 의사, 수련생을 병상에서 하나로 모은다는 점일 것입니다. POCUS에 능숙해지기 위해, 의사들은 환자와 함께 있어야(be present) 하고, 대화를 시작하며, 검사할 신체 부위를 적절히 노출시켜야 합니다. 그 과정에서 중요한 병력 단서(historical clues)와 신체 검진 소견(예: 흉골 절개 흉터(sternotomy scar) 또는 심박 조율기(pacemaker))이 명백해집니다.50 의사들은 또한 병태생리학적 특징의 실시간 영상을 보여줌으로써 환자와의 유대감(connection)을 형성하고 공동 의사 결정(shared decision making)에 환자를 참여시킬 수 있습니다.51

기술

  • 임상 검진에 대한 물리적 장벽(예: 촉각과 청각을 제한하는 개인 보호 장비)을 극복하는 데 도움을 줄 수 있으며, 환자를 스캐너로 이송하는 것이 불가능할 때(예: 임상적 불안정성 또는 감염 예방의 필요성 때문에) 실시간 진단(real-time diagnostics)을 제공할 수 있습니다.52
  • 기술은 또한 원격의료(telehealth)를 포함하도록 병상의 개념을 재구성(reframed)했으며, 이는 의사에게 환자의 가정 환경에 대한 통찰력(insight)을 제공하는 동시에 환자가 의사의 도움을 받아 환자 주도(physician-assisted, patient-led)로 신체 검진에 참여할 수 있게 합니다.53

 

새롭게 부상하는 기술(Emerging technologies)들은 병상 임상 만남을 더욱 변화시킬 잠재력을 가지고 있습니다.

  • 예를 들어, 다중모드 AI 시스템(multimodal AI systems)은 언젠가 환자의 관찰 및 시진(visual inspection)을 보조할 수 있을 것입니다.54
  • 거대 언어 모델(Large language models)임상 추론(clinical reasoning) 작업에서 가능성을 보여주었습니다.55
  • 아마도 AI의 더 즉각적이고 유용한 영향은 EHR에 의해 부과된 행정적 부담(administrative burden)을 덜어주어, 환자와의 직접적인 접촉을 위한 시간을 확보해 주는 것일 겁니다.56

병상에서 AI의 역할이 어떻게 구체화되든, AI 상호작용의 결과는 항상 병상에서의 인간의 관찰, 인간의 임상적 의사 결정, 그리고 인간의 소통대체하기보다 정보를 제공(inform rather than replace)해야 합니다.57 AI가 활성화된 임상 업무 환경(AI-enabled clinical workplace)에서는 병상 임상 술기가 훨씬 더 중요해질 것이며, 이는 이러한 술기에 대한 직접 관찰(direct observation)과 피드백(feedback)을 더 강력하게 강조할 필요성을 부각시킵니다.

 

임상 술기에 대한 피드백을 구하고 제공하라 (Seek and Provide Feedback on Clinical Skills)

 

환자가 있는 앞에서 학습자에게 피드백을 전달(Delivering feedback)하는 것은 복잡한 기술입니다. 특히 그 피드백이 신체 검진 기술의 실수를 교정하거나 감별 진단 또는 치료 계획을 수정하는 것을 포함할 경우 더욱 그렇습니다. 잘못 전달된 피드백은 수련생과 환자 사이의 관계를 약화시킬 수 있습니다. 그러나 맥락 특이적이고(context-specific) 사려 깊은 방식으로 전달된다면, 병상 피드백(bedside feedback)은 환자들에게 전체 팀이 자신들의 진료에 전념하고 있음을 안심(reassure)시킬 수 있습니다 (대화형 그래픽 참조). 병상 피드백을 전달하기 전에 환자 및 학습자와 기대치를 설정(set expectations)하는 것이 중요합니다. 이 과정에는 환자와 팀 모두에게 피드백이 제공될 것임을 미리 알리고 학습자에게 필요한 특정 영역을 찾는 것이 포함될 수 있습니다. 가능할 때 의학 용어(medical jargon)를 피하는 것은 의사소통과 교육을 향상시킬 수 있습니다. 병상 만남 후 학습자와의 짧은 디브리핑(debriefing)은 핵심 사항을 강화하고 향후 경험을 개선할 방법을 식별할 수 있습니다.36,58

 

병상 피드백의 중요성에도 불구하고, 실제 환자를 대상으로 한 임상 술기의 직접 관찰 및 평가(direct observation and assessment)는 미국에서 드뭅니다.59 대신 미국 의학 교육은 학습자의 역량 발달을 결정하기 위해 객관식 시험(multiple-choice examinations)을 사용한 의학 지식의 총괄 평가(summative assessments)에 의존합니다. 다른 많은 국가에서는 내과 전공의를 마치는 이들에게 교수 관찰자(faculty observers)에 의해 평가받으면서 실제 소견을 가진 실제 환자를 만나는 시험에 합격할 것을 요구합니다. 이해관계가 큰 평가(high-stakes assessment)는 학습을 촉진할 수 있습니다.60 이러한 경험을 거친 비미국 수련 의사(Non–U.S.-trained physicians)는 미국에서 수련받은 의사들보다 임상 검진 술기에 더 능숙하고 환자 진료에 있어 병상 만남의 가치에 대해 더 폭넓게 인식하는 경향이 있습니다.61 이러한 경험은 환자에게 더 나은 결과(better outcomes)로 이어질 수 있습니다.62

 

미국에서는 이해관계가 큰 총괄 임상 술기 시험(summative clinical skills examination)에 대한 요구가 없지만, 수련 과정에 더 많은 직접 관찰을 통합할 필요가 있습니다.

  • 신체 검진 및 소통 기술 평가(Assessment of Physical Examination and Communication Skills, APECS)는 내과 전공의들을 위한 형성적 경험(formative experience)으로, 실제 환자와의 통합(integrated), 신체 검진-단독(physical examination–only), 원격의료(telemedicine), POCUS 만남을 포함합니다.
  • 전공의들은 7개 임상 영역(clinical domains)에 걸쳐 평가받고 숙련된 교수진으로부터 개별화된, 실습 중심의(hands-on) 피드백을 받습니다.63

 

APECS는 신체 검진의 지속적인 가치를 강조합니다.

  • 인턴들의 신체 검진 술기를 평가하기 위해 APECS를 사용한 한 연구는 좋은 기술(good technique)이 올바른 신체 소견의 식별(identification of the correct physical findings)과 유의하게 연관되며, 좋은 기술과 신체 소견의 식별 모두 올바른 감별 진단 공식화(formulation of a correct differential diagnosis)와 유의하게 연관됨을 보여주었습니다.63 수련생에 대한 직접 관찰은 또한 피드백 기회를 제공합니다.
  • APECS를 통합한 다른 연구에서는, 중증 대동맥판 역류증(severe aortic regurgitation) 환자 진찰에 참여한 인턴의 절반만이 특징적인 이완기 심잡음(diastolic murmur)을 인지했습니다(대화형 그래픽의 시나리오).64 흔히 관찰되는 두 가지 오류(대화형 그래픽 시나리오의 학습자도 범한)는 환의나 옷 위로 청진(auscultating through the gown or clothing)하는 것과 (심첨 박동이나 경동맥 박동 대신) 요골 동맥(radial pulse)을 촉지하며 심장을 청진하는 것입니다.64 이것들은 쉽게 교정될 수 있는(easily corrected) 기술상의 간단한 오류입니다.
  • APECS는 또한 다양한 전문 분야와 경험 수준을 가진 의사들이 학습자들과 지도교수(preceptors)로 짝을 이루기 때문에 교수 개발(faculty development)을 위한 기회도 제공합니다.63

 

APECS는 자원 집약적(resource-intensive)이며 일상적인 진료 제공 과정 밖에서 일어납니다. 이러한 한계를 인식하고, 병상의학회(Society of Bedside Medicine)는 일상 업무 흐름(daily workflow)에서 사용하기 위한 '10분 순간(Ten-Minute Moment)'을 만들었습니다.65 여기서는 교수진이 술기 기반 워크시트(skills-based worksheet)의 도움을 받아 학습자가 집중 신체 검진(focused physical examination)을 수행하는 것을 관찰하고 실시간 피드백(real-time feedback)을 제공합니다. 소규모 임상 평가 실습(Mini–Clinical Evaluation Exercise, Mini-CEX)은 업무 현장 기반 관찰(workplace-based observations)과 후속 피드백을 안내하기 위해 흔히 사용되는 또 다른 도구입니다.66

 

진단을 넘어선 병상 만남의 힘을 인정하라 (Acknowledge the Power of the Bedside Encounter beyond Diagnosis)

 

임상 의학은 불확실성(uncertainty)을 배경으로 실행됩니다. 당면 과제가 진단 확립이든, 치료 결정이든, 임상적 추적 관찰이든, 불확실성은 병상 환자 진료의 일부입니다. 이 사실을 인정하면 환자, 임상의, 수련생이 불확실성을 함께 헤쳐나갈(negotiate the uncertainty together) 수 있으며, 이는 환자-의사 관계를 강화할 수 있습니다.67 교육자가 불확실성을 완화하기 위해 보여줄 수 있는 한 가지 속성은 호기심(curiosity)입니다. 1999년 피츠제럴드(Fitzgerald)의 에세이에서 정의된 바와 같이, 호기심은 "탐구하고 발견하려는 충동(the urge to investigate, to discover)"이며, 임상 의학에 적용될 때 호기심은 환자를 하나의 이야기 속 구성 요소인 징후와 증상을 가진 한 사람(person)으로 보게 합니다.68 호기심을 가지고 병상 만남에 접근하면 임상의는 환자 및 학습자와 효과적으로 협력(effectively partner)할 수 있습니다.

 

의도를 가지고 준비하기, 열심히 경청하기, 중요한 것에 동의하기와 같이 환자와의 상호작용 중에 온전히 집중하기(be fully present) 위한 근거 기반 실천법을 사용하는 것은, 병상에서 보내는 시간이 단순한 임상적 단서 이상의 것을 산출하게 합니다. 이는 환자의 이야기와 연결(connection with a patient’s story)되게 하고 신뢰(trust)를 낳습니다.69 온전히 집중하며 보내는 시간은 임상의가 자신의 일에서 의미(meaning in their work)를 찾도록 도와주며, 이는 스트레스와 소진(burnout)에 맞서는 강력한 버팀목이 될 수 있습니다.7,27 잘 수행된 신체 검진은 돌봄(caring)을 전달하며 진단적 소견을 넘어선 플라시보 효과(placebo effect)를 가질 수 있습니다.7 환자와 보낸 시간이 중요한 임상 정보를 산출하는 순간을 축하하는 것(Celebrating moments)은 임상 만남에서 흥미(excitement)를 불러일으키고 "유레카페니아(eurekapenia)"(즉, 학습자가 임상 소견과 질병의 병태생물학적 기초 사이의 연관성을 인식하는 "유레카"의 순간이 부족(paucity of “eureka” moments)한 것)에 대한 해독제(antidote)입니다. 많은 학습자와 현직 의사들은 병상에서 시간을 거의 보내지 않기 때문에 유레카페니아를 경험합니다.70

 

병상 만남은 또한 의료 불평등(health care disparities)을 다룰 수 있습니다.

  • 소외된 인종 및 민족 집단(underrepresented racial and ethnic groups)에 속한 십대들 중, 정기 검진(routine checkups) 중에 신체 검진을 한 번도 받아본 적이 없다고 보고하는 비율이 백인 또래(White peers)보다 높습니다.71
  • 설령 그러한 검진이 이루어지더라도, 제도적 불평등(systemic inequities)(예: 어두운 피부색(darker skin tones)을 포함하는 피부과 교과서의 부족72 또는 맥박 산소 측정기(pulse oximeters)와 같은 장치의 편향73)은 유색인 환자(patients of color)의 결과를 악화시킬 수 있습니다.
  • 영어 능숙도가 낮은(low English language proficiency) 환자들도 부적절한 치료(inadequate care)를 받을 수 있습니다.74 교육자들이 팀을 병상으로 데려갈 때, 그들은 맥락 특이적인 방식(context-specific way)으로 이러한 불평등을 인지하고 해결(acknowledge and address these inequities)할 수 있습니다.

 

결론 (Conclusions)

 

기술 발전, 환자와의 제한된 시간, 임상적 불확실성을 배경으로, 21세기 환자, 수련생, 임상 교육자의 요구를 충족시키기 위해 병상 만남을 재활성화할(reinvigorate the bedside encounter) 시급한 필요가 있습니다. 여섯 가지 전략을 사용함으로써, 임상 교육자들은 수련생들이 진단적 추론(diagnostic reasoning)에 있어 병상 만남의 가치를 인식하고, 환자-의사 관계를 강화하며, 의료 불평등과 싸우고(combat health care inequities), 전문직으로서의 성취감(professional fulfillment)을 향상시키며, 소진을 피하도록(avoid burnout) 도울 수 있습니다. 오슬러(Osler)의 말은 1세기가 지난 지금도 여전히 진실되게 울립니다: "의학은 교실이 아니라 병상에서 배운다(Medicine is learned by the bedside and not in the classroom). 질병의 징후에 대한 당신의 개념이 강의실에서 들은 말이나 책에서 읽은 글에서 나오게 하지 말라. 보고, 그런 다음 추론하고 비교하고 통제하라(See, and then reason and compare and control). 그러나 먼저 보라(But see first)."7

 

 

표 1. 병상 만남을 재활성화하기 위한 전략 (Strategies to Reinvigorate the Bedside Encounter.)

전략: 병상으로 가서 (환자와 수련생 모두를) 관찰하라 (Go to the bedside and observe (both patient and trainee))

  • 근거 (Justification):
    • 관찰은 신체 검진의 많은 부분의 기초를 형성하며, 많은 질병의 진단과 예후(prognosis)에 귀중한 단서를 제공할 수 있습니다.
    • 수련생의 임상 술기를 직접 관찰(Direct observation)하는 것은 실행 가능하고(actionable) 구체적인 피드백을 제공하는 데 매우 중요합니다.
    • 관찰 기술은 비의료적 맥락(nonmedical contexts)에서의 연습을 통해 향상될 수 있습니다.

전략: 신체 검진에 대한 근거 기반 접근법을 실천하고 가르쳐라 (Practice and teach an evidence-based approach to the physical examination)

  • 근거 (Justification):
    • 신체 검진은 다른 진단 검사와 마찬가지로 가설 중심 접근법(hypothesis-driven approach)으로 사용되어야 합니다.
    • 많은 경우 신체 검진은 여전히 표준 진단 검사(reference-standard diagnostic test)로 남아있습니다.
    • 다른 경우에는, 기술 기반 검사(technology-based test)와의 비교를 통해, 가능도비(likelihood ratios)가 적절한 신체 검진 술기를 선택하는 데 도움을 줄 수 있습니다.

전략: 의도적인 연습 기회를 창출하라 (Create opportunities for intentional practice)

  • 근거 (Justification):
    • 병상에서의 시간은 제한되어 있으므로, 교육자는 병상 술기를 의도적으로 연습(intentional practice)할 기회를 만들 필요가 있습니다.
    • 전통적인 아침 회진(Traditional morning rounds)은 여전히 병상 임상 술기를 가르칠 최고의 기회입니다.
    • 아침 보고(morning report), 정오 컨퍼런스(noon conference) 또는 전용 신체 검진 세션과 같은 다른 교육 세션도 연습 기회를 제공할 수 있습니다.

전략: 임상 검진 술기를 가르치고 강화하기 위해 기술을 사용하라 (Use technology to teach and reinforce clinical examination skills)

  • 근거 (Justification):
    • 현장 진료 기술(Point-of-care technology) (예: 디지털 청진기 및 초음파검사 사용)은 병상 검진의 일부입니다. 이는 진단을 향상시키고, 학습자가 자신의 신체 검진 기술을 교정(calibrate)할 수 있게 하며, 교육자, 학습자, 환자를 하나로 모읍니다.
    • 원격의료(Telemedicine)는 의료 접근성을 향상시키고 임상의가 환자의 가정 환경에서 환자를 방문할 수 있게 합니다.
    • 인공지능(Artificial intelligence)은 행정적 부담을 줄이고, 임상 추론 과정을 보조하며, 데이터 획득을 도울 수 있습니다.
    • 기존 또는 새로운 기술을 병상에서 사용할 때는 편향(bias)의 가능성에 대한 인식이 중요합니다.

전략: 임상 술기에 대한 피드백을 구하고 제공하라 (Seek and provide feedback on clinical skills)

  • 근거 (Justification):
    • 실제 환자를 대상으로 한 임상 술기의 직접 관찰과 피드백은 미국에서 드뭅니다.
    • 평가는 학습을 견인(drive learning)할 수 있습니다.
    • 실제 환자를 통한 형성 평가(Formative assessments)는 개별 학습 계획에 정보를 제공할 수 있습니다.

전략: 진단을 넘어선 병상 만남의 힘을 인정하라 (Acknowledge the power of the bedside encounter beyond diagnosis)

  • 근거 (Justification):
    • 호기심(curiosity)을 가지고 각 만남에 접근하는 것은 의사가 불확실성(uncertainty)을 헤쳐나가는 데 도움이 될 수 있습니다.
    • 적절한 병력 청취와 신체 검진을 수행하는 것은 환자가 보살핌을 받고 있다고 느끼게(feel cared for) 도우며 치유 효과(healing effect)를 가질 수 있습니다.
    • 환자에게 온전히 집중(be fully present)하기 위해 근거 기반 접근법을 사용하는 것은 환자-의사 관계를 개선하고 전문직으로서의 성취감(professional fulfillment)을 높입니다.
    • 병상에서 시간을 보내는 것은 의료 불평등(health care inequities)을 해결하는 데 도움이 될 수 있습니다.
N Engl J Med. 2025 Aug 21;393(8):786-797. doi: 10.1056/NEJMra2503232.

Educational Strategies for Clinical Supervision of Artificial Intelligence Use

 

🤖 "AI 의사"의 시대, 당신은 '사이보그'인가 '켄타우로스'인가?

안녕하세요! 🩺 여러분은 요즘 가장 핫한 주제인 '의료 인공지능(Medical AI)'에 대해 어떻게 생각하시나요? 특히 ChatGPT 같은 LLMs (대규모 언어 모델, Large Language Models)가 등장하면서, 의학 교육과 임상 현장은 말 그대로 격변의 시기를 맞이하고 있습니다.

환자를 진료하던 레지던트가 몰래 스마트폰으로 ChatGPT에게 "이 환자 증상이 뭘까요?"라고 물어보는 상상, 이제는 현실이 되었죠. (논문의 그림 1이 딱 이 장면을 묘사하고 있습니다!)

이게 과연 괜찮은 걸까요? 의사들이 더 효율적으로 일하게 되는 걸까요? 아니면... 스스로 생각하는 능력을 잃어버리게 되는 걸까요?

오늘 소개해 드릴 저명한 의학 저널 NEJM (New England Journal of Medicine)에 실린 한 논문은 바로 이 위험하고도 매력적인 질문에 대해 아주 흥미로운 해답을 제시합니다.


⚠️ AI가 가져온 3가지 그림자: 탈숙련, 미숙련, 오숙련

우리는 AI에게 일을 맡기는 것, 즉 '인지적 부담 전가(Cognitive off-loading)'에 익숙해지고 있습니다. 간단한 계산이나 정보 검색은 편하지만, 이게 '임상 추론'처럼 복잡한 영역으로 넘어가면 심각한 문제가 생길 수 있습니다.

논문은 AI에 대한 맹목적인 의존이 3가지 위험을 초래한다고 경고합니다.

  1. 탈숙련 (Deskilling): 😥 이미 가지고 있던 임상 기술을 AI에 의존하다가 잃어버리는 현상.
  2. 미숙련 (Never-skilling): 😟 AI가 다 해주니까, 애초에 필수적인 임상 기술을 배울 기회조차 갖지 못하는 현상.
  3. 오숙련 (Mis-skilling): 🤯 AI가 틀린 정보나 편향된 답을 줬는데, 그걸 비판 없이 수용해서 잘못된 방식이 몸에 굳어지는 현상.

연구진은 이 문제의 심각성을 이렇게 표현했습니다.

"의학 교육(medical training)에서 AI를 사용하면, 매우 효율적이지만 AI 이전 시대의 전문가들보다 독립적인 문제 해결 및 비판적 평가(critical evaluation) 능력이 떨어지는 전문가를 초래할 수 있습니다."

(Original Text: "the use of AI in medical training could result in professionals who are highly efficient yet less capable of independent problem solving and critical evaluation than their pre-AI counterparts.")

 

생각만 해도 조금 아찔하죠? 🤖


💡 해답은 '적응적 실천'과 '비판적 사고'

그렇다고 AI를 무조건 금지해야 할까요? 논문은 절대 아니라고 말합니다. AI는 이미 강력한 도구이며, 문제는 '어떻게' 사용하느냐에 달려있습니다. 연구진이 제시하는 핵심 능력은 바로 '적응적 실천(Adaptive practice)'입니다. 이는 효율적인 일상 업무(자동적 실천)와 새롭고 불확실한 문제에 직면했을 때 유연하게 대처하는 혁신적 사고(적응적 실천) 사이를 자유롭게 오가는 능력을 말합니다.

그리고 이 '적응적 실천'을 가능하게 하는 무기가 바로 '비판적 사고(Critical thinking)'입니다.

"비판적 사고는 불확실성(uncertainty)에 직면했을 때 적응적 실천의 기초가 되는 구조화된 인지적 도구 집합입니다."

(Original Text: "Critical thinking is the structured cognitive tool set that underlies adaptive practice in the face of uncertainty.")

 

AI가 아무리 그럴듯한 답을 내놓아도, 그 답이 '추적할 수 없는 블랙박스(untraceable black box)'에서 나왔다는 사실을 인지하는 것, 그것이 비판적 사고의 시작입니다. 연구진은 우리가 AI의 답을 받아들이는 순간을 '맹목적 신뢰(Leap of faith)'라고 표현하며, 이 순간을 인식하는 것이 중요하다고 말합니다.

"AI 상호작용은... 이 판단을 추적할 수 없을(this judgement cannot be traced) 때로 정의되며, 이는 사용자가 AI 결과물을 신뢰하기 위해 '맹목적 신뢰(leap of faith)'를 고려하도록 유도합니다."

(Original Text: "An AI interaction is defined as a moment when... this judgement cannot be traced, which prompts the user to consider taking a leap of faith to trust the AI output.")


🐎 당신은 '사이보그'인가, '켄타우로스'인가?

자, 그럼 이 '비판적 사고'를 가지고 AI를 어떻게 활용해야 할까요? 논문은 두 가지 매우 흥미로운 협업 모델을 제시합니다. (그림 4 참조)

🦾 1. 사이보그 (Cyborg) 모델

  • 특징: 인간과 AI가 긴밀하게 얽혀(tightly intertwine) 모든 작업 단계에서 협업합니다. AI와 거의 한 몸이 되어 일하는 방식이죠.
  • 적합한 과제: 위험도가 낮거나(Low-risk), 창의적이거나, 잘 검증된 과제 (예: 이메일 초안 작성, 일반적인 학습 계획 짜기)
  • 장점: 매우 효율적이고 강력합니다.
  • 단점: '자동화 편향(Automation bias)'에 빠지기 쉬워, 자칫 AI의 오류를 놓치고 '탈숙련'이나 '오숙련'으로 이어질 수 있습니다.

🐎 2. 켄타우로스 (Centaur) 모델

  • 특징: 신화 속의 반인반마(켄타우로스)처럼, 인간(머리)과 AI(다리)가 작업을 전략적으로 분할(strategically divide)합니다. 인간의 판단이 항상 AI보다 우위에 있으며, AI는 작업을 위임받는 '도구' 역할을 합니다.
  • 적합한 과제: 위험도가 높거나(High-stakes), 불확실하거나, AI가 검증되지 않은 과제 (예: 환자 감별 진단, 복잡한 임상 의사결정)
  • 장점: 인간의 '비판적 사고'가 중심이 되어 AI의 오류를 걸러내고, 안전성을 극대화합니다.
  • 단점: '사이보그' 모델보다 시간과 노력이 더 들 수 있습니다.

의료 현장에서는 어떨까요? 환자의 생명과 직결된 '진단'과 '치료' 같은 고위험(High-stakes) 과제에서는, 우리는 반드시 '켄타우로스'가 되어야 합니다. AI의 제안을 받더라도, 최종 결정은 인간 의사의 비판적 평가와 검증을 거쳐야 한다는 뜻이죠!


🎓 교육자는 무엇을 해야 하는가? (DEFT-AI 프레임워크)

이 논문은 특히 의학 교육자(교수, 지도교수)의 역할을 강조합니다. 학생이 AI를 쓴다고 무조건 혼내는 것이 아니라, 그 순간을 '비판적 사고'를 가르칠 교육적 기회로 삼아야 한다고 말이죠.

이를 위해 DEFT-AI라는 멋진 프레임워크를 제안합니다. (그림 3 참조)

  • Diagnosis (진단, 토론): "어떤 AI를 썼니? 어떤 프롬프트를 입력했어?"
  • Evidence (증거): "그 AI가 내놓은 답을 어떻게, 무슨 근거로 검증(verify)했니?"
  • Feedback (피드백): "스스로의 AI 사용법을 평가해보고, 어떻게 개선할 수 있을까?"
  • Teaching (교육): "AI의 답은 '검증하고(verify)' 나서 '신뢰(trust)'해야 해. 고위험 상황에선 '켄타우로스'처럼 행동해야 한단다."

🌟 마치며: "검증하고 신뢰하라 (Verify and Trust)"

AI는 의학의 미래를 바꿀 강력한 도구임이 틀림없습니다. 하지만 이 도구에 휘둘릴 것인지, 이 도구를 지배할 것인지는 우리에게 달려있습니다. 연구진의 마지막 메시지는 이 모든 논의를 관통하는 핵심입니다.

"궁극적으로, "검증하고 신뢰하는(verify and trust)" 패러다임을 육성하는 것은 AI가 인간 전문성의 유익한 증강(beneficial augmentation)이 되도록 보장하는 데 매우 중요합니다."

(Original Text: "Ultimately, fostering a 'verify and trust' paradigm is crucial for ensuring that AI is a beneficial augmentation of human expertise.")

 

'사이보그'의 효율성과 '켄타우로스'의 지혜를 모두 갖춘, AI 시대를 현명하게 헤쳐나가는 우리 모두가 되기를 바랍니다!

 


인간-컴퓨터 상호작용 (Human–computer interactions)은 수십 년 동안 이루어져 왔지만, 최근 의료 인공지능 (AI)의 기술 발전은 더 효과적이고 잠재적으로 더 위험한 상호작용을 초래했습니다. AI에 대한 과대광고 (hype)는 인터넷 및 전자의무기록 (electronic health record)의 발전과 같은 이전의 기술 혁명을 연상시키지만,1 대규모 언어 모델 (LLMs, large language models)의 등장은 달라 보입니다. LLM은 인간과 유사한 유창함으로 지식 생성과 임상 추론 (clinical reasoning)을 시뮬레이션할 수 있으며, 이는 LLM에 주체성 (agency)과 독립적인 정보 처리의 모습을 부여합니다.2 따라서 AI는 의학 학습과 실무를 근본적으로 변화시킬 (fundamentally alter) 역량을 가지고 있습니다.3,4 다른 전문직에서와 마찬가지로,5 의학 교육 (medical training)에서 AI를 사용하면, 매우 효율적이지만 AI 이전 시대의 전문가들보다 독립적인 문제 해결 및 비판적 평가 (critical evaluation) 능력이 떨어지는 전문가를 초래할 수 있습니다.

 

이러한 도전은 교육적 기회와 위험을 동시에 제시합니다.

  • AI는 시뮬레이션 기반 학습,6 지식 상기 (knowledge recall), 적시 피드백 (just-in-time feedback)7을 강화할 수 있으며, 단순 반복 작업의 인지적 부담 전가 (cognitive off-loading)에 사용될 수 있습니다. 인지적 부담 전가를 통해, 학습자는 작업 기억 (working memory)의 부담을 줄이기 위해 AI에 의존하며, 이는 더 까다로운 작업에 정신적으로 몰입 (mental engagement)하도록 돕는 전략입니다.8
  • 그러나 임상 추론 및 의사 결정과 같은 복잡한 작업의 부담을 전가하는 것은 잠재적으로
    • 자동화 편향 (automation bias) (자동화된 시스템에 대한 과도한 의존 및 오류 위험),
    • "탈숙련 (deskilling)" (이전에 습득한 기술의 상실),
    • "미숙련 (never-skilling)" (필수 역량 개발 실패), 그리고
    • "오숙련 (mis-skilling)" (AI 오류 또는 편향으로 인한 잘못된 행동의 강화)으로 이어질 수 있습니다.9
  • 이러한 위험은 LLM이 예측 불가능한 블랙박스 (unpredictable black boxes)10로 작동하기 때문에 특히 우려됩니다. 즉, LLM은 추론 투명성 (reasoning transparency)이 낮은 확률론적 응답을 생성하므로 신뢰성 (reliability) 평가에 한계가 있습니다. 예를 들어, 한 연구에서는 상급 의대생의 3분의 1 이상이 임상 시나리오에 대한 LLM의 잘못된 답변을 놓쳤습니다.11

 

AI 생성 결과물의 고유한 가변성 (inherent variability)과 잠재적인 부정확성 (potential inaccuracies)은 숙련된 임상의조차도 AI의 권고에 대해 불확실하게 만들 수 있습니다. 이러한 딜레마는 새로운 것이 아니며, 익숙하지 않은 임상 문제에 직면하는 더 광범위한 도전을 반영합니다. 그러한 순간에는 적응적 실천 (adaptive practice), 즉 효율적이고 익숙하며 정형화된 행동과 혁신적이고 유연한 문제 해결 사이를 유연하게 전환 (shift fluidly)하는 역량이 필요합니다.12 비판적 사고 (Critical thinking)는 불확실성에 직면했을 때 적응적 실천의 기초가 되는 구조화된 인지적 도구 집합입니다. 이는 임상의가 가정을 수면 위로 끌어올리고, 지식 격차와 편향을 인식하며, 오류를 완화 (mitigate errors)하고, 새로운 문제에 적응하며, 새로운 지식을 생성하거나 채택(즉, 학습)하는 데 도움이 되는 자기 성찰 (self-reflection)에 참여하도록 합니다.13,14 따라서 비판적 사고는 AI 시대의 적응적 실천에 필수적 (foundational)입니다.

 

의학 학습자를 지도하는 임상의(이하 교육자)는 평생의 적응적 실천을 증진하기 위해 비판적 사고를 명시적으로 가르치고 (teach), 평가하며 (assess), 시범 보여야 (model) 합니다. 이해관계자들이 의학교육에 AI를 안전하게 통합하기 위한 시스템 수준의 전략을 개발하고 있지만,15 교육자와 학습자가 AI에 비판적으로 참여 (engage critically)하는 데 필요한 기술을 갖추도록 하는 구조화된 전략의 부재라는 중대한 공백 (critical gap)이 남아있습니다.16 본 종설 (review)에서는 AI가 사용되는 모든 곳에서 수련생의 임상 지도 (clinical supervision) 중에 비판적 사고를 가르치고 평가하기 위해 교육 전략을 활용하는 프레임워크 (framework)를 제안합니다.

 

배우면서 가르치기(Teaching while Learning)

 

AI 도구가 교실과 임상 현장에 스며들면서 (permeate), 교육자들은 자신들보다 학습자들이 더 능숙하게 (adept at using) 사용할 수 있는 기술의 사용을 지도하고 있는 자신을 발견하게 됩니다. 이러한 전문성의 역전 (inversion of expertise)은 교수진이 시스템 변화를 동시에 가르치고, 배우며, 실천해야 했던 환자 중심 의료 홈 (patient-centered medical home)의 부상과 같은 의학교육의 초기 변화들과 유사합니다.17 이러한 맥락에서, 교수 개발 (faculty development)은 교육자의 정의를 (AI 문해력 (AI-literate)을 갖춘 학습자와 환자를 포함한) 임상팀의 모든 구성원으로 확장하고, 성찰적이며 팀 기반의 "실천 공동체 (communities of practice)"17를 지원함으로써 공유 학습 모델 (shared learning model)에 기반해야 합니다. 이러한 원칙은 AI 지도 (AI supervision)에 직접 적용됩니다. 교육자는 학습자 주도의 통찰 (learner-led insight)의 순간을 수용하고 AI의 역량과 한계에 대한 공동 탐구 (shared inquiry)를 장려해야 합니다. 그렇게 함으로써 불편함은 불확실성의 공동 관리 (comanagement of uncertainty)18를 위한 기회로 전환되며, 이는 모두를 위한 임상적 사고 (clinical thinking)와 AI 문해력 (AI literacy)을 증진하는 구조화된 교육적 순간을 위한 발판을 마련합니다. 아래에서 설명할 전략들은 단순히 가르치기 위한 도구가 아니라, 교육자 자신이 AI에 대한 이해를 발전시킬 수 있도록 돕는 비계 (scaffolds)이기도 합니다. 이 새로운 지형 (terrain)에서는, 가르치는 사람도 역시 배우는 사람입니다.

 


주요 포인트: 인공지능 사용의 임상 지도를 위한 교육 전략

  • 전문가적 실천 (expert practice)의 발전을 위한 인공지능(AI)의 사용은 전례 없는 기회를 제공하지만, "탈숙련", "미숙련", "오숙련"과 같은 위험도 제기합니다.
  • 임상 지도교수는 학습자보다 AI 경험이 적을 수 있습니다. 교수 개발은 AI의 역량과 한계를 공동 탐색 (coexploration)할 수 있는 공유 학습 환경을 수용해야 합니다.
  • 효율성과 혁신 사이를 전환하는 적응적 실천 (Adaptive practice)은 AI 기반 학습의 기초입니다. 비판적 사고는 이러한 전환을 지원하며, 반드시 교육되고 시범 보여야 합니다.
  • AI 상호작용은 임상의가 완전히 재현할 수 없는 (retrace) 결과물을 받는 순간으로 이어지며, 이는 '맹목적 신뢰 (leap of faith)'를 유발합니다. 이러한 순간을 인식하기 위해 잠시 멈추는 것이 비판적 사고에 필수적입니다.
  • DEFT-AI (AI 사용에 대한 진단, 증거, 피드백, 교육 및 권장)는 학습자-AI 상호작용 동안 비판적 사고와 AI 문해력을 증진하기 위한 구조화된 프레임워크입니다.
  • 두 가지 AI 사용 행동이 나타납니다: 각 작업에 대해 사용자와 AI가 긴밀하게 얽히는 사이보그 (cyborg)와, 사용자와 AI 간의 작업을 분할하고 비판적 감독 (critical oversight)을 유지하는 켄타우로스 (centaur)입니다. 적응적 AI 실천은 작업의 복잡성과 관련된 위험에 따라 이러한 행동 사이를 전환하는 능력을 필요로 합니다.

의학 학습에서 AI의 약속과 위험(Promises and Perils of AI in Medical Learning)

 

다음과 같은 가상적이면서도 현실적인 예시를 고려해 보십시오: 진료 세션 중에, 한 의학 레지던트가 환자를 평가한 후 조용히 (discreetly) 스마트폰을 확인하고 LLM에 감별 진단 (differential diagnosis)과 관리 계획 (management plan)을 생성하도록 프롬프트를 입력합니다 (그림 1). 몇 초 안에 AI는 논리 정연하고 (well-reasoned) 설득력 있는 주장을 제시합니다. 학습자는 AI가 생성한 권장 사항을 환자 기록에 삽입합니다. 방 건너편에서 이 상호작용을 지켜보던 교육자는 생각합니다. "이제 어떡하지? 레지던트가 AI에게 어떤 프롬프트를 제공했을까? AI에게 질문을 던지고 있는 걸까, 아니면 제안을 그대로 받아들이고 있는 걸까? 이 AI에게 임상 추론을 맡겨도 (entrusted with) 될까? 내가 개입해야 할까? 그렇다면 어떻게? 이것이 임상 추론의 미래일까?"

 

그림 1. 학습자의 인공지능(AI) 사용을 목격하는 교육자.

 

교육자의 마지막 질문은 임상의를 지원하기 위한 AI 사용을 정의하는 것과 관련된 불확실성 (uncertainty)을 강조합니다.19 오늘날 AI 상호작용은 학습자의 일과 시간 내내 발생하고 있습니다. 예를 들어, 심전도(ECG) 판독 전문성 (expertise)이 제한적인 학습자는 흉통 환자의 임상 평가를 수행하기 위해 ECG 기계의 해석에 의존하는 (lean on) 경우가 많습니다.20 기술이 발전함에 따라, 임상의는 영상의학과의 영상 판독 (image interpretation)21,22부터 자동화된 임상 기록 (automated clinical documentation)23에 이르기까지 많은 임상 업무를 AI에 전가 (off-load)할 수 있습니다.

 

AI에게 임상 추론을 맡길 것인지에 대한 교육자의 질문은 친숙하면서도 시의적절합니다. 임상 의사 결정을 지원하는 이전 세대의 AI 도구들은 인간의 추론을 증강 (augment)하는 데 실패했지만,24 다양한 연구에서 지식 상기,25,26 복잡한 진단적 과제 해결,27-29 확률론적 추론 (probabilistic reasoning),30 관리 추론 (management reasoning),31 및 의사소통32을 포함한 여러 임상 추론 역량에서 LLM의 전문가와 유사한 수행 능력 (expertlike performance)을 입증했습니다. 그러나 보건 의료에 존재하는 기존의 편향을 반영하는 편향된 산물 (biased artifacts)33이 AI 모델 훈련 중에 포함될 가능성이 높으며, 이는 진단의 불평등 (diagnostic inequities)을 영속화 (perpetuate) (그리고 알려줄34) 가능성이 있습니다.35 더욱이, LLM은 환각을 일으키며 (confabulate)36 인간과 유사한 인지 편향 (cognitive biases)을 보입니다.37 따라서 AI가 보조 수단 (adjunct)으로 사용될 수는 있지만, 최종 진단과 치료 계획은 인간의 노력 (human endeavor)으로 남아야 합니다.38,39 우리는 임상 추론에서의 AI 사용에 본 종설의 초점을 맞추는데, 이 영역은 학습자와 그들의 미래 환자에게 높은 위험을 수반하며40 따라서 교육자와 학습자에게 우선순위 (priority)가 되어야 합니다.41

 

탈숙련 (Deskilling) 및 미숙련 (Never-Skilling)

 

그림 2에서 볼 수 있듯이, AI를 임상 추론을 지원 (informing)하는 대신 임상 추론의 대체재 (substitute)로 사용하는 것(부담 전가, off-loading)은 기술 개발과 관련하여 탈숙련 (deskilling),42 미숙련 (never-skilling),43 및 오숙련 (mis-skilling)이라는 몇 가지 위험을 초래합니다.

  • AI에 대한 과도한 의존 (Overreliance)은 웹 검색 사용에서 나타난 바와 같이44 정보 상기 (information recall)를 포함하여 학습자가 막 습득하기 시작한 임상 추론 기술의 상실로 이어질 수 있습니다.
  • AI 도구 사용, 인지적 부담 전가, 비판적 사고 능력을 측정한 한 연구에서, 연구자들은 잦은 AI 도구 사용과 비판적 사고 능력 사이에 유의미한 음의 상관관계 (significant negative correlation)가 있음을 발견했으며, 이는 증가된 인지적 부담 전가에 의해 매개 (mediated)되었습니다.45
  • AI에 대한 의존도가 높다고 보고한 참가자들은 독립적인 문제 해결 및 분석적 추론 (analytic reasoning)에 대한 참여가 감소한 것으로 나타났는데, 이는 개인의 인지적 노력 (personal cognitive effort)보다는 AI가 생성한 해결책으로 전환되었음을 시사합니다.
  • 동일한 연구에 따르면, 젊은 참가자들이 나이 든 참가자들보다 AI 도구에 대한 의존도 (dependence)가 더 높고 비판적 사고 점수가 더 낮았으며,45 이는 AI의 과용 (overuse)이 비판적 사고 능력 개발의 실패를 초래할 수 있음을 시사합니다.
  • 이러한 우려는 한 무작위 시험 (randomized trial)에서도 반복되는데, 비판적 검토 (critical scrutiny) 없이 AI 결과물을 맹목적으로 채택한 (blindly adopted) 사용자들은 복잡한 분석 기술을 요구하는 작업에서 AI를 사용하지 않았을 때보다 AI를 사용했을 때 더 저조한 성과를 보였으며,5 이러한 효과는 전반적인 수행 능력이 낮은 사용자들 사이에서 더욱 두드러졌습니다.
  • 저자들은 이 결과를 사용자가 자신의 판단을 우회 (bypassing their own judgment)하고 시스템의 결과물에 묵인 (acquiescing)하는 "AI와의 비관여적 상호작용 (unengaged interaction with AI)" 탓으로 돌렸습니다.

 

그림 2. 적응적 실천의 개발과 AI의 영향.

 

오숙련 (Mis-Skilling)

 

오숙련 (Mis-skilling)은 학습자가 부정확하거나 편향된 AI 모델에 특정 추론 작업을 맹목적으로 맡길 (blindly entrust) 때 발생할 수 있습니다.9,33 예를 들어, 노인 환자의 폐렴 가능성을 과대평가하거나 체질량 지수가 높은 환자의 심부전 가능성을 과대평가하는 등 체계적인 편향 (systematic biases)을 가진 AI 생성 진단 예측을 본 임상의는 이러한 부정확한 예측을 채택할 가능성이 더 높았습니다.46 더욱이, AI 지원은 기본 수행 능력이 낮은 (low baseline performance) 임상의에게 불균형적으로 해를 끼쳤습니다.47,48

  • 실제로 AI가 임상의보다 뛰어난 성과를 보였을 때, (인간과 AI의) 조합은 AI 단독보다 더 나쁜 성과를 보였습니다. AI 모델의 설명 (AI model explanations)은 이러한 오류를 완화 (mitigate)하는 데 실패했으며,46,47 이는 임상의가 AI 편향을 인식하고 수정할 수 없었고 오숙련이 더욱 강화될 수 있음을 시사합니다. AI의 권고가 올바른 경우에도 이를 무시하는 것은 AI에 대한 과소 의존 (underreliance)과 효과적인 AI 지원 기회의 상실을 의미합니다.
  • 반대로, 임상의가 AI보다 뛰어난 성과를 보였을 때, 인간과 AI 추론의 조합은 성과를 향상시켰으며, 이는 높은 기본 수행 능력이 효과적이고 안전한 AI 지원을 촉진함을 시사합니다.47

 

AI 상호작용 중의 교육 전략(Educational Strategies during AI Interactions)

 

이러한 위험을 인식하고, 교육 프로그램과 기관들은 의학교육에서 AI 사용 원칙을 수립했으며15 보건 의료에서의 AI 사용을 위한 역량 (competencies)과 커리큘럼을 정의하기 시작했습니다.19,49,50 그러나 교육자들은 즉각적인 (in-the-moment) AI 상호작용 중에 적응적 실천 (adaptive practice)의 발전을 촉진해야 하는 도전에 여전히 직면해 있습니다. 여기에서 우리는 효과적인 임상 기술과 AI 참여의 동시 발전을 위해 교육자가 비판적 사고 (critical thinking)를 시범 보이고 비계 (scaffold)하는 데 사용할 수 있는 학습자-AI 상호작용에 대한 단계적 접근 방식 (stepwise approach)을 제안합니다. 위에서 언급했듯이, 강력한 기초 지식과 기술 (strong foundational knowledge and skills)을 증진하는 것은 AI 사용의 이점을 극대화 (maximizes the benefits)하고 위험을 완화 (mitigates the risk)하며, 우리는 이것이 효과적이고 안전한 AI 상호작용을 위한 모든 프레임워크에서 명시된 목표 (stated goal)가 되어야 한다고 믿습니다. AI 상호작용의 급증 (surge)은 AI 및 임상 문해력 (clinical literacy)을 높이기 위한 교육적 기회로 재구성되어야 (framed as) 합니다.51

 

AI 상호작용의 정의(Defining AI Interactions)

 

"인공 지능"이라는 용어는 학문과 맥락에 따라 다양한 정의를 포함하며 (encompasses), 이는 기술적 (technical), 역량 기반 (capability-based), 관계적 (relational) 정의로 그룹화될 수 있습니다 (NEJM.org에서 본 논문 전문과 함께 제공되는 보충 부록 [Supplementary Appendix]의 표 S1 참조). AI에 대한 이 세 가지 관점 중에서, 레지던트-지도교수 비네트(그림 1)에서 설명된 AI의 관계적 정의 (relational definition)는 의학교육 맥락에서 특히 유용합니다. 이 정의는 AI의 기술적 구성 (technical composition)이나 역량보다는 추론과 실천에 미치는 영향 (effects on reasoning and practice)에 기반합니다.52 AI 상호작용은 "특정한 상호작용의 맥락에서, 컴퓨터 산물 (computational artefact)이 최적의 행동 방침을 알리기 위한 판단 (judgement)을 제공하고... 이 판단을 추적할 수 없을 (cannot be traced) 때"로 정의되며, 이는 사용자가 AI 결과물을 신뢰하기 위해 '맹목적 신뢰 (leap of faith)'를 고려하도록 유도합니다.53 이러한 '맹목적 신뢰'는 어린이가 처음 계산기를 사용할 때나, 진료실에서의 AI의 경우, 의대생이 감별 진단을 위해 생성형 AI에 프롬프트를 입력할 때 흔히 발생합니다. AI의 관계적 정의는 AI가 어떻게 작업을 수행하는지에 대한 기술적 세부 사항과는 무관합니다 (independent of). 따라서 이 정의는 AI가 1940년대의 방 크기의 컴퓨터이든 미래에서 온 시간 여행 로봇이든 비네트에 적용됩니다. 여기서 우리의 요점은 AI 상호작용에 내재된 '맹목적 신뢰'가 AI 생성 결과물은 검증 (verification) 없이는 완전히 신뢰할 수 없음54을 인식하게 하며, 이는 잠시 멈추고 (pause) AI 도구와 그 결과물의 신뢰성 (trustworthiness)을 비판적으로 평가 (critically assess)할 필요를 촉발한다는 것입니다.

 

 

Technical (기술적)

AI 시스템은 기반이 되는 계산 프레임워크(computational frameworks)를 기준으로 정의됩니다.
  • 의사 결정 트리(decision trees) 및 회귀(regression)와 같이 미리 정의된 알고리즘을 사용하는 규칙 기반 기호(Rule-based symbolic) 시스템 – 때때로 "구식 AI(good old-fashioned AI)"라고도 불립니다.
  • 서술(narratives)이나 이미지와 같은 복잡한 데이터로부터 예측을 해석하고 수행하기 위해 신경망(neural networks)을 사용하는 딥 러닝(Deep learning) 기술
  • (텍스트 및 이미지와 같은) 새로운 결과물을 생성할 수 있는 대규모 언어 모델(LLMs) 및 확산 모델(diffusion models)과 같은 생성형 모델(Generative models)
  • 혼합 모델(Mixed models)은 여러 기술과 에이전트를 결합합니다.

Capability-based (역량 기반)

AI 시스템은 일반적으로 인간의 지능을 필요로 하는 작업을 수행하는 능력을 기준으로 정의됩니다.
  • 지식 검색(Knowledge retrieval): 검색 엔진, 문헌 데이터베이스, 검색 증강 생성(RAG)
  • 분류기 및 예측기(Classifiers and predictors): 임상 의사결정 지원(CDS) 도구, 종단 평가 예측(longitudinal assessment prediction), 입학 모델
  • 요약기(Summarizer): 앰비언트 스크라이브(ambient scribes), 학습자 성과 대시보드, 추천서, 서술형 성적(narrative grades)
  • 가상 에이전트(Virtual agent)*: 가상 환자, AI 제공자, AI 튜터
  • 머신 비전 및 공간 추론(Machine vision and spatial reasoning): 수술 시뮬레이터, 시각적 진단 지원

Relational (관계적)

AI 시스템은 인간의 추론(reasoning)과 실천(practice)에 미치는 영향을 기준으로 정의됩니다.
  • 튜링 테스트(Turing test): 상호작용이 두 인간 사이에서 일어난 것인지, 혹은 인간과 계산 시스템(computational system) 사이에서 일어난 것인지 판단하는 것이 불가능할 때 AI는 "달성되었다"고 봅니다.
  • AI 상호작용(AI interaction): 인간이 자신의 추론에 영향을 미치지만 그 과정을 추적할 수 없는(cannot be traced) 판단을 계산 시스템으로부터 받는 순간. 이는 시스템을 신뢰하기 위한 '맹목적 신뢰(a leap of faith)'를 유발합니다.

핵심 질문 (The Core Question)

  • 튜링 테스트 (Turing Test): "저 너머의 존재는 사람인가, 기계인가?"
    • 이것은 AI의 성능을 판별하기 위한 '탐지(Detection)'의 질문입니다.
    • AI가 이 테스트를 통과했다는 것은 "AI가 인간과 구별 불가능할 정도로 지능적이 되었다"는 철학적/기술적 선언입니다.
  • AI 상호작용 (AI Interaction): "나는 이 기계의 답을 (근거도 모르는데) 믿어야 하는가?"
    • 이것은 AI를 사용하는 과정에서 발생하는 '신뢰(Trust)'의 질문입니다.
    • 이 상호작용이 발생했다는 것은 "사용자가 '비판적 사고'를 발휘해야 할 '맹목적 신뢰(Leap of Faith)'의 순간에 직면했다"는 실용적/교육적 신호입니다.

 


네, 이 '관계적 정의'는 AI를 기술이나 성능이 아니라 '그것이 인간과 맺는 관계', 특히 '인간의 생각에 미치는 영향'을 기준으로 바라보는 방식이라 조금 낯설 수 있습니다.

더 쉽게 풀어서 설명해 드릴게요.

핵심은 "블랙박스(Black Box)의 대답을 믿을 것인가?" 하는 순간입니다.

 

우리가 AI, 특히 ChatGPT 같은 LLM에게 무언가를 물어보면 답이 나옵니다. 하지만 그 AI가 정확히 어떤 과정을 거쳐서 그 답을 만들었는지 우리는 알 수 없습니다. 그 내부 과정이 복잡한 '블랙박스'처럼 숨겨져 있기 때문이죠.

AI 상호작용 (AI Interaction)이란 바로 이 순간을 말합니다.

  1. AI가 판단(답)을 제시합니다. (예: "이 환자는 폐렴일 가능성이 높습니다.")
  2. 나는 그 답이 나온 과정을 100% 이해하거나 추적할 수 없습니다. (블랙박스)
  3. 하지만 그 답은 나의 다음 생각이나 행동에 영향을 줍니다.
  4. 그래서 나는 이 '블랙박스'의 답을 그냥 '믿고 사용할지' 아니면 '무시할지' 선택해야 합니다.

이때 우리가 그 답을 "에라 모르겠다, 그냥 믿고 쓰자!"라고 결정하는 것이 바로 '맹목적 신뢰(a leap of faith)'입니다.


🚗 가장 쉬운 예: 내비게이션 (GPS)

  • 상황: 내비게이션(AI)이 "500m 앞에서 좌회전하세요."라고 말합니다.
  • 블랙박스: 우리는 내비게이션이 우회전이 아니라 좌회전을 하라고 했는지 그 복잡한 실시간 교통 정보, 알고리즘을 전부 알지 못합니다.
  • AI 상호작용: 지금 이 순간, 나는 내비게이션의 '추적할 수 없는 판단'을 받았습니다.
  • 맹목적 신뢰: "내비가 시키는 대로 가보자"라고 결정하고 핸들을 돌리는 것.

🩺 논문의 예: 의사와 AI

  • 상황: 의사가 AI에게 환자 증상을 입력하자 AI가 "감별 진단 목록 1순위는 A입니다."라고 답합니다.
  • 블랙박스: 의사는 AI가 B나 C가 아닌 A를 1순위로 꼽았는지, 그 수백만 개의 파라미터를 거친 추론 과정을 알 수 없습니다.
  • AI 상호작용: 의사는 AI의 '추적할 수 없는 판단'을 받았습니다.
  • 맹목적 신뢰: "AI의 추천을 믿고 A 질환에 대한 검사부터 해보자"라고 결정하는 것.

결론적으로,

'관계적 정의'는 AI의 기술(Technical)이나 성능(Capability)이 중요한 게 아닙니다. AI가 "인간이 이해할 수 없는 답(블랙박스)"을 제시함으로써, "인간이 그것을 '신뢰'할지 말지 고민하게 만드는' 관계 그 자체가 중요하다고 보는 것입니다.

 

이 논문에서 이 정의를 중요하게 다루는 이유는, 교육자들이 바로 이 '맹목적 신뢰(leap of faith)'가 일어나는 순간을 포착해서, 학습자(학생, 레지던트)가 '비판적 사고'를 하도록 개입해야 하기 때문입니다. "AI가 그렇게 말했으니 맞겠지"가 아니라, "AI가 왜 그렇게 말했을까? 정말 맞을까? 내가 검증(verify)해야겠다"라고 생각하도록 가르쳐야 한다는 것이죠.


nejmra2503232_appendix.pdf
0.20MB

 

교육적 순간 만들기(Creating an Educational Moment)

 

교육자가 AI 상호작용을 인식하면, 교육적 순간 (educational moment)을 만들고 비판적 사고를 함양 (cultivate critical thinking)할 기회가 생깁니다.14 비판적 사고 강화에 있어 소크라테스식 접근 (Socratic approach)의 효과를 활용하는56 기존 모델55을 기반으로, DEFT (진단, 증거, 피드백, 교육; diagnosis, evidence, feedback, and teaching) 프레임워크는 임상 추론, 증거 기반 지원 (evidentiary support), 표적화된 피드백 (targeted feedback)에 대한 구조화된 토론 (structured discussions)을 강조합니다.57 우리는 AI의 도움을 받는 학습자가 임상 추론에 참여할 때 비판적 사고와 적응적 실천의 발전을 촉진하기 위해 고안된 수정된 접근 방식인 "DEFT-AI"를 제안합니다 (그림 3 및 표 S2). DEFT는 AI 상호작용의 맥락 밖에서 개발되었지만, 교육 이론에 강력한 뿌리 (strong roots)를 두고 있으며,55,57 그 상식적인 접근 방식 (common-sense approach)은 모든 학습자-AI 상호작용을 다루는 (negotiating) 일선 교육자 (frontline educators)들에게 공감 (resonate)을 얻을 것입니다. 아래에서는 각 DEFT 구성 요소가 AI 참여 권장 사항으로 이어지는 과정을 검토합니다.

 

그림 3. AI 상호작용 중 비판적 사고를 증진하기 위한 DEFT-AI의 사용.

 

진단, 토론, 그리고 담론 (Diagnosis, Discussion, and Discourse)

 

교육자는 학습자의 임상 추론 과정 (clinical reasoning process)과 AI 사용을 탐색 (probing)하는 것으로 시작합니다.

  • 이 단계는 데이터 수집 (data acquisition)귀납적 추론 (inductive reasoning)을 반영하는 학습자의 임상 문제 종합 (synthesis of the clinical problem)에 대해 묻고,
  • 학습자의 연역적 추론 (deductive reasoning)지식 기반 (fund of knowledge)을 반영하는 감별 진단에 대해 묻는 것을 포함합니다.
  • 교육자는 또한 학습자가 AI와 어떻게 상호작용했는지 묻습니다.
    • 구체적으로, 어떤 AI 도구와 어떤 프롬프트 (prompts)가 사용되었는지,
    • AI 생성 결과물의 타당성 (validity)을 탐색하기 위해 후속 프롬프트 (follow-up prompts)가 구조화되었는지 여부와 그 방식,
    • 그리고 그 결과물이 학습자의 진단적 접근법을 영향을 미쳤는지 (influenced), 대체했는지 (replaced), 또는 증강했는지 (augmented) 묻습니다.

 

증거 (Evidence)

 

이 단계에서 교육자는 학습자의 의학 및 AI 지식, 그리고 그 지식의 적용을 평가하기 위해 지지 증거 (supporting evidence)와 반대 증거 (opposing evidence)의 사용에 대해 탐색합니다. 이 과정은

  • 진단 가설 (diagnostic hypotheses)을 생성하기 위한 진단 프레임워크 (diagnostic frameworks) 사용,
  • 이러한 가설의 확인 (confirmation) 또는 반박 (refutation), 그리고
  • 적응적 전문성 (adaptive expertise)의 특징인 대안 가설 (alternative hypotheses)을 생성하기 위해 지식을 활용 (leverage)하는 능력을 평가하는 것을 포함합니다.

교육자는 또한 학습자에게 지지 증거로 추론을 정당화 (justify the reasoning)하도록 요청하고, 현재 진행 중인 병태생리 (pathobiology)에 대한 학습자의 이해, 관련 임상 지침 및 문헌의 적용, 근거 중심 의학 (evidence-based medicine) 프레임워크의 사용을 탐색할 수 있습니다. 동시에, 교육자는 학습자가 AI 문해력 (AI literacy)에 대해 자가 평가 (self-assessment)에 참여하도록 할 수 있습니다. 첫째, 질문은 

  • 기술적 이해
    • ("AI가 어떻게 결론에 도달했다고 생각하는가?"),
  • 비판적 평가 (critical appraisal)
    • ("이 AI의 약점은 무엇인가? 이 AI 애플리케이션의 역량과 한계를 평가할 수 있는가?"), 그리고
  • 실용적 적용
    • ("당신이 사용한 AI는 어떤 문제를 해결하도록 설계되었는가? 이 AI가 실무를 지원하는가, 아니면 방해하는가? 효과적인 프롬프트 전략 (prompting strategies)은 무엇인가?")58,59에 초점을 맞춥니다.
  • 다음으로, 교육자는 학습자에게 AI 도구 사용을 뒷받침하는 증거를 식별하도록 유도해야 합니다:
    • "어떤 동료 심사 연구 (peer-reviewed research)가 임상 추론 지원을 위한 이 도구의 사용을 뒷받침하는가?"
  • 일반적인 AI 문해력 척도 (AI literacy scales)를 사용하여 학습자가 선택한 AI 애플리케이션의 작동 방식을 어느 정도 이해하고 있는지 확인할 수 있습니다.60
  • 교육자는 학습자가 AI와 독립적으로 새로운 문제를 탐색하는 능력과 AI에 대한 과도한 의존 (overreliance) 가능성을 평가하기 위해, AI 없이 수정된 사례 발표를 통해 소리 내어 추론 (reason out loud)하도록 요청할 수 있습니다.

 

피드백 (Feedback)

 

안내된 자기 성찰 (Guided self-reflection)이 이 단계의 중심입니다. 교육자는 학습자에게 자가 평가를 바탕으로 당면한 사례 및 학습자의 AI 사용과 관련된 잠재적인 성장 기회 (potential growth opportunities)에 대해 성찰 (reflect)하도록 요청합니다. 이러한 기회에는

  • 놓친 진단적 고려 사항 (missed diagnostic considerations),
  • 사례와 관련된 의학 지식의 격차 (gaps in medical knowledge),61
  • AI 기술 및 그 응용에 대한 문해력 (literacy)이 포함될 수 있습니다.

 

교육 (Teaching)

 

교육자는 학습자의 자기 성찰을 바탕으로,

  • 특정 활동에서의 학습자의 추론 성과 (reasoning performance)와 특정 AI 도구 사용에 대한 피드백을 제공하고,
  • 학습자의 요구에 맞춘 (tailored) 일반적인 교육 원칙 (general teaching principles)을 제공할 수 있습니다. 이는
    • 임상 추론 과정의 강화 (reinforcing),
    • (증거의 비판적 평가를 포함한) 근거 중심 의학 원칙의 적용을 장려하는 것, 그리고
    • AI 문해력 (아래에서 논의됨)을 증진하는 것을 포함할 수 있습니다.

 

AI 참여 권고 (AI Engagement Recommendation)

 

교육자는 기초 기술 (foundational skills)과 AI 문해력을 동시에 증진하는 권고 (recommendations)로 마무리합니다. 드문 예외를 제외하고, 교육자는 AI를 사용한 지속적인 연습 (ongoing practice)을 장려해야 합니다. 보다 구체적으로, 교육자는

  • 학습자가 간접적이거나 간헐적인 직접 감독 (indirect or intermittent direct supervision) 하에 AI 도구를 조심스럽게 사용 (cautiously engage)할 수 있다거나, 또는
  • 학습자가 지속적인 자가 모니터링 (self-monitoring)과 교육을 병행하며 감독 없이 (without supervision) 안전하게 도구를 사용할 수 있다고 결론 내릴 수 있습니다.

이 에피소드가 전개됨에 따라, 두 가지 뚜렷한 인간-AI 협업 행동 (human–AI collaboration behaviors) 중 하나가 나타날 가능성이 높습니다. 이러한 행동은 켄타우로스 (centaur)와 사이보그 (cyborg)5로 알려져 있습니다 (그림 4).

  • 켄타우로스 사용자자신과 AI 사이에 전략적으로 작업을 분할 (strategically divide tasks)합니다.
    • 그들은 각 개체의 강점과 역량에 따라 책임을 할당하는데, 이는 신화 속의 반인반마 (half-human, half-horse) 생물체의 이름에서 유래했습니다. AI는 아이디어 구상 (ideation), 요약 (summarization), 또는 초안 작성 (drafting)에 사용될 수 있지만, 켄타우로스 사용자는 진단과 의사 결정을 위해 자신의 임상적 판단 (clinical judgment)에 의존합니다. 반면에,
  • 사이보그 사용자는 작업의 모든 단계에서 자신의 작업을 AI와 얽히게 (intertwine) 합니다.
    • 이 이름은 인간과 기계의 하이브리드인 공상 과학 소설 속 사이보그에서 유래했습니다. 사이보그 사용자는 반복적으로 프롬프트를 입력하고 (iteratively prompting), 수정하며 (correcting), 정당성을 요구 (asking for justifications)한 다음, AI와 공동으로 (jointly with AI) 결과물을 정제 (refining)함으로써 AI와 함께 평가 계획을 작성합니다. 이러한 접근 방식은 AI 능력 범위 내의 잘 정의되거나 (well-defined) 위험도가 낮은 (low-risk) 작업에 대해 효율적이고 강력할 수 있지만, 자동화 편향 (automation bias)으로 인한 미숙련, 탈숙련, 또는 오숙련의 위험을 수반합니다.

사이보그와 켄타우로스 행동은 상호 배타적이지 (mutually exclusive) 않습니다. 사용자는 작업과 위험에 따라 이 두 가지 행동 사이를 전환해야 (shift between them) 하며, 이는 임상 추론 기술의 발전을 보존하면서 효율성과 혁신을 극대화할 수 있는 적응적 실천의 한 예입니다 (그림 4).

 

그림 4. AI의 과제 기반 적응적 사용.

 

교육자는 사이보그-켄타우로스 프레임워크를 사용하여 학습자가 자신의 상호작용 스타일을 성찰하도록 도울 수 있습니다. 예를 들어,

  • 교육자는 고위험 (high-risk), 불확실 (uncertain), 또는 진단적 (diagnostic) 작업, 특히 AI 도구의 검증된 사용 범위를 벗어나는 작업(예: 복잡한 의사 결정을 위해 ChatGPT와 같은 범용 [general-purpose] AI 챗봇 사용)에 대해서는 켄타우로스 접근 방식 (centaur approach)을 채택하도록 권장할 수 있습니다. 이러한 환경에서, 교육자는 학습자가 AI를 사용하되 그 결과물을 주의 깊게 검증 (carefully validate its output)하도록 격려할 수 있습니다. 반대로,
  • 사이보그 전략 (cyborg strategies)AI 도구가 신뢰할 수 있는 성능을 입증한 저위험 (low-risk), 잘 정의된 (well-defined), 또는 창의적인 (creative) 작업(예: 일반적인 의사소통 초안 또는 초기 아이디어 구상)에 적합할 수 있습니다. 사이보그 모드에서 학습자는 성찰적 감독 (reflective oversight)을 유지하고 필요에 따라 교육자에게 자신의 접근 방식을 정당화할 수 있다면, AI와 반복적으로 해결책을 공동 구축 (iteratively coconstruct solutions)할 수 있습니다.
  • 보편적으로, 교육자는 학습자에게 질문 없이 (without interrogation) AI 결과물을 수동적으로 채택 (passively adopting)하는 것을 명시적으로 경고 (explicitly caution)해야 합니다. 대신, 적응적 참여 (adaptive engagement)가 권장되어야 합니다. 즉,
    • 올바른 작업을 위해 올바른 상호작용 스타일을 선택하고, AI 제안에 대해 비판적으로 생각하며, 검증된 결과물을 얻기 위해 프롬프트를 정제 (refining prompts)하고, 학습자의 역량이 발전하고 맥락이 변화함에 따라 AI와의 임상적 상호작용을 수정하는 것입니다.
    • 이러한 상호작용 스타일을 명명하고 (naming) 토론함으로써, 교육자는 학습자가 기술 발전 및 임상적 복잡성과 함께 성장할 수 있는 AI를 활용한 적응적 실천을 함양하도록 돕습니다.

 

AI 문해력 증진(Promoting AI Literacy)

 

AI 문해력 (AI literacy)은 컴퓨터 시스템의 판단을 재현 (retrace)할 수 없고 인지적 멈춤 (cognitive pause)이 필요한 순간으로서 AI 상호작용을 "인지 (call out)"하는 능력에서 시작됩니다.62 DEFT-AI는 비판적 사고를 통해 적응적 실천을 촉진하고, 작업에 따라 켄타우로스, 사이보그, AI-독립적 행동 간의 원활한 전환 (seamless shifting)을 용이하게 합니다. 교육자가 집중해야 할 AI 문해력의 두 가지 핵심 영역은 AI의 비판적 평가에 대한 구조화된 접근과 정확성과 관련성을 극대화하기 위한 프롬프트의 효과적인 사용 ("프롬프트 엔지니어링", prompt engineering)입니다.

 

AI의 비판적 평가 (critical appraisal)는 신뢰성에 대한 근거 기반 판단 (evidence-based judgment)을 내리기 위해 도구 자체와 그 결과물에 대한 구조화된 평가 (structured evaluation)를 필요로 합니다. 근거 중심 의학 (evidence-based medicine)의 기본 원칙에 뿌리를 둔 근거 기반 실천 (Evidence-based practice)은 새로운 증거를 임상 실무에 도입하는 구조화된 과정을 제공합니다.63 Sackett의 5단계 모델질문하기 (asking), 최상의 증거 획득하기 (acquiring), 증거 평가하기 (appraising), 실무에 적용하기 (applying), 결과 평가하기 (assessing) — 은 근거 기반 실천을 위한 포괄적이고 구조화된 프레임워크를 제공합니다.64 이러한 과정을 통합하면 AI 도구와 그 결과물에 대한 별도의 탐구 (separate inquiries)를 구조화함으로써 특정 작업에서 AI의 신뢰성 (trustworthiness)을 판단하는 데 도움이 될 수 있습니다.

 

AI 도구에 대한 근거 기반 평가(Evidence-Based Evaluation of the AI Tool)

 

AI 도구 자체의 신뢰성 (trustworthiness)을 평가하기 위해, 첫 번째 단계는 증거 검색을 시작하는 질문 (question)을 결정하는 것입니다. 비네트의 경우, 교육자는 다음과 같은 질문을 할 수 있습니다:

  • "성인 외래 환자 (adult ambulatory care patients)의 감별 진단 (differential diagnosis)에 대한 이 LLM의 정확도 (accuracy)는 얼마인가?"

두 번째와 세 번째 단계는 AI의 신뢰성에 대한 증거를 획득 (acquiring)하고 평가 (appraising)하는 것을 포함하며, 이는 동료 심사 연구 (peer-reviewed research), AI 스코어카드 (AI scorecards)65 및 관련 리더보드 (leaderboards) (AI 도구의 이름과 순위를 표시하는 스코어보드),66,66 그리고 보건 시스템이나 정부 기관(예: 식품의약국, Food and Drug Administration)의 규제 정보 (regulatory information) 등입니다. 스코어카드, 리더보드, 규제 프레임워크가 AI 도구 평가에 도움이 되지만, 실시간 판단 (real-time judgment)에는 불충분하며 (insufficient) 현재 교육자에게는 유용성이 제한적입니다. AI 도구 자체에 대한 포괄적인 평가 (comprehensive assessment)는 대부분의 교육자와 학습자의 범위를 벗어난다 (beyond the scope)고 가정하는 것이 타당해 보입니다.

 

AI 결과물에 대한 근거 기반 평가(Evidence-Based Evaluation of AI Output)

 

AI 도구를 평가하는 대신, 임상의는 자신의 임상 기술, 환자 선호도 (patient preferences), 연구 증거를 통합하여 AI 결과물 (AI output)을 평가할 준비가 되어 있습니다.64 임상의는 AI가 답변하는 데 사용된 임상 질문에 대해 독립적으로 증거를 획득하고 평가 (independently acquire and appraise evidence)하며 (예: 확립된 가이드라인, 출판된 문헌, 또는 전문가 컨설턴트의 의견), 자신들의 결론을 AI 결과물과 비교합니다. AI와 인간 결과물 간의 신뢰할 수 있는 일치 (reliable concordance)는 인간의 경계 (vigilance) 필요성을 줄일 수는 있지만 결코 제거할 수는 없으며 (never remove), AI 도구 사용의 신뢰성을 증진시킵니다. 학습자는 환자에 대한 임상 평가와 관련하여 AI 결과물을 자신의 임상 추론 결과물과 신뢰성 있게 비교할 수 있도록 이러한 독립적인 기술 (independent skills)을 개발해야 합니다.

 

LLM에 프롬프트 입력하기(Prompting LLMs)

 

효과적인 프롬프트 입력 (Effective prompting)은 LLM 기반 의료 애플리케이션의 유용성을 극대화하고 이에 대한 의미 있는 평가를 수행하는 데 중요한 기술 (critical skill)입니다.68 환자에 대한 컨설턴트의 의견 요청과 마찬가지로, LLM 프롬프트는 응답의 관련성 (relevance)과 품질 (quality)을 결정합니다. 인간의 자문 (human consultations)에서와 마찬가지로, 모호하거나 (vague) 잘못 구성된 (poorly framed) 질문은 혼란이나 잘못된 방향 (misdirection)으로 이어질 수 있습니다. 결과물은 입력만큼만 좋습니다 (The output is only as good as the input).

 

좋은 프롬프트의 주요 특징은 구체성 (specificity)과 맥락 제공 (context provision)을 포함합니다.

  • 일반적인 질문과 비교할 때, 잘 정의된 질문 (well-defined query)이 더 정확한 응답을 산출합니다 (예: "심장 질환에 대해 말해줘" 대신 "관상동맥 질환의 가장 흔한 위험 요인은 무엇인가?").
  • 맥락 제공은 배경 정보를 통합함으로써 LLM이 더 관련성 높은 (relevant) 결과물을 생성하도록 돕습니다 (예: "저는 흡입기 치료에 반응하지 않는 천식 환자를 진료실에서 돌보고 있는 폐 전문의입니다. 치료 반응 부족을 설명할 수 있는 여러 가설을 나열해 주십시오.").
  • LLM을 유도하는 (lead) 편향된 프롬프트 (Biased prompts) (예: "진단명이 무엇인가요? 제 생각엔 천식 같은데요.")는 "아첨하는 (sycophantic)" 응답69과 인간과 유사한 인지 편향 (cognitive biases)37을 조장할 수 있습니다. 따라서 LLM과의 대화 중에 편향되지 않은 프롬프트 (unbiased prompts)로 연습하고 반복 (practice and iteration)하는 것이 필수적입니다.54

 

  • 초기 프롬프트의 일부로 예시 사례 (example cases)를 제공하면 정확도가 향상됩니다.
  • 또한, AI 모델에게 "소리 내어 생각하도록 (think out loud)" (즉, 연쇄적 사고 프롬프팅 [chain-of-thought prompting]) 요청하는 것은 AI의 추론 담론 (reasoning discourse)을 드러내어, 그 결과물의 정확도를 향상시키고 (enhances the accuracy)70,71 추론에 대한 평가 (assessment)를 가능하게 합니다.72
    • 예를 들어, "우선순위가 정해진 감별 진단 목록을 생성해 줘"라는 프롬프트 뒤에 "너의 추론 과정을 설명해 줘"라고 이어붙이는 것입니다.
    • 최신 LLM 모델은 인터페이스에 연쇄적 사고 추론이 내장 (embedded)되어 있어,71 결과물에 대한 비판적 평가를 용이하게 합니다.
  • AI 결과물이 부정확해 보이거나 추가적인 성찰을 촉발할 때, 모델에게 설명을 요청하거나 응답을 수정하도록 프롬프트를 입력하는 등 후속 대화 (follow-up conversation)에 참여시키는 것은 수동적 사용 (passive use)을 능동적 학습 (active learning)으로 전환시키고, 비판적 사고를 강화하며, AI의 교육적 가치를 극대화할 수 있습니다.

 

 

검증하고 신뢰하라 (Verify and Trust)

 

AI 도구의 기술적 발전에도 불구하고, 그 사용은 여전히 신중한 고려와 함께 '맹목적 신뢰 (leaps of faith)'를 요구합니다. 검증의 필요성 (need for verification)은 AI 상호작용의 핵심에 있습니다. 의학 학습자들이 이러한 도구들을 환자 평가의 핵심 부분으로 점점 더 많이 사용함에 따라, 의학교육자들은 AI 상호작용이 여기 머무를 현실 (here to stay)임을 직시해야 합니다. 비판적 사고 (Critical thinking)가 AI에 대한 과도한 의존에서 발생할 수 있는 탈숙련, 미숙련, 오숙련에 대한 방벽 (bulwark)73이지만, 비계 (scaffold)로서 비판적 사고를 증진할 기회는 적응적 실천 기술 (adaptive practice skills)의 발전을 가속화하고 학습자와 교육자 모두의 AI 문해력을 동시에 향상시킬 수 있습니다. DEFT-AI는 학습자-AI 상호작용 중에 비판적 사고를 증진하기 위한 구조화되고 상식적인 접근 방식 (structured and common-sense approach)을 제공하며, AI 사용 과정의 일부로서 AI 결과물의 타당성 (validity)을 확립하는 것의 중요성을 강조합니다. 검증이 AI 사용의 핵심 (verification is key)이라는 확신을 수련생들에게 심어줄 (inculcate) 책임 (onus)은 교육자에게 있습니다. 이를 효과적으로 수행하려면 학습자와 교육자 사이에서 AI 역량을 증진하기 위해 AI 개발자, 보건 의료 시스템, 교육 프로그램 간의 긴밀한 협력을 통한 커리큘럼 재설계 (curricular redesign)가 필요할 것입니다. 또한 우리는 AI 상호작용이 발생하는 교육 환경에서 학습자-AI 상호작용에 대한 체계적인 평가 (systematic assessment)를 포함해야 합니다.74 거버넌스 구조 (governance structures), 엄격한 검증 프레임워크 (rigorous validation frameworks), 지속적인 모니터링 (ongoing monitoring) 없이는, AI 기반 오류와 편향의 위험이 AI 기술의 이점을 상회 (outweigh)할 수 있으며, 따라서 의학교육을 개선하기보다는 위태롭게 (jeopardize) 할 수 있습니다. 궁극적으로, "검증하고 신뢰하는 (verify and trust)" 패러다임을 육성하는 것은 AI가 인간 전문성의 유익한 증강 (beneficial augmentation)이 되도록 보장하는 데 매우 중요합니다.

 

 

🖼️ 그림 1. 레전드 번역

그림 1. 학습자의 인공지능(AI) 사용을 목격하는 교육자.

임상 지도교수(clinical preceptor) 역할을 하는 교육자가 감별 진단(differential diagnosis)을 돕기 위해 대규모 언어 모델 챗봇을 사용하고 있는 레지던트를 관찰합니다. 교육자는 완전히 신뢰할 수 없을지도 모르는(not be fully reliable) AI 도구를 신뢰하는 것의 내재적인 어려움(inherent challenge)을 인식합니다. 이러한 AI 상호작용의 순간(moment of AI interaction)은 교육자로 하여금 학습자와 환자 모두에게 고위험 시나리오(high-risk scenario)가 될 수 있는 상황에 개입(intervene)하도록 촉발합니다. 개입함으로써, 교육자는 비판적 사고(critical thinking)를 비계(scaffold)로 삼고 임상 추론(clinical reasoning) 및 책임감 있는 AI 사용에 더 깊이 관여(deeper engagement)하도록 촉진할 기회를 만듭니다. 이는 DEFT-AI(진단[diagnosis], 증거[evidence], 피드백[feedback], 교육[teaching] 및 AI 사용 권장[recommendation for AI use])에 요약된 접근 방식입니다.


📋 그림 설명

이 그림은 논문에서 제시된 가상적이면서도 현실적인 임상 시나리오를 시각적으로 보여줍니다.

  1. 상황: 진료실에서 한 레지던트(학습자)가 가슴 통증을 호소하는 듯한 환자(Mr. C)를 진료한 후, 스마트폰을 보며 생각에 잠겨 있습니다.
  2. 학습자의 생각: 말풍선에는 "MR C의 증상을 유발하는 것이 무엇일까? ChatGPT에게 물어봐야겠다..."라고 생각하는 내용이 나타나, 학습자가 감별 진단을 위해 생성형 AI를 사용하려 함을 보여줍니다.
  3. 교육자의 관찰: 방 건너편에서 한 교육자(임상 지도교수)가 팔짱을 낀 채 이 장면을 목격하고 있습니다.
  4. 교육자의 내적 독백 (고민): 교육자의 생각은 여러 가지 질문으로 가득 차 있습니다.
    • "레지던트가 아마도 휴대폰의 AI를 사용하고 있겠지. 이제 어떡하지? 레지던트가 AI에게 어떤 프롬프트를 제공했을까?"
    • "레지던트가 AI에게 질문을 던지고(questioning) 있는 걸까, 아니면 제안을 그대로 받아들이고(accepting) 있는 걸까?"
    • "이 AI에게 임상 추론을 맡겨도(entrusted) 될까? 어떻게 개입해야 할까?"
  5. 교육자의 결론 (행동 계획): 이러한 고민은 교육자가 취해야 할 행동을 보여주는 순서도로 이어집니다.
    • 인식: "나는 AI 상호작용(AI interaction)을 목격했다."
    • 필요성: "나는 임상 추론과 AI 사용에 있어 비판적 사고(critical thinking)를 증진해야 한다."
    • 해결책: 이를 위한 프레임워크로 DEFT-AI (토론[Discussion], 증거[Evidence], 피드백[Feedback], 교육[Teaching], AI 참여 권고[recommendation for AI engagement])를 제시합니다.

결론적으로 이 그림은, 학습자가 AI를 사용하는 순간을 교육자가 목격했을 때 느끼는 딜레마와, 이 순간을 비판적 사고AI 문해력을 가르치는 교육적 순간(educational moment)으로 전환하기 위해 DEFT-AI 프레임워크를 사용해야 함을 강조하고 있습니다.

 

 

🖼️ 그림 2. 레전드 번역

그림 2. 적응적 실천의 발달과 AI의 영향.

실천(practice)과 비판적 사고(critical thinking)를 통해, 학습자들은 정형화된, 자동적 실천(automatic practice)의 중단(break, 별표[star]로 표시)에 대응하여 혁신적인 적응적 실천(adaptive practice)으로 전환하는 능력을 개발합니다. 그들이 발전하고 임상 실무에 들어서면서, AI의 사용은 위험(risks)과 기회(opportunities)를 모두 도입합니다.

  • AI에 인지적 부담을 전가(Cognitive off-loading)하는 것은 AI에 대한 과도한 의존(overdependence)과 "탈숙련(deskilling)"으로 이어질 수 있으며,
  • 반면 AI에 대한 맹목적인 의존(blind reliance)은 AI 오류가 도전받지 않은 채(unchallenged) "오숙련(mis-skilling)"을 초래할 수 있습니다.
  • 너무 일찍 도입되면(If introduced too early), AI는 학습자가 필수 기술을 습득하는 것을 막을 수 있습니다("미숙련, never-skilling").
  • 반대로, AI의 현명한 사용(judicious use)은 비판적 사고의 필요성을 강조하고 효과적인 인간-AI 협업(human–AI collaboration)을 촉진함으로써 실천과 학습을 향상(enhance)시킬 수 있습니다.

📋 그림 설명

이 그래프는 시간이 지남(X축)에 따라 학습자의 실무 기술 수행 능력(Y축)이 어떻게 발달하는지, 그리고 생성형 AI의 도입이 이 과정에 어떤 영향을 미치는지 보여줍니다.

  1. 기본적인 학습 곡선 (왼쪽 녹색 선):
    • 학습자는 '초심자(Novice)' 수준에서 의학 교육을 시작합니다.
    • 시간이 지남에 따라 '상급자(Advanced)'를 거쳐 '역량 있음(Competent)' 수준에 도달합니다. 이 수준은 '독립적 실무를 위한 최소 허용 기술 숙련도(MINIMAL ACCEPTED SKILL PROFICIENCY FOR INDEPENDENT PRACTICE)'입니다.
    • 계속 발전하여 '능숙함(Proficient)' 수준에 이르면, 정형화된 '자동적 실천(Automatic practice)'을 수행합니다.
    • 어느 시점(분홍색 별표)에서 '정형화된 실무의 중단(BREAK IN ROUTINE PRACTICE)'이라는 새로운 도전에 직면합니다.
    • 이때 '비판적 사고(CRITICAL THINKING)'를 발휘하여 기존의 자동적 실천에서 벗어나 '적응적 실천(Adaptive practice)'으로 전환하며 '전문가(Expert)' 수준으로 나아갑니다.
  2. 생성형 AI의 도입 (수직 주황색 선):
    • 학습자의 발달 과정 중 '생성형 AI가 도입(Generative AI is introduced)'되는 시점을 나타냅니다. 이 그림은 AI가 학습자의 여러 발달 단계(초심자, 역량 있음, 능숙함)에서 도입될 수 있음을 보여줍니다.
  3. AI 도입 후의 다양한 경로 (오른쪽 곡선들):
    • AI가 도입된 이후, 학습자가 AI를 어떻게 활용하느냐에 따라 매우 다른 결과가 나타납니다.
    • 긍정적 경로 (AI 강화):
      • AI 강화 학습 (AI-enhanced learning): AI를 비판적으로 활용하여 '역량 있음(Competent)' 또는 '능숙함(Proficient)' 수준에서 학습을 가속화하고 발달을 지속합니다.
      • AI 강화 적응적 실천 (AI-enhanced adaptive practice): '능숙함(Proficient)' 수준의 학습자가 AI를 비판적 사고와 결합하여 '적응적 실천' 능력을 더욱 향상시키는 최상의 시나리오입니다.
    • 부정적 경로 (위험):
      • 미숙련 (Never-skilling): '초심자(Novice)' 또는 '상급자(Advanced)' 단계에서 AI가 너무 일찍 도입되어 학습자가 AI에 의존한 나머지, '독립적 실무를 위한 최소 역량'조차 스스로 개발하지 못하는 상태입니다.
      • 발달 정체 (Arrested development): '역량 있음(Competent)' 수준에서 AI에 부적절하게 의존하여 더 이상 기술이 발전하지 않고 정체되는 상태입니다.
      • 탈숙련 (Deskilling): 이미 '역량 있음' 또는 '능숙함' 수준의 기술을 습득했지만, AI에 과도하게 의존하여 이전에 가졌던 기술을 상실하고 수행 능력이 오히려 퇴보하는 현상입니다.
      • 오숙련 (Mis-skilling): AI가 생성한 부정확하거나 편향된 정보를 맹목적으로 수용하여 잘못된 지식이나 기술을 습득하고 강화하는 현상입니다.
    • 또 다른 경로 (놓친 기회):
      • AI를 채택하지 않음 (No adoption of AI): (가장 위의 점선) AI 기술을 아예 받아들이지 않는 경우로, 이는 'AI 강화 적응적 실천'이라는 잠재적 이점을 얻지 못하는 '놓친 기회(missed opportunity)'로 표시됩니다.

결론적으로, 이 그림은 AI가 학습자의 기술 발달에 양날의 검임을 시각적으로 강조합니다. 비판적 사고 없이 맹목적으로 의존하면 미숙련, 탈숙련, 오숙련 등의 심각한 위험을 초래할 수 있지만, 현명하게(judiciously) 비판적 사고와 결합하여 사용하면 학습을 가속화하고 '적응적 실천'을 강화하는 강력한 기회가 될 수 있음을 보여줍니다.

 

 

 

🖼️ 그림 3. 레전드 번역

(맞은편 페이지) 그림 3. AI 상호작용 중 비판적 사고를 증진하기 위한 DEFT-AI의 사용.

AI 상호작용을 인식한 후, 교육자는 구조화된 교육적 순간(structured educational moment)에 학습자를 참여시켜 상호작용에 대해 토론하고, 평가하며, 피드백을 제공하고, 임상 추론과 AI 사용법을 가르칩니다. 이 토론은 사용된 프롬프트를 포함하여 학습자의 임상 추론 과정(learner's clinical reasoning process)과 AI 사용 접근 방식을 포괄합니다. 교육자는 학습자의 임상 및 AI 지식을 평가하기 위해 지지 증거(supporting evidence)와 반대 증거(opposing evidence)의 사용에 대해 학습자를 탐색합니다. 이 과정은 학습자가 AI를 임상 추론을 대체(replace)하기 위해 사용했는지 아니면 정보를 얻기(inform) 위해 사용했는지 판단하는 데 도움이 되며, 학습자의 AI 문해력(AI literacy)을 엿볼 수 있는 창을 제공합니다. 그 후 교육자는 학습자가 성장 기회(growth opportunities)에 대해 성찰(reflecting)하도록 안내하고 AI 상호작용 및 임상 추론에 대한 비판적 사고(critical thinking)를 장려합니다. 마지막으로, 교육자는 AI를 효과적으로 사용하고, 올바른 도구를 선택하며, 프롬프트를 정제(refining prompts)하는 것에 대해 집중적인 교육(focused teaching)을 제공합니다. 학습자는 AI 출력에 의존하는 것(사이보그[cyborg] 전략)과 AI 출력을 확인하는 것(켄타우로스[centaur] 전략) 사이를 전환하며, 과제(task)에 맞게 AI 사용을 조절하도록(adapt) 권장됩니다. 표 S2는 DEFT-AI의 확장된 버전을 제공합니다.

 

[상단 제목] DEFT-AI: AI 사용 중 비판적 사고를 증진하기 위함

[인물] Educator (교육자) Learner (학습자)


진단, 토론, 담론 (Diagnosis, Discussion, and Discourse)

[설명] 교육자가 학습자의 구체적인 AI 사용에 대해 설명을 요청합니다.

  • Educator: 어떤 구체적인 AI를 사용했나요? Learner: 제 휴대폰에 있는 무료 버전 ChatGPT를 사용했습니다.
  • Educator: 이 과정에서 AI를 어떻게 사용했나요? Learner: 그냥 "천명(wheezing)의 감별 진단은 무엇인가?"라고 입력했습니다.
  • Educator: 앱에 어떤 프롬프트를 입력했나요? Learner: 최고의 진단 검사와 치료 전략을 물었습니다.

증거 (Evidence)

[설명] 교육자가 학습자의 근거 기반 AI 사용에 대해 평가하도록 요청합니다.

  • Educator: AI가 생성한 결과물을 어떻게 검증(verify)했나요? Learner: 음. 안 했습니다. 답변이 저에게는 그럴듯해 보였습니다.
  • Educator: 사용한 AI가 정확하고(accurate) 안전하다(safe)고 알려져 있나요? Learner: 네. 소셜 미디어에서 사람들이 (그 AI가) 진단을 얼마나 잘하는지에 대해 쓴 게시물들을 계속 보고 있습니다.

피드백 (Feedback)

[설명] 교육자가 학습자에게 AI 사용에 대한 성장 기회(growth opportunities)를 성찰(reflect)하도록 요청합니다.

  • Educator: 이 경우 자신의 AI 사용을 어떻게 평가하나요? Learner: 저는 ChatGPT 사용에 꽤 익숙해진(familiar) 것 같습니다. 지금은 항상 사용하거든요.
  • Educator: AI 사용을 어떻게 개선할(improve) 수 있을까요? Learner: 심전도(ECGs)와 흉부 방사선 사진을 판독할 수 있는 AI가 빨리 나왔으면 좋겠어요. 다음번에는 AI 결과물을 검증해야겠습니다.

교육 (Teaching)

[설명] 교육자가 대화에서 발견된 사항(findings)을 바탕으로 집중적인 교육 지점(focused teaching points)을 제공하고, 앞으로 AI를 안전하게 사용할지 여부, 시기, 방법에 대해 권고합니다.

 

Educator:

  • 효과적이라고 알려진 AI 도구를 사용하세요. 그 정확성과 안전성에 대한 동료 심사(peer-reviewed) 증거를 찾아보세요. 우리 기관은 아마 고품질 데이터를 기반으로 유사한 모델을 채택하고 검증했을 수 있습니다.
  • 가치 있고 정확한 결과물을 생성하기 위해서는 챗봇에 프롬프트(Prompting)를 입력하는 것이 중요합니다. "컨설턴트와 대화하는 것"이라고 생각하세요.
    • 누가(Who) (AI의 의도된 용도와 당신의 역할), 어디서(Where) (맥락에 대한 설명), 그리고 무엇을(What) (당신의 목표와 구체적인 과제 또는 질문)에 대해 충분하고 구체적인 정보를 제공하세요.
    • 항상 AI에게 "추론 과정을 설명하도록(explain its reasoning)" 요청하세요. 이는 AI의 답변을 개선시키고, 당신이 AI가 어떻게 생각하는지 그리고 얼마나 신뢰할 수 있는지를 평가할 수 있게 해줍니다.
    • 프롬프트 한 번으로는 충분하지 않습니다(One prompt is not enough): 대화를 나누고 피드백을 주세요. 제가 당신에게 그랬던 것처럼, 당신도 AI에게 "자가 성찰에 참여하고 오류를 찾도록(engage in self-reflection and look for errors)" 요청할 수 있습니다.
  • AI는 항상 오류(error)와 편향(bias)에 취약합니다(prone). 항상 "검증하고(verify) 신뢰하세요(trust)". 당신의 지식, NEJM 그룹의 간행물과 같은 신뢰할 수 있는 의학 정보 출처, 그리고 저와 같은 당신의 신뢰할 수 있는 동료들과 대조하여 그 답변을 반드시 확인하세요.

AI 참여 권고 (Recommendation for AI engagement)

[설명] 교육자가 안전한 AI 사용을 위해 학습자에게 특화된(learner-specific) 권고를 제공합니다.

Educator:

  • 당신의 추론을 대체(replace)하기보다는 정보를 얻기(inform) 위해 AI를 사용하는 연습을 계속하세요. AI 결과물은 예비 방사선 보고서나 자동화된 심전도 해석과 마찬가지로 당신의 예비적인 입력값(preliminary inputs)입니다. 검증하고, "그런 다음(then)" 신뢰하세요. 언제 (사이보그[cyborg]처럼) 그것에 의존(rely on)할 수 있는지 그리고 언제 (켄타우로스[centaur]처럼) 그 결과물을 확인(confirm)해야 하는지 알아야 합니다.

 

🖼️ 그림 4. 레전드 번역

그림 4. 과제 기반 AI의 적응적 사용(Task-Based Adaptive Use of AI).

AI 참여 행동(AI engagement behaviors)은 과제의 유형(type of task)과 관련된 위험(associated risk)에 맞춰 순간순간 달라져야(vary moment to moment) 합니다. 인간-AI 통합(human–AI integration)의 정도는 전략적 위임(strategic delegation) (켄타우로스, centaur)에서부터 긴밀한 협업(tight collaboration) (사이보그, cyborg)에 이르기까지 다양할 수 있습니다.

  • 켄타우로스 전략은 특히 위험도가 높은 과제(high-stakes tasks)나 AI 도구가 특정 의도된 용도로 검증되지 않은(not been validated) 상황과 같이 인간의 판단이 주도해야(human judgment must lead) 할 때 적절합니다. 켄타우로스 사고방식(centaur mindset)을 통해, 임상의는 AI에게 신중하게 작업을 위임(delegates)하고 항상 그 결과물을 평가(evaluates)합니다.
  • 사이보그 전략위험도가 낮거나(low-risk), 창의적이거나(creative), 혹은 잘 검증된(well-validated) 과제에 대해 효율성을 향상시킬 수 있습니다. 적응적 AI 사용(Adaptive AI use)은 기술, 과제, 맥락(skill, task, and context)에 기초하여 이러한 모드(modes) 사이를 전환(shifting)하는 것을 포함합니다.

📋 그림 설명

이 그림은 의료 현장에서 AI를 '적응적'으로 사용하는 것이 무엇을 의미하는지 시각적으로 보여주는 2x2 매트릭스입니다.

  • 수평축 (X축): 과제의 위험도(Stakes)를 나타냅니다.
    • 왼쪽: 위험도가 낮은 과제 (Low-Stakes Tasks) (예: 행정 업무)
    • 오른쪽: 위험도가 높은 과제 (High-Stakes Tasks) (예: 환자 진단 및 치료)
  • 수직축 (Y축): AI와의 상호작용 방식(Interaction Style)을 나타냅니다.
    • 아래쪽 (사이보그, Cyborg): '평가/검토가 거의 없는 (긴밀한) 협업 (Collaboration with little evaluation)'. 사용자와 AI가 긴밀하게 통합되어 함께 작업합니다.
    • 위쪽 (켄타우로스, Centaur): '신중한 평가/검토를 동반한 위임 (Delegation with careful evaluation)'. 사용자가 AI에게 작업을 맡기되(위임), 그 결과물을 비판적으로 검토하고 감독합니다.

그림 속 6가지 예시 과제:

이 그림은 학습자(의사)가 하루 동안(Time throughout the day, 회색 화살표) 수행하는 여러 과제를 이 매트릭스 상에 배치하여, 과제의 성격에 따라 AI 사용 전략을 어떻게 바꿔야 하는지 보여줍니다.

  1. 범용 AI 챗봇으로 이메일 초안 작성: (Low-Stakes / Cyborg) 위험도가 낮고, AI와 긴밀하게 협업하여 효율을 높입니다.
  2. AI 앰비언트 스크라이브(ambient scribe)를 사용하여 환자 진료 내용을 듣고 경과 기록지 초안 작성: (Low-Stakes / Centaur) 위험도는 낮지만, 기록의 정확성을 위해 AI가 작성한 초안을 신중하게 검토(평가)해야 합니다 (켄타우로스 방식).
  3. 임상 의사결정 지원을 위해 범용 AI 챗봇 사용: (High-Stakes / Centaur) 위험도가 매우 높고 AI가 검증되지 않았으므로, AI의 제안을 전적으로 위임하되 매우 신중하게 평가하고 검증해야 합니다 (가장 켄타우로스적인 접근).
  4. 검증된 AI 기반 ECG 판독기 사용: (High-Stakes / Cyborg) 환자 진단과 관련된 고위험 과제이지만, 도구가 '검증'되었기 때문에 3번보다 더 긴밀하게 협업(사이보그)할 수 있습니다. 하지만 여전히 인간의 최종 확인이 필요합니다.
  5. 범용 AI 챗봇으로 학습 계획 생성: (Low-Stakes / Cyborg) 위험도가 낮으므로 AI와 긴밀하게 협업하여 계획을 세웁니다.
  6. AI 기반 사례 시뮬레이션으로 연습: (Low-Stakes / Centaur) 위험도는 낮지만, AI가 제공하는 시뮬레이션 내용을 학습자가 비판적으로 평가하며 학습해야 합니다.

결론: 이 그림의 핵심은 AI 사용에 '하나의 정답'은 없다는 것입니다. '적응적 실천(Adaptive Practice)'이란, 이메일 작성(1번)처럼 사이보그 모드로 효율을 높이다가도, 임상 의사결정(3번)처럼 켄타우로스 모드로 즉시 전환하여 비판적 평가를 수행하는 등, 과제의 위험도와 맥락에 맞춰 AI와의 관계(위임 vs 협업)를 유연하게 조절하는 능력을 의미합니다.

 

 

 

 

 

 

N Engl J Med. 2025 Jul 24;393(4):376-388. doi: 10.1056/NEJMra2411880.

Competency-Based Medical Education at the Front Lines of Patient Care

 

🩺 "우리 의사들은 잘 배우고 있나요?" : 전통적 의학 교육의 위기와 대안

최근 의학 저널 NEJM(New England Journal of Medicine)에 실린 한 논문은 현재의 의사 양성 시스템에 대해 매우 강력한 질문을 던지고 있습니다.

"과연 지금의 의학 교육 시스템이 환자와 사회가 필요로 하는 유능한 의사를 제대로 길러내고 있는가?"

논문의 저자들은 안타깝게도 "아니다"라고 답합니다.


🚨 "위기입니다": 현재 의학 교육의 문제점

우리는 의료 시스템이 '5중 목표(Quintuple Goal)'를 달성하길 점점 더 강력히 원하고 있습니다.

  • 인구 집단 건강(population health) 향상
  • 건강 형평성(health equity) 증진
  • 환자 의료 서비스(patient health care) 개선
  • 의료 전문가 지원(support for health care professionals) 강화
  • 의료 비용(health care costs) 절감

하지만 현실은 어떤가요? 논문에 따르면, 많은 의사들이 기본적인 임상 및 술기 능력(basic clinical and procedural skills)이 부족하고, 팀 단위 근무나 정보 관리, 질 향상(quality improvement) 활동에 대한 준비가 미흡한 상태로 현장에 투입되고 있습니다.

이것이 바로 저자들이 "우리는 패러다임의 변화(paradigm change)를 요구하는 위기 시점(crisis point)에 와 있다"고 진단하는 이유입니다.


💡 "시간이 아니라 역량입니다": CBME의 등장

그렇다면 이 위기의 원인은 무엇일까요? 저자들은 '전통적인, 시간 기반(time-based) 접근법'을 지목합니다.

  • 전통적 모델: "의대 4년, 레지던트 3년"처럼 정해진 시간(fixed time)이 지나면, 모든 학생이 다 비슷한 준비가 되었을 것이라고 '가정'합니다. 하지만 실제로는 졸업생들의 역량 편차가 크죠.
  • 새로운 대안: 바로 '역량 기반 의학 교육(Competency-Based Medical Education, CBME)'입니다.

CBME는 '시간'이 아니라 '성과(outcomes)'에 집중합니다. 즉, "정해진 시간을 채웠는가?"가 아니라 "졸업생이 의사로서 기대되는 일을 실제로 해낼 수 있는가?"를 보장하는 것을 근본적인 목표로 삼습니다. (그림 1, 4 참고)

 

CBME 모델에서는 학습자(trainee)가 필요한 역량을 달성했다는 것이 확인되어야만 다음 단계로 나아갈 수 있습니다. 누구는 더 빠를 수도, 누구는 더 많은 시간이 필요할 수도 있죠. 시간을 역량을 쌓기 위한 '자원(resource)'으로 활용하는 것입니다.


🤝 CBME, 모두의 역할이 중요합니다

CBME는 단순히 커리큘럼을 바꾸는 것이 아니라, 교육에 참여하는 모든 사람의 역할 변화를 요구하는 '복잡한 사회 시스템 개입(complex social systems intervention)'입니다.

  • 👨‍🏫 프로그램 리더 (Program Leaders):
    • 명확한 '역량 틀(competency framework)'과 '발달 이정표(milestones)'를 설계해야 합니다.
    • '임상 역량 위원회(Clinical Competency Committees)'를 통해 학생들의 데이터를 종합적으로 검토하고 발달(progression) 결정을 내립니다.
  • 🧑‍⚕️ 임상 교육자 (Clinician-Educators):
    • CBME의 '핵심(at the heart)'입니다.
    • 단순히 지식을 전달하는 것이 아니라, 학생의 수행을 '직접 관찰(direct observation)'하고 '빈번하고 즉각적인 피드백(frequent and immediate feedback)'을 제공하는 코치(coach)가 되어야 합니다.
    • 이때 '위임 가능 전문직업적 활동(Entrustable Professional Activities, EPAs)' (그림 3 참고) 같은 도구를 사용해, "이 학생에게 지도 감독 없이 이 업무(예: 환자 상담)를 맡길 수 있는가?"를 실질적으로 평가합니다.
  • 📚 피수련자 (Trainees):
    • 더 이상 수동적인 학습자가 아닙니다.
    • 자신의 학습 과정에 능동적으로 참여하는 '맥락 전문가(context experts)'이자 교육의 '공동 생산자(coproducers)'가 됩니다.
    • 명확한 목표(clear expectations)와 개인화된 학습(personalized learning)을 통해 '성과(performance)'가 아닌 '성장(growth)'에 집중하게 됩니다.

💬 연구진의 핵심 주장: "현상 유지는 답이 아니다"

물론 CBME로의 전환은 어렵습니다. 시간과 자원이 많이 들고, 교수진의 엄청난 헌신(faculty development)이 필요하죠. 특히 경직된(rigid) 시간표 속에서 학생별 맞춤형 학습(tailored learning)을 구현하는 것은 큰 도전입니다.

하지만 저자들은 이러한 어려움에도 불구하고 CBME로 나아가야 하는 이유를 강력하게 주장합니다.

"비록 CBME가 종종 자원 집약적(resource-intensive)이라고 인식되지만, 그것의 진정한 가치(true value)는 환자와 인구 집단의 관점에서 투자 대비 수익(return on investment)으로 고려되어야 합니다."

 

준비가 덜 된 의사를 배출했을 때 발생하는 오류(errors)와 환자가 입는 피해라는 '비용(costs)'이 훨씬 더 크다는 것입니다.

연구진은 매우 단호한 어조로 말합니다.

"우리의 전통적인 의학 교육 접근법을 유지해야 한다는 근거는 빠르게 사라지고 있으며, 우리는 되돌아갈 수 없다고 주장합니다. (The evidence for maintaining our traditional approaches to medical education is rapidly disappearing, and we argue that there is no going back.)"


"현상 유지(Sustaining the status quo)는 실행 가능한 선택지(viable option)가 아닙니다. (Sustaining the status quo is not a viable option.)"


🎯 변화는 '선택'이 아닌 '도덕적 의무'입니다

이 논문은 CBME가 단순히 더 나은 '교육 기법'이라고 말하지 않습니다. 마지막 문장은 이 변화가 왜 필요한지 다시 한번 강조하며 깊은 울림을 줍니다.

"변화의 필요성은 단지 교육을 개선하는 것에 관한 것이 아닙니다. 그것은 모든 훈련 환경에서, 피수련자의 보살핌을 받는 모든 환자가 최고 품질의 의료 서비스(highest-quality medical care)를 받도록 보장해야 하는 도덕적 의무(moral imperative)입니다."

 

결국 의학 교육의 최종 목표는 '환자의 안전'과 '더 나은 건강'에 있기 때문이죠. 우리 사회도 이러한 변화의 필요성에 대해 함께 고민하고 목소리를 내야 할 때가 아닐까요?

 


환자, 의료 전문가(health care professionals), 그리고 지역사회는 인구 집단 건강(population health) 향상, 건강 형평성(health equity) 증진, 환자 의료 서비스(patient health care) 개선, 의료 전문가 지원(support for health care professionals) 강화, 그리고 의료 비용(health care costs) 절감이라는 5중 목표(quintuple goal) 달성의 시급한 필요성을 점차 인식하고 있습니다.1,2 하지만 너무나 많은 의사들이 기본적인 임상 및 술기 능력(basic clinical and procedural skills)이 부족하고,3-6 팀 단위 근무, 정보 관리, 질 향상(quality improvement) 참여에 대한 준비가 불충분한(insufficiently prepared) 상태로 현장에 투입되고 있습니다.4-6 이러한 격차(gaps)는 특히 일차의료(primary care) 분야에서 활동하는 임상의의 불균형한 분포(maldistribution)와 더불어, 많은 사람에게 의료 전달 시스템(health care delivery system)이 직면한 문제를 해결하는 데 필수적인 파트너로 마땅히 여겨져야 할4 의학 교육 시스템이 환자, 인구 집단, 지역사회의 건강 및 의료 요구(health and health care needs)를 충족시켜야 하는 사회적 계약(social contract)을 이행하지 못하고 있다는 결론을 내리게 했습니다.5-7 현재의 전통적, 시간 기반(time-based) 의학 교육 접근법(즉, 입학부터 졸업까지 고정된 시간)을 유지해야 한다는 근거는 빠르게 사라지고 있습니다. 사실, 현재의 증거들은 이 전통적인 모델이 학습자들을 효과적으로 준비시키지 못했으며, 우리는 패러다임의 변화(paradigm change)를 요구하는 위기 시점(crisis point)에 와 있음을 시사합니다.8,9

 

본 논문에서 우리는 의사 양성을 위한 유망한 패러다임인 역량 기반 의학 교육(competency-based medical education, CBME)을 지지하는 주장을 펼치고자 합니다.10 CBME는 학습자가 진료 현장에 준비된(prepared for practice) 의사가 되도록 훈련시키는 데 있어 성과 기반 접근법(outcomes-based approach)을 취하며, 근본적으로 졸업생들이 훈련 기간이 끝날 때 그들에게 기대되는 바를 수행할 수 있도록 보장하는 데 중점을 둡니다. 우리는 CBME의 잠재력(potential of CBME)을 완전히 실현하는 데 영향을 미치는 수많은 다른 요인들이 있음을 인정하면서도, 우리의 고찰을 수련 프로그램 수준(training-program level)에서 CBME를 실행하는 과정과 도전 과제(challenges)에 한정하고자 합니다.

 

우리는 전통적인 시간 기반 훈련 모델의 지속적인 문제점들과 CBME를 통해 제공되는 해결책들을 논의하며, 의료와 의학 교육은 매우 인간적이고(deeply human) 중대한 결과를 초래하는(highly consequential) 활동이기에 교육 및 임상 진료의 최전선(front lines)에 있는 프로그램 리더, 임상 교육자(clinician–educators), 그리고 피수련자의 역할에 특히 주목합니다.11 이러한 인간 행위자들(human actors)은 환자와 피수련자 모두에게 바람직한 성과(desired outcomes)를 창출하는 데 가장 중요합니다. 의심할 여지 없이, CBME로의 전환(transition to CBME)은 여러 이유로 어렵습니다. 하지만 변화가 어렵다는 이유로 유능한(competent) 의사를 일관되게 배출하지 못하는 의사 교육 시스템을 유지하는 것은 근본적으로 결함이 있는 논리(fundamentally flawed logic)를 반영합니다. 우리는 현재의 어려움에도 불구하고 CBME를 향한 지속적이고 집단적인 노력을 지지하는 논거들을 제시합니다.

 

전통적인 의학 교육과 CBME의 차이점

 

CBME 운동의 초기 동력(initial impetus)은 전통적인 의학 교육 훈련 프로그램을 이수한 졸업생들의 편차가 있는 능력(varying abilities)에 대한 구체적인 우려를 해결하고자 하는 열망이었습니다.3–6,8,12 전통적인 의학 교육의 특징인 고정된, 시간 기반(fixed, time-based) 훈련—미국의 경우 의학 학부 교육 4년, 일반 전문의를 위한 의학 졸업 후 교육 3년—은 모든 피수련자가 이 미리 정해진(predefined) 훈련 기간이 끝날 때 다음 단계로 이행(transition)할 준비가 되어 있다고 가정합니다.10,12,13 이러한 가정에 맞서, CBME 모델은 측정 가능한 구체적인 교육 성과(specific assessable educational outcomes)를 정의하고 목표로 삼으며, 피수련자들이 서로 다른 발달 궤적(developmental trajectories)을 가질 수 있음을 인정합니다 (NEJM.org에서 기사 전문과 함께 제공되는 보충 부록의 그림 1 및 표 S1 참조).12-17 이를 통해 CBME는 피수련자의 준비 상태(trainee preparedness)에 대한 더 큰 책무성(accountability), 피수련자가 요구되는 성과를 달성하도록 지원하는 시간 기반 유연성(time-based flexibility), 그리고 역량 기준(standards of competency)을 타협하지 않으면서 경로를 설계하는 피수련자 중심성(trainee centeredness)을 약속합니다.12,18 환자와 가족을 돌볼 준비가 다양한 수준으로(variably prepared) 갖춰진 졸업생을 배출하는 대신,5 CBME는 훈련을 사회적 요구(societal needs)에 맞추고13,15 모든 졸업생이 인구 집단 건강 향상, 건강 형평성 증진, 환자 의료 서비스 개선, 의료 전문가 지원 강화, 의료 비용 절감이라는 5중 목표를 달성하는 데 필요한 지식, 기술, 전문직업적 태도(즉, 능력(abilities))를 갖추도록 보장하는 것을 목표로 합니다.2,16

 

그림 1 전통적인 시간 기반 의학 교육과 역량 기반, 시간 가변적 의학 교육의 비교.

 


주요 사항 (Key Points) 역량 기반 의학 교육 (Competency-Based Medical Education)

  • 현재 의학 교육의 프로그램 설계와 접근 방식은 교육 연속체(continuum) 전반에 걸쳐 피수련자들 사이에 바람직하지 않은 교육 성과의 편차(unwanted variation in educational outcomes)를 지속적으로 야기하고 있습니다. 현재 시스템을 유지하는 것은 필요한 개선으로 이어지지 않을 것입니다.
  • 역량 기반 의학 교육(CBME)은 훈련 목표를 환자 및 사회의 의료 요구에 맞추고 피수련자들의 숙달을 향한 여정(journey to mastery)을 촉진하는 성과 중심 모델(outcomes-focused model)입니다.
  • 역량 틀(Competency frameworks)은 공유된 정신 모델(shared mental models, 즉 공유된 이해)을 지원하고 학부 및 졸업 후 훈련 단계에서 CBME를 실행하는 데 필수적입니다.
  • 최전선의 임상 교육자(Frontline clinician–educators)는 CBME의 필수 파트너입니다. 그들은 역량을 가르치고 평가(assessment), 피드백(feedback), 코칭(coaching)에 필요한 기술을 습득하는 데 중점을 둔 기관의 지원(institutional support)과 종단적 교수 개발(longitudinal faculty development)을 필요로 합니다.
  • 학습자는 CBME 프로그램에 적극적으로 참여하는 교육 및 임상 진료 파트너(educational and clinical care partners)로 간주되어야 합니다. 교수진과의 공동 생산(coproduction) 원칙이 그들의 전문직업적 개발(professional development)을 지원하고 고품질 의료 서비스를 제공하는 데 사용되어야 합니다.
  • 프로그램 및 기관 리더는 CBME와 혁신을 지원하는 정책을 개발하고 실행해야 합니다.

CBME는 훈련 프로그램의 기대 성과(expected outcomes)를 명확히 정의하고, 직접 관찰(direct observation)을 우선시하며 안전하고 효과적인 환자 임상 진료를 보장하는 데 필요한 업무 현장 과업(workplace tasks)과 평가를 연계하는(align assessment) 피수련자 평가 접근법을 사용합니다.19-22 이러한 평가 방법들은 피수련자의 발달(trainee development) 및 다음 경력 단계로의 승급(promotion)에 대한 판단을 지원하기 위해, 훈련 기간 동안 요구되는 활동에 대한 피수련자의 진전(progress)을 모니터링하는 것과 밀접하게 연결되어 있습니다 (표 S2).20,21,23,24

 

초기 증거에 따르면 이러한 새로운 평가 접근법이 전통적인 접근법보다 더 낫다고 합니다. 다면적 프로그램적 평가(programmatic assessment) 시스템은 어려움을 겪는 학생과 레지던트를 더 일찍 식별하고 학습자의 능력이 다루어지는 방식을 개선할 수 있습니다.25-27

  • 예를 들어, CBME 도입 전후에 훈련받은 458명의 캐나다 가정의학과 레지던트를 대상으로 한 코호트 연구(cohort study)에 따르면, CBME 프로그램에서의 빈번한 형성 피드백(frequent formative feedback)이 조기 경로 수정(early course correction)의 기회를 제공했으며, 이는 승급 결정을 내려야 할 때 수행 능력이나 전문성(performance or professionalism)에 결함이 지적된(flagged deficiencies) 레지던트 수의 전반적인 감소로 이어졌습니다.25,28
  • 이 연구는 또한 어려움을 겪던 레지던트들이 지원을 받았으며, 이전 기간에 지적되었던 결함들이 이후 로테이션(subsequent rotations)에서는 발생하지 않았음을 보여주었습니다. CBME로 전환하는 데는 시간, 자원, 교수 개발(faculty development)이 필요하지만, 더 나은 교육 성과(better educational outcomes)는 장기적으로 더 높은 질과 더 안전한 의료(higher-quality and safer health care)로 이어집니다.29,30

 

CBME에서 교육자와 피수련자의 역할과 책임

 

CBME는 훈련 기회의 개발 및 제공에 대한 조정되고 프로그램적인 접근(coordinated and programmatic approach)과 피수련자의 발달(trainee progression)에 대한 공동의 책임(shared responsibility)을 요구합니다. 아래에서는 프로그램별 환자 진료 활동(교육과정 위원회)부터 피수련자의 환자 진료에 대한 관찰 및 기록(병동 임상 교육자), 학습 계획 개발(프로그램 책임자와 피수련자), 다음 훈련 단계로의 승급을 위한 역량 평가(임상 역량 위원회)에 이르기까지 CBME에서 프로그램 리더, 임상 교육자, 피수련자의 필수적인 역할을 간략하게 설명합니다(그림 2). 임상 경험과 동시에 역량 개발을 지원하기 위해, 이러한 필수적인 역할과 책임은 고도로 상호작용적(highly interactive)이며 학습자의 발전은 종종 비선형적(nonlinear)입니다.

 

그림 2 CBME 프로그램에서 교수, 평가 및 발달 결정에 대한 역할 기반 책임.

 

프로그램 리더 (Program Leaders)

 

프로그램 책임자(Program directors)와 기타 교육 리더들은 CBME의 실행과 성공에 매우 중요한 역할(crucial role)을 합니다. 그들은 임상 교육자와 피수련자에게 방향, 자원, 그리고 지원을 제공합니다.

 

교육과정 설계 (Curriculum Design)

 

CBME는 한 단계에서 다음 단계로 나아가기 위해 충족해야 하는, 식별 가능하고 평가 가능한 발달 이정표(identifiable and assessable developmental benchmarks (i.e., milestones))를 기반으로 구축된 잘 설계된 역량 틀(competency framework)에 크게 의존합니다(그림 3A). 이 틀이 효과적이기 위해서, 리더들은 공유된 정신 모델(shared mental models)을 만들고, 명확한 훈련 기대치(clear training expectations)를 가지며, 특정 환경(예: 일반 소아청소년과 vs. 산부인과)에서 원하는 교육 성과(desired educational outcomes)에 부합하는 교육과정과 평가를 개발해야 합니다.31-33 학습의 발달적 진행(developmental progression)을 지원하기 위해, 이러한 틀은 상세하고, 단계별 서술적 기술(stage-specific narrative description)(즉, 초보자(novice) 수준에서 초기 전문가(early expert) 수준까지 기대되는 능력에 대한 이정표)을 통합해야 합니다(그림 3B). 훈련 프로그램이 식별 가능한 이정표 틀을 일관되게 사용하면, 발달 경로(developmental path)가 명확해지고, 이는 피수련자들이 숙달(mastery)을 목표로 하도록 장려하며 CBME의 핵심 원칙인 평생 학습(lifelong learning)을 준비시킵니다.30,33–35

 

그림 3 EPA와 역량 이정표 간의 관계, 숙련도에 대한 서술적 기술 포함.

 

프로그램 실행 (Program Implementation)

 

교육 리더들은 CBME 프로그램의 실행을 감독합니다(oversee). 그들은 교육과정을 개발하고, 평가를 업무 현장 과업(workplace tasks)과 연계하며, 지속적인 피드백(ongoing feedback)을 제공하고, 학습 환경과 환자 진료의 형평성(equity)을 증진하는 프로그램적 평가 전략(programmatic assessment strategies)을 실행할 책임이 있습니다. 성공하기 위해서, 교육 리더들은 최전선의 임상 교육자 및 피수련자들과 함께 역량에 대한 공유된 이해와 해석(shared understanding and interpretation of competencies)을 발전시키는 데 세심한 주의를 기울여야 하며, 이는 CBME 틀 내에서 피수련자를 효과적으로 가르치고 평가하기 위한 임상 교육자들의 훈련과 지원을 필요로 합니다.

  • 예를 들어, 임상 추론(clinical reasoning) 평가에서, 지도 감독 없이 진료할 준비가 된(ready for unsupervised practice) 숙련된 학습자(proficient learner)로 간주되는 피수련자는 해당 전문 분야 내의 흔한 질환에 대한 임상 양상의 패턴 인식(pattern recognition)을 효과적으로 사용하지만, 새롭거나 복잡한 의학적 문제를 관리하기 위해서는 여전히 체계적이고 단계적인 추론(methodical, stepwise reasoning)에 의존해야 할 것입니다. 숙련된 학습자는 또한 진화하는 상황(evolving situations)을 편안하게 여기며 모호성(ambiguity)과 불확실성(uncertainty)을 관리할 수 있습니다.

 

피수련자 발달 평가 (Assessment of Trainee Progression)

 

CBME 프로그램에서는 임상 역량 위원회(clinical competency committees)로 알려진 교수 위원회가 피수련자의 발달을 감독하는 것을 돕습니다. 임상 역량 위원회와 교육 리더들은 임상 교육자들의 업무 현장 관찰(workplace observations), 과제물, 표준화된 평가를 포함한 다양한 출처의 평가 데이터(multiple sources of assessment data)를 사용하여 발달(progress)에 대한 판단을 내리고 피수련자에게 피드백을 제공합니다.19–21,36–40 여러 연구에 따르면 레지던트 수련 기간 중 특정 시점(specific time points)에 임상 역량 위원회가 수행하는 검토는 개별 레지던트의 궤적(trajectories)에 대한 예측 정보(predictive information)를 제공하며, 이는 이정표 틀이 피수련자 발달을 위한 포괄적인 로드맵(comprehensive road map)을 제공할 수 있음을 시사합니다.29,33,41

  • 예를 들어, 한 레지던트의 수행 능력을 검토하는 동안, 임상 역량 위원회는 교수들의 평가에서 환자와의 상담 기술(counseling skills)이 기준에 미치지 못함(suboptimal)을 발견할 수 있고, 외래 진료실에서 수행된 다면 피드백 평가(multisource feedback assessment)에서는 간호사들로부터 대인관계 및 팀 의사소통 기술(interpersonal and team communication skills)에 대해 낮은 평가를 보일 수 있습니다.

이러한 결과들은 종합적으로(in aggregate) 프로그램 책임자나 교수 코치(faculty coach)가 결함(deficiencies)을 명시하고 레지던트와 함께 개별화된 학습 계획(individualized learning plan)을 개발하기 위한 추가적인 조사로 이어져야 합니다.

 

교육 리더들에게 있어 CBME 프로그램의 대용량 평가 데이터(large volume of assessment data) 분석은 기술적 해결책(technological solutions)과 의사 결정을 위한 새로운 전략을 요구합니다. 학습 분석(Learning analytics)(미래 성과를 예측하고 잠재적 문제를 식별하기 위해 광범위한 데이터를 해석하는 것)은 프로그램이 의도한 성과를 달성하지 못할 위험이 있는(at risk) 피수련자를 식별하고 모든 피수련자를 위한 성장 및 개발 기회를 지원하는 데 도움을 줄 수 있는 접근법입니다.15,40,42,43 여러 프로그램이 현재 교육 프로그램을 평가하고 기존 평가 접근법을 개선하기 위해 분석을 사용하고 있습니다.44,45 일부 프로그램은 또한 개인 및 프로그램 수준에서 평가 데이터의 총체(corpus of assessment data)를 보다 전체적으로(holistically) 평가하기 위해 인공지능(artificial intelligence) 및 대규모 언어 모델(large language models)의 사용을 탐색하고 있습니다.44 개별 피수련자에 대한 집계된 평가 데이터(Aggregated assessment data)는 학습 분석과 결합되어, 프로그램 평가(program evaluation)를 개선하고 교육과정 및 평가 접근법의 주요 격차(key gaps)를 식별하는 데 도움을 주어, 전반적인 프로그램 개선(overall program improvement)으로 이어질 수 있습니다.

 

지속적인 개선 (Continuous Improvement)

 

교육 리더들은 정기적으로 CBME 프로그램을 평가하고 개선해야(evaluate and refine) 합니다. 프로그램에서 생성된 집계된 평가 정보는 프로그램을 모니터링하고 더 엄격한 프로그램 평가(rigorous program evaluation)를 통해 개선을 유도하는 데 사용될 수 있습니다. 상당수의 레지던트가 훈련 프로그램의 특정 구성 요소(예: 흔한 진단에 대한 학제간 관리 계획(interdisciplinary management plan) 개발)에서 기대되는 수행 수준(expected performance level)에 도달하지 못하고 있음을 보여주는 데이터는, 피수련자의 수행 능력이 부족하다(deficient trainee performance)기보다 교육과정의 문제(curricular problem)를 예측할 가능성이 더 높습니다(그림 4).30,33,41,46,47

 

그림 4 CBME에서 개별 학습 궤적 지원.

 

임상 교육자 (Clinician–Educators)

 

임상 교육자(Clinician–educators)는 모든 CBME 프로그램의 핵심(at the heart)에 있습니다. 무엇보다도, 임상 교육자는 피수련자가 고품질의 피드백과 코칭을 받도록 보장하는 동시에, 효과적인 교수(teaching), 평가(assessment), 그리고 지도 감독(supervision)을 통해 모든 환자가 고품질의 안전한 진료(high-quality, safe care)를 받도록 보장해야 합니다. CBME에서 임상 교육자의 역할은 또한 가르치고 평가되는 일반 역량(general competencies)에 대한 이해와 숙련도(proficiency)를 요구합니다.

 

교수와 학습을 촉진하기 위한 이정표의 사용 (Use of Milestones to Facilitate Teaching and Learning)

 

임상 교육자는 임상 환경(clinical settings)에서 학습 과정을 촉진합니다(facilitate). 그들은 역량 이정표(competency milestones)를 활용하여 훈련 격차(training gaps, 예: 피수련자가 아직 이정표를 시연할 기회를 갖지 못함)를 식별하고 개별 학습 궤적(individual learning trajectories, 예: 피수련자가 기대만큼 발전하지 못함)을 모니터링할 수 있습니다. 임상 교육자는 이정표를 사용하여 피수련자와 함께 학습 목표(learning goals)와 개별화된 학습 계획(individualized learning plans)을 개발함으로써, 학습자가 자신에게 무엇이 기대되는지 알고 다음 훈련 단계로 넘어가기 전에 개선을 계획할 수 있도록 보장할 수 있습니다(그림 3).48-50

 

향상된 평가와 피드백 (Enhanced Assessment and Feedback)

 

CBME 모델에서는 피수련자에 대한 직접 관찰(direct observation)과 빈번하고 즉각적인 피드백(frequent and immediate feedback)에 중점을 둡니다. 로테이션이 끝날 때 총괄 평가(summative assessments)가 제공되는 전통적인 모델과는 대조적으로, CBME에서 임상 교육자는 학습과 개인적 성장을 더 잘 지원하는 지속적이고 구체적인 서술적 피드백(ongoing and specific narrative feedback)을 제공합니다. 이러한 집중적인 피드백 작업을 용이하게 하기 위해, 일부 프로그램은 위임 가능 전문직업적 활동(entrustable professional activities, EPAs)이라고 알려진 것을 도입했습니다.36,51–57 EPA는 의사의 일상적인 전문직업적 활동(routine professional activities)을 나타내도록 설계되었습니다; 이는 핵심적인 환자 진료 활동을 효과적으로 수행하는 데 필요한 관련 핵심 역량(key competencies, 즉 능력)을 통합해야 합니다. 텐 케이트(Ten Cate)와 테일러(Taylor)는 EPA를 "피수련자가 이 활동을 지도 감독 없이(unsupervised) 수행하는 데 필요한 역량을 입증했을 때, 그에게 완전히 위임될 수 있는(fully entrusted) 전문직업적 실무의 단위(a unit of professional practice)"라고 정의합니다. '단위(Unit)'개별 과업(discrete task, 예: '백내장 환자 관리하기') 또는 과업의 묶음(bundle of tasks, 예: '내과 술기 수행하기' 또는 '입원 환자 진료 서비스 관리하기')을 의미하며, 자격 부여(credentialing)에 적합해야 합니다."57 그림 3은 현재 미국에서 사용되고 있는 소아청소년과 의사를 위한 EPA의 예를 제공합니다.

 

EPA는 하나 이상의 특정 관찰 가능 임상 과업(specific observable clinical tasks)에 초점을 맞추는 것이 직접적인 환자 진료와 일치하기 때문에 견인력(traction)을 얻었습니다. EPA는 피수련자가 모든 전문 분야별 EPA를 수행하는 것을 관찰하도록 요구함으로써 교육과정 및 평가 프로그램을 실행하는 데 더 전체적인 접근법(more holistic approach)을 제공합니다. 전통적인 숫자 척도(traditional numerical scales) 대신, EPA는 특정 임상 과업에 대해 피수련자에게 필요한 지원이나 지도 감독의 양을 전달하기 위해 위임 기반 척도(entrustment-based scales)를 사용합니다.54-56 위임 척도(entrustment scale)는 특정 활동(예: 환자에게 새로운 약물 시작에 대해 상담하기)을 수행하는 데 있어 피수련자가 앞으로 얼마나 많은 지도 감독이 필요한지에 대한 임상 교육자의 평가를 나타내며, 이는 진료실에 임상 교육자가 동석하는 직접적인 지도 감독(direct supervision)에서부터 지도 감독 없음(no supervision)까지 다양할 수 있습니다. 이러한 새로운 척도들은 임상 교육자가 피수련자에게 더 많은 자율성(autonomy)을 부여할 때 내리는 결정과 쉽게 일치하기 때문에 업무 현장 기반 평가(workplace-based assessment)에 널리 받아들여지고 있습니다.58,59

 

우리는 이러한 새로운 평가 접근법이 특히 현재 의료 시스템의 복잡한 맥락(complex context), 증가하는 업무량(increasing workloads), 의사 보상 모델(physician reimbursement models)을 고려할 때 시간이 많이 걸리고(time-consuming) 어려울 수 있음을 인정합니다. 최전선 임상 교육자에게 프로그램적 평가(programmatic assessment)는 피수련자에 대한 다수의 관찰(multiple observations)을 요구하며, 비록 이러한 관찰이 시스템 내에서 이미 이루어지고 있을 가능성이 높지만, 이를 기록하는 것(documenting them)은 과중한 업무에 시달리는 임상 교육자에게 여전히 부담스러울(burdensome) 수 있습니다. 최전선 임상 교육자로부터 양질의 데이터 수집을 지원하려면 관찰을 포착하여 임상 업무 흐름(clinical workflow)에 통합하는 것을 용이하게 할 수 있는 기술(technology)이 필요합니다.60

 

발달 결정 (Progression Decisions)

 

아마도 CBME 모델에서 임상 교육자에게 가장 큰 변화 중 하나는 수행 능력과 발달 준비 상태(readiness to progress)에 대한 총괄적 판단(summative judgments)에서 벗어나는 것일 것입니다. 개별 임상 교육자는 더 이상 합격 또는 불합격(pass-or-fail) 결정을 내려서는 안 됩니다. 대신, 피수련자와 함께하는 시간이 종종 제한적이기 때문에, 그들은 피수련자의 발달 과정(developmental progress)에 대한 결정을 안내하기 위해 프로그램에서 사용하는 평가 시스템에 풍부한 기술적 정보(rich descriptive information)를 제공하는 데 집중해야 합니다(그림 2).

 

교육과정 개발 (Curriculum Development)

 

임상 교육자는 프로그램 책임자 및 기타 교육 리더에게 무엇이 효과가 있고 프로그램이 훈련의 격차(gaps in training)를 어디에서 해결할 수 있는지에 대한 중요한 피드백을 제공합니다. 이 피드백은 CBME에 부합하는(CBME-aligned) 교육과정의 설계 및 실행에 기여합니다.

 

교수 개발 (Faculty Development)

 

업무 현장 기반 평가 및 충실한 피드백(fulsome feedback)을 통한 임상 코칭(clinical coaching)에 대한 강조와 임상 역량 위원회의 중심적 역할을 고려할 때, (개인 및 기관 수준에서) 의미 있는 변화를 촉진하는 강력한 교수 개발(strong approach to faculty development) 접근법이 CBME에 필요합니다. 혁신과 개선을 장려하는 문화(A culture that fosters innovation and improvement)가 매우 중요합니다.37,39 임상 교육자는 CBME의 핵심에 있으므로, 그들의 중추적인 역할과 책임에 대해 지원과 인정(support and recognition)을 받을 자격이 있습니다. 프로그램 질 성과(program quality outcomes)의 향상은 고도로 숙련된(highly skilled) 임상 교육자 없이는 일어날 수 없습니다.

 

피수련자 (Trainees)

 

피수련자 또한 CBME의 실행에 매우 중요한 역할(crucial role)을 합니다. 피수련자의 목소리(Trainee voices)는 기관 및 국가 수준(institutional and national levels) 모두에서 정책 변화와 자원을 옹호(advocating)할 때 중요합니다.

 

피수련자를 위한 이점 (Advantages for Trainees)

 

CBME는 의학 훈련에 있어 중요한 변화를 나타냅니다; 이는 피수련자를 학습 과정의 중심(trainees at the center of the learning process)에 두며 고품질 임상 실무에 필요한 역량 개발을 강조합니다. 무엇보다도, CBME는 피수련자에게 학습 성과에 대한 명확한 기대치(clear expectations), 평가와 연계된 훈련 기회, 향상된 피드백(enhanced feedback), 그리고 개인화된 학습(personalized learning)을 제공합니다.12,27,61 이러한 각각의 특징은 투명성(transparency)을 향상시키고 학습자에게 자기 평가(self-assessment)에 참여하고, 목표를 설정하며, 개인적 향상을 위한 전략을 실행할 기회를 제공합니다. 필수적인 환자 진료 요구와 일상적인 임상 활동에 초점을 맞춤으로써, CBME는 레지던트 피수련자들이 졸업 시 지도 감독 없이 진료를 제공할 수 있도록 완전히 준비되는 것(fully prepared)을 보장하는 것을 목표로 하며, 이러한 접근법은 훈련 기간 단축(shortened training period) 및 부채 감소(reduced debt)의 기회를 제공할 수 있습니다. 직접 관찰과 빈번한 피드백에 대한 초점은 학습자의 사고방식(mindset)을 성과(performance)에서 성장(growth)과 신중한 연습(deliberate practice)으로 전환시켜, 자기 조절 학습(self-regulated learning)과 향상된 동기 부여(enhanced motivation)를 위한 매우 필요한 틀을 제공합니다.62,63

 

CBME의 공동 생산자로서의 피수련자 (Trainees as Coproducers in CBME)

 

피수련자는 맥락 전문가(context experts)입니다. 학습 환경에 대한 그들의 개인적인 이해는 그들을 CBME를 위한 핵심적인 공동 생산 파트너(key coproduction partners)로 만듭니다. 교육적 공동 생산(Educational coproduction)48-50은 피수련자와 교사 간의 학습 성과에 대한 상호 구성(mutual construction)으로, 이는 의료 성과를 공동 생산(coproducing health care outcomes)하는 의사와 환자 간의 파트너십과 유사합니다49,50(그림 2).

  • 피수련자는 교육과정과 평가 도구 모두의 개발에 정보를 제공하기 위해 자신들의 프로그램이 가진 교육적 강점과 약점(educational strengths and shortcomings)에 대한 통찰력(insight)을 제공할 수 있습니다.
  • 더 낮은 연차 학습자의 지도 감독자(supervisors)로서, 피수련자는 평가 및 피드백 접근법에 통찰력을 제공합니다.
  • CBME는 학습자를 팀 기반 진료 모델(team-based care models)에 노출시키기 때문에, 그들은 다양한 분야의 전문가들과 나란히 훈련하며 팀 기반 진료를 개선하는 데 파트너가 될 수 있습니다.
  • 마지막으로, 공동 생산(coproduction)은 피수련자의 리더십(leadership)과 전문성(professionalism)을 함양합니다(fosters).18

 

CBME 구성 요소 실행의 도전 과제 (Challenges in Implementing the Components of CBME)

 

비록 CBME가 건전한 교육 과학(sound educational science)에 뿌리를 두고 있지만, 실행(implementation)은 어렵다고 증명되었습니다. CBME는 5가지 핵심 요소(five core components)를 가진 복잡한 사회 시스템 개입(complex social systems intervention)입니다:

  • 성과 기반 역량 틀(outcomes-based competency framework),
  • 의학 교육 프로그램에서의 점진적 순서화(progressive sequencing),
  • 맞춤형 학습 경험(tailored learning experiences),
  • 역량 중심 교수 및 코칭(competency-focused instruction and coaching), 그리고
  • 프로그램적 평가(programmatic assessment).64-66

CBME 프로그램이 역량 기반(competency-based)이 되고 의도한 대로(as intended) 기능하기 위해서는, 5가지 구성 요소 모두가 실행되어야 합니다.

 

표 S3는 5가지 핵심 구성 요소를 더 자세히 설명하고 피수련자, 교수진, 프로그램에 의해 공동 생산(coproduced)될 수 있는 활동의 예를 제공합니다. CBME 모델의 일부 구성 요소는 다른 것들보다 실행하기 더 쉬웠습니다. 구체적으로, 역량 이정표(competency milestones), EPA, 프로그램적 평가(programmatic assessment)의 사용뿐만 아니라 역량 중심 교수 및 코칭(competency-focused instruction and coaching)에서도 의미 있는 진전(meaningful progress)이 있었습니다. 하지만, 점진적 순서화(progressive sequencing)와 맞춤형 학습(tailored learning)의 실행은 여전히 도전 과제로 남아있습니다.65,66

 

성과 달성을 위한 자원으로서의 시간과 연속성 (Time and Continuity as Resources for Achieving Outcomes)

 

의학 학부 교육(undergraduate medical education)에서 의학 졸업 후 교육(graduate medical education), 그리고 평생 전문직업적 개발(continuing professional development)로 이어지는 연속체(continuum)상의 주요 전환점(Key transition points)들은 피수련자에 대한 기대치의 중요한 변화를 나타냅니다. 하지만 이러한 전환(transitions)은 또한 상당한 단절(considerable fragmentation)을 포함합니다.67-70 역량을 향한 궤적(trajectory toward competence)이 피수련자마다 다르기 때문에(그림 4), 학습 환경에서의 수많은 전환과 단절(numerous transitions and fragmentation)은 프로그램이 이전의 관찰(previous observations)을 기반으로 하지 못하고 피수련자의 역량을 공정하게 판단하지(fairly judge) 못하는 평가 정보를 해석할 때 직면하는 어려움의 원인이 됩니다. 마지막으로, 의학 학부 교육, 의학 졸업 후 교육, 평생 전문직업적 개발 간에 공유된 교육적 비전(shared educational vision)과 우선순위(priorities)가 없다면, 훈련 환경은 사일로화(siloed)되며, 이는 전환점을 피수련자, 지도 감독자, 환자에게 고통스럽게(painful) 만듭니다.

 

대부분의 훈련 프로그램이 가진 경직된 시간 기반(rigid time-based) 교육과정 구조를 고려할 때, 피수련자의 개별적인 학습 요구(individual learning needs)를 지원할 공간을 만드는 것은 어렵습니다. 우리는 임상 경험을 조직하기 위해 순환하는 시간 블록(rotational blocks of time)을 사용하는 현재의 접근법에서 벗어나, 피수련자의 개별 학습 궤적(individual learning trajectories)을 더 잘 반영하기 위해 시간을 학습을 위한 자원(time as a resource for learning)으로 사용하는 모델로 전환해야 합니다.46,71,72 예를 들어, 의사와 환자 간, 임상 교육자와 피수련자 간, 그리고 피수련자와 다른 의료팀 구성원 간의 더 큰 연속성(greater continuity)을 허용하는 종단적 로테이션(longitudinal rotations)은 효과적인 학습, 전문직업적 개발, 고품질 환자 진료에 매우 중요한(critical) 관계(relationships)를 강화하는 것으로 나타났습니다.17,73

 

CBME로의 전환 (Making the Transition to CBME)

 

훈련 프로그램이 현재의 경직된, 시간 고정적(rigid, time-fixed) 훈련 패러다임에서 CBME 구조로 어떻게 전환할지는 두고 볼 일입니다(remains to be seen). 우리는 시간 가변적 모델(time-variable models)이 피수련자가 제공할 것으로 기대되는 의료 서비스(health care services)에 대한 보건 시스템의 의존도(reliance)에 영향을 미친다는 것을 인식합니다.

  • 예를 들어, 만약 피수련자가 주어진 훈련 모듈에서 예상보다 일찍 이동한다면, 다른 피수련자나 다른 의료 전문가가 즉시 그 역할을 맡을 수(step into that role) 있지 않는 한 환자 진료의 공백(a gap in patient care)이 발생할 수 있습니다. 그러한 업무 현장 프로세스(workplace processes)를 재조직하는 것은 혁신을 지원하는 재정적, 물질적 자원(financial and material resources)의 공동 생산(coproduction)과 배분(allocation)을 필요로 할 것입니다.

이러한 우려 중 일부를 해결하기 위해, 캐나다와 미국 모두에서 여러 새로운 시간 가변적 모델(novel time-variable models)이 도입되었습니다. 캐나다 왕립 의사 및 외과 의사 대학(The Royal College of Physicians and Surgeons of Canada)은 CBME에 대한 하이브리드 접근법(hybrid approach)인 Competence by Design 프로그램10을 실행했습니다. 피수련자들은 자신의 능력과 발달 궤적(abilities and developmental trajectories)에 따라 서로 다른 속도(different rates)로 발전하지만, 반드시 규정된 기간(prescribed period) 동안 전문 과목 프로그램에 남아 있어야 합니다. 시간 가변적 요소(time-variable component)는 프로그램 내에서 발생합니다; 바람직한 성과를 일찍 달성한 피수련자는 준비가 되었을 때 특정 훈련 영역을 추구할 수 있습니다. 시간 가변성(Time variability)은 또한 임상 교육자들이 추가적인 코칭이 필요한 피수련자들에게 더 많은 시간을 할애할 수 있게 하는 이점을 제공할 수 있습니다. Competence by Design 접근법의 효과성을 개선하고(refine) 평가하려는(evaluate) 노력은 계속 진행 중입니다. 미국에서 이 모델은 "제자리 승급(promotion in place)"이라고 불려왔는데, 이는 레지던트나 펠로우가 의학 졸업 후 교육 요구 사항을 넘어 더 높은 수준의 책임(higher levels of responsibility)으로 "승급(promoted)"될 수 있지만, 이를 자신들의 수련 기관 내에서(within their training institution) 수행하는 것입니다.74,75 "제자리 승급" 및 Competence by Design과 같은 혁신은 현재의 역할, 책임, 진료 제공(provision of care)을 유지하면서 훈련을 개인화(personalizing training)하기 위한 옵션을 제공합니다.

 

결론 (Conclusions)

 

비록 CBME가 종종 자원 집약적(resource-intensive)이라고 인식되지만, 그것의 진정한 가치(true value)는 환자와 인구 집단의 관점에서 투자 대비 수익(return on investment)으로 고려되어야 합니다. 증가하는 환자 진료 책임에 대한 피수련자의 준비 부족(Lack of trainee preparedness)은 진단 및 치료 오류(diagnostic and therapeutic errors), 그리고 기준에 미달하는 진료(suboptimal care)의 제공과 같이 환자, 훈련 프로그램, 보건 시스템에 비용(costs)을 발생시킵니다. 교육 공동체는 견고한 교육 성과(robust educational outcomes)를 내지 못하는 것에 대한 비용이 얼마인지 자문해야 합니다.

 

CBME를 지지하는 가장 강력한 주장 중 하나는 학습 이정표의 숙달(mastery of learning milestones)을 지원하고 사회적 요구(societal needs)를 충족시키는 종단적 교육(longitudinal education)이라는 그것의 기본 철학(foundational philosophy)입니다.14,28,62 우리의 전통적인 의학 교육 접근법을 유지해야 한다는 근거는 빠르게 사라지고 있으며, 우리는 되돌아갈 수 없다(no going back)고 주장합니다. 우리는 현재 의학 교육 시스템의 성과에 안주(comfortable)하거나 자기만족(complacent)해서는 안 됩니다; 변화의 필요성(the need for change)은 너무나 큽니다. 이것이 건설적인 비판(constructive criticism)과 과학적 마찰(scientific friction)이 중요하지 않다는 것을 의미하지는 않지만, CBME에 비판적인(critical) 사람들은 부적절한 현재 모델(inadequate current model)에 대한 대안(alternatives)을 제공할 의무(obligation)가 있습니다. 현상 유지(Sustaining the status quo)는 실행 가능한 선택지(viable option)가 아닙니다. 우리가 의사 커뮤니티를 풍요롭게 하고 지역사회 다양성(community diversity)을 더 잘 지원하기 위해 입학 기준(admissions criteria)을 넓힘에 따라, 우리는 우리의 교사들과 피수련자들에게 미래 진료를 위해 피수련자들을 더 잘 준비시킬 수 있도록 설계된 시스템을 제공할 빚(owe)을 지고 있습니다. 이제 이해관계자(stakeholders)들 사이에서 공유된 사고방식(shared mindset)과 행동 촉구(a call to action)를 개발하기 위한 집단적인 대화(collective conversation)가 필요한 때입니다. 변화의 필요성은 단지 교육을 개선하는 것에 관한 것이 아닙니다. 그것은 모든 훈련 환경에서, 피수련자의 보살핌을 받는 모든 환자가 최고 품질의 의료 서비스(highest-quality medical care)를 받도록 보장해야 하는 도덕적 의무(moral imperative)입니다.

 

 

📜 그림 1 레전드 번역

그림 1 (반대쪽 페이지). 전통적인 시간 기반 의학 교육(Traditional Time-Based Medical Education)과 역량 기반, 시간 가변적 의학 교육(Competency-Based, Time-Variable Medical Education)의 비교.

  • 전통적인 시간 기반(Traditional time-based) 프로그램은
    • 사회적 의료 요구(societal health care needs)에 대한 충분한 고려 없이 교육과정에 대한 합의 중심 접근법(consensus-driven approach)에 크게 의존합니다.
    • 피수련자에 대한 평가(Assessment of trainees)는 제한적이고 드물게(limited and infrequent) 이루어집니다.
    • 학습자와 교수진이 프로그램과 기관 내에 속해(nested) 있지만, 그들은 느슨하게 연결(loosely coupled)되어 있으며,
    • 환자 진료 활동(patient care activities)과 성과는 종종 교육 활동(educational activities) 및 성과와 분리된(separate) 것으로 간주됩니다.
  • 역량 기반 의학 교육(Competency-based medical education, CBME)은
    • 피수련자의 요구(trainee needs)를 환자 및 지역사회 요구(patient and community needs)에 맞춥니다(aligns). 학습자가 다음 단계로 이행(transitioning)하기 전에 특정 역량(specific competencies)을 충족하도록 요구함으로써, CBME 프로그램은 교육적 성과(educational outcomes)와 의료 성과(health care outcomes)를 통합(integrate)하고 모든 의사가 고품질의 진료(high-quality care)를 제공할 수 있도록 보장합니다.
    • CBME는 학습자, 임상 교육자(clinician–educators), 그리고 환자 간의 상호의존적인(interdependent) 진료 및 교육 활동(즉, 공동 생산[coproduction])을 포함합니다.
    • 이러한 3자 관계(triadic relationships)는 프로그램과 기관 내에 내재되어(embedded) 있습니다. 기관 및 보건 시스템의 성과(Institutional and health system performance)는 수련 프로그램과 기관 리더의 강력한 지원을 필요로 하는 의료 성과와 교육 성과 모두에 지대한 영향(profound effect)을 미칩니다.

📊 그림 1 설명

이 그림은 '전통적 모델(TRADITIONAL MODEL)'과 'CBME 모델(CBME MODEL)'을 위에서 아래로 흐르는 도식을 통해 시각적으로 비교하며, 두 의학 교육 패러다임의 핵심적인 차이점을 보여줍니다.

  • 1. 교육 설계 및 목표 (상단)
    • 전통적 모델: 전문가가 교육과정을 정의합니다. 이는 '시간 기반 과정 및 임상 로테이션(Time-based courses and clinical rotations)'과 '제한된 평가(Limited assessments)'를 특징으로 합니다.
    • CBME 모델: '5중 목표(Quintuple goal)' (인구 집단 건강 향상, 건강 형평성, 환자 진료 개선, 의료 전문가 지원, 비용 절감)가 '성과 기반 접근(outcomes-based approach)'을 주도합니다.
  • 2. 성과 (Outcomes)
    • 전통적 모델: '교육적 성과(Educational outcomes)'와 '의료 성과(Health care outcomes)'가 두 개의 분리된 원으로 표시되어, 서로 연관성이 낮은 것으로 묘사됩니다.
    • CBME 모델: 두 성과가 서로 통합되어(겹쳐진 원) 상호작용하는 것으로 나타납니다.
  • 3. 의료 기관 (Health care institution)
    • 전통적 모델: 제공되는 진료의 '질과 안전성에 대한 감독이 제한됨(Limited oversight of quality and safety)'을 시사합니다.
    • CBME 모델: '5중 목표 달성을 위한 헌신(Commitment to quintuple goal)'과 이를 위한 지원 및 자원 확보를 강조합니다.
  • 4. 수련 프로그램 및 관계 (Training program)
    • 전통적 모델: '합격/불합격(pass-or-fail)'과 정해진 활동 이수에 중점을 둡니다. 관계도가 '환자-학습자', '교수-학습자' 간의 분리된 1:1 상호작용으로 그려집니다.
    • CBME 모델: 'CBME 교육과정 및 평가'를 기반으로 합니다. 핵심은 '환자(및 가족)', '교수', '학습자' 간의 '공동 생산(Coproduction)'이라는 3자 관계(triadic relationship)입니다. 이 관계 속에서 교수는 '지도 감독, 평가, 피드백, 코칭(Supervision, assessment, feedback, coaching)'을 제공하며, 이는 '고품질의 안전한 진료(High-quality, safe care)'로 이어집니다.
  • 5. 수련 방식의 특징 (하단 노란색 상자)
    • 전통적 모델: '고정된 기간(Fixed length)', '역량의 대리 지표로서의 시간(Time as proxy for competence)', '평가 테스트(Assessment tests)', '특정 시점의 고부담 평가(Point-in-time and high stakes)'를 특징으로 합니다.
    • CBME 모델: '가변적 기간(Variable length)', '역량을 위한 자원으로서의 시간(Time as resource for competence)', '프로그램적 평가(Programmatic assessment)', '빈번하고 훈련 전반에 걸친(Frequent and thoroughout) 평가'를 특징으로 합니다.
  • 6. 수련 종료 (Exit)
    • 전통적 모델: '미리 정해진 시간(prespecified time)'에 수련을 마칩니다.
    • CBME 모델: '역량이 준비되었을 때(when competency ready)' 수련을 마칩니다.
  • 7. 최종 중점 (하단 보라색 상자)
    • 전통적 모델: '최소한의 수용 가능한 역량(minimal acceptable competence)' 보장에 초점을 맞추며, '보건 시스템 요구와의 연결이 약함(Weak link to health system needs)'을 보입니다.
    • CBME 모델: '보장 및 성과(assurance and outcomes)'에 초점을 맞추며, '지속적인 발전을 위한 준비(Prepared for continuous ongoing development)'를 강조합니다.

 

 

📜 그림 2 레전드 번역

그림 2. CBME 프로그램에서 교수, 평가, 그리고 발달 결정에 대한 역할 기반 책임.

책임(Responsibilities)은 CBME 수련 프로그램 내의 역할(roles)에 따라 달라집니다.

  • 임상 교육자(Clinician–educators)는 프로그램의 핵심(at the heart)에 있습니다. 그들은 효과적인 교수(effective teaching), 평가(assessment), 피수련자 지도 감독(trainee supervision)을 통해 고품질의 안전한 환자 진료(high-quality, safe patient care)를 보장합니다. 임상 교육자는 또한 피수련자가 학습과 성장을 지원받기 위해 고품질의 피드백과 코칭(high-quality feedback and coaching)을 받도록 보장합니다.
  • 프로그램 책임자(Program directors)와 기타 교육 리더(education leaders)는 임상 교육자와 피수련자에게 방향, 자원, 지원(direction, resources, and support)을 제공합니다. 그들은 임상 교육자들이 고품질의 빈번한 피드백을 제공하는 데 사용하는 평가 프로그램의 실행뿐만 아니라, 역량 및 이정표 틀(competency and milestone frameworks)의 개발과 실행을 감독합니다(oversee). 프로그램 책임자는 또한 수집된 데이터를 사용하여 교육 프로그램을 개선(refine)합니다.
  • 임상 역량 위원회(Clinical competency committees)는 피수련자의 발달(trainee progression)을 감독하는 교수 위원회입니다. 임상 역량 위원회와 교육 리더들은 임상 교육자들의 업무 현장 관찰(workplace observations)을 포함한 다양한 정보 출처(multiple sources of information)를 사용하여 피수련자의 발달(trainee progress)에 대해 판단하고 피수련자에게 피드백을 제공합니다.
  • 피수련자 또한 자신의 학습에 능동적인 주체(active agents)로서, 그리고 교육적 공동 생산(educational coproduction)의 파트너로서 CBME에서 중요한 역할을 합니다. 피수련자, 임상 교육자, 프로그램 책임자는 의사와 환자가 의료 성과를 공동 생산(coproducing health care outcomes)하는 파트너십과 유사하게, 목표와 학습 성과(goals and learning outcomes)를 함께 구성(construct)합니다. 피수련자는 또한 교육과정 및 평가 도구 개발에 정보를 제공하기 위해 프로그램의 강점과 약점(strengths and shortcomings)에 대한 통찰력(insight)을 제공할 수 있습니다.
  • ACGME는 Accreditation Council for Graduate Medical Education(의학 졸업 후 교육 인증 위원회)을, DIO는 designated institutional official(기관 지정 책임자)을 나타냅니다.

📊 그림 2 설명

이 그림은 CBME 프로그램 내에서 4가지 핵심 주체(교육 리더, 임상 교육자, 프로그램 책임자, 임상 역량 위원회)의 역할과 상호작용을 순환 도표(flowchart) 형태로 보여줍니다.

  1. 교육 리더 (Education Leaders, 좌측 상단):
    • 구성원: 프로그램 책임자(Program Director), 부학장(Associate Dean), 기관 지정 책임자(DIO) 등.
    • 역할: '인가 요구 사항(Accreditation requirements)', '교육과정/평가', '지역사회 및 인구 집단 요구(Local mission and population needs)'를 종합하여, '전문 과목별 이정표(specialty-specific milestones)'를 결정합니다.
    • 상호작용: 이들의 결정은 임상 교육자에게 '프로그램 피드백 및 개선(Program feedback and improvement)' 정보로 전달됩니다.
  2. 임상 교육자 (Clinician-Educators, 우측 상단):
    • 역할: 진료 현장에서 피수련자를 직접 관찰(individual observations)합니다.
    • 상호작용:
      • 피수련자에게 직접 '공동 생산 피드백 및 코칭(Coproduced Feedback and Coaching)'을 제공합니다.
      • 관찰한 '평가 정보(assessment information)'를 교육 리더(프로그램)에게 다시 제공하여 1번의 개선 루프(loop)를 완성합니다.
  3. 프로그램 책임자 (Program Directors, 좌측 하단):
    • 역할: 피수련자와 1:1로 만나 '평가 데이터(assessment data)'를 검토하고, '학습 궤적(learning trajectories)'을 평가하며, '진행 보고서(Progress report)' 및 '학습 계획(Learning plan)'을 함께 구성합니다.
    • 상호작용:
      • 피수련자와 '공동 생산 피드백 및 코칭(Coproduced Feedback and Coaching)' 관계를 맺습니다.
      • 피수련자의 학습 궤적을 지원하기 위한 피드백(Trainee feedback to support learning trajectory)을 임상 역량 위원회(4번)로 전달합니다.
  4. 임상 역량 위원회 (Clinical Competency Committee, 우측 하단):
    • 구성원: 프로그램 책임자(Program Director), 임상 교육자(Clinician-Educator), 위원회 의장(Committee Chair), 간호 교수(Nurse Faculty) 등 다학제 위원회.
    • 역할: 모든 평가 데이터를 검토하고, 수행 능력 정보를 종합하여, 피수련자의 공식적인 '발달 결정(progression decisions)'을 내립니다.
    • 상호작용: 이 '효과적인 그룹 프로세스(Effective group process)'를 통해 도출된 결정과 피드백/코칭 정보는 다시 프로그램 책임자(3번)에게 전달되어 피수련자의 학습 계획에 반영됩니다.

요약하자면, 이 그림은 CBME가 지속적인 순환 고리(continuous cycle)임을 강조합니다. (1)리더가 기준을 설정하면, (2)임상 교육자가 현장에서 관찰/평가하고, (3)프로그램 책임자가 피수련자와 개별 학습 계획을 세우며, (4)역량 위원회가 공식적인 발달 결정을 내립니다. 이 모든 과정에서 수집된 데이터는 다시 (1)리더에게 돌아가 프로그램을 개선하는 데 사용됩니다.

 

📜 그림 3 레전드 번역

그림 3. EPA와 역량 이정표(Competency Milestones) 간의 관계, 그리고 숙련도(Proficiency)에 대한 서술적 기술.

  • 패널 A는 '권장되는 소아 건강 스크리닝 제공(Provide recommended pediatric health screening)'이라는 위임 가능 전문직업적 활동(EPA)과 역량 이정표(competency milestones) 간의 관계를 보여줍니다. 이 EPA는 미국 소아과 위원회(American Board of Pediatrics, ABP)에서 제안한 핵심 EPA 중 하나입니다. 전체론적 관점(holistic perspective)에서 이 EPA는 6가지 일반 역량(general competencies)을 모두 숙지하고 평가해야 합니다. 이 예시는 '임상 추론(clinical reasoning)' 하위 역량에 대한 학습 발달의 단계를 보여줍니다.
  • 패널 B는 이 EPA에서 숙련도(proficiency)를 달성하기 위한 서술적 기술(narrative)을 보여줍니다(즉, 피수련자가 지도 감독 없이[unsupervised] 이 활동을 수행할 준비가 되었음을 의미함). 이는 소아과 레지던시의 종료 시점(end)의 목표입니다. ABP가 선정한 4가지 일반 역량과 6가지 하위 역량을 숙련도 달성을 위해 결합하여, 우리는 프로그램 임상 역량 위원회(program clinical competency committees), 교수진, 그리고 학습자가 '권장되는 소아 건강 스크리닝 제공'에 대한 교육적 성과(educational outcome)가 어떠해야 하는지 설명하는 데 도움을 줄 수 있는 서술적 내러티브(narrative)를 만들었습니다.

📊 그림 3 설명

이 그림은 하나의 EPA(위임 가능 전문직업적 활동)가 어떻게 여러 역량 영역(competency domains)과 연결되며, 그 역량이 발달 이정표(milestones)에 따라 어떻게 평가되는지 구체적으로 보여줍니다.

패널 A: EPA와 역량 이정표의 관계

  • EPA 예시: 좌측에는 '권장되는 소아 건강 스크리닝 제공(Provide Recommended Pediatric Health Screening)'이라는 구체적인 EPA가 제시됩니다.
  • 6대 역량: 이 EPA는 6가지 핵심 역량 영역(환자 진료, 의학 지식, 대인관계 및 의사소통 기술, 시스템 기반 실무, 실무 기반 학습 및 향상, 전문성)과 모두 관련됨을 보여줍니다.
  • 이정표 상세 (임상 추론): '의학 지식'의 하위 역량인 '임상 추론(Clinical reasoning)'을 예로 들어, '역량 이정표(Competency Milestones)'를 5단계로 나누어 설명합니다.
    • 초보자 (Novice / 관찰만): 병력, 검사 등 제시된 임상 사실을 나열합니다.
    • 상급 초보자 (Advanced beginner / 직접 지도 감독): 임상 사실에 기반해 체계화되지 않은 감별 진단 목록을 생성합니다.
    • 유능함 (Competent / 간접 지도 감독): 임상 사실을 비교/대조하여 우선순위가 정해진 감별 진단 목록을 만듭니다.
    • 숙련됨 (Proficient / 감독 위임): 임상 사실을 통합하여 하나의 진단으로 만들거나, 실시간으로 재평가하여 진단 오류를 피합니다.
    • 전문가 (Expert / 열망 수준): 복잡한 사례, 불확실성 등을 포함하여 조직적 오류의 맥락에서 감별 진단을 개발하는 데 멘토(role model) 및 코치 역할을 합니다.

패널 B: 졸업 목표로서의 '숙련도(Proficiency)'

  • 패널 B는 레지던트 졸업 목표(Graduation Goal)가 '숙련됨(Proficiency)' 수준임을 명확히 합니다 (패널 A의 4번째 단계).
  • 이 '숙련됨' 수준에 도달했다는 것이 구체적으로 어떤 행동을 의미하는지, 각 역량 영역별로 상세히 서술(narrative)합니다.
  • 예시:
    • 의학 지식 (임상 추론): (패널 A의 'Proficient' 내용과 동일) "임상 사실을 통합하여 하나의 진단으로 만들거나, 실시간으로 재평가하여 진단 오류를 피합니다."
    • 대인관계 및 의사소통 기술: "모호함이나 갈등이 있는 상황에서도 환자/가족과 치료적 관계를 수립하고, 공유 의사 결정을 활용하여 개인화된 진료 계획을 만듭니다."
    • 전문성 (윤리적 원칙): "자신과 타인에게 해가 될 수 있는 잠재적 실수를 인식하고, 윤리적 딜레마를 해결하기 위한 적절한 자원(윤리 자문, 문헌 검토 등)을 찾고 사용합니다."

요약하자면, 이 그림은 '스크리닝 제공'이라는 하나의 실제 업무(EPA)를 잘 수행하기 위해서는 6가지 역량이 모두 필요하며(패널 A), 졸업 시점에는 각 역량에 대해 '숙련됨(Proficient)' 수준의 구체적인 행동(패널 B)을 보여줄 수 있어야 함을 설명하는 청사진(blueprint)입니다.

 

 

 

📜 그림 4 레전드 번역

그림 4. CBME에서의 개별 학습 궤적(Individual Learning Trajectories) 지원.

세 명의 피수련자를 위한 학습 곡선(Learning curves)은 학습자가 역량을 달성하는 속도(variable rates)가 각기 다름을 보여주며, 이는 시간 가변적 교육(time-variable education)의 필요성을 강조합니다.

  • 시간 고정적(time-fixed) 프로그램에서는 개별 학습 궤적의 차이에도 불구하고, 피수련자들이 정해진 수련 기간이 끝날 때 다양한 기술 수준(variable skill levels)을 가진 채로 이행(transition)합니다.
  • 시간 가변적(time-variable) 모델에서는 피수련자들이 기대되는 역량 수준(expected level of competence)을 달성했을 때 이행하며, 이는 다음 단계로 나아갈 준비가 되었음(readiness to progress)을 보장하는 접근법입니다.
  • 별표(*)는 잠재적인 수련 프로그램의 문제점을 식별하고 교육 프로그램 개선의 기회를 강조하는 코호트 수준의 이정표 정보(cohort-level milestone information)를 나타냅니다.

📊 그림 4 설명

이 그래프는 'CBME: 시간 가변적 모델(TIME-VARIABLE MODEL)' 하에서 시간(가로축)에 따른 피수련자의 발달 단계(세로축, 초보자(Novice)에서 전문가(Expert)까지)를 보여줍니다.

  • 핵심 개념 (개별 학습 곡선):
    • Trainee 1(녹색), 2(주황색), 3(보라색) 세 명의 피수련자는 모두 서로 다른 속도로 역량을 습득합니다. Trainee 1이 가장 빠르고, Trainee 3이 가장 느립니다.
  • 모델 간의 비교:
    • 전통적 '시간 고정적' 모델 (파란색 음영 영역): 이 모델은 '시간 고정적 모델에서의 수련 기간 종료(End of training period in a time-fixed model)'라는 수직선을 기준으로 합니다. 이 시점에서 Trainee 1은 '숙련됨(Proficient)'을 넘었지만, Trainee 3은 아직 '유능함(Competent)' 수준에도 도달하지 못했습니다. 그럼에도 불구하고, 전통적 모델에서는 이들 모두가 동일하게 수련을 마치게 됩니다.
    • CBME '시간 가변적' 모델 (점선 역치): 이 모델은 '바람직한 역량 역치(Desired competency threshold)'라는 수평적 점선을 기준으로 합니다.
      • Trainee 1과 2: 이 역치를 통과하면(원으로 표시됨), 이들은 '다음 단계 또는 추가적인 도전을 위한 준비(Ready for next step...)'가 된 것으로 간주되어 다음 단계로 이행합니다. Trainee 1이 Trainee 2보다 더 이른 시점에 이 역치를 통과합니다.
      • Trainee 3: 전통적인 수련 기간(파란색 영역 끝)이 지나도 이 역치에 도달하지 못했습니다. 따라서 이 피수련자는 '바람직한 역량 역치에 도달하기 위해 필요한 추가 시간(Additional time needed...)'이 필요하다는 것이 명확해집니다.
  • 프로그램 개선 지표 (별표 *):
    • Trainee 3의 곡선에 있는 별표(*)들은 '프로그램 개선의 잠재적 지표(Indicators of potential program improvements)'를 의미합니다.
    • 만약 Trainee 3처럼 많은 피수련자(즉, 코호트)가 특정 지점에서 공통적으로 성장이 정체된다면, 이는 개인의 문제가 아니라 교육 프로그램 자체의 문제(예: 교육과정의 공백 또는 비효율적인 교수법)일 수 있음을 시사하며, 프로그램 개선이 필요함을 알려줍니다.

 

 

+ Recent posts