2021년, 필자 중 한 명은 의과대학 첫 강의에 들어가 보드에 쓰인 방정식을 마주했습니다:
“P = MD.”
(합격(Pass)이면 의사(MD)가 된다는 뜻입니다.)

강의실에 웃음이 퍼지며 집단적인 안도감이 느껴졌습니다. 교수는 우리에게 걱정을 멈추라고 말했습니다. 합격만 하면 된다고요.

“P = MD” — Passing was enough.

 

최근 수십 년 동안, 많은 의과대학들이 **Pre-clerkship(임상 전 교육과정)**에서 합/불(Pass/Fail) 평가의 사용을 확대해 왔습니다. 더 나아가 **Core Clerkship(핵심 임상실습)**에서도 이 같은 평가방식을 도입하려는 움직임이 점차 늘어나고 있습니다. 이러한 변화는 대부분 Pre-clerkship 교육을 중심으로 한 연구 결과에 기반하고 있으며, 이들 연구는 Pass/Fail 평가가 학생들의 단기적 웰빙(well-being)을 향상시킬 수 있지만, 학업 성취도에는 해가 없다고 제안합니다.

pass/fail grading may improve students’ short-term well-being without compromising academic performance.


🔹 Pass/Fail 평가를 지지하는 주장

Pass/Fail 평가 방식의 지지자들은 다음과 같은 주장을 펼칩니다:

  • 이 방식이 학생들로 하여금 **성장 마인드셋(growth mindset)**을 유지하도록 돕고,
  • 감독자에게 잘 보이려는 것보다 질문하고 배우는 것에 집중할 수 있게 한다고 봅니다.
  • 평가의 위험도를 낮추면, 학생들이 **평생 학습(lifelong learning)에 필요한 내재적 동기(intrinsic motivation)**를 개발할 수 있다고 봅니다.

이러한 주장은 성적 평가에 대한 논의의 초점을 '순위 매기기(ranking)'에서 '학습(learning)'으로 전환시키는 데 기여했으며, 이는 환영할 만한 변화입니다.


🔹 그러나: 임상 기술 저하에 대한 우려

하지만 최근 일부 연구에서는 **특정 임상 기술의 저하(decline in clinical skills)**가 보고되고 있으며, 이런 상황 속에서 너무 낮은 기준으로 합격선을 설정한 Pass/Fail 제도는 임상 역량의 탁월성을 약화시킬 수 있다는 우려가 제기되고 있습니다.

we worry that pass/fail grading systems that set a low bar for passing could undermine clinical excellence.

 

저자들은 다음과 같이 주장합니다:

  • 지금과 같은 Pass/Fail 방식 대신,
  • 의과대학은 학생들이 '임상적으로 탁월한(clinically outstanding)' 의사가 될 수 있도록 돕는 평가 체계를 구축해야 한다는 것입니다.

🔹 의과대학의 주된 사명과 평가 방식

의과대학과 수련 프로그램의 주된 사명은
➡️ 훌륭한 환자 진료(excellent patient care)를 제공할 수 있는 의사 양성입니다.

그러나 현재 형태의 Pass/Fail 시스템은 다음과 같은 이유로 그 목표를 위협할 수 있습니다:

  • 의과대학생은 모든 학습자와 마찬가지로, **활동의 가치(value)**에 따라 동기부여를 받습니다.
  • 학생들은 무엇이 실제 임상에서 필요한 지를 미리 알기 어렵습니다.
  • 따라서, 특히 임상적으로 중요한 내용을 다루는 필수 강의나 실습에서, **등급이 있는 평가(tiered grades)**는 학생들에게 학습 동기를 부여하는 역할을 합니다.
    • 이는 처음엔 중요해 보이지 않을 수 있지만, 훗날 의사로서의 역량(competence)을 갖추는 데 필수적인 주제들을 익히게 만듭니다.

👉 실제로, 의과대학 초기에 보인 학업 성취도는 이후 임상 역량과 관련이 있습니다.

Academic performance, even early in medical school, is associated with future clinical competence.

 


🔹 외재적 동기의 공백과 "그림자 경제(Shadow Economy)"

**등급이 있는 평가(tiered grades)**가 폐지되면, 그 자리를 **다른 외재적 동기(external motivators)**가 채우게 됩니다.
학생들은 레지던시 프로그램에 눈에 띄기 위해 압박감을 느끼게 되며,

Students feel pressure to distinguish themselves to residency programs.

 

등급이 없는 평가 체계 속에서, 학생들은 평가받지 않는(ungraded) 임상 기술을 향상시킬 것인지,
아니면 전략적 가치가 더 높은 활동들(e.g., 연구 활동)에 우선순위를 둘 것인지 사이에서 선택해야 합니다.

 

특히, **비임상 지표(nonclinical metrics)**를 중시하는 레지던시 프로그램에 지원할 계획인 학생들에게는 더욱 그렇습니다.

저자들은 이를 통해 다음과 같은 문제가 발생할 수 있다고 경고합니다:

  • 학생들이 점점 더 연구, 자원봉사, 아르바이트 등 다양한 활동을 쌓는 데 집중하게 되며,
  • 질보다는 양을 중시하는 경향이 생기고,
  • 그 결과, 임상 학습(clinical learning)이 희생될 수 있습니다.

We worry about the perpetuation of a “shadow economy”… at the expense of clinical learning.

 

나아가, **임상 학습과 돌봄(caregiving)에서 멀어지도록 만드는 유인(incentives)**은
➡️ 학생들의 **의학적 소명의식(sense of purpose)**을 약화시킬 수 있습니다.


🔹 평가 정보의 부재와 레지던시 선발의 왜곡

성적 정보가 사라진 상황에서는, 레지던시 프로그램 측도 지원자 간의 차이를 구별하는 데 어려움을 겪게 됩니다.

Without access to information on grades, residency programs may struggle to differentiate among applicants.

 

이 경우 가능한 두 가지 시나리오는 다음과 같습니다:

  1. 최선의 경우: 질적인 평가(qualitative evaluations)에 의존하겠지만,
    • 대부분의 코멘트는 너무 일반적이고 모호해서 실질적으로 쓸모가 없습니다.
  2. 최악의 경우:
    • **논문 수(publication count)**와 같은 **질 낮은 비임상 지표(low-quality, nonclinical metrics)**를 중시하거나,
    • **내부 인맥과 추천(back door endorsements)**에 의존하게 되어,
      연줄(connections)이 있는 학생들에게 유리하게 작용할 수 있습니다.

🔹 평가 방식에 대한 논쟁과 근거 부족

의과대학의 성적 평가 방식에 대한 논쟁은 학생들의 환멸(disillusionment) 증가와 교수들이 느끼는 학생들의 임상 실습 소홀 등의 인식 속에서 더욱 격화되고 있습니다.

Disagreements about medical school grading have intensified amid growing trainee disillusionment and a perception… that students have deprioritized clinical work.

 

이에 따라 성적 정책을 결정하는 데 있어 다음과 같은 고려가 필요합니다:

  • 학생 웰빙(well-being)
  • 동기부여(motivation)
  • 타당도(validity)
  • 형평성(equity)
  • 레지던시 선발(residency selection)

그러나, 이와 관련한 대부분의 주장은 의견(opinions)에 기반할 뿐이며,
정책 결정을 뒷받침할 만큼 충분한 근거(evidence)는 부족합니다.


🔹 Tiered Grading의 장단점

**등급 평가(tiered grading)**는 학생들에게 임상 활동에 더 많은 노력을 기울이도록 동기를 부여하지만,
다음과 같은 단점도 존재합니다:

  • 임상 평가 기준은 주관적이고 불명확할 수 있으며,
  • 학생들은 자신의 지식 부족을 감추기 위해 질문을 회피하거나 도전을 두려워하게 되고,

students may avoid asking questions and learn to fear challenges rather than welcome them.

  • 또한, **임상실습 평가(clerkship grading)**는
    인종, 민족, 성별에 따라 **불평등(disparities)**이 존재한다는 연구 결과도 있으며,
    이는 소수자 집단(marginalized groups)에게 불리하게 작용하고,
    **유능한 임상의(talented clinicians)**를 발굴하는 데 방해가 됩니다.

🔹 제안: 낮은 기준은 충분하지 않다

이처럼 상반된 **이점과 위험성(conflicting benefits and risks)**이 공존하면서, 의과대학 평가 방식, 특히 Clerkship 평가를 둘러싼 논란이 깊어지고 있습니다. 저자들은 주장합니다:

“Until there is a stronger evidence base… any system that involves setting low standards for clinical learning isn’t good enough.”
"임상 학습에 대해 낮은 기준을 설정하는 어떤 시스템도 충분하지 않다."


✅ 다섯 가지 핵심 제안 (표로 제시됨)

저자들은 Tiered vs. Pass/Fail 논쟁을 넘어설 수 있도록,
다음의 **5가지 평가 우선 영역(five priority areas for assessment)**을 제안합니다:

  1. 환자 진료(patient care)의 핵심 가치 강조
  2. 근거 기반의 평가 정책 결정
  3. 임상 학습 경험의 강화
  4. 형평성 있는 제도 운영(equitable institutional practices)
  5. 임상적 탁월성(clinical excellence) 문화를 조성

We believe medical school leaders should emphasize the core value of patient care… and support a culture of clinical excellence.

 


🔷 의학교육 평가를 위한 다섯 가지 우선 과제 (Five Priorities for Medical Education Assessment)


1️⃣ 평가 목표 설정: 학생뿐 아니라 미래의 환자를 고려해야 함

의과대학의 리더들은 **교수진과 학생 등 다양한 이해관계자(stakeholders)**와 협력하여
**학생뿐 아니라 학생의 미래 환자들을 위한 평가 목표(assessment goals)**를 설정해야 합니다.

"define assessment goals that take into account commitments not just to students but also to students’ future patients."

 

물론, 이상적으로는 학생의 웰빙(well-being), 과외 활동 참여(extracurricular engagement),
그리고 환자 진료 목표(patient care goals) 사이에서 win–win 해법을 찾을 수 있습니다.
하지만, 모든 목표를 동시에 만족시킬 수 없는 경우에는
➡️ 관리자들이 이러한 상충(trade-offs)에 대해 투명하게 소통해야 합니다.


2️⃣ 근거 기반의 정책 결정: 단기성과를 넘어서 장기성과까지 고려

신약이나 기술을 평가하듯이, 의과대학도 성적 제도를 단순한 의견(opinions)이 아니라, 데이터(data)에 기반해 설계해야 합니다.

  • 시험 성적이나 학생 만족도와 같은 **단기 지표(short-term outcomes)**만이 아니라,
  • **학습, 웰빙, 그리고 궁극적으로는 환자 진료 역량(patient care skills)**에 미치는 장기적 영향을 평가해야 합니다.

📌 **무작위 연구(randomized studies)**도 윤리적·실현 가능하며,
➡️ 학생들이 무작위 배정에 대해 사전 동의한 경우 의학교육에서도 충분히 활용 가능합니다.

또한 다음과 같은 체계를 구축해야 합니다:

  • 실시간 데이터를 모니터링하여 **지속적 질 향상(continuous quality improvement)**에 활용하고,
  • 졸업생들의 임상 역량 및 성장 가능성에 대한 피드백을 레지던시 프로그램으로부터 받아야 합니다.

3️⃣ 평가 외적 요소에 대한 주의: 임상 경험의 질과 피드백이 학습을 결정짓는다

성적 제도가 학습에 미치는 영향에만 집중해서는 안 됩니다.
의과대학은 다음과 같은 교육과정(curricular) 요소들도 함께 고려해야 합니다:

  • 임상실습의 횟수, 강도, 특성
  • 의미 있는 역할 부여 (e.g., graduated autonomy in clerkships)
  • 고품질의 피드백 제공(high-quality and timely feedback)
  • 사례 기반 학습(case-based learning), 표준화 환자 활동(standardized-patient experiences) 등으로
    Pre-clerkship 단계에서 임상 추론 능력을 키우는 활동

이러한 전략은 어떤 평가 제도를 사용하든 학습 향상에 기여할 수 있으며,
**학생–교수 간의 연속적인 상호작용(continuity)**은
➡️ 시간에 따른 객관적 및 주관적 데이터의 통합을 가능하게 하고,
➡️ **학생들의 장기적 성장(longitudinal development)**을 촉진할 수 있습니다.


4️⃣ 평가 형평성 확보: 차별(disparity)을 인지하고 시정하라

의과대학은 **성적 평가에서 나타나는 불평등(disparities)**을 철저히 감시(vigilant)하고,
제도적 정책이 이를 완화하거나 악화시키는 방식에 대해 숙고해야 합니다.

이를 위해 다음을 고려해야 합니다:

  • 상과(honors)나 수상(awards)의 기준이 편향되어 있는지 점검하고,
  • 필요 시 편향된 지표(biased metrics)의 사용을 피해야 하며,
  • 레지던시 프로그램과의 투명한 정보 공유를 통해
    ➡️ 학생 평가의 형평성 확보를 도모해야 합니다.

5️⃣ 임상적 탁월성(clinical excellence)을 일관되게 강조하라

성적 체계가 tiered든 pass/fail이든 상관없이, 의과대학은 의과 교육 전반에 걸쳐 임상적 탁월성을 강조해야 합니다:

  • 학생 선발(admissions)
  • 오리엔테이션
  • 재방문 프로그램(revisit)
  • 강의와 실습
  • 레지던시로의 전환 등 모든 교육의 순간에서

특히 Pass/Fail 제도를 도입한 학교는 다음 두 가지를 반드시 수행해야 합니다:

  1. 합격 기준(passing threshold)은 ‘의미 있고 높은 수준’이어야 하며,
  2. **기준을 충족하지 못한 학생에게는 충분한 보완(remediation)**이 이루어져야 합니다.

Administrators… must ensure that they set a meaningful passing threshold — in other words, a high bar for clinical excellence — and implement substantive remediation…

 

“P = MD”라는 개념은 더 이상 유효하지 않으며,
➡️ 학생들에게는 합격선을 넘는 성취가 헛된 노력(wasted effort)이 아니라는 메시지를 전달해야 합니다.


✅ 결론: “Good Enough”는 충분하지 않다

“When it comes to training physicians, we believe a grading system that supports the concept of just ‘good enough’ isn’t good enough.”

 

의사를 양성하는 데 있어, 단지 “충분히 괜찮은(good enough)” 정도로 만족시키는 성적 제도는 결코 충분하지 않습니다.

우리는 교육 프로그램이 **임상적 탁월성(clinical excellence)**을 중심 가치로 재확인하고,
이를 향해 나아가도록 체계를 조정할 때, 비로소 더 높은 수준의 교육과 평가를 실현할 수 있습니다.

“By reaffirming the centrality of clinical excellence and aligning educational programs to advance this goal, we can all earn a higher grade.”


 

 

 

🏫 의과대학 평가를 위한 우선 영역 (Priority Areas for Medical School Assessment)

 

우선 영역  예시
1. 환자 진료의 핵심 가치 강화 (Advance the core value of patient care) • 교수진, 학생 등 **이해관계자(stakeholders)**와 협력하여 학생의 현재뿐 아니라 미래 환자에 대한 책무를 포함하는 공유된 목표를 정의
• 학생의 임상적 탁월성을 의사의 다른 모든 역량의 기반으로 인식하면서도 학교의 고유한 목표와 정렬
• 모든 교육적 목표를 동시에 달성하기 어려운 경우, **불가피한 교육적 선택(trade-offs)**에 대해 투명하게 소통
2. 근거 기반의 평가 정책 수립 (Make evidence-based decisions about grading policies) • 평가 개입이 학습, 웰빙 등 학생의 교육 및 경력 전반의 성과에 어떤 영향을 주는지 고려
단기적 이득이 장기적 해악을 줄 수 있음(그 반대도 마찬가지)을 인식
실시간 교육 데이터를 모니터링하여 지속적 질 향상을 지원
레지던시 프로그램으로부터 졸업생의 역량과 성장 가능성에 대한 확장된 피드백 확보
3. 임상 학습 경험의 질 향상 (Enhance clinical learning experiences) 평가를 넘어서는 교육과정 설계 요소들(예: 임상 경험의 수, 강도, 성격)을 고려
성적 제도와 관계없이 임상 학습을 개선할 수 있는 요소들 고려 (예: 핵심 임상실습에서 점진적 자율성 명시 제공 등 의미 있는 역할 부여)
4. 제도적 형평성 확보 (Ensure equitable institutional practices) • 학교별 성적 평가의 격차를 모니터링
격차를 확대시킬 수 있는 상·포상 기준을 검토
• 학생 및 레지던시 프로그램과 성적 격차에 대한 정보 공유 (예: **의과대학생 수행 평가서(MSPE)**에 명시)
5. 임상적 탁월성의 문화 조성 (Support a culture of clinical excellence) 임상적 숙련(clinical mastery)의 중요성을 강조
임상적 탁월성을 전 교육과정에 걸쳐 추진 (예: 학생 선발, revisit 프로그램, 오리엔테이션, 강의 및 실습, 레지던시로의 이행 등)
Pass/Fail 제도 하에서도 의미 있는(즉, 높은) 합격 기준을 설정하고, 이를 충족하지 못할 경우 **실질적인 보완(remediation)**을 제공하며, 합격 기준 이상의 성취가 불필요한 노력이라는 인식을 방지

📝 이 표는 논문 본문에서 제시된 다섯 가지 평가 우선 영역을 구체적 실행 전략과 함께 요약한 것입니다. 블로그 포스트나 슬라이드 제작용으로 시각적 구조를 유지한 채 재구성하거나, 각 항목을 해설하는 교육자료 형식으로도 정리해드릴 수 있으니 원하시는 방향이 있다면 말씀해주세요!

 

Iyer, A. A., Hirsh, D. A., & Schwartzstein, R. M. (2025). Medical School Grading—Is “Good Enough” Good Enough?. New England Journal of Medicine.

+ Recent posts