N Engl J Med. 2025 Dec 4;393(22):2268-2270. doi: 10.1056/NEJMclde2506914.

Simplify or Stratify? The Debate over Medical School Grading Systems

 

 

성적 평가 방식을 검토하는 의과대학 (A Medical School Evaluating the Grading System)

Harleen Marwah, M.D.

 

귀하는 최근 귀하의 의과대학의 임상 전 교육과정(preclinical curriculum)을 담당하는 학장(dean)으로 임명되었습니다(named). 학교의 교수진(faculty)과 학생들 사이에는 임상 전 학년(preclinical years)의 성적 평가 방식(approach to grading)에 관해 논쟁(debate)이 있습니다. 현재의 정책(current policy)은 5단계 등급제(five-tier grading system) (A, B, C, D, F)이지만, 합격/불합격 제도(pass/fail system)로 변경하자는 요구(calls)가 있습니다. 각 접근 방식(approach)에 대해 잠재적인 이점들(potential benefits)이 제기되었으며(raised), 귀하는 학교의 임상 전 학년(preclinical years)에 대해 합격/불합격 제도(pass/fail system)를 도입할지(implement) 아니면 5단계 등급제(five-tier grading system)의 사용을 계속할지(continue) 결정해야 합니다(decide).

 

선택지 (Options)

 

다음의 접근 방식(approaches) 중 어떤 것을 선택하시겠습니까(choose)? 문헌(literature), 귀하의 경험(experience), 출판된 지침(published guidelines), 그리고 기타 정보(other information)에 근거하여(base your choice on) 선택하십시오.

  1. 합격/불합격 제도(pass/fail system)를 도입한다(Implement).
  2. 5단계 등급제(five-tier grading system)를 유지한다(Continue).

귀하의 의사 결정(decision making)을 돕기(aid) 위해, 우리는 해당 분야의 전문가(experts in the field) 두 명에게 편집자들이 배정한(assigned) 접근 방식(approaches)을 지지하는(in favor of) 증거(evidence)를 요약해 달라고(summarize) 요청했습니다. 이 문제(issue)에 대한 귀하의 지식(knowledge)과 전문가들이 제시한 요점(points made by the experts)을 고려할 때(Given), 어떤 접근 방식(approach)을 선택하시겠습니까(choose)?


선택지 1 (Option 1) 합격/불합격 제도 도입 (Implement a Pass/Fail System)

Abhinav Suri, M.P.H. Clarence H. Braddock III, M.D., M.P.H.

 

의과대학 임상 전 학년(preclinical years)의 등급제 성적(Tiered grades)은 합격/불합격 성적 평가 제도(pass/fail grading system)로 대체되어야 합니다(replaced). 등급제 평가(Tiered grading)는 이점(benefit)에 대한 증거(evidence)는 거의 보여주지 않는 반면 해로움(harm)에 대한 증거는 많이 보여줍니다. 합격/불합격 성적 평가 제도(pass/fail grading system)는 개인의 웰빙(personal well-being)을 향상시키는 동시에(while improving), 긍정적인 학업 성취(academic progress)와 레지던트 선발(residency selection)에 대한 경쟁력(competitiveness)을 유지합니다(sustains).

 

합격/불합격 제도(pass/fail system)로 전환하는(converting) 것이 임상 실습(clinical rotations) 및 레지던트 과정(residency)에 대한 준비도(readiness)를 측정하는 데(measure) 널리 사용되는 미국 의사 면허 시험(U.S. Medical Licensing Examinations, USMLE)에서의 학생 성적(performance)을 악화시킬 것(worsen)이라는 우려(concern)가 있습니다. 그러나 합격/불합격 성적 평가 제도(pass/fail grading system)는 USMLE Step 1(임상 실습 전 교육과정(preclerkship curriculum) 완료 시 치르는 시험)에서의 낮은 성적(lower performance)과 상관관계가 없습니다(correlate). 학생들의 의과대학 입학 시험(Medical College Admission Test, MCAT) 점수를 통제한(controlled for) 미국 96개 의과대학에 대한 분석(analysis)에서, 합격/불합격 임상 전 평가(pass/fail preclinical grading)를 사용하는 학교들의 Step 1 시험 합격률(pass rate)은 등급제 평가(tiered grading)를 사용하는 학교들의 합격률에 비해 열등하지 않았습니다(noninferior).1 한 미국 의과대학의 Step 1 점수에 대한 평가(assessment)에서는 3단계 등급제(three-tiered system)에서 합격/불합격 제도(pass/fail system)로 변경한 후 점수 감소(decrease in scores)가 나타나지 않았습니다.2

 

USMLE Step 1 시험은 학생들이 임상 수련(clinical training)에 들어가기 전 지식 역량(knowledge competency)을 보장하는 것을 목표로 하는(aims to ensure), 표준화되고(standardized) 심리측정학적으로 타당한(psychometrically sound) 평가 체계로서 중요한 역할(important role)을 수행합니다(serve). 이 국가적인 시스템(national system)은 임상 수련 단계(clinical phase of training)에서의 성공에 대한 예측 변수(predictor of success)로서 개별 학교의 임상 전 과정 평가(preclinical course assessments)보다 더 광범위한 타당성(validity)과 신뢰성(reliability)을 제공할 수 있습니다(offer).

 

등급제 평가 시스템(tiered grading system)의 지지자들(Proponents)은 이 시스템이 레지던트 프로그램 책임자들(residency program directors)이 지원자들(candidates)을 평가하는(assess) 데 도움이 된다고 주장할 수 있습니다(argue). 하지만, 증거(evidence)에 따르면 레지던트 프로그램들은 선발(selections)을 할 때 임상 전 학업 성적(preclinical academic performance)에 큰 비중을 두지 않는(do not heavily weigh) 것으로 나타났습니다. 1000개 이상의 레지던트 프로그램을 대상으로 한 2024년 설문조사(survey)에 따르면, 임상 전 성적(preclinical grades)은 프로그램 책임자들이 의존하는(rely on) 가장 중요한 10가지 요소(top 10 most important factors)에도 포함되지 않았습니다. 사실(Indeed), 이 성적들은 22개 변수(variables) 중 최하위(last)를 기록했습니다.3 또 다른 연구(study)에서는 학생들이 매칭된(matched) 레지던트 프로그램의 질(quality) (전문의 자격 시험 합격률(specialty board examination pass rates)로 판단됨)이 등급제 평가 시스템(tiered grading system)과 비교했을 때 합격/불합격 제도(pass/fail system)에서 차이가 없음(no different)을 보여주었습니다.4

 

게다가(Furthermore), 등급제 평가 시스템(tiered grading systems)은 부정적인 영향(negative effects)을 미칩니다. 한 의과대학의 의대생들은 합격/불합격 평가(pass/fail grading)로 변경하기 전 임상 전 교육과정(preclinical curriculum)에서 웰빙 평가(assessment of well-being) (124점 만점의 Dupuy General Well-Being Schedule) 점수가 더 낮았습니다(lower scores).4 다른 기관(institution)에서는, 5단계 등급(five-tier scale)에서 합격/불합격 평가(pass/fail grading)로 이동함에 따라 전체적인 성적(overall performance)은 유지하면서도(sustained), 대부분의 과목별 시험(subject-specific examinations) (임상 전 및 임상 학년 모두에서)과 USMLE Step 시험 전반에 걸쳐 의학계 소수 집단 학생들(students who are underrepresented in medicine)과 그렇지 않은 학생들 간의 격차(gap)를 좁혔습니다(narrowing).5

 

이러한 설득력 있는 이유들(compelling reasons)로 인해, 우리 기관(institution)은 몇 년 전 합격/불합격 제도(pass/fail system)로 전환했습니다(switched). 우리의 경험(experience)에 따르면 이 교육과정의 유연성(flexibility)은 우리 학생들이 개인적인 관심사(individual interests)를 개발하고 다양한 전문 분야(specialties)를 탐색할(explore) 수 있게 해주었습니다(enabled). 우리 학생들은 임상 전 학년(preclinical year) 동안 연구 프로젝트(research projects) 주도, 학생 운영 클리닉(student-run clinics) 관리, 의과대학 초기에 임상 경험(clinical experiences) 참여 등을 포함한 광범위한 활동(wide range of activities)에 참여할(engage in) 수 있습니다. 이 모든 것은 필기시험(written examinations)과 임상 실습 평가(clinical rotation evaluations)로 평가되는(assessed) 학업 성취(academic performance)를 희생하지 않고도(without sacrificing) 가능합니다.

 

합격/불합격 임상 전 교육과정(pass/fail preclinical curriculum)은 평가 기반의 학업 성공 지표(assessment-based markers of academic success)에서 결손(deficits)을 초래하지 않으면서(without resulting in), 학생 웰빙(student well-being)을 강화하고(bolstering), 의학교육 만족도(satisfaction with medical education)를 개선하며(improving), 학업 격차(academic disparities)를 해소하는(bridging) 데 있어 실질적인 이점(substantial benefits)을 제공합니다. 삽화(vignette) 속의 학장(dean)에게, 우리는 합격/불합격 임상 전 교육과정(pass/fail preclinical curriculum)의 도입(implementation)을 강력히 권장합니다(highly recommend).

 

선택지 2 (Option 2) 5단계 등급제 유지 (Continue the Five-Tier Grading System)

Dawn E. DeWitt, M.D. Rhett Oellrich, B.S.

 

대부분의 미국 의과대학들은 등급제 평가(tiered grading)가 학생 스트레스(student stress)를 유발하고, 협력(collaboration)보다는 학급 내 경쟁(in-class competition)을 조장하며, 배움(learning)보다 성과(performance)를 중시하게 만든다(fosters)는 우려(concerns) 때문에 임상 실습 전 과정(preclerkship courses)에서 합격/불합격 평가(pass/fail grading)를 사용합니다. 불행히도(Unfortunately), 경쟁적인 레지던트 선발(competitive residency selection) 분위기(climate) 속에서, 의과대학의 임상 실습 전 합격/불합격 평가(preclerkship pass/fail grading)는 지원자들(applicants)과 레지던트 프로그램들(residency programs)에게 의도하지 않은 난관들(unintended challenges)을 제시하고 있습니다(presenting).

 

임상 실습 전 과정(preclerkship courses)의 등급제 성적(Tiered grades)은 학습자들(learners)에게 성과(performance)에 대한 더 빠르고(earlier), 더 구체적인 피드백(more specific feedback)을 제공할 수 있으며, 이는 공부 습관(study habits)을 안내할(guide) 수 있습니다. 게다가(Furthermore), 예비 의사들(future physicians)이 최소 기준(minimum standards)을 충족하는 것(meeting) 그 이상을 목표로 하도록(aim beyond) 돕는 지표들(metrics)은 단언컨대 유익합니다(arguably helpful). 예를 들어, USMLE Step 1이 합격/불합격 제도(pass/fail system)로 전환된(transitioned) 이후, Step 1 합격률(pass rates)은 떨어진 반면, (임상 실습(clerkships) 중에 치르는) Step 2 시험 점수는 상승했는데(risen), 이는 Step 2 시험 점수의 더 커진 인식된 중요성(greater perceived importance)과 평행을 이룹니다(paralleling).6 이러한 추세들(trends)은 수치화되거나 등급화된 결과(numerical or tiered results)와 외적 동기(extrinsic motivation)가 공부 행동(study behavior)을 유도할 수 있다(drive)는 주장을 뒷받침합니다(support) — 특히 현재의 레지던트 매칭 환경(residency match environment)에서는 더욱 그렇습니다.

 

레지던트 선발(Residency selection)은 여전히 매우 경쟁적이며(remains highly competitive), 임상 실습 전 과정(preclerkship courses)과 면허 시험(licensing examinations)에서의 합격/불합격 평가(pass/fail grading)는 스트레스를 줄이는 것이 아니라(may not decrease stress) 단지 학생 스트레스의 초점(focus)을 옮기는 것일 수 있습니다(merely shift).7 레지던트 프로그램 책임자들(residency program directors)이 이용할 수 있는(available) 유일한 표준화된 지표(standardized metric)가 Step 2 점수이기 때문에, 임상 실습 전 합격/불합격 평가(preclerkship pass/fail grading)의 부상(rise)은 교실 내에서의 조기 피드백(early feedback)과 외적 동기(extrinsic motivation)의 잠재적인 이점들(potential benefits)을 희생시켰으며(sacrificed), 이전에(previously) 초기 평가척도들(earlier measures)과 연관되었던(associated with) 스트레스를 의과대학 생활의 후반부(later)로 방향을 돌렸습니다(redirected).6 이제 학생들은 이미 엄격하고(rigid), 혹독한 일정(rigorous schedules)을 가지고 있는 임상 실습(clerkships)과 Step 2 기간 동안 고조된 스트레스(heightened stress)에 직면합니다(face). 이러한 타이밍(timing)은 학생들이 임상적 수월성(clinical excellence)에 집중하는 것을 더욱 방해할(distract) 수 있습니다.8

 

합격/불합격 평가(pass/fail grading)의 정보 공백(information vacuum) 속에서, 학생들이 레지던트 지원서(residency applications)를 최적화하기(optimize) 위해 교과 과정(coursework)보다 연구(research)나 다른 과외 활동(extracurricular activities)을 우선시하는(prioritize) "그림자 경제(shadow economy)"가 등장했습니다(emerged).9 등급제 평가 구조(tiered grading structure)는 "그림자 경제"보다 학생들을 더 공평한 경쟁의 장(more even playing field)에 놓을 수 있습니다. 대부분의 학교가 모든 학생에게 표준 학습 자료(standard study resources)를 제공하고(make available), 임상 실습 전 등급제 성적(preclerkship tiered grades)이 미래의 의사 수행 능력(physician performance)에 대한 예측 타당도(predictive validity)를 가지기 때문에,10 높은 성적(high grades)을 성취할 기회(opportunity)는 비전형적인 학생들(nontraditional students) (예: 의학계 소수 집단 출신 학생들, 비 STEM [과학, 기술, 공학, 수학] 배경을 가진 학생들, 군대 배경이 있는 학생들, 또는 만학도들(mature students))이 스스로를 돋보이게 하는 데(distinguish themselves) 도움이 될 수 있습니다. 게다가(In addition), 이는 인맥(connections)과 재정적 자원(financial resources)이 명망 있는 과외 활동 기회(prestigious extracurricular opportunities)의 가용성(availability)을 용이하게 할(facilitate) 수도 있는 "그림자 경제"에서 나타날 수 있는 불평등(inequities)과 싸울(combat) 수 있습니다.

 

임상 실습 전 등급제 성적(Preclerkship tiered grades)은 또한 더 빠르고(earlier) 더 목표 지향적인(more targeted) 레지던트 계획(residency planning)을 용이하게 할(facilitate) 수 있습니다. 특정 레지던트 지원(specific residency applications)에 대한 예상 경쟁력(likely competitiveness)을 나타내는 데(indicate) 도움이 되는 지표들(metrics)이 없다면, 학생들은 의도치 않게(inadvertently) 특정 전문 분야(particular specialty)에 상당한 시간과 노력(substantial time and effort)을 투자하고도, 나중에야 자신들이 이용 가능한 자리(available slots)를 두고 경쟁하기에(compete) 좋은 위치가 아님(not well positioned)을 발견하게 될(discover) 수 있습니다. 일부 학생들은 경쟁력을 높이기(increase their competitiveness) 위한 활동에 참여하기(engage in) 위해 1년짜리 휴학(yearlong leaves of absence)을 해야 한다는 압박감(pressured)을 느낄 수 있으며, 이는 의학 수련(medical training)을 연장하고(prolonging) 부채(debt)를 증가시킵니다. 더욱이, 휴학(leaves of absence)은 수련을 지연시키고(delay) 중단시킬(disrupt) 수 있습니다.

 

임상 실습 전 등급제 평가(Preclerkship tiered grading)와 추가적인 지표들(additional metrics) (교과 성적(course grades) 등)은 커져가는 "그림자 경제"를 단계적으로 축소하고(de-escalate), 비용이 많이 드는 휴학(costly leaves of absence)을 줄이며(decrease), 전반적인(overall) 학생 스트레스를 증가시키지 않으면서(without increasing) 기술 개발(skill development)과 진로 계획(career planning)을 위한 더 빠르고 구체적인 피드백(earlier and more specific feedback)을 제공할 수 있습니다. 등급제 평가(tiered grading)를 통한 조기 피드백(Early feedback)은 궁극적으로 학생들을 핵심 지식(core knowledge)과 임상 기술(clinical skills)의 수월성(excellence)에 다시 집중하게 하면서(refocusing) 학생들의 이익(interests)에 더 잘 부합합니다(better serves).

 

 

 

+ Recent posts