우리의 정체성(identities)은 매우 개인적인 것이다. 정체성은 우리 자신에 대한 관점과 타인과의 관계를 형성하며¹, “나는 누구인가?”그리고 “나는 어떤 사람이 되어가고 있는가?”라는 질문에 답하도록 도와준다. 정체성이라는 구성개념(construct of identities)은 보건의료전문직 교육(health care professions education)에서 핵심적이다.
Carnegie Foundation 보고서는 의학 교육의 네 가지 목표 중 하나로 “전문직 정체성에 대한 초점(focus on professional identity)”(p. 6)²을 제시했으며,
National League for Nursing은 전문직 정체성(professional identity)을 “간호의 예술과 과학에 필수적인 것”(p. 35)³이라고 강조했다.
전문직 정체성 형성(professional identity formation)의 렌즈를 통해 보건의료전문가가 된다는 것이 무엇을 의미하는지 재정의하는 것은, 교육의 초점을 단순히 실천을 위한 지식(knowledge), 술기(skills), 행동(behaviours)을 포함시키는 데서 벗어나, 보건의료의 가치(values)와 덕목(virtues)을 “전문직 자아(professional self)”로 내면화하는 방향으로 전환시킨다.⁴ 그 결과, 보건의료 전문직 전반에서 전문직 정체성 형성에 관한 연구가 폭발적으로 증가했다. 그러나 중요한 문제가 여전히 남아 있다. 정체성은 철학(philosophy), 사회학(sociology), 심리학(psychology)을 포함한 다양한 학문 분야에서 오랜 이론적 작업의 역사를 지닌 복잡한 개념(complex concept)이다.¹ 하지만 보건의료교육 연구의 상당수는 강한 이론적 토대가 부족하며, 정체성 이론을 명시적으로 밝히는 연구는 소수에 그친다.⁵ 전문직 정체성은 보건의료전문가에게 핵심적이므로, 우리는 교육자와 연구자들이 정체성 연구의 풍부한 이론적 전통을 바탕으로 더 큰 개념적 명료성(conceptual clarity)을 추구할 것을 촉구한다.
정체성 이론(identity theories)들은 정체성의 내용(content)과 정체성이 출현하는 과정(processes)에 대한 이해에서 서로 다르다.⁶ 차이가 있음에도 불구하고, 모든 이론은 정체성이 우리가 사회적 세계(social world) 안에서 상호작용하면서 발달한다는 점에는 동의한다.¹ 그러나 이론들은 정체성이
단일한가(singular) 또는 복수적인가(multiple),
개인적인가(personal) 또는 관계적인가(relational),
상대적으로 안정적인가(relatively stable) 또는 유동적이고 변화 가능한가(fluid and changeable), 그리고
발견될 수 있는가(discovered) 아니면 개인적/사회적으로 구성되는가(personally/socially constructed)에 대해 서로 다르다.⁶
이러한 차이는 각 이론의 존재론적(ontological: 지식과 앎의 본질), 인식론적(epistemological: 우리가 어떤 것을 어떻게 알 수 있는가), 가치론적(axiological: 가치) 토대와 관련된다. 정체성 이론들은 정체성의 존재 위치를 어디에 두는가에 따라, 즉 내적 심리/인지적 영역(internal psychological/cognitive)에서 외적 사회/상호작용적 영역(external social/interactional)에 이르는 연속선 위에서 서로 구별되지만 상호 관련된 세계관을 가진다.¹˒⁷
심리학적 또는 사회인지적 정체성 이론(psychological or socio-cognitive identity theories)은
흔히 과학적 실재론(scientific realism, 존재론)과 객관주의(objectivism, 인식론)에 기반한다.
이 관점에서 정체성은 사회적 상호작용의 영향을 받지만, 인지적으로 표상(cognitively represented)된다.⁸
정체성은 외부 현실을 표상하는 내적이고 정신적인 상징(internal, mental symbols)이며, 단일한 것으로 간주된다.
따라서 이 관점에서는 대체로 identity라는 단수형 용어를 사용한다.
개인은 자신이 타인과의 관계 속에서 누구인지를 정의하기 위해 특정 범주와의 동일시(identification)및 다른 범주와의 비교(comparison)과정을 사용한다.
우리는 이러한 표상을 직접 볼 수는 없지만, 실험 설계(experimental design), 인터뷰(interviews), 설문지(questionnaires)를 통해 그 내용을 발견할 수 있다.⁵
따라서 심리학적/인지적 관점은 정체성을 자기 관련 정보(self-relevant information)를 해석하고, 문제를 해결하며, 의사결정을 내리는 개인적 참조 틀(personal frame of reference)로 본다.
그리고 우리가 그러한 정보를 어떻게 처리하는지가 궁극적으로 일관된 정체성(coherent identity)을 발달시키는 능력에 영향을 미친다고 본다.⁶
이렇게 인지적으로 표상된 정체성은 비교적 안정적으로 유지되면서도, 시간에 따라 발달한다. 즉 연속성(continuity)이 강조된다.
예를 들어, Erikson의 여덟 단계 정신분석적 심리사회적 발달 모형(psychoanalytic model of psychosocial development)은 정체성을 개인의 삶의 발달이라는 심리적 과정 안에 위치한 것으로 특징짓는다.⁶
Marcia의 정체성 지위 모형(identity status model)은 Erikson의 이론을 경험적으로 조작화하려는 시도로, 다양한 신념과 역할에 대한 우리의 탐색(exploration)과 그에 대한 헌신(commitment)을 함께 구분한다. 이 모형은 개인을 네 가지 지위 중 하나로 분류하는데, 높은 탐색과 높은 헌신을 보이는 정체성 성취(identity achievement)부터 낮은 탐색과 낮은 헌신을 보이는 정체성 혼미(identity diffusion)까지 포함된다.⁶
연속선에서 사회적/관계적 끝으로 이동할수록, 이론들은 사회적 범주(social categories)와 집단 구성원성(group membership)의 영향을 강조하면서도, 정체성이 자기 범주(self-categories)로서 인지적으로 표상된다는 관점은 유지한다. 예를 들어 사회정체성 이론(Social Identity Theory)이 이에 해당한다.⁹˒¹⁰
이러한 관점은 전문직(professions), 조직(organisations), 기관(institutions)을 포함한 다양한 집단과 우리가 얼마나 잘 맞는지를 고려한다. 집단 구성원으로서의 적합감(sense of fit)은 우리 자신을 집단에 대한 정신적 표상과 비교함으로써 파악된다. 이 비교는 두 방식으로 이루어진다.
하나는 규범적 비교(normative comparison)로, “나는 나의 범주 관련 기대(category-related expectations)에 비추어 볼 때 잘 맞는가?”를 묻는 것이고,
다른 하나는 비교적 비교(comparative comparison)로, “나는 다른 집단 구성원들과 유사한가?”를 묻는 것이다.
그러나 이 관점은 집단 지위(group status), 집단 안정성(group stability), 집단 정당성(group legitimacy), 집단 침투 가능성(group permeability), 대안적 집단과의 적합성(fit with alternative groups)을 둘러싼 복잡성도 함께 고려한다.
더 나아가 사회정체성 이론은 개인을 단순하게 분류하는 것을 거부하고, 정체성에 대한 우리의 정신적 표상이 매우 복잡한 성격을 지닌다는 점을 받아들인다. 이 표상에는 여러 내집단(in-groups)이 포함될 수 있다. 따라서 우리는 하나의 내집단 표상을 유지하면서도 여러 사회적 정체성을 인정하기 위해 네 가지 교차 범주화 전략(cross-categorisation strategies)중 하나를 사용한다. 즉,
(1) 여러 집단 구성원성이 교차하는 지점에서 내집단을 분류하거나,
(2) 여러 정체성 중 하나를 더 우세한 것으로 순위화하거나,
(3) 정체성을 구획화하여 맥락적으로 드러나게 하거나,
(4) 여러 내집단 동일시의 합으로 병합하는 것이다.¹¹
이러한 전략은 개인차(individual differences), 개인적 가치(personal values), 상황적 요인(situational factors)의 영향을 받는다.
연속선의 사회적/관계적 끝에 위치한 이론들은 우리가 말하기(talk)와 사회적 상호작용(social interaction)을 통해 정체성을 구성한다고 주장한다.¹² 이러한 이론들은 상대주의적(relativist)이고 주관주의적(subjectivist)인 앎의 방식에 기반하며, 우리가 내적 인지 구조(internal cognitive structures)를 알 수 있다는 생각을 거부한다. 우리가 자신과 타인에 대해 어떻게 말하는지, 누구와 정렬하거나 정렬하지 않는지(align/misalign), 어떤 사회적 범주를 사용하는지, 그리고 어떤 더 넓은 사회적 담론(societal discourses)에 의존하는지는 모두 우리가 주장하는 정체성(claimed identities)을 가리킨다.¹² 정체성은 우리 마음속의 범주가 아니라, 사회적 상호작용을 통해 살아 움직이는 것이다. 이러한 이론들은 정체성 구성에서 개인의 행위주체성(individual agency)을 인정하면서도, 사회적 담론이 언어(language)와 같은 공유된 상징(shared symbols)을 포함한 사회적 실천(social practices)을 통해 어떻게 형성되고, 또 어떻게 그 실천을 통해 형성되는지를 강조한다.⁶˒¹²
이 단락은 정체성(Identity)을 바라보는 사회구성주의(Social Constructionism) 및 사회문화적(Sociocultural) 이론의 핵심을 아주 명확하게 요약하고 있습니다.
본질적으로 이 이론들은 정체성을 "내 머릿속에 고정된 무엇"이 아니라, "타인과의 상호작용 속에서 끊임없이 수행하고 만들어가는 과정(Doing identity)"으로 바라봅니다.
이 단락의 핵심 주장을 세 가지 주요 개념으로 풀어서 설명해 드리겠습니다.
1. 인지적 렌즈의 거부: 정체성은 '내면'이 아니라 '사이'에 있다
과거의 전통적인 심리학이나 인지주의적 관점은 정체성을 개인의 뇌나 내면에 존재하는 '인지 구조(cognitive structures)'로 보았습니다. (예: "나는 본래 내향적인 성격이다", "나는 확고한 직업관을 가진 사람이다"라는 식의 고정된 상태).
하지만 이 단락에서 말하는 상대주의적/주관주의적 접근은 이를 전면 거부합니다. 정체성은 개인이 혼자서 마음속으로 깨닫는 진리가 아니라, 특정 상황 속에서 타인과 관계를 맺을 때 비로소 드러나고 형성되는 결과물이라는 것입니다.
2. 언어와 상호작용의 정치학: 정렬(Alignment)과 범주화
우리가 일상적으로 던지는 말(talk)이나 대화 패턴은 단순한 의사소통 수단이 아니라, 자신의 위치를 주장(claiming identity)하는 적극적인 행위입니다.
정렬과 어긋남(Align/Misalign): 특정 집단이나 가치관에 자신을 동조시키거나, 반대로 거리를 두는 방식을 뜻합니다. 예를 들어, 병원 현장에서 누군가가 다른 직역의 전문가와 대화할 때 특정 전문 용어를 강하게 사용하거나 권위적인 태도를 취한다면, 이는 단순히 말을 하는 것이 아니라 '전문가로서의 우위'라는 정체성을 상호작용 속에서 주장하고 정렬하는 행위입니다.
사회적 범주(Social categories): 대화 속에서 "우리(의사/연구자)"와 "그들(환자/대중)"이라는 범주를 어떻게 나누어 사용하는지를 보면, 그 사람이 스스로를 어떤 집단의 일원으로 정체화하는지 알 수 있습니다.
3. 구조와 행위주체성의 춤 (Structure vs. Agency)
정체성 형성은 개인이 마음대로 100% 창조할 수 있는 것도 아니고, 사회에 의해 100% 억압되는 것도 아닙니다.
더 넓은 사회적 담론(Societal discourses): 의료계의 전문직업성 담론, 사회적 갈등 속에서의 의사 역할에 대한 기대 등 이미 사회에 깔려 있는 거대한 언어와 상징의 규칙(Shared symbols)이 존재합니다.
개인의 행위주체성(Individual agency): 동시에 개인은 그 담론 안에서 수동적으로 머물지 않고, 언어와 사회적 실천(Social practices)을 통해 기존의 담론을 자신만의 방식으로 변형하거나 활용하며 스스로의 정체성을 만들어갑니다.
우리는 정체성 이론의 몇 가지 예를 공유했지만, 탐색할 수 있는 이론은 훨씬 더 많다.¹˒⁶ 각각의 이론적 관점은 정체성 형성(identity formation) 또는 정체성 구성(identity construction)이 어떻게 일어나는지에 대한 우리의 관점을 형성한다. 즉, 그것이 심리학적 정체성 처리 지향성(psychological identity-processing orientations)에 부합하는 과정인지, 아니면 사회적으로 구성되는 과정인지에 대한 관점을 결정한다.⁶
그렇다면 왜 우리가 정체성을 어떻게 개념화하는지가 중요한가?
첫째, 자신의 이론적 지향(theoretical orientation)을 명확히 하는 것은 연구의 엄밀성(rigour)과 신뢰가능성(trustworthiness)을 높인다. 이는 자신의 존재론적, 인식론적, 방법론적 틀(methodological framework)과 연구 질문(research questions)을 정렬시키기 때문이다.
둘째, 이론적 정렬(theoretical alignment)은 같은 관점을 공유하는 연구의 축적된 흐름에 참여한다는 것을 의미한다. 이는 기존 문헌과 분리된 연구가 아니라, 해당 분야를 앞으로 나아가게 하는 연구에 기여하도록 만든다.
마지막으로, 정체성에 대한 자신의 입장을 명확히 하는 것은 전문직 정체성 형성(professional identity formation)을 지원하는 교육 실제(education practices)를 정렬하는 데 도움을 준다. 예를 들어,
정체성을 개인적 관점에서 바라보면 학생 중심 개입(student-focused interventions)으로 이어진다. 그러나 이는 시스템 안에 내재된 문화적 문제(cultural problems embedded within systems)를 개인이 홀로 씨름해야 하는 문제로 남겨두는 의도치 않은 결과를 낳을 수 있다.¹³
반대로, 사회화 과정(socialisation processes)을 강조하면 교육자들에게 학습환경(learning environment)을 정체성을 형성하는 힘(shaping force)으로 검토해야 할 책임이 부여된다.
궁극적으로 우리는 여러분이 “정체성(identit[ies])”이라고 말할 때 무엇을 의미하는지 검토할 것을 권한다. 이는 연구의 엄밀성을 위해서이며, 궁극적으로는 고품질의 실천 권고(high quality practice recommendations)를 개발하기 위해서이다.
같은 OSCE 영상을 두 명의 평가 전문가가 봤다고 해볼게요. 데이터도 똑같고, 쓰는 용어도 똑같아요. 타당도(validity), 신뢰도(reliability), 좋은 평가(good assessment)… 다 같은 단어를 씁니다. 그런데 두 사람이 내린 결론이 정반대예요. 한 명은 "평가자들 점수가 일치할수록 좋은 평가"라고 하고, 다른 한 명은 "오히려 의견이 다양하게 갈릴수록 좋은 평가"라고 합니다.
누가 틀린 걸까요? 사실 둘 다 틀리지 않았을 수 있어요. 두 사람이 서로 다른 철학적 입장(philosophical positions) 위에 서 있기 때문이거든요. 더 골치 아픈 건, 정작 본인들은 그 사실을 모르고 있는 경우가 많다는 점이에요.
이번 글에서 소개할 논문은 바로 이 지점을 정면으로 파고듭니다. 평가가 점점 더 "보는 눈에 따라 달라지는" 일이 되어 가는데, 정작 우리는 그 '보는 눈(=철학적 입장)'에 대해 충분히 이야기하지 않고 있다는 거죠.
🤔 무슨 문제일까요?
저자들이 던지는 핵심 문제의식은 이래요. 예전에는 평가 개념과 모델이 측정 패러다임, 행동심리학, 정신측정학(psychometrics)의 영역이라고 어느 정도 합의가 되어 있었어요. 그런데 지금은 그렇지 않습니다. 구성주의/해석주의(constructivism/interpretivism), 사회인지주의(socio-cognitivism), 실재론·반실재론(realist/anti-realist views), 실용주의(pragmatism) 등 다양한 철학적 입장이 '동시에' 평가 안에서 작동하고 있어요.
문제는 여기서 시작됩니다. 입장이 다르면 같은 단어도 다르게 해석되거든요.
어떤 사람에게 주관성(subjectivity)은 평가에서 끌어안아야 할 풍부함이고, 다른 사람에게는 방어 가능성을 위협하는 요소예요.
어떤 사람에게 평가자들의 의견 수렴(rater convergence)은 좋은 신호이고, 다른 사람에게는 평가자들의 의견 발산(rater divergence)이야말로 풍부함의 증거예요.
저자들은 이런 차이가 단순한 맥락 차이나 취향의 문제가 아니라고 못 박습니다. 평가를 어떻게 설계하고 실행할지에 대한 근본적이고 서로 다른 가정이라는 거죠. 그리고 이 논문의 가장 핵심적인 통찰이 여기 있어요. 바로 '안에서(within)' 벌어지던 논쟁이 '가로질러(across)' 벌어지는 논쟁으로 바뀌었다는 진단입니다.
평가에서 어느 정도의 논쟁은 불가피하지만, 지금까지의 논쟁은 대부분 하나의 철학적 입장 안에서 이루어졌습니다(예: 오차를 어떻게 최소화할 것인가). 반면 최근의 논쟁은 서로 다른 철학적 입장을 가로질러 벌어지고 있습니다(예: 오차라는 개념이 과연 유용한가).
"While some debate in assessment is inevitable, most have been within philosophical positions (e.g., how best to minimize error), whereas newer debates are happening across philosophical positions (e.g., whether error is a useful concept)."
차이가 느껴지시나요? "오차를 어떻게 줄일까"는 같은 운동장 안에서의 논쟁이에요. 그런데 "오차라는 개념 자체가 의미가 있나"는 아예 다른 운동장끼리 부딪히는 논쟁이죠. 후자는 한쪽을 이해하는 것이 오히려 다른 쪽을 오해하게 만들기도 해요.
참고로 저자들이 말하는 '철학적 입장'의 정의는 이렇습니다.
평가 연구자가 평가의 문제와 해법을 들여다볼 수 있도록 렌즈를 제공하는, 인정된 가정과 신념의 집합 또는 지적 틀.
"sets of recognized assumptions and commitments or intellectual frameworks that provide assessment scholars with lenses for examining assessment problems and solutions."
🕰️ 어쩌다 여기까지 왔을까요?
저자들은 이 변화를 토마스 쿤(Kuhn)의 패러다임(paradigm) 전환에 비유해요. 새로운 패러다임은 기존 방식에 대한 '불만'이 쌓이는 순간 등장한다는 거죠. 예를 들어 Hodges는 점수를 이리저리 합산해서 역량을 판정하는 방식에 강한 의구심을 표한 바 있어요.
다만 의학교육(HPE, health professions education)에는 한 가지 중요한 차이가 있다고 봅니다. 보통 패러다임 전환은 '낡은 것이 새것으로 교체되는' 모습인데, 평가 분야에서는 그게 아니라는 거예요. 옛 입장이 사라지는 게 아니라, 더 많고 더 다양한 입장이 한꺼번에 공존하게 됐다는 거죠.
그러니까 정신측정학·실증주의 뿌리가 사라진 게 아니에요. 거기에 구성주의, 사회인지주의, 실용주의가 '나란히' 얹힌 상태인 겁니다. 그리고 이 입장들은 저마다 "이게 좋은 평가야"라는 서로 다른 주장을 들고 있어요. 그러다 보니 이제는 평가에 대한 공통의 철학적 관습이 사라진 상태가 됐습니다. 이게 기회이면서 동시에 혼란인 거죠.
🔬 실전 예시 ① 평가자 데이터를 어떻게 읽을까
말이 추상적이니까 저자들이 든 구체적인 예시를 볼게요. OSCE에서 의사 평가자의 점수에 표준화 환자(SP)의 관점을 더하자는 연구가 하나 있었어요. 서로 다른 경험과 시각을 가진 평가자들의 점수와 서술을 합치자는 제안이었죠. 이 똑같은 연구를 두 독자가 정반대로 읽습니다.
독자 1번 (후기실증주의/실재론 관점) 🟦
역량(competence)은 관찰자와 무관하게 사람 안에 존재하는 안정적 특성이다(이른바 잠재특성 모델, latent-trait model).
평가를 잘하면 그 역량을 (약간의 오차는 있어도) 포착할 수 있다.
서로 다른 평가자 집단의 의견이 일치하면, 그건 진실에 더 가까워졌다는 뜻이다.
따라서 의견을 모으는(수렴) 활동은 바람직하고, 일치도가 높아질 때 "좋은 평가"라고 말할 수 있다.
독자 2번 (구성주의/반실재론 관점) 🟥
역량은 측정 대상이 아니라 사회적으로 구성되는 것이다. 관찰자와 학습자가 특정 시간·공간에서 상호작용하며 만들어진다.
역량은 내부에 고정된 특성이 아니라 상황적이고 관계적이다.
의견 일치를 인위적으로 유도하면(예: 훈련, 표준화 도구) 오히려 우리가 알 수 있는 것을 약화시킨다.
따라서 더 적은 게 아니라 더 많은 다양성을 추구해야 "좋은 평가"라고 말할 수 있다.
같은 연구, 같은 데이터인데 "좋은 평가"의 의미가 정반대로 갈리죠?
저자들이 여기서 강조하는 포인트가 세 가지예요.
평가자 의견을 합친다는 설계 자체가 이미 철학적으로 물든 선택이다.
이건 방법(method)의 문제가 아니다. 똑같은 방법도 서로 다른 철학적 입장과 연결될 수 있다.
어느 한쪽이 옳다는 얘기가 아니다. 핵심은 양쪽 모두 자신이 어떤 해석 위에 서 있는지 분명히 인식해야 한다는 것이다.
⚖️ 실전 예시 ② '타당도'마저 흔들린다
두 번째 예시는 평가의 가장 기본이라 할 수 있는 타당도(validity)예요. 타당도 근거(validity evidence)가 도대체 무엇을 의미하는지조차 해석이 갈립니다. 여기서 두 진영이 부딪혀요.
Markus & Borsboom: Kane의 타당화(validation) 틀이 진리(truth)를 제대로 다루지 않는다고 비판해요. 이들은 진리를 주장하지 않는 정당화된 믿음(justified beliefs)과, 진리를 주장하는 정당화된 참된 믿음(justified true beliefs)을 구분합니다. 그리고 진리(실재와의 대응)가 중요하다고 봐요. 왜냐하면 우리는 틀린 주장도 충분히 정당화해 버릴 수 있기 때문이죠.
Kane: 입장이 달라요. 과학자가 '지금 여기서' 합리적이고 잠정적으로 내릴 수 있는 결론에 집중합니다. 충분한 근거로 일관되게 뒷받침되면 그것으로 '정당화된 믿음'이 성립하고, 거기에 굳이 '진리'라는 딱지를 붙일 필요는 없다는 거예요. 중요한 건 그 정당화가 같은 생각을 공유하는 동료 공동체(like-minded community of peers)가 보기에 적절한가입니다.
결국 타당도 이론가들끼리도 '타당도가 무엇을 뜻하는가'를 다르게 해석한다는 거죠. 그래서 저자들은, 평가에서 그토록 널리 쓰이는 '타당도 근거'마저도 해석의 문제를 피해 갈 수 없다고 정리합니다. 무엇이 타당도의 정당한 근거인지조차 결국 여러 해석적 요인에 달려 있다는 거예요.
🧭 실용주의도 정답은 아니에요
여기서 많은 분들이 이렇게 생각하실 거예요. "복잡한 철학 얘기 말고, 그냥 실용적으로(pragmatic) 가면 되는 거 아냐?" 실제로 평가 현장에서 정말 자주 나오는 말이죠. 한 연구에서 프로그램 책임자들도 "저는 아주 실용적인 관점에서 봤어요"라고 말하면서, 마치 실용성이 모든 문제의 해법인 것처럼 여기곤 했어요.
그런데 저자들은 바로 이 지점을 날카롭게 찌릅니다.
더 깊은 해석상의 철학적 쟁점에서 실무자를 면제시켜 주기 위해 실용주의를 끌어오는 것은 강력한 수사적 전략이지만, 그렇다고 해서 해석 과정 자체를 우회할 수는 없습니다.
"The reference to pragmatism to absolve practitioners of deeper philosophical issues of interpretation is a powerful rhetorical move, but it cannot circumvent interpretative processes."
여기서 중요한 구분이 나와요. 일상어로서의 '실용적'(= 그냥 현실적으로 편하게)과, 고유한 역사·가정·신념을 가진 철학으로서의 실용주의(pragmatism)는 다르다는 거예요. 그리고 후자, 즉 진짜 실용주의 안으로 들어가 봐도 해석은 또 갈립니다. 저자들은 '진리(truth)'를 실용주의 철학자들이 어떻게 다르게 다루는지 보여줘요.
퍼스(Peirce): 진리란 모든 탐구가 끝난 지점에서 믿게 되는 것. 진리는 발견될 수 있고 시간이 지나도 유지된다고 봤어요(대응 이론, correspondence theory에 가까움).
제임스(James): 정합 이론(coherence theory)을 택했어요. 진리는 우리를 가치 있게 이끌어 주는, 믿음들 사이의 일관성. 꼭 실재를 반영하는 건 아니라고 봤죠.
듀이(Dewey): 한발 더 나아가요. 어떤 믿음도 틀린 것으로 드러날 수 있다며 '진리'를 아예 약화시킵니다. 퍼스의 대응 이론도, 제임스의 정합 이론도 거부하고, 앞으로의 행동을 이끄는 잠정적·실용적 판단을 선호했어요.
로티(Rorty): 우리가 생각하는 것과 별개로 존재하는 객관적 세계는 없다고 봤어요. 진리란 알 수 없는 것이라 별로 할 말이 없다는 거죠. 진리는 그저 모든 반박을 견뎌 낸 것일 뿐이에요.
보세요. '실용주의'라는 하나의 입장 안에서도 진리를 보는 눈이 이렇게나 다릅니다. 그러니 "우리 실용주의로 갑시다!"라고 선언하는 것만으로는 의도치 않은 해석을 막을 수 없어요. 오히려 철학적 입장을 어설프게 갖다 붙이면 명료해지기는커녕 더 흐려질 수도 있다는 게 저자들의 경고입니다.
💡 그래서 어쩌라는 걸까요?
"사람마다 해석이 다른 거, 뭐 새삼스럽냐?" 하실 수도 있어요. 저자들도 이 반응을 예상합니다. 그런데 핵심은, 지금 평가 현장에 서로 다른 '규칙'들이 동시에 굴러가고 있다는 데 있어요. 그래서 무엇이 좋은 평가인지 판단할 때 실질적인 불확실성이 생깁니다.
저자들이 정말 우려하는 건 이거예요.
우리가 우려하는 것은, 실제 현장에서 교육자들이 이런 서로 다른 가정과 방법론적·해석적 규범을 자기도 모르게(때로는 은밀하게) 적용한 끝에, 동일한 평가 프로그램이나 평가 상황을 두고도 무엇이 양질의 평가인지에 대해 서로 다른 입장에 도달할 수 있다는 점입니다.
"Our concern is that in practice educators may unknowingly or insidiously apply these different assumptions, methodological and interpretive norms, and therefore, settle on different views on what serves as quality assessment even for the same assessment program or event."
즉, '가정이 다른 것' 자체는 어쩌면 당연해요. 문제는 그 다름을 본인도 모른 채 적용한다는 데 있죠. 이게 방치되면 어떻게 될까요? 평가를 어떻게 진행해야 할지 혼란스러워지고, 심하면 어떤 평가 활동이나 결과든 그 정당성(legitimacy)을 의심받는 빌미가 됩니다. 또 이 문제는 단순히 과학이나 존재론·인식론의 문제가 아니라, 누구의 해석이 지배적인가, 왜 그러한가 하는 윤리와 가치, 위치성(positionality)의 문제이기도 해요.
그래서 저자들의 결론이자 제안은 명확합니다. 평가를 본질적으로 해석 과정(interpretive process)으로 인정하자는 거예요. 그리고 교육 연구자들이 연구에서 이론적·개념적 틀(theoretical/conceptual framework)을 분명히 밝히듯, 평가를 계획·설계·실행·평가하는 모든 단계에서 철학적 입장을 명시적으로(philosophically explicit) 드러내자는 겁니다.
평가의 해석 과정이 더 투명해지고, 이해와 공정한 비판에 열려 있을 수 있도록, 가정과 신념을 명시적으로 드러내야 합니다.
"assumptions and commitments should be made explicit so that the interpretive processes of assessment can be more transparent and open to understanding and fair criticism."
여기서 오해하면 안 되는 게, 저자들은 평가를 뒤엎자고 하는 게 아니에요. 평가를 어떻게 개념화하고 표현하는지에 좀 더 주의를 기울이자는 것뿐입니다. 숨은 가정을 꺼내 놓고 이야기하자는 거죠.
✏️ 마치며
읽으면서 우리 현장이 자연스럽게 떠오르지 않으셨나요? 같은 임상실습 평가를 두고도 어떤 교수님은 "평가자 간 일치도가 낮아서 문제"라고 하고, 어떤 분은 "다양한 시선이 담겨서 오히려 좋다"고 합니다. 역량위원회(competence committee)에서 점수 합산을 두고 의견이 갈리는 장면도 마찬가지고요. 이게 단순한 의견 차이가 아니라 서로 다른 철학적 입장이 부딪히는 순간일 수 있다는 거예요.
이 논문이 주는 실천적 메시지는 의외로 담백합니다. 평가를 설계하거나 그 결과를 해석할 때, "나는 지금 어떤 가정 위에 서 있지?"를 한 번 스스로에게, 그리고 동료에게 물어보는 것. 그 작은 명시화가 불필요한 소모적 논쟁을 줄이고, 우리가 진짜 같은 이야기를 하고 있는지 확인하는 출발점이 됩니다.
평가는 결국 숫자나 도구의 문제가 아니라, '우리가 무엇을 보려 하는가'에 대한 합의의 문제인지도 모르겠습니다.
보건전문직 교육(health professions education, HPE)에서 평가는 이제 더 넓고 더 다양한 해석 과정(interpretive processes)을 수반한다. 동등하게 자격을 갖춘 교육자나 연구자라 하더라도, 평가 문제에 접근할 때 사용할 수 있는 철학적 입장이 서로 다르기 때문에, 평가 과정과 평가의 질에 대해 서로 다른 결론에 도달할 수 있다.¹ 우리 분야에는 해석 과정이 실제 평가에 어떻게 영향을 미치는지를 보여주는 많은 사례가 있다.
예를 들어,
역량(competence)은 수련생 내부에 존재하는 인지적 구성개념(cognitive construct), 즉 잠재특성 모형(latent-trait model)으로 이해될 수 있다.
² 또한 역량은 둘 이상의 개인 사이의 상호작용의 산물, 즉 사회적으로 구성된 것(socially constructed)으로 이해될 수도 있다.³
또는 그 중간에 위치하는 것, 즉 사회인지적 과정(socio-cognitive process)으로 이해될 수도 있다.⁴
평가에서 실천적 해석과 질에 관한 해석도 현재 여러 방식으로 작동하고 있다.
어떤 사람들에게 평가 과정은 평가자 간 차이(rater divergence)를 활용할 때, 즉 평가자들이 보이는 차이를 풍부함으로 받아들일 때 ‘더 나은’ 것이 된다. 반면 다른 사람들에게 ‘더 나은’ 평가는 평가자 간 수렴(rater convergence)을 갖는 것, 즉 높은 합의도나 일관성을 선호하는 것이다.⁵
마찬가지로 주관성(subjectivity)은 평가 실천에서 받아들여야 할 것으로 논의되기도 하고, 방어가능성(defensibility)에 대한 위협으로 논의되기도 한다.⁶˒⁷ 우리는 신뢰도(reliability)를 지지하는 주장과, 중요한 타당도 지표로서 질적 엄격성(qualitative rigor) 개념을 지지하는 주장을 모두 찾을 수 있다.⁸˒⁹
어떤 사람들에게는 특정 통계적 접근, 예를 들어 베이지안 기법(Bayesian techniques)이 역량위원회(competence committee) 과정을 지원할 수 있지만, 다른 사람들에게는 그렇지 않다.¹⁰˒¹¹
이러한 차이는 맥락적 변이(contextual variations)나 단순한 선택 이상의 것이다. 오히려 이는 평가를 어떻게 가장 잘 설계하고 실행할 것인지, 그리고 무엇이 질 높은 평가 과학과 실천인지에 관한 논쟁을 형성하는 근본적이고 지침이 되는 서로 다른 가정(fundamental and guiding assumptions)을 나타낸다. 이러한 해석적 문제가 전면에 제기되지 않는다면, 논쟁은 비생산적인 상태로 남을 수 있다.
이러한 평가 관련 질문들과 다른 질문들에 대해 어떤 입장을 취하느냐는, 동일한 맥락에서도 서로 다른 교육자들에 의해 적절하다고 판단될 수도 있고 동시에 부적절하다고 판단될 수도 있다. 이는 좋은 평가를 구성하는 것이 무엇인지까지 포함하여 평가의 특징들이 확장되는 철학적 입장들에 의해 형성되고 있기 때문이다. 평가 지침도 일반적으로 이 문제에 대해서는 침묵한다.¹²˒¹³ 여기서 우리는 “철학적 입장(philosophical positions)”이라는 용어를 “평가 학자들에게 평가 문제와 해결책을 검토할 수 있는 렌즈를 제공하는, 인정된 가정과 헌신 또는 지적 틀의 집합”으로 사용한다.¹ 예를 들어, 실증주의(positivism)와 구성주의(constructivism)는 평가의 역할, 선택, 특징, 질에 대해 서로 다른 결론을 제공한다. 서로 다른 철학적 입장은 평가 과학과 실천의 계획, 수행, 평가에서 다양한 해석을 낳는다. 평가 실천에 정보를 제공해온 우리의 연구와 경험, 예를 들어 평가 실천에서 평가자를 어떻게 참여시켜야 하는지, 평가에서 심리측정학(psychometrics)의 역할은 무엇인지, 그리고 프로그램적 평가(programmatic assessment)와 평가 전반에서 이러한 문제를 탐구해온 이전 연구는, 철학적 다양성, 진화, 긴장이 유동적인 지금 평가 과학과 실천의 기저에 있는 긴장의 역할을 인식하게 해주었다.¹˒¹⁴–¹⁸ 철학적 관점에 의해 형성되는 해석은 많은 평가 작업 아래에 놓여 있는 것처럼 보이지만, 그 함의는 종종 숨겨져 있으며, 이로 인해 의도하지 않은 해석과 어떻게 나아가야 할지에 대한 혼란이 생긴다.¹⁶ 우리는 평가에 접근하는 새로운 방식들이 등장했지만, 그 기저에 있는 철학적 입장의 해석적 성격은 충분히 주목받지 못했다고 주장한다. 그 이유는 추가 조사가 필요하지만, 우리는 이전에 이 문제가 평가절하되고 있을 가능성, 철학적 헌신보다 방법에 초점이 맞추어져 있을 가능성, 경계가 불명확할 가능성, 그리고 아직 모범 실천(best practices)에 이러한 기대가 포함되어 있지 않을 가능성을 주장한 바 있다.¹⁶ 기존 지침은 이 주제를 우선순위에 두지 않으며,¹⁹ 최근 연구는 이러한 입장들이 여전히 충분히 보고되지 않고 있음을 시사했다.¹⁶
이 논문에서 우리의 목적은 이 해석적 문제를 드러내는 것이다. 우리는 HPE 평가의 현재 상태가 이를 요구한다고 본다. 평가에 대해 생각하는 방식의 발전은 평가 문제에 대한 해결책으로 볼 수도 있지만, 그 자체가 하나의 문제로 볼 수도 있기 때문이다. 평가에서 철학적 입장이 확장되면서, 교육자들은 유사한 평가 개념에 서로 다른 해석을 적용하고 있다. 그 결과, 유사한 활동과 언어를 사용함에도 불구하고, 평가를 통해 주장되는 것, 그리고 질로 간주되는 것은 사람마다 달라질 수 있다. 이는 어떻게 나아가야 할지에 대한 불확실성을 낳고 있으며, 더 나쁘게는 어떤 평가 활동이나 평가 결과의 정당성을 문제 삼을 기회를 제공하고 있다. 평가에서 어느 정도의 논쟁은 불가피하지만,
기존의 논쟁 대부분은 철학적 입장 내부에서 이루어졌다. 예를 들어, 오류를 가장 잘 최소화하는 방법이 그러하다.
반면 새로운 논쟁은 철학적 입장들 사이에서 일어나고 있다. 예를 들어, 오류가 유용한 개념인지 여부가 그러하다.
평가에 접근하는 새로운 방식들이 등장했지만, 그 기저에 있는 철학적 입장의 해석적 성격은 충분히 주목받지 못했다. 우리의 의도는 이 영역에서 대화와 발전을 촉진하여 교육자들이 서로를 이해하도록 돕는 것이다.
다음으로 우리는 철학적으로 형성된 이러한 해석 과정과 그것이 보건전문직 교육에서 어떻게 전개되고 있는지를 세 가지 방식으로 드러낼 것이다.
첫째, 우리가 어떻게 여기까지 오게 되었는지를 설명하기 위해, HPE의 현재 평가 맥락을 철학적 수준에서 간략히 요약한다. 특히 서로 다른 철학적 입장과 관련된 서로 다른 가정에 근거하여 평가 활동을 보고 주장하는 방식이 더 많아졌다는 점을 탐구한다.
둘째, 실천에서의 함의를 보여주기 위해 두 가지 예시를 제시한다. 하나는 HPE에서 이제 흔해진 서로 다른 철학적 가정을 적용함으로써 평가 연구물의 독자가 의도하지 않은 해석에 도달할 수 있는 방식이고, 다른 하나는 유사하게 강한 타당도 주장이 평가 자료의 의미와 자료가 함의하는 바에 대해 서로 다른 관점으로 이어질 수 있는 방식이다.
셋째, 철학적 입장을 그 가정과 헌신에 세심하게 주의를 기울이지 않고 단순히 불러오는 것, 즉 해결책으로 동원하는 것의 잠재적 어려움을 검토한다. 우리는 이 예시로 실용주의(pragmatism)를 선택했다. 왜냐하면 철학적 영향에 대해 질문받을 때, 교육자들이 평가에서 실천적이거나 실용적이라는 것이 받아들여지는 해결책이라고 주장하는 경향을 보고 있기 때문이다.¹ 철학적 입장을 일반적으로 공허하거나 잘못된 방식으로 사용하는 것을 반복하지 않기 위해, 우리는 실용주의를 하나의 예시로 검토한다. 이를 통해 특정 철학적 입장 내부에서도 추가적인 다양한 해석과 적용의 가능성이 존재함을 보여준다. 이러한 주장들은 본질적으로 존재론(ontology), 인식론(epistemology), 가치론(axiology)의 문제와 연결되어 있다. Varpio와 MacLeod를 보라.²⁰
마지막으로, 우리는 평가에 대한 철학적으로 명시적인 접근(philosophically explicit approach), 즉 메타 접근(meta-approach)을 요청하며 결론을 맺는다. 이 접근은 평가가 근본적으로 해석 과정이라는 점을 강조한다. 이는 맥락 안에서 가정을 세심하게 밝혀내고 정당화하는 작업을 요구한다.
동일한 평가 접근에 대한 다양한 해석: 우리는 어떻게 여기까지 오게 되었는가 Variable interpretations of the same assessment approaches: How we got here
한때 평가 개념과 모형은 측정 패러다임(measurement paradigms), 행동주의 심리학(behavioral psychology), 심리측정학(psychometrics)의 산물이라고 가정할 수 있었다. 그러나 이제 이는 더 이상 사실이 아니며, 보편적으로 받아들여지지도 않는다.²¹˒²² 지속적인 평가의 도전과제, 그리고 무엇이 평가되고 있는지, 평가가 무엇을 의미하는지, 평가가 실천에서 어떻게 실행되어야 하는지에 대한 비판적 검토는 평가 문제와 해결책을 바라보는 익숙한 방식 일부를 억제하고, 다른 방식을 도입하게 했다.⁶˒⁹˒²³
예를 들어 어떤 사람들은 “실증주의적 토대(positivist underpinnings)”를 줄일 것을 주장하고,²² 다른 사람들은 심리측정 정보가 정당화될 뿐 아니라 핵심적이라고 주장하며,¹⁵ 대부분은 철학적 입장을 전혀 언급하지 않는다.¹⁶ 평가에서 평가자들이 무엇을 어떻게 하는지를 검토하면서, 연구자들은 교수자를 오류의 원천, 즉 심리측정학적 원리로 보지 말고, 사회적으로 매개된 관찰자(socially mediated observers)로 생각하도록 촉구해왔다. 이들의 기여는 다르게, 예를 들어 질적이고 구성주의적인 접근을 사용하여 검토되어야 한다는 것이다.²²˒²⁴
다른 연구자들은 철학적 전환이 존재하는 지점이나 필요한 지점을 보여주고 있다. 예를 들어, 프로그램적 평가는 시간이 지나면서 서로 다른 철학적 입장에 의해 형성되어왔다.²⁵ 이 접근은 처음에는 향상된 신뢰도를 촉진하기 위해 더 많은 표집 시간과 자료 지점이 필요하다는 점을 강하게 강조하는 것으로 시작되었지만,²³ 이제는 판단(judgment)을 지지하고, 더 질적인 엄격성과 방어가능성 개념을 옹호하는 방향으로 주장하고 있다.²⁶ 이는 프로그램적 평가가 진화함에 따라, 새로운 통찰을 도출하기 위한 것이었든 그것을 정당화하기 위한 방식이었든, “작동 중인(in play)” 철학적 입장이 변화했음을 시사한다.
또한 역량위원회 맥락에서, 어떤 연구자들은 철학적 입장, 예를 들어 실증주의적 토대가 “수련생 수행평가의 복잡하고 사회적으로 상황화된 본질에는 적합하지 않다”고 강조해왔다. 이는 우리가 역량위원회 작업을 이끌고 있다고 가정해온 것이 도전받고 있음을 시사한다.¹⁰(p.732)
종합하면, 이러한 예시들은 평가 문제와 그 해결책이 다양한 철학적 입장의 적용에 의해 어떻게 주장되고 형성되어왔으며, 계속해서 그렇게 되고 있는지를 보여준다.
평가에 영향을 미치는 철학적 입장의 이러한 진화는 Kuhn이 제시한 생각과 유사하다.²⁷ Kuhn은 새로운 패러다임이 불만족의 순간에 담론으로 들어온다고 주장했다. 다만 HPE에는 중요한 차이가 있다. 예를 들어, Hodges는 “일련의 숫자 점수를 재조합하여 역량 판정에 도달하는 것에 대해 우리는 강한 유보를 가져야 한다”고 쓰면서, 심리측정학적 또는 측정 관점이 만족스럽지 않은 여러 이유를 제시했다.²¹(p.566) 그러나 현재 존재하는 것은 오래된 철학적 입장이 다른 하나로 대체되는 것이 아니라, 추가적이고 더 다양한 철학적 입장들이 동시에 작동하는 상황으로 보인다.¹
예컨대 측정, 심리측정학, 실증주의 또는 후기실증주의(post-positivism)의 뿌리에 더하여, 이제는 다양한 철학적 입장, 예를 들어 구성주의/해석주의(constructivism/interpretivism), 사회인지주의(socio-cognitivism), 실재론과 반실재론(realist and anti-realist views), 실용주의(pragmatism)에 의해 이끌리는 접근들이 존재한다.⁴˒²⁸–³¹
각각은 무엇이 좋은 평가로 간주되는지에 대해 저마다의 주장을 가지고 있다.
평가에 의해 계속 도전받고 평가 문제를 이해하고 해결하는 데 도움이 되는 방식을 찾는 과정에서, 더 많은 철학적 입장들이 존재하거나 앞으로 등장할 가능성이 크다.
평가의 여러 특징에 따라 후기실증주의/객관주의(post-positivism/objectivism)와 구성주의/해석주의(constructivism/interpretivism)를 나란히 비교한 것은 Tavares et al.¹을 보라.
관찰자가 이 두 입장에서 어떻게 개념화되는지에 관한 관점은 Govaerts et al.²²을 보라.
사회인지적 렌즈에서 평가가 무엇일 수 있는지에 대한 관점은 Mislevy⁴를 보라.
실재론과 반실재론의 함의는 Borsboom³⁰을 보라.
우리가 여기까지 오게 된 것, 즉 평가 실천과 담론에서 해석 과정이 세심한 주의를 요구하는 지점에 이르게 된 것은, 평가 문제를 이해하고 해결책을 제공하려는 노력의 결과이다. 이러한 노력은 오늘날 평가에 정보를 제공하는, 가능하고 이제는 “동등하게 관련성 있는(equally relevant)” 많은 철학적 입장을 낳았다.
실제로 작동하는 해석 과정 Interpretive processes in action
예시: 평가 근거에 대한 독자의 해석 Example: Reader interpretations of assessment evidence
예시로, 최근 발표된 “Augmenting Physician Examiner Scoring in Objective Structured Clinical Examinations: Including the Standardized Patient Perspective”라는 논문을 생각해보자.⁵ 이 연구는 고부담 OSCE(high-stakes OSCE) 맥락에서 채점 실천을 개선하는 방법을 탐구했다. 이 연구의 핵심 주장 중 하나는 동일한 사건과 동일한 응시자에 대해 서로 다른 경험, 전문성, 관점을 가진 의사와 표준화 환자(standardized patients)의 관찰자 기여, 이 경우 점수와 서술을 결합하는 것이 바람직하다는 것이었다. 이를 어떻게 적절히 수행할 것인지, 더 나아가 이를 아예 수행해야 하는지 여부조차도, 지식 생산자와 사용자가 모두 수행하는 해석 과정이다. 이 경우 그 해석 과정은 해당 아이디어를 고려할 때 사용되는 서로 다른 철학적 입장에 의해 형성된다. 두 가지 서로 다른 관점에서 이 연구를 검토하기 전에, 우리의 의도는 이 뛰어나고 시의적절한 연구의 질이나 기여를 비판하는 것이 아님을 밝힌다. 이 연구는 오직 시의적절한 주제를 대표하고, 질 높은 연구이며, 다른 곳에서 서로 다른 철학적 입장과 관련되어온 평가자 역할의 예시를 취할 기회를 제공하기 때문에 선택되었다.²⁴
위에서 설명한 연구를 서로 다른 철학적 입장에서 해석하는 두 명의 가상 독자를 생각해보자.
첫 번째 독자가 역량은 관찰자와 독립적으로 모든 사람 안에 존재하는 안정적인 특성(stable trait)이며, 잘 수행된 평가는 일정 정도의 오류를 수반하더라도 한 사람이 가진 역량의 정도를 포착하거나 대표할 수 있다고 본다고 가정하자.
이는 후기실증주의(post-positivist) 또는 실재론적 관점(realist perspective)과 일치할 것이다. 첫 번째 독자는 더 방어가능한 평가를 산출하는 것은 서로 다른 관찰자 집단이 수행이 역량과 관련하여 무엇을 의미하는지에 대해 동의할 때 달성된다고 주장할 수 있다. 그들이 동의한다면, 이는 평가받는 개인에 관한 진실에 대한 명확한 표상 또는 더 가까운 근사치(closer approximations of the truth)를 나타내는 것일 수 있다.
이 관점에서 해당 연구를 고려하면, 첫 번째 독자는 자신의 해석에 근거하여 서로 다른 평가자 관점이 함께 모이는 것이 저자들이 주장하듯이 바람직하다고 주장할 수 있다. 그리고 이를 지원하는 조치가 정당화되며, 평가자 간 합의가 향상될 때 좋은 평가 질에 대한 주장이 가능하다고 볼 수 있다.
그러나 다른 해석도 가능하다. 두 번째 독자는 역량은 측정될 수 있는 것이 아니라 사회적 구성물(social construction)이라고 믿을 수 있다. 즉, 역량은 특정 시간과 장소에서 관찰자와 학습자가 상호작용하는 것을 포함하는 것이다.
역량은 안정적인 내적 특성이 아니라 상황적이고 대인관계적이다. 이는 구성주의적(constructivist) 또는 반실재론적 관점(anti-realist perspective)과 일치할 것이다. 두 번째 독자는 평가 합의와 이를 촉진하려는 모든 노력, 예를 들어 훈련이나 표준화된 도구를 통한 노력은 우리가 역량에 대해 알 수 있는 것을 강화하기보다는 약화시킬 것이라는 관점을 취할 수 있다.
두 번째 독자에게는 다양한 관점을 촉진하고 수집하며, 맥락의 역할을 중요한 특징으로 허용하는 것이 더 유리하다. 이 둘을 오류의 원천으로 취급하기보다는 말이다. 여기서 두 번째 독자는 좋은 평가 질을 주장하기 위해서는 그러한 기여에서 더 적은 변이가 아니라 더 많은 변이를 추구해야 한다고 주장할 수 있다.
여기서 고려해야 할 세 가지 요점이 있다.
첫째, 평가 모형 설계에서 평가자 기여를 결합하는 것은 철학적으로 형성된 접근을 대표한다. 이는 평가자가 무엇을 제공하는지, 그들의 기여를 어떻게 가장 잘 사용하고 구조화해야 하는지, 그리고 좋은 또는 방어가능한 평가자 기반 평가 모형(rater-based assessment models)이 어떤 모습인지와 관련된 기저의 믿음, 가치, 가정에 의해 형성된 해석에 의존한다. 이루어진 해석과 선택을 정당화한다는 것은 이러한 관점과 정렬되는 특정 타당도 고려사항과 주장을 활용한다는 것을 의미한다.
둘째, 위의 예시와 우리의 일반적 주장은 방법의 문제가 아니다. 유사한 평가 방법이 서로 다른 철학적 입장과 관련될 수 있다.강조점이 방법 자체에 놓이고, 그 방법이 어떻게 또는 왜 적절한지, 그것이 무엇을 의미하는지, 동일한 방법에 대한 서로 다른 해석이 어떻게 일어날 수 있는지에 놓이지 않는다면, 우리는 더 나아가지 못할 것이다.
셋째, 이 예시는 한 관점이 올바른 관점이라거나, 하나가 다른 것보다 더 낫다는 것을 시사하려는 것이 아니다. 오히려 우리는 이 맥락에서 어느 접근이든 그 해석적 성격(interpretive nature)에 명확하게 주의를 기울이는 것이 중요하다는 점을 강조하려 한다. 문제와 해결책을 다르게 볼 수 있는 이러한 기회는 혼합방법 연구(mixed methods research)에서 변증법적 입장(dialectical stance) 또는 다원주의(pluralism)로 설명되어 왔으며, 평가에서도 기회이자 도전이 된다.¹˒³²˒³³ 위협과 위험은 서로 다른 독자들이 서로 간에, 또는 저자가 의도한 기여와 다른 해석을 생성할 수 있다는 점이다. 이는 관련된 모든 사람에게 문제가 될 수 있다.
1. 평가자의 역할은 단순한 '기술'이 아니라 '철학'의 문제다
쉬운 설명: 평가 과정에서 평가자의 판단을 어떻게 활용할 것인가는 단순한 시스템 설계가 아니라, "평가자의 주관적 판단을 어떻게 생각하는가?"라는 근본적인 철학(가치관)에 달려 있다는 뜻입니다. 예를 들어, 평가자를 '오차를 줄여야 하는 불완전한 측정 도구'로 볼 것인지, 아니면 '풍부한 맥락을 해석해 내는 전문가'로 볼 것인지에 따라 평가 모형이 완전히 달라집니다. 따라서 특정 평가 방식을 도입했다면, 기저에 깔린 이 철학적 믿음에 맞춰 타당성을 설명(정당화)해야 한다는 것입니다.
2. '어떤 평가 도구를 쓰는가'보다 '어떻게 해석하는가'가 더 중요하다
쉬운 설명: 객관식 시험, 루브릭, 포트폴리오 등 특정 '평가 방법' 자체가 중요한 것이 아니라는 의미입니다. 똑같이 '전반적 평가 척도(Global Rating Scale)'를 사용하더라도, 어떤 사람은 이를 '점수화하기 위한 객관적 지표'로 해석하고, 어떤 사람은 '교수자의 주관적 인상을 담아내는 질적 도구'로 해석할 수 있습니다. 방법론 겉모습에만 집착하고 그 안에 담긴 의미나 철학을 놓치면 본질적인 평가 개선으로 나아갈 수 없습니다.
3. 정답은 없지만, '관점의 투명성'이 없으면 오해가 생긴다
쉬운 설명: 앞서 말한 평가에 대한 여러 가지 철학적 관점 중 "무조건 이 방식이 맞다"는 정답은 없습니다. 중요한 것은 평가를 설계하고 결과를 도출할 때 "우리는 이러이러한 관점과 맥락에서 이 결과를 해석했다"는 점을 투명하게 밝히는 것입니다. 문제를 다양하게 바라보는 것(다원주의)은 연구와 평가를 풍부하게 해주지만, 치명적인 위험도 존재합니다. 평가 설계자는 '평가자의 주관적 해석'을 의도하고 데이터를 모았는데, 결과를 읽는 사람(또는 위원회)이 이를 '객관적이고 절대적인 수치'로 오해해버리면 전혀 엉뚱한 결론이 나오기 때문입니다.
예시: 진실의 지표로서의 타당도 Example: Validity as an indicator of truth
두 번째 예시는 특정 평가 프로그램에 대한 타당도 근거(validity evidence)가 무엇을 의미하거나 함의하는지에 관한 서로 다른 해석을 포함한다. 예를 들어
한 가지 해석은 그것이 속성(attributes)에 관한 어떤 종류의 “진실(truth)”을 대표한다는 것이다.²
다른 해석은 그것이 특정 맥락, 시간, 공간에서 유용한 주장, 즉 어떤 목적에 봉사하는 주장을 제공할 뿐, “진실”에 대해서는 어떠한 주장도 하지 않는다는 것이다.³⁴
여기서 우리의 의도는 ‘진실’이 평가나 타당도에서 유용한 구성개념인지 아닌지를 논쟁하는 것이 아니다. 또한 타당도 개념 일반과 그 철학적 토대에 대한 포괄적 분석을 제공하려는 것도 아니다. 오히려 이는 평가에서 매우 근본적인 것인 타당도 안에서도 또 다른 해석 과정이 존재한다는 점을 보여주기 위한 것이다.
연구자들은 타당도에서 진실에 대한 개념이 어떻게 다를 수 있는지, 그리고 그 결과 상응하는 타당도 주장이 어떻게 다르게 해석될 수 있는지를 논의해왔다.³³
이 문제에 대해 Markus와 Borsboom²은 Kane의 타당도 및 타당화(validity and validation) 틀이 진실의 역할을 고려하지 않는다고 비판한다. 타당도에서 철학적 토대가 부재한 상황은 HPE에서도 재생산되었으며, 충분히 주목받지 못했다. 여기서는 특정 선택이 왜 또는 어떻게 특정 관점과 대응하는지를 논의하기보다는 방법론적 접근에 더 초점을 두었다.⁸ Markus와 Borsboom²은 ‘진실’에 대한 주장을 하지 않는 정당화된 믿음(justified beliefs)과, 그러한 주장을 하는 정당화된 참된 믿음(justified true beliefs)을 구별한다. 그들은 진실, 즉 현실과의 대응(correspondence to reality)이 중요하다고 주장한다. 그 이유 중 하나는 우리가 틀린 타당도 주장을 충분히 정당화할 수도 있기 때문이다. 실용주의에 대한 주장을 예상하면서, 그들은 심지어 이 입장조차 최소한의 진실 개념을 정당화할 것이라고 주장한다. 다시 말해, Markus와 Borsboom은 타당도 결과를 해석할 때 진실에 대한 주장(claims to Truth)이 중요해야 한다고 제안한다.
Kane은 타당도에 대해 다른 해석을 취한다. Kane에게 강조점은 과학자가 지금 여기에서 합리적이고 잠정적으로 결론 내릴 수 있는 것에 있다.³⁴ 이 관점에서, 그리고 실용주의가 설명되는 몇몇 방식과 일치하게, 해석이 충분한 근거, 어쩌면 사용 가능한 최대한의 근거에 의해 일관되고 정합적인 방식으로 뒷받침될 때 정당화된 믿음이 존재한다. 또한 이는 의도된 해석과 연결되어 있으며, 잘 확립되고 명확히 표현된 이론적 틀, 예를 들어 구성개념의 본질에 대한 입장을 설명하는 틀을 사용하면서 이루어진다.³⁴ 그렇게 하는 것은 진실에 대한 주장을 하지 않는다. 단지 현재의 주장이 다른 가능한 주장들에 비해 정당화될 수 있다는 사실만을 주장하며, 새로운 근거가 시간과 자료의 표지가 찍힌 타당도 주장에 대한 기존 정당화의 강도나 의미를 변화시킬 수 있음을 인정한다. 이 틀에서 더 중요한 것은 모든 정당화가 비슷한 생각을 가진 동료 공동체와 관련되어 있으며, 그 공동체에 의해 적절하다고 판단될 것이라는 점이다. 예를 들어, 우리가 평가에서 진실의 역할에 대해 유사한 해석을 가지고 있고, 공동체가 적절하다고 판단하는 방식으로 행동할 수 있다는 것이다. 여기서 Kane은 진실에 관심을 두지 않는다. 다시 말해, 핵심은 Kane이 Markus와 Borsboom과 비교할 때 타당도를 다르게 해석한다는 점이다.
학생의 임상 역량이나 전문직 정체성을 평가할 때, 우리가 내린 평가 결과가 '타당하다'는 것은 과연 무엇을 의미할까요? 학자들에 따라 이를 완전히 다르게 해석합니다. 핵심을 두 가지 관점으로 나누어 설명해 드리겠습니다.
1. Markus & Borsboom의 관점: 타당도는 실제 '진실(Truth)'과 일치해야 한다
이들은 타당도를 주장할 때 '현실과의 대응(현실을 얼마나 정확히 반영하는가)'이 필수적이라고 봅니다.
정당화된 믿음 vs. 정당화된 참된 믿음: 아무리 그럴듯한 논리와 근거로 평가 결과를 '정당화(justified)'하더라도, 그것이 실제 학생의 진짜 능력(진실, true)과 엇갈린다면 문제가 된다는 것입니다.
비판점: 평가 도구나 절차가 방법론적으로 아무리 완벽하게 설계되었어도, 그것이 측정하고자 하는 '진짜 현실(예: 학생의 실제 진료 능력)'과 동떨어져 있다면 우리는 "틀린 결과를 완벽하게 정당화하는 오류"에 빠질 수 있다고 경고합니다. 즉, 타당도는 단순한 논리적 설득을 넘어 실제 현실(Truth)을 담보해야 한다고 주장합니다.
2. Kane의 관점: 타당도는 현재 시점에서의 '최선의 합리적 추론과 공동체의 합의'다
보건의료교육 평가에서 널리 쓰이는 Kane의 프레임워크는 절대적인 '진실'을 찾는 데 큰 관심이 없습니다. 대신 실용적이고 잠정적인 합의에 초점을 맞춥니다.
진실보다는 '현재의 최선': Kane에게 타당도는 절대적 진리를 찾는 것이 아닙니다. 과학자나 교육자가 "지금 우리가 가진 최선의 근거와 이론을 바탕으로 판단할 때, 이 평가 결과가 가장 말이 되고 일관성 있다"고 논리적으로 주장(정당화)할 수 있으면 충분합니다. 나중에 새로운 근거가 나오면 언제든 수정될 수 있는 '잠정적인' 결론입니다.
전문가 공동체의 역할: 가장 중요한 것은 '비슷한 생각을 가진 동료 공동체(예: 의학교육 학계, 평가 위원회)가 이 정당화 과정을 합리적이라고 인정해 주는가'입니다. 학계가 수용할 수 있는 방식으로 논리를 전개하고 합의에 이른다면, 굳이 그것이 궁극적인 '진실'인지 따지지 않아도 타당도가 성립한다고 봅니다.
💡 요약하자면
이 글은 보건의료교육(HPE)의 평가 영역이 철학적 고민 없이 '어떤 평가 도구를 쓸 것인가'하는 방법론에만 치우쳐 있었음을 지적하며, 타당도에 대한 두 거장의 시각 차이를 보여줍니다.
Markus & Borsboom: "평가 결과가 실제 현실(진실)을 정확히 반영해야만 타당하다."
Kane: "절대적 진실은 알 수 없다. 현재 가진 데이터로 가장 논리적인 주장을 구성하고, 학계 전문가들이 동의한다면 그것이 타당한 것이다."
그렇다면 타당도 이론가나 교육자들이 타당도의 행위와 의미를 다르게 해석할 때, 타당도에 대해 무엇을 말할 수 있는가? 타당도에서 진실과 관련하여 어떤 주장이 가능한지에 대해 서로 다른 해석을 적용할 때, 우리는 타당도 주장이 정당화되는지 여부를 서로 다르게 해석하게 된다. 평가에서 널리 받아들여지고 활용되는 개념인 타당도 근거조차 해석의 문제를 우회할 수 없다. 무엇이 타당도에 대한 정당한 근거를 구성하는지를 결정하는 것은 많은 해석적 요인에 달려 있다. 이를 HPE에 적용하면, 이는 해석 과정이 실제로 작동하고 있음을 보여주며, 무엇이 좋은, 방어가능한, 신뢰할 수 있는 평가 실천으로 인정되는지에 대한 함의를 가진다.
실용주의: 일관된 철학적 관점 내부에서도 존재하는 해석 과정 Pragmatism – interpretive processes even in a coherent philosophical perspective
이제 우리는 일관된 철학적 입장을 해결책으로 불러올 때에도 생기는 어려움을 검토한다. 평가 실천가들은 일상적으로 ‘실용적이기(being pragmatic)’라는 개념에 호소한다. 예를 들어, 대학원 의학교육에서 성과 틀(outcome frameworks)을 평가 계획(assessment plans)으로 번역하는 과정을 탐구한 최근 연구에서, 연구자들은 프로그램 디렉터들이 평가 계획에 영향을 미치는 경쟁적 영향들, 예를 들어 인증(accreditation), 기술(technology), 타당도(validity) 사이에서 협상해야 할 필요가 있음을 확인했다.³⁵ 평가 계획 설계를 고려하면서, 프로그램 디렉터들은 “나는 그것을 매우 실용적인 관점에서 보고 있었다”고 말하곤 했다.³⁵ 이는 실천적이라는 것이 평가 도전과제에 대한 해결책을 제공하며, 심지어 타당도를 핵심 영향요인으로부터 밀어낼 수도 있음을 시사한다. 따라서 실천적이라는 문제, 그리고 실천적 의도를 가지고 평가 선택을 협상하는 문제는 평가 전략에 대한 의도적 영향과 정당화로 확인되고 사용된다.³⁵
실용주의는 단순한 실천성(practicality)을 넘어서는 것을 포함한다. 어떤 접근이 다른 접근보다 더 적합한 이유를 생각하고, 평가 결과의 의미에 초점을 두며, 방법론을 넘어 탐구(inquiry)와 유용성(utility)을 정의적 특징으로 우선시하는 것이다. 그러나 아래에서 보여주듯이, 실용주의가 무엇을 의미하는지에 대한 암묵적 가정은 여전히 서로 다른 해석으로 이어질 수 있다. 여기서 우리는 일상적 용어로서의 실용주의, 즉 실용적이거나 실제적이라는 의미와, 고유한 역사, 가정, 헌신을 가진 실질적인 철학적 입장으로서의 실용주의를 구별한다. 실용주의를 언급하여 실천가들을 더 깊은 철학적 해석 문제로부터 면제시키는 것은 강력한 수사적 움직임이지만, 그것은 해석 과정을 우회할 수 없다.
우리가 강조했듯이, 실증주의/후기실증주의와 객관주의의 영향을 받은 심리측정학적 접근(psychometric approaches)은 역사적으로 HPE 평가를 지배해왔다. 이는 구성주의적 입장과 해석주의적 입장으로 대체되거나, 강화되거나, 보완되어왔다. 따라서 HPE 평가에는 더 이상 명확한 철학적 관습이 존재하지 않을 수 있다. 이는 하나의 기회를 제공하지만, 동시에 어떻게 나아가야 할지에 대한 불확실성도 도입한다. 현재 HPE 평가와 유사해진 혼합방법 연구는 비슷한 어려움을 경험해왔다. 혼합방법 연구의 일부에서는 실용주의가 실행 가능한 해결책을 제공한다.³⁶ HPE 평가 맥락에서 실용주의를 채택하는 것은 어떤 사람들에게는 논리적인 확장일 수 있다. Kane에게 그러했듯이 말이다. 그러나 그것의 함의가 해석에 대해 무엇을 의미하는지 이해하기 위해서는 그 뉘앙스와 가정에 주의를 기울여야 한다. 즉, 평가 맥락에서 실용주의나 다른 어떤 철학적 입장을 사용하는 것은 일부 철학적 긴장을 완화하는 데 도움이 될 수 있지만, 동시에 다른 긴장을 도입할 수 있다.
또 다른 해석 과정이 실제로 작동하는 모습을 보여주기 위해, 우리는 “진실(truth)” 개념으로 돌아가 실용주의에서 “진실”이 다루어지는 다양한 방식을 강조한다. 실용주의자들이 “진실”에 어떻게 접근하는지 생각하는 것은 유용하다. 이는 HPE에서 구성개념이나 역량의 본질에 관한 관점을 해석하거나, 타당도 주장을 형성하는 데 유비적으로 사용될 수 있기 때문이다. 많은 실용주의 철학자들은 “진실” 개념에 약간씩 다른 방식으로 접근한다.³⁷ 예를 들어
Peirce는 ‘진실’을 가능한 모든 탐구의 끝에서 믿어지는 것으로 설명했다. 즉 참된 믿음(true beliefs)이다.³⁸ Peirce에게 진실은 발견될 수 있으며, 더 많은 경험에도 불구하고 시간이 지나도 유지될 수 있다.
James는 정합 이론(coherence theory), 즉 믿음의 일관성을 강조하는 이론을 사용하여 “진실”에 접근했다.³⁹˒⁴⁰ James에게 “진실”은 우리를 가치 있는 방식으로 합리적이고 만족스럽게 이끄는 관념을 의미하지만, 그것이 반드시 현실을 나타내는 것은 아니다.
Dewey는 한 걸음 더 나아갔다. 그는 어떤 믿음이든 거짓으로 드러날 수 있다고 주장했으며, 진실을 덜 강조했다.³⁷˒⁴¹ Dewey는 Peirce의 대응 이론, 즉 ‘참된 믿음’이 현실을 대표한다는 이론과 James의 정합 이론, 즉 ‘진실’이 믿음들 사이의 일관성 문제라는 이론을 거부했다. 대신 Dewey는 그 자체로 ‘진실’을 함의하지는 않지만 앞으로 나아가는 행동을 안내하는 데 유용성을 가진, 지적이고 잠정적이며 임시적인 판단에 대해 논의하는 것을 선호했다. 어떤 “진실”도 시간이 지나면서 우리가 그 판단으로 무엇을 하는지에 근거하여 출현한다.⁴²
마지막으로 Rorty는 우리가 그것에 대해 생각하는 것과 별개로 존재하는 객관적 세계는 없다고 주장했다.⁴³˒⁴⁴ 그는 Kane과 마찬가지로 “진실”에 대해 말할 수 있는 것은 아무것도 없다고 주장했다. 왜냐하면 그것은 알 수 없으며, 어떤 의미에서는 덜 의미 있기 때문이다. “진실”은 모든 반론에 대해 방어될 수 있는 것이다. 개인적이고 사회적인 사고 없이 진실을 발견하는 일은 없다.⁴²
실용주의 철학자 4명이 ‘진실(Truth)’을 어떻게 다르게 바라보았는지, 이를 “의대생의 임상 역량을 평가하는 상황”에 빗대어 알기 쉽게 풀어보겠습니다.
1. Peirce (퍼스): "진실은 끝까지 탐구하면 결국 '발견'할 수 있는 것이다."
철학적 의미: 진실은 존재하며, 수많은 경험과 과학적 탐구를 끝까지 밀어붙이면 결국 흔들리지 않는 '참된 믿음'에 도달할 수 있습니다.
HPE 비유: 학생의 '진짜 임상 역량'은 어딘가에 객관적으로 존재합니다. 우리가 완벽한 평가 도구를 만들고 무한히 반복해서 평가한다면, 결국 그 학생의 진짜 능력을 오차 없이 정확히(True) 발견해 낼 수 있다고 믿는 관점입니다.
2. James (제임스): "진실은 현실의 복사판이 아니라, 논리적으로 '일관'되고 '유용'한 것이다."
철학적 의미: 진실이 굳이 저 밖의 객관적 현실과 완벽히 일치할 필요는 없습니다. 우리의 믿음들이 서로 모순되지 않고(정합성), 우리를 만족스럽고 가치 있는 결과로 이끌어준다면 그것을 진실로 봅니다.
HPE 비유: '임상 역량'이라는 절대적 실체가 존재하는지는 중요하지 않습니다. 중요한 것은 우리가 만든 평가 루브릭과 모형이 논리적으로 앞뒤가 맞고, 결과적으로 좋은 의사를 길러내는 데 유용하게 작동한다면 그 평가 프레임워크를 '진실된(타당한) 것'으로 인정하는 관점입니다.
3. Dewey (듀이): "고정된 진실은 없다. 오직 행동을 이끄는 '잠정적 판단'만 있을 뿐이다."
철학적 의미: 영원불변한 진실을 찾는 것을 포기합니다. 대신, 당장 앞으로 나아가기 위해 내리는 똑똑하지만 '임시적인 판단'을 중시합니다. 진실은 고정된 명제가 아니라, 우리가 그 판단을 가지고 실천해 나가는 과정에서 사후적으로 드러나는 것입니다.
HPE 비유: "이 학생이 완벽한 역량을 갖추었는가?"라는 절대적 질문을 던지지 않습니다. 대신 "이 학생을 다음 단계(실습이나 전공의 과정)로 진급시켜도 좋다는 임시적 판단을 내리자"라고 결정합니다. 그 판단이 맞았는지(진실)는 학생이 실제 현장에서 환자를 보며 어떻게 행동하는지를 지켜보면서 나중에야 결정됩니다.
4. Rorty (로티): "객관적 진실은 없다. 공동체의 '방어 가능한 합의'가 진실을 대체한다."
철학적 의미: 인간의 생각과 독립적으로 존재하는 객관적 세계(진실) 자체를 부정합니다. 앞서 나온 Kane의 타당도 관점과 가장 유사합니다. 진실이란 그저 '다른 사람들의 반론에 맞서 방어해 낼 수 있는 주장'일 뿐입니다.
HPE 비유: 학생의 역량에 대한 객관적 진실 따위는 애초에 알 수도 없고 의미도 없습니다. 학생의 역량은 '임상실습 평가위원회 소속 교수들이 모여 논의하고 합의한 결과' 그 자체입니다. 누군가 평가 결과에 이의를 제기했을 때, 교수진이 그 판단을 방어해 낼 수 있다면 그것이 곧 진실(타당도)이 됩니다.
💡 왜 이 이야기가 중요한가?
우리가 의학교육 논문이나 평가 도구를 설계할 때, 은연중에 이 4가지 관점 중 하나를 취하게 됩니다.
평가 도구의 오차를 줄여 학생의 '진짜 능력'을 정확히 측정하려 한다면 Peirce에 가깝고, 평가 위원회의 합의와 해석 과정을 중시한다면 Rorty(또는 Kane)에 가깝습니다. 저자는 "우리가 평가를 통해 무엇을 진실이라고 주장하고 있는지, 그 철학적 기반부터 명확히 인식해야 한다"고 말하고 있는 것입니다.
철학적 입장 내부, 이 경우 실용주의 내부에서도 그 핵심 특징에 대한 많은 서로 다른 해석이 존재한다. 평가 맥락에서 실용주의를 불러오는 것은 사람마다 많은 것을 의미할 가능성이 크다. 여기에는
활동이 구성개념의 “참된” 본질에 대한 주장을 허용한다고 제안하는 것, 즉 참된 믿음이 포함될 수 있다.
또한 우리의 주장이 합리적이고 정당화된 것으로 보아야 하지만 반드시 “참”이거나 현실에 대응한다고 볼 필요는 없다는 것, 즉 정당화된 믿음이 포함될 수 있다.
또는 “진실”에 관심을 두기보다는 우리의 주장과 결정이 앞으로 무엇을 의미하는지를 검토하는 것과 같은 중간적 입장도 포함될 수 있다.
또는 주장이 가장 강한 논증에 근거하여 이루어질 수 있으며, 그러한 주장은 사회적 맥락에 의존한다는 입장도 포함될 수 있다.
철학적 입장에 대한 해석 내부에서조차 존재하는 이러한 다양성은, 철학적 입장을 단순히 불러오는 것만으로는 의도하지 않은 해석을 막기에 충분하지 않다는 점을 시사한다. 이런 방식으로 철학적 입장의 적용은 의미와 이해를 명확히 하기보다는 오히려 더 가릴 수 있다. 평가 설계자가 평가 사용자가 자신의 평가 작업을 고려할 때 어떤 가정을 인정하기를 원하는지에 대해 더 명시적이고 주의 깊게 되는 것은, 의도하지 않은 해석을 방지하는 한 가지 방법일 수 있다.
논의 Discussion
HPE 평가에서 해석 과정의 개념을 부각시키려는 우리의 목적은 평가 프로그램이 논의되고 사용되는 방식의 명확성에 기여하는 것이다. Veen과 Cianciolo는 철학적 입장이 교육에서 얼마나 널리 퍼져 있는지, 그리고 “상황을 철학적으로 바라보는 것이 우리가 잠시 멈추어 주의를 집중하고, 당면한 문제를 재구성하며, 그에 따라 행동하도록 돕는다”는 근본적 이점을 상기시켰다.⁴⁵(p.338) 이는 해방적이면서도 생산적이었다. 평가에 철학적으로 접근하는 것은 지속적인 문제를 다르게 보기 위해 평가에 대해 생각하는 새로운 방식을 도입했고, 새로운 해결책을 밝혀내며 발전의 기회를 제공했다. 그러나 평가 과학과 실천이 그 철학적 토대에서 변화하고 있는 지금, 우리는 공통 개념과 언어에 대한 공유된 이해를 잃고 있다. 이는 우리가 그것들에 접근할 수 있는 다양한 방식 때문이다. 우리는 다음을 주장해왔다.
첫째, 평가에서의 다양한 해석은 보통 서로 다르며 대부분 암묵적인 철학적 입장에서 비롯되는데, 이러한 해석이 확장되었고, 그 결과 평가 과학과 실천에서 의도하지 않은 해석과 다양한 질 판단의 기회가 생겼다.
둘째, 평가의 핵심 특징, 예를 들어 평가자/관찰자의 활용과 타당도는 기저의 철학적 입장에 의해 부분적으로 형성되는 해석 과정이다.
셋째, 실용주의와 같이 일관된 철학적 입장을 불러오는 것조차도 의미와 이해를 드러내기보다는 오히려 더 감출 수 있는 또 다른 종류의 해석 과정을 포함한다.
어떤 사람은 이를 대수롭지 않게 여기며 “그래서 뭐가 문제인가? 사람들은 서로 다르게 해석한다”고 말할 수도 있다. 실제로 해석 과정의 역할이 반드시 새로운 것은 아니다. 그러나 이는 무엇이 좋은 평가를 구성하는지 고려할 때 실천적 불확실성을 도입하고 있다.현재 하나 이상의 “규칙” 집합이 작동하고 있기 때문이다. 예를 들어
Cizek은 “가장 포괄적인 타당화 노력조차도 동등하게 자격을 갖춘 평가자들을 서로 다른 결론으로 이끌 수 있는 모호한 근거를 산출할 수 있다. 그러한 결론은 종합될 타당도 근거에 대한 인식에 영향을 미치는 믿음, 가정, 가치에 달려 있다”고 썼다.⁴⁶
마찬가지로 이미 1975년에 Messick은 평가 논리와 의미를 더 잘 이해하기 위해, 평가 활동의 기저에 있는 핵심 가정과 주장에 주의를 돌릴 필요가 있다고 말했다.⁴⁷
실천에서 서로 다른 기저 가정은 해석을 형성하며, 따라서 평가가 어떻게 구조화되고 실행되며 방어가능하게 만들어져야 하는지에 관한 주장을 형성한다. 이러한 서로 다른 해석들은 교육자들 사이에서 유사한 평가 특징들에 적용되고 있으며, HPE에서 무엇이 좋은 평가를 구성하는지를 주로 보는 사람의 눈에 맡기고 있다. 또한 의도된 것과 해석된 것 사이에 잠재적 불일치를 만들 수 있다. 이러한 다양한 해석은 학생과 다른 사회적 책무성(social accountabilities)에 매우 큰 영향을 미칠 수 있다.
교육자와 HPE 평가 공동체를 위해 여러 함의를 도출할 수 있다.
첫째, 우리의 우려는 평가 설계자와 평가 사용자가 서로 다른 가정을 가지고 있다는 사실 자체가 아니다. 그들이 서로 다른 가정을 가질 것이라는 점은 거의 동어반복적이다. 우리의 우려는 실천에서 교육자들이 자신도 모르게 또는 은밀하게 이러한 서로 다른 가정, 방법론적 규범, 해석적 규범을 적용할 수 있으며, 따라서 동일한 평가 프로그램이나 평가 사건에 대해서도 무엇이 질 높은 평가로 기능하는지에 대해 서로 다른 관점에 도달할 수 있다는 점이다. 이는 평가의 여러 특징들 사이의 정합성(coherence), 그리고 궁극적으로 어떤 추론(inferences)을 도출할 수 있는지에 대한 우려를 제기한다.
둘째, 주목하지 않은 채 방치된다면 이러한 철학적으로 형성된 발전이 어떻게 나아가야 할지, 예를 들어 관찰자 자료를 어떻게 구조화하고 사용할지에 대한 불확실성을 낳고, 더 나쁘게는 어떤 평가 활동이나 결과의 정당성을 문제 삼을 기회를 제공할 수 있다는 우려가 있다.
셋째, 평가에서 어느 정도의 논쟁은 불가피하며, 오랫동안 존재해왔다. 그러나 이러한 논쟁들은 명시적이지 않았더라도 대체로 철학적 입장 내부에서 이루어져왔다. 예를 들어, 평가자 간 신뢰도(inter-rater reliability)를 어떻게 가장 잘 향상시킬 것인지에 관한 논쟁이 그러하다. 평가가 더 이상 하나의 지배적 철학적 입장에서만 바라보이지 않기 때문에,¹ 그리고 실천에서 서로 다른 해석 규범으로 이어지기 때문에, 오늘날의 논쟁은 철학적 입장들 사이에서 이루어진다. 이때 한 입장에 대한 이해가 다른 입장에 대한 오해로 이어질 수 있으며, 선택과 질에 대한 새로운 해석을 도입한다. 예를 들어 평가자 간 신뢰도가 중요한가라는 질문이 그러하다.
넷째, 평가 문헌은 방대하지만, 해석 과정이 그 작업에 어떻게 정보를 제공하고 있는지에는 거의 주의가 기울여지지 않았다.⁴⁸ 평가 실천과 결과적 주장을 구조화하고 방어하는 방식을 제공하는 평가 지침은 해석 과정이나 틀을 개괄할 필요가 있다. 이러한 관점은 주목된다 하더라도 여전히 암묵적이거나 가정된 상태로 남아 있다.¹⁶˒¹⁹
우리는 논의를 교육 및 평가 과학자, 평가 설계자, 또는 평가 결과나 자료의 사용자에게 초점을 맞추어왔다. 이러한 문제가 최전선 임상의(frontline clinicians)에게 어떻게 나타나는지에 대해서도 추가적인 고려가 필요하다. 그들 자신도 평가에 대한 철학적 가정을 가지고 있기 때문이다. 마찬가지로, 역량위원회에서 철학적 입장의 함의를 연구한 이들도 있지만,¹⁰ 학습자가 직접 영향을 받을 때 학습자에게 미치는 더 넓은 함의도 탐구될 필요가 있다.
이러한 철학적으로 형성된 해석적 문제는 평가 작업 아래에 놓여 있다. 이는 이미 일부 평가 프로그램의 가치 부여와 가치 절하로 이어졌으며,²² 무엇이 좋은 평가로 간주되는지에 대해 연구자와 교육자 사이의 순환적 논의와 논쟁을 낳았다. 그 사이에, HPE 평가가 계속 진화하는 동안 이러한 철학적 발전과 제안을 탐색하는 더 생산적인 방식이 필요할 수 있다.
결론: HPE 평가를 위한 철학적으로 명시적인 접근을 향하여 Conclusion: toward a philosophically explicit approach for assessment in HPE
평가에서 다른 사람들과 상호작용하기 시작할 때에야 비로소, 우리 각자의 평가 세계에 대한 어떤 형태의 조율이나 이해가 필요해진다. 우리의 의도는 평가에서 확장되고 더 다양해진 해석 과정의 불가피성과 그 함의를 강조하는 것이다. 전통적으로 그렇게 여겨지지는 않았지만, 우리는 평가가 과학철학(philosophy of science), 혼합방법 연구에서의 논쟁과 발전, 예를 들어 변증법적 다원주의(dialectical pluralism)의 영역에 속한다고 본다. 또한 평가는 평가 생산자와 사용자 사이에서 철학적 주장에 대한 합의가 형성되는 데 의존한다. 해석 과정에 대한 이러한 초점은 평가에서 윤리, 가치, 사회화의 역할도 도입한다. 이는 단지 과학적 추구나 존재론적 또는 인식론적 고려만의 문제가 아니다.⁴⁹ 이는 누가 해석을 하고 있는지, 누구의 해석이 지배적인지와 그 이유, 그리고 위치성(positionality)의 역할에 주의를 돌리게 한다. 이는 의도된 사용과 의미를 지원하기 위해 필요하다. 이 문제는 HPE 평가 틀에서 아직 충분히 밝혀지지 않았다.¹³˒¹⁹˒⁵⁰
따라서 우리는 평가 생산과 사용과 관련하여 철학적 전망(philosophical outlooks)을 밝혀내고 발전시키는 데 헌신함으로써, 평가를 해석 과정으로 널리 인정할 것을 요청한다. 따라서, 적어도 당분간은, 평가 실천과 과학에서 해석 과정에 주의를 기울이기 위해 평가 활동을 계획, 설계, 실행, 평가할 때 철학적으로 명시적(philosophically explicit)이어야 한다고 제안한다. 이는 교육 연구자들이 자신의 연구에서 이론(theory) 및/또는 개념적 틀(conceptual frameworks)을 밝혀내는 방식과 유사하다.⁵¹ 우리는 해석의 개념과 그 중대한 결과를 받아들이는 평가 접근, 또는 평가에 대해 생각하는 방식을 제안한다.
궁극적으로, 평가에서 공유되고 철학적으로 견고한 이해의 지평을 회복하기 위해, 우리는 평가 과학과 실천의 해석적 성격이 강조되어야 한다고 제안한다. 평가는 항상 철학적 입장에 의존하며, 그러한 입장들은 너무나 자주 완전히 암묵적이거나 주목받지 못한다.¹⁶ 그리고 이제 그것들은 다양하다. 이러한 철학적 전망들이 긴장 관계에 있을 때, 서로 통약 불가능한 입장(incommensurate positions)이 출현하고 평가 논쟁이 뒤따른다. 우리는 평가 자체의 급진적 변화를 요구하는 것이 아니다. 우리가 요구하는 것은 평가 과학, 실천, 담론이 개념화되고 표현되는 방식에 대한 주의이다. 암묵적 입장 내부에서 접근의 정당성을 논쟁하기보다는, 가정과 헌신을 명시해야 한다. 그래야 평가의 해석 과정이 더 투명해지고, 이해와 공정한 비판에 열릴 수 있다.
보건의료 평가(health professions assessment)를 둘러싼 논쟁은 정말 끝이 없죠. 신뢰도와 통계 지표를 중시하는 심리측정학적 시각이 있는가 하면, 점수로는 도저히 담아낼 수 없는 맥락과 서사를 강조하는 구성주의적 시각도 있고요. "도대체 어떤 평가가 좋은 평가냐"는 질문 앞에서 우리는 종종 길을 잃습니다.
Pearce와 Tavares가 Academic Medicine(2024)에 발표한 이 글은, 과학철학에서 오래 다듬어진 관점주의(perspectivism)라는 렌즈가 이 소모적인 논쟁을 꽤 산뜻하게 정리해줄 수 있다고 말합니다. 오늘은 이 논문의 핵심을 함께 따라가 볼게요.
🔍 관점주의란 무엇일까?
저자들은 관점주의를 한마디로 이렇게 정의합니다.
관점주의는 지식이 본질적으로 특정한 관점들로부터 생겨난다는 점을 받아들인다. "Perspectivism embraces the notion that knowledge inherently arises from particular perspectives."
쉽게 말하면, 우리가 무언가를 '안다'고 할 때 그 앎은 늘 '어딘가에서 바라본' 앎이라는 거예요. 어디에도 속하지 않은 완전히 객관적인 시점, 그러니까 '신의 시점' 같은 건 애초에 없다는 거죠.
관점주의가 완전히 새로운 개념은 아닙니다. 라이프니츠(Leibniz)와 칸트(Kant)에서 시작해 니체(Nietzsche), 비트겐슈타인(Wittgenstein)을 거쳐 발전했고, 최근에는 과학철학자 기어리(Giere)가 형이상학·존재론 논쟁의 돌파구로 다시 꺼내 들었어요. 중요한 건, 관점주의가 "또 하나의 -ism"을 목록에 추가하자는 게 아니라, 서로 다른 입장 사이의 중간 지대를 찾으려는 사고방식이라는 점입니다.
⚖️ '진리'를 둘러싼 세 가지 입장
관점주의가 가장 또렷하게 드러나는 지점은 '진리(truth)'를 어떻게 보느냐입니다. 저자들은 세 입장을 이렇게 대비시켜요.
구분
절대주의(Absolutism)
상대주의(Relativism)
관점주의(Perspectivism)
진리관
명제는 객관적 사실에 따라 참 또는 거짓으로 정해진다
사실을 어떻게 구성하느냐에 따라 참·거짓이 달라진다
참·거짓의 가능성은 있으나, 그것은 관점에 달려 있다
인식론
지식은 객관적으로 검증·확정될 수 있다
모든 견해가 똑같이 타당하고 정당하다
지식은 늘 특정 시점에서 나오며 맥락에 의존한다
평가에 적용하면
객관적으로 더 좋고 나쁜 평가가 존재한다 (예: 신뢰도가 가장 중요)
모든 평가 견해가 동등하게 타당하다
모든 평가는 철학적 전제 위에 있고 맥락에 자리한다; 타당성은 맥락과 필요에 따라 결정된다
여기서 핵심 개념이 평가적 배경(evaluative background)입니다. 진리에 대한 판단은 결국 우리의 문화적 배경, 개인적 경험, 도덕적 가치 같은 주관적 요소들 위에서 이뤄진다는 거예요. 그래서 저자들은 이렇게 못 박습니다.
"진리"는 언제나 평가적 배경에 의존한다. " 'Truth' always depends on an evaluative background."
이쯤에서 흔한 반론이 하나 나옵니다. "관점주의가 옳다고 주장하는 순간, 결국 '관점주의는 참이다'라는 절대적 진리를 인정하는 셈 아니냐"는 거죠. 하지만 저자들은 이 비판 자체가 이미 '진리에는 위계가 있다'는 절대주의적 전제에서 출발한 것이라고 봅니다. 관점주의는 애초에 '모든 관점을 내려다보는 관점' 같은 건 없다고 말하니까요. 그래서 관점주의의 본질은 결국 인식론적 겸손(epistemic humility), 즉 우리의 앎이 역사적·맥락적으로 자리 잡고 있음을 겸허히 인정하는 태도입니다.
🩺 평가에 적용해보기: OSCE를 예로
이제 본론입니다. 최종 임상시험인 OSCE를 떠올려볼게요.
심리측정학(psychometrics)에 기반한 절대주의 시각에서 보면, 높은 신뢰도(reliability)는 시험의 방어 가능성을 높여주고, "어떤 시험은 다른 시험보다 분명히 낫다"고 말하는 게 충분히 타당합니다.
반면 구성주의(constructivism)시각에서 보면, 한 시점의 시험(point-in-time examination)은 역량의 다면적 본질을 온전히 담아낼 수 없고, 풍부한 인간 인지를 지나치게 단순화한다고 비판할 수 있죠.
그럼 둘 중 뭐가 맞을까요? 저자들은 "어느 쪽이 더 나은가?"라고 묻는 순간 우리는 다시 절대주의로 빠진다고 말합니다. 관점주의는 질문 자체를 바꿉니다.
이 평가 이슈에 대한 접근의 바탕에는 어떤 철학적 입장이 깔려 있는가? "What underlying philosophical position forms the basis of the approach to the assessment issue?"
그리고 이어서 묻습니다.
그 철학적 접근은 이 특정한 맥락에서 정당화되는가? "Is this philosophical approach justified in this specific context?"
이 질문들에 대한 답은 대개 이렇게 나옵니다.
음, 그건 당신이 무엇을 하려고 하느냐에 달려 있다. "Well, it depends on what you are trying to do."
실제로 OSCE에서는 공정성을 위해 표준화와 신뢰도가 가장 중요한 설계 기준이 되고, 일터 기반 평가(workplace-based assessment)에서는 피드백과 교육적 효과가 가장 중요한 기준이 됩니다. 맥락이 다르면 최적화해야 할 가치도 달라지는 거죠. 저자들은 반더플뢰튼(van der Vleuten)의 유명한 효용 공식(utility formula)이나 프로그램적 평가(programmatic assessment)에도 이런 관점주의적 정신이 이미 담겨 있다고 봅니다.
🚫 "아무거나 다 괜찮다"는 뜻은 절대 아니다
여기서 가장 오해하기 쉬운 게, "그럼 관점주의는 결국 세련된 상대주의 아니냐"는 거예요. 저자들은 단호하게 아니라고 합니다.
뇌의 구조와 기능에 관한 해부학 문제를 떠올려보세요. 거기엔 여전히 정답이 있습니다.
골수 상대주의자라면 "구조와 기능을 다르게 재구성할 수도 있다"고 하겠지만,
관점주의자는 교과서와 시험의 답이 옳다는 데 동의해요. 다만 "현대 과학의 관점에서 그렇다"는 단서를 붙일 뿐이죠. (17세기 데카르트는 정신과 신체가 송과선을 통해 상호작용하는 별개의 실체라고 봤고, 그 시대의 관점에서는 그게 '참'이었으니까요.)
표준설정(standard setting)도 좋은 예입니다. 모든 맥락에 통하는 '최고의' 표준설정 방법은 없습니다(절대주의 기각). 그렇다고 아무 방법이나 써도 된다는 뜻도 아니에요(상대주의 기각). 응시자가 5명뿐인 임상시험에 경계선 회귀(borderline regression)를 쓰는 건 부적절하고, 평가자가 2명뿐인데 수정 Angoff(modified Angoff) 방법을 쓰면 엉성하게 실행되어 타당하지 않은 결과로 이어지죠. 그래서 "어떤 표준설정 방법이 최고냐?"는 질문은, 사실 "우리 맥락에서 실행 가능하면서도 최적인방법은 무엇이냐?"는 뜻인 셈입니다.
👥 역량위원회(competence committee)라는 현실
마지막 예시는 역량위원회입니다. 위원들이 한 학생의 진급이나 보충교육(remediation)을 논의할 때, 그 판단의 밑바탕에는 평가에 대한 암묵적 가정과 신념이 깔려 있어요. 이 결정들은 학생에게 큰 영향을 미치는 고부담(high-stakes) 결정이기 때문에, 저자들은 이 암묵적 시각에 꼭 주목해야 한다고 강조합니다.
특히 위원회가 교착 상태(stalemate)에 빠졌을 때, 위원들에게 이런 질문을 던져보자고 제안해요.
"데이터에서 당신에게 가장 중요한 건 무엇인가요? 일관성? 변동성? 효용? 포화(saturation)?"
"어떤 형태의 데이터가 당신에게 더 무겁게 다가오나요?"
"실증주의·구성주의·실용주의 중 당신의 신념에 가장 가까운 건 무엇인가요?"
각자의 철학적 입장을 수면 위로 끌어올리자는 거죠. 이게 교착을 항상 풀어주진 않더라도, 적어도 대화의 물꼬를 다른 방향으로 틀 수는 있다는 겁니다.
💡 그래서, 우리에게 주는 메시지
저자들이 일관되게 강조하는 건 결국 하나입니다. 평가를 '해석적 과정(interpretive process)'으로 인정하고, 그 밑에 깔린 철학을 겉으로 드러내자는 거예요.
[평가에서] 해석적 과정을 철학적으로 명시적으로 드러낸다(는 책무). "...to make the interpretive processes in assessment philosophically explicit."
평가 연구에서 저자들이 자신의 철학적 가정을 밝히는 경우는 의외로 드뭅니다. 그러다 보니 같은 데이터를 두고도 해석이 제각각 갈리죠. 관점주의적 렌즈는 이 숨은 가정들을 명시적으로 만들어 실무의 명료함을 높이자고 말합니다. 그리고 이 사고방식은 평가에만 머물지 않습니다. 저자들은 관점주의적 사고가 평가를 넘어 의학교육 담론과 실천 전반을 진전시킬 잠재력이 있다고 봅니다.
✏️ 마무리하며
관점주의는 "또 하나의 -ism"을 추가하자는 게 아닙니다. 오히려 우리가 이미 매일 하고 있는 일 — 서로 다른 시각이 부딪히고, 그 긴장을 어떻게 다룰지 고민하는 일 — 을 더 또렷하게 바라보게 해주는 틀이에요. 평가를 둘러싼 소모적 논쟁 앞에서, "누가 옳은가" 대신 "이 맥락에서 무엇이 타당한가"를 묻게 해주는 거죠.
다음에 평가 설계나 위원회 회의에서 의견이 갈릴 때, 한 번쯤 이렇게 물어보면 어떨까요. "지금 우리가 서 있는 철학적 자리는 어디일까?" 🤔
관점주의는 우리가 깨닫지 못하더라도 이미 우리 주변에 존재하는 사고방식이며, 우리가 무엇을 하고 있는지, 그리고 왜 긴장(tensions)이 발생하는지를 더 잘 이해하도록 도와준다. 많은 학문 분야와 마찬가지로, 보건의료전문직교육의 연구 접근(research approaches)은 특정한 시점 또는 관점(vantage points)으로부터 출현한다. 새로운, 그리고 잠재적으로 양립하기 어려운 입장들이 등장하고, 이러한 시각들이 달라질 때 방법론적 논쟁(methodological debates)이 뒤따른다. 우리는 평가과학(assessment science) 분야에서 이러한 일이 벌어지고 있음을 본다.¹ 다른 연구자들이 지적했듯이, 우리가 그러한 긴장에 어떻게 반응하는가는 매우 중요하다.² 우리는 이에 동의하며, 관점주의가 우리 분야를 바라보는 유용한 방식이라고 주장한다.
예를 들어, 관점주의는 평가에서 주관성의 가치에 관한 최근 논의를 확장한다.³˒⁴ 또한 무엇이 좋은 평가(good assessment)인지와 같은 평가 담론의 지배적인 논쟁을 가로질러 정리하는 데 도움이 될 수 있다.⁵ 우리는 이 저널과 다른 주요 저널에서 진행되는 많은 담론 속에서 관점적 대화(perspectival dialogue)의 양상을 본다. 그 안에서는 특정 렌즈(lenses)가 명시되고, 연구질문(research questions)에 적용되어 새로운 교훈과 탐구의 흐름을 만들어낸다. 의학교육에서 연구 접근과 철학적 렌즈가 넓어지고, 이를 통해 다양한 연구를 탐색하고 지원하게 되면서, 철학적 관점(philosophical vantage points)을 분명히 밝힐 필요가 커졌다. 우리의 목적은 과학철학의 확립된 학문적 논의⁶를 바탕으로 관점주의와 관점적 사고를 설명하고, 그것이 의학교육, 특히 평가와 어떤 관련성을 갖는지 보여주는 것이다.
관점주의란 무엇인가? What Is Perspectivism?
관점주의를 평가와 보건의료전문직교육에 적용하고 몇 가지 사례를 제시하기 전에, 먼저 관점주의를 보다 일반적인 수준에서 설명할 필요가 있다. 일관된 철학적 입장(coherent philosophical position)으로서 관점주의는 아마도 라이프니츠(Leibniz)와 칸트(Kant)에 의해 처음 제시되었고,⁷ 니체(Nietzsche)⁸와 비트겐슈타인(Wittgenstein)⁹에 의해 여러 형태로 발전되었다고 볼 수 있다. 보다 최근에 Giere는 형이상학(metaphysics), 즉 현실의 본성(the nature of reality)을 다루는 철학의 한 분야와, 근본 존재론(fundamental ontology), 즉 존재(existence)와 존재함의 본성(the nature of being)을 다루는 형이상학의 한 분야에 관한 과학철학 논쟁에서 관점주의를 실행 가능한 전진 방향으로 제시하였다.¹⁰ 그러나 대부분의 개념이 그렇듯이, 관점주의에는 하나의 버전만 있는 것이 아니라 다양한 표현들이 존재한다는 점을 유의해야 한다.⁶
관점주의는 서로 다른 입장들 사이에서 중간지대(middle ground)를 찾으려는 철학적 사고방식이다. 이는 단순히 기존 생각들의 목록에 하나의 아이디어나 또 다른 “-주의(-ism)”를 추가하는 것이 아니다. 오히려 더 넓고 총체적인 관점(broader, more holistic perspective)을 채택함으로써 철학이 적용될 수 있는 방식의 전환을 이룬다.
인간의 지식(human knowledge), 즉 우리가 무엇을 아는지,
인식론적 주장(epistemic claims), 즉 무엇이 참인지, 그리고 더 일반적으로
인식론(epistemology), 즉 우리가 어떻게 아는지와 관련하여,
...관점주의는 서로 다른 관점들을 고려할 것을 요구한다.
이는 우리가 알 수 있다고 주장할 수 있는 것에 본질적인 한계(inherent limits)를 설정함으로써, 이분법(dichotomies)과 양극성(polarities) 같은 극단적 입장들을 극복하도록 도울 수 있다.¹¹
우리 자신의 관점이 우리가 믿는 것에 어떤 영향을 미치는지 생각하고, 우리의 가정(assumptions)에 질문을 던지는 것이 중요하다. 이는 지식이 본질적으로 특정한 관점들로부터 발생한다는 생각을 받아들이는 것이다. 이러한 생각은 평가에서 암묵적 철학적 입장(implicit philosophical positions)이 어떻게 작동하는지, 그리고 그러한 전제(presuppositions)를 검토하는 것이 왜 중요한지에 관한 현재의 연구와 실제와도 맞닿아 있다.⁵˒¹²
관점주의는 진리(truth)라는 개념을 고려할 때 가장 분명하게 드러난다.
절대주의(absolutism)는 어떤 진술(statement)이 객관적으로 참이거나 참이 아니라고 주장한다. 이에 비해
상대주의(relativism)는 특정한 가정(assumptions), 헌신(commitments), 또는 구성된 맥락(constructed contexts)에 따라 어떤 진술이 참으로 간주될 수 있다는 생각을 도입한다. 왜냐하면 상대주의자에게는 절대적이거나 객관적인 “진리(Truth)”가 존재하지 않기 때문이다. 무엇이 참으로 간주되는지는 우발적(contingent)이고 가변적(malleable)이다.
물론 두 입장 모두에는 정도의 차이가 있다. 예컨대 급진적 상대주의자(radical relativist)나 순수 상대주의자(sheer relativist)는 진리 주장(truth claims)에 관해서는 “무엇이든 가능하다(anything goes)”고 주장할 수 있다.
관점주의는 이러한 문제들에 대해 메타-관점(meta-view)을 취한다. 관점주의는 이러한 논쟁이 발생하는 이유가, 우리가 근본적으로 진리의 개념이 “평가적 배경(evaluative backgrounds)”에 의존한다는 사실을 무시하기 때문이라고 본다. 평가적 배경이란 개인의 관점을 형성하고 그 개인이 진리 주장을 평가하는 방식에 영향을 미치는 다양한 주관적 요인(subjective factors)을 말한다. 이러한 평가적 배경에는 문화적 성장 배경(cultural upbringing), 개인적 경험(personal experiences), 도덕적 가치(moral values) 등이 포함될 수 있다.
관점주의자들은 순수하게 객관적인 관점에서 진리를 보기 위해 이러한 배경들로부터 벗어나는 것은 불가능하다고 주장한다. 대신 개인들은 이러한 배경을 인정하고 그것과 관여하도록 격려되어야 한다. 그렇게 함으로써 이해를 형성하고, 관점들이 이해를 어떻게 형성하는지 인식하며, 보다 정교한 결론(more nuanced conclusions)에 도달하기 위한 건설적 대화(constructive dialogue)에 참여할 수 있다.
관점주의에 대한 흔한 반론은 다음과 같다. 관점주의가 일관된 메타-입장(coherent meta-position)이라고 주장하려면, 관점주의 자체가 참이라고 보아야 하며, 따라서 어떤 절대적 진리(absolute truth)가 존재한다는 입장을 받아들여야 한다는 것이다. 그러나 이러한 비판은 관점적 설명(perspectival account)의 미묘함을 오해한 것이다. 관점주의 자체가 참이라고 말하는 것은 이미 진리의 위계(hierarchy of truth)를 가정하는 절대주의적 관점에서 문제에 접근하는 것이다. 그러나 관점주의는 순수하게 초월적인 관점(pure transcendent viewpoint), 또는 “모든 관점들의 관점(perspective of all perspectives)”이 존재하지 않음을 보여준다.
관점적 설명은
“어디에도 속하지 않는 곳에서 이론화하려 하지 않으며(does not attempt to theorize from nowhere)”, 또한
“이론화하는 사람이 존재하지 않는 척하지 않는다(pretend that the theorizer does not exist).”¹³
따라서 우리가 관점주의라고 말할 때, 그것은 인식적 겸손(epistemic humility)의 한 형태를 받아들이며, 인식론적 주장이 근본적으로 역사적·맥락적으로 위치 지어진 것이라고 보는 것을 의미한다.
관점적 사고를 보건의료전문직 평가에 적용하기 Applying Perspectival Thinking to Health Professions Assessment
관점주의는 진리에 대한 주장(claims to truth)이 타당하고 의미 있을 수 있다고 본다. 다만 진리는 특정한 관점에 대한 참조를 통해 명확히 설명되어야 한다. 세계는 우리가 그것에 가져가는 범주(categories)와 개념(concepts)을 통해, 또는 가다머(Gadamer)의 용어로 말하면 우리가 세계에 가져가는 선판단(prejudgments)과 “지평(horizons)”을 통해 의미를 얻게 된다.¹⁴ Gamez에 따르면, 이는 세계가 서로 다른 관점들로부터 무수한 의미(countless meanings)를 가질 가능성을 부여한다.¹³ 그러나 이러한 의미들을 조정하기 위해, 관점주의자는 서로 다른 관점들 사이의 대화를 장려하여 당면한 문제에 대한 보다 정교한 이해(more nuanced understanding)를 촉진한다.
전통적인 의과대학 졸업시험(final medical examination), 예컨대 객관구조화진료시험(objective structured clinical examination, OSCE)을 생각해 보자.
절대주의/객관주의(absolutism/objectivism)에 기반한 심리측정학적 관점(psychometric perspective)에서 보면, 고부담 OSCE(high-stakes OSCE)의 견고성(robustness)에 관한 특정 주장들은 가치가 있고 타당하게 이해된다. 심리측정학적 사고방식(psychometric mindset)은 질(quality)을 보장하기 위해 통계적 지표(statistical metrics)에 호소할 것이다. 이 관점에서 높은 신뢰도(reliability)는 도구의 방어가능성(defensibility)을 높이며, 이 지표에 비추어 어떤 시험이 다른 시험보다 분명히 “더 낫다(better)”고 주장하는 것이 타당하다.¹⁵˒¹⁶
그러나 구성주의적 관점(constructivist perspective)에서 보면, 심리측정 모형(psychometric models)에 내재한 실증주의적 가정(positivist assumptions)은 정당하지 않게 보일 수 있다.¹⁷ 왜냐하면 구성주의자는 지식의 맥락적 성격(contextual nature of knowledge)을 강조하기 때문이다.
절대주의가 측정의 구체적 기준(concrete standards of measurement)을 확립하려는 반면, 구성주의는 개인들이 지식을 구성하고 해석하는 다양한 방식들을 강조한다. 구성주의자는 단일한 “한 시점(point-in-time)”의 시험이 역량(competence)의 다면적 성격(multifaceted nature)을 충분히 포착할 수 없다고 주장할 수 있다. 이는 심리측정학적 접근이 인간 인지(human cognition)의 풍부한 직조물(rich tapestry)을 지나치게 단순화하기 때문이다.
구성주의자는 또한 시험이 환원주의적(reductionist)이며, 직장에서 훈련생과 상호작용함으로써 의학 훈련생(medical trainee)에 대해 더 정교한 정보를 얻을 가능성을 줄인다고 주장할 수 있다.¹⁸˒¹⁹ 또한 의미 있는 피드백, 예를 들어 서사적 피드백(narrative feedback)을 촉진하지 못한다고 주장할 수도 있다.²⁰
의학 훈련생 평가에서 이들 관점 중 어느 것이 가장 좋은지를 묻는 것은 다시 절대주의적 시각(absolutist outlook)으로 돌아가는 것이다. 관점적 접근(perspectival approach)을 적용하면 질문은 이렇게 바뀐다.
“평가 문제에 접근하는 방식의 기초를 이루는 근본적인 철학적 입장은 무엇인가?”이어서
“이 특정 맥락에서 이 철학적 접근은 정당화되는가?”라고 묻게 된다.
이러한 질문에 대한 답은 아마도 “글쎄, 그것은 당신이 무엇을 하려는지에 달려 있다”가 될 것이다.
관점적 접근의 목적은 사안을 더 복잡하게 만들거나, 어떤 입장이든 옹호할 수 있는 방법을 제공하는 데 있지 않다. 오히려 평가에서 작동하는 근본 가정(underlying assumptions), 맥락적 특징(contextual features), 의도(intentions)를 명확히 하여 접근이 더 견고하고 더 잘 이해되도록 하는 데 있다. 이는 여러 철학적 입장을 동시에 채택할 가능성을 열어주며, 행위자들이 서로 다른 관점을 더 너그럽게 이해하도록 격려한다. 두 관점 모두의 장점을 인정하는 것은 평가에 대한 더 총체적이고 정교한 접근(holistic and nuanced approach)에 기여할 수 있다.
증거에 기반한 논증(argument based on evidence)으로서의 현대적 타당도(validity) 개념은, 정신적으로는 관점주의적이라고 볼 수 있다.왜냐하면 타당도에 대한 근거(rationale)는 제공되고, 정당화되고, 맥락화되어야 하기 때문이다.²¹
보다 넓은 관점적 접근은 van der Vleuten의 유명한 효용 공식(utility formula)에도 존재했다. 이 공식은 평가 기준들을 목적에 따라 최적화해야 한다고 주장했다.²² 그리고 그의 후속 연구인 프로그램화 평가(programmatic assessment)에서는 이러한 관점이 더욱 명시적으로 드러났다.¹²
직장기반평가(workplace-based assessment)에서 최적화해야 할 가장 중요한 요소는 피드백(feedback)과 평가의 학습 또는 교육적 영향(learning or educational impact)이다. 이 원칙에 따르면, 직장기반평가의 가장 중요한 설계 기준(design criteria)이 바로 피드백과 교육적 영향이라고 주장하는 것은 정확하다. 그러나 OSCE에서는 훈련생에 대한 공정성(fairness)을 위해 표준화(standardization)와 신뢰도(reliability)가 최적화해야 할 가장 중요한 설계 기준이라고 주장할 수 있다.
평가과학과 평가 실제에서 관점주의를 표면으로 끌어올리면, 사람들은 그것을 정교한 형태의 상대주의(relativism)에 불과하다고 여길 수도 있다. 그리고 상대주의 역시 단지 가능한 하나의 관점일 뿐이라고 생각할 수 있다. 관점주의의 일관성을 뒷받침하는 자기반박 문제(self-refuting issue)에 대한 기술적 논증들이 있기는 하지만,¹³˒²³˒²⁴ 의학 평가의 사례를 더 살펴보면, 관점주의가 순수 상대주의적 관점(sheer relativist viewpoints)으로 환원될 수 없는 이유를 더 잘 보여줄 수 있다.
의학에서의 정전적 지식(canonical knowledge), 예컨대 기본 해부학(basic anatomy)의 경우,
인간 뇌의 구조와 기능에 관한 주장의 진리성을 부정하는 것은 틀린 일일 것이다. 뇌 해부학에 관한 평가 문항에는 여전히 정답이 있다.
순수 상대주의자는 우리가 구조와 기능을 다르게 재구성할 수 있다고 주장할 것이다.
반면 관점주의자는 의학교과서의 설명과 시험 정답에 동의하되, 이러한 주장이 현대 과학의 관점(modern scientific vantage point)에서 참이라고 덧붙일 것이다. 절대주의적 관점과 관점주의적 관점의 차이는 이 관점에 관한 작은 한정(qualification)에 있다.
실제로 17세기 초 데카르트(Descartes)의 관점에서는 정신과 신체를 분리된 것으로 보고, 정신을 송과선(pineal gland)을 통해 뇌와 상호작용하는 비물질적 실체(nonphysical substance)로 간주하는 것이 관점적으로 참(perspectivally true)이었다. 그리고 먼 미래에 우리의 해부학 교과서가 어떤 모습일지 누가 알겠는가? 다시 말해 여기서 핵심은 “무엇이든 가능하다”고 주장하는 것이 아니다. 오히려 인식론적 주장이 필연적으로 역사적·맥락적으로 위치 지어진다는 점을 인식하는 것이다.
추가 사례로, 많은 평가 설계자(assessment designers)는 특정 시험 맥락에 가장 적합한 기준설정 방법론(standard setting methodology)을 결정해야 한다. 기준설정(standard setting)은 통계적 분석을 사용하고 전문가의 판단(judgments of experts)을 활용하여 시험의 합격점(pass marks)을 결정하는 과정이다.²⁵ 모든 맥락에 대해 “최고의(best)” 기준설정 접근법이 존재하지 않는다는 사실, 즉 절대주의적 관점이 성립하지 않는다는 사실은, 어떤 방법이든 어떤 맥락에서든 사용할 수 있다는 상대주의적 관점이 맞다는 뜻이 아니다. 맥락에 따라 기준설정에는 더 나은 접근과 더 나쁜 접근이 여전히 존재한다.
예컨대 응시자가 5명뿐인 임상시험(clinical examination)에 경계선 회귀법(borderline regression)을 적용하는 것은 최적이 아니라고 주장하는 것은 관점적으로 참이다.
또한 전문가 평가자(expert raters)가 2명뿐인 상황에서 수정 Angoff 방법(modified Angoff approach)을 사용하는 것은 제대로 실행되기 어렵고 타당하지 않은 결과(invalid outcomes)로 이어질 것이라고 주장하는 것 역시 관점적으로 참이다.
두 경우 모두, 응시자 수와 평가자 수라는 맥락에 근거할 때 기준설정 방법 또는 접근이 그 맥락에 적합하지 않다고 주장하는 것은 참이다.
따라서 교육 설계자가 “어떤 기준설정 방법이 가장 좋은가?”라고 물을 때, 그들이 보통 암묵적으로 의미하는 바는 “우리 맥락에서 최적이면서, 동시에 실행 가능하고 적합한 접근은 무엇인가?”이다. 이는 상당히 정교한 입장이다. 그리고 이러한 질문에 답할 때 진리 주장의 참됨(veracity of claims to truth)은 본질적으로 관점적인 성격을 갖는다. 관점주의는 이처럼 복수의 입장(plurality of positions)을 맥락과 필요에 따라 타당하고 정렬된 입장들로 조정한다. 표 1은 관점주의를 추가로 요약하고, 이를 절대주의와 상대주의로부터 구분한다.
표 1 절대주의, 상대주의, 관점주의의 차이 명료화 Clarifying the Differences Between Absolutism, Relativism, and Perspectivism
요소
절대주의 Absolutism
상대주의 Relativism
관점주의 Perspectivism
진리 주장에 관하여
명제(proposition)는 객관적 사실(objective facts)에 따라 참이거나 거짓이다.
명제는 사실을 그에 맞게 구성함으로써 참 또는 거짓이 될 수 있다.
명제에는 참 또는 거짓의 가능성이 있지만, 이는 관점(perspective)에 의존한다.
인식론에 관하여
지식에 대한 인식론적 주장(epistemic claims to knowledge)은 객관적으로 결정되고 검증될 수 있다.
지식에 대한 인식론적 주장에 관해서는 어떤 관점이든 타당하고 정당하다.
지식에 대한 인식론적 주장은 언제나 본질적으로 특정한 관점(vantage points)에서 발생하며, 맥락에 의존한다.
현실에 관하여
객관적이고 초월적인 관점, 즉 “모든 곳으로부터의(from everywhere)” 현실에 대한 관점이 존재한다.
객관적이고 초월적인 관점은 존재하지 않는다. 그러나 여전히 “어디에서도 오지 않는(from nowhere)” 관점을 상정한다.
어디에도 속하지 않는 곳에서 이론화하려 하지 않는다. 존재론적 겸손(ontological humility)의 한 형태를 받아들이며, 존재론(ontology)을 근본적으로 맥락적인 것으로 본다.
보건의료전문직 평가와 관련하여
객관적으로 더 나은 평가 실제와 더 나쁜 평가 실제가 있다고 가정한다. 예를 들어 신뢰도(reliability)가 평가의 질을 결정하는 가장 중요한 특성이라고 주장할 수 있다.
평가 실제에 관해서는 복수의 입장들이 존재하며, 이들 중 어느 것도 다른 것보다 더 낫거나 더 나쁘지 않다고 주장한다. 평가 실제에 대한 개인의 관점은 모두 동등하게 타당하다.
모든 평가 실제가 철학적 전제(philosophical presuppositions)에 의해 추동되며 맥락적으로 위치 지어진 것임을 인식한다. 복수의 입장들을 맥락과 필요에 따라 정렬되고, 그에 따라 타당하거나 적절한 입장들로 조정한다.
관점주의는 독자들에게 평가(evaluation)에 대한 실재론적 접근(realist approaches)을 떠올리게 할 수 있다. 특히 “무엇이, 누구에게, 어떤 상황에서 작동하는가(what works, for whom, and under what circumstances?)”라는 질문을 추구한다는 점에서 그렇다.²⁶
평가에 대한 실재론적 접근은 맥락(context)이 관찰된 결과(outcomes)에 어떻게 영향을 미치는지 이해하는 것의 중요성을 강조한다. 관점주의 역시 진리와 지식에 대한 우리의 이해를 형성하는 다양한 관점들을 이해하는 것의 중요성을 강조한다.
두 경우 모두, 어떤 사안에 대한 순수한 객관성(pure objectivity)은 맥락이나 관점으로부터 완전히 분리되어 접근될 수 없다는 점을 인정한다. 따라서 관점주의와 실재론(realism)은 모두 세계를 이해하고 개입(interventions)을 평가할 때 맥락 민감적 접근(context-sensitive approach)을 취하는 것의 중요성을 강조한다. 그 결과 당면한 문제에 대한 더 정교한 이해가 가능해진다.
ten Cate와 Regehr는 평가에서 주관성을 받아들여야 한다고 주장하면서도, 의학 훈련생 평가에서 복수의 관점(plurality of perspectives)이 얼마나 중요한지를 잘 설명하였다.³ 얼핏 보면 그들의 작업은 객관성보다 주관성을 옹호하는 설명처럼 읽힐 수 있다. 그러나 저자들은 연구와 실제에 대해 더 정교한 방향을 제시한다. 평가 맥락에서 주관성을 받아들이는 것이 “자료와 평가에 대한 ‘전-심리측정학적(pre-psychometric)’ 사고방식으로의 복귀를 초래해서는 안 된다.”³ 오히려 서로 다른 평가 관점들을 받아들인다는 것은 맥락 의존적 정보(context-dependent information)로부터 나오는 가치를 인식하고, 그 중요성에 적절한 무게를 부여하는 것을 의미한다.
Pack과 동료들의 연구는 이를 잘 예시한다. 그들은 역량위원회(competence committees)가 “문제적 증거(problematic evidence)”를 어떻게 다루며, “해석적 틀(interpretive frameworks)과 평가 자료 및 판단의 피할 수 없는 주관적 성격(inescapably subjective nature of assessment data and judgment)” 사이의 불일치를 어떻게 협상하는지 탐구하였다.²⁷ 이러한 접근들은 정확히 관점주의의 정신과 일치한다.
마지막 사례로, 전형적인 역량위원회(competence committee)의 작동을 생각해 보자. 의학 훈련생의 결과(outcome)를 심의할 때, 위원회 구성원들은 평가와 관련된 근본 가정과 헌신에 의해 안내될 것이다. 우리는 이러한 암묵적 관점(implicit views)에 주의를 기울여야 한다고 주장한다. 특히 위원회가 이러한 가정에 근거하여 내리는 추론(inferences)이 학생들에게 큰 영향을 미치기 때문이다.
어떤 학습 대화(learning conversations)를 해야 하는지, 학생이 훈련 프로그램을 계속 진행할 수 있는지, 또는 학생이 보충교육 과정(remediation process)에 들어가야 하는지와 같은 개인에 관한 결정은 고부담 결정(high-stakes decisions)이다. 이러한 결정의 질(quality)과 방어가능성(defensibility)은 실제에서 쉽게 달라질 수 있으며, 연구자들은 그러한 결정이 신뢰 가능하고 견고해야 한다고 올바르게 주장해 왔다.²⁸
위원회 전체와 개별 위원들은 자신들이 어떤 철학적 관점(philosophical perspectives)에서 작업하고 있는지를 설명함으로써, 심의를 이끌고 있을 수 있는 은밀한 영향(covert influences)을 드러낼 수 있다. 물론 이러한 이론적 접근을 실제로 구현하는 것은 어려울 수 있다. 그러나 역량위원회에서 교착상태(stalemates)가 발생했을 때 추가될 수 있는 가치를 생각해 보라.
위원들이 합의(consensus)에 도달하지 못한다면, 그들은 교착상태의 기원(origin of the stalemate)을 파악하기 위한 일련의 질문에 답하도록 요청받을 수 있다. 예컨대 다음과 같은 질문들이다.
“자료에서 당신에게 가장 중요한 것은 무엇인가? 일관성(consistency)인가? 변동성(variability)인가? 유용성(utility)인가? 포화(saturation)인가? 등…”
“어떤 형태의 자료가 당신에게 더 큰 무게를 갖는가?”
“자료를 얼마나 신뢰하는지에 가장 큰 영향을 미치는 요인은 무엇인가?”
“실증주의(positivism), 구성주의(constructivism), 실용주의(pragmatism) 등과 같은 철학적 입장에 연결된 가정들의 목록을 검토할 때, 어떤 것이 당신의 헌신(commitments)과 가장 잘 맞는가?”
우리는 이러한 서로 다른 관점들이 반드시 바뀌어야 한다거나, 위원회 안에서 공존할 수 없다고 주장하는 것이 아니다. 오히려 그러한 관점들이 명시되고, 심의의 일부를 구성해야 한다고 권장하는 것이다. 이러한 과정이 항상 교착상태를 해결하지는 않을 것이다. 그러나 대화를 전환하고 합의에 이르는 새로운 길을 열 수는 있다.
철학적으로 명시적인 접근의 함의 Implications of a Philosophically Explicit Approach
다른 글에서 우리는 평가를 해석적 과정(interpretive process)으로 널리 인정해야 한다고 주장해 왔다. 이를 위해서는 철학적 관점(philosophical outlooks)을 명료화하고 발전시키는 데 헌신해야 한다.¹˒¹²˒²⁹˒³⁰ 평가 연구에서 저자들은 자신의 철학적 가정(philosophical assumptions)을 거의 보고하지 않는다. 이는 서로 다른 추론(divergent inferences)에 기반한 가변적인 해석(variable interpretations)으로 이어질 수 있다.⁵
보건의료전문직 평가에 관점적 렌즈를 적용하는 것은, 평가에서 작동하는 해석적 과정을 철학적으로 명시해야 한다는 필요성을 받아들이는 것이다. 이를 통해 실제에서 명료성(clarity)을 증진할 수 있다. 이는 모든 평가 실제가 관점적(perspectival)이라는 점을 인정한다. 즉, 평가 실제는 철학적 전제(philosophical presuppositions)에 의해 추동되며, 지역적 맥락(local contexts)과 가정(assumptions) 속에 위치 지어진다. 그러나 이러한 요소들은 너무나 자주 완전히 암묵적인 상태로 남아 있다.⁵
바라건대, 이러한 관점은 평가 공동체가 평가에서 계속 혁신하도록 격려할 것이다. 이는 다양한 평가 관점들의 중요성을 인정하는 데서 출발한다. 그리고 그러한 관점들은 시간이 지나면서 자연스럽게 변화해 왔다.³¹˒³²
비록 우리는 보건의료전문직의 평가에 초점을 맞추었지만, 관점적 사고는 평가를 넘어 의학교육 담론과 실제를 보다 일반적으로 발전시킬 잠재력을 지닌다. 우리의 바람은, 더 비판적인 성찰을 촉진함으로써 이 관점적 사고에 대한 설명이 보건의료전문직교육의 연구자와 실천가 모두가 철학적으로 어떤 일이 더 자주 일어나고 있는지를 더 잘 이해하도록 돕는 것이다. 또한 우리는 독자들이 보건의료전문직 평가에서 문제를 다루고 해결책을 제안할 때, 관점주의의 정신에 따라 더 많은 철학적 질문을 던지기를 권한다.
여러 의과대학에서 #의사과학자 양성 또는 #연구역량 함양을 위한 교육과정을 운영하고 있다. 한양의대도 2017년부터 ‘#한양의과학자양성프로그램’이라는 비교과 프로그램을 시작하였다. 학생은 한 명의 교수와 1:1로 매칭되고, 3월부터 12월까지 약 10개월간 연구에 참여하게 된다. 2017년에 10개 과제로 시작된 프로그램은, 작년과 올해에는 30개 이상의 과제로 규모가 확대되었다.
이런 프로그램에서는 흔히 “의과대학생이 제1저자로 OOO저널에 논문을 게재했다”와 같은 것을 ‘성과’로 홍보하곤 한다. 실제로 한양의과학자양성프로그램에서도 적지 않은 학생들이 학술대회에서 발표를 하거나, 공저자나 주저자로 논문을 출판하기도 하였다. 물론 연구 역량 함양의 근거로 ‘논문’으로 상징되는 성과는 중요하다. 하지만 의학교육학을 전공하는 입장에서, 단순히 겉으로 보이는 결과물이 아니라, 그것이 만들어지는 ‘과정’에 조금 더 관심을 가지고 싶었다.
결과물이 중요하지 않다는 의미는 아니다. 그러나 연구 프로그램에 참여하는 모든 학생이 논문을 쓰는 것도 아니고, 심지어 모든 학생이 논문을 쓰려고 이런 프로그램에 참여하는 것도 아니다. 조금 과장해서 말하자면, 논문이 필요한 것은 ‘교수’이지 ‘학생’이 아니다.
이러한 이유로 “연구 프로그램에서 학생들을 더 적극적으로 참여하게 만드는 요인은 무엇일까?” “학생들은 어떤 경험을 통해서 조금 더 능동적인 연구활동을 수행할까?” 라는 질문으로 질적연구를 시작했다.
다행스럽게도 (많이 부족하지만) 그 연구가 오늘 출판되었다. 연구 결과를 한 문장 요약하면 ‘학생이 연구에 적극적으로 참여하게 만들기 위해서는 학생과 교수와 프로그램이 각각 갖춰야 할 특징들이 있다’이다. 이렇게만 보면 가끔 질적 연구는 ‘너무 뻔한 이야기’를 하고 있는 것처럼 보이기도 한다. 하지만, 핵심 결과를 아래처럼 체크리스트로 만들어서 그 중에 몇 개쯤을 하고 있는지를 생각해보면, 당장 나 스스로부터 (심지어 이런 연구를 수행하고서도) 잘 하고 있었는지 반성해보게 된다.
1. 의과대학 학생들은 새로운 경험에 대해서 개방적인가?
2. 의과대학 학생들은 과거에 연구활동에 노출되거나 직접 수행한 적이 있는가?
3. 학생과 교수의 관계가 일시적이지 않고, 장기간 유지될 가능성이 있는가?
4. 연구활동 진행 과정에서 학생은 작더라도 유의미한 기여감과 성취감을 느낄 수 있는가?
5. 교수는 연구에 관한 학생의 의견을 수용하고, 편안하게 질문할 수 있는 존중을 보이는가?
6. 교수는 연구 진행과정에서 학생에게 과제의 내용/기한/방법/목적을 명확히 설명하는가?
7. 교수는 학생의 연구 수행에 대해 적절한 칭찬과 교정을 포함한 건설적 피드백을 주는가?
8. 교수는 학생이 연구참여 과정에서 다양한 연구자와의 교류와 협업 기회를 제공하는가?
9. 프로그램에서 학생에게 요구하는 과제는 무엇이며, 수행 및 제출 시점은 언제인가?
10. 연구 프로그램은 교육과정의 다른 요소나 과목과 상호보완적인 관계에 있는가?
11. 교육과정은 학생에게 연구를 수행할 충분한/보장된 시간을 제공하는가?
---
답답함과 불안함 속에서도 몇 번의 리젝, 투고, 수정 과정을 수행해준 석사과정 이효정 선생님과 강예지 교수님, 논문의 강점을 살릴 돌파구를 제안해준 임정준 교수님 감사드립니다.
요즘과 같이 의사과학자 양성이 의학교육의 중요한 화두가 된 시점에, 관련된 교육을 하시는 여러 분들께 조금이나마 도움이 되었으면 합니다.
--- 《연구 주요결과 요약》
1) 학생
1-1) 첫 번째 학생 요인은 ‘새로운 경험을 향한 열망’이다. 단조로운 의과대학 생활 속에서 무언가 새로운 경험과 자극을 찾거나, 도전적인 과제를 기꺼이 받아들이는 태도였다.
1-2) 두 번째 요인은 과거의 연구 경험이다. 특히 고등학교에서 연구와 관련된 경험이 있는 학생일수록 프로그램에 진입하는 것도, 이후에 진행하는 것도 수월했다.
1-3) 세 번째는 좋은 인상을 남기고자 하는 마음이다. 학생들은 프로그램에서 매칭된 연구 지도교수에게 자신이 어떻게 보여질지를 의식하고 있었다. 이유는 학교에서든 병원에서든, 심지어는 나중에 전공의를 가서든 다시 보게 될 가능성이 있기 때문이었다.
1-4) 네 번째는 연구에 무언가 기여를 하고 있다는 느낌이다. 큰 성과가 아니라도, 연구 시간의 단축이나 연구 방법의 작은 개선도 이들에게는 의미있는 성취감을 주었다.
2) 교수
2-1) 첫째는 학생에 대한 존중이다. 지도교수가 친절하게 대해주는 것, 질문에 답해주고 질문하는 것에 대한 걱정을 덜어주는 것, 학생의견을 수용하는 것으로부터 학생들은 동기부여되었다.
2-2) 둘째는 명확한 과제를 설정하는 것이다. ‘명확하다’는 의미는 과제의 내용을, 과제의 기한을, 과제 수행의 방법을, 그리고 무엇보다 그 과제의 목적을 명확히 전달하는 것을 의미한다.
2-3) 셋째는 건설적 피드백을 주는 것이다. 단순한 칭찬이 전부는 아니지만, 어떤 칭찬은 학생의 뇌리에 깊이 남아 연구를 지속할 수 있는 힘을 준다. 미처 생각하지 못했던 부분에 대한 교정적 피드백은 학생이 연구 방향을 재설정하거나 성장하는 기회가 된다.
2-4) 넷째는 더 넓은 연구 공동체로의 초대이다. 지도교수가 다른 연구자와 관계맺는 방식을 배우기도 하고, 다른 분야의 연구자로부터 직접적인 도움을 받기도 한다. 자신과 관계된 사람의 수가 늘어날수록 학생은 더 큰 책임감을 느끼기도 한다.
3) 프로그램
3-1) 먼저 프로그램에서 적절한 과제를 지정하여 요구하는 것이 도움이 된다. 연구노트를 기록하는 것, 보고서를 쓰는 것, 중간 및 최종 발표를 하는 것 등은 스스로의 진행상황을 점검하고 다른 학생과 비교해보는 기회를 준다.
3-2) 연구 프로그램은 다른 교육과정과 상보적인 관계를 가질 수 있다. 연구 프로그램이 전체 교육과정에서 고립되지 않는 것이 중요하다. 연구 과정에서 배운 지식과 스킬을 다른 과목에서 적용할 수도 있고, 반대로 다른 과목에서 배운 것을 바탕으로 연구를 수행할 수도 있다.
3-3) 마지막으로 학생들이 연구를 하려면 시간이 필요하다. 이런 측면에서 코로나는 어떤 학생들에게는 좋은 기회였다. 녹화 수업을 원하는 시간에 시청하고, 오히려 낮 동안 실험실에 나가서 연구에 몰입할 수 있었기 때문이다.
이번 의학교육학술대회 준비와 실행 과정을 돌이켜보다가 문득 나는 2013년부터 시기별로 어떻게 변해왔는지 생각해봤다.
• 새로운 분야에 대한 호기심(2013~2014년): 의학교육 분야에 아무것도 모르는 채로 (다소 충동적으로) 진입한 시기. 당연하게도 내가 모르는 것과 배워야 할 것이 산더미였지만, 두려움보다는 모든 것이 새롭고 신기하고 재미있어 보이던 시기.
• 연구와 논문에 대한 생소함과 우려(2014~2017년): 시야를 조금씩 넓혀가던 시기. 여하튼 일단 학위과정에서는 논문을 써야했으니, 읽은 논문 중 몇 개를 비슷하게 따라해보며 이런저런 시도를 하고 여러 시행착오를 겪던 시기. 그러면서 '이렇게 하는게 맞나' 싶었던 시기.
• 이른 성취가 가져다 준 자신감(2017~2019년): 일과 가정 모두에서 어느 정도 안정과 작은 성취들이 쌓이던 시기. 지금 돌이켜 생각해보면 무척 미숙했으면서도 (물론 지금도 미숙하지만) 이른 성취에 가려져서 였는지 스스로 그걸 잘 몰랐던 시기.
• 커리어 패스의 근원적인 한계 인식(2020~2022년): 한 번의 이직 후 소속 기관 안팎에서 맡겨지는 역할이 지속적으로 늘어나던 시기. 역할이 늘어남에 따라 요구되는 역량/스킬셋도 늘어나며, 어느 정도 성장하기도 한 시기. 하지만 동시에 내가 속한 분야와 내가 밟아온 커리어 패스의 근원적 한계(= 나의 한계)를 깨달아가는 시기.
• 조직과 나의 역할에 대한 고민(2022년 하반기~): 내가 가진 장/단점이 조직의 장/단점과 어떻게 조화하여 시너지를 갖거나, 반대로 어떻게 결합되어 한계에 봉착하는지를 겪거나, 고민하거나, 깨닫던 시기. 여러 조직(의대)의 서로 다른 문화와 특성이 조금씩 분별되던 시기. '나'라는 사람을 어떻게 사용해야 할지, 내 역할은 무엇일지, 나는 무슨 역할을 하고 싶은지 고민하는 시기.
"서로 보기 면담inter/view은 두 주체 사이의 교환이다. 그것은 문자 그대로 상호적 목격이다. 반대편에서 이쪽을 볼 수 없다면, 내가 타인을 볼 수 없음은 당연하다. 상호작용 하는 두 주체는 상호성을 확립하지 않는 한 함께 움직일 수 없다. 따라서 현장 연구자는 덜 왜곡된 소통과 덜 편향된 자료수집의 조건을 통해 평등을 객관적으로 이해해야 한다.
구술사에 관한 이 정식은 인문학과 보건의료의 교차점에서 일하는 의료인과 교사에게로 확장될 수 있다. 치료와 교육은 근본적으로 상호주관적인 서로 보기 면담이며, 그렇기에 평등에 관한 실험이다. 여기에서 평등이란 의사, 간호사, 학자가 자신의 지식과 권위를 포기하는 것을 의미하지 않는다. 그것은 학생, 고객, 환자를 더 잘 돌보기 위해, 우리 사이 더 만족스러운 전문가적 관계를 위해 상호성과 투명성을 향해 나아가는 것을 의미한다."
이번 학기 의예과 1학년 과목을 운영하면서, 과목 진행하며 수 차례 "저는 이 과목에서 F를 줍니다."라고 이야기했음에도 불구하고, 최종적으로 10명(1주차부터 모두 결석한 3명 포함 총 수강생 117명)에게 F를 부여했다.
그렇다고 (내 기준으로는) 얼마나 대단히 엄격하게 평가한 것도 아니다. 예를 들면, 웬만한 평가는 일단 '기본만 하면' 60%는 받아갈 수 있게 설계 및 채점하였고, 수업 중에 진행하는 설문 등에 '성실히 응답만 하면' 1점씩 가산점을 여러 차례 주었고, 최종적으로 원점수에서 일괄적으로 몇 점씩 상향보정도 했다. 그럼에도 10명(실인원 7명) F라는 결과가 난 것이다. (원점수 합산 후 추가 상향보정 하지 않은 상태에서 60점 이하는 18명이었다.)
그래서 결국 F를 받은 학생들의 점수를 살펴보면 아래의 a~d중 보통 세 가지씩은 해당하는 양상을 보인다.
(a) 여러 차례 결석을 함
(b) 조 내 동료평가 점수에서 0점을 받음(즉, 다른 모든 조원이 이 학생의 기여도가 없었다고 판단함)
(c) 기말과제보고서 최소분량에 현저히 미달하여 60%의 점수조차 주지 못함
(d) 제출만 하면 되는 동료평가를 제출하지 않아서 감점당함
물론 열심히 하는 의예과 학생, 당연히 있다. 그리고 "의과대학 6년제"가 "본과 6년제"가 되기를 바라지 않는다. 하지만 현재 의예과가 가진 문제점이 과연 이러한 시스템적 개선 없이도 고쳐질 것인가에 대해서는 대단히 회의적일 수 밖에 없다.
의료인문학(으로 통칭되는) 과목의 주요 교수자는 크게 이 세 유형으로 구분될 것 같다. 물론 둘 또는 셋의 교집합도 있다. 문제는 한 분야의 전문성이 다른 분야의 전문성을 담보하지 못하는 데 있다.
예를 들어, 의학교육학을 전공한 나는 어떻게 가르쳐야 하는지는 안다. 하지만 특정 분야의 내용(의료커뮤니케이션, 의료윤리 등)이나 그것이 임상현장에서 어떻게 활용되는지에 대해서는 제한적으로만 파악하고 있다.
다른 예로, 임상 교수님들은 늘상 환자와 의사소통하며 윤리적 판단을 내린다. 하지만 경험과 직관으로 체화된 그 행위를 학문적 근거를 토대로, 학생의 수준에 맞게 세분화하고, 효과적인 방식으로 가르치는 것에 대해 어려워하시는 모습을 본다.
2. 의과대학의 현실
일단 의과대학에는 의료인문학(으로 통칭되는) 과목을 담당할(또는 담당하고자 하는) 교수의 수가 적다. "석사 또는 박사 학위"로 대변되는 "전공자"로 제한하면 특히 더 그렇다. 임상에서는 낙수과니 기피과니 비인기과니 하지만, 그보다 더 적은 것이 의과대학 졸업 후 기초의학을 전공하는 사람일 것이며, 그것보다도 더더더 적은 것이 의과대학 졸업 후 의료인문학을 전공하는 사람이 아닐까. 하다못해 의과대학을 졸업하고 의료인문학 계열 교실에서 파트타임 대학원생을 하는 경우도 거의 없다.
하지만 전공자가 있든 없든 의과대학에는 이미 평가인증 기준에도 명시된 "의료인문학" 교육과정으로 개설된 과목들이 있다. 따라서 누군가는 그 과목을 맡아야 하고, 그 수업을 해야 한다. 하지만 사람이 부족하다보니 교육학(또는 의학교육학) 전공자들에게 의료인문학(혹은 인문사회의학으로 불리는) 과목의 수업이나, 책임교수나, 더 크게는 전체 의료인문학 교육과정을 설계/운영하는 책임이 맡겨진다. 기초의학도 아니고 임상의학도 아닌 과목, 그래서 누구도 적극적으로 맡으려 하지 않는 역할이 다만 인접한 분야라는 이유로 맡겨지는 것이다.
3. 교육 전공자의 입장
학교 입장도 이해는 된다. 의료인문학 전공자(내용전문가 or 학위소지자)는 매우 적고, 임상 선생님들은 수업이나 과목을 맡기 부담스러워한다. 그나마 가까운 분야로 보이는 것이 (마침 평가인증 덕분에 학교마다 한 명씩은 있는) 교육학/의학교육학교실 전임교원이다.
이러니 교육 전문가도 힘겹긴 마찬가지다. 한/중/일이 동아시아 국가로 퉁쳐져도 서로는 서로를 구분한다. 어쩌면 의료인문학과 의학교육학도 그렇다. 멀리서(예컨대 기초의학/임상의학 전공자가) 보기에는 비슷해 보이는 듯 하다. 하지만 의료인문학으로 묶이는 학문들도 서로 다르고(의사학-의철학-의료윤리 등), 의학교육학과 의료인문학도 다르다. 공통점은 어쨌거나 "문과"라는거...?
그리하여 교육 전문가는 종종 내용 전문가도 아니고 임상현장의 프랙티스도 모르지만 교육은 해야하는 입장에 놓인다. 이상적으로는 내용전문가 및 임상가와의 삼각협력이 좋겠지만, 내용전문가는 가까이 없고, 임상가는 선뜻 참여하려 하지 않는다.
4. 어떻게 해야할까
교육 전문가일지라도, 한 분야의 전문성이 다른 분야의 전문성을 담보하지 못한다는 것을 겸허히 수용해야 한다. 최소한의 내용전문성도 갖추고, 최소한의 임상현장에 대한 이해도 필요하다.
못하겠으면 안 하는 것도 방법이다. 교육전문가가 교육과 관련된 모든 문제를 해결할 수 없고, 그러한 노력이 마냥 바람직하지도 않다. 조직에서 요구하는 역할을 무작정 거부해서도 안 되지만, 내 역량의 한계를 인지하는 것도 프로페셔널리즘이다. 조직의 문제는 조직이 감당할 책임도 있다.
학술적으로는, 두루뭉술하게 설문을 설계한 사람조차 해석하지 못할 설문은 지양했으면 한다 (주최측엔 죄송하지만, 설문을 열었다가 닫아버린 솔직한 심정이다). 그보다는 협소해도 단단한 근거가 필요하다. 만약 내용전문가나 임상가가 아니라 교육 전문가가 교육하는 것도 필요하다(또는 충분하다)고 주장하려 한다면, 적절한 연구를 설계해서 근거를 가지고 주장할 필요가 있겠다.
1. 교강사가 강의를 하면서 출석과 관련해서 하지 말아야 할 것 중에 하나가 '출석한 학생'들을 대상으로 '결석/대리출석에 대해서 문제삼기'이다. 그런데 일부 교수님들은 수업에 가셔서 종종 '이미 성실하게 출석한 학생'들을 대상으로 부정출결은 패널티를 주겠다며 엄포를 놓거나, 불성실하거나 부정직한 출결을 한 학생들을 비난하거나, 한명한명 이름을 불러가며 출석체크를 하느라 수업시간을 소모하곤 한다. 결과적으로 결석한 학생은 받지 않는 패널티를 출석한 학생이 받는 상황이 벌어진다.
2. 하지만 교강사의 이러한 행동만 문제삼기에는 그럴 만한 이유가 없는 것은 아니다. 왜냐하면 대리출석이 가능한 이유는 '출석한 학생'이 '결석한 학생'을 도와주기 때문이다. 또한 한 날에 출석한 학생은 다른 날의 결석한 학생이 될 수도 있다. 이렇게 학생들이 서로의 부정직한 행위를 도와주기 때문에 유지되는 것이 대리출석이다. 물론 단 한번도 그런 부정직 행위에 가담하지 않은 학생들도 있을 것이다. 그래서 여전히 교강사의 1과 같은 행위는 문제가 있다.
3. 그럼 학생들은 왜 대리출석을 했을까. 하나는 '그럴수 있기' 때문이고, 다른 하나는 '그래도 되기'때문이다. 현재 시스템에서는 (예를 들어 인증번호를 입력하는 방식 또는 일정 반경 내에 스마트폰이 있으면 위치를 인식하는 방식 등) 손쉽게 대리출석이 가능하다. 그리고 현재 시스템에서는 그렇게 대리출석한 학생에 대해 의과대학에서도 적극적으로 문제삼고 있지 않다(예를 들어 반복된 대리출석에 대해 중징계하지 않는다).
4. 이렇게 보면 지금 의료에서 발생하는 큰 문제는 사실 이미 의과대학에서부터 미시적으로 발생하고 있고, 아무도 고치고 있지 않은(고치지 못하는?) 문제의 확장판 같다
"내러티브 탐구는 그렇지 않았으면 침묵 속에 머물렀을지도 모를 목소리들을 증폭시킨다. 이는 이야기하기(story-telling)를 통해 참여자들의 현실을 더 넓은 청중에게 전달하는 수단으로 활용된다"
"데이터의 어원을 찾아보면, 라틴어 ‘주어진 것’에서 유래한다. 데이터의 어원과 의미를 고려할 때, 내러티브 탐구자가 연구를 위해 수집하는 것을 ‘데이터’라고 지칭하기는 어렵다. 내러티브 탐구자들은 이른바 ‘데이터’라는 것이 객관적으로 존재한다고 믿지 않을 뿐더러, 주어진 것을 ‘발견’하는 것이 내러티브 탐구자의 역할이라고 생각하지 않기 때문이다. 따라서 클랜디닌과 카늘리는 ‘데이터’라는 용어보다 ‘텍스트(text)’라는 용어가 더 적절하다고 주장하였다. 텍스트란 해석해야 할 그 무엇을 의미한다. 삶의 경험은 마치 텍스트와 같이 끊임없이 재해석되고 재구성되는 존재이다."
"연구자가 알고 싶은 것만 듣는 것이 아니라, 연구참여자가 하고 싶은 이야기를 듣는 것, 이것이 내러티브 면담의 기본 자세이다. 연구자는 연구참여자의 이야기를 다 듣고, 그러고 나서 그의 이야기에서 궁금한 것들, 좀 더 자세히 듣고 싶은 것들, 탐사해 보고 싶은 것들에 대해 연구참여자에게 질문을 한다. 말하자면, 비구조화된 면담(unstructured interview)으로 시작해서, 여기서 이야기된 내용을 토대로 반구조화된 면담(semi-structured interview)을 하는 것이다."
정부의 일방적 의대 정원 확대 정책에 맞선 집단행동 과정에서, 의료 체계 내 최약자에 속하는 의과대학생이 가장 큰 부담을 떠안았다. 그리고 이 부담은 프랙탈 불평등(fractal inequality)의 논리처럼 학생 집단 내부에서도 다시 분화되어, 24·25학번(곧 26학번까지 포함), 즉 더블링/트리플링으로 교육 여건이 가장 열악해질 세대에게 집중되고 있다.
결과적으로 “외부(정부)로부터 야기된 구조적 부당함을 해소하려는 투쟁” 이, 아이러니하게도 “내부(학번 간) 구조적 부당함” 을 재생산하는 모순이 발생했다.
이러한 프랙탈 불평등 현상을 우리는 어떻게 이해하고, 어떤 연대·보상 메커니즘으로 교정할 수 있을까?
"시스템은 그저 오래된 대상들의 집합이 아니다. 시스템은 일련의 요소들이 뭔가를 달성하도록 일관되게 조직되고 상호 연결된 것이다. 이 정의를 잠깐만 깊이 살펴보면 시스템은 요소, 상호연관성, 기능 혹은 목적이라는 세 가지로 구성된다는 사실을 알 수 있다."
"시스템의 요소와 상호연관성, 목적을 하나씩 바꿔보면 상대적인 중요성을 이해할 수 있다. 일반적으로 시스템에 최소한의 영향을 주는 방법은 요소를 바꾸는 것이다. 축구팀은 선수를 모두 바꿔도 여전히 같은 축구팀이다(팀의 기량이 훨씬 더 좋아지거나 떨어질 수는 있다. 시스템에는 정말 중요한 특정 요소들이 있기 때문이다). 나무는 끊임없이 세포를 바꾸고 해마다 잎을 바꾸지만, 본질적으로 여전히 같은 나무다. 여러분의 몸도 몇 주마다 한 번씩 대부분 세포를 교체하지만 계속해서 여러분의 몸이다. 대학도 새로운 학생들이 계속 들어오고 교수와 관리자도 더디게 꾸준히 들어오고 나가지만 여전히 대학이다. 사실 여전히 같은 대학이다."
"일반적으로 시스템은 계속 자신을 유지하며 모든 요소가 바뀌어도 상호연관성과 목적이 변하지 않는 한 아주 느리게 변한다."
"상호연관성이 바뀌면 시스템은 크게 달라진다. 선수 교체 없이도 상호연관성이 바뀌면 같은 팀인지 몰라볼 정도로 달라진다. 축구 야구 건 규칙을 바꾸면 완전히 새로운 구기 종목으로 변한다. 흔히 말하듯 상황이 완전히 바뀌는 것이다. 나무의 상호연관성을 바꿔보자. 예를 들어 나무가 이산화탄소를 흡수하고 산소를 배출하는 대신 산소를 흡수하고 이산화탄소를 배출한다면 동물이지 더 이상 나무가 아닐 것이다. 대학에서 학생이 교수에게 학점을 주고 이성 대신 힘으로 논쟁의 승패를 가른다면 대학 대신 다른 명칭이 필요할 것이다. 흥미로운 조직이겠지만 대학은 아닐 것이다. 상호연관성이 바뀌면 시스템이 극적으로 변한다."
"기능 혹은 목적의 변화도 극적이다. 예를 들어, 축구팀의 선수와 규칙은 그대로 두고 목적을 승리가 아니라 패배로 바꾸면 어떻게 될까? 나무의 기능이 생존과 증식이 아니라 땅속 영양분을 모두 빨아들여 무한히 성장하는 것이라면? 대학도 마찬가지다. 돈을 벌거나 특정 사상을 주입하거나 축구 경기에서 승리하는 등 지식의 전파 외에도 사람들이 이제껏 상상한 대학의 목적은 아주 많다. 모든 요소와 상호연관성이 그대로 있어도 목적이 변하면 시스템이 완전히 바뀐다."
"시스템에서 가장 중요한 것이 요소인지 상호연관성인지 기능인지 묻는 것은 시스템 사고에 걸맞은 질문이 아니다. 세 가지 모두 필수적이고 상호작용하며 각각의 역할이 있다. 하지만 시스템에서 가장 불분명한 부분인 기능 혹은 목적이 흔히 시스템의 행동을 결정하는 가장 중요한 요인이다. 상호연관성도 매우 중요하다. 관계가 바뀌면 대체로 시스템의 동태가 변하기 때문이다. 흔히 시스템의 독특한 특징을 규정할 때 가장 중요하지 않은 것은 시스템에서 가장 눈에 잘 띄는 요소다. 다만, 요소의 변경이 관계나 목적의 변경으로 이어지지 않을 때만 그렇다."
"나는 다른 사람들의 이야기에 관심이 있기 때문에 면담(interview)을 한다. 단순하게 말하자면, 이야기는 앎의 방식인 것이다. '이야기(story)'라는 단어의 근원은 그리스어로 'histor'라고 하는데, 이는 '현명하고(wise)' '박식한(learned)' 사람을 의미한다(Watkins, 1985, p. 74). 이야기를 하는 것은 본질적으로 의미를 만들어 가는 과정이다. Aristotle는 세상 모든 이야기에는 도입과 전개와 결말이 있다고 했다(Butcher, 1902). 자신이 경험한 세부적인 내용에 도입, 전개, 결말을 부여하기 위해서는 자신의 경험을 곰곰이 되짚어 보아야 한다. 경험을 구성하고 있는 세부적인 내용을 선택하고, 이를 되짚어 보고, 순서대로 나열하고, 그럼으로써 의미가 통하게 하는 일련의 과정은 이야기를 통해 의미를 만들어 가는 경험을 제공한다(Schutz, 1967, p. 12, p. 50 참조).
사람들이 자신의 이야기를 하면서 사용하는 모든 단어는 그들의 의식을 보여주는 축도다(Vygotsky, 1987, pp. 236-237). 사회적·교육적 쟁점은 사람들의 구체적인 경험에 기초한 추상적 개념이기 때문에 가장 추상적이고 복합적인 사회적·교육적 쟁점에 접근할 수 있도록 해 주는 것은 개인의 의식이다. W. E. B. Du Bois는 이를 체험하고,"나는 내가 가장 잘 알고 있는 나의 인생에 대해 설명함으로써 삶에 대한 영적인 의미와 인종 문제의 중요성을 천명하는 방법을 알게 되었다.”라고 했다(Wideman, 1990, p. xiv)."
캐나다에서 배운 것은 내가 절박함을 호소하며 나서서 요구하지 않으면 아무도 나를 도와주기는 커녕 절박함을 알아주지도 않는다는 사실이었다. 그곳에서 머문 기간 중, 처음 절반 정도의 기간은 이 사실을 배우는데 쓴 것 같다. 한국이라는 고맥락 사회에서 해오던 습성대로 지냈다. 내가 주변에 어떠한 기운이나 분위기를 드러내고 있으면 그것을 눈치채주리라 무의식적으로 기대하고 생각했던 것 같다. 하지만 그 곳에서는 그렇지 않다는 것을 점차 깨달아갔다. 내가 한 발짝도 움직이지 않으면, 대부분의 경우 상대방도 한 발짝도 움직이지 않았다. 그렇기에 드물게 반대로 누군가가 먼저 내 상황을 짐작하고 내가 필요로 하는 무언가를 제안해주었을 때, 그런 분들이 더욱 고맙게 느껴졌다. 아무튼 이 1년의 경험이 ‘절박함’에 대한 내 가치관에 많은 영향을 줬다.
하나. 캐나다에서 1년을 지내고 돌아와보니, 가기 전에 받아 두었던 연구비의 연구기간 종료가 임박해 있었다. 누군가에게는 푼돈에 가까운 금액일 만한 작은 교내 연구과제였다. 하지만 나에게는 아무리 작더라도 꼭 필요한 연구비였다. 과제기간이 종료되면 8월에 가려고 했던 국외 학회에 이 연구비를 사용할 수 없기 때문이었다. 올해만큼은, 8월에, 그 학회에, 꼭 가고 싶었다. 문제는 과제기간 연장이 불투명하다는 점이었다. 내 연구과제를 담당하는 산학협력단 직원은 내가 이미 작년에 한 차례 연구기간을 연장을 했기 때문에 올해 더 이상의 추가 연장은 불가하다고 했다. 재차 물어봐도 대답은 같았다. 포기할까 하다가 밑져야 본전, 지푸라기라도 잡아보자는 마음으로 산학협력단 홈페이지에서 그 직원이 속한 팀의 팀장님 연락처를 찾아 연락을 드렸다. 이미 규정에 대해 인지하고 있고, 직원에게 답을 듣고도 문의드려서 정말 죄송하지만, 작년 1년간 휴직하고 해외에 머물고 있어서 연구비 사용이 불가능했었다고, 혹시 한 번만 더 연장할 방법이 없겠냐고 여쭈었다. 감사하게도 팀장님은 장담할 수는 없지만 한번 알아봐주시겠다고 하셨다. 얼마 후 일정 서류를 내면 몇 달의 추가 기간을 받을 수 있는 방법을 찾아주셨고, 8월 학회 등록비 및 여비로 사용할 수 있게 되었다.
둘. 며칠 전에는 첫째가 캐나다에서 다녔던 학교로부터 졸업앨범을 국제우편으로 받았다. 6학년을 끝까지 마치지 못했음에도 불구하고, 졸업앨범에 한 페이지를 넣어서 만들어주고 심지어 학교가 배송료를 부담하여 앨범을 한국에 택배로 보내준 것은 더할 나위 없이 감사한 일이었다 (물론 학교 측에는 ‘어떠한 비용이든 내가 부담해야 하는 것은 하겠다’라고 말했었다). 하지만 이 졸업앨범을 받는 과정이 수월하지만은 않았다. 귀국 직전에 학교의 직원에게 문의를 했고, 직원은 교장선생님에게 확인해보겠다 하였다. 며칠간 답장을 기다리다가, 기다려도 연락이 오지 않아 직접 교장선생님에게 연락을 드렸다(3월 말). 이후 캐나다 학기가 끝날 6월 중순 즈음에 다시 한 번 리마인더 메일을 드리고, 일주일정도 회신을 기다리다가 회신이 오지 않기에, 졸업앨범 작업을 맡으셨던 (첫째와 같은 반 학부모라는 것 외에는 친분이 전혀 없는) 학부모 대표께도 연락을 드렸다. 회신은 오지 않았다. 그래서 또다시 일주일 뒤에 리마인더를 드렸고, 며칠 뒤 드디어 ‘배송받을 주소를 알려달라’라는 회신을 받았다. 배송받을 주소를 보냈는데, 보름이 지나도 택배가 오지 않았다. 염치불구하고 다시 한 번 교장선생님과 학부모 대표께 메일을 드렸고, 그리고 일주일 뒤에 택배를 받았다. 잘 받았다고 곧바로 감사 메일을 드리니, 여름 휴가 가기 전에 보낸다는 것을 깜박 했다며, 미안하고, 잘 도착해서 기쁘다는 답을 주셨다.
셋. 캐나다의 연구소에 visiting scholar로 지내는 동안 내 supervisor를 해주신 D가 있었다. 캐나다에 있는 동안 이 분과 시작한 연구 프로젝트가 하나 있었는데, 기간이 빠듯해서 연구를 끝까지 마무리하지 못한 상태로 한국으로 돌아올 수밖에 없었다. 게다가 내가 한국으로 돌아올 준비로 바빠질 시기쯤 D도 한 달간 출산휴가를 가시게 되었고(참고로 이 분은 남자이시다), 그렇게 한달 남짓 서로 연락을 주고받지 않은/못한 상태로 시간만 흘러갔다. 그러다 문득 이대로 포기하기엔 캐나다에서 썼던 시간이 아깝다는 생각이 들었다. 그래서 나름대로 꾸역꾸역 마무리를 하고, 논문으로 정리를 하고, 구색을 갖춰서 피드백을 달라고 메일을 보냈다. 하지만 캐나다에서는 그렇게 친절했던 D는 몇 주가 지나도 회신을 주지 않았다. 무슨 이유가 있겠지 싶어서 굉장히 구차하지만 이런저런 핑계로 계속 메일을 보냈다. 물론 앞서 보낸 manuscript를 확인해달라는 말과 함께. 하지만 두번째, 세번째, 네번째 메일에도 회신은 없었다. 회신 없는 메일을 마치 스팸처럼 그분에게 보내며 혼자 속으로만 앓다가, 다섯 번째 메일에서는 급기야 ‘혹시라도 내가 당신께 무엇이든 잘못한 것이 있으면 알려달라’는 말까지 하기에 이르렀다. 하지만 이번에도 회신은 없었다. 메일로는 더 이상 진전이 없을 것 같아 캐나다에 계신 교수님께 ‘직접 D를 뵙게 되면 내가 그분의 회신을 간절히 기다린다고 전해달라는 말을 전해달라’는 부탁을 드렸고, 다행히 그 이후에 연락이 재개되어 프로젝트를 이어가고 있다.
내가 했던 이런 행동들은 나에게는 정말 중요한 것이었지만, 기껏해야 조금 더 뻔뻔해지는 정도에 불과하고, 우리 사회에서 누군가가 겪은 절박함과 그 절박함 때문에 했던 것들에 비하면 절박함의 ‘ㅈ’의 첫 가로획 ‘ㅡ’에조차 미치지 못한다고 생각한다. 절박하기 때문에 누군가는 어딘가를 찾아가기도 하고, 부탁을 하기도 하고, 매달리기도 한다. 어딘가로 향하기도 하고, 어딘가에서 도망쳐나오기도 한다. 누군가를 찾아가기도 하고, 심지어는 쫓아가기도 한다. 무언가를 만들기도 하고, 부수기도 한다. 상대에게 질문을 던지기도 하고, 묻지 않았음에도 먼저 나서서 대답을 하기도 한다. 너무나도 절박해서 무언가를 팔기도 하고, 사기도 한다. 조직을 만들기도 하고, 조직에 들어가기도 하고, 조직에서 나오기도 한다. 심지어는 스스로에게 고통을 주기도 하고, 반대로 다른 사람에게 고통을 가하기도 한다. 무엇이 되었든 절박함은 무언가를 하게끔 한다. 이처럼 절박함은 이루려는 것과 직접적으로 연결되는 보여지는 행동을 통해서 외부에 드러나고, 영향을 미친다. 그러다가 어떤 사람은 선을 넘어 범죄를 저지르지만, 행동의 옳고 그름을 이야기하려는 것은 아니다. 또한 아무것도 하지 않음이 절박하지 않음과 동일하다는 말을 하려는 것도 아니다. 다만, 옳든 그르든 절박함은 행동으로 드러나기에, ‘아무것도 하지 않음’으로부터 절박함의 정도를 가늠하기란, 그래서 참 어렵다.
[문화] 문화는 단일한 정의가 어렵다. 개인은 자신만의 ‘미시 문화(microculture)’를 가지고 있으며, 동시에 외부의 큰 문화적 틀 속에서 살아간다. 한 지역 출신이라고 해서 동일하다고 일반화할 수 없다. 문화는 고정된 것이 아니라 개인의 가치관과 선택에 따라 다양하게 표현된다.
[문화지능 - 일반] 문화지능(CQ)은 다른 문화적 배경의 사람들과 효과적으로 교류하고 협력하는 능력이다. CQ는 문화적 역량(cultural competence)보다 한 단계 더 나아간다. 단순한 인식 차원을 넘어, 실제로 다른 문화적 관점을 수용하고 적응하는 능력이다. CQ의 핵심은 겸손(humility)이다. 자신의 가정을 끊임없이 질문하고, 배움이 쌍방향(bidirectional)임을 인정해야 한다.
[문화지능 - 케이터링] 말레이시아에서는 음식이 매우 중요하다. 대부분 무슬림이므로 할랄 음식이 필요하고, 힌두교 신자에게는 소고기를 제공하지 않는다. 채식주의자 역시 충분한 선택지가 있어야 한다. 이런 사소해 보이는 배려가 실제 회의나 행사에서 모두를 환영하는 분위기를 만든다 .
[문화지능 - 다양성] 다양성을 존중하기 위해 차이를 강조하는 것이 항상 도움이 되는 것은 아니다. 때로는 차이를 덜 부각시키고 공통점을 찾는 것이 더 효과적일 수 있다.
[문화지능 - 심리적 안전] 모든 사람이 발언하는 것이 안전하다고 느끼는 환경은 중요하지만, 일부 문화에서는 ‘위계 존중’을 안전감으로 인식할 수 있다. 즉, 심리적 안전감의 표현 방식이 다르다.
[문화지능 - 다양성] 나와 비슷한 사람들과 있을 때 가장 덜 배운다. 반대로 나랑 다른 사람들과 있을 때 가장 많이 배운다.
[예측분석의 단계] 예측분석은 ‘묘사적(Descriptive) → 진단적(Diagnostic) → 예측적(Predictive) → 처방적(Prescriptive)’ 단계로 발전한다. 묘사적 분석은 과거의 성과를 요약한다. 진단적 분석은 ‘왜 이런 일이 일어났는가’를 규명한다. 예측적 분석은 미래에 무엇이 일어날지를 예측한다. 처방적 분석은 데이터 기반으로 ‘무엇을 해야 하는가’를 제안한다.
[학생과의 공유] 학습자에게 모든 데이터를 보여주는 것은 도움이 되지 않는다. 학생이 자신의 목표와 성장을 위해 활용할 수 있는 ‘의미 있는 데이터’를 선별 제공해야 한다. 예측분석 결과를 그대로 학생에게 전달하는 것은 불안과 부담을 유발할 수 있다. 따라서 코치나 교수와 함께 해석하고 학습 계획을 세우는 과정이 필요하다. 학생들은 동료 평균과의 비교를 원하지만, 이는 불필요한 경쟁심을 조장할 수 있으므로 신중하게 제공해야 한다. 예측분석 공유 과정에서 학습자의 웰빙(wellness)과 감정 상태를 함께 고려해야 한다.
[학생의 역할] 학생이 데이터 해석에 익숙하지 않으면, 교수가 문제 해결을 대신 떠안게 된다. 따라서 학생 스스로 데이터를 반성(reflect)하고 활용하도록 훈련해야 한다. 학생은 자기 데이터의 ‘주체(owner)’가 되어야 하며, 이를 기반으로 자기주도적 학습 계획을 세울 수 있어야 한다. 학생의 자기성찰(self-reflection) 데이터는 때로 가장 강력한 예측 신호가 된다. 교수와 학생 모두 데이터 해석 역량을 길러야 하므로, 교수개발과 학습자 교육이 동시에 필요하다. 예측분석은 학습자에게 에이전시(agency)를 부여하고, 스스로 ‘곡선을 바꿀 수 있다(bend the curve)’는 믿음을 심어야 한다.
[데이터와 해석] 예측분석의 성패는 결국 ‘신뢰할 수 있는 데이터’와 ‘적절한 해석’에 달려 있다. 데이터가 많아도 잘못 해석되면 오히려 위험하다. 수치 데이터와 직관이 불일치할 때, 프로그램은 수집하는 데이터의 적절성과 정렬(alignment)을 되돌아봐야 한다. 때로는 더 많은 데이터가 아니라 ‘다른 종류의 데이터’가 필요하다. 예측이 빗나간 이유는 가르치지 않은 부분이 데이터에 드러났기 때문일 수 있다. 정량적 데이터만큼이나 내러티브(텍스트) 데이터가 중요하다. 하지만 이를 해석하고 분류하는 것은 인간에게도 기계에게도 쉽지 않은 과제다.
[코칭] 코칭은 데이터를 단순 점수화가 아니라 자기주도적 학습 계획으로 전환하는 핵심 과정이다. 학생들에게 제공되는 데이터는 진단적(diagnostic)일 뿐 아니라 발전적(developmental)이어야 한다. 단순히 부족함을 지적하는 것이 아니라 성장을 유도해야 한다. 데이터 공유 시 교수가 학습자를 미리 ‘낙인찍는’ 위험을 방지하려면, 성장 중심 프레임(growth framing)으로 접근해야 한다. 성장 마인드셋(growth mindset)을 촉진하는 코칭은 예측분석 결과를 고정된 낙인으로 받아들이는 것을 방지한다.
[생산적 실패] 이번 연구는 정답을 바로 주지 않고, 학습자가 스스로 고민·실패·재도전하는 과정을 의미하는 ‘생산적 실패/고투(Productive failure)’가 언제나 효과적인 것은 아님을 보여준다. 학생이 학습에 대해 어떤 신념을 가지고 있는지가 큰 영향을 주었다. 대표적으로, 학생은 “교사의 역할은 정답을 알려주는 것” 이라는 신념을 가지곤 한다. 의대생들은 정답 중심 학습에 익숙해, 정답이 바로 주어지지 않으면 불편해한다.
따라서 단순히 자율성만 주는 것이 아니라, 그 자율성을 어떻게 써야 할지 안내가 필요하다. 단순히 자율성을 주는 것만으로는 부족하다. 학생들에게 “왜 이 실패/고투를 경험하게 하는지”를 설명해야 한다. 학생들에게 불확실성과 고투란, 종종 개인적 기대·학습 전략과의 충돌을 의미한다. 이를 해결하지 않으면, 생산적 고투는 오히려 학습자에게 해가 될 수 있다. 학생들에게 고투를 경험하고 적응하는 과정 자체가 의사로서 성장의 일부임을 이해시켜야 한다.
[AI라는 테크놀로지] 예전에는 우리 대부분이 긴 나눗셈이나 미적분을 배워야 했다. 하지만 지금은 모두 계산기를 사용한다. 계산기에 의존하는 것이 더 이상 논란거리가 아니다. 마찬가지로 GPS에 의존하면 특정 인지 기능이 약화되지만, 그것도 큰 논란거리는 아니었다. 그러나 생성형 AI 기술의 차이점은 이들이 범용(generalist) 기술이라는 데 있다. 아주 많은 일을 할 수 있으며, 어떤 것은 정말 잘하지만, 어떤 것은 놀라울 정도로 형편없이 수행하기도 한다.
[AI와 Deskilling] 연구들은 교육 현장에서 LLM(대규모 언어 모델)에 대한 의존도가 높아질수록 비판적 사고 능력이 감소한다는 결과를 보여준다. 이는 인지적 대리(cognitive offloading) 때문이다. 즉, 사고 과정을 AI에게 떠넘기면서 인간은 그 능력을 애초에 발달시키지 못하게 되는 것이다.
예를 들어, 폴란드에서 진행된 무작위 대조시험(RCT)에서, 연구 시작 시점에서 의사들이 AI를 사용하기 전의 용종 발견율(ADR)은 약 28.4%였다. 그런데 단 3개월 동안 AI 보조를 사용한 뒤에는 발견율이 22.4%로 떨어졌다. 이는 무려 60% 감소이다. 기원전 3~4세기에 플라톤은 “문자가 고대 그리스인의 기억력을 약화(deskilling)시킨다”고 불평했다. 글을 쓰게 되면서 이제는 『오디세이』 전체를 암송하지 못하게 되었고, 이 끔찍한 발명(문자)이 사람들의 기억을 약화시켰다는 것이다.
즉, 기술이 스킬을 약화시킨다는 불평은 언제나 현재 세대가 다음 세대를 보며 하는 오래된 이야기이다.
[AI와 교육] 만약 초지능 AI가 등장하면, 교육자가 아무것도 하지 않아도 결국 의사 직업은 필요 없어질 수 있다. 그러나 AI가 ‘아주 뛰어난 수준’에서 멈춘다면, 교육자가 아무 변화도 하지 않은 상태에서는 문제가 발생한다. 학생들이 AI에 지나치게 의존해 필요한 인지 능력을 아예 발달시키지 못하는 상황이 올 수 있기 때문이다.
따라서 합리적인 선택은, AI가 초지능이 되지 않는다고 가정하고 학습자의 인지 발달을 보호하는 교육 설계를 하는 것이다. 그래야 AI와 협력할 수 있는 미래 인재를 기를 수 있다. 이 역할은 기업이 아니라 교육자가 담당해야 한다. 구글 같은 기업들은 기술을 만들 뿐, 다음 세대의 뇌를 어떻게 훈련할지는 우리 교육자의 몫이다. 의료 전문가 교육자들에게는 세대를 지키는 중대한 책무가 있다.
[절차적 지식과 개념적 지식] "절차적 기술만을 지나치게 강조하면, 결국 개념적 지식의 발달을 저해할 수 있다고 봅니다. 물론 반드시 그렇다는 것은 아니고, 균형이 필요하다는 뜻입니다. 예를 들어, 일부 교육 프로그램에서는 체크리스트(checklist) 를 강조하며 “이 대화를 할 때는 A, B, C 단계를 따라라”라고 가르칩니다. 그런데 숙련된 의사들은 시간이 지나면서 이것이 유연(flexible) 해야 한다는 것을 이해합니다. 상황에 따라 다르게 적용할 수 있다는 것이죠.
제가 읽은 연구 중 가장 인상 깊었던 것은, 수련의들이 가족들과 매우 어려운 대화(예: 임종 상황 대화)를 할 때였습니다. 그들은 체크리스트를 따르려고 했지만, 가족들은 그 ‘다음 단계’로 넘어가지 않았습니다. 즉, 가족들은 자신들이 ‘시나리오(script)’ 안에 있다는 것을 몰랐던 것입니다. 경험 많은 의사들은 즉시 체크리스트를 내려놓고 유연하게 대처할 수 있었지만, 일부 수련의들은 그렇지 못했습니다. 그 순간에 융통성 있게 대화하지 못함으로써, 오히려 가족에게 상처를 주고 자신들도 괴로움을 느끼게 된 것이죠.
그래서 저는 절차적 기술이 매우 중요하다고 믿습니다. 하지만 동시에 개념적 지식을 함께 키워야 합니다. 그래야만 균형이 맞고, 진정한 전문성을 발휘할 수 있습니다."
[멘토링] "멘토의 역할은 고정된 프로필이 아니라, 필요에 따라 입고 벗는 ‘재킷(jackets)’ 같은 것이었습니다. 예를 들어, 멘토링 경험이 적은 사람은 학생들에게 학사 일정이나 행정 절차를 알려주는 ‘촉진자 역할’을 더 많이 합니다. 반면, 경력이 많은 멘토는 연구 방법을 알려주거나 학문적 롤모델로 행동하는 경우가 많습니다. 또한 멘토들은 종종 이렇게 말했습니다. “내가 멘토링을 어떻게 하는지가 중요한 게 아니라, 내 학생이 지금 무엇을 필요로 하는지가 더 중요하다.” 즉, 멘토의 실제 역할 인식(actual task perception)은 종종 자신이 바라는 이상적인 역할(preferred task perception)과 다르다는 것이었습니다.
결론적으로, 저는 “멘토링은 이렇게 해야 한다”는 규범적 처방에는 비판적일 필요가 있다고 봅니다. 대신, 멘토들이 자신의 역할을 성찰(reflection)할 수 있도록 돕는 것이 중요합니다. 이는 멘토들에게 매우 쉬운 일이 아닙니다. 그렇기 때문에 교수개발(faculty development)의 역할이 바로 여기 있다고 생각합니다. 예를 들어, 구조화된 교수개발 세션은 멘토들이 안전한 공간에서 자신의 경험을 성찰하고, 동료들과 토론하며, “나는 멘토로서 무엇을, 왜, 어떻게 하고 있는가”를 고민할 수 있도록 해야 합니다. 단순히 교육학 이론을 배우는 자리가 아니라, 실제 사례를 가져와서 어려운 대화와 딜레마를 공유할 수 있는 장을 제공해야 합니다.
결국 핵심은, 멘토링의 본질은 “내가 멘토로서 누구인가?”라는 질문에 대한 성찰이라는 점입니다.
[피드백] 학습자들은 피드백 자체는 유익하다고 느끼지만, “그 피드백을 실제로 어떻게 활용해야 할지 잘 모르겠다”는 불안을 갖고 있었습니다. 이 점은 교육적 시사점을 줍니다. 피드백을 “전반적으로 잘 받도록” 하는 것만이 아니라, 특히 자기효능감을 높이는 방향으로 접근할 필요가 있다는 것입니다. 또 하나 흥미로운 점은, 학습자의 단계별로 큰 차이가 없었다는 것입니다. 1학년 의대생과 3년 차 레지던트의 피드백 지향성 점수가 거의 같았습니다. 즉, 학년이나 수련 단계별로 차별화된 개입이 필요하지 않을 수도 있다는 뜻입니다.
[피드백] 피드백을 받을 때 느낀 감정을 중심으로 살펴보면, 흥미롭게도, 긍정적 감정을 느낀 경우 오히려 피드백을 덜 기억하는 경향이 나타났습니다. 하지만 낙담할 필요는 없습니다. 왜냐하면 감정의 활성 수준을 고려했을 때 효과가 달라졌기 때문입니다. 예를 들어, 긍정적이면서 비활성화된 감정(예: 안도감, relief)을 느낀 경우에는 오히려 피드백을 더 잘 기억하는 경향이 있었습니다. 즉, “안도감”이 피드백 기억에 도움이 될 수 있다는 점이 흥미롭게 드러났습니다.
[피드백] 임상 현장에서 나쁜 소식을 전달할 때 쓰이는 SPIKES 프로토콜이 있습니다. 이 프로토콜은 환자에게 나쁜 소식을 전하는 의사-환자 소통 모델입니다. 우리는 이 프로토콜을 교육 맥락에도 적용할 수 있을까 궁금했습니다. 그 결과, SPIKES의 단계들이 교육 현장에도 상당히 관련성이 있다는 것을 발견했습니다. 하지만 핵심은 E(Emotion)였습니다. 학습자에게 나쁜 소식(예: “시험에 떨어졌다”)을 전달할 때, 학습자의 감정을 고려하는 것이 가장 중요하다는 사실을 확인했습니다.
[AI: 정체성의 핵심] 의사들은 우선 행정적 기능(예: 문서화)에서 AI를 사용해보면서 도구를 익히고 있습니다. 흥미로운 점은, 우리가 하는 일 가운데 “원래는 하기 싫어했던 업무”―즉, 문서화 같은 것―는 정체성에 큰 의미를 갖지 않습니다. 하지만 임상적 의사결정(clinical decision-making)은 우리의 전문적 정체성의 핵심입니다. 그래서 의사들은 전자는 기꺼이 AI에 맡기면서도, 후자에는 훨씬 더 신중하고 주저하는 태도를 보이고 있습니다.
[AI: 협력적 사고] 최근 JAMA Network Open에 발표된 논문을 보면, “의사+ChatGPT” 조합은 ChatGPT 단독보다 더 낫지 않았습니다. 그 이유는, 의사들이 ChatGPT를 단순히 구글 검색처럼 불확실한 질문에만 사용하는 방식으로 접근했기 때문입니다. ChatGPT의 강점은 “내가 미처 생각하지 못한 진단을 제안하는 것”인데, 이를 활용하지 못한 것입니다. 따라서 올바른 접근은 먼저 ChatGPT로 전체 감별진단을 생성하고, 그 중에서 인간 전문가가 비판적으로 선별·판단하는 것입니다. 이것이야말로 “Master Adaptive Learner”의 사고방식이며, 전문직 정체성의 일부로 자리 잡아야 합니다.
[AI: 질문 제기자] 중요한 것은 “의사+AI의 상호작용이 어떻게 우리를 변화시키는가”입니다. 감별진단을 생성하는 방식이 달라지고, 사고 과정이 달라지며, 그 결과 정체성도 달라지는 것입니다. 우리는 이제 인지적 희소성(cognitive scarcity)의 시대에서 인지적 풍요(cognitive abundance)의 시대로 이동하고 있습니다. 과거에는 “한정된 인지 자원을 어떻게 배분할까”가 중요했지만, 이제는 AI 덕분에 인지 자원이 풍부해졌습니다. 따라서 우리의 정체성도 “정답 제공자(provider of answers)”에서 “올바른 질문 제기자(identifier of the right questions)”로 이동해야 합니다.
[AI: 인간적 연결] 교육자로서 AI는 행정 업무를 줄이고, 새로운 교수법을 실험할 수 있는 기회를 제공합니다. 하지만 결국 교육자로서 우리의 정체성은 AI를 활용하면서도 인간적 연결을 지켜내는 것에 달려 있습니다. 즉, 단순 업무는 AI에 위임하고, 우리는 학습자와의 관계에 집중하는 것입니다. 이는 마치 임상의가 AI 기반 문서화 도구를 활용해 기록 시간을 줄이고, 환자에게 더 집중할 수 있는 것과 같습니다.
[AI: 조직문화] AI는 학습자들의 성과 데이터를 통합적으로 수집·분석할 수 있게 합니다. 이를 통해 개별 학습자의 성장 필요를 파악하고, 적절한 학습 자원과 임상 경험을 제공할 수 있습니다. 즉, “데이터와 기술로 강화된 역량 기반 교육”을 실현할 수 있게 되는 것입니다. 그러나 기술만으로는 충분하지 않습니다. 사회기술 시스템 이론(socio-technical systems theory)처럼, 기술은 맥락 속에서 존재합니다. 따라서 조직 차원의 구조와 문화가 함께 뒷받침되어야 합니다. 학습자가 안전하게 학습 필요를 드러낼 수 있는 “의도적 발달적 조직(deliberately developmental organization)”이 필요합니다. 이 시점에서 교육자들의 역할은 매우 중요합니다. 왜냐하면 병원과 교육 기관이 모두 실험적으로 AI를 도입하고 있는 상황에서, 투명성, 위계 완화, 상호 의존성, 실패를 통한 학습 문화를 마련해야 하기 때문입니다.
[AI: 신뢰와 공동 생산] 데이터가 늘어나면서 학습자들은 “감시받고 있다”는 불안감을 느낄 수 있습니다. 따라서 반드시 데이터 활용 목적이 “지원”임을 분명히 해야 하며, 학습자가 안전하게 성장할 수 있는 신뢰 기반 시스템을 마련해야 합니다. 결론적으로, 지금이야말로 학습자와 교육자가 함께 공동 생산(co-production)을 통해 새로운 전문직 정체성 형성을 설계해야 할 시점입니다.
[AI: 글로벌 격차] 오늘 이 자리에 있는 우리들은 AI와 교육에 대해 활발히 논의하고 있지만, 아프리카·아시아·라틴아메리카의 많은 동료들은 이런 대화에 참여할 기회조차 없습니다. 따라서 우리가 이 회의에서 얻는 배움은, 결국 그들에게 어떻게 전달되고 공유될 수 있는가라는 과제를 남깁니다.
[AI: 언어와 데이터 편향] 또 다른 중요한 문제는 언어(language)와 번역입니다. 예를 들어, 제가 영어로 말하고 그것이 AI를 통해 다른 언어로 번역된다면, 그 의미가 제대로 전달되고 있는지 어떻게 확인할 수 있을까요? 이는 단순히 기술적 문제가 아니라, 교육과 환자 안전에도 영향을 미칠 수 있는 핵심적인 문제입니다. 또 하나의 큰 쟁점은, AI 개발이 주로 글로벌 노스의 데이터에 기반하고 있다는 것입니다. 그렇다면 그 AI는 본질적으로 편향(bias)을 내포할 수밖에 없습니다. 진정한 공평성과 접근성을 위해서는 글로벌 사우스의 지역 데이터와 오픈소스 도구 개발이 반드시 필요합니다.
[AI: 이미지 생성과 편향] AI로 이미지를 생성하는 것은 학습자들에게 AI의 한계와 편향을 이해시키는 훌륭한 방법이 될 수 있습니다. 예를 들어, 의사 이미지를 검색하면 항상 목에 청진기를 건 모습만 나온다든지 하는 식으로, 데이터 학습 과정에서의 편향이 금방 드러납니다. 이런 점은 학습자들이 AI를 비판적으로 바라볼 수 있게 해줍니다.
[AI: 환경적, 윤리적 비용] AI 인프라를 유지하기 위해 소비되는 전기와 에너지는 엄청납니다. 게다가 AI 개발에 필요한 광물 자원들은 대체로 AI 혜택을 제대로 누리지 못하는 국가들에서 채굴되고 있습니다. 결과적으로 이 지역들은 환경 파괴와 자원 수탈의 피해를 입지만, 혜택은 고르게 분배되지 않습니다. 따라서 우리는 AI의 혜택뿐만 아니라 그 환경적·윤리적 비용에도 책임감을 가져야 합니다. AI는 겉보기에는 저렴해 보입니다. 하지만 실제로는 막대한 에너지 소비와 온실가스 배출이 발생합니다. 문제는 이것이 잘 드러나지 않고, “광고 기반(ad-driven) 모델”처럼 숨겨져 있다는 점입니다. 결국 AI의 경제적 비용뿐 아니라 환경적 비용도 우리가 심각하게 고려해야 합니다.
[AI: 접근성 문제] 디지털 격차(digital divide)에 대한 여러분의 의견이 매우 인상 깊었습니다. 아이러니하게도, 사실상 AI가 가장 큰 혜택을 줄 수 있는 곳은 오히려 이 도구에 접근하기 어려운 지역입니다. 미국의 오지이든 아프리카든, 교육적 지원이 부족한 상황에서 이 도구는 교육자, 학습자, 의료인 모두에게 중요한 도움을 줄 수 있습니다. 하지만 정작 가장 필요로 하는 곳일수록 접근하기 어렵다는 것이 현실입니다.
[AI: 환자-의사 공동 적응] 저는 소아 응급의학과 의사로서, 보스턴에서 종종 이런 상황을 봅니다. 부모들이 이미 Google이나 ChatGPT에서 많은 정보를 찾아본 뒤 병원에 옵니다. 특히 희귀질환의 경우, 부모들이 의사보다 더 잘 아는 경우도 있죠. 이때 제 역할은 제 전문성을 더해 함께 의사결정을 하는 것입니다. 사실 이런 정보 비대칭의 역전은 AI 이전에도 늘 있었습니다. 희귀질환처럼 사례가 전 세계에 몇 건밖에 없는 경우, 평범한 의사가 다 알 수는 없습니다. 환자·보호자와 의사가 신뢰와 협상 속에서 함께 적응하는 과정은 AI가 확대시킨 측면이 있을 뿐, 완전히 새로운 것은 아닙니다.
[AI: 교육적 활용] 환자들이 Google 검색 결과를 가져올 때, 저는 “이건 동료심사(peer review)를 거친 자료인가요?”라고 질문합니다. 마찬가지로 AI를 쓸 때도, 저는 환자에게 ChatGPT 진단을 보여주며 “이 자료를 이렇게 비판적으로 검토한다”고 설명합니다. 이 과정을 학습자 앞에서 시연하면, 학습자에게도 AI를 단순히 수용하는 것이 아니라 ‘감독(supervise)’하는 방식으로 사용해야 한다는 메시지를 줄 수 있습니다.
[AI: 정체성의 재구성] 전통적으로는 지식이 풍부한 의사가 이상적 정체성으로 여겨졌습니다. 그러나 AI 시대에는 단순 지식 제공자로서의 정체성은 약화될 것입니다. 대신, 우리는 공감과 연민을 교육 속에서 재강조해야 합니다. 지식은 AI에서 얻을 수 있습니다. 하지만 의사-환자 관계의 다른 핵심 요소(소통, 협력, 공감)는 인간에게 달려 있습니다. 오히려 AI 덕분에 우리는 이러한 인간적 측면을 더욱 강화할 기회를 얻는 셈입니다. 저는 특히 AI 접근성이 부족한 지역을 강조하고 싶습니다. 그곳에서 의사들이 환자에게 필요한 것은 결국 따뜻한 인간성입니다. AI가 도구로서 도움은 되겠지만, 인간 고유의 자질은 대체할 수 없습니다. 결국 최선의 결과는 AI와 인간이 균형 있게 협력할 때 나올 것입니다. 권위적인 “모든 걸 아는 전문가” 정체성은 점차 사라지고, 질문을 잘 던지는 전문가 정체성이 중요해질 것입니다. 평생학습자(lifelong learner)로서 정체성은 지식을 많이 아는 것이 아니라, 좋은 질문을 던지는 능력에 있습니다. AI가 답을 줄 수는 있지만, 질문은 여전히 인간이 던져야 합니다.
Q. Cultural safety(문화적 안전성)을 이야기할 때, 특히 학습자들이 자신과 닮은 교수자를 보고 정체성을 형성할 수 있도록 하는 대표성(representation) 문제가 있습니다. 물론 차별 문제에 대해서도 말씀해주셨는데, 저는 특히 원주민 교수진이나 소수자 교원 대표성을 어떻게 확보하고 있는지 궁금합니다.
A. 예를 들어 말씀드리겠습니다. 구조적 차원에서 원주민 리더십 직책을 신설한 경우입니다. 예컨대, 저희 의대 학장은 마오리 원주민 출신 학자로, 원주민 보건 부서를 이끌고 있습니다. 인증(accreditation) 체계를 통한 변화도 있습니다. 현재 의과대학 인증 과정에 문화적 안전성 기준이 포함되어 있어, 대학은 원주민 교수진 및 학생 대표성을 반드시 증거로 제시해야 합니다. 또한, 장학금, 특별 채용 프로그램, 원주민·태평양 학생 선발 경로 등을 통해 원주민 및 소수자 학생·교수진을 늘리려 하고 있습니다. 마지막으로, cultural safety가 단순히 소수자 교수진에게만 의존해서는 안 됩니다. 비(非)원주민 교수진이 pro-equity allies(형평성 동맹자)로 나서야 합니다. 제 지도교수도 비원주민이었지만, 마오리·태평양 학생들을 적극적으로 지지해주셨습니다. 이런 연대가 중요합니다
[다양한 피부색에 대한 교육: 필요성]
오랫동안 피부과 교재와 네트워크는 백인 피부 사진에 의해 지배되어 왔습니다. 하지만 우리가 근무하는 지역의 환자 중 약 25%는 유색인종입니다. 즉, 학생들이 배우는 교재와 실제 임상현장은 괴리가 큽니다. 피부색 차이에 따른 질환 표현 차이는 종종 형식적으로만, “토큰(tokenistic)”하게 언급됩니다. 예컨대, 교재 본문 끝에 짤막하게 “어두운 피부에서는 다르게 보일 수 있다”고만 서술되는 식이죠. 그 결과, 학생들은 자신감과 지식이 부족해지고, 실제로 피부색 환자를 진료할 때 어려움을 겪습니다. 더 심각한 문제는, 교재에서 백인 피부를 기준으로 한 표현이 ‘정상(norm)’으로 규정되고, 흑인이나 유색인 피부의 표현은 ‘비정형(atypical)’으로 취급된다는 점입니다. 결과적으로 유색인 피부 질환은 잘 교육되지 않아 진단이 늦어지고 치료도 지연됩니다.
[다양한 피부색에 대한 교육: 성과와 어려움]
불평등을 인식하고 드러내는 것 자체가 첫걸음입니다. 의도적으로(conspicuously) 다양한 피부색 환자를 포함한 교육은 학생들의 자신감과 지식을 크게 향상시켰습니다. 또한 놀라운 점은, 피부색 교육을 강화했음에도 불구하고 백인 피부 질환 교육 성취도도 동시에 향상되었다는 것입니다. 즉, 다양성을 반영한 교육은 전체 학습 효과에 긍정적 영향을 준다는 것을 확인했습니다.
다만 교육에 필요한 이미지(백인 피부와 흑인·갈색 피부를 정확히 같은 질환, 같은 조건에서 비교할 수 있는 이미지)를 찾는 것이 거의 불가능했습니다. 그래서 일부는 타협을 할 수밖에 없었고, 뉴질랜드 기반의 웹사이트(특히 태평양·동아시아 환자 피부 이미지가 풍부함) 같은 국제 자원을 활용했습니다. 하지만 여전히 흑인 피부나 남아시아 피부에 대한 자료는 매우 부족했습니다.
[파트타임 교육과정(파트타임 의대생) 요구조사]
시드니 의대 의학과는 4년제 학위 과정으로, 1학년 때부터 임상 현장에 나가며, 3학년부터는 풀타임 임상 실습을 합니다. 학생의 약 70%는 정부 보조(Commonwealth funded)로 학비를 지원받지만, 생활비는 스스로 부담해야 합니다. 시드니는 세계에서 가장 생활비가 비싼 도시 중 하나이기 때문에, 많은 학생들이 아르바이트 등으로 생활비를 충당하고 있습니다.
여기서 저희가 논의하는 것은 시간 가변적 과정(time-variable training), 즉 의대 과정을 part-time으로 운영하는 것입니다. 이는 학생들이 학업을 파트타임으로 진행해, 의대 재학 기간이 길어지지만 생활·가족·재정 상황을 조율할 수 있는 옵션입니다. 저희는 매년 학생들에게 교육과정 만족도 조사를 하는데, 2024년 조사에 “시간 가변적 과정이 도입된다면 관심이 있겠는가?”라는 문항을 추가했습니다.
838명 중 420명(50%)이 응답했고, 그 중 31%가 ‘관심이 있다’고 답했습니다. 흥미로운 점은, 나이가 많을수록 관심도가 높았다는 것입니다. 22세 이하 학생들은 관심이 낮았지만, 30세 이상 학생들은 관심도가 확연히 높았습니다. 이는 이미 가족이 있거나, 재정적 책임이 있는 학생들이 많기 때문입니다. 성별에 따른 차이는 거의 없었습니다. 저희는 학생들의 강한 요구를 확인했고, 이제 실제로 파트타임 의대 과정 도입을 추진하려 합니다. 구체적으로는 출산·양육·개인 사정 등 특정 기간 동안만 파트타임을 선택할 수 있고, 이후 다시 풀타임으로 복귀하는 방식을 구상하고 있습니다. 즉, 완전한 파트타임 의대 과정이라기보다는 유연하게 전환 가능한 과정을 만들려는 것입니다.
2019년 9월부터 몸담았던 한양대학교 의과대학 의학교육학교실을 떠나, 9월부터는 고려대학교 의과대학 의학교육학교실로 소속을 옮기게 되었습니다. 한양의대에 있는 동안 여러 방면으로 기회를 마련해 주시고, 도움을 주시고, 진심어린 조언을 아끼지 않으신 많은 분들께 일일이 직접 인사드리고 말씀드리지 못하여 죄송할 따름입니다.
돌이켜보면 학교의 과감한 지원 덕분에 교실에 교원이 충원되고, 대학원생이 합류하고, 의학교육진흥원이 설립될 수 있었고, 그러면서 새로운 시도도 많이 해볼 수 있었습니다. 주임교수, 위원장, 부원장 등 조교수로서는 급에 맞지 않는 과분한 직을 맡아본 것도 개인적으로는 정말 감사한 경험이었습니다. 맡은 역할을 수행함에 있어서 시행착오도 많고 부족한 점도 많았지만, 나름대로는 조금이나마 한양의대 교육의 발전에 기여하려고 노력했던 것 같습니다. 다만 무슨 일이든 마무리가 더 중요한 법인데, 의정사태 이후 최근 1년 반 동안 학교에 별다른 기여를 하지 못한 것과, 후임이 정해지지 않은 상태에서 제대로 인계를 하지 못하고 떠나게 된 것에 대해서는 아쉬움이 많이 남습니다.
어쩌다 보니 벌써 두 번째 이직이자 세 번째 소속에 이르게 되었는데, 마냥 기뻐하기에는 긴장이 많이 됩니다. 기대에 맞게 잘 해내고 싶은 마음과 스스로의 능력에 대한 의심이 자꾸 부딪칩니다. 소속된 조직의 규모가 커지는 만큼 기회도 많아지겠지만, 난이도도 그만큼 올라갈 것 같습니다. 낯선 시스템과 문화에 적응하는 것 뿐만 아니라, 교실의 가장 주니어 구성원로 합류하게 되는 것도 새롭게 적응해야 할 부분입니다. 단기적으로는 의과대학생들의 수업 복귀와 내년도 평가인증 준비로 바쁘겠지만, 조급해하지 않고 도움을 드리고 또 받으면서, 길게 보고 차근차근 해나가겠습니다.
저의 미숙한 준비로 다소간의 허둥지둥과 우왕좌왕이 있었음에도, 끝까지 적극적으로 참여해주신 울산의대 교수님들 덕분에 잘 마무리할 수 있었습니다. 늘 그렇듯 준비하면서 제가 더 많이 배우는 기회였던 것 같습니다.
저 스스로도 AI가 이 정도로 발전하고 있는 시점에, 이러한 내용을 가지고 교수개발 강의를 하는게 맞는지에 대한 의구심이 늘 마음 속 어딘가에 있습니다. 그래서인지 'AI 시대에 의학교육의 방향'에 대한 승학이형의 질문도 계속 머리 속을 맴돕니다. 예상도 못한 보너스처럼 2010년에 일렉티브로 뉴욕에 갔을 때 이후로 15년만에 뵙는 강민지 교수님도 너무나 뜻밖의 반가움이었습니다.
초청해주신 울산의대 의학교육학교실 채수진 교수님과 참여해주신 모든 교수님들께 진심으로 감사드립니다.
지금까지 평가에서 점수를 산출하는 방법은 0점에서 획득한 점수만큼 쌓아올리는 방식이었다. 10문제 중 한 문제를 맞추면 10점, 두 문제를 맞추면 20점, 열 문제를 다 맞추면 100점.
하지만 AI활용이 보편화되면 이 방식은 거꾸로 뒤집을 필요가 있지 않을까 생각해본다. 모든 학생에게 기본적으로 100점을 주고, 오류만큼 점수를 차감하는 것이다. 사소한 오류는 하나 당 5점, 중대한 오류는 하나 당 10점과 같이. 이는 모든 학생에게 AI를 사용하는지 않는 것을 기대하는 것이 아니라, AI를 목적에 맞게 최선의 방식으로 사용하기를 기대하는 것이다. 다만 사용한 AI의 성능에 따른 결과물 차이가 있을텐데 여기에 대해서는 참 고민스럽다.
답안은 평가자(교수자)가 충분한 전문성이 있다면 (모든 오류를 잡아내지는 못하더라도) 중대한 오류 정도는 어느 정도 잡아낼 수 있을 것 같다. 혹은 사실관계 자체는 틀리지 않더라도 문제의 취지에 부합하지 않는 방식의 서술 역시 감점으로 처리할 수 있다.
오래간만에 논문이 나왔습니다. 작년 1년간 캐나다에서 잘 쉬고(?) 오느라 연구를 조금 소홀히 했는데, 다행히 돌아온 다음에 교신저자(이영미 교수님)께서 잘 이끌어주셔서 출국 전 2023년에 했던 작업을 논문으로 출판할 수 있었습니다. 주제는 '의과대학교육에 의료 AI 교육과정을 개발 및 도입하기 위한 열두가지 팁'입니다.
의학교육 분야의 사람들에게는 제법 친숙한 이 'Twelve tips for...'로 시작하는 논문은 Medical Teacher라는 저널의 시그니처와 같은 시리즈이기도 하고, 12개 팁을 순서대로 나열하는 포맷을 요구하고 있어서, 처음 Medical Teacher 투고하고 리젝을 받은 이후에 이걸 과연 다른 저널에 실을 수 있을까 반쯤은 포기하기도 했었습니다. 리뷰어 의견도 극단적으로 갈렸는데, 다행히 잘 진행된 것은 운이 좋았던 것 같기도 합니다.
개인적으로는 처음으로 해외저널에 내보는 리뷰논문이고(전형적 리뷰는 아니지만..), 처음 내보는 저널이고, AI라는 주제로 논문을 내본 것도 처음이라 나름대로는 여러가지 의미가 있는 듯 합니다. '의료 AI 교육과정'이라고 하지만, 비단 의료AI뿐만 아니라 의과대학에 새로운 교육내용을 개발하고 도입할 때 고려해볼만한 팁들이라고 볼수도 있을 것 같습니다.
과정 전반을 이끌어주신 이영미 교수님, 그리고 지금은 서로 소속이 달라졌지만 처음 작업 과정에서 많은 부분을 함께해준 강예지 교수님께 감사드립니다.
이번 의정 사태를 거치며 상당수의 학생들이 필수의료에 대한 진로 의향을 철회했다는 것은 이미 잘 알려진 사실입니다.
다만 이 연구에서는 실제로 그 정도가 어느 수준인지, 이번 사태를 겪으며 필수의료에 대한 의향을 철회한 학생들이 ① 여전히 필수의료에 대한 최소한의 선호를 유지하고 있는 학생들, ② 원래부터 필수의료 진로 선호가 없었던 학생들과 어떻게 다른 특성과 인식을 보이는지를 살펴보고 싶었습니다.
모두가 짐작하듯 지난 의정사태의 영향은 매우 오래 갈 것 같습니다. 한계가 많은 연구이지만, 조금이나마 도움이 되었으면 좋겠습니다.
지난 주, 대한의사협회 의료정책연구원-한국의학교육학회 공동주체 세미나 발제를 갑작스레 요청받아 오늘 발표하게 되었다.
이미 의대증원이 의대 교육에 어떠한 영향을 미쳤는지/미칠지에 대해서는 많이 이야기된 바 있기에 굳이 Gemini나 ChatGPT의 Deep Research만 '딸깍'해도 나오는 말을 반복하고 싶지는 않았다. 무엇보다 나는 [서울-의사-남자-교수]로서, 내가 서있는 곳은 상대적으로 의정사태의 충격의 변두리에 있음을 인정하지 않을 수 없기에, 이 사태에 대한 나의 관점에 대해 이야기하는 것은 아무리 생각해도 부적절했다.
그래서 이번 발제에서는 나의 의견/관점이 아니라, 의정사태 이전에도, 그 중간에도, 그리고 오늘도 교육과정이 아무 일 없이 운영될 수 있도록 묵묵히 자리를 지키고 있는 [非서울-非의사-非남자-非교수] 선생님들의 목소리가 조금이라도 조명되게 하고 싶었다. 기사화 된 것은 매우 일부분이지만, 발제를 준비하기 위해 많은 분들께 부탁드려 받게 된 의견에는 가볍게 지나칠 수 없는 '현장'의 모습이 담겨있었다.