Adv Health Sci Educ Theory Pract. 2022 Oct;27(4):1177-1194. doi: 10.1007/s10459-022-10124-8. Epub 2022 Jun 6.

A state-of-the-art review of speaking up in healthcare 

 

 

🏥 "왜 의료현장에서 '말하기'가 이렇게 어려운 걸까?" — Speaking Up 연구 10년의 현주소

이 글은 Violato (2022)의 논문 "A state-of-the-art review of speaking up in healthcare" (Advances in Health Sciences Education, 27, 1177–1194)의 핵심 내용을 정리한 것입니다.


들어가며: Elaine Bromiley 이야기 

2005년, 건강했던 37세 여성 Elaine Bromiley가 간단한 수술을 위해 마취를 받다가 사망했습니다. '기관삽관 불능, 산소 공급 불능(can't intubate, can't oxygenate)' 상황이었는데, 방 안에는 여러 명의 숙련된 전문가가 있었습니다. 간호사들은 뭔가 잘못되고 있다는 걸 알았지만, 결정적인 순간에 충분히 목소리를 내지 못했습니다.

 

이 사건은 의료현장에서 "말하기(speaking up)"가 왜 중요한지, 그리고 왜 그것이 그토록 어려운지를 극명하게 보여주는 사례입니다. Violato (2022)는 바로 이 문제를 다룬 지난 10년간의 리뷰 논문 14편을 모아서, 우리가 이 주제에 대해 지금까지 무엇을 알고 있고, 무엇을 모르는지를 종합적으로 정리했습니다.


📌 '말하기(Speaking Up)'란 정확히 뭘까?

먼저 용어부터 정리해볼게요. 여기서 말하는 '말하기'는 일상적인 대화가 아닙니다. 논문에서 가장 널리 받아들여진 정의는 이렇습니다:

"의료팀 내에서 타인의 위험하거나 결함 있는 행위를 인지하거나 알게 되었을 때, 환자안전과 돌봄의 질을 위하여 의료 전문가가 우려를 제기하는 것"

"Speaking up is defined as the raising of concerns by healthcare professionals for the benefit of patient safety and care quality upon recognising or becoming aware of the risky or deficient actions of others within healthcare teams." (Okuyama et al., 2014)

 

쉽게 말하면, "이건 좀 아닌 것 같은데요"라고 말할 수 있는 능력이죠. 선배가 약물 용량을 잘못 지시했을 때, 수술 중 뭔가 이상한 걸 발견했을 때, 팀의 결정이 환자에게 위험할 수 있다고 느꼈을 때 — 그 순간 입을 여는 것. 그게 speaking up입니다.


🔍 이 논문은 어떻게 진행됐나? 

Violato는 최신기술리뷰(State-of-the-Art review)라는 방법을 사용했습니다. 이건 개별 연구를 하나하나 분석하는 게 아니라, 이미 나와 있는 리뷰 논문들을 모아서 "리뷰의 리뷰"를 하는 방법이에요. 6개 데이터베이스(MEDLINE, CINHAL, Scopus, Google Scholar, PsycINFO, ERIC)를 검색해서 2012년부터 2021년까지 발표된 14편의 리뷰 논문을 선정했고, 이 14편이 다룬 원문은 총 335편(고유 논문 236편)에 달합니다.

 

분석 결과, 문헌 전반에 걸쳐 5가지 공통 연구 질문5가지 공통 권고사항이 도출되었습니다.


📊 연구자들이 던진 5가지 핵심 질문

1️⃣ 어떤 교육과 훈련이 시도되었고, 효과가 있었나?

결론부터 말하면, 아직 뚜렷하게 효과적인 방법은 없습니다. 교육적 중재(educational interventions)는 태도(attitudes)와 자신감(confidence)에 약하고 단기적인 효과를 보였지만, 정작 중요한 실제 행동 변화(behaviour change)에는 효과가 거의 없거나 아예 없었습니다.

 

그나마 가장 긍정적인 결과를 보인 건 항공 분야에서 가져온 승무원/위기 자원 관리(Crew/Crisis Resource Management, CRM) 훈련이었어요. 하지만 이마저도 "어떤 특정 중재 특성이 일관되게 효과적이다"라고 말할 수 있는 수준은 아닙니다.

한마디로, 말하기는 의료 전문가 교육에 필수적이라고 다들 말하지만, 정작 체계적인 교육과정이나 훈련은 부족한 상태인 거죠.

2️⃣ 말하기를 막거나 돕는 요인은 뭘까?

가장 강력한 억제요인(inhibitor)은 위계(hierarchy)와 권력 역학(power dynamics)입니다. 이건 전문직 내(intraprofessional, 예: 수간호사 vs. 학생간호사)에서도, 전문직 간(interprofessional, 예: 마취과 의사 vs. 호흡치료사)에서도 작동합니다.

 

흥미로운 건, 실험 환경에서 위계를 일부러 평탄화(flattening)해봐도 말하기가 일관되게 개선되지는 않았다는 점이에요. 위계가 너무 깊이 뿌리박혀 있어서, 구조만 바꾼다고 해결되지 않는 거죠. 논문은 이렇게 표현합니다:

"위계와 문화의 명백한 극복 불가능성은 말하기를 시도하는 것 자체에 대한 무력감을 종종 만들어낸다."

"The apparent insurmountably of hierarchy and culture often create a sense of futility in even trying to speak up." (Morrow et al., 2016에서 재인용)

 

심리적 안전(psychological safety)의 부족도 큰 억제요인입니다. 보복에 대한 두려움, 갈등에 대한 걱정, 동료의 역량을 의심하는 것처럼 보일까 봐 하는 우려 — 이런 것들이 입을 다물게 만듭니다.

 

반면, 가장 일관된 촉진요인(enabler)은 조직적 지원(organizational support)이었습니다. 리더가 직접 말하기를 보여주고(modeling), 멘토링하고, 격려하고, 수용하는 환경이 핵심이에요.

 

한 가지 재미있는 발견도 있습니다. "감정적 축적(emotional buildup)"이라는 부정적 촉진요인인데요, 사람들이 참고 참다가 더 이상 참을 수 없는 지경에 이르러서야 비로소 입을 여는 현상입니다. 좋은 의미의 동기부여는 아니지만, 현실에서 실제로 작동하는 기제라는 거죠.

3️⃣ 사람들은 말하기를 어떻게 경험하나?

한마디로: 부정적입니다.

"말하기와 개방적 의사소통은 비효과적이고 전문적으로 불안전한, 높은 위험-낮은 보상의 행동으로 인식된다."

"Speaking up and open communication is viewed as a high-risk, low reward behaviour that is ineffective and professionally unsafe."

조직과 개인 모두 "말하기가 중요하다"고 말은 하지만, 실제로 적극적으로 장려하지는 않는 경우가 많습니다. 말해봤자 무시당하고, 언제 말해야 하는지도 불분명하고, 말하면 동료를 모욕하는 것 같고. 특히 학생들은 부정적 평가나 향후 커리어에 미칠 영향을 가장 걱정합니다.

 

그래도 사람들이 말하기를 하는 가장 큰 이유는 분명합니다: 환자를 걱정하기 때문이에요.

4️⃣ 사람들은 실제로 어떤 방식으로 말하나

놀랍게도 이 질문에 대한 연구가 매우 부족합니다. 알려진 바에 따르면, 사람들은 주로 간접적 방법(indirect methods)을 씁니다. 직접 "그건 틀렸어요"라고 하기보다는, 질문 형태로 돌려 말하거나, 제안하는 척하거나, 심지어 처방을 그냥 수행하지 않는 식의 소극적 저항을 하기도 합니다.

5️⃣ 말하기는 실제로 효과가 있나?

이것도 모릅니다. 연구 자체가 부족해서 실무에서의 효과를 판단할 수 없는 상태입니다. 대부분의 연구는 교육 중재의 효과나 자기보고(self-report)에 머물러 있어요.


💡 리뷰에서 도출된 5가지 공통 권고사항 

1. 조직적 지원과 문화 변화

심리적 안전, 공손함, 파트너십을 통한 정의로운 문화(just culture) 조성이 필요합니다. 리더가 직접 모범을 보이고 말하기를 수용하는 하향식(top-down) 변화가 핵심이에요.

2. 연구 방법의 개선

객관적 측정도구 개발, 생태학적 관찰(ecological observation), 병원 밖 맥락으로의 확장, 종단 연구(longitudinal research) 등 7가지 구체적 개선 방향이 제시되었습니다.

3. 인과 기제에 대한 깊은 이해

어떤 요인이 말하기에 가장 큰 영향을 미치는지, 그 요인들이 서로 어떻게 상호작용하는지를 밝혀야 합니다.

4. 교육과 훈련의 개선

학부 수준에서 시작해서 평생교육까지 이어지는 체계적이고 표준화된 훈련이 필요합니다. 특히 CRM 같은 효과가 검증된 방법을 중심으로, 각 전문직의 맥락에 맞춤화된 시나리오 기반 학습이 권장됩니다.

5. 외부 분야 지식의 통합

사회심리학(social psychology)의 순응(compliance), 권위에 대한 복종(obedience to authority), 동조(conformity) 연구, 그리고 경영학의 조직행동(organizational behaviour) 연구가 큰 도움이 될 수 있습니다. 논문은 이렇게 강조합니다:

"맥락은 중요하지만, 인간 행동과 인지의 원칙은 일반적으로 보편적이며, 이미 알려진 것을 재발견할 필요는 없다."

"Context is important; however, the principles of human behaviour and cognition are generally universal, and it is not necessary to rediscover what is already known." (Ariely, 2008; Olsson-Collentine et al., 2020; Avorn, 2018; Croskerry et al., 2017에서 재인용)


🎯 시뮬레이션: 기대와 현실 사이 

시뮬레이션(simulation)은 speaking up 연구와 교육에서 빠지지 않고 언급되는 방법입니다. 하지만 현실은 좀 복잡해요.

  • 기대하는 역할: 객관적인 행동 측정이 가능하고, 다양한 변수를 실험적으로 조작할 수 있으며, 안전한 환경에서 기술을 연습할 수 있는 유망한 도구.
  • 현실적 한계: 임상 환경과의 괴리, 참여자들의 낮은 긴박감, 측정 도구의 미비, 종단적 추적 부재.

그런데 정말 흥미로운 점이 하나 있습니다. 시뮬레이션은 위험이 낮은 환경이고, 참여자들이 사전 훈련까지 받았는데도 말하기가 보편적으로 나타나지는 않았다는 겁니다. 안전한 환경에서조차 입을 열지 못하는 거예요. 이건 이 문제가 단순히 지식이나 기술의 문제가 아니라는 걸 시사합니다.

 

Violato는 시뮬레이션에 대한 인식 전환을 제안합니다:

"제한으로 여겨지기보다는, 시뮬레이션은 훈련과 인과적 기제를 실험적으로 검토할 풍부한 가능성을 제공하는, 높은 생태학적/외적 타당도를 가진 검증 장소로 여겨져야 한다."

"Rather than being seen as a limitation simulation should be viewed as a testing ground with high ecological/external validity that provides abundant possibilities to experimentally examine training and causative mechanisms for speaking up."


🗣️ 저자가 제안하는 핵심 연구 질문 

Violato는 이 분야의 연구를 전진시키기 위한 근본적인 질문 하나를 제시합니다:

"말하기에서 가장 많은 분산을 설명하는 변수는 무엇이며, 그들의 공분산은 어떠한가?"

"Which variables account for the most variance in speaking up, and what are their covariance?"

 

복잡해 보이지만 핵심은 간단합니다. "도대체 뭐가 사람들을 말하게 하고, 뭐가 입을 다물게 하는지, 그리고 그 요인들이 서로 어떻게 얽혀 있는지를 제대로 밝혀보자"는 거예요. 이를 위해 구조방정식모형(Structural Equation Modelling, SEM) 같은 방법론의 활용을 제안합니다.


📝 결론: 아직 갈 길이 멀다

이 논문의 결론을 한 문장으로 요약하면 이렇습니다:

"말하기에 대한 지식과 연구는 확실성보다는 더 많은 한계, 질문, 개선의 여지가 있는 초기 단계에 있다. 말하기의 이유와 방법은 여전히 열린 질문으로 남아 있다."

"Knowledge about speaking up and research related to speaking up is in an emergent state with more shortcomings, questions, and avenues for improvement than certitude. The whys and how of speaking up remain open questions."

 

겉보기에는 정말 단순한 행동 — "위험한 상황에서 입을 여는 것" — 이 왜 이렇게 어려운지, 우리는 아직 제대로 이해하지 못하고 있습니다. 위계, 문화, 심리적 안전, 개인적 특성, 조직적 지원 — 이 모든 것들이 복잡하게 얽혀 있고, 그 실타래를 풀기 위한 연구는 이제 막 시작 단계인 셈이죠.


💭 의학교육 관점에서의 시사점

이 논문이 의학교육자에게 던지는 메시지는 분명합니다.

  • 첫째, 교육과정에 speaking up을 체계적으로 포함해야 합니다. "중요하다"고 말만 하는 것으로는 부족합니다. 학부 과정부터 시작해서 전공의 수련, 평생교육까지 이어지는 연속적인 훈련이 필요합니다.
  • 둘째, 시뮬레이션만으로는 안 됩니다. 시뮬레이션은 유용한 도구이지만, 안전한 시뮬레이션 환경에서도 말하기가 보편적이지 않다는 사실은, 이 문제가 단순한 스킬 트레이닝으로 해결되지 않는다는 것을 보여줍니다.
  • 셋째, 문화를 바꿔야 합니다. 가르치는 것만큼 중요한 건, 학습자가 실제로 목소리를 냈을 때 그것이 수용되고 존중받는 환경을 만드는 것입니다. 교수와 선배 의료진이 먼저 모범을 보이는 것(role modeling)이 어떤 교육 프로그램보다 강력할 수 있습니다.

 

 


서론 (Introduction) 

의료 전반에서, 교육을 포함하여, speaking up을 지원하고 사람들이 speaking up에 참여하도록 훈련시키는 책임과 필요성 이 존재한다 (Milligan et al., 2017). Speaking up 이란 타인에게 환자 진료와 안전에 관련된 우려를 인식시키기 위해 우려(concern) 또는 다른 의견(differing opinion)을 표명하는 것이다 (Okuyama et al., 2014). 현재 의료 시스템 전반의 많은 실무자들에게는 환자 안전, 진료, 위험에 관해 우려를 제기할 수 있다는 지각된 능력(perceived ability) 과 함께, 실제로 어떻게 우려를 제기할지에 대한 지식과 기술(knowledge and skills) 이 최적 수준에 미치지 못한다 (Jones et al., 2021; Kim et al., 2020; Milligan et al., 2017; Morrow et al., 2016). Speaking up의 부재, 혹은 speaking up을 하지 못하는 상황은 환자 안전(patient safety), 교육(education), 전문성 개발(professional development), 그리고 전문직 정체성(professional identity) 에 부정적 영향을 미칠 수 있다 (Bickhoff et al., 2017). Speaking up을 어렵게 만들고, 심지어 전문직적·개인적으로 위험한 일(professionally and personally risky) 로 만들 수 있는 수많은 도전 과제가 존재하는데, 여기에는 개인적(individual), 대인관계적(interpersonal), 전문직적(professional), 조직적(organizational) 요인이 포함된다 (Jones et al., 2021; Kim et al., 2020). Elaine Bromiley는 이러한 요인들의 합류(confluence) 때문에 사망했다.

  • 건강한 사람이, 여러 명의 자격 있는 전문가들이 같은 방에 있었음에도 불구하고 발생한 ‘삽관도 불가능하고 산소 공급도 불가능한(can’t intubate can’t oxygenate)’ 상황에서 사망한 사례는, 사람들이 speaking up을 하지 않거나 할 수 없을 때 어떤 일이 벌어질 수 있는지를 상징적으로 보여준다 (Harmer, 2005).
  • 반대로, 팀 리더의 약물 선택과 투여 방식에 대해 질문하는 것과 같이 직접적이고 지속적인 speaking up 은 잠재적으로 치명적인 오류를 피하게 할 수 있다 (Calhoun et al., 2014).

 

이 문제는 이전부터 존재해 왔지만, speaking up이라는 전 세계적으로 인정된 도전 과제는 지난 10년 사이 더욱 전면화되었다 (Jones et al., 2021; Peadon et al., 2020). 이 문제에 대한 접근은 다양한 관점들을 포함해 왔고 (Holmes et al., 2014; Kohn et al., 1999), 그 결과 지식을 모으고 문헌을 요약하는 여러 형식의 리뷰 논문이 등장하게 되었다.

 

리뷰 논문들이 다수 출현함에 따라, speaking up에 대한 문헌 요약과 지식은 서로 다른 지식 흐름들(knowledge streams) 속으로 분절(fractionated)되고 확산(diffuse)될 수 있다. 이미 의료에서의 speaking up 연구는 기존 근거와의 연속성(continuity)과 연결성(connection)이 부족하며, 새로운 연구들은 이전의 결함을 수정하거나 선행 발견을 바탕으로 축적적으로 발전하지 못하고 있다 (Jones et al., 2021). 의료에서의 speaking up 연구는 비교적 초기 단계(nascent)에 있기 때문에, 향후 발전을 촉진하고 지식의 분산을 막기 위해 기존 지식을 하나의 포괄적인 출처로 통합하는 것이 필수적이다. 본 논문은 speaking up의 현재 “최신 동향(State of the Art)” 을 대표하는 통합된 진술(unified statement) 을 만들고자 하며, 이를 통해 speaking up 관련 연구를 계획하는 연구자들, speaking up 개선 방안을 결정하는 정책입안자들, 그리고 speaking up을 위한 교육과정(curriculum) 및 수업 자료(course material)를 개발하는 교육자들을 지원하고자 한다. 이 목적을 달성하기 위해 다음과 같은 안내 연구 질문(guiding research question)을 개발하였다.

 

speaking up에 관한 문헌 전반에서 공통된 발견(common findings)을 확인하고 종합하여, 의료에서의 speaking up에 대한 연구와 지식의 현재 상태를 통합적으로 이해할 수 있을까?

 


방법 (Methods) 

최근의 리뷰들을 통합(amalgamating)함으로써 현재의 지식과 미래 연구의 우선순위에 대한 포괄적 선집(comprehensive anthology)을 효율적으로 구축하기 위해 최신 동향 검토(State-of-the-Art review) 를 수행하였다 (Grant & Booth, 2009). State-of-the-Art review는 일차 연구(primary research) 의 형식적 질 평가(formal quality assessment)를 포함하지 않으며, 대신 리뷰들을 모아 보다 높은 수준(higher-level)의 종합을 통해 지식을 통합하는 데 초점을 둔다. 리뷰 형식의 다양성은 2차 수준(secondary level)의 형식적 평가 가능성을 배제한다 (Fusar-Poli & Radua, 2018; Grant & Booth, 2009).

검색 전략 (Search strategy)

문헌은 MEDLINE, CINHAL, Scopus, Google Scholar, PsycINFO, ERIC 을 사용하여 수집하였다. 검색은 최초로 2020년 10월에 수행되었고, 2021년 2월과 2021년 9월에 다시 수행되었으며, 연도 제한은 두지 않았다. Table 1은 검색어와 결과를 보여준다. Speaking up 관련 연구들과 기타 출판물들의 참고문헌 목록(reference lists)은 수기 검색(hand-search)하였다 (예: Mannion et al., 2018).

추출 (Extraction)

검색 및 검토 과정은 PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses) 형식을 따랐다 (Fig. 1) (Moher et al., 2009). 중복 제거 후, 주 연구자(principal investigator)가 제목과 초록을 선별하여 더 면밀한 검토를 위한 포함 여부를 판단하였다.

  • 포함 기준은 다음과 같았다: speaking up, safety voice, challenging authority에 관한 리뷰 논문; 모든 리뷰 유형과 방법 포함.
  • 제외 기준은 다음과 같았다: 비리뷰 논문, 예를 들어 일차 연구(primary source research), whistleblowing 관련 문헌, 일반적인 환자 옹호(patient advocacy), 그리고 환자 안전의 비관련 측면들.
  • 또한 다전문직 교육 및 협력(interprofessional education and collaboration), 팀 커뮤니케이션(team communication)에 관한 자료와 같은 다른 출처의 수기 검색을 통해 추가 기록(records)을 확인하였다.

분석 (Analysis)

공통점들, 예를 들어 연구 질문(research questions), 결과(outcomes), 한계(limitations), 결론(conclusions) 을 확인하는 데 초점을 둔 지속적 비교 분석(constant comparative analysis) 의 반복적 과정(iterative process)을 사용하였다 (American Psychological Association, n.d.). 모든 논문은 주 연구자(PI)가 읽고 요약하여 개요집(compendium)과 내용에 대한 전반적 이해를 구축하였다. 이후 논문들을 다시 읽고, 각 리뷰의 발견을 추출하였다. 발견들이 도출됨에 따라, 최종 종합(final synthesis)이 가능해질 때까지 모든 논문을 반복적으로 검토하여 도출되는 발견들과의 일치(concordance)를 확인하였다.


표 1. 데이터베이스, 검색 전략, 그리고 결과 (Table 1 Databases, search strategy, and results) 

데이터베이스 (Database)검색어 (Terms)결과 (Results)
MEDLINE speak* up OR speak* out OR safety voice OR positive deviance OR challeng* authority / Review로 필터링 103
CINHAL speak* up OR speak* out OR safety voice OR positive deviance OR challeng* authority / Review로 필터링 359
Scopus speak* up OR speak* out OR safety voice OR positive deviance OR challeng* authority / Medicine, Nursing, Health Professions, Review로 제한 15
Google Scholar speak* up OR speak* out OR safety voice OR challeng* authority AND healthcare (첫 10페이지 선별) 7
ERIC speak* up OR speak* out OR safety voice OR positive deviance OR challeng* authority AND healthcare / Review로 필터링 0
PsycINFO speak* up OR speak* out OR safety voice OR positive deviance OR challeng* authority AND healthcare / Review로 필터링 0

결과 (Results) 

14편의 리뷰 논문이 분석되었다 (Table 2). 이 14편의 리뷰는 정량적 연구(quantitative research), 정성적 연구(qualitative research), 혼합방법 연구(mixed methods research), 논평(commentaries), 이론 논문(theoretical papers)을 포함하여 총 335편의 논문을 다루고 있었다. 335편 중 51편은 여러 리뷰에 중복 포함되어 있었으며, 그 결과 150회의 중복 인용(replications)과 236편의 고유 논문(unique articles)이 존재하였다 (전체 문헌 목록은 보조자료 참조). 가장 자주 검토된 논문은 다음과 같다: Pian-Smith et al (2009) (8회 검토), Raemer et al (2016) (7회), Schwappach and Gehrig (2014) (6회), Johnson and Kimsey (2012) (6회), O’Connor et al. (2013) (6회), Sayre et al (2012) (6회), Barzallo Salazar et al. (2014) (5회). 이들 논문군은 반복 인용된 논문의 29%를 차지하였다.

그림 1. 검토 대상 논문 선정 과정을 보여주는 PRISMA 흐름도 (Fig. 1 PRISMA flow chart illustrating selection of papers for review)

  • 데이터베이스 검색을 통해 확인된 기록: n = 484
  • 기타 출처를 통해 추가로 확인된 기록: n = 27
  • 중복 제거 후 기록: n = 489
  • 선별된 기록: n = 489
  • 적격성 평가를 위해 원문 검토한 논문: n = 28
  • 제외된 기록: n = 462
  • 포함 기준을 충족하지 못해 제외된 원문 논문: n = 14
  • 종합에 포함된 연구: n = 14

표 2. 본 검토에 포함된 논문들 (Table 2 Articles included in the review)

연도저자리뷰 유형저널자료 수(# Sources)
2012 Rutherford et al. (2012) 문헌(서술적) 리뷰 [Literature (Narrative) Review] British Journal of Anaesthesia 3
2014 Okuyama et al. (2014) 문헌(서술적) 리뷰 BMC Health Services Research 27
2016 Morrow et al. (2016) 해석적 메타합성(Interpretive Meta-Synthesis) International Journal of Nursing Studies 11
2016 Nacioglu (2016) 문헌(서술적) 리뷰 Safety in Health 53
2016 Fagan et al. (2016) 개념 분석(Concept Analysis) Journal of Advanced Nursing 34
2017 Bickhoff et al. (2017) 문헌(서술적) 리뷰 Collegian 15
2017 Omura et al. (2017) 체계적 문헌고찰(Systematic Review) International Journal of Nursing Studies 8
2017 Milligan et al. (2017) 체계적 문헌고찰, 메타합성(Systematic literature review, Meta-synthesis) Nurse Education Today 23
2019 Noort et al. (2019) 체계적 문헌고찰 Safety Science 48
2019 Pattni et al. (2019) 질적 서사적 종합(Qualitative Narrative Synthesis) British Journal of Anaesthesia 31
2020 O’Donovan and McAuliffe (2020) 체계적 문헌고찰 BMC Health Services Research 14
2020 Peadon et al. (2020) 체계적 문헌고찰 Safety Science 19
2020 Kim et al. (2020) 범위 문헌고찰(Scoping Review) Journal for Healthcare Quality 14
2021 Jones et al. (2021) 체계적 서사 문헌고찰(Systematic Narrative Review) Health Policy 34

일차 자료(primary sources)는 여러 세계 지역의 데이터를 반영하고 있었다.

  • 아시아(홍콩, 일본, 한국, 네팔, 대만), 아프리카(동아프리카, 케냐), 유럽(불가리아, 키프로스, 핀란드, 아일랜드, 이탈리아, 스웨덴, 스위스), 그리고 중동(이란, 이스라엘)이 포함되었다.
  • 가장 자주 출처가 된 논문들은 호주와 뉴질랜드, 캐나다, 미국, 영국에서 나온 것들이었다. 대부분의 문헌은 학생을 포함한 의사와 간호사에 초점을 맞추고 있었다.
  • 일부 소수 문헌만이 allied health professionals, 행정(administration), 약사(pharmacists), 환자(patients)를 다루고 있었다 (보조자료 참조).

현상의 정의 (Definition of the phenomena) 

모든 논문은 speaking up을 유사하게 정의하고 있었다. Okuyama et al. (2014)은 Leonard et al. (2004)와 Lyndon et al. (2012)에서 도출한, 간결하면서도 포괄적인 정의를 제시하였으며, 이는 모든 리뷰에서 사용된 정의들을 포괄하였다. 즉, “Speaking up”은 병원 환경(hospital environment) 내 의료팀(healthcare teams)에서 타인의 위험하거나 결함 있는 행위(risky or deficient actions)를 인식하거나 알게 되었을 때, 환자 안전(patient safety)과 진료의 질(care quality)을 위해 의료전문직 종사자들이 우려를 제기하는 것 으로 정의된다.

 

14편의 리뷰 전반에서 speaking up은 세 가지 맥락(context)에서 탐구되었다.

  • (1) 훈련(training)을 포함한 팀 상황(team situations),
  • (2) 의료의 위계(hierarchies) 속에서의 일반적 맥락(general contexts),
  • (3) 주로 간호(nursing)와 학생(students)에 초점을 둔 전문직 집단 간 차이(differences amongst professional groups) 이다.
  • Safety voice 는 Morrison의 employee voice 모델(Morrison, 2011; Noort et al., 2019)에서 변형된 개념으로, 위험한 상황(hazardous situations)에서 speaking up하는 행위를 설명하는 데 널리 사용된 해석적 틀(interpetive framework)이었다.
  • Employee voice 는 더 높은 조직적 위치에 있는 사람에게 우려, 제안, 정보, 또는 업무 관련 의견을 자발적으로 전달하는 것이다 (Morrison, 2014).
  • Safety voice 는 개념적으로 employee voice와 유사하지만, 그 내용과 메시지가 안전(safety)에 초점을 둔다는 점, 맥락이 안전-중요 조직(safety-critical organizations)과 관련된다는 점, 행동이 법적으로 요구될 수 있다는 점, 그리고 그 행동이 whistleblowing처럼 조직 밖으로까지 확장될 수 있다는 점에서 차이가 있다 (Noort et al., 2019).

용어와 언어 (Terms and language) 

권위에 도전하는 행위(challenging authority)를 정의하고 논의하는 데 공통적으로 사용된 언어는 다음과 같다. “Speaking Up,” “Hierarchies,” “Psychological Safety,” “Safety Voice,” “Challenging Authority,” “Communication.” 이와 함께 다양한 언어와 고유한 표현들도 나타났다. 예를 들어

  • “Incivility by Elites” (Morrow et al., 2016),
  • “Dance of Caring Professionals” (Morrow et al., 2016),
  • “Circular Hierarchy” (Morrow et al., 2016),
  • “Immorality” (Okuyama et al., 2014),
  • “Duty of Candor” (Milligan et al., 2017),
  • “Lateral [Horizontal] Violence” (Milligan et al., 2017),
  • “Unwholesome Submissiveness” (Peadon et al., 2020) 등이 있었다.

리뷰들의 연구 질문과 발견 (Research questions and findings of the reviews) 

각 리뷰는 고유한 연구 질문을 가진 독자적인 문헌 탐구로 제안되었다. 그러나 모든 리뷰를 종합해 보면, 발견들은 다음과 같은 5개의 공통 질문 아래에서 정리될 수 있었다.

  • (1) 어떤 중재(interventions)/훈련(training) 이 사용되었고, 얼마나 효과적인가? (Jones et al., 2021; Kim et al., 2020; Milligan et al., 2017; Nacioglu, 2016; O’Donovan & McAuliffe, 2020; Okuyama et al., 2014; Omura et al., 2017);
  • (2) 어떤 기제(mechanisms), 즉 억제요인(inhibitors)/촉진요인(enablers) 이 speaking up에 영향을 미치는가? (Bickhoff et al., 2017; Nacioglu, 2016; Okuyama et al., 2014; Peadon et al., 2020);
  • (3) 사람들은 speaking up을 어떻게 지각(perceptions) 하고 경험(experiences) 하는가? (Fagan et al., 2016; Morrow et al., 2016; Noort et al., 2019; Pattni et al., 2019);
  • (4) 사람들은 실제로 어떻게 말하는가(how do people speak up)? (Bickhoff et al., 2017; Morrow et al., 2016; Pattni et al., 2019; Rutherford et al., 2012);
  • (5) speaking up은 얼마나 효과적인가(how effective is speaking up)? (Milligan et al., 2017; Nacioglu, 2016; Okuyama et al., 2014).

어떤 중재/훈련이 사용되었고, 얼마나 효과적인가?
(What interventions/training have been used, and how effective are they?)
 

Speaking up은 보건의료전문직 교육의 필수적인 부분으로 간주되지만, speaking up/assertiveness training/conflict training에 관한 교육과정(curriculum)체계적 훈련(systematic training) 의 부족이라는 교육적 격차(educational gap) 가 존재한다 (O’Donovan & McAuliffe, 2020; Omura et al., 2017; Pattni et al., 2019). 다섯 가지 형태의 중재가 확인되었다:

 

  • 교육과 시뮬레이션(education and simulation),
  • 교육과 리더십 비디오(education and leadership videos),
  • 교육과 사례 연구(education and case studies),
  • 교육 워크숍(educational workshops), 그리고
  • 비교육적 중재(non-educational interventions) 로서 forum play, holistic facilitation, action research meetings가 포함되었다 (Jones et al., 2021; Kim et al., 2020; O’Donovan & McAuliffe, 2020; Okuyama et al., 2014; Omura et al., 2017).

 

Speaking up에 대한 훈련과 중재 연구는 비교적 최근의 것이며, 효능 근거(efficacy evidence) 는 제한적이다.

 

  • 전반적으로, speaking up을 위한 교육적 중재는 태도(attitudes)자신감(confidence) 에 대해서는 약하고 단기적인 긍정 효과를 보이지만, 행동(behaviour) 에 대한 효과는 미미하거나 거의 없다.
  • 팀 훈련(team training)과 assertive communication 을 위한 중재는 어느 정도 효과적이지만, 코칭 기반 훈련(coaching based training)은 효과적이지 않은 것으로 보인다.
  • 항공 분야에서 차용한 팀 기술 훈련(team skills training)과 의사소통 기법, 특히 Crew/Crisis Resource Management (CRM) 는 긍정적으로 평가되었으며, 태도·자신감·행동에 대해 가장 강한 긍정 효과를 보였다 (Fagan et al., 2016; Jones et al., 2021; Kim et al., 2020; Milligan et al., 2017; Nacioglu, 2016; O’Donovan & McAuliffe, 2020; Okuyama et al., 2014; Omura et al., 2017; Pattni et al., 2019; Peadon et al., 2020).
  • 그러나 어떤 특정한 중재 특성(specific characteristics of interventions) 도 일관되게 긍정 효과를 보이지는 않았다.

 


어떤 기제(촉진요인/억제요인)가 speaking up에 영향을 미치는가?
(What mechanisms (enablers/inhibitors) influence speaking up?)
 

Speaking up을 억제하거나 촉진하는 수많은 선행요인(antecedents) 이 확인되었으나, 일관되게 억제적이거나 촉진적이거나 양면적 역할을 하는 기제는 소수에 불과했다 (Bickhoff et al., 2017; Fagan et al., 2016; Jones et al., 2021; Kim et al., 2020; Morrow et al., 2016; Noort et al., 2019; Omura et al., 2017; Pattni et al., 2019; Peadon et al., 2020).

Speaking up의 억제요인 (Inhibitors of speaking up) 

가장 주요한 억제 기제는 위계(hierarchies)권력 역학(power dynamics) 이었지만, 실험 조건에서 위계를 평평하게(flattening hierarchies) 만든다고 해서 speaking up이 일관되게 향상되지는 않았다 (Bould et al., 2015; Friedman et al., 2015; Sydor et al., 2013). 위계는 student nurse와 charge nurse 사이처럼 전문직 내 위계(intraprofessional hierarchy) 일 수도 있고, anesthetist와 respiratory therapist 사이처럼 전문직 간 위계(interprofessional hierarchy) 일 수도 있다. 전문직 간·내 위계 장벽과 그에 수반되는 전문직 문화(professional cultures)는 위계의 하위에 있는 사람들, 특히 학생들에게는 물론이고, 더 상위에 있는 senior medical doctors에게조차 종종 극복 불가능한 것으로 여겨진다 (Peadon et al., 2020). 위계와 문화가 극복 불가능해 보인다는 점은, speaking up을 시도하는 것 자체가 무의미하다는 무력감(futility) 을 만들어내곤 한다 (Morrow et al., 2016). 위계와 권력 역학은 역할(roles), 책임(responsibilities), 전문직 고정관념(professional stereotypes)에 대한 기대를 생성하고 지지함으로써 speaking up을 제약하는 것으로 확인되었다. 이러한 고정관념은 speaking up의 수용을 저해하고, speaking up할 수 있다는 지각된 능력을 떨어뜨리며, speaking up의 책임감을 약화시키고, 위계 제약에 도전하는 것을 회피하게 만들 수 있다.

 

심리적 안전감(psychological safety) 의 부재는, 지각된 것이든 실제든, 보복(reprisal), 갈등(conflict), bullying과 harassment, 타인의 역량(competency)에 의문을 제기하는 것에 대한 우려 등 부정적 결과에 대한 두려움(fear of negative consequences) 을 통해 speaking up을 억제한다. 이러한 부정적 결과에 대한 두려움은 맥락 의존적일 수 있다. 예를 들어 학생은 부정적 평가(negative evaluation)를 두려워할 수 있고, senior professional은 동료의 역량에 의문을 제기하는 것으로 비칠까 봐 동료를 불쾌하게 만들고 싶지 않을 수 있다. 또한 speaking up이 무엇을 의미하는지에 대한 일관되지 않은 언어(language), 훈련(training), 불일치하는 이해(discordant understandings) 역시 억제 요인이다.

Speaking up의 촉진요인 (Enablers of speaking up) 

 

  • “Safety voice”를 갖는 것 은 speaking up의 촉진요인이지만, safety voice의 의미 자체는 “분절되어 있고 아직 초기 단계(disintegrated and nascent)” 에 있다 (Noort et al., 2019).
  • 가장 일관되게 확인된 촉진요인은 관리자와 행정적 지지(managerial and administrative support) 를 포함한 조직적 지원(organizational support) 이었다. 조직적 지원에는 리더십 위치에 있는 사람들이 speaking up 행동을 모델링(modeling) 하고, 멘토링(mentoring) 하며, 격려(encouraging) 하고, 수용(accepting) 하는 것이 포함된다.
  • 시스템 차원의 지원(system supports)으로는 접근 가능한 보고 체계(reporting systems)whistleblowing 지원 이 주로 언급되었다 (Fagan et al., 2016). 이러한 조직적 지원을 만들기 위해서는 지원의 필요성에 대한 인식이 필요하며, 사람이 목소리를 낼 수 있다고 느끼는, 권한부여되고 심리적으로 안전한 조직/환경(empowering and psychologically safe organization/environment) 을 조성하려면 하향식(top-down) 지원 이 필수적이다 (Morrow et al., 2016; O’Donovan & McAuliffe, 2020).
  • Speaking up에 대한 지원은 환자중심성(patient-centeredness), 환자안전(patient safety), 전문직 원칙(professional principles)의 보호, 예를 들어 환자 옹호자(patient advocate) 가 되어야 한다는 전문직 명령(professional mandates)에서도 나온다 (Bickhoff et al., 2017).
  • 임상 및 안전 관련 경험(experience)지식(knowledge) 또한 지지적이다 (Fagan et al., 2016; Okuyama et al., 2014).
  • 부정적으로 지향된 촉진요인으로는 “감정의 축적(emotional buildup)” 이 있는데, 사람들은 결국 말하지 않을 수 없을 정도의 정서적 수준에 도달하게 된다 (Morrow et al., 2016).

 

억제요인이자 촉진요인인 요소 (Inhibitor/enabler of speaking up) 

위계(hierarchy)는 주요한 억제 기제이면서도 동시에 의료의 필요한 측면으로 간주되며, 상위 위치에 있는 사람들이 speaking up을 모델링, 멘토링, 가능하게 하고, 수용할 때 오히려 speaking up을 긍정적으로 지지할 수 있다.

 

  • 예를 들어 개별 nurse manager는 학생이나 그 아래에 있는 사람들이 speaking up을 할지 여부에 긍정적 또는 부정적 영향을 미칠 수 있다 (Morrow et al., 2016).
  • 상호 존중(mutual respect)에 기반한 긍정적인 멘토-멘티 관계(mentor–mentee relationship) 는 speaking up을 지원할 수 있으나, 지나친 존중은 오히려 speaking up을 막을 수 있고, 반대로 부정적 관계는 의사소통을 방해한다.
  • 문화적·세대적 배경(cultural and generational background), 태도(attitudes), 성격(personality), 성(sex), 경험(experience), 자신감(confidence)과 같은 개인 요인(individual factors)은 억제적일 수도 있고 촉진적일 수도 있다.

 

이러한 개인적 특성이 어떻게 작동하는지는 아직 발전 중이며, 맥락에 따라 달라질 수 있다. 예를 들어 학생은 speaking up을 하기 위해 조직적 지원, 임상 지식, 안전에 대한 헌신, speaking up을 위한 기술과 도구가 있어야 자신감을 가질 수 있다. 반면 더 경험 많은 동료는 조직적 지원이나 speaking up 도구가 꼭 필요하다고 느끼지 않을 수 있다.

 

문화적 고려(cultural considerations)는 중요하지만, 그 중요성이 정확히 어떻게 작용하는지는 명확하지 않다 (Jones et al., 2021). 위계의 기울기(hierarchy gradients)가 의료 문화(medical culture)에 너무 깊이 각인되어 있어 국가 문화의 영향을 능가할 수도 있고 (Kobayashi et al., 2006), 반대로 국가 문화가 너무 강해서 전문직 변화와 중재 효과를 압도할 수도 있다 (Roh et al., 2015).


사람들은 speaking up을 어떻게 지각하고 경험하는가?
(What are people’s perceptions and experiences of speaking up?)
 

전반적으로 speaking up에 대한 지각과 경험은 부정적(negative) 이며, 이것 자체가 speaking up에 대한 억제 기제로 작용할 수 있다. 개인과 조직은 speaking up이 가치 있는 것이라고 자주 말하지만, 이를 적극적으로 장려하지는 않는다. Speaking up과 개방적 의사소통(open communication)은 높은 위험, 낮은 보상(high-risk, low reward) 의 행동으로 인식되며, 비효율적이고 전문직적으로 안전하지 않다고 여겨진다. 여기에는 학대(abuse)에 대한 두려움과 기타 부정적 결과에 대한 두려움이 포함된다. 더 나아가, speaking up 행동은 종종 무시되며, 언제 말해야 하는지, speaking up이 정확히 무엇을 포함하는지도 종종 불분명하다. 사람들은 speaking up이 동료를 굴욕스럽게 만들 것이라고 생각할 수 있다. 학생들이 부정적 결과를 우려하는 주된 이유는 부정적 평가(negative assessment) 와 미래 실무(future practice)에 미칠 영향과 관련되어 있다. 위험한 상황을 개선하고 환자를 염려하는 것이 speaking up의 주된 이유이다. Speaking up은 정서적 부담(emotional burden)을 수반할 수 있으며, 용기(courage) 와 함께 조직, 상위 지위의 동료, 또래(peer)의 지원이 필요하다 (Bickhoff et al., 2017; Fagan et al., 2016; Milligan et al., 2017; Morrow et al., 2016; Nacioglu, 2016; Noort et al., 2019; Okuyama et al., 2014; Peadon et al., 2020).


사람들은 실제로 어떻게 말하는가? (How do people speak up?) 

실제 현장에서 사람들이 어떻게 speaking up을 하는지 에 관한 연구는 매우 부족하다 (Bickhoff et al., 2017; Milligan et al., 2017; Morrow et al., 2016; Noort et al., 2019; Okuyama et al., 2014; Rutherford et al., 2012). 사람들은 종종 직접적 표현 대신, 질문이나 제안의 형태로 말을 조정하는 간접적 방법(indirect methods) 을 사용하거나, 행동을 회피하고 지시를 따르지 않는 등의 소극적 혹은 침묵 기반 방법(negative or silent methods) 을 사용한다. 긍정적 방법(positive methods)에는 사실을 수집하는 것, 말하려는 의도를 보여주는 것, 언제 어디서 말할지에 대한 구체적인 목표를 정하는 것이 포함된다. Speaking-up 행동에 관한 많은 근거는 학생들에게서 나왔으며, 학생들은 종종 언제, 누구에게 우려를 보고해야 하는지 알지 못한다. Speaking up을 고려할 때 사람들은 그 효용성(utility) 과 예상되는 결과(expectations about outcomes) 를 저울질하고 평가한다. 전문직 간 차이(professional differences)에 대한 경험적 근거(empirical evidence)는, 전문직 간 연구(cross-professional research)행동 평정 척도(behavioural rating scales) 와 같은 객관적 측정의 부재로 인해 부족하다.


Speaking up은 얼마나 효과적인가? (How effective is speaking up?) 

실제 실무(practice)에서 speaking up의 효과성(effectiveness)은 연구 부족으로 인해 알려져 있지 않다. 연구와 근거의 대부분은 교육적 중재 및 훈련의 효과성, 그리고 speaking up에 대한 자기보고 경험(self-reported experiences)에 초점을 맞추고 있다. 환자의 speaking up을 조사한 연구는 매우 적으며, 그러한 연구들은 환자의 speaking up이 잘 받아들여지지 않는다는 점을 보여주었다 (Nacioglu, 2016).


시뮬레이션의 중요성 (The importance of simulation) 

시뮬레이션(simulation)은 교육과 훈련을 조사하는 데 중요하다고 여겨지지만, 시뮬레이션 기반 연구(simulation-based research) 는 매우 부족하다. 14편의 리뷰 전반에서 17편의 시뮬레이션 기반 연구가 명시적으로 확인되었다 (보조자료 참조). Pattni et al. (2019)는 자기보고 연구(self-report studies) 가 시뮬레이션 연구에 비해 광범위하게 퍼져 있음을 지적하였다. 세 가지 유형의 시뮬레이션 기반 연구가 확인되었다. (1) 교육 효과 검증(testing education), (2) 장벽의 효과 검증(testing effects of barriers), 예를 들어 엄격한 위계(strict hierarchy), (3) speaking up 방법의 검증(testing methods to speak up), 예를 들어 two-challenge rule. 시뮬레이션 연구에 대한 논의는 세 가지 영역에 초점을 두었다: 유용성(utility), 도전 과제(challenges), 개선(improvement) (Fagan et al., 2016; Kim et al., 2020; Morrow et al., 2016; Noort et al., 2019; O’Donovan & McAuliffe, 2020; Okuyama et al., 2014; Omura et al., 2017; Pattni et al., 2019; Peadon et al., 2020).

시뮬레이션의 유용성 (Utility of simulation) 

시뮬레이션은 speaking up과 관련된 교육, 훈련, 개념 검증에 유망한 방식(promising modality)으로 여겨진다 (Fagan et al., 2016; Noort et al., 2019; O’Donovan & McAuliffe, 2020; Okuyama et al., 2014; Omura et al., 2017; Pattni et al., 2019; Peadon et al., 2020). 가장 큰 유용성은 수행(performance)행동(behaviour) 에 대한 객관적 측정(objective measurements) 을 얻을 수 있다는 점이다. 또한 시뮬레이션은 태도, 성격, 의사소통 기술과 같은 개인 요인의 영향을 측정하고, 평평한 팀과 위계적 팀 구조처럼 조절자(modifiers)와 장벽(barriers)의 영향을 측정하는 데 유용하다. 시뮬레이션은 사람들이 기술을 연습하고, 강의식으로 전달된 지식을 실제로 통합할 수 있게 하며, 학생들의 시나리오 기반 학습(scenario-based learning) 욕구를 충족시킨다. 또한 새로운 speaking up 방법을 시험하고 개발하는 환경으로 사용될 수 있다.

시뮬레이션의 도전 과제 (Challenges of simulation) 

거의 모든 리뷰가 시뮬레이션을 비판하였으며, 시뮬레이션 기반 연구 자체가 한계로 간주되었다. 가장 큰 비판은 시뮬레이션이 실제 임상 환경(clinical environment)과 일치하지 않으며, 실재감(verisimilitude) 의 부족이 시뮬레이션 의존 중재의 효과 부족 원인이라는 점이었다. 또한 시뮬레이션에서 참가자들이 책임감(responsibility)과 긴박감(urgency)을 충분히 지각하지 못한다고 가정된다. 흥미롭게도, 시뮬레이션 연구는 저위험 환경(low risk settings)으로 간주되고 참가자들이 훈련을 받은 후에도 speaking up이 보편적으로 일어나지 않았다 (O’Donovan & McAuliffe, 2020; Omura et al., 2017; Pattni et al., 2019; Peadon et al., 2020). 추가적인 비판은 참가자들에게 익숙하지 않은 시나리오와 맥락, 시간 압축(time compression), 종단 연구(longitudinal study)의 부족 등 시뮬레이션 방법 자체에 초점을 맞추었다 (Omura et al., 2017). 시뮬레이션 중 사용되는 평가의 신뢰성(reliability)은 부적절한 측정(inadequate measures)과 불일치한 관찰자/평정자 훈련(observer/rater training)으로 인해 제한적인 것으로 간주되었다. 확인된 유일한 무작위대조시험(Randomized Control Trials) 은 시뮬레이션 연구였지만, 전반적인 질은 낮았다 (Omura et al., 2017).

시뮬레이션의 개선 방향 (Improvement to simulation) 

이러한 한계에도 불구하고, 시뮬레이션은 여전히 유리하고(advantageous), 중요하며, 계속 사용되어야 한다고 여겨진다.

 

  • Omura et al. (2017)에 따르면, “…관찰자 기반 결과 측정(observer-based outcome measures)과 시뮬레이션은 반응(reaction), 지식(knowledge), 태도(attitudes)뿐만 아니라 행동 변화(behaviour change)도 평가할 수 있다는 점이 분명하다.”

 

리뷰 전반에서 제안된 시뮬레이션 개선 방향은 여섯 가지이다 (Fagan et al., 2016; Kim et al., 2020; Morrow et al., 2016; Noort et al., 2019; O’Donovan & McAuliffe, 2020; Okuyama et al., 2014; Omura et al., 2017; Pattni et al., 2019; Peadon et al., 2020).

 

  • (1) 시뮬레이션에서 행동 결과(behavioural outcomes) 를 더 자주 측정하고, 행동 평가 방법을 더 잘 개발할 것.
  • (2) 실제 관찰(real-world observations)에서부터 거꾸로 설계하여 실제 시나리오, 텍스트, 언어, 대화를 반영함으로써 더 높은 생태적 대응성(ecological correspondence) 을 가진 시뮬레이션을 설계할 것.
  • (3) Speaking up의 인과 기제(causative mechanisms)와 장벽(barriers)을 이해하기 위해 실험적 방법(experimental methods)과 사전검사(pre-test measures)를 사용할 것.
  • (4) 특히 deception이 사용될 경우, 학습을 촉진하고 신뢰를 유지하기 위해 좋은 디브리핑(debriefing) 전략을 사용할 것.
  • (5) 시뮬레이션에서의 교육과 훈련 효과를 실제 실무(practice outcomes)와 연결하기 위해 종단 연구를 사용할 것.
  • (6) 시뮬레이션 훈련에 멀티미디어(multi-media)확장현실(extended reality) 의 활용 가능성을 탐색할 것.

 


검토된 리뷰들이 speaking up 개선을 위해 제시한 권고
(Recommendations in the reviewed reviews to improve speaking up)
 

다섯 가지 공통 권고가 도출되었다.

 

  • (1) 조직적 지원과 문화 변화(organizational support and culture change),
  • (2) speaking up 연구의 개선(improving the research on speaking up),
  • (3) 인과 기제에 대한 더 나은 이해(developing a better understanding of causative mechanisms),
  • (4) 교육과 훈련의 개선(improving education and training),
  • (5) 외부 지식의 통합(incorporating outside knowledge) 이다.

 

조직적 지원과 문화 변화 (Organizational support and culture change) 

조직적 지원과 문화 변화는 모든 수준의 보건의료전문직 종사자들 사이에서 심리적 안전(psychological safety), 시민성(civility), 파트너십(partnership) 을 통해 정의로운 문화(just cultures) 를 형성할 수 있다.

 

  • 하향식(top-down)의 조직 및 문화 변화는 대부분 수정 가능한 institutional barriers and enablers 에 초점을 맞추어야 한다 (Bickhoff et al., 2017; Fagan et al., 2016; Kim et al., 2020; Morrow et al., 2016; Noort et al., 2019; Omura et al., 2017; Pattni et al., 2019).
  • Speaking up은 경영진과 행정을 포함한 모든 직원의 지지를 받아야 하며, 조직은 위계와 전문직 간 긴장(professional tension)을 포함한 기존의 부정적 직장 문화(adverse workplace cultures)를 해결해야 한다.
  • 리더십 위치에 있는 사람들과 전문직 및 팀의 선임 구성원들은 speaking-up 행동을 모델링(modeling), 멘토링(mentoring), 격려(encouraging), 수용(accepting) 함으로써 변화를 만들어낼 수 있다.
  • 이러한 기술과 행동에 대한 교육, 훈련, 격려, 지원은 리더십 위치에 있는 사람들에게 제공되어야 하며, 이러한 행동을 의무화(mandating) 하는 것도 필요할 수 있다. 또한 조직 변화를 실행하려 할 때는, 적용되는 지역의 국가 문화(national culture), 사회경제적 맥락(socio-economic contexts), 정치적 맥락(political contexts) 을 고려해야 한다.

 

Speaking up 연구의 개선 (Improve research on speaking up) 

Speaking up이 어떻게 일어나는지를 더 잘 이해하고 교육과 훈련을 개선하기 위해서는 더 엄밀한 연구가 필요하다 (Bickhoff et al., 2017; Jones et al., 2021; Nacioglu, 2016; Omura et al., 2017; Rutherford et al., 2012). 일곱 가지 개선점이 확인되었다.

 

  • (1) 교육과 훈련 중의 평가를 포함하여 더 객관적인 측정(objective measures) 과 평가를 사용함으로써 speaking up의 측정 방식을 개선할 것.
  • (2) 사람들이 실제로 어떻게 speaking up을 하는지, 그 결과는 무엇인지, speaking up이 어떻게 받아들여지는지를 이해하기 위해 생태적 관찰(ecological observation) 이 필요하다.
  • (3) 병원 밖 맥락(outside of hospitals), 의학과 간호를 넘어선 다른 전문직, 서로 다른 직장 문화 및 국가 문화, 문화적으로 다양한 팀에서의 연구가 필요하다. 연구는 지역적 실행(local implementation)을 넘어서, 초국가적(transnational) 및 국가적 정책의 효과를 이해해야 한다.
  • (4) Speaking up의 인과 기제, 촉진요인, 억제요인을 검증하기 위해 실험적 방법과 시뮬레이션을 사용할 것.
  • (5) 훈련을 위해 더 상황적으로 현실적인 시뮬레이션(situationally realistic simulation)을 사용할 것.
  • (6) 여러 맥락에서 종단 연구(longitudinal research)를 수행하여 실행 격차(implementation gap)를 연결하고, 교육과 훈련의 장기 효과와 개인 및 조직의 변화 과정을 이해할 것.
  • (7) 이해관계자(stakeholder)의 연구 참여를 확대하고, speaking up 연구를 우선순위화하며, 더 많은 자금과 자원을 투입할 것.

 

인과 기제에 대한 더 나은 이해 (Developing a better understanding of causative mechanisms) 

인과 기제에 대한 더 나은 이해는 연구 개선과 동시에 이루어져야 한다 (Jones et al., 2021; Kim et al., 2020; Milligan et al., 2017; Noort et al., 2019; Omura et al., 2017; Peadon et al., 2020).

 

  • 어떤 선행요인들은 이미 충분한 연구가 축적되어 있는데, 예를 들면 업무량(workload), speaking up에 대한 수용성(receptiveness), speaking up의 지각된 가치(perceived value), 환자 위해(patient harm)를 피하고자 하는 욕구, 그리고 intimidation, bullying, harassment와 같은 부정적 결과가 speaking up을 억제하는 효과 등이 있다.
  • 그러나 사람들이 왜 speaking up을 하거나 하지 않는지에 이르는 사회적·심리적 과정(social and psychological processes), 개인차(individual differences)와 성격(personality), 직장 맥락(workplace contexts), 전문직 맥락(professional contexts), 문화적 맥락(cultural contexts)의 효과에 대해서는 더 많은 지식이 필요하다. 또한 다양한 훈련 방식의 효과성과 조직 변화 시도가 speaking up에 미치는 영향을 더 잘 이해할 필요가 있다.

 

Speaking up은 일반적으로 사회적으로 구성된 현상(socially constructed phenomenon) 으로 간주되어 왔고, speaking up의 부재에 대해서는 가정(assumptions), 추론(inferences), 의미 귀속(attributions of meaning)이 이루어진다. 실제로 일어나지 않은 일을 평가하고, 부재(absence)를 추론적으로 해석하는 것은, 동일한 결과에 대해 서로 반대되거나 충돌하는 해석을 만들어낼 수 있다. Speaking up을 본질적으로 의미를 지니며 사회적으로 내재된 현상(inherently meaningful and socially embedded phenomenon)으로 보고, 동시에 경험적 접근(empirical approach)을 사용하는 것이 speaking up에 대한 보다 구체적인 이해를 가능하게 할 수 있다 (Noort et al., 2019).

교육과 훈련의 개선 (Improvement to education and training) 

모든 의료 수준에서 speaking up에 대한 더 많고 더 나은 교육과 훈련이 필요하다 (Fagan et al., 2016; Kim et al., 2020; Morrow et al., 2016; Noort et al., 2019; O’Donovan & McAuliffe, 2020; Okuyama et al., 2014; Omura et al., 2017; Pattni et al., 2019). 학습자들은 더 많은 교육과 훈련을 통해 speaking up에 대한 지원을 원하고 있다. 교육과 훈련은 학부 수준(undergraduate level) 에서 시작되어야 하며, 대학원 수련(post-graduate training)계속교육(continuing education) 에서도 지속되어야 한다. Speaking up에 대한 교육과 훈련은 효과성이 불확실하며, 맞춤형(bespoke) 이고 이질적인(heterogenous) 중재의 성격이 일관된 훈련 효과 부족에 기여하는 것으로 보인다. Speaking up을 위한 도구와 기법에 대한 표준화된 훈련(standardized training)표준화된 평가 척도(standardized assessment measures) 는 개인의 경력 전반과 교육·훈련 자체에 대한 지속적 개선 과정을 만들 수 있다. 교육과 훈련은 주로 CRM과 같은 높은 효능(high efficacy) 을 보이는 방법에 초점을 두어야 하며, 대면(face-to-face) 방식 및 기타 전달 방식(delivery methods)을 활용해야 한다. 시뮬레이션을 통한 경험 기반 시나리오 학습(experiential scenario-based learning) 과 각 전문직의 특정 맥락과 작업환경에 맞춘 맞춤형 중재는 교육과 훈련을 개선할 수 있다. 교육과 훈련의 설계 단계에서는 학습자부터 고위 경영진까지 모두를 포함하는 다층적 조직 입력(multilevel organizational input)이 필요하다. Speaking up을 위한 교육과 중재를 개선하는 일은 복잡하며, 연구, 전략 기획(strategic planning), 조직 변화를 통한 하향식 노력과 맞물려야 한다. Education과 intervention이 개선되면, 새로운 세대에게 더 나은 훈련을 제공할 수 있다. Speaking up을 장려하고 수용하며, 그 행동을 모델링하고, 새로운 학생을 멘토링하는 새로운 세대의 전문가를 길러냄으로써 광범위한 문화 변화(widespread culture change)가 일어날 수 있다. 또한 다른 방식으로 사고하고 실천하는 새로운 전문가들이 의료체계에 진입함에 따라, 기존 시스템과 실무자를 개선하기 위한 조직 차원의 상향식 변화(bottom-up change)가 하향식 조직 변화와 상응하게 일어나게 될 것이다.

외부 지식의 통합 (Incorporating outside knowledge) 

의료 외부, 특히 의학 외부의 분야에서 온 지식은, 교육과 훈련을 개선하고 speaking up에 대한 이해를 위한 연구를 가속화함으로써, speaking up 문제 해결에 도움이 될 수 있다 (Jones et al., 2021; Nacioglu, 2016; Noort et al., 2019; Peadon et al., 2020).

 

  • 가장 가치 있는 지식 영역으로 확인된 두 분야는 심리학(psychology)비즈니스/조직행동 연구(business, including organizational behavioural research) 이다.
  • 복잡성 이론(complexity theories)시스템 이론(systems theories) 역시 유용할 수 있다. 의료 외부에는 관련 연구가 매우 많지만, 일반적으로 충분히 통합되거나 활용되지 않고 있다.

 


Speaking up에 관한 기존 지식의 종합 (Synthesis of the existing knowledge on speaking up) 

 

  • Speaking up은 위계(hierarchy), 불이익에 대한 두려움(fear of repercussions), 조직적 지원의 부족(lack of organizational support) 과 같이 깊이 뿌리내린 장벽들 때문에 비효과적인 것으로 인식된다.
  • 리더십과 상급 동료의 지원, 환자에 대한 우려, 개인적 특성은 speaking up을 지지한다. Speaking up의 인과 기제(causative mechanisms), 촉진요인(facilitators), 억제요인(inhibitors)의 영향은 복잡한 상호작용 속에서 존재한다. 이들 인과 기제의 실제 효과는 잘 이해되어 있지 않으며, 그 효과를 단정적으로 진술할 수 없다.
  • Speaking up을 더 잘 이해하기 위해서는 더 나은 평가, 실험, 종단 연구, 생태적 관찰을 포함한 연구 방법의 개선이 필요하다.
  • Speaking up을 촉진하기 위해서는 하향식 조직 변화(top-down organizational change)상향식 교육 및 훈련(bottom-up education and training) 이 필수적이다.
  • 현재 교육과 훈련은 충분히 자주 제공되지 않으며, 일관되거나 충분히 효과적이지도 않다. 따라서 개선이 필수적이다.
  • 시뮬레이션은 교육, 훈련, 연구에서 중요한 역할을 할 수 있지만, 역시 개선이 필요하다.
  • 현재 speaking up과 관련된 지식과 연구는 아직 출현적(emergent) 상태에 있으며, 수많은 한계를 보완하고, 질문을 명확히 하고, 개선 경로를 식별할 수 있는 기회가 많다.

 


논의 (Discussion) 

의료에서의 speaking up에 관한 현재 지식 상태를 통합적으로 이해하기 위해 14편의 리뷰를 종합하였다. Speaking up을 개선하는 것은 전 세계적으로 중요한 의료 이슈이다. 국가와 의료 시스템을 막론하고, speaking up의 어려움이 문제라는 공통된 이해는 존재한다. 그러나 이 문제를 효과적으로 해결하는 방법에 대한 지식은 제한적이다.


최신 동향 검토에 근거한 권고
(Recommendations based on the state-of-the-art review)
 

일관된 언어 사용 (Consistent use of language) 

Speaking up을 연구하기 위해서는 일관된 언어(consistent language) 가 필요하다. Okuyama et al (2014)은 모든 리뷰에 반영되어 있으며, “hospital environment”를 제거하면 적용 범위를 넓힐 수 있는 간결하고 구체적인 정의를 제시한다. 즉, “Speaking up은 의료팀 내 타인의 위험하거나 결함 있는 행위를 인식하거나 알게 되었을 때, 환자 안전과 진료의 질을 위해 의료전문직 종사자들이 우려를 제기하는 것” 으로 정의될 수 있다. ‘Safety voice’보다 ‘speaking up’이 더 유리한데, speaking up은 행동 가능하고(actionable) 정밀한 반면, safety voice는 수동적(passive)이고 정의상 “분절되어 있고 아직 초기 단계(disintegrated and nascent)” 이기 때문이다 (Noort et al., 2019). Morrison의 틀 내에서 safety voice는 향후 이해를 돕는 데 기여할 수 있지만, 현재 지식은 아직 출현 단계이므로 보다 단순한 개념화(simple conceptualization)가 권장된다.

 

Speaking up을 논의하고 연구할 때는 명확하고 객관적인 언어(clear, objective language) 를 사용해야 한다. “incivility of elites”, “unwholesome submissiveness” 와 같은 용어들은 모호하고 비난적(accusatory)이다. 가치가 실린(value-laden) 용어를 통해 명시적으로 비난(blame), 죄책(guilt), 보복(reprisal)의 필요성을 부여하는 것은 개방적 의사소통과 무비난 문화(blame-free cultures)라는 환자안전의 근본 원칙을 훼손한다 (Helmreich et al., 1999; Kohn et al., 1999). 최적의 환자 진료를 위해 speaking up을 장려하고 지원하는 동료적 팀(collegial teams)과 조직을 만드는 일은, 개인이나 집단을 권력투쟁(power struggle)이나 자연스러운 갈등 상태(natural state of conflict)로 보는 관점에서 나오지 않는다.

연구 방향 (Research directions) 

Speaking up을 이해하기 위한 근본적 질문은 다음과 같이 설정될 수 있다. 어떤 변수들이 speaking up의 분산(variance)을 가장 많이 설명하며, 이 변수들 간의 공분산(covariance)은 무엇인가? 여기서 변수들은 speaking up이라는 단일 행동 결과(single behavioral outcome)를 억제하거나 촉진하는 인과 기제 혹은 선행요인으로 정의될 수 있다. 이러한 단순화된 접근은 speaking up을 구성하는 변수들의 복잡한 상호작용에 대한 인과적 탐구(causal investigation)를 가능하게 한다. 주요 촉진 변수와 억제 변수에 대한 지식이 축적될수록, 데이터 수집은 보다 효율적으로 초점을 맞출 수 있고, 이를 통해 구조방정식모형(Structural Equation Modelling, SEM) 을 사용한 경험적 기반의 speaking up 모형(empirically based model) 을 개발할 수 있다 (Kenny, 2019). SEM을 활용한 초기 시도에서는 engagement에 의해 부분 매개되는, “voice”를 촉진하는 지지(support)통제(control) 의 이요인 모델(bifactorial model)이 확인되었다 (Voogt et al., 2019). 이러한 단순화된 개념화와 경험적으로 도출된 모형은 연구, 행동 관찰, 평가를 지원할 것이다.

 

연구와 교육에서, 특히 사회심리학(social psychology) 의 지식, 즉 복종(compliance), 권위에 대한 복종(obedience to authority), 동조(conformity) 에 대한 방대한 연구(Cialdini & Griskevicius, 2010; Cialdini & Trost, 1998)를 통합하는 것은 이 분야를 빠르게 발전시킬 수 있다. 심리학은 대인관계적 진료 측면을 포함하여 의료 제공의 여러 영역과 교차하는 과학이다. 맥락은 중요하지만, 인간의 행동과 인지의 원리는 대체로 보편적이다 (Ariely, 2008; Olsson-Collentine et al., 2020). 따라서 이미 알려진 것을 다시 발견할 필요는 없다 (Avorn, 2018; Croskerry et al., 2017).

 

연구의 양(quantity)질(quality) 을 모두 향상시키는 것이, 연구로부터 도출되는 추론(inferences)을 개선하기 위해 필요하다 (Vazire et al., 2022). 이 두 측면의 지속적인 개선은 speaking up을 촉진하는 교육과 방법을 만들고, 신뢰도와 타당도가 좋은 객관적 관찰 평가(objective observational assessments)에 의해 안내되는 장기 효과(long-lasting effects)를 지닌 효과적이고 표준화된 중재를 개발하는 데 도움이 될 수 있다.

시뮬레이션의 강화 (Enhancement of simulation) 

연구와 교육을 위한 시뮬레이션에 대한 인식 전환이 필요하다. 시뮬레이션의 한계는 그 매체(modality) 자체에 내포되어 있다. 따라서 시뮬레이션은 제한점으로 보기보다, 높은 생태적/외적 타당도(ecological/external validity)를 지닌 시험장(testing ground) 으로 보아야 하며, speaking up의 훈련과 인과 기제를 실험적으로 검토할 수 있는 풍부한 가능성을 제공한다 (Friedman et al., 2015). 임상 연구와 관찰(clinical research and observation)과 함께, 시뮬레이션은 이론 개발(theory development), 실험(experimentation), 교육(education), 평가(assessment)에 큰 이점을 제공한다. 예를 들어 speaking up의 예측 모형(predictive models)은 실제 임상 및 조직 수준으로 넘어가기 전에 시뮬레이션에서 평가될 수 있다. 임상 환경으로 이행하는 과정에서, 시뮬레이션은 speaking up 기술을 연습하는 중간 단계(intermediary)가 될 수 있다. 또한 실행과학(implementation science) 을 통합하면, 시뮬레이션에서 얻은 학습이 임상 현장으로 확산되고, 새로운 지식과 실천이 임상의, 교육자, 행정가에 의해 수용되도록 도울 수 있다.


본 리뷰의 한계 (Limitations of the present review)

  • (1) 관련 문헌 일부를 놓쳤을 가능성이 높다. 실제로 최근의 관련 논문들 가운데 일부는 어떤 리뷰에도 포함되지 않았다 (Calhoun et al., 2014; Daly Guris et al., 2019; Fisher & Kiernan, 2019; Kaba et al., 2016; Kuo et al., 2020; Oner et al., 2018; Shanks et al., 2020).
  • (2) 본 리뷰는 사용된 리뷰들의 검색, 분석, 보고에 의존하고 있다. 또한 본 리뷰에서는 리뷰들의 방법론적 질(methodological quality)에 대한 평가는 수행하지 않았다. 현재 단계에서는 방법론적 리뷰(methodological review)가 반드시 적절한 것은 아니다. 검색 결과 메타분석(meta-analyses)은 확인되지 않았는데, 이는 이 분야가 아직 발달 단계(developmental stage)에 있음을 시사한다. 현재 시점에서는 수많은 효과크기(effect sizes)가 많은 변수들에 걸쳐 분산되어 있고 리뷰 유형도 다양하기 때문에 체계적 평가(systematic evaluation)는 가능하지 않다 (Noort et al., 2019).
  • (3) 본 리뷰는 환자 진료(patient care)의 맥락에서의 speaking up에 초점을 맞추었다. 그러나 교육적 및 전문직적 다른 맥락들에서도, 개인의 존엄(individual dignity) 을 지지하기 위해 speaking up이 필요하며, 이러한 맥락 또한 고려되어야 한다 (Gianakos et al., 2022).

결론 (Conclusion)

지속적인 환자 위해(patient harm) 문제와 환자안전을 발전시키고 지속적으로 개선해야 할 필요성을 고려할 때, 이 사명을 앞으로 나아가게 하기 위한 집중적 노력(concerted effort) 이 필요하다 (Cohen & Patel, 2020). 이 행동은 겉보기에 단순해 보이지만, speaking up은 아직 잘 이해되지 않았고, 관련 연구는 초기 단계이며, 교육과 훈련의 개선이 필요하고, 외부의 시각도 요구된다. 초기 단계의 분야(incipient field)에서 리뷰 논문이 다수 존재한다는 사실은, 중복을 줄이고 현재 지식의 포괄적 종합을 제공하기 위한 하나의 단일하고 포괄적인 문서(single comprehensive document) 를 만들 필요성을 뒷받침한다. 본 종합은 통합된 이해를 촉진하고, 기존 지식을 명확히 하며, 향후 연구를 위한 공통의 출발점(common starting point)으로 기능하고자 한다.

 

 

 

 

 

 

Med Educ. 2026 Jan 23. doi: 10.1111/medu.70180. Online ahead of print.

Mirrors and prisms: How interprofessional interactions influence medical students' professional identity formation 

 

 

🪞 "가위를 건네받는 것"이 의대생의 정체성을 바꾼다고? — 전문직 간 상호작용과 의사 정체성 형성 

Miller KA, Sawatsky AP, Barker AM, et al. Mirrors and prisms: How interprofessional interactions influence medical students' professional identity formation. Med Educ. 2026;1‐9. doi:10.1111/medu.70180


의과대학생이 '의사가 된다는 것'의 의미를 배워가는 과정, 즉 전문직 정체성 형성(professional identity formation, PIF)에 대한 연구는 그동안 주로 '의사'에게 초점이 맞춰져 있었습니다. 지도전문의(attending physician)나 전공의(resident)가 학생의 롤모델이 되고, 의사 공동체 안에서 소속감을 느끼게 되는 과정 말이죠.

 

그런데 잠깐, 임상실습(clinical clerkship) 현장에서 의대생이 매일 마주치는 사람은 의사만이 아닙니다. 간호사, 약사, 물리치료사, 수술기사, 사회복지사 등 수많은 타 보건전문직 종사자(other health professionals, OHPs)와 끊임없이 상호작용하고 있죠. 그렇다면 이 사람들과의 만남은 의대생이 '나는 어떤 의사가 될 것인가'를 고민하는 데 어떤 영향을 미칠까요?

 

Medical Education에 2026년 게재된 Miller 등의 이 논문은 바로 이 질문에 답합니다. 그리고 그 답이 꽤 인상적입니다.


📌 연구 개요: 어떻게 했나?

하버드 의과대학(Harvard Medical School)에서 첫 해 임상실습을 수행 중인 의대생 20명을 대상으로, 구성주의 근거이론(constructivist grounded theory, CGT) 방법론을 활용한 질적 연구(qualitative study)입니다.

 

특이한 점은 리치 픽처(rich pictures)라는 방법을 활용했다는 건데요. 면담 시작 전에 학생들에게 OHP와의 상호작용 장면 두 가지를 직접 그림으로 그리게 한 뒤, 그 그림을 출발점으로 60~75분간 심층 면담(semi-structured interview)을 진행했습니다. 말로 표현하기 어려운 감정이나 맥락까지 끌어낼 수 있는 영리한 방법이죠.

 

연구팀은 의사 4명, PA(physician assistant) 1명, 비임상 배경의 보건전문직교육(health professions education) 연구자 2명으로 구성되어 다양한 관점에서 데이터를 해석했습니다.


🪞 거울(Mirror): "지금의 나는 기여할 준비가 되었는가?" 

연구의 첫 번째 핵심 발견은, OHP와의 상호작용이 학생 자신의 현재 정체성(present identity)을 비추는 '거울' 역할을 한다는 것입니다.

임상실습에 나온 의대생들은 환자 진료에 기여하고 싶어 합니다. 그런데 의사가 하는 일에 직접 끼어들기는 쉽지 않습니다. 참여자 10은 이렇게 말했습니다.

"[의사가] 하는 일에 끼어들 기회가 많지 않아요." ("not as many opportunities for you to slide into what [the physician] does")

반면, OHP 곁에서 하는 일 — 봉합사 자르기, 소변 카테터 삽입, 환자 이송 같은 업무 — 은 학생의 현재 역량 수준에서 충분히 해볼 수 있는 것들이었습니다. 그래서 학생들은 OHP가 자신을 어떻게 대하는지에 매우 민감하게 반응했는데요, 크게 두 가지 패턴이 나타났습니다.

✅ "초대(inviting-in)" — 너도 해볼래?

OHP가 학생을 적극적으로 업무에 참여시키는 순간입니다. 참여자 12는 수술 중 수술기사가 가위를 건네준 경험을 이렇게 회고했습니다.

"수술기사가 가위를 건네주는 건, 마치 '너는 사실상 팀의 일원이고, 여기서 기여하고 있고, 네가 여기 있다는 걸 인정한다'는 뜻이에요. (…) 가위를 믿고 맡긴다는 건 아주 사소한 일이지만, 자기가 어디에 속하는지 알아가려 할 때 정말 큰 의미가 있다고 생각해요."
("The scrub tech can [pass] the scissors and be like, you're on the team effectively and you're contributing here, and I recognize that you're here … I trust you with the scissors is such a little thing, but it just I think means a lot when you're trying to figure out where you fit in.")

이런 순간은 학생에게 "나는 신뢰받고 있다, 나는 유능하다, 나는 이 팀에 속해 있다"는 강력한 메시지가 됩니다.

❌ "개입(stepping-in)" — 내가 할게, 비켜봐

반대로, OHP가 학생의 업무 수행을 중단시키거나 대신하는 순간도 있었습니다. 이런 경험은 자기 의심(self-doubt)을 유발했죠. 참여자 6은 폴리 카테터 삽입을 시도하다 간호사에게 중단당한 후 이렇게 느꼈습니다.

"세상에, 구멍에 관도 하나 못 넣다니, 내가 여기서 뭘 하고 있는 거지?" ("Oh my God, I can't put a tube in a hole, what am I doing here?")

 

심지어 참여자 15는 간호사가 학생이라는 이유만으로 기회를 주지 않는다고 느껴서, 명찰을 뒤집거나 코트 지퍼로 가리는 행동까지 했다고 합니다.

🔑 왜 OHP의 반응이 의사보다 더 '진짜'처럼 느껴질까?

흥미로운 점은, 학생들이 OHP의 반응을 지도의사의 반응보다 더 진정성 있는 피드백으로 받아들였다는 것입니다. 왜냐하면 의사는 학생을 가르칠 '의무'가 있지만, OHP에게는 그런 의무가 없으니까요. OHP가 자발적으로 학생을 참여시켰다면 그건 진짜로 '너는 할 수 있어'라는 인정이라는 거죠. 참여자 10의 표현이 이를 잘 보여줍니다.

"의과대학에서 가장 보람 있는 경험 중 일부예요. 왜냐하면 A) 실제로 누군가를 돕는 데 관여하고 있다는 감각을 주고, 그리고 B) 다른 사람들이 그것을 인정해주기 때문이에요."
("Some of the most rewarding experiences in med school for me, because it gives you a sense of I am actually A) involved in helping someone … and then B) other people can recognize that.")


🔺 프리즘(Prism): "의사란 무엇인가"에 대한 시야가 바뀌다 

연구의 두 번째 핵심 발견은, OHP와의 상호작용이 학생의 미래 정체성(future identity)을 재구성하는 '프리즘' 역할을 한다는 것입니다.

 

학생들은 임상실습에 들어갈 때 대체로 두 가지를 의사의 핵심 속성으로 가지고 들어옵니다: 전문적 지식(expert knowledge)독립성(independence). "나는 다른 사람보다 더 많이 알게 될 것이다", "혼자서 다 할 수 있어야 한다"는 생각이죠. 

💡 전문성의 분산 — 빛이 갈라지듯 

그런데 OHP와 함께 일하면서, 학생들은 임상 전문성(clinical expertise)이 어느 한 직종에 독점된 게 아니라 여러 전문직에 걸쳐 분산된 스펙트럼이라는 걸 깨닫기 시작합니다.

"다른 의료전문직에 대해 더 많이 배울수록, 의사가 그렇게 특별하지 않다는 걸, 많은 것을 알고 환자 진료를 실질적으로 발전시킬 수 있는 사람들이 많다는 걸 더 많이 알게 돼요."
("The more and more I learn about other healthcare professions, the more I learn that doctors are not that special, that there are a lot of people who know a lot and can really advance patient care.") — 참여자 19

 

프리즘이 백색광을 여러 색으로 분산시키듯, OHP와의 상호작용은 '의사 = 유일한 전문가'라는 단색적 관점을 '각 직종이 서로 다른 전문성 영역(domain of expertise)을 가진 다채로운 팀'이라는 관점으로 전환시켰습니다. 

💡 독립성에서 상호의존으로 — 빛이 굴절되듯 

더 나아가, 학생들은 수련을 마친 선배 의사들도 여전히 다른 전문직에 의존하고 있다는 사실을 목격합니다.

"수련을 마친 지 10, 15년이 된 주치의들도 여전히 서로 상의하고, 여전히 간호사들에게 치료 계획에 대한 관점과 의견을 묻더라고요."
("attending [physicians] that are 10, 15 years out of training, they're still conferring with one another, they're still asking the nurses their perspectives and their thoughts about treatment plans") — 참여자 8

 

이 경험은 '의사 = 독립적 존재'라는 전제를 흔들었습니다. 하지만 학생들이 곧바로 상호의존(interdependence)을 받아들인 것은 아닙니다. 참여자 8은 이 내적 갈등을 솔직하게 표현했습니다.

"확실히 독립적으로 행동해야 할 시점이 올 거예요. 하지만 글쎄요, 완전히 독립적인 시점이 올지는 의문이에요."
("I'll definitely come to a point where I'll have to act independently, but I don't know, I doubt there'll ever be a point in which I'm fully independent.")


🧩 이론적 해석: 역할 정체성과 사회 정체성 

연구팀은 두 가지 이론적 렌즈로 이 현상을 설명합니다.

 

  • 첫째, 정체성 이론(identity theory)의 역할 정체성(role identity) 개념. 학생들은 임상 현장에서 '학생'에서 '기여자(contributor)'라는 역할 정체성으로 전환하고 싶어 합니다. OHP가 학생을 업무에 초대하거나 배제하는 행위는 이 역할 정체성의 수행이 성공적인지를 판단하는 핵심 단서가 됩니다. 문제는, 학생들이 OHP의 행동을 종종 과잉해석한다는 것입니다 — OHP가 개입한 것이 학생의 능력 부족 때문이 아니라 다른 이유였을 수도 있는데 말이죠.
  • 둘째, 사회 정체성 이론(social identity theory). 학생들은 자기 집단(의사)을 타 집단(OHP)과 비교하면서 의사의 정체성을 구성합니다. 처음에는 '의사가 가장 전문적이고 독립적'이라는 전제를 가지고 있지만, OHP와의 실제 상호작용을 통해 이 사회적 정체성이 '여러 전문가 중 하나, 전문성 영역으로 구별되는 존재'로 수정됩니다.

 


📣 실천적 함의: 그래서 우리는 뭘 해야 할까? 

이 연구는 몇 가지 중요한 교육적 시사점을 제시합니다.

 

  • 1) OHP와의 상호작용을 '성찰(reflection)'의 대상으로 만들자. 학생들이 OHP의 행동을 과잉해석하는 경향이 있으므로, 지도의사가 이런 순간을 함께 돌아보며 맥락화된 해석을 도울 수 있습니다. 더 나아가, OHP를 직접 성찰 세션에 초대하여 학생과 함께 상호작용의 의미를 풀어가는 구조를 만들 수도 있겠죠.
  • 2) OHP를 '직장 교육자(workplace educator)'로 공식 인정하자. 현재 대부분의 의학교육 시스템에서 OHP에게는 의대생 교육에 대한 명시적 역할이 부여되어 있지 않습니다. 그런데 이 연구가 보여주듯이, OHP는 이미 학생의 정체성 형성에 강력한 영향을 미치고 있습니다. 이들의 역할을 공식화하고 임상 피드백 시스템(clinical feedback system)에 포함시키는 것이 필요합니다.
  • 3) '전문직 간 정체성'을 별도로 떼어놓지 말자. 기존 문헌에서는 '전문직 정체성(professional identity)'과 '전문직 간 정체성(interprofessional identity)'을 별개의 것으로 구분하는 경향이 있었습니다. 그러나 이 연구의 참여자들은 협력(collaboration)과 상호의존(interdependence)을 의사 정체성 자체의 핵심 속성으로 인식하기 시작했습니다. 연구팀은 이렇게 제안합니다: 별도의 전문직 간 정체성을 만들 것이 아니라, 협력과 상호의존의 중심성을 부각시키는 포용적 전문직 정체성(inclusive professional identity)을 개발하는 데 초점을 맞추자.

 


📝 한 줄 요약

의대생의 정체성은 의사만 보고 만들어지는 게 아닙니다. 간호사가 건네는 가위 한 자루, 약사가 물어보는 질문 하나가 "나는 이 팀에 속해 있는가?", "의사란 정말 혼자서 다 하는 사람인가?"라는 근본적 질문의 답을 바꿔놓을 수 있습니다. 거울처럼 현재의 나를 비추고, 프리즘처럼 미래의 의사상을 새롭게 굴절시키는 이 전문직 간 상호작용의 힘을, 우리 교육과정에서 더 적극적으로 활용할 필요가 있지 않을까요.

 


1 | 서론 (INTRODUCTION)  

전문직 정체성 형성(professional identity formation, PIF) 은 의과대학생이 의사처럼 사고하고(think), 행동하며(act), 느끼는(feel) 법을 어떻게 배우는지를 바라보는 하나의 렌즈(lens)이다.1,2 이 과정을 이해하고 지원하려는 노력은 의학교육(medical education)의 공인된 핵심 관심사가 되었으며, 그 목적은 미래의 의사들이 의사 전문직(physician profession)의 가치(values)와 규범(norms)을 탐색하도록 하는 데 있다.3–6 PIF는 복잡하고(complex), 구성적이며(constructive), 때로는 갈등적인(conflicted) 과정으로, 학생들의 이전 경험(prior experiences), 훈련 과정에서 이루어지는 의학 전문직으로의 지속적인 사회화(ongoing socialization), 그리고 전문직 기대(professional expectations)가 제한적이거나 해롭다고 인식될 때 이에 저항하는 도전이 서로 협상되는 지점을 나타낸다.5,7–10

 

사회적 상호작용(social interactions)은 정체성 형성(identity formation)의 핵심이며, 임상 현장(clinical workplaces)은 의과대학생에게 환자(patients), 의사(physicians), 그리고 다른 보건의료전문직(other health professionals, OHPs) 과 상호작용할 수 있는 다양한 기회를 제공한다.4,6,11–14 지금까지 의과대학생의 임상학습 경험을 통한 PIF를 다룬 연구는 일반적으로 의사 중심적 관점(physician-centric vantage point) 을 취해 왔으며, 지도전문의(supervising physicians)가 학생들이 의학 전문직과 관련된 규범(norms)이나 의료 공동체(medical community) 안에서의 소속감(sense of belonging)을 성찰하는 과정에서 어떤 역할모델(models)과 지지자(supporters)가 되는지를 탐색해 왔다.4,7,12,15

 

의사의 역할에 초점을 맞추는 것은 의학 전문직 내부의 PIF를 이해하는 데 유용한 토대를 제공하지만, 정체성 이론(identity theories)은 더 넓은 범위의 사회적 상호작용이 개인의 정체성을 형성하는 데 기여한다고 시사한다.7,16,17 모든 학생은 임상실습(clinical clerkships)의 일상적 업무에 참여하면서 다양한 보건의료전문직과 상호작용한다. 그럼에도 불구하고, 이러한 전문직 간 상호작용(interprofessional interactions) 이 학생들이 의사가 된다는 것이 무엇을 의미하는지에 대한 관점을 형성하는 데 어떻게 기여하는지는 대체로 탐구되지 않았다. 기존 연구는 이러한 상호작용이 학생들에게 지도전문의의 관점과는 종종 다른 시각에서 임상 과제(clinical tasks)에 접근하는 방식에 대한 정보를 제공한다는 점을 보여주었다.18,19 그러나 그러한 정보가 학생들이 의사처럼 사고하고, 행동하며, 느끼는 법을 배우는 데 어느 정도 도움이 되는지는 여전히 불분명하다. 더욱이, PIF는 의사들이 자신을 다른 보건의료전문직과의 관계 속에서 어떻게 바라보는지에 중요한 기여를 하는 요인으로 지목되어 왔으며, 이는 전문직 경계(professional boundaries), 위계(hierarchies), 협업(collaboration)에 영향을 미친다.6,13,20,21 협업(collaboration)에 대한 담론이 점점 확대되는 상황에서, 전문직 간 직장 상호작용(interprofessional workplace interactions) 이 학생들로 하여금 자신의 전문직 규범과 가치—즉, 의사로서뿐 아니라 협력적인 전문직 간 팀(collaborative interprofessional teams)의 구성원으로서—를 어떻게 이해하게 만드는지 밝히는 것은 보건전문직 교육(health professions education) 문헌에서 매우 중요한 공백(critical gap)이다.22–25

 

OHPs와의 상호작용을 통해 의과대학생의 전문직 정체성이 어떻게 형성되는지를 탐구한 기존 연구는 주로 직장학습(workplace learning)과 분리된 의도적 교육 경험(intentional educational experiences)에 초점을 맞추어 왔다.21,26–29 그러나 임상 환경에서 의사와 함께 일하는 경험이 의과대학생이 자신의 미래 전문직을 바라보는 방식에 영향을 준다면,4,7,12,15 임상진료 중 OHPs와의 상호작용 역시 의과대학생이 타인과의 관계 속에서 의사로서의 정체성(identities as physicians) 을 이해해 가는 데 영향을 미칠 것이라고 기대할 수 있다.22–24 본 연구에서는 임상진료 중 OHPs와의 상호작용이 의과대학생이 의사란 무엇인가를 구성해 가는 데 어떻게 기여하는지를 탐색하였다. 이러한 전문직 간 상호작용이 학생들의 PIF에 미치는 영향을 이해하는 것은 미래 의사의 전문직 정체성 개발을 위한 교육과정(curricular efforts)에 통찰(insights)을 제공할 수 있다.


2 | 방법 (METHODS) 

본 연구는 의과대학생이 전문직 간 직장 상호작용(interprofessional workplace interactions)을 통해 무엇을, 그리고 어떻게 배우는지를 탐구하는 더 큰 연구 프로그램(program of research)의 일부이다. 이전 연구에서 우리는 학생들이 OHPs와의 전문직 간 상호작용을 통해 임상 업무(clinical work)에 참여하는 법을 어떻게 배우는지를 기술하였으며, 이러한 직장 상호작용이 의사 중심 지식과 기술(physician-centric knowledge and skills)에 대한 학생들의 역량(competence)을 강화하는 동시에, 다른 전문직의 역할과 책임(roles and responsibilities)에 대해 보다 미묘하고 맥락화된 이해(nuanced and contextualized understanding)를 제공한다는 점을 밝혔다.18 이 연구를 수행하는 동안, 우리는 학생들이 이러한 전문직 간 상호작용을 되돌아보며, 그러한 순간들이 자신이 의료전문직(medical professionals)으로서 새롭게 형성되어 가는 자아감(emerging sense of themselves)에 어떤 영향을 미쳤는지 이야기하는 경우를 자주 발견하였다. 이는 전문직 간 상호작용이 학생들의 전문직 정체성에 어떻게 기여하는지에 대한 질문을 제기하였고, 따라서 우리는 해당 현상을 더 의미 있게 탐구할 수 있도록 그 면담 프로토콜(interview protocol)을 수정하였다. 현재의 연구는 그 자료(data)에 대한 계획된 재분석(planned return)이며, 새롭게 수집한 자료를 추가하여 재초점화된 분석(refocused analyses)을 수행한 것이다(Appendix S1). 이 과정은 PIF 문헌에 나타난 다양한 관점들에 의해 민감화(sensitized)되었다.16,30–34

 

본 연구는 구성주의 근거이론(constructivist grounded theory, CGT) 접근을 사용하여, 전문직 간 상호작용이 의과대학생의 형성 중인 PIF(emerging PIF)에 어떻게 기여하는지를 탐구하였다.35 CGT 방법론(methodology)은 복잡하고 아직 충분히 이해되지 않은 사회적 과정(complex, incompletely understood social processes)에 대한 통찰을 생성한다는 점에서 본 연구질문에 적합하다.35,36

 

  • 이 연구를 수행하기 위해 우리는 관련 경험이 다양한 팀(team)을 구성하였고, 각자의 배경이 연구 관점에 어떻게 영향을 미치는지를 정기적으로 성찰하였다. 연구팀에는 다섯 명의 임상의(clinicians)—네 명의 의사(four physicians; K.A.M., A.P.S., M.V.P., J.S.I.)와 한 명의 physician assistant(A.M.B.)—가 포함되었으며, 이들은 응급의학(emergency medicine), 내과(internal medicine), 소아과(paediatrics), 류마티스학(rheumatology) 등 서로 다른 전문과와 보건의료 환경(healthcare settings)을 대표하였다.
  • 두 명의 연구팀 구성원(A.B.H.d.B.와 R.E.S.)은 임상 배경 없이 보건전문직 교육 연구(health professions education research)를 수행하는 연구자들이다. 모든 연구팀 구성원은 CGT 방법론을 사용한 경험이 있는 교육연구자(educational researchers)이며, PIF와 전문직 간 협업(interprofessional collaboration)과 같은 주제를 포함하여 본 연구질문과 관련된 연구를 수행해 왔다.
  • 면담은 주연구자(primary investigator)인 K.A.M.이 수행하였는데, 그는 의사이자 참여자들이 속한 의과대학의 전문직 간 교육(interprofessional education) 담당 교수(faculty director)였다. 다른 어떤 연구자도 해당 학교의 학부 의학교육(undergraduate medical education)에서 리더십 직위를 갖고 있지 않았다.

 

자료 수집과 분석 전반에 걸쳐, 우리는 팀 회의를 활용하여 각자의 배경과 과거 경험이 해석(interpretations)에 어떻게 영향을 줄 수 있는지를 집단적으로 성찰하였다. 예를 들어, 면담자의 현지 맥락에 대한 지식(local knowledge)은 학생들의 경험에 깊이 관여하는 데 자산(asset)이 되었지만, 면담자와 팀은 동시에 그녀의 교수 역할(faculty role)이 학생들이 공유하는 이야기들에 미치는 영향도 성찰하였다. 이로 인해 우리는 이러한 대화의 기밀성(confidential nature) 을 더욱 강조하게 되었고, 사회적으로 덜 수용될 수 있거나 더 민감한 이야기들에 더욱 귀 기울이고 탐색(probe)하게 되었다. 두 명의 팀 구성원(K.A.M.와 A.M.B.)은 전사본(transcripts)을 중복 코딩(coded in duplicate)하였고, 각자의 전문직 배경이 분석 및 이후 자료 수집에 어떤 영향을 미칠 수 있는지 정기적으로 성찰하였다. 전체 연구팀은 자료에 대한 해석을 논의하고(discuss), 토론하며(debate), 정교화(refine)하기 위해 정기적으로 회합하였다.

2.1 | 맥락(setting context)과 참여자(participants) 

본 연구는 2023년 8월부터 2024년 10월까지 미국 하버드 의과대학(Harvard Medical School, HMS)에서 수행되었다. 우리는 학생들이 임상 업무에 참여하기 위해 종종 다른 전문직의 지원(support)을 필요로 할 것이라는 가정에 따라, 초기 임상 경험(early clinical experiences) 중인 학생들을 목적표집(purposive sampling)하였다. 그렇게 함으로써 그러한 상호작용이 학생들로 하여금 의료전문직으로서의 자신의 성장(growth as medical professionals)을 자각하게 만들 것이라고 예상하였다.37 참여자들은 임상수련 첫해(first year of clinical training)에 해당하는 의과대학생 코호트(cohort)에서 모집되었으며, 이는 의과대학 2학년과 3학년에 걸쳐 있다. HMS에서 이 수련은 내과(medicine), 신경과(neurology), 산부인과(obstetrics and gynaecology), 소아과(paediatrics), 일차진료(primary care), 정신건강의학과(psychiatry), 영상의학과(radiology), 외과(surgery)의 필수 임상실습(mandatory clerkships)으로 구성된다. 이러한 실습 동안 학생들은 다섯 개의 보건의료시스템(health care systems)에 걸쳐 입원(inpatient), 외래(outpatient), 수술(surgical) 보건의료팀에 통합되며, 다양한 임상 환경에서 환자진료에 참여하면서 지도전문의(attending physicians)와 수련의들(physicians-in-training; residents and fellows)의 감독을 받고, 다양한 OHPs와 함께 일한다. 이러한 임상실습 이전에 학생들은 전임상(preclinical) 교육과정 동안 전문직 간 협업(interprofessional collaboration)에 초점을 맞춘 3~4회의 공식적 강의실 기반 세션(formalized classroom-based sessions)을 받으며, 그중 2회는 다른 보건의료전문직 학생들과의 상호작용을 포함한다.

 

HMS에서 필수 임상실습에 참여 중인 학생들은 학생용 리스트서브(student listserv)를 통해 배포된 이메일을 통해 본 연구 참여 요청을 받았다. 월에 따라 다르지만, 이 리스트서브는 일반적으로 약 160명의 학생에게 পৌঁ달한다. 해당 안내문은 참여가 자발적(voluntary)이며, 그들의 평가(assessment)나 성적(grades)에 어떤 영향도 미치지 않는다는 점을 강조하였다. 각 면담 시작 시 구두 동의(verbal informed consent)를 받은 후, 우리는 참여자들의 현재 및 과거 실습(rotations)에 대한 정보를 수집하여, 다양한 임상 맥락(clinical settings)에 걸친 경험들이 자료집합(dataset)에 포함되도록 하였다. 우리는 특히 OHPs와의 자발적이고 진정성 있는 직장 상호작용(spontaneous authentic workplace interactions) 이 학생들에게 미치는 방식에 관심이 있었기 때문에, 학생들이 최소 두 개의 필수 임상실습을 마친 시점에 연구 초청을 하였다. 학생들의 임상 경험 동안 OHPs는 본 연구가 진행 중이라는 사실을 알지 못했다. 본 연구는 HMS 기관생명윤리심의위원회(institutional review board)의 심의를 거쳐 인간대상연구 보호정책(Policy for Protection of Human Research Subjects) 의 면제(exempt) 대상으로 선언되었다.

2.2 | 자료 수집(data collection)과 분석(analysis) 

자료 수집 초기 단계에서 연구팀은 의과대학생이 OHPs와의 상호작용을 통해 무엇을, 어떻게 배우는지를 탐구하는 반구조화 면담 지침(semi-structured interview guide)을 개발하였다.18 학생들에게 OHP는 임상 공간(clinical space)에서 상호작용한 비의사(non-physician) 보건의료전문직 으로 정의되었으며, 면담 전반에 걸쳐 학생들은 간호사(nurses), 전문간호사(nurse practitioners), 약사(pharmacists), 물리치료사(physical therapists), physician assistants, 호흡치료사(respiratory therapists), 사회복지사(social workers), 수술기구 담당자(surgical technicians)와의 상호작용을 설명하였다. 우리는 참여자들이 환자진료에 참여하면서 경험한 최근의 OHPs와의 상호작용을 이끌어내기 위해 리치 픽처 방법론(rich picture methodology) 을 사용하였다. 리치 픽처는 참여자들로 하여금 한 경험을 시각적으로 묘사하게 하여, 무슨 일이 일어났는지, 누가 관여했는지, 그리고 그 경험에 자신이 어떻게 반응했는지를 설명하도록 한다.38–40 우리는 이 기법을 학생들이 이전에는 미처 고려하지 못했던 상호작용의 요소들을 알아차리게 하고, 언어로 표현하기 더 어려운 측면들을 전달하게 하는 수단으로 선택하였다.38,39 면담 시작 시 우리는 참여자들에게 두 가지 전문직 간 상호작용을 그리도록 요청했다. 하나는 학생이 OHP에게 먼저 시작한 상호작용(student initiated with an OHP), 다른 하나는 OHP가 학생에게 먼저 시작한 상호작용(OHP initiated with the student)이었다. 그 그림은 면담자에게 공유되었고, 면담자는 이를 출발점으로 삼아 참여자의 가정(assumptions), 신념(beliefs), 감정(feelings), 반응(reactions)을 탐색하였으며, 이후 다시 그림으로 돌아가 이야기의 추가 측면들을 명확히 했다. 학생들은 그림을 완성하는 데 필요한 만큼 시간을 가졌고, 대부분의 학생은 10분 이내를 필요로 하였다. 면담은 녹음(recorded)되어 분석을 위해 전사(transcribed)되었다. 리치 픽처는 면담 대화를 지원하는 유도 도구(elicitation tool) 로 사용되었으며, 그림 자체를 자료(data)로 간주하지 않았기 때문에 면담 후 그림을 다시 검토하거나 그림 자체에 대한 분석은 수행하지 않았다.38,39

 

우리는 전사본을 Dedoose(Dedoose, Los Angeles, version 9.2.22)를 사용하여 코딩하였다. 초기 7개의 전사본은 연구팀의 두 구성원(K.A.M.와 A.M.B.)이 독립적으로 읽고 코딩하였다. 이 초기 7개 전사본을 코딩하는 동안, 주 코더(primary coders)들은 참여자들이 이러한 상호작용이 의료전문직으로서의 자아감에 어떤 영향을 미쳤는지를 묘사하는 여러 사례를 발견하였으며, 여기에는 소속감(belonging), 정체성(identity), 자기효능감(self-efficacy), 고정관념(stereotyping) 과 관련된 코드들이 포함되었다. 이러한 상호작용이 학생들의 PIF에 미치는 잠재적 영향을 인식한 뒤, 우리는 면담 지침을 확장하여 이러한 경험이 학생들의 의사처럼 사고하고, 행동하며, 느끼는 방식 에 어떤 영향을 주는지,1 그리고 전문직 간 맥락(interprofessional context) 안에서 의사란 무엇인가에 대한 변화하는 감각(evolving sense)에 어떤 영향을 주는지를 탐색하는 질문을 포함시켰다(Appendices S1 and S2). 이러한 면담 프로토콜의 추가 내용은 본 연구를 예상하며 도입된 것이었고, 다른 곳에 보고된 우리의 원래 연구와는 구별되는 것이었다.18 우리는 이렇게 수정된 면담 지침을 사용하여, 전문직 간 상호작용이 학생들의 PIF에 어떻게 기여하는지를 탐구하는 13개의 추가 면담을 수행하였다. 총 20개의 면담은 2023년 8월부터 2024년 10월 사이에 수행되었고, 면담 시간은 60분에서 75분 사이였다. 면담 당시 20명의 참여자들은 평균적으로 6개의 실습 중 4~5개를 마친 상태였으며(범위 2–6), 여섯 개의 clerkships를 경험한 정도에는 차이가 있었다.

 

코드북(codebook)은 주 코더들(K.A.M.와 A.M.B.)이 PIF에 초점을 맞추어 전사본을 다시 독립적으로 읽은 뒤 공동으로 개발하였다. 이 과정은 문헌의 대표적 논문들(seminal articles)에 의해 민감화(sensitized)되었다.16,30–34 주 코더들은 전체 연구팀과 정기적으로 논의하였고, 여기에는 PIF 전문성을 가진 구성원(A.P.S.와 J.S.I.)도 포함되었다. 초기 코딩 후, 우리는 이러한 집단 토의를 사용하여 코드들을 범주(categories)로 묶었다. 또한 이 회의들에서 전체 연구팀은 어떤 영역이 추가 탐색(further exploration)을 필요로 하는지 검토하였고, 특히 참여자들의 설명에서 구성된 개념(concepts)을 반증하거나(disconfirm) 도전하는(challenge) 사례들에 주의를 기울였다. 축코딩 범주(axial coding categories)들 간의 잠재적 관계를 탐색하고, 학생들의 OHPs와의 상호작용이 그들의 PIF에 어떻게 기여하는지를 설명하는 개념모형(conceptual model)을 생성하기 위해, 연구팀은 도식화(diagramming)와 메모 작성(memo writing)을 수행하였다. 이후 우리는 자료에 대한 예비적 이해(preliminary understanding)를 연구팀 외부의 보건전문직 교육 연구자 그룹에게 제시하여, 떠오르는 모형(emerging model)을 더욱 탐색하고(probe), 도전하고(challenge), 수정하였다(revise).41–43 이러한 연속적 개념화 노력(serial efforts to conceptualize the data)을 통해, 연구팀은 거울(mirrors)프리즘(prisms) 이라는 은유(metaphors)를 전문직 간 상호작용이 학생들의 현재 및 미래 전문직 정체성(current and future professional identities)을 어떻게 형성하는지 포착하는 비유(analogies)로 확인하게 되었다.

 

우리는 관심 현상(phenomenon of interest)에 대한 강건한 개념모형(robust conceptual model) 을 구성할 수 있고, 새로운 자료를 기존 모형 수정 없이 통합할 수 있을 때까지 자료 수집을 계속하였다.44 우리는 17개의 면담 후 그러한 모형을 구성하기에 충분한 자료를 확보하였고, 이후 3개의 면담에서 모형의 수정이 필요한 새로운 자료가 나타나지 않았기 때문에, 연구 목적을 달성하기에 우리의 표본(sample)이 충분하다고 결론지었다.45


3 | 결과 (RESULTS) 

참여자들은 매우 다양한 상호작용을 이야기하면서, OHPs와 함께 일하는 경험이 환자진료에 기여(start contributing to patient care) 하기 위한 의미 있는 방식을 제공한다고 설명하였다. 참여자들은 종종 의사의 역할과 책임이 자신에게는 아직 도달하기 어려운 것(out of reach)이라고 느꼈고, 전문직 간 상호작용은 자신의 현재 역량에 더 잘 부합하는, 보다 접근 가능한 과업(tasks)에 참여할 기회를 제공하였다. OHPs와의 상호작용을 통해 환자진료에 의미 있게 기여하는 경험은 참여자들이 현재 자신을 의과대학생으로서 어떻게 이해하는지, 그리고 미래에 자신을 의사로서 어떻게 상상하는지에 변화를 가져왔다. 우리는 참여자들의 전문직 간 상호작용에 대한 설명을, 자신이 현재 보건의료팀의 기여적 구성원(contributing member)이 될 준비가 되어 있는지를 비추는 거울(mirror) 이자, 미래에 자신이 전문직 간 팀의 의사 구성원(physician members of interprofessional teams) 으로서 수행할 일을 새롭고 다른 방식으로 바라보게 만드는 프리즘(prism) 으로 해석하였다.

3.1 | 현재 정체성(Present identity): 거울로서의 전문직 간 상호작용 

환자진료에 기여하려는 지속적인 노력 속에서, 참여자들은 OHPs가 자신을 업무에 참여시키려는 의지가 더 크거나 혹은 덜한 순간들을 인식하였다. 환자진료에서 변화를 만들어내는 것(making a difference in patient care)은 미래의 의사로서 참여자들의 “목적의식(sense of purpose)”(Participant 6)의 핵심이었지만, 그들은 종종 자신이 “도움이 되는(helpful)”(Participant 2) 존재“쓸모없는(useless)”(Participant 3) 존재 사이의 “문턱(cusp)”(Participant 15)에 서 있다고 여겼다. 자신이 의사들의 업무(the work of physicians)에 실제로 합류할 수 있는지를 생각할 때, 참여자들의 자기효능감(self-efficacy)소속감(belonging) 은 특히 불안정(tenuous)했다. 그들은 “[의사]가 하는 일로 네가 미끄러져 들어갈 수 있는(slide into) 기회는 그렇게 많지 않다”고 한탄하였다(Participant 10). 반면, 참여자들은 봉합사 자르기(cutting sutures), 요도카테터 삽입(placing urinary catheters), 환자 이송(transporting patients) 등 OHPs와 나란히 과업에 참여하는 것이 자신의 현재 역량에 부합하는 방식으로 진료에 기여하기 시작할 수 있는 길을 제시한다고 설명하였다. 결과적으로, 참여자들은 자신이 이용 가능한 과업에 참여할 수 있는지 판단할 때 OHPs가 자신에게 어떻게 반응하는지에 세심한 주의를 기울였다. 일반적으로 이러한 상호작용은 두 가지 형태를 띠었다. 첫 번째는 다른 전문직이 참여자에게 어떤 과업에 함께하라고 초대하는 경우였고, 두 번째는 다른 전문직이 참여자의 과업 수행을 중재(intervene)하거나 방해(interrupt)하는 경우였다. 우리는 두 경우 모두에서 학생들이 OHPs와의 상호작용을 자신이 현재 기여할 준비가 되어 있는지를 비추는 거울 로 사용하고 있다는 인상을 받았다.

 

참여자들은 OHPs가 자신을 임상 과업(clinical tasks)에 적극적으로 참여시키려 한 여러 사례를 설명하였다. 이러한 초대해 들이는 순간(inviting-in moments) 은 참여자들에게 자신이 신뢰받고(trusted) 유능하다는(competent) 증거로 여겨졌고, 그 결과 자신이 유능한 기여자(capable contributors)이며 자신의 보건의료팀에 속해 있다고 느끼게 되었다. 예를 들어, Participant 12는 수술 중 수술기구 담당자(surgical technician)가 자신에게 가위를 건네준 경험의 영향을 다음과 같이 설명하였다.

“스크럽 테크가 [가위를] 건네주면서,
너는 사실상 이 팀의 일원이고, 여기서 기여하고 있어,
그리고 나는 네가 여기 있다는 걸 인정해 …
내가 너를 믿고 가위를 준다는 건 정말 작은 일이지만,
네가 어디에 속하는지 알아가려는 상황에서는
그게 정말 큰 의미가 있다고 생각해요.”

 

그러나 자신이 감당할 능력을 넘어선 것으로 인식되는 과업—예를 들어 아직 준비되지 않은 의사의 책임(physician responsibilities)을 맡으라는 요청—에 직면했을 때, 이러한 inviting-in moments는 일부 참여자에게 고통(distress)의 원천이 되기도 했다. Participant 19는 간호사로부터 환자의 활력징후 변화(change in a patient's vital signs)에 어떻게 대응할지 질문받았을 때 “당황했다(panicked)”고 말했는데, 그 상호작용이 “내 소속감을 편안함의 한계를 넘는 수준으로 증가시켰다(increased my sense of belonging beyond the point of comfort)”고 설명하였다.

 

다른 경우에 참여자들은 OHPs가 자신이 환자진료 과업을 수행하는 것을 방해하거나 막았던 경험을 설명하였다. 이러한 끼어드는 순간(stepping-in moments) 은 참여자들의 기여감(sense of contributing)에 도전하였고, 종종 자기의심(self-doubt)을 낳았다. 그런 순간들은 참여자들로 하여금 자신이 여전히 “환자를 돌볼 자격이 있는지(still qualified to take care of the patients)”(Participant 5) 의문을 품게 만들었고, 일부는 자신이 임상 현장(clinical workplace)에 속하는지조차 의심하게 되었다. 이는 Participant 6이 Foley catheter 삽입을 시도하던 중 간호사에게 제지당했을 때 보인 반응에 잘 드러난다.

“세상에, 나는 구멍에 튜브 하나도 못 넣는데,
내가 여기서 뭐 하고 있는 거지?”

 

OHPs가 개입하는 순간은 또한 좌절감(frustration)을 불러일으키기도 했는데, 특히 참여자들이 자신이 의과대학생이라는 지위(status) 때문에 OHPs가 자신에게 지식이나 기술이 부족하다고 단정했다고 느낄 때 그러했다. 이런 경우 참여자들은 그러한 개입의 순간들을 자신의 역량(capabilities)을 정확히 반영하지 않는 부정확한 거울(inaccurate reflections) 로 보게 되었다. Participant 15는 간호사들이 자신이 학생이라는 사실을 알면 자신이 마땅히 누려야 할 기회를 주지 않는다고 느꼈기 때문에, “배지를 뒤집어 놓거나, 배지가 보이지 않게 코트를 올려 잠그기까지(turn my badge around or zip up my coat so that my badge wasn't out)” 했다고 말했다.

 

OHPs가 학생들을 끌어들이든(inviting-in) 혹은 끼어들든(stepping-in), 분명한 것은 참여자들이 이러한 전문직 간 상호작용을 통해 자신이 보건의료팀의 의미 있는 기여자(meaningful contributors) 인지 스스로를 가늠하고 있었다는 점이다. 실제로 일부 참여자들은 전문직 간 상호작용이 지도전문의와의 상호작용보다 자신의 역량(capabilities)을 더 진실되게 반영한다고 보았다. 예를 들어 Participant 10은 간호사들이 자신에게 질문을 해온 경험을 다음과 같이 묘사하였다.

“의대에서 내가 경험한 가장 보람 있는 경험들 중 일부였어요.
왜냐하면 그게 A) 내가 실제로 누군가를 돕는 일에 관여하고 있다는 감각을 주고 …
그리고 B) 다른 사람들도 그걸 알아볼 수 있다는 느낌을 주기 때문이에요.”

 

참여자들의 생각 속에서, 의사들은 자신을 참여시켜야 할 의무(obligation) 가 있는 반면, OHPs는 선택(choice) 의 여지가 있는 것처럼 보였다. 따라서 OHPs의 행동은 학생들이 기여할 준비가 되어 있는지를 더 정확하게 보여주는 그림(picture)으로 받아들여졌다.

3.2 | 미래 정체성(Future identity): 프리즘으로서의 전문직 간 상호작용 

OHPs와의 상호작용은 또한 참여자들로 하여금 현재의 자신을 넘어 미래를 바라보게 만들었다. 이런 의미에서 전문직 간 상호작용은 참여자들이 의사 전문직(physician profession) 을 새롭고 구별되는 방식으로 보게 만드는 프리즘(prism) 이 되었다. 참여자들은 임상실습에 들어가면서 이미 의료전문직으로서 자신이 무엇을 지향하는지에 대한 예비적 감각(preliminary sense)을 가지고 있었는데, 대체로 전문적 지식(expert knowledge)독립성(independence) 을 의사의 핵심 속성(core physician attributes)으로 보았다. 이러한 전문성(expertise)에 대한 개념화 속에서, 참여자들은 의사의 특수한 지식과 기술(specialized knowledge and skills)을 OHPs의 것보다 상위에 있는 듯한 방식으로 묘사하였다. 예를 들어 Participant 19는 “당신은 다른 사람들보다 더 많이 알게 될 것이기 때문에(you’re going to know more than other people) 많은 시간을 투자하는 것이다”라고 회고하였다. 참여자들은 또한 자신의 수련(training)의 목표가 독립적으로 진료(practicing independently)하는 데 맞추어져 있다고 보았고, Participant 3은 자신의 임상 경험이 “내가 [임상 상황을] 혼자서(handle on my own) 다룰 수 있는 지점”까지 자신을 이끌어주기를 바란다고 말했다.

 

마치 프리즘이 빛을 분산시키듯(dispersing light), OHPs와의 상호작용은 참여자들로 하여금 임상적 전문성(clinical expertise)을 여러 전문직에 걸쳐 분포하는 지식, 기술, 관점의 스펙트럼(spectrum) 으로 보게 하였다. 참여자들은 의사와 OHPs가 서로 다른 방식으로 기여하며, 각자가 “돌봄 연속체(care continuum)의 다른 부분을 소유하고(own)” 있고, “서로 다른 전문성 영역(domains of expertise)”을 가지고 있음을 알아차렸다(Participant 10). 예를 들어, 그들은 의사가 “그 영역의 전문가가 아니기 때문에(not an expert in that area)” 다른 보건의료전문직이 “끼어드는(step in)” 것이 적절하고 바람직한 상황들을 이해하기 시작하였다(Participant 12). Participant 19는 이를 다음과 같이 더 자세히 설명하였다.

“다른 보건의료전문직에 대해 점점 더 많이 배울수록,
의사들이 그렇게까지 특별한 존재가 아니라는 걸 배우게 돼요.
정말 많이 알고 있고 환자진료를 진전시킬 수 있는 사람들이 많다는 걸요.”

 

이러한 경험은 함께 작용하여, 의사를 유일무이한 단독 전문가(singular experts) 로 보는 참여자들의 개념화를 흔들었고, 이전에는 잘 인식되지 않았던 OHPs의 기여를 드러냈다.

 

프리즘이 빛을 굴절시키듯(refracting light), OHPs와 상호작용한 경험은 또한 참여자들의 초점을 독립성(independence) 에서 조금씩 벗어나게 만들었다. 어떤 참여자들에게는 임상 현장이 여러 전문직의 다양한 전문가들로 가득 차 있다는 사실을 인식하는 것이 오히려 안도(relief)를 주었고, Participant 7은 “무슨 일이 일어나고 있는지 혹은 우리가 무엇을 해야 하는지를 알아내야 하는 유일한 사람이 꼭 당신일 필요는 없다(it’s not your sole responsibility to be the one person that figures out what’s going on or what we need to do)”고 성찰하였다. 참여자들은 또한 OHPs의 전문성을 활용하는 것이 “의대생들만의 일(not just the [medical] students)”이 아니라는 점도 알게 되었다(Participant 9). OHPs에 의존하는 경험은 의사들도 다른 사람들—OHPs뿐 아니라 다른 의사들—에게 의존한다는 사실을 인식하게 하였다. Participant 8은 “수련을 마친 지 10년, 15년 된 주치의(attending physicians)들조차 여전히 서로 상의하고(conferring with one another), 여전히 간호사들에게 치료계획에 대한 관점과 생각을 묻는다”고 강조하였다. 그러나 참여자들은 종종 다시 독립적 존재가 되려는 열망으로 돌아갔고, 도움을 받았지만 그것을 “혼자서 알아냈다면(figured it out [alone]) 훨씬 좋았을 텐데”라고 말한 사례들을 언급하였다(Participant 19). Participant 8은 이러한 내적 갈등(internal struggle)을 다음과 같이 간결하게 표현하였다.

“분명 내가 독립적으로 행동해야 하는 시점(definitely come to a point where I'll have to act independently)은 올 거예요.
하지만 잘 모르겠어요,
내가 완전히 독립적인(fully independent) 상태가 되는 시점이 정말 있을지는 의문이에요.”

 

자신이 OHPs에 의존하고 있다는 사실, 그리고 의사들 역시 그러한 전문가들에게 의존하는 모습을 목격하는 경험은, 학생들로 하여금 자신이 상호의존성(interdependence) 을 받아들여야 하는지, 아니면 계속해서 독립성(independence) 을 추구해야 하는지를 고민하게 만들었다.


4 | 논의 (DISCUSSION) 

의과대학생이 임상 현장에서 의사 이외의 사람들을 필연적으로 만나게 됨에도 불구하고, 이러한 상호작용이 학생들이 자기 자신(self)의사란 무엇인가에 대해 이해하는 방식에 어떤 영향을 미치는지는 거의 알려져 있지 않다. 본 연구는 전문직 간 상호작용이 의과대학생의 전문직 정체성을 어떻게 형성하는지를 보여주었는데, 이는 학생들이 현재 보건의료팀의 기여적 구성원이 될 준비가 되어 있는지를 반영해 주고, 동시에 의사를 단독적이고 독립적인 전문가(a singular independent expert) 로 보던 시각을, 많은 상호의존적인 전문가들 중 한 사람(one of many interdependent experts)으로 변화시키는 방식으로 작동하였다.

 

정체성 이론(theories of identity)은 우리의 결과를 이해하는 데 추가적인 통찰을 제공할 수 있다. 학생들은 전문직 간 상호작용을 통해 자신이 선택한 전문직과 관련하여 “나는 지금 누구인가?(Who am I now?)” 라는 질문에 답하고 있었다. 많은 정체성 이론들이 사람들이 이 질문에 대한 답을 구성하는 방식을 설명하지만, 우리는 특히 정체성 이론(identity theory) 이 이를 비추는 데 유용하다고 보았다.3,4,7,12,13,30,46,47 정체성 이론에서 개인의 자기개념(self-conceptions)은 흔히 역할 정체성(role identities) 개념을 통해 이해되는데,34 이는 사람들이 자신이 점유하고 있는 구조적 위치(structural positions)에 근거해 자신을 바라보는 방식을 의미한다. 정체성 이론역할 정체성이 개인에게 자기 의미(self-meaning) 를 제공하며, 특정 역할의 구체적 내용(particulars)과 그 역할이 다른 역할과 어떻게 구별되는지를 규정한다고 본다. 이러한 이론적 틀 속에서 개인은 역할 정체성의 위계(hierarchy of role identities)를 지니며, 타인이 특정 역할에서 자신에게 어떻게 반응하는지가 자기개념(self-concept)과 행동(behaviour)에 영향을 미친다.34,48 우리 연구의 의과대학생들에게 있어, 강의실을 떠나 임상 환경에 들어가는 것은 자신을 단순한 학생(student)으로 보던 상태에서 의사(physician)를 상상하기 시작하는 중요한 전환(transition)이었다.49–51 과도기적 단계(liminal phase)에서 ‘기여자(contributor)’라는 구별되는 역할 정체성(distinct role identity)을 취하는 것—즉, 환자진료 활동에 기여할 수 있는 사람으로 대우받는 것—은, 비록 자신이 팀 내 의사 구성원들의 업무에 합류하는 데 어려움을 겪더라도, 더 이상 “그저(just)” 의과대학생이 아니라는 식으로 자신을 볼 수 있게 해주는 구체적인 방식이 되었다.

 

우리 연구에 참여한 의과대학생들은 기여자가 되기 위해 노력하면서, OHPs가 자신을 환자진료 활동에 초대(invited into) 하거나 배제(excluded from) 하는 순간들에 매우 주의를 기울였다. 이후 학생들은 이러한 전문직 간 상호작용이 자신의 현재 역량(current capabilities)에 대해 무엇을 의미하는지를 폭넓게 해석하였는데, 종종 OHPs의 행동이 학생의 능력과 무관한 이유로 발생했을 가능성은 충분히 고려하지 않았다. 이러한 상호작용이 의과대학생의 자기감각(sense of themselves)과 자신의 능력에 대한 인식에 영향을 주고 있다는 점을 인식한다면, 지도전문의는 학생들이 OHPs가 임상 업무의 다양한 측면에 자신을 왜 초대했는지, 혹은 왜 초대하지 않았는지에 대해 보다 미묘하고 맥락화된 해석(nuanced and contextualized interpretations)을 할 수 있도록 도와줌으로써, 기여자(contributor) 라는 역할 정체성을 만족스럽게 수행(enacting)한다는 감각을 더 잘 지원할 수 있다.52 이상적으로는 학생들이 OHPs와 함께 이러한 순간들을 풀어내야(unpack) 하며, 이는 학생들이 임상학습 환경(clinical learning environments)의 핵심 구성원들과 함께 직장 경험(workplace experiences)을 성찰할 수 있는 구조(structures)의 필요성을 시사한다. 이는

  • OHPs를 초대하여 학생들이 의사와의 직장 경험을 성찰하는 세션을 공동 진행(co-lead)하게 하거나,
  • 학생들이 일상적(ad hoc) 상호작용 후 OHPs와 함께 성찰하도록 장려하는 피드백 시스템(feedback systems)을 설계함으로써 달성할 수 있을 것이다.
  • 더 나아가, OHPs가 전통적으로 의사의 권한 영역(traditional purview of physicians) 안팎의 과업에 학생들을 초대하거나 수행하게 할 수 있도록 권한을 부여(empower)함으로써, 학생들의 기여자로서의 자기개념(self-concept as contributors) 을 강화할 방법이 있을 수도 있다.

학생들은 또한 전문직 간 상호작용을 통해 “나는 무엇이 되어 가고 있는가?(Who am I becoming?)” 라는 질문에 답하려 하였고, 이 과정에서 의사란 무엇인지에 대해 숙고하였다. 전문직 간 상호작용은 학생들에게 의사 전문직의 상대적 전문성(relative expertise)과 독립성(independence)에 대해 다른 시각을 제공했으며, 사회정체성 이론(social identity theory) 은 이것이 왜, 어떻게 일어났는지를 이해하는 데 유용한 통찰을 제공한다.31,33,34,53 사회정체성 이론은 집단 구성원 자격(group membership)이 특정 집단의 특성과 행동을 기술하는 사회정체성(social identity) 과 어떻게 연결되는지에 초점을 맞춘다.34 사회정체성은 자신이 속한 집단을 유리하게 구별하는 방식으로 다른 관련 집단들과 비교(comparisons)함으로써 형성되고 재형성된다. 우리 연구에서 학생들이 의사가 OHPs보다 더 우월한 전문성(superior expertise)을 가진다고 전제했던 것은, OHPs와의 상호작용이 여러 전문직 전반에 걸친 전문성의 범위(range of expertise)를 보여주면서 도전받았다. 이렇게 수정된 사회정체성(revised social identity)의사를 팀 위의 절대적 전문가가 아니라, 우월성(superiority) 이 아니라 전문영역(areas of expertise) 에 의해 구별되는, 팀 내 여러 전문가 중 한 명(one of many experts on the team)으로 드러냈다. 또한 개인적으로 OHPs에 의존한 경험과 더 선배인 의사들 또한 그렇게 하는 모습을 보는 경험은 참여자들로 하여금 독립성이 정말로 의사 전문직을 구별하는 속성(distinguishing attribute)인지 재고하게 만들었다. 그들은 독립성을 중요한 전문직 목표(professional goal)로 언급했지만, 동시에 임상 업무(clinical work)가 종종 전문직 간 상호의존적 작업(interdependent work) 에 의존한다는 점도 인식하기 시작했다.

 

보건의료의 협업적 성격(collaborative nature)을 고려할 때, 전문직 간 상호작용이 학생들을 상호의존성(interdependence) 을 가치로 삼는 의사 정체성(physician identities)으로 이끄는 방식을 더욱 증폭시키는 것은 충분히 가치 있어 보인다.54–57 우리의 결과는 전문직 간 직장 상호작용이 학생들이 다른 전문직의 전문성(expertise)에 대해 가지는 인식을 높여 주며, 이는 전문직 위계(professional hierarchies)를 강화하는 다른 경험들에 대한 상쇄(counter)로 작용할 수 있음을 보여준다.58–60 전문직 간 협업(interprofessional collaboration)과 위계(hierarchies)가 맥락(context)에 따라 상당히 달라질 수 있음을 인식한다면,61–64 교육기관은 OHPs와의 상호작용이 학생들의 의사가 효과적인 협업자(collaborators)로 일할 수 있는 방식 에 대한 이해를 변화시키는 효과를 더 강화할 수 있을 것이다. 예를 들어, 이는 임상 현장에서 의과대학생을 지원하기 위한 OHPs의 명시적 교육 역할(explicit educational roles)의 부재를 해결하고, 임상 피드백 시스템(clinical feedback systems)에 OHPs를 더 의도적으로 포함시키는 것을 의미할 수 있다.

 

OHPs의 중요한 기여를 강조하고, 그러한 기여가 학생들이 자신과 의사 전문직을 보는 방식에 어떤 함의를 갖는지 성찰하게 만든다는 점에서, 전문직 간 직장 상호작용은 의과대학생을 전문직 간 협력 실무(interprofessional collaborative practice) 를 위해 준비시키는 데 필수적일 수 있다. 현재의 전문직 간 교육(interprofessional education) 노력이 왜 자주 기대한 목표에 미치지 못하는지를 이해하고자 했던 선행 문헌은, 협업이 요구되는 상황에서 활성화되는 별도의 전문직 간 정체성(interprofessional identity) 이라는 개념을 제시해 왔다.21,27,28,66 그러나 우리 참여자들이 현재와 미래의 자신을 기여자이자 협업자로 성찰한 방식은 이러한 개념에 도전하며, 오히려 전문직 간 협업(interprofessional collaboration) 이 의사들이 자신의 전문직 정체성을 이해하게 되는 방식의 통합적 일부(integral part) 임을 시사한다. 아마도 PIF와 전문직 간 협업을 모두 촉진하려는 노력은, 분리된 전문직 정체성(professional identity)과 전문직 간 정체성(interprofessional identity)을 서로 대립시키는 개념화(conceptualizations)를 피할 때 더 잘 이루어질 것이다.28,66 우리의 결과는 협업과 상호의존성을 별도의 전문직 간 정체성에 가두기보다는, 그 중심성을 부각시키는 포용적 전문직 정체성(inclusive professional identities) 개발에 다시 초점을 맞출 가능성을 보여준다.

4.1 | 제한점 (Limitations) 

고려해야 할 몇 가지 제한점이 있다.

  • 첫째, 학생들의 경험은 환경(settings)에 따라 달라질 수 있으며, 본 연구의 참여자들은 단일 기관(single institution) 출신이다. 우리의 결과의 전이가능성(transferability) 을 높이기 위해, 우리는 다섯 개의 훈련 사이트(training sites)에 걸친 임상 경험이라는 학생들 경험의 맥락적 측면(contextual aspects)에 대한 정보를 제공하였고, 이론(theory)을 활용하여 우리의 결과를 다른 환경에서의 기존 연구와 의도적으로 연결하려 하였다.53 그럼에도 우리는 이러한 경험들이 다른 임상학습 환경에서는 다를 수 있음을 인정한다.
  • 둘째, 학생들은 연구 참여 요청을 받았고, 자원하여 참여한 학생들은 비참여 학생들과 다른 경험을 가졌기 때문에 참여했을 수 있다. 그러나 우리는 학생들 사이에서 다양한 경험을 들을 수 있었고, 위에 제시된 결과에 의문을 제기하게 만들 반증 사례(disconfirming examples) 들에도 주의를 기울였다. 마지막으로, 우리는 이러한 상호작용에 참여한 OHPs를 인터뷰하지 않았다. 이 전문직들의 관점(perspectives)은 향후 연구에 매우 중요하지만, 본 논문의 초점은 아니었다.

5 | 결론 (CONCLUSION) 

전문직 간 상호작용은 의과대학생의 전문직 정체성(professional identities) 에 영향을 미치며, 학생들이 현재 보건의료팀의 기여자(current contributors)로서 자신을 보게 하고, 미래의 의사 전문직(future physician profession)을 새로운 방식으로 바라보게 하는 기회를 제공한다. 학생들의 자기개념(self-concept)을 촉진하고, 의사를 여러 상호의존적 임상 전문가 중 한 사람(one of many interdependent clinical experts)으로 재구성(recasting)하는 이러한 중요한 기여는, 학생들이 전문직 간 상호작용을 해석하거나, 그것을 자신의 발달 중인 PIF에 기여하는 다른 요소들과 조화시키는 데 어려움을 겪을 경우 약화될 수 있다. 교육자들과 연구자들은 OHPs의 참여와 관점을 이끌어내어, 이들 전문직이 언제 왜 학생들을 임상 업무로 초대하는지를 학생들이 더 잘 이해하도록 지원하는 방안을 고려해야 한다. 더 나아가, OHPs를 직장 교육자(workplace educators) 로 포함하고 인정(recognizing)함으로써, 전문직 간 상호작용이 PIF에 미치는 영향을 강화하고, 협업(collaboration)을 자신의 전문직 핵심(core)으로 보는 의사들의 발달을 촉진할 기회가 있을 수 있다. 종합하면, 본 연구는 전문직 간 정체성(interprofessional identity)의사란 무엇인가와 분리된 개념으로 보는 생각을 재고할 필요가 있음을 시사한다.

 

 

 

 

 

 

Med Educ. 2025 Nov 6. doi: 10.1111/medu.70079. Online ahead of print.

Myths of contestation in the medical education curriculum: A dialogical exploration 

 

[논문 리뷰] 의대 교육과정은 왜 항상 바꾸기 힘들까? 🤔 '논쟁적 경합'의 5가지 신화 깨기 

안녕하세요! 오늘은 의학교육(medical education) 분야에 종사하시거나 교육과정 개편에 관심이 있는 분들이라면 격하게 공감하실 만한 흥미로운 논문을 하나 소개해 드리려고 합니다.

새로운 교육과정(curriculum)을 도입하거나 기존 시스템을 변경하려고 할 때마다 회의실에서 겪는 끝없는 논쟁과 진통, 다들 익숙하시죠? 오늘 소개할 논문은 이처럼 교육과정을 둘러싸고 벌어지는 팽팽한 의견 대립을 '논쟁적 경합(contestation)'이라는 개념으로 설명하며, 우리가 이 과정에 대해 흔히 착각하고 있는 5가지 신화(myths)를 시원하게 깨부수어 줍니다.

 

어떤 착각들을 하고 있었는지, 핵심만 쏙쏙 뽑아 살펴볼까요?

🚫 우리가 믿고 있던 5가지 신화 

1. 신화 1: 교육과정 기획은 논란 없이 순탄하게 흘러간다

  • 많은 사람들이 교육과정 개발을 아주 논리적이고 순조로운 과정(consensual process)으로 기대합니다. 하지만 현실은 정반대죠! 교육과정은 언제나 다양한 가치관이 부딪히는 이데올로기적 투쟁(ideological struggle)의 장입니다. 반대가 없는 기획이 오히려 비정상에 가깝습니다.

2. 신화 2: 논쟁은 찬성파 vs 반대파, 딱 두 진영으로 나뉜다

  • 회의실의 갈등을 단순한 '양립 구조'로 보기 쉽지만, 실제로는 훨씬 복잡합니다. 다양한 파벌(factions), 오랜 관행, 숨겨진 권력(power)과 행위 주체성(agency)이 복잡하게 얽힌 다면적인 협상(multifaceted negotiation) 과정입니다.

3. 신화 3: 교육과정 내용 자체가 제일 중요하다

  • "무엇을 가르칠 것인가"를 두고 가장 많이 싸우지만, 연구에 따르면 공식적인 교육과정 구조(formal curricular structure)가 실제 학생의 성과(student outcomes)에 미치는 영향은 생각보다 크지 않다고 해요. 내용보다는 교수법(pedagogy)이나 학습 환경(learning environment)이 더 중요할 수 있는데도, 우리는 종종 문서 상의 '단어 수정'에 너무 많은 에너지를 쏟곤 합니다.

4. 신화 4: 변화는 무조건 필요하고 좋은 것이다 

  • '변화를 위한 변화'에 집착하고 계시진 않나요? 무비판적인 혁신(innovation)은 오히려 피상적인 개혁이나 의도치 않은 결과(unintended consequences)를 낳을 수 있습니다. 때로는 현재의 좋은 시스템을 잘 유지하는 책무성(stewardship)도 매우 중요합니다.

5. 신화 5: 억지로라도 '합의'를 끌어내는 것이 낫다 

  • 무조건 둥글게 둥글게 만장일치 형태의 합의(consensus)를 이루려다 보면, 오히려 소수의견이 억눌리고 조직 내 냉소주의가 퍼질 수 있습니다. 건강한 의견 불일치(disagreement)를 자연스러운 것으로 받아들이는 문화가 훨씬 생산적입니다.

💡 연구진의 핵심 메시지

그렇다면 연구진은 이 피곤한 '논쟁적 경합'을 어떻게 바라봐야 한다고 말할까요? 단순히 갈등을 피해야 할 비전문적인 행동으로 보았을까요? 결코 그렇지 않습니다.

"우리는 논쟁적 경합이 필요하며, 이에 대한 부주의나 그것이 바람직하지 않다는 기대가 우리 분야에서 문제를 영속시킬 뿐이라고 주장한다." (we argue that contestation is necessary and that inattention to it or expectations that it is undesirable only perpetuates the problem in our field.)

 

연구진은 갈등과 논쟁을 피해야 할 '적'이 아니라, 더 나은 결정을 위해 반드시 거쳐야 할 '필수 관문'으로 보았습니다. 

"위원회는 구성원들이 서로의 생각을 테스트하고 잠재적인 결정에 대해 충분히 생각할 수 있도록 허용할 때 제 기능을 발휘한다. 그렇지 않으면 창의성과 비판적 사고가 질식하는 것을 피할 수 없다." (Committees function well when they allow their members to test each other's thoughts and to think through potential decisions; not doing so avoids stifling creativity and critical thinking.)

 

결국 핵심은 "싸우지 않는 것"이 아니라 "건강하고 전문적으로 잘 싸우는 것"입니다. 의견 불일치를 억누르기보다는 이를 명시적으로 허용하고 긍정적으로 관리할 수 있는 위원회 문화와 심리적 안전감(psychological safety)을 구축하는 것이 앞으로 우리가 나아가야 할 방향이 아닐까요?


1 서론 (1 INTRODUCTION) 

 

우리는 이전에 의학교육자들(medical educators)이 교육과정 개발(curriculum development)을 합리적이고(rational), 선형적이며(linear), 합의에 기반한 과정(consensual undertaking)으로 보는 불행한 경향에 주목한 바 있다.1 가끔은 그럴 수도 있겠지만, 우리는 대개 그 반대가 사실임을 발견했다. 즉, 의학교육 교육과정(medical education curricula)은 관련된 다양한 당사자들 사이에서 논쟁(debate), 의견 불일치(disagreement), 그리고 논박(disputation)의 중심이 되는 경우가 많다. 우리는 이러한 다양한 종류의 참여를 ‘논쟁적 경합(contestation)’이라는 개념으로 묶는데, 이를 다른 행동 방침(courses of action)을 취할 목적으로 제안과 정책(proposals and policies)(그리고 때로는 이를 추진하는 사람들)에 대한 도전으로 표현되는 적극적인 의견 불일치(active disagreement)로 정의한다. 우리는 논쟁적 경합(또는 그것의 부재) 자체를 판단하거나 가치 평가(value)하지 않으며, 단지 의학교육 시스템(medical education systems) 내에 그것이 주변에 만연하게 존재함(ambient presence)을 주목할 뿐이다.

 

의학 교육과정(medical curricula) 내의 논쟁적 경합에 어느 정도 관심이 기울여지긴 했지만,2-5 우리는 이 문제가 일반적으로 문헌(literature)에서 과소 보고(underreported)되고 있으며 비판적 고찰(critical examination)이 부족하다는 것을 발견했다. 실제로, 전문적 저항(professional resistance)에 관한 우리의 연구6에서, 교육과정 개발에 관여하는 많은 개인들이 교육과정의 논쟁적 경합으로 인한 어려움을 묘사했고, 그들의 고군분투가 인정받고 탐구될 필요성을 표명했다. 본 논문은 부분적으로 이러한 풀뿌리적 요구(grassroots request)에 대한 응답이다. 사실, 교육과정 기획(curriculum planning)에 논쟁적 경합이 만연하게 존재한다는 것은 이것이 의학교육(medical education)의 오랜 문제일 뿐만 아니라, 전부는 아닐지라도 현재 의학교육 지형(medical education landscape)의 상당 부분이 논쟁적 경합의 산물(product of contestation)임을 의미한다. 따라서 교육과정의 논쟁적 경합은 관련된 모든 사람들의 관심사이지만, 특히 프로그램의 교육과정(programme's curriculum)(또는 다른 운영 부분)에 기여하거나 변화를 주고자 고군분투하는 교수진(faculty)과 학습자(learners)에게 더욱 그러하다. 우리는 교육과정 논쟁적 경합과 관련된 교차하는 다섯 가지 신화(five intersecting myths)를 해체(deconstructing)함으로써 이 문제를 다루고자 했다. 이러한 신화들과 우리가 이를 분석하고 도전한 방법들은 대화적 접근법(dialogical approach)을 사용하여 개발되었다.

 

 

2 대화적 접근법 (2 A DIALOGICAL APPROACH) 

 

연구에 대한 대화적 접근법(dialogical approaches to research)7, 8은 아이디어, 질문, 다양한 관점(diverse viewpoints)을 탐구하기 위한 의미 있고 확장된 대화(extended conversation)와 공동의 탐구(shared inquiry)를 통한 학습과 연구를 강조한다. 우리 팀은 네 명의 연구원(researchers)으로 구성되었다.

 

  • RE는 사회적 해석학(social hermeneutics)에 중점을 둔 시스템 중심 학자(systems-focused scholar)로, 교육과정 위원회(curriculum committees)의 위원장을 맡고 의학교육 거버넌스(medical education governance) 전반에서 풍부한 경험을 가지고 있다. 교육과정 거버넌스에서의 논쟁적 경합은 오랫동안 그녀의 관심사였다.9
  • MK는 학부 및 졸업 후 의학교육(undergraduate and postgraduate medical education) 수준의 위원회에서 다년간의 경험을 쌓은 가정의학과 교육자(family physician educator)이며, 교육과정에 대한 학습자 경험(learner experiences)에 관심이 있다.10 그녀는 종종 '테이블에 초대'를 받았으나 다른 사람들이 자신을 침묵시키려 하는 것을 발견하곤 했다고 언급했다.
  • KH는 심리측정학(psychometrics)과 응용 인지 신경과학(applied cognitive neuroscience)의 교차점에서 연구하는 측정/평가 중심 학자(measurement/assessment-focused scholar)이다. 그는 또한 평가 정책(assessment policy)과 관련된 다수의 국제 위원회에 소속되어 있으며, 그의 박사 학위 논문은 (무엇보다도) 의학교육 성과(medical education outcomes)에 대한 교육과정의 중요성을 측정했다.11
  • TW는 권력 역학(power dynamics), 불평등(inequalities), 그리고 숨겨진 가정(hidden assumptions)에 초점을 맞추어 연구하는 비판적 학자(critical scholar)이다. 그녀는 주(state) 및 연방(federal) 수준의 의학교육 시스템에서 근무했으며, 오랫동안 의학교육의 학습 맥락(learning contexts)에 초점을 맞춰왔다.12

 

초기 연구는 RE와 MK로 시작되었으며, 이들은 의학교육에서 교육과정 변화(curriculum change)를 추진(advancing)하고 저항(resisting)하는 것을 묘사하기 위해 사용되는 휴리스틱(heuristics, 발견적 방법)을 식별했다. 이러한 휴리스틱은 의학교육이 불확실한 결과(uncertain outcomes)를 가진 모호한 문제(ambiguous problems)를 해결하기 위해 사용하는 접근법으로 간주되었다.13 우리는 직접적인 경험(first-hand experience)을 사용하여, 표현된 변화 접근법의 관점에서 대표적인 동사(representative verb) (예: '적정하다(titrate)', '옹호하다(champion)', '의심하다(doubt)')를 할당한 초기 휴리스틱 목록(initial list of heuristics)을 만들었다. 그런 다음 우리는 우리가 동의할 수 있는 보다 일관된 모델(consistent model)을 확립하기 위해 토론과 '묶기 및 나누기(lumping and splitting)'를 통해 이 목록을 반복적으로 개선(iteratively refined)했다. 우리는 여러 교수 개발 워크숍(faculty development workshops)과 교육 과정에서 반복되는 모델을 테스트했으며, 받은 피드백에 대응하여 이를 개선했다. 이후 우리는 PubMed와 [[“medical education”] AND [“curriculum change”]]라는 검색 문자열을 사용하여 교육과정 변화에 관한 문헌을 검색했고, 137개의 논문(articles)을 반환받았다. 반복되는 참고문헌(recurring references)을 검색하여 추가로 10개의 논문을 찾아냈으며, 이로써 추출할 147개의 논문을 식별했다. 우리는 논문에 설명된 변화 전략(change strategies)기존의 휴리스틱 목록을 반영하는지 기록하기 위해 간단한 데이터 추출 도구(data extraction tool)를 고안했다. 반영되었다면 해당 휴리스틱을 수정(adapting)할 필요가 있는지 기록했고, 반영되지 않았다면 새로운 휴리스틱을 추가할 필요가 있다고 기록했다. 또한 교육과정 변화의 휴리스틱 모델(model of the heuristics of curriculum change)을 세밀하게 다듬기 위해 메모를 하고 반복적인 토론(iterative discussion)에 참여했다.

 

검토된 147개의 논문 중 52개는 변화가 어떻게 추진되거나(advanced) 저항받는지(resisted) 설명했으며, 우리는 이 논문들로부터 5개의 추가적인 휴리스틱을 식별하여, 변화 추진에 사용되는 13개의 휴리스틱과 변화 저항에 사용되는 15개의 휴리스틱으로 구성된 최종 모델(final model)을 완성했다(그림 1 참조). 이 시점에서, 우리는 휴리스틱에 대한 초점에서 한 걸음 물러나 의학교육의 교육과정 변화 맥락에서 논쟁적 경합(contestation)이 인정되고 이해되는 방식에 관한 더 넓은 문제들을 고려하기로 결정했다. 이때 TW와 KH가 연구팀에 합류했는데, TW는 형평성 관련 문제(equity-related issues)를 둘러싼 논쟁적 경합에 대한 지식을, KH는 평가 정책 및 실무(assessment policy and practice)에서의 논쟁적 경합에 대한 지식을 가져와 논쟁적 경합에 초점을 맞춘 대화적 접근법(dialogical approach)에 참여했다.7

 

FIGURE 1 교육과정 논쟁적 경합의 휴리스틱(Heuristics of curriculum contestation).  

 

 

팀으로서, 우리는 문헌(literature)과 의학교육자(medical educators) 및 과학자(scientists)로서의 오랜 경력에서 얻은 경험7을 모두 활용하여 교육과정 변화의 논쟁적 경합을 둘러싼 광범위하게 왜곡된 믿음들(broadly skewed beliefs), 즉 신화(myths)에 대해 반복적인 토론(iterative discussions)을 진행했다. 우리는 더 넓은 의학교육 공동체(medical education community)에 무엇이 적절한지(germane)에 대한 지속적인 토론과 논쟁을 벌였고, 논쟁적 경합에 대한 우리 자신의 경험을 바탕으로 창의적인 글쓰기(creative writing)를 수행했다. 우리는 귀추적 추론(abductive reasoning)을 모색하여, 우리 각자가 신화에 대한 표현(articulations of the myths)을 제안한 뒤 비판하고, 이들을 묶고 나누며(lumping and splitting), 그들의 표현과 범위(articulation and scope)를 비판적으로 개선함으로써, 다른 사람들이 이해하는 데 가장 중요하다고 생각하는 문제들을 총체적으로 반영하도록 했다.

왜 굳이 귀추적 추론이라고 불렀을까?

이 연구가 만약 순수 귀납적이었다면,
  • “147편에서 반복적으로 나온 내용을 모아서 범주화했다”
    정도로 서술됐을 가능성이 큽니다.
반대로 순수 연역적이었다면,
  • “기존 이론 X를 적용해 문헌을 분류했다”
    는 식이었겠죠.
그런데 이 연구는 둘 다 아닙니다.
  • 처음부터 경험 기반 휴리스틱이 있었고
  • 문헌을 보며 그것을 수정했고
  • 다시 더 넓은 문제의식으로 옮겨 갔고
  • 여러 연구자의 관점을 합쳐 개념을 재구성했습니다
즉, 자료에 의해 끌려가면서도, 연구자 해석과 이론적 상상력이 적극 개입합니다.
그래서 귀추적이라고 부르는 것이 가장 정확합니다.


제공된 본문에서 연구진은 단순히 기존 문헌의 데이터를 기계적으로 요약(귀납)하거나, 미리 정해놓은 이론을 증명(연역)하려고 하지 않았습니다. 대신 데이터와 자신들의 경험을 교차하며 새로운 개념(신화, Myths)을 도출하는 귀추적 추론을 사용했습니다. 구체적으로 다음과 같은 단계로 나타납니다.
  • 1. 재료의 융합 (관찰 + 배경지식): 문헌 검토를 통해 얻은 '객관적 데이터(147개의 논문, 식별된 휴리스틱)'에 연구진(TW, KH 등)이 가진 평가 정책, 형평성 문제 등에 대한 '실무 경험 및 배경지식'을 결합했습니다.
  • 2. 가설의 제안 (창의적 도약): 교육과정 변화 과정에서 끊임없이 발생하는 '논쟁적 경합(contestation)'을 설명하기 위해, 기존 문헌에는 명시되지 않았던 '신화(Myths, 널리 퍼진 왜곡된 믿음)'라는 새로운 개념적 틀을 제안했습니다. 이는 데이터가 스스로 말해주는 것이 아니라, 연구자들의 지적 직관이 개입된 도약입니다.
  • 3. 반복적 검증과 다듬기 (최선의 설명 도출): 각자가 제안한 '신화'의 초안들을 놓고 서로 비판하고, 비슷한 것은 묶고 다른 것은 나누며(lumping and splitting), 그 범위를 수정하는 반복적인 토론(iterative discussions)을 거쳤습니다. 이 과정을 통해 의학교육 공동체가 직면한 문제를 총체적으로 반영하는 '가장 최선의 설명'을 완성해 낸 것입니다.

 

 

3 다섯 가지 신화 (3 FIVE MYTHS) 

 

교육과정 변화(curriculum change)에서 논쟁적 경합(contestation)의 역할은 문헌(literature)에 광범위하게 기술되어 있지 않으며, 실제(practice)에서 인정받기는커녕 잘 이해되고 있는 것 같지도 않다. 이는 부분적으로 이 논문을 쓸 당시 구글 스칼라(Google Scholar)에서 4000회 이상 인용된 Kern 등의 저서 "의학교육을 위한 교육과정 개발: 6단계 접근법(Curriculum development for medical education: a six-step approach)"14, 15과 같은 텍스트의 지배력으로 설명될 수 있는데, 이 책은 논쟁적 경합에 대한 인정이 거의 없는 이상화된 변화 모델(idealized model of change)을 제시한다. 우리는 의학교육 내에서 다음의 문제들을 제기함으로써 이러한 이상화된 관점(idealized perspective)을 다루고자 했다:

 

  • a) 우리는 한 분야로서 교육과정이나 의학교육 거버넌스(governance of medical education) 전반에서 논쟁적 경합의 중요한 역할에 충분히 주의를 기울이지 않는다.
  • b) 우리는 대신 변화의 순응(compliance)과 선형성(linearity)을 가정하는 단순화된 변화의 신화(myths of simplistic change)를 영속화해 왔다.
  • c) 논쟁적 경합은 널리 퍼져 있을 뿐만 아니라, 교육과정의 질 보장(quality assurance)과 질 향상(quality improvement)에서 필수적인 역할을 제공할 수 있다.

 

이를 위해, 우리는 하나의 포괄적인 신화가 아니라 교육과정 기획 및 변화(curriculum planning and change)에서의 논쟁적 경합에 관한 상호 연결된 다섯 가지 신화(five interlinked myths)를 고찰한다. 우리는 교육과정 변화에서 논쟁적 경합의 역할에 대한 더 깊은 이해가 그러한 변화를 더욱 효과적이고 의미 있게 만드는 자원(resource)으로 그것을 더 정당하게 위치시킬 수 있다고 주장한다.

 

3.1 신화 1: 교육과정 기획은 논쟁의 여지가 없다 (3.1 Myth 1: curriculum planning is uncontested) 

첫 번째 신화는 교육과정 기획이 선형적이고(linear), 논리적이며(logical), 합의에 기반한 과정(consensual process)이라는 것이다. 이는 우리가 제안했듯이, 변화를 본질적으로 바람직하고, 객관적이며, 예측 가능한 것으로 묘사한 Kern과 동료들14, 15이 개발한 모델에 의해 전형적으로 나타나며, 이러한 편향(bias)은 Everett Rogers와 같은 변화 이론가(change theoreticians)들의 연구에서도 발견된다.16 프로그램에 반대(dissent)를 용납하지 않는 독재적인 리더(autocratic leader)가 없는 한, 현실은 교육과정의 어떤 측면이나 그에 대한 변화라도 어떤 당사자에 의해 논쟁적 경합의 대상(open to being contested)이 될 수 있다는 것이다. 이것이 전 세계 의과대학들이 위원회 기반 거버넌스(committee-based governance)17를 갖추고 있는 이유이다. 위원회는 반대 의견을 표출하고 선택지와 쟁점들을 탐구할 수 있게 하는 동시에, 정중한 담론(civil discourse)과 완전한 합의(full consensus) 없이도 구속력 있는 결정(binding decisions)을 내릴 수 있는 능력을 유지하게 해 준다.

 

왜 의과대학에는 위원회가 많은가?

보통 우리는 위원회를
“행정 절차” 정도로 생각하기 쉽습니다.
하지만 이 논문은 위원회의 존재 이유를 훨씬 정치적으로 봅니다.

위원회는 단지 형식적인 조직이 아니라,
  • 반대 의견(dissent)을 표출하게 하고
  • 여러 선택지(options)를 검토하게 하며
  • 쟁점(issues)을 드러내고 토론하게 하고
  • 모두가 100% 동의하지 않아도
  • 결국은 구속력 있는 결정(binding decision)을 내리게 하는 장치
라는 것입니다.
즉, 위원회는 합의를 확인하는 곳 이라기보다,
사실은 갈등을 관리하고, 정당한 의사결정을 가능하게 하는 구조 에 가깝습니다.

이건 아주 흥미로운 관점입니다.

쉽게 말하면

위원회는 “모두가 같은 생각을 하는 곳”이 아니라,
오히려 “생각이 다르다는 전제를 두고 운영되는 곳” 입니다.

 

논쟁적 경합이 의학교육에 본질적이라는 사실은 견고한 위원회 기반 의사결정(committee-based decision-making)에 대한 인증 요건(accreditation requirements)에 반영되어 있다. 예를 들어, 미국 의과대학의 현행 학부 의학교육 인증 기준(undergraduate medical education accreditation standards)의 약 10%가 위원회 거버넌스 요건18을 언급하고 있으며, 다른 관할권(jurisdictions)의 기준들도 유사한 초점을 보여준다.19 교육과정 거버넌스에서 논쟁적 경합이 예상될 뿐만 아니라, 위원회 기반 거버넌스를 채택하는 인증 기관(accreditation bodies), 평가 기관(assessment organizations) 및 기타 기관의 업무의 일부이기도 하다. 교육과정 논쟁적 경합은 Pinar 등20에게도 중요했는데, 그들은 교육과정이 이데올로기(ideology)와 편향(bias)으로 가득 차 있어 본질적으로 회의주의(skepticism)와 해체(deconstruction)의 대상이 된다고 비판했다. 그들의 초점은 주로 유치원부터 고등학교까지의 교육(K-12 education)에 있었으며, 이는 반사적 의심(reflexive suspicion)에는 덜 초점을 맞추고 전문성의 권위(authority of expertise)와 집단적 행동(collective action)의 필요성에 더 초점을 맞추는 경향이 있는 보건의료전문직 교육(health professions education)의 문화와 대조된다. 최근에는 다양성(diversity), 형평성(equity), 포용성(inclusivity)에 대한 관심이 높아지면서 이조차도 변화하고 있으며, 이는 다시 교육과정을 논쟁적 경합의 장(ground for contestation)으로 만드는 경향이 있다.

 

왜 교육과정은 본질적으로 논쟁적일 수밖에 없는가?

여기서 논문은 교육과정 이론(curriculum theory) 쪽의 중요한 관점을 가져옵니다.
바로 Pinar 등의 논의입니다.

그들의 입장은 대체로 이렇습니다.
쉽게 말해서 교육과정은 단순히
“무엇을 가르칠까?”의 문제가 아니라,

사실은 동시에
  • 무엇이 중요한 지식인가?
  • 누구의 관점이 중심이 되는가?
  • 무엇을 정상(normal)으로 볼 것인가?
  • 어떤 인간상, 어떤 전문직 정체성을 길러내려 하는가?
  • 누가 결정권을 가지는가?
를 포함합니다.
예를 들어 의학교육에서도 교육과정은 늘 이런 질문을 내포합니다.
  • biomedical knowledge가 우선인가, social accountability가 우선인가?
  • 개별 환자 치료 역량이 중심인가, 시스템 개선 역량도 포함해야 하는가?
  • 의사를 전문가(expert)로 키울 것인가, 시민적 책임을 가진 변화 주체(agent)로 키울 것인가?
  • DEI(diversity, equity, inclusivity)를 어디까지 반영할 것인가?
이런 질문들에는 “완전히 객관적인 정답”이 없습니다.
그래서 논쟁이 생길 수밖에 없습니다.

K-12와 보건의료전문직교육(HPE)의 문화 차이

논문은 또 하나의 흥미로운 비교를 합니다.
Pinar의 전통은 주로 K-12 교육 에서 발전했는데,
이쪽은 교육과정을 더 비판적으로 봅니다.

즉,
  • 교육과정 안에 숨겨진 권력
  • 당연하게 여겨지는 가치
  • 배제된 관점
  • 이데올로기적 작동 방식
을 해체(deconstruction)하고 의심(skepticism)하는 태도가 강합니다.
반면에 보건의료전문직교육(HPE) 은 전통적으로
  • 전문가의 권위(authority of expertise)
  • 집단적 행동(collective action)
  • 실용적 문제 해결
  • 시스템 운영
에 더 초점을 두는 문화가 있었다고 말합니다.
즉, HPE는 상대적으로
“교육과정을 비판적으로 해체하는 것”보다
“합의해서 잘 굴러가게 만드는 것”을 더 중시해 왔다는 뜻입니다.

그런데 최근에는 HPE도 변하고 있습니다.
특히
  • 다양성(diversity)
  • 형평성(equity)
  • 포용성(inclusivity)
에 대한 관심이 커지면서,
예전에는 당연하게 여겨지던 교육과정도 다시 질문받고 있습니다.

예를 들면,
  • 특정 집단에 불리한 평가 방식은 없는가?
  • 교육내용이 특정 문화나 성별 관점을 중심으로 짜여 있지는 않은가?
  • 소수자 경험은 배제되어 있지 않은가?
  • hidden curriculum은 누구에게 유리하고 누구에게 불리한가?
이런 질문들이 많아질수록, 교육과정은 더더욱 논쟁의 장 이 됩니다.

 

교육과정 위원회 내부(그리고 종종 외부에서도)에서 나타나는 여러 종류의 논쟁적 경합을 가시화하기 위한 시도로서, 우리는 얼마 동안 우리 자신의 연구에서 접했거나, (주로 교수 개발 활동에서) 다른 사람들이 우리에게 설명했거나, 문헌에 기술된 다양한 휴리스틱 전략(heuristic strategies)을 문서화해 왔다. 이 작업은 대학원생과 교수 개발(faculty development) 참여자들에게 의학교육 시스템에 대해 가르치는 데 사용됨으로써 더욱 발전되었다. 이러한 휴리스틱 중 일부는 변화를 추진(advance)하는 데 사용될 수 있는 반면, 다른 것들은 변화에 저항(resist)하는 데 사용될 수 있으며, 종종 두 가지 방식 모두로 사용될 수 있다 (그림 1 참조). 우리는 그것들이 논쟁적 경합에 참여하기 위한 레퍼토리(repertoire) 역할을 하는 부정확한 '경험 법칙(rules of thumb)'이기 때문에 휴리스틱이라고 설명한다. 그것들이 반드시 작동하거나 원하는 목표를 달성하는 것은 아니며, 행위자(actors)들은 더 효과적일 것이라 기대되는 것을 찾기 위해 전략을 바꿀 수도 있다.21

7. “휴리스틱 전략(heuristic strategies)”은 무엇인가?

이 부분이 이 논문의 아주 독특한 기여입니다.
저자들은 교육과정 논쟁이 실제로 어떻게 벌어지는지를 보면서,
사람들이 사용하는 여러 휴리스틱(heuristics) 을 정리해 왔다고 말합니다.

휴리스틱은 쉽게 말하면:
입니다.
정교한 공식이 아니라,
현장에서 사람들이 실제로 쓰는 행동 레퍼토리(repertoire) 에 가깝습니다.

예를 들어 교육과정 변화 맥락에서 휴리스틱은 이런 식일 수 있습니다.
  • 문제를 더 크게 보이게 만들기
  • 외부 인증 기준을 근거로 제시하기
  • 학생 요구를 앞세우기
  • 시범사업부터 시작하자고 제안하기
  • 반대자들을 직접 설득하기보다 우회하기
  • “지금은 때가 아니다”라고 말하며 지연시키기
  • 다른 학교 사례를 들며 정당화하기
이런 전략은 변화 추진에도 쓰일 수 있고,
반대로 변화 저항에도 쓰일 수 있습니다.

즉, 같은 전략도 맥락에 따라
  • advancing change
  • resisting change
두 방향으로 모두 사용될 수 있습니다.
이 점이 중요합니다.

 

이 신화에서 해체해야 할 마지막 문제는 의학교육자들이 논쟁적 경합을 하거나 해서는 안 된다는 암묵적 믿음(tacit belief)이다. 왜냐하면 그렇게 하는 것이 일부 사람들에게는 비전문적(unprofessional)인 것으로 보일 수 있기 때문이다. 많은 교육자들이 이러한 믿음을 가지고 있지 않은 것 같지만(거의 모든 교육과정 변화에 대해 경합할 준비가 명백히 되어 있다는 점으로 증명됨), 교육과정 거버넌스에 새로 참여하는 많은 사람들이 논쟁적 경합에 놀라워하고 이에 참여할 준비가 전혀 되어 있지 않음을 발견했다. 논쟁적 경합의 정당성(legitimacy)과 규범성(normativity) 또한 논쟁의 대상이 된다는 점을 고려할 때, 이와 관련하여 전문적 저항(professional resistance)과 평행선(parallels)을 이룬다.6

아주 쉽게 비유하면

이걸 “병원 회의에서 새로운 교육과정을 만드는 상황”으로 생각해보면 쉽습니다.
겉으로는 모두가 이렇게 말합니다.
  • “학생을 위해 더 좋은 교육과정을 만들자.”
하지만 실제 회의 안에서는 각자 다른 생각을 합니다.
  • 기초교수: “우리 시간 줄어들면 안 된다.”
  • 임상교수: “실습 부담은 누가 감당하나?”
  • 학생대표: “평가 공정성이 제일 중요하다.”
  • 보직교수: “인증에 맞춰야 한다.”
  • 행정가: “예산과 인력이 없다.”
  • 개혁 성향 교수: “이건 너무 구식이다.”
  • 보수 성향 교수: “근거 없는 유행을 따라가면 안 된다.”
즉, 모두가 “교육의 질”을 말하지만,
실제로는 각자 생각하는 좋은 교육 이 다릅니다.

그래서 교육과정 기획은 설계(design)이면서 동시에
협상(negotiation), 설득(persuasion), 경합(contestation), 타협(compromise)의 과정이 됩니다.

 

3.2 신화 2: 논쟁적 경합은 두 개인 사이에서 일어난다 (3.2 Myth 2: contestation is between two individuals) 

 

교육과정 안팎의 논쟁적 경합이 항상 한 쪽은 변화를 찬성하고 다른 쪽은 변화를 반대하는 식의 두 주체(entities, 개인 또는 집단) 사이에서 발생한다는 것 또한 신화이다. 우리는 논쟁적 경합이 종종 다양한 파벌(multiple factions)이데올로기를 포함하며, 수많은 맥락적 요인(contextual factors), 동향(trends), 선례(precedents), 정체성(identities)에 의해 형성된다는 것을 발견했다. 더욱이, 모든 당사자가 변화의 필요성에 동의하더라도, 논쟁적 경합은 대신 변화의 정도(degree), 변화의 방향(direction), 변화의 시기(timing), 변화의 시급성(urgency), 그리고/또는 변화의 종류(kind)에 초점을 맞출 수 있다. 실제로 논쟁적 경합은 해당 문제 자체에 관한 것이 아닐 수 있으며, 대신

  • 더 광범위한 파벌적 문제(factional issues)(예를 들어, 서로 다른 전문 분야 간),
  • 오랜 문제(longstanding issues)(예를 들어, 교육과정에서 전신 해부나 조직학을 제외하는 것), 또는
  • 실제 문제가 무엇인지에 대한 서로 다른 해석(different interpretations)(예를 들어, 교정(remediation)이 필요한 대상이 학습자인지 아니면 학습 환경인지)을 반영할 수 있다.

이러한 논쟁적 경합의 암묵적인 원인(tacit causes)은 근저에 있는 문제나 원인을 알지 못하는 사람들에게 특히 혼란스러울 수 있다.

 

왜 “두 개인 사이의 대립”이라는 생각이 신화인가?

보통 사람들은 갈등을 이렇게 이해하기 쉽습니다.
  • 한쪽은 변화 찬성
  • 다른 쪽은 변화 반대
예를 들면,
  • “혁신적인 교수” vs “보수적인 교수”
  • “학생 편” vs “기득권 편”
  • “개혁파” vs “저항파”
그런데 저자들은 현실이 훨씬 더 복잡하다고 말합니다.
실제 교육과정 논쟁에서는 보통 이런 식입니다.
  • 찬성하는 사람들끼리도 서로 의견이 다르고
  • 반대하는 사람들끼리도 이유가 다르고
  • 어떤 사람은 변화 자체는 찬성하지만 시기는 반대하고
  • 어떤 사람은 방향은 찬성하지만 범위는 반대하고
  • 어떤 사람은 표면적 쟁점과 전혀 다른 이유로 움직입니다
즉, 갈등의 축(axis) 이 하나가 아닙니다.
이건 조직이론에서 말하는 multivocality 또는 polycentric conflict와 비슷한 감각으로 볼 수 있습니다.
즉, 하나의 중심 갈등이 아니라 여러 중심이 동시에 존재하는 갈등이라는 뜻입니다.

논쟁은 겉으로 드러난 문제 때문이 아닐 수도 있다

이 부분이 이 절의 핵심 중 핵심입니다.
저자들은 말합니다.
즉, 사람들이 회의에서는 A를 두고 다투는 것처럼 보이지만, 실제로는 B나 C 때문에 싸우고 있을 수 있다는 것입니다.
논문은 세 가지를 예로 듭니다.

4-1. 더 광범위한 파벌 문제(factional issues)

예를 들면 서로 다른 전문 분야 간의 긴장입니다.
예를 들어 의과대학에서
  • 기초의학 vs 임상의학
  • 내과계 vs 외과계
  • 교육전담교수 vs 임상현장교수
사이의 오래된 미묘한 경쟁이 있을 수 있습니다.
겉으로는 “이 과목 시간을 늘릴지 말지”를 두고 논쟁하지만, 실제로는
  • “왜 늘 저쪽 분야가 더 영향력이 큰가?”
  • “우리 과는 늘 우선순위에서 밀린다”
  • “이번에는 우리 목소리도 반영되어야 한다”
같은 파벌적 역학 이 작동할 수 있습니다.
즉, 현재 논쟁은 실제로는 더 큰 권력관계의 한 장면 일 수 있습니다.

4-2. 오랜 문제(longstanding issues)

지금 논쟁하는 사안이 사실은 오래된 논쟁의 연장선일 수 있습니다.
논문은 해부학이나 조직학 제외 문제를 예로 듭니다.
이걸 쉽게 말하면,
지금 어떤 커리큘럼 조정안이 나왔을 때, 사람들은 단지 그 안건 하나만 보고 반응하는 것이 아니라,
  • 과거에 비슷한 안건이 어떻게 처리되었는지
  • 그동안 누가 손해를 봤는지
  • 누가 반복적으로 소외되었다고 느끼는지
  • 과거 결정에 대한 감정적 잔여물이 무엇인지
를 함께 가져옵니다.
그래서 새 안건을 둘러싼 갈등은, 사실상 역사적 기억(historical memory) 의 재연일 수 있습니다.

4-3. 실제 문제가 무엇인지에 대한 해석 차이

이 예시는 정말 중요합니다.
논문은 remediation을 예로 듭니다.
어떤 학생이 반복적으로 어려움을 겪는 상황에서,
  • 한쪽은 “문제는 그 학생 개인에게 있다”고 볼 수 있고,
  • 다른 쪽은 “문제는 학습환경이 그 학생을 실패하게 만들고 있다”고 볼 수 있습니다.
겉보기엔 둘 다 “학생을 도와야 한다”는 점에서는 같지만,
문제의 원인에 대한 해석이 완전히 다릅니다.

이 차이는 곧 해결책 차이로 이어집니다.
  • 개인 문제로 보면: 추가 지도, 평가 강화, remedial teaching
  • 환경 문제로 보면: 임상실습 구조 수정, 피드백 문화 개선, 학습지원 시스템 개편
즉, 갈등은 종종 해결책보다도 문제 정의(problem framing) 에서 시작됩니다.
여기서 알아두면 좋은 개념이 problem framing 입니다.
같은 현상도 어떻게 틀지우느냐에 따라 전혀 다른 문제처럼 보이게 됩니다.
정책학이나 조직학에서 아주 중요한 개념입니다.

 

이 마지막 점은 전문성(expertise)에 기반한 위원회 참여와 대표성(representation)에 기반한 참여 사이의 긴장 관계에서 특히 두드러질 수 있다.

  • 대표성에 기반한 참여(Representational engagement)는 파벌적 사익(factional self-interest)과 '아웃사이더 의식(outsiderism)'으로 흐르는 경향이 있는 반면,
  • 전문성에 기반한 참여(expertise-based engagement)는 지지(buy-in)가 부족한 기술 관료적 해결책(technocratic solutions)으로 흐르는 경향이 있을 수 있다.

6. 대표성 기반 참여 vs 전문성 기반 참여의 긴장

이 부분은 매우 중요하고, 실제 위원회 운영에서도 핵심적인 문제입니다.
논문은 위원회 참여 방식에 두 가지가 있다고 봅니다.

6-1. 대표성에 기반한 참여 (representational engagement)

이건 어떤 사람이 특정 집단을 대표해서 들어오는 방식입니다.
예를 들면,
  • 학생대표
  • 특정 학과 대표
  • 특정 직군 대표
  • 특정 병원/캠퍼스 대표
이런 참여의 장점은 뚜렷합니다.
  • 다양한 목소리를 반영할 수 있음
  • 정책의 정당성이 높아짐
  • 현장의 수용성(buy-in)을 얻기 쉬움
  • 소외된 집단의 이해관계를 드러낼 수 있음
그런데 단점도 있습니다.
논문은 이것이 파벌적 사익(factional self-interest)outsiderism 으로 흐를 수 있다고 말합니다.
여기서 outsiderism 은 흥미로운 표현인데, 쉽게 말하면:
입니다.
즉, 대표성 기반 참여는 자칫하면
  • 공통의 교육과정보다
  • “우리 집단 몫 지키기”
  • “우리 과의 이해관계 방어하기”
  • “저쪽이 또 다 가져가려 한다”
같은 방식으로 흘러갈 수 있다는 것입니다.

6-2. 전문성에 기반한 참여 (expertise-based engagement)

이건 어떤 사람이 그 분야의 전문지식 때문에 위원회에 참여하는 방식입니다.
예를 들면,
  • 평가 전문가
  • 교육과정 설계 전문가
  • 통계/측정 전문가
  • accreditation 전문가
이런 참여의 장점도 큽니다.
  • 질 높은 기술적 해결책 제시 가능
  • 복잡한 문제를 구조화 가능
  • 근거 기반 의사결정에 도움
  • 시행가능성 있는 설계 가능
하지만 단점도 있습니다.
논문은 이것이 buy-in이 부족한 technocratic solutions 로 흐를 수 있다고 말합니다.
여기서 technocratic solution
쉽게 말해 전문가가 보기엔 맞지만, 현장 사람들은 마음으로 동의하지 않는 해결책 입니다.

예를 들어,
  • 이론적으로 완벽한 평가체계
  • 구조적으로 아름다운 커리큘럼 매트릭스
  • 데이터상 타당한 개편안
이라 해도, 현장 교수들이
  • “현실을 모른다”
  • “실행이 너무 어렵다”
  • “우리 의견은 반영되지 않았다”
  • “전문가들이 위에서 설계만 했다”
고 느끼면 수용성이 떨어집니다.
즉, 전문성 기반 참여는 자칫하면 정치적 정당성 없이 기술적 정답만 내는 방식 이 될 수 있습니다.

7. 외부인(outsiders)이 왜 논쟁을 더 악화시킬 수 있는가?

논문은 facilitatior나 change management consultant 같은 외부인의 존재가 갈등을 악화시킬 수 있다고 말합니다.
처음 보면 이상하게 느껴질 수 있습니다.
보통 외부인은 갈등을 조정하러 오는 사람처럼 보이니까요.

그런데 왜 악화될 수 있을까요?
이유는 다음과 같습니다.
  • 외부인은 조직 내부의 역사와 감정을 잘 모를 수 있음
  • 중립적으로 보이지만 실제로는 특정 안건을 밀고 있다고 느껴질 수 있음
  • 내부 사람들에게 “우리 현실을 모른다”는 반감을 살 수 있음
  • 전문적 언어나 변화관리 담론이 오히려 현장에겐 강압적으로 들릴 수 있음
예를 들어,
외부 컨설턴트가 와서
“글로벌 베스트 프랙티스를 적용해야 합니다”
라고 말하면, 내부 사람들은

  • “또 외부 논리로 밀어붙이네”
  • “우리는 우리 나름의 맥락이 있는데”
  • “결국 이미 정해진 답을 설득하러 온 거 아닌가?”
라고 느낄 수 있습니다.
즉, 외부인은 해결자이면서 동시에 새로운 정치적 행위자(actor)가 됩니다.

 

이데올로기적 논쟁적 경합은 퍼실리테이터(facilitators)나 변화 관리 컨설턴트(change management consultants)와 같은 '외부인(outsiders)'의 존재로 인해 더욱 악화될 수 있다.

 

따라서 논쟁적 경합은 즉각적으로 드러나지는 않는 여러 주체들 사이의 권력(power)과 행위 주체성(agency)의 표현 및 협상(expression and negotiation)이라는 관점에서 이해될 필요가 있다. 이러한 권력은 종종 사람뿐만 아니라 구조(structures, 예: 교육과정)에도 부여되며, 행위 주체성은 개인적 특성과 집단적 특성(collective characteristics)을 모두 가질 수 있다. 논쟁적 경합은 맥락적(contextual)일 뿐만 아니라, 그것의 해결(resolution) 또한 맥락적이어야 한다. 논쟁적 경합의 해결책이 한 쪽이 다른 쪽을 상대로 '이기는(winning)' 것을 포함하는 경우는 드물다. 오히려 수용해야 할 다수의 이해관계자(multiple stakeholders)와 구조가 있으며, 이는 결과적으로 타협(compromises)으로 이어진다. 실제로, 현실적으로 말해서 타협은 의학교육의 핵심적인 조직 원리(organizing principle)라고 할 수 있다.9

 

그래서 논쟁적 경합은 무엇으로 이해해야 하는가?

논문은 매우 중요한 결론을 내립니다.
이 말을 쉽게 바꾸면,
사람들은 단지 의견을 내는 것이 아니라,
  • 누가 결정할 자격이 있는지
  • 누가 영향력을 가져야 하는지
  • 누가 발언권을 가져야 하는지
  • 누가 문제를 정의할 수 있는지
  • 누가 변화를 멈추거나 밀어붙일 수 있는지
를 놓고도 싸우고 있다는 뜻입니다.
즉, 교육과정 논쟁은 항상 권력의 문제 입니다.

여기서 말하는 power와 agency는 무슨 뜻인가?

Power

권력은 단순히 직책이 높은 사람이 가진 힘만 뜻하지 않습니다.
예를 들어 교육과정에서 권력은
  • 공식 직위
  • 전문성
  • 연륜
  • 네트워크
  • 인증 기준
  • 전통
  • 제도
  • 시간표 구조
  • 필수과목이라는 지위
같은 다양한 형태로 존재합니다.
논문은 특히 권력이 사람뿐 아니라 구조(structures) 에도 부여된다고 말합니다.

이 말은 굉장히 중요합니다.
예를 들어,
  • 현재 교육과정 구조 자체
  • 기존 학사 일정
  • 시험 제도
  • 인증 기준
  • 조직도
가 이미 어떤 가능성은 열고, 어떤 가능성은 닫습니다.
즉, 구조도 하나의 행위자처럼 작동합니다.
이런 관점은 구조화 이론(structuration theory) 이나 행위자-네트워크 이론(actor-network theory) 쪽과도 닿아 있습니다.

Agency

행위 주체성은 사람들이 그냥 상황에 끌려가는 존재가 아니라,
해석하고, 전략을 세우고, 개입하고, 변화시키려는 능력을 가진 존재라는 뜻입니다.

그런데 이 agency도 개인 수준만 있는 게 아니라,
  • 학과 차원
  • 교수집단 차원
  • 학생집단 차원
  • 직군 차원
처럼 집단적 agency 도 있습니다.
즉, 누가 무엇을 할 수 있는가는 개인 능력뿐 아니라 집단 정체성과 연합에도 달려 있습니다.

논쟁의 해결도 맥락적이어야 한다

이 문장은 매우 중요합니다.
논문은 말합니다.
즉, 어떤 위원회에서 잘 먹힌 해결책이 다른 학교에서 그대로 통하지 않을 수 있습니다.
왜냐하면 갈등의 원인이
  • 누적된 역사인지,
  • 대표성 부족인지,
  • 전문성 부족인지,
  • 신뢰 문제인지,
  • 자원 문제인지,
  • 정체성 문제인지
에 따라 해결 방식이 달라져야 하기 때문입니다.
이건 change management에서 아주 자주 놓치는 부분입니다.
표준 해법 하나로 갈등을 해결할 수 있다고 생각하는 순간 오히려 더 악화될 수 있습니다.

3.3 신화 3: 교육과정은 논쟁적 경합의 주요 초점이며, 마땅히 그래야 한다 (3.3 Myth 3: curriculum is and should be the main focus of contestation) 

 

교육과정 위원회의 업무는 때로 매우 치열한 논쟁의 대상이 될 수 있는데, 그 주된 이유는 아주 많은 의학교육자들이 교육과정을 의학교육의 정체성(identity), 목적(purpose), 성과(outcomes)를 정의하는 일차적 구성 개념(primary construct)으로 보기 때문이다. 따라서 많은 교수진(faculty members)이 교육과정 변화를 초래하거나 저항하는 데 많은 에너지, 희망, 그리고 두려움을 집중하는 것은 놀라운 일이 아니다 (앞의 그림 1 참조). 그러나 알고 보면, 교육과정의 중요성은 또 다른 신화이다. Hecker와 Violato11는 공식적인 교육과정 구조(formal curricular structure)가 면허 시험(licensure exams) 분산(variance)의 5% 미만을 차지한다는 것을 증명했으며, 최근 Kulasegaram 등22도 유사한 결과를 보여주었다. 모범 사례(best practices)를 사용하여 구축된 교육과정 구조가 필요하긴 하지만, (합리적인 선에서) 무엇을 가르치느냐(what is taught)는 종종 어떻게 가르치는지(how it is taught), 누구에게 가르치는지(who it is taught to), 그리고 누가 가르치는지(who does the teaching)보다 덜 중요하다.

 

그럼에도 불구하고, 교육과정과 이를 감독하는 교육과정 위원회는 종종 논쟁적 경합의 지렛대(fulcra) 역할을 한다. 여기에는 다양한 이유가 있다.

  • 하나는 사물(things, 즉 정책, 구조, 활동)이 사람보다 더 수용 가능한 도전의 대상(targets of challenge)이 될 수 있다는 점이다. 즉, 서로에게 도전하는 것보다 교육과정과 같은 추상적인 개념(abstraction)에 도전하는 것이 훨씬 더 쉬울 수 있다.
  • 다른 이유는, 유럽에서 더 널리 퍼져 있는 경향이 있는 교육학(pedagogy)('어떻게')에 초점을 맞춘 '교수법(didactics)'에서 영미권의 '교육과정' 및 그것과 내용('무엇')의 연관성으로의 이동이다.23

5. 그럼 왜 사람들은 여전히 교육과정을 두고 싸우는가?

여기서 논문은 매우 흥미로운 설명을 합니다.
교육과정은 실제 영향력이 절대적이지 않을 수 있지만, 그럼에도 불구하고 논쟁의 지렛대(fulcrum) 가 된다는 것입니다.
이유는 여러 가지가 있습니다.

5-1. 사람보다 ‘사물(things)’을 공격하는 것이 더 쉽다

이 대목은 아주 중요합니다.
논문은 말합니다.
예를 들어 회의에서 누군가 이렇게 말하는 것은 부담스럽습니다.
  • “김 교수님의 수업 방식이 문제입니다.”
  • “이 과는 교육에 헌신하지 않습니다.”
  • “당신들이 권력을 너무 많이 쥐고 있습니다.”
이건 너무 직접적이고 관계를 해칠 수 있습니다.
대신 사람들은 이렇게 말합니다.
  • “현재 교육과정 구조에 문제가 있습니다.”
  • “이 과목 배치가 적절하지 않습니다.”
  • “교육과정 정렬이 부족합니다.”
표면상으로는 curriculum을 말하지만, 실제로는
  • 특정 집단의 영향력
  • 특정 교수의 교육방식
  • 자원 배분
  • 권력 구조
  • 책임 회피
를 겨냥하고 있을 수도 있습니다.
즉, 교육과정은 종종 대리전(proxy battle) 의 대상이 됩니다.
이건 조직사회학적으로 보면
policy as proxy for politics 라고 볼 수 있는 장면입니다.
문서를 둘러싼 논쟁이 사실은 사람과 권력의 문제를 대리 표현하는 것이죠.

5-2. 무엇을 가르칠지(what)에 초점이 과도하게 쏠린다

논문은 또, 영미권에서는 ‘교육과정(curriculum)’ 이 주로 “무엇을 가르칠 것인가”와 강하게 연결되어 있다고 말합니다.
반면 어떤 전통에서는 pedagogy 또는 didactics 처럼
“어떻게 가르칠 것인가”가 더 중심일 수 있습니다.

저자들이 보기에는, 실제로 학습에 더 큰 영향을 줄 수 있는 것은 오히려
  • 수업 방식
  • 피드백 질
  • 임상지도 방식
  • 평가 방식
  • 관계와 문화
인데도,
위원회 안에서는 훨씬 더 많이 다음을 두고 싸운다는 것입니다.
  • 어떤 내용을 넣을지
  • 어느 과목 시간을 늘릴지
  • 어느 주제를 필수로 할지
  • 어느 항목을 문서에 명시할지
즉, whathow 를 압도하는 현상이 있다는 것입니다.

쉽게 말하면

사람들은
“어떤 내용을 넣을까?”
에는 매우 민감하지만,

정작
“그 내용을 실제로 어떻게 가르칠까?”
에는 상대적으로 덜 싸운다는 것입니다.

그런데 실제 교육 효과는 종종 후자에 더 많이 달려 있습니다.

 

우리는 보건의료전문직의 교육에 더 큰 영향을 미칠 가능성이 있는 교수(teaching)의 그러한 측면들보다 무엇을 가르칠 것인지와 관련하여 교육과정 위원회 내에서 훨씬 더 많은 논쟁적 경합을 보아왔다. 그렇긴 하지만, '어떻게'와 '무엇을'에 대한 논의 모두 제안된 변화의 세부 사항, 특히 교육과정 문서 및 도구(예: 평가 대본(assessment scripts) 및 루브릭(rubrics))에 사용되는 정확한 언어를 다듬는 과정(wordsmithing)에서 논쟁의 대상이 될 수 있다.

 

세 번째 문제는 교육과정이 종종 논쟁적 경합(그리고 타협)의 산물이며, 이것이 결과적으로 교육과정을 추가적인 논쟁적 경합을 위한 지속적인 장(ongoing locus)으로 정당화하고 관심을 집중시킨다는 것이다. 네 번째 문제는 의학 교사(medical teachers)와 다른 이해관계자들(other stakeholders) 간의 교육과정 논쟁적 경합을 반영한다. 교육과정을 소유하는 것은 (교수단이라는) 교수진(faculty)인가, 아니면 (조직적 실체라는) 단과대학(Faculty)인가? 아니면 소속 대학(host university)이나 보건의료 시스템(health care system), 혹은 정부나 사회 전체가 이를 소유하고 있는가? 과연 누군가 그것을 '소유(own)'하고 있기는 한가?24 우리는 수년에 걸쳐 교육과정에 대한 많은 논쟁적 경합을 보아왔는데, 이는 반드시 그것을 '옳게(right)' 만들기 위해서라기보다는 위원회의 목표와 그에 부과된 요구사항 및 한계 사이에서 가장 덜 파괴적인 타협(least disruptive compromise)을 찾기 위함이었다. 의사결정자(decision makers)의 자율성(autonomy) 및 전문성에 관한 문제가 내려져야 할 결정(예: 무엇을 어떻게 가르쳐야 하는지)과 얽힐 때 논쟁적 경합은 특히 혼탁해질(muddied) 수 있다.

 

6. 세 번째 문제: 교육과정은 이미 이전 논쟁과 타협의 산물이다

이 부분도 아주 중요합니다.
논문은 교육과정이 단순한 설계물이 아니라,
이미 수많은 갈등과 타협의 결과물이라고 말합니다.

즉, 현재의 교육과정은
  • 누군가의 승리만도 아니고
  • 누군가의 패배만도 아니며
  • 여러 이해관계자가 조금씩 양보한 흔적
으로 이루어져 있습니다.
그래서 교육과정은 자연스럽게 또다시 새로운 논쟁의 중심이 됩니다.
왜냐하면 사람들은 현재 교육과정을 보며 이렇게 생각할 수 있기 때문입니다.
  • “이건 예전 타협의 흔적일 뿐이다.”
  • “이 구조는 원래 최선이 아니라 당시의 정치적 절충안이었다.”
  • “그러니 지금 다시 손봐야 한다.”
즉, 교육과정은 한 번 완성되고 끝나는 것 이 아니라
계속해서 재논의되는 ongoing locus, 즉 지속적 논쟁의 장입니다.

7. 네 번째 문제: 도대체 교육과정은 누구의 것인가?

이 부분은 매우 본질적입니다.
논문은 교육과정 소유권(ownership)을 묻습니다.
  • 교수 개인들의 것인가?
  • 교수단 전체의 것인가?
  • 단과대학의 것인가?
  • 대학 본부의 것인가?
  • 보건의료 시스템의 것인가?
  • 정부의 것인가?
  • 사회의 것인가?
  • 학생도 공동 소유자인가?
  • 아니면 애초에 누구의 것이라고 말하기 어렵나?
이 질문은 단순한 철학적 질문이 아닙니다.
실제 의사결정 권한과 직결됩니다.

예를 들어,
  • 교수들은 “교육의 전문성은 우리에게 있다”고 말할 수 있고,
  • 대학 본부는 “학사 운영의 책임은 기관에 있다”고 말할 수 있으며,
  • 정부는 “사회적 책무성과 공공성 때문에 개입할 정당성이 있다”고 할 수 있고,
  • 학생은 “우리가 실제 경험하는 교육인 만큼 우리의 목소리도 중요하다”고 말할 수 있습니다.
즉, curriculum contestation은 내용만의 문제가 아니라
통제권(control), 정당성(legitimacy), 자율성(autonomy) 의 문제이기도 합니다.

11. 아주 쉬운 예시로 설명해보면

가령 어떤 의과대학이
“AI in Medicine” 교육을 넣을지 말지를 두고 논쟁한다고 해봅시다.

겉으로는 교육과정 논쟁처럼 보입니다.
  • 몇 학점 넣을까?
  • 필수로 할까 선택으로 할까?
  • 어느 학년에 배치할까?
하지만 실제로는 그 밑에 이런 문제가 숨어 있을 수 있습니다.
  • 누가 이 과목을 맡을 것인가?
  • 기존 과목 시간을 누구에게서 가져올 것인가?
  • 교육과정 결정권은 누가 갖는가?
  • 임상교수와 기초교수 중 누가 더 영향력이 큰가?
  • 교수 개인의 자율성을 위원회가 어디까지 제한할 수 있는가?
  • 대학은 사회적 요구를 우선할 것인가, 교수단의 자율성을 우선할 것인가?
즉, 표면상으로는 curriculum debate지만,
실제로는 권한, 자원, 정체성, 자율성, 소유권 의 문제입니다.

 

3.4 신화 4: 변화는 필요하고 바람직하다 (3.4 Myth 4: change is both necessary and desirable) 

앞서 언급했듯이, 변화 이론가(change theorists)들은 종종 변화를 본질적으로 바람직하고(intrinsically desirable) 불가피한(inevitable) 것으로 간주해 왔지만9 현실은 그렇지 않은 경우가 많다.

  • 우리는 모든 것을 더 잘할 수 있다는 원칙을 받아들이지만, 우리가 하는 일의 대부분은 이미 높은 품질을 갖추고 있으며, 이를 변경하는 것은 품질을 높일 가능성만큼이나 떨어뜨릴 가능성도 있다. 이는 교육 프로그램(educational programming)에서 혁신(innovation)책무성(stewardship, 관리) 사이의 본질적인 긴장을 반영한다.
    • 전자는 종종 새로운 것, 평판을 높이는 것, 그리고 '남들에게 뒤처지지 않으려는(keeping up with the Joneses)' 매력을 가지고 있는 반면,
    • 후자는 (정치적 의미가 아닌) 소문자 'c'를 쓰는 보수적(conservative)이고 반동적(reactionary)이라는 비판을 받을 수 있다.
  • 더욱이, 혁신이 훈련을 향상시킬 수는 있지만, 그 실행은 종종 엄격한 교육학적 평가(pedagogical evaluation)의 속도를 앞질러 피상적인 변화(superficial change)심지어 의도치 않은 결과(unintended consequences)를 초래하기도 한다.25
  • 교육과정 개정(curricular revisions)에 드는 재정적, 시간적, 감정적 비용이 학생의 학습이나 성과(performance)의 (가정된) 변화를 정당화할 수 있다 하더라도, 더 깊은 질문들(예를 들어, 그러한 혁신이 보건의료전문직 교육(HPE)의 인식론적(epistemological) 및 윤리적 목표(ethical goals)와 일치하는지 여부)은 종종 무시된다.
  • 그렇긴 하지만, 책무성 역시 문제를 가지고 있는데, 특히 '원래 항상 이런 식이었어'라는 인식이 강력한 평가와 비판을 가로막을 때 더욱 그러하다.

3. 혁신(innovation)과 책무적 관리(stewardship)의 긴장

이 부분이 매우 중요합니다.
논문은 교육프로그램 운영에 본질적인 긴장이 있다고 말합니다.

① 혁신(innovation)

혁신은 매력적입니다.
  • 새롭고
  • 미래지향적으로 보이며
  • 기관의 평판을 높여줄 것 같고
  • “다른 학교도 하니까 우리도 해야 한다”는 압박과 잘 맞습니다
여기서 논문이 쓴 “keeping up with the Joneses”
쉽게 말하면 “남들 하는 건 우리도 뒤처지지 않게 해야 한다” 는 심리입니다.
한국식으로 바꾸면,
“다른 의대도 AI curriculum 넣었는데 우리만 가만히 있을 수 있나?”
같은 감각입니다.

② 책무성 혹은 관리(stewardship)

반면 stewardship은
  • 기존의 좋은 것을 지키고
  • 자원을 신중하게 쓰고
  • 검증되지 않은 변화를 무작정 도입하지 않으며
  • 교육의 지속가능성을 생각하는 태도
입니다.
그런데 문제는, 이런 태도는 종종
  • 보수적이다
  • 소극적이다
  • 시대에 뒤처진다
  • 변화에 저항한다
는 비판을 받기 쉽다는 점입니다.
하지만 논문은 말합니다.
즉, 교육과정 리더십은 단순히 혁신가(innovator)가 되는 것만이 아니라,
좋은 것을 망치지 않도록 책임 있게 관리하는 관리자(steward) 의 역할도 해야 합니다.

이건 의학교육에서 매우 중요한 개념입니다.
특히 accreditation이나 curriculum governance를 하시는 입장에서는,
혁신과 stewardship의 균형은 정말 핵심적인 리더십 과제입니다.

5. 교육과정 개정의 진짜 비용은 무엇인가?

이 부분도 아주 현실적입니다.
교육과정 개정은 단순히 문서 수정이 아닙니다. 비용이 큽니다.

논문은 세 가지 비용을 언급합니다.
  • 재정적 비용
  • 시간적 비용
  • 감정적 비용
감정적 비용(emotional cost)이라는 표현이 특히 중요합니다.
왜냐하면 교육과정 개편은 사람들에게 다음을 유발할 수 있기 때문입니다.

  • 피로
  • 상실감
  • 소외감
  • 불안
  • 정체성 위협
예를 들어 어떤 과목의 축소는 단순히 시수 조정이 아니라,
그 과목을 가르쳐 온 교수에게는
“내 전문성이 덜 중요해졌다는 신호”
처럼 느껴질 수 있습니다.

따라서 논문은 묻습니다.
그리고 더 나아가,
라고 묻습니다.

6. 여기서 말하는 인식론적(epistemological) 목표란?

이건 선생님처럼 학술적으로 읽으실 때 중요한 표현입니다.
인식론(epistemology)
“무엇을 지식으로 볼 것인가?”, “어떻게 아는가?”에 관한 철학입니다.

따라서 교육의 인식론적 목표는 예를 들어 이런 질문입니다.
  • 우리는 어떤 종류의 지식을 중요하게 보는가?
  • 사실 암기인가, 비판적 사고인가?
  • 개별 전문지식인가, 통합적 판단인가?
  • 표준화된 정답인가, 맥락적 추론인가?
즉, 어떤 변화가 단순히 최신 유행이라서가 아니라,
우리가 지향하는 학습과 지식의 본질과 맞는가 를 물어야 한다는 뜻입니다.

 

변화를 제외하고는 영원한 것이 없다는 헤라클레이토스(Heraclitus)의 말26은 보건의료전문직 교육(HPE)의 맥락에서 특히 공감을 불러일으키는데, 여기서 교육과정 개발은 종종 사전 기획(pre-planning), 기획(planning), 실행(implementation), 평가(evaluation)의 주기로 특징지어지는 영구적인 개정의 나선형(spiral of perpetual revision)을 닮을 수 있다. 진화하는 사회적 요구와 기술의 발전에 대한 교육과정의 대응성(responsiveness)이 필요하다는 점에 반대할 사람은 거의 없겠지만, 변화의 바람직성(desirability), 방향(direction), 속도(pace)는 비판적 성찰(critical reflection)을 요한다. "개선한다는 것은 변화하는 것이고, 완벽하다는 것은 자주 변화하는 것이다"라는 처칠(Churchill)의 격언27은 수사학적으로 설득력이 있을지 모르지만, 긴장이 없는 것은 아니다. 적어도 모든 변화가 의미가 있는지, 아니면 어떤 경우에는 변화를 위한 변화(change occurs merely for its own sake)가 일어나는 것은 아닌지 질문해 볼 가치가 있다.

 

형평성, 다양성, 포용성(equity, diversity and inclusion, EDI)을 교육과정에 광범위하게 채택한 것이 좋은 사례이다. 최근의 교육과정 개혁은 의학교육에 내재된 구조적 불평등(structural inequities)을 정당하게 인정해 왔다. 그러나 이에 대한 대응은 제도적 문화의 더 깊은 병폐를 해결하지 않은 채 암묵적 편견(implicit bias) 훈련을 의무화하거나 위원회를 다양화하는 등, 변혁적(transformative)이라기보다는 수행적(performative)인 것으로 보일 수 있다.

 

11. 여기서 performative는 무슨 뜻인가?

이 문맥에서 performative
단순히 “수행한다”는 뜻이 아니라,

을 뜻합니다.
쉽게 말하면:
  • 암묵적 편견 교육을 의무화했다
  • 위원회 구성에 다양성을 추가했다
  • EDI 문구를 curriculum document에 넣었다
그런데 정작
  • 조직 문화는 그대로이고
  • 권력 구조는 바뀌지 않았으며
  • 소수자에게 불리한 평가 구조도 그대로이고
  • 실질적 참여 권한도 늘지 않았다면
그건 변혁적 변화 가 아니라 겉치레성 변화 일 수 있다는 것입니다.
즉, EDI가 commitment(헌신) 이 아니라
checklist(체크리스트) 가 되어버리는 것이죠.

이건 요즘 매우 중요한 비판입니다.
조직이 EDI를 “해야 하니까 하는 것”으로 만들면,
오히려 그 본래 취지를 약화시킬 수 있습니다.
  • 변화를 서두르는 과정에서, 선의의 개혁은 포용(inclusion)의 사회적, 정치적 차원을 모호하게 만들고 EDI를 헌신(commitment)이 아닌 체크리스트로 격하할 수 있다. 더욱이, EDI 이니셔티브를 실행하는 부담은, 특히 변화의 초기 채택 단계에서, 변화하지 않은 제도적 틀(institutional frameworks) 내에서 '옹호(advocate)'하도록 요구받는 소외된 개인들(marginalized individuals)에게 불균형적으로 떨어지는 경우가 많다.
  • 한편으로 이러한 토큰주의적 포용(tokenistic inclusion, 명목상의 포용)은 형평성이라는 의도된 목표를 훼손할 수 있을 뿐만 아니라, 사회적 책무성을 지닌 의학교육(socially accountable medical education)의 정신에 위배되는 결과인 번아웃(burnout), 이탈(disengagement), 냉소주의(cynicism)에 기여할 수 있다.
  • 다른 한편으로, 대표성이 부족한 사람들(underrepresented)의 목소리가 교육과정 논의(또는 의학교육 프로그램의 다른 측면에 관한 논의)에 포함되지 않는다면, 변화(또는 변화의 부재)는 그들의 관점을 수용하지 못할 가능성이 높으며 그 과정의 인식론적 정의(epistemic justice)는 미해결 상태로 남게 될 것이다.

15. epistemic justice(인식론적 정의)는 무슨 뜻인가?

아주 중요한 개념입니다.
Epistemic justice
누구의 경험과 지식이 정당한 지식으로 인정받는가 의 문제입니다.

쉽게 말하면:
  • 누가 말할 수 있는가?
  • 누구의 경험이 믿을 만한 것으로 받아들여지는가?
  • 어떤 관점이 의사결정에 포함되는가?
  • 누가 지식 생산의 주체로 인정받는가?
예를 들어 교육과정 개혁에서
소수자 학생이나 교수의 경험이 늘 주변화된다면,
그건 단순한 대표성 부족이 아니라
지식적 배제(epistemic exclusion) 의 문제입니다.

이건 최근 의학교육, 평가, 전문직업성 논의에서도 매우 중요한 개념입니다.

 

3.5 신화 5: 합의(또는 타협)는 논쟁적 경합보다 가치 있게 여겨진다 (3.5 Myth 5: consensus (or compromise) is valued over contestation) 

집단 의사결정(group decision-making)에서 목표는 일반적으로 논쟁적 경합(contestation)이 아니라 합의(consensus)이다. 그러나 이는 오히려 다양한 관점들을 침묵시키는(quietening) 결과를 낳을 수 있으며, 이는 그룹 내에서 분개(resentment), 험담(backbiting), 심지어 무관심(apathy)과 이탈(disengagement)을 포함한 장기적인 결과를 초래할 수 있다. 합의를 찾는 것은 최상의 상황에서도 어려울 수 있지만, 인식적 다양성(epistemic diversity, 사람들이 생각하는 바)인식론적 다양성(epistemological diversity, 사람들이 지식을 검증하는 방법)이 높을 때는 더욱 까다롭다.28 거버넌스 과정에 더 많은 투자(예: 투입된 시간, 연공서열, 개인적 안건)를 한 사람들은 투자를 덜 한 다른 그룹 구성원들보다 유리한 입장에 있다고 인식될 가능성이 높으며, 특히 의사결정 과정에서 어떤 지식이 관련성이 있거나 더 중요한지에 대한 논쟁적 경합이 있을 때 더욱 그러하다. 따라서 합의 구축(consensus-building)이 궁극적인 목표일 수 있지만, 논쟁적 경합은 참가자들에게 자신의 관점을 공유하고, 쟁점에 대해 토론하며, 대안(counterproposals)을 제시할 수 있는 기회를 제공한다. 위원회는 구성원들이 서로의 생각을 테스트하고 잠재적인 결정에 대해 충분히 생각할 수 있도록 허용할 때 제 기능을 발휘한다. 그렇지 않으면 창의성(creativity)과 비판적 사고(critical thinking)가 질식하는 것을 피할 수 없다. Wiener는 자신의 논쟁적 경합 이론(theory of contestation)에서 논쟁적 경합이 상호작용 내에서 불일치와 갈등을 허용하는 메타-조직적 프레임워크(meta-organizational framework)로 사용되어야 한다는 아이디어를 제시했다. 이를 달성하기 위해 개인들은 그룹 상호작용을 민주화하고, 권력 문제를 다루며, 의견 불일치가 있을 때 누구의 규범이 중요한지 명확히 하기 위해 "한편으로는 근본적인 규범과 다른 한편으로는 표준화된 절차 사이의 상상된 매개 수준(imagined intermediary level)"을 식별해야 한다.29

3. 왜 합의는 특히 어려운가? “다양성” 때문

논문은 두 종류의 다양성을 말합니다.

① 인식적 다양성 (epistemic diversity)

이건 사람들이 무엇을 생각하느냐 의 차이입니다.
예를 들어:
  • 어떤 교수는 학생 자율성을 중시하고
  • 어떤 교수는 표준화된 역량을 중시하며
  • 어떤 교수는 시험 성적을 더 중요하게 보고
  • 어떤 교수는 사회적 책무성을 더 중요하게 볼 수 있습니다
즉, 의견 내용의 차이 입니다.

② 인식론적 다양성 (epistemological diversity)

이건 더 깊은 차이입니다.
즉, 무엇을 근거 있는 지식으로 볼 것인가, 지식을 어떻게 검증할 것인가 의 차이입니다.

예를 들어:
  • 어떤 사람은 정량적 데이터만 강하게 믿고
  • 어떤 사람은 현장 경험과 내러티브를 중시하며
  • 어떤 사람은 학생 만족도보다 licensure outcomes를 더 신뢰하고
  • 어떤 사람은 실증적 근거보다 규범적/윤리적 정당성을 더 중요하게 여길 수 있습니다
즉, 단순히 “의견이 다른 것”이 아니라
의견을 정당화하는 방식 자체가 다른 것 입니다.

이런 상황에서는 합의가 훨씬 더 어려워집니다.

왜 중요할까?

같은 안건을 놓고도 사람들이
  • 같은 사실을 보고도 다르게 해석하고
  • 같은 자료를 보고도 중요도를 다르게 매기며
  • 무엇이 ‘좋은 근거’인지부터 합의가 안 될 수 있기 때문입니다.

8. “허용 가능한 논쟁”의 경계가 왜 필요한가?

논문은 논쟁을 무조건 찬양하지 않습니다.
아주 중요한 균형점을 제시합니다.

즉,
  • 모든 갈등이 좋은 것은 아니고
  • 모든 충돌이 생산적인 것은 아니며
  • 논쟁이 인신공격, 위협, 침묵 강요, 괴롭힘으로 가면 안 됩니다
그래서 건강한 위원회는
의견 불일치의 자유안전한 경계 를 동시에 가져야 합니다.

이걸 쉽게 나누면

허용되어야 하는 것

  • 이견 제시
  • 반론
  • 대안 제안
  • 문제 제기
  • 근거에 대한 비판
  • 절차에 대한 질문

허용되면 안 되는 것

  • 인신공격
  • 공개적 모욕
  • 권위로 찍어누르기
  • 특정 집단 침묵시키기
  • 보복 암시
  • 괴롭힘
즉, 위원회는 abuse로부터는 자유로워야 하지만, disagreement로부터는 자유로워선 안 된다 는 말입니다.
이 문장은 정말 중요합니다.

 

논쟁적 경합을 정상화(Normalizing)하려면, 허용 가능한 논쟁적 경합이 무엇인지, 그리고 그것이 언제 파괴적일 가능성이 있는지에 대한 명확한 경계(boundaries)를 가지고, 위원회 과정의 구조 속에 의견 불일치가 짜여진(woven) 공간이 필요하다.30 더욱이, 위원회는 남용(abuse)으로부터 자유로워야 하지만, 의견 불일치(disagreement)로부터 자유로워서는 안 된다. 마지막으로, 합의가 도달할 수 있다면 가치 있는 것이지만, 위원회는 합의가 반드시 '모두가 X에 완전히 동의함'을 의미하지는 않는다는 점을 이해해야 한다. 합의는 'X에 관한 타협(compromise)을 수용할 수 있음' 정도를 의미할 수도 있다. 모든 당사자가 완전히 동의하지(bought in) 않더라도 결정은 내려질 수 있으며, 미래의 논쟁적 경합 가능성은 열려 있을 수 있다.

11. 이 절을 아주 쉽게 비유하면

예를 들어 교육과정 위원회에서
“AI 교육을 필수로 넣을 것인가”를 논의한다고 해봅시다.

나쁜 방식의 합의 추구는 이렇습니다.
  • 분위기 흐리지 말자
  • 이미 방향은 정해졌다
  • 반대하면 비협조적으로 보인다
  • 다들 대충 고개 끄덕이고 넘어가자
겉으로는 합의입니다.
하지만 실제로는

  • 반대 의견은 묻혔고
  • 걱정은 해소되지 않았고
  • 회의 후 불만만 커집니다
좋은 방식은 다릅니다.
  • 왜 반대하는지 충분히 듣고
  • 누가 어떤 근거를 중요하게 보는지 드러내고
  • 대안안을 함께 검토하고
  • 완전한 찬성은 아니더라도 수용 가능한 타협점을 찾고
  • 나중에 재검토할 여지를 남깁니다
이 경우 갈등은 있었지만, 더 건강한 결정이 됩니다.

4 고찰 (4 DISCUSSION) 

본 논문에서 우리는 의학교육 학자(medical education scholars)이자 변화 주도자(change agents)로서의 집단적 경험을 사용하여 논쟁적 경합과 교육과정 변화에 관한 다섯 가지 신화를 식별했다. 이러한 신화를 식별함에 있어 우리의 목표는 교육과정 변화에 관한 결정이 중립적(neutral)이지 않다는 것을 보여주는 것이었다. 오히려 그러한 결정은 흔히 논쟁적 경합, 협상(negotiation), 그리고 타협의 결과이다. 의학교육 문헌에서 논쟁적 경합의 중요한 역할이 널리 인정되지는 않았지만, 우리는 그것이 교육과정 위원회와 기타 거버넌스 메커니즘(governance mechanisms)이 작동하는 방식에 근본적(fundamental)이라고 주장한다. 대화적 접근법(dialogical approach)을 통해 논쟁적 경합의 역할을 전면에 내세움으로써, 우리는 그것이 어떻게 이해관계자들로 하여금 자신의 근거(rationale)를 명확히 하고, 자신의 입장을 방어하며, 대안적 관점(alternative viewpoints)을 고려하게 만드는지 보여준다. 이러한 과정들은 검증되지 않은 가정(untested assumptions)을 드러내고, 기존 패러다임(paradigms)에 도전하며, 교육의 목적과 내용에 대한 더 깊은 탐구에 참여하게 한다. 즉, 그들은 이데올로그(ideologues)가 아니라 학자(scholars)가 되도록 요구받는다. 나아가 우리는 (매시지로서의 매체인) 이러한 신화들에 대한 우리의 경합이 교육과정 변화를 둘러싼 논의에서 종종 묘사되었던 것보다 훨씬 더 미묘하고 역동적인 현실을 조명하기를 희망한다. 이를 통해 교육과정 개발이 선형적이고, 합의적이며, 비정치적 노력(apolitical endeavour)이라는 단순한 개념을 넘어, 대신 만연한 협상(pervasive negotiation)으로 특징지어지는 지형(landscape)을 그려낼 수 있기를 바란다.

4. “대화적 접근(dialogical approach)”이란 무엇인가?

이 부분도 중요합니다.
저자들은 dialogical approach, 즉 대화적 접근법 을 통해 contestation의 역할을 전면에 내세운다고 말합니다.
여기서 dialogical은 단순히 “대화를 많이 한다”는 뜻이 아닙니다.
조금 더 깊게 보면,

는 뜻입니다.
즉, 저자들은 교육과정 의사결정을
  • 누군가 정답을 제시하는 과정이 아니라
  • 다양한 입장이 서로 부딪히며 의미를 만들어가는 과정
으로 보고 있습니다.
이 관점은 대화주의(dialogism), 혹은 Bakhtin적 감각과도 살짝 닿아 있습니다.
즉, 의미는 하나의 목소리에서 완성되는 것이 아니라 복수의 목소리 사이의 긴장 속에서 형성된다는 생각입니다.

7. “이데올로그가 아니라 학자가 되도록 요구받는다”는 말의 뜻

이 문장이 아주 인상적입니다.
이건 무슨 뜻일까요?

이데올로그(ideologue)

  • 자기 신념에 강하게 매달리고
  • 다른 관점을 열어두지 않으며
  • 이미 정해진 답을 밀어붙이는 사람

학자(scholar)

  • 자신의 전제를 검토하고
  • 근거를 따지고
  • 대안을 진지하게 고려하며
  • 복잡성을 견디는 사람
즉, 저자들은 contestation이 사람들에게
“내가 옳다”를 외치게 하는 것 이 아니라,
“왜 내가 이렇게 생각하는지, 다른 가능성은 무엇인지 학문적으로 성찰하게 하는 것” 이라고 보고 있습니다.

이건 굉장히 중요한 메시지입니다.
교육과정 위원회는 단지 정치적 힘겨루기 공간이 아니라,
잘 운영되면 지적 성찰과 학문적 판단의 공간 이 될 수 있다는 말입니다.

10. 이 결론을 정말 쉽게 다시 요약하면

이 논문의 전체 메시지는 이렇게 정리할 수 있습니다.

기존 통념

  • 교육과정 변화는 객관적이고 합리적이다
  • 좋은 근거가 있으면 대체로 합의가 된다
  • 갈등은 문제이거나 방해물이다

저자들의 주장

  • 교육과정 변화는 결코 중립적이지 않다
  • 실제로는 논쟁, 협상, 타협의 결과다
  • 갈등은 피해야 할 것이 아니라 이해하고 다뤄야 할 것이다
  • 논쟁은 사람들로 하여금 자신의 전제를 검토하고 더 학문적으로 사고하게 만든다
  • 따라서 교육과정 거버넌스는 비정치적 절차가 아니라 지속적 협상의 장이다

 

  • 신화 1(논쟁의 여지가 없는 교육과정 기획)에 반박하면서, 우리는 교육과정이 이데올로기적 투쟁(ideological struggle)의 장이라는 근본적인 사실에 초점을 맞추었다. 실제로, 보건의료전문직 교육(HPE)에서 널리 인정되지는 않았지만, 논쟁적 경합은 모든 교육과정 변화 과정에 본질적(intrinsic)이다. 이 신화를 폭로함으로써, 우리는 조화와 합의에 대한 순진한 기대(naïve expectation)를 넘어 의견 불일치를 예상하고 전략적으로 탐색할 수 있도록 우리 커뮤니티를 촉구했다.
  • 신화 2(논쟁적 경합은 두 개인 사이에서 일어난다)에 반박하면서, 우리는 논쟁적 경합을 권력(power)과 행위 주체성(agency)의 다면적인 협상(multifaceted negotiation)으로 규정했다. 학문적 충성도(disciplinary loyalties), 역사적 선례(historical precedents), 근본 문제에 대한 서로 다른 해석은 교육과정 변화 노력의 중심에 있는 경우가 아주 많다. 승리보다는 종종 타협이 결과가 된다는 우리의 주장은 서로 다른 목표와 이상을 가진 위원회 구성원들을 수용할 수 있는 유연하고 맥락화된 해결책(contextualized solutions)의 필요성을 강조한다.
  • 신화 3(교육과정은 논쟁적 경합의 주요 초점이며, 마땅히 그래야 한다)에 대한 반박은 공식적인 교육과정이 학생 성과(student outcomes)의 큰 부분을 차지한다는 개념을 약화시킨다. 교육학적 접근(pedagogical approaches), 교수 개발(faculty development), 학습 환경(learning environment) 자체를 포함하여 교수/학습 과정의 다른 측면에 더 많은 주의를 기울여야 한다.
  • 신화 4(변화는 필요하고 바람직하다)에 반박하면서, 우리는 사실 비판 없는 변화의 추구가 피상적인 개혁, 의도치 않은 결과, 엄격한 교육학적 평가의 무시로 이어질 수 있음에도 불구하고 변화가 항상 목표가 되어야 하는지에 대해 도전했다. 이에 대응하기 위해 교육자들은 제안된 변화가 진정으로 의미가 있는지, 그리고 HPE의 더 깊은 인식론적 및 윤리적 목표와 일치하는지 비판적으로 질문해야 한다.
  • 마지막으로, 신화 5(합의는 논쟁적 경합보다 가치 있게 여겨진다)에 반박하면서, 우리는 그룹이 의견 불일치를 헤쳐 나가는 방식에 대한 이해와 기대의 전환을 옹호했다. 조화와 모든 구성원들의 동의(buy-in)에 대한 보편적인 추구는 의도치 않게 (그리고 때로는 고의적으로) 다양한 관점을 억눌러 장기적인 분개와 이탈로 이어질 수 있다. 반면, 의견 불일치를 정상화하면 위원회의 과정 속에 의견 불일치와 그것을 성찰(reflection) 및 탐구에 활용하는 것이 통합된 민주화된 실천(democratizing practices)을 허용할 수 있다.

분명히 해두자면, 우리는 교육과정에서 논쟁적 경합의 만연한 성격을 비전문적(unprofessional)인 것으로 규정하려는 것이 아니다. 사실 그 반대이다. 우리는 논쟁적 경합이 필요하며, 이에 대한 부주의(inattention)나 그것이 바람직하지 않다는 기대가 우리 분야에서 문제를 영속시킬 뿐이라고 주장한다. 문제는 교육과정 변화에 관해 논쟁적 경합이 존재한다는 것이 아니라, 우리가 하나의 분야로서 그것에 대해 다소 거부감(squeamish)을 느끼고 포용하기를 꺼려하는 것 같다는 점이다. 그렇긴 하지만, 논쟁적 경합이 추구되는 구체적인 방식은 다소 비전문적일 수 있다. 비록 직접적인 경험에 따르면 규칙이 깨지는 경우는 드물며(기껏해야 구부러지는 정도일 것이다) 논쟁적 경합과 관련된 행동이 공식적인 제재를 받을 만큼 충분히 지독한(egregious) 경우는 드물지만(전혀 불가능한 것은 아니지만), 이는 다소 회색 지대(grey area)에 해당한다.

 

실제(practice)에서 논쟁적 경합의 역할에 대한 인식을 확립하기 위해, 우리는 교육자들이 필요할 때 논쟁적 경합에 참여할 수 있도록 다양한 형태의 논쟁적 경합을 식별하고, 이해하며, 건설적으로 참여할 수 있도록 훈련시킬 것을 제안한다. 또한 우리는 위원회가 의견 불일치를 억압하기보다는 그것을 명시적으로 허용하고 관리하는 과정을 개발할 것을 제안한다. 종종 인용되는 로버트의 규칙(Robert's Rules)31 이나 그와 동등한 구조와 같은 현재의 프레임워크들은 토론을 허용하도록 의도되었지만, 위원회 과정에서 논쟁적 경합을 가능하게 하고 관리하는 데에도 사용될 수 있다. 그렇다고 해서 모든 것이 규칙에 얽매여야 한다거나 반대 의견을 억누르기 위해 규칙을 사용할 수 없다는 의미는 아니다. 실제로 로버트의 규칙에 대한 대안으로 합의에 더 초점을 맞춘 마사의 규칙(Martha's Rules)32과 같은 대안도 있다. 오히려 논쟁적 경합에 참여하는 방법에 대한 과정에 주의를 기울임으로써, 우리는 더 많은 교육자들이 자신의 우려를 제기하고 전문적인 방식으로 다른 사람들과 협상할 수 있다고 느끼기를 바란다.

 

3. Robert’s Rules는 왜 언급되는가?

논문은 Robert’s Rules 를 예로 듭니다.
이건 쉽게 말하면,
회의를 질서 있게 운영하기 위한 대표적인 회의 규칙 체계 입니다.

보통 이런 것들을 정해줍니다.
  • 누가 언제 발언할 수 있는지
  • 안건을 어떻게 상정하는지
  • 수정안을 어떻게 제안하는지
  • 토론 후 어떻게 표결하는지
  • 소수 의견을 어떻게 다룰지
논문이 여기서 말하고 싶은 것은,
입니다.
즉, 절차는 갈등을 없애기 위한 것이 아니라
갈등을 안전하고 공정하게 다루기 위한 장치 가 될 수 있다는 것입니다.

4. 그런데 규칙이 있다고 다 좋은 것은 아니다

논문은 곧바로 중요한 단서를 붙입니다.
이 말은 아주 중요합니다.
왜냐하면 현실에서 회의 규칙은 때때로 이렇게 악용될 수 있기 때문입니다.
  • “이미 절차상 끝났습니다”
  • “그 발언은 지금 할 수 없습니다”
  • “규정상 더 토론할 수 없습니다”
  • “다수결로 결정났으니 끝입니다”
이렇게 되면 규칙은 공정성을 보장하는 장치가 아니라
권력 있는 사람들이 이견을 통제하는 도구 가 될 수 있습니다.

즉, 논문은 규칙 자체보다
규칙을 어떤 철학으로 사용하느냐 가 중요하다고 보는 것입니다.

5. Martha’s Rules는 왜 예로 드는가?

논문은 Robert’s Rules와 대조적으로 Martha’s Rules 도 언급합니다.
여기서 핵심은 특정 규칙 이름 자체보다,
회의 운영 방식에도 서로 다른 철학이 있다는 점입니다.

  • Robert’s Rules는 전통적으로 절차와 질서, 의사진행 에 강한 틀이고
  • Martha’s Rules는 상대적으로 합의와 숙의(consensus-oriented discussion) 에 더 무게를 둔 접근으로 소개됩니다
논문의 메시지는 이겁니다.
입니다.
즉, “규칙이 있느냐 없느냐”보다
그 규칙이 dissent를 살아 있게 만드는가, 죽이는가 가 더 중요합니다.

Robert's Rules (로버트의 규칙)

정식 명칭은 Robert's Rules of Order로, 1876년 미국 육군 공병 장교 Henry Martyn Robert가 만든 의회식 회의 진행 절차입니다. 미국에서 가장 널리 사용되는 회의 운영 규칙으로, 핵심 구조는 다음과 같습니다.
의장이 회의를 주재하고, 안건은 동의(motion) → 재청(second) → 토론(debate) → 표결(vote) 순서로 진행됩니다. 발언권 요청, 수정안 제출, 토론 종결 등 모든 절차가 명문화되어 있어서, 다수결 원칙 하에 소수 의견도 공식적으로 발언할 기회를 보장받습니다. 학회, 위원회, 이사회, 학생회 등 공식 회의체에서 폭넓게 채택되고 있습니다.
다만 본문에서 지적하듯이, 절차가 엄격한 만큼 오히려 규칙을 활용해 반대 의견을 절차적으로 차단하는 데 악용될 수도 있다는 한계가 있습니다.

Martha's Rules (마사의 규칙)

이에 대한 대안으로 제시된 것이 Martha's Rules입니다. 합의(consensus) 지향적 의사결정 방식으로, 일반적으로 다음과 같은 절차를 따릅니다.
제안자가 안건을 간략히 설명한 뒤, 참여자 전원이 찬성(support) / 반대(object) / 보류(stand aside) 중 하나로 즉시 의사를 표시합니다. 반대가 없으면 바로 채택되고, 반대가 있으면 반대자가 우려 사항을 설명한 후 짧은 논의를 거쳐 재투표합니다. 다수결로 밀어붙이기보다는 반대 의견을 명시적으로 청취하고 조율하는 데 초점을 둡니다.

 

우리는 또한 의과대학들이 교육과정에 집중된 초점과 자원을 학습 성과에 더 큰 영향을 미칠 수 있는 교육 환경의 다른 측면으로 전환할 것을 제안한다. 예를 들어, 가르칠 내용을 완벽하게 다듬는 것보다 학습자의 필요에 부응하고 증거 기반의 교수 및 학습 전략에 기초한 교육적 접근법(educational approaches)에 더 많은 관심을 기울이는 것은 어떨까? 우리는 또한 논쟁적 경합 과정을 정상화하는 학습 환경을 조성함으로써 심리적 안전감(psychological safety)을 구축하는 데 더 명시적인 주의를 기울여야 한다고 생각한다.

 

우리는 우리가 취한 대화적 접근법의 한계(limitations)를 인정한다. 그중 하나는 우리의 분석에 피할 수 없는 주관성(subjectivity)과 편향이 있다는 점이다. 우리는 아마도 의학교육자로서의 우리 자신의 경험을 바탕으로 우리가 볼 것으로 기대하는 것을 보고 있을 것이다. 비록 이것이 우리의 살아있는 경험의 타당성(validity of our lived experiences) 측면에서는 강점이지만, 전반적인 상황을 보여주지는 못하므로, 본 논문은 더 광범위한 대화에서의 하나의 움직임으로 간주되어야 하며, 우리는 이 논문이 그러한 대화를 촉진(catalyse)하는 데 도움이 되기를 희망한다. 우리의 주장을 전개함에 있어, 우리는 우리가 제공한 관점들이 우리 자신의 경험과 이해에 기초하고 있음을 인정한다. 우리 모두는 북미의 백인 학자임을 인정하지만, TW, RE, MK는 다양한 유럽의 맥락에서 일한 실질적인 경험도 가지고 있으며, 우리가 묘사한 논쟁적 경합의 문제들이 미국, 캐나다, 호주, 영국, 아일랜드, 뉴질랜드, 남아프리카공화국, 독일, 네덜란드, 스웨덴 등지에서 나타나는 것을 발견했다는 점을 덧붙인다. 실제로 우리는 교육과정 체계의 논쟁적 경합이 전부는 아니더라도 대부분의 의학교육 시스템에서 일반적인 요소이지만, 그 표현 방식은 다를 수 있다고 생각한다. 부분적으로 이는 규칙과 관계 중 어느 것이 더 중요한지33와 같은 쟁점에 대한 문화적 차이(cultural differences)나 개인 간 권력 거리(power distances)의 정도와 형태에 기인할 수 있으며, 이 모든 것이 토론과 의사결정을 형성할 수 있다.34 적어도, 우리는 의학교육 기획 내에서 논쟁적 경합의 역할을 정상화하고, 이것이 의학교육 지형의 다양한 측면에서 무엇을 의미하는지에 대한 건설적인 토론에 다른 사람들을 참여시키기를 희망한다.

 

 

 

 

 

Acad Med. 2025 Aug 1;100(8):896-908. doi: 10.1097/ACM.0000000000006072. Epub 2025 Apr 22.

Curriculum Research Solutions: Shifting From "Did It Work Locally?" to Contributing to a Scholarly Conversation 

 

 

📝 우리 학교의 새로운 교육과정, 논문으로 낼 수 있을까

교육 현장에 계신 분들이라면 한 번쯤 이런 생각 해보셨을 겁니다. "이번에 새로 도입한 플립 러닝(flipped classroom) 반응이 너무 좋은데? 학생들 성적도 올랐고! 이거 데이터 모아서 논문으로 하나 써볼까?" 하지만 야심 차게 준비한 교육과정 중심 연구(curriculum-focused research)는 종종 학술지에서 거절당하곤 합니다. 도대체 왜 그럴까요? 단순히 데이터가 부족해서일까요? 오늘 소개해 드릴 논문에서는 그 근본적인 이유와 함께, 내 교육과정을 훌륭한 연구로 탈바꿈시키는 핵심 비법을 소개합니다! 💡

🚫 내 교육과정 연구가 번번이 거절당하는 5가지 이유 

저자들은 교육자들이 흔히 범하는 실수들을 날카롭게 지적합니다.

  1. 중복성 (Redundancy): "가르치면 성적이 오른다"는 건 이미 수백 편의 연구가 증명했습니다. 또 증명할 필요는 없겠죠?
  2. 맥락 특수성 (Context-specificity): 우리 학교만의 독특한 문화나 환경에서만 통하는 결과라면, 지구 반대편의 다른 교육자에게는 별 도움이 되지 않습니다.
  3. 교란과 희석 (Confounding and dilution): 성적이 오른 게 정말 내 수업 때문일까요? 학생들이 따로 학원에 다녔거나, 시간이 지나면서 자연스럽게 성장했을 수도 있습니다.
  4. 피상성 (Superficiality): 연구를 위해 정교하게 설계된 데이터가 아니라, 기말고사 점수나 형식적인 강의 평가 등 '얻기 쉬운 데이터'만 사용한 경우입니다.
  5. 개념적 모호성 (Conceptual obscurity): 현상을 설명해 줄 탄탄한 이론적/개념적 프레임워크(conceptual framework)가 빠져있어 연구가 방향을 잃는 경우입니다.

🔑 해결책: '내 수업'에서 벗어나 '학술적 대화'에 참여하라 

이 논문이 제시하는 가장 핵심적인 통찰은 바로 초점의 전환입니다.

연구진은 이렇게 당부합니다.

"(동료심사 출판으로 이어지는) 연구의 목적은 국지적인 교육과정에 대해 '연구를 하는 것'이 아니라,
전 세계적인 '학술적 대화'에 참여하고 유용한 기여를 함으로써 해당 분야를 발전시키는 것입니다."

(“The purpose of research (leading to peer-reviewed publication) is not to “do research” on the local curriculum but rather to advance the field by joining a global “scholarly conversation” and making a useful contribution.”)

 

즉, "내 수업이 효과가 있었나?"를 자랑하는 것은 일기장이나 내부 보고서에 어울립니다. 학술지라는 파티에서 훌륭한 대화 상대가 되려면 다른 기관의 사람들이 겪는 문제(needs of others)에 집중해야 합니다.

"국지적 요구와 성취에서 타인의 요구로 초점을 전환하는 것(즉, 학술적 대화를 진전시키고 과학을 발전시키는 것)이 모든 연구에서와 마찬가지로 교육과정 연구에서 성공의 열쇠입니다."
(“Shifting the focus from local needs and accomplishments to the needs of others (i.e., advancing the scholarly conversation and advancing the science) is the key to success in curriculum research—as in all research.”)


🚀 더 나은 연구를 위한 꿀팁: "효과가 있나?" 대신 "왜, 어떻게 작용하나?" 

지금까지 많은 교육 연구가 "우리 프로그램이 효과가 있었나요?(Did it work?)"를 묻는 정당화(justification) 연구에 머물렀습니다. 하지만 앞서 말했듯 교육은 안 하는 것보단 무조건 효과가 있기 마련입니다.

이제는 질문을 바꿔야 합니다. 다른 연구자들도 궁금해할 만한 "이 교육은 왜, 그리고 어떻게 작용하는가?(Why and how does it work?)" 혹은 "어떤 상황에서 누구에게 가장 효과적인가?"를 밝히는 명료화(clarification) 연구로 나아가야 합니다. 이를 위해서는 튼튼한 개념적 프레임워크(conceptual framework)를 바탕으로 가설을 세우고 연구를 설계하는 것이 필수적입니다.

맺음말: 꼭 논문을 써야만 훌륭한 교육자인가요? 🌱

마지막으로 연구진은 아주 따뜻하고 현실적인 조언을 건넵니다. 모든 사람이 굳이 학술지에 실리는 '대문자 연구(Research)'를 할 필요는 없다는 것입니다.

 

우리 학교 학생들을 위해 좋은 교육과정을 개발하고, 내부적으로 평가하여 질을 높이는 '소문자 연구(research)'나 학술적 교수법(scholarly teaching) 그 자체로도 이미 엄청난 가치가 있습니다. 자신이 진정으로 원하는 것이 출판을 위한 험난한 연구인지, 아니면 현장에서 학생들과 호흡하며 교육의 질을 높이는 것인지 솔직하게 고민해 보는 것이 첫걸음입니다.

 


 

보건의료 전문직 교육자들(Health professions educators)은 종종 자신들의 교육과정(curriculum)을 연구하고자 합니다. 학위 수여 프로그램(degree-granting program)을 위한 새롭거나 개정된 교육과정이든, 해당 교육과정의 한 구성 요소이든, 또는 독립된 과정이나 세션(stand-alone course or session)이든 상관없이 말입니다. 이러한 조사 노력(investigative efforts)은 일반적으로 새로운 기술, 교수 기법 또는 교육 패러다임(educational paradigm)(예: 온라인 학습, 역량 기반 교육(competency-based education), 플립 러닝(flipped classroom), 정밀 교육(precision education))의 적용과 같은 혁신적인 교수법(innovative teaching approach)에 대한 기대감에서 비롯됩니다. 다른 자극제로는 새롭거나 화제가 되거나 이전에 충분히 다뤄지지 않았던 주제를 다루는 새로운 과정을 도입하거나, "과거의" 교육과정에 대해 전면적인(종종 막대한 자원이 소요되는) 개편을 단행하는 것 등이 있습니다.

  • 누군가는 논문 출판을 제안하기도 하고("우리 새로운 교육과정에 대한 논문을 발표해야 해!"),
  • 교육 훈련의 임상적 또는 경제적 영향(clinical or economic impact)에 대해 곰곰이 생각해보거나("환자의 예후에 미치는 영향은 무엇인가?" 또는 "이것이 더 큰 효율성과 비용 절감으로 이어지는가?"), 혹은
  • 하나의 목적(예: 인증(accreditation))을 위해 수집된 데이터 세트를 연구 목적으로 용도를 변경할 수 있다고 추측하기도 합니다("우리에겐 이미 데이터가 있어!").

아아, 교육과정 중심 연구(curriculum-focused studies)는 출판하기 어려울 수 있습니다. 실제로 보건의료 전문직 교육(health professions education, HPE) 분야에서 이러한 연구는 반복적으로 만류되어 왔는데,1–7 그 이유 중 하나는 "결과가 교란되어 있고 사소하기(confounded and trivial)" 때문입니다.1 그러나 실용적인 해결책을 제시한 저자는 거의 없습니다. 우리는 그 격차를 바로잡고자 합니다. 적절하게 설계되고 실행될 때, 교육과정 중심 연구는 교육 과학(education science)에 중요한 기여를 할 수 있습니다. 이 논문의 목적은 HPE 내 교육과정 연구의 일반적인 문제점들을 명확히 설명하고, 교육과정 연구가 성공적으로 수행(및 출판)될 수 있는 구체적인 방법들을 제안하는 것입니다. 우리는 잠재적으로 성공 가능한 교육과정 중심 연구의 예시를 제시하고, 피해야 할 연구들을 강조하며, 실제적 고려사항(practical considerations)으로 결론을 맺습니다.

정의 및 개념적 프레임워크 (Definitions and Conceptual Framework) 

이 논문에서 우리는 여러 유형의 교육 활동을 "교육과정"의 (일부)로 간주합니다. 즉,

  • 단일 교육 세션,
  • 하나의 과정(course)으로 조직된 일련의 교육 세션,
  • 훈련 프로그램 단계(예: 훈련 연도, 임상실습 로테이션(clerkship rotation))로 조직된 일련의 과정/경험, 그리고
  • 프로그램 전체가 여기에 해당합니다.

우리의 제안은 모든 전문직(비보건의료 전문직 포함), 전공 분야, 그리고 훈련 수준(지속적인 전문성 개발(continuing professional development) 포함)의 활동에 적용됩니다.

 

우리는 연구(research)를 동료심사 포럼(peer-reviewed forum)(예: 저널 출판)에 결과를 배포할 의도로 새로운 지식을 엄격하고 체계적으로 추구하는 것으로 정의합니다.8,9 연구는 학술활동(scholarship)이라는 더 넓은 개념의 하위 집합으로, 학술활동은 "학자[주제를 아주 상세히 연구하는 사람]의 자질, 방법 또는 성취"10로 정의됩니다. 보이어(Boyer)11는 4가지 유형의 학술활동을 구분하는 널리 인정받는 모델을 설명했으며(표 1), 우리의 연구 정의는 발견의 학술활동(scholarship of Discovery)과 대체로 일치합니다. 우리는 교수 및 학습(Teaching and Learning),12–15 적용(Application),16,17 그리고 통합(Integration)16,18이라는 보이어의 다른 형태의 학술활동을 인정하고 높이 평가합니다. 하지만 동료심사 저널(peer-reviewed journal)에 출판하는 것을 목표로 하는 대부분의 연구자들이 구상하는 교육과정 중심 연구의 목표는 이러한 활동들이 아니라고 제안합니다.

 

표 1. 보이어(Boyer)가 정의한 4가지 유형의 학술활동 (Table 1. Four Types of Scholarship, as Defined by Boyer) 

유형 (Type) 보이어의 원문에 따른 정의 (페이지) (Definition (page) as per Boyer’s original text)11 예시 (Examples)
발견 (Discovery) • "새로운 지식의 발견 (Discovery of new knowledge)" (18)

• "학자들이 '연구(research)'에 대해 말할 때 의미하는 바에 가장 근접함" (17)

• "지식 그 자체, 탐구의 자유, 그리고 ... 훈련된 ... 조사에 대한 헌신" (17)
• 전통적인 "독창적(original)" 연구

• 체계적인 과정을 사용하여 새로운 통찰력을 식별하고 해당 분야의 전문가를 대상으로 하는 문헌 고찰(Literature reviews)a 및 개념적 연구(conceptual works)8
통합 (Integration) • "학문 간의 연결을 만들고, 전문 분야를 더 큰 맥락에 배치하며, 데이터를 의미 있게 조명하고, 종종 비전문가를 교육함" (18)

• "원저 연구(original research)를 해석하고, 결합하며, 새로운 통찰력을 제공하고자 하는 진지하고 훈련된 작업" (19)

• "'결과가 의미하는 바는 무엇인가? 발견된 것을 더 크고 포괄적인 이해를 제공하는 방식으로 해석할 수 있는가?' 이와 같은 질문들은 비판적 분석(critical analysis)과 해석의 힘을 요구함" (19)

• "[다음을 포함할 수 있음] 교과서 집필, ... 종종 '대중적 글쓰기(popular writing)'라 불리는 비전문가를 위한 글쓰기, ... 양질의 컴퓨터 소프트웨어 준비, ... 비디오 카세트 및 텔레비전, ... [그리고] 핵심 교육과정(core curriculum) 구성 또는 학제간 세미나(cross-disciplinary seminar) 준비" (34–36)
• 특히 비전문가 독자를 대상으로 특정 주제에 대한 연구 결과 개요를 제공하는 문헌 고찰, 저서, 팟캐스트 또는 블로그a

• 한 분야에서 사용되는 개념이나 접근법을 다른 분야에 도입

• 학문이나 시간을 초월한 정보의 종합
적용 (Application) • "'지식이 중대한 문제에 어떻게 책임 있게 적용될 수 있는가? 기관뿐만 아니라 개인에게도 어떻게 도움이 될 수 있는가? ... 사회적 문제 자체가 학술적 조사(scholarly investigation)의 의제를 정의할 수 있는가?'" (21)

• "새로운 지적 이해는 바로 이 적용이라는 행위 자체에서 발생할 수 있음" (23)

• "학술활동(scholarship)으로 인정받기 위해서는, 봉사 활동[위원회 참여, 학생 동아리 지도, 시의회 참여 등]이 개인의 전문 지식 분야와 직접적으로 연결되어야 하며, 이러한 전문적인 활동과 관련되고 그로부터 직접 파생되어야 함. 이러한 봉사는 진지하고 까다로운 작업이며, 전통적으로 연구 활동과 연관된 엄격함(rigor)과 책무성(accountability)을 요구함" (22)

• "교수의 지적 작업과 직접적으로 관련되는 활동들이 포함되며 ... 자문, 기술 지원, 정책 분석, [그리고] 프로그램 평가(program evaluation)를 통해 수행됨" (36–37)
• 응용 연구(Applied research) 또는 기술 이전(technology transfer); 실생활의 새로운 제품, 프로세스 또는 서비스를 만들기 위한 연구(지식, 방법)의 실용적 적용

• 기술 지원 및 자문; 특정 기술 분야(예: 공학, 정보 기술)에 대한 전문성 공유

• 전문적인 지식과 직접적으로 연결된 전문 기관이나 지역사회 그룹에서의 리더십 역할
교수 [및 학습] (Teaching [and Learning]) • "가르치는 자는 ... 정보에 밝고, 자신의 분야의 지식에 깊이 스며들어 있어야 하며 ... 폭넓게 읽고 지적으로 참여해야 함" (23)

• "교육적 절차(Pedagogical procedures)는 세심하게 계획되고, 지속적으로 검토되어야 하며, 가르치는 주제와 직접적으로 연관되어야 함" (23)

• "교수(teaching)가 연구(research)와 동등하게 간주되려면, 단일 기관 내에서만이 아니라 학계 내에서 인정되는 기준을 사용하여 엄격하게 평가(vigorously assessed)되어야 함 .... 증거는 최소 세 가지 출처에서 수집되어야 함: 자기 평가, 동료 평가, 학생 평가" (37)
• 최상의 교육 실무의 체계적 적용 후, 평가, 성찰, 타인과의 공유; 공유 기회에는 교수에 관한 워크숍, 블로그, 저서, 교육 매뉴얼 또는 정책 문서가 포함됨

• 지속적인 학습 자료(예: 오픈 액세스 온라인 모듈, 출판된 강의 계획, 새로운 평가 도구)의 생성 및 공유

• 피교육자의 목표와 성과에 대한 문서화를 수반하는 교육생 또는 동료에 대한 멘토링, 코칭 또는 조언(1대1 교육)

• 훌륭한 교수에 대한 공개적 인정 (동료 또는 학생으로부터)

a 문헌 고찰(literature reviews)을 발견(Discovery) 또는 통합(Integration)으로 분류하는 보이어(Boyer)의 분류11는 모호합니다.

  • 본 논문의 저자들은 체계적인 방법(반드시 "체계적 문헌고찰(systematic reviews)"에 국한되지 않음)을 사용하고, 새로운 통찰력을 생성하며, 과학계의 동료들을 대상으로 하는 고찰은 발견(Discovery)에 해당한다고 제안합니다.
  • 덜 체계적인 방법을 사용하거나, 간략한 개요 또는 시놉시스를 제공하거나, 비과학계 독자를 대상으로 하는 고찰은 통합(Integration)으로 분류될 수 있습니다.

두 유형 모두 고품질의 고찰은 "연구(research)" 자격을 얻을 수 있으며 학술적 논의에 중요하게 기여할 수 있습니다.

 

야심 찬 교육 연구자들(aspiring education researchers)에게 한 가지 과제는 연구(research)가 단순히 "주제에 대한 상세한 공부(detailed study of a subject)"10로 정의될 수도 있다는 것입니다. (동료심사를 거친 배포(peer-reviewed dissemination)의 목적을 생략한) 이러한 광범위한 정의는 프로그램 평가(program evaluation), 질 향상(quality improvement), 교육 혁신(education innovation), 그리고 학술적 교수법(scholarly teaching)과 같은 관련 개념들을 모두 포괄할 수 있습니다. 이러한 개념들 간의 중복은 혼란을 야기하고 때로는 좌절감을 낳을 수 있습니다. 예를 들어, 잠재적인 교육 연구 활동은 교육적 혁신을 연구하기 위해 질 향상 접근법(예: 계획-실행-학습-적용 사이클(Plan-Do-Study-Act cycle))을 사용할 수 있으며, 그 결과는 일상적인 프로그램 평가 보고서와 학습자 평가(learner assessments)에서 도출될 수 있습니다. 이 활동은 좁은 정의와 동료심사 출판의 목표를 반영하는 "Research(대문자 R 의도)" 프로젝트로 구성되거나, 광범위한 정의와 국지적 적용(local application)의 목표를 반영하는 "research(소문자 r 의도)" 프로젝트로 구성될 수 있습니다.

  • Research 프로젝트와 research 프로젝트 간의 차이는 방법(이 예시에서는 둘 다 질 향상 및 프로그램 평가 방법을 사용함)이나 연구 대상(교육적 혁신)에 있다기보다는 프로젝트 자체의 의도(intent)에 있습니다.
  • 우리의 프레임워크에서 대문자 Research는 외부 독자를 대상으로 하므로 반드시 국지적 상황을 넘어서는 관련된 질문들에 답해야 합니다.
  • 반면 소문자 research국지적인 사용을 위해 의도된 것입니다.
  • 이러한 각각의 의도는 다양한 방법을 사용하여, 그리고 변동성 있는 엄격함(variable rigor)을 가지고 추구될 수 있습니다. 이 논문에서 우리가 설명하는 모든 연구는 대문자 Research이며, 대문자와 소문자의 구분은 더 이상 계속하지 않겠습니다.

임상의학(clinical medicine)에서도 이와 동일한 긴장—그리고 동일한 결론—을 발견할 수 있습니다. 예를 들어, 대부분의 임상 질 향상 활동은 국지적 독자를 대상으로 의도되지만, 그중 일부는 외부로 확산됩니다. 교육 연구와 임상 연구 모두에서 핵심적인 차이는 방법론 자체에 있다기보다는, 외부 독자에게 적용하기 위한 문제, 해결책, 평가를 어떻게 구성(framing)하느냐에 있습니다(여기에는 이전의 관련 경험적 및 개념적 연구(prior relevant empirical and conceptual work)에 대한 참조 및 확장이 포함됩니다).

 

교육과정 중심 연구의 문제점 (Problems With Curriculum-Focused Research) 

교육과정 중심 연구(curriculum-focused research)의 한 가지 과제는, 야심 찬 저자들이 동료심사 저널(peer-reviewed journal)에 출판하기를 희망함에도 불구하고 종종 저널 편집자, 동료 심사자(peer reviewers), 그리고 잠재적 독자들의 관점과 기대를 제대로 이해하지 못한다는 것입니다. 우리는 교육과정 중심 연구에서 관찰되는 5가지 공통적인 문제점들을 발견했습니다:

  • 중복성(redundancy)(선행 연구를 바탕으로 발전시키지 못함),
  • 맥락 특수성(context-specificity),
  • 교란과 희석(confounding and dilution),
  • 피상성(superficiality)(편의적인 데이터 출처 사용), 그리고
  • 개념적 모호성(conceptual obscurity)(관련 개념적 프레임워크를 사용하지 못함).

중복성 (Redundancy) 

많은 교육과정 중심 프로젝트에서 근본적인 질문에 대한 답은 이미 알려져 있습니다. 이러한 프로젝트들은 "가르치면 배우게 될 것이다"라는 발견을 재입증합니다.19 교육자들은 보편적으로 "주제 X에 대한 내 과정이 학습 성과(learning outcomes)를 향상시키는가?"를 알고 싶어 합니다. 그러나 외부 독자에게 이것은 "가르치는 것이 학습 성과를 향상시키는가?"라는 일반적인 질문으로 번역되며, 그 대답은 거의 항상 "그렇다"입니다. 예를 들어, 수백 개의 인터넷 기반 교육(Internet-based instruction) 및 시뮬레이션 기반 교육(simulation-based education) 연구를 종합한 메타분석(meta-analyses)에 따르면, 극히 예외적인 경우를 제외하고 교육적 개입(educational interventions)은 개입이 없는 대조군(no-intervention controls)과 비교했을 때 예외 없이 성과를 향상시킵니다.19,20 이러한 일관된 발견은 교육적 개입을 개입이 없는 것과 비교하는 추가 연구가 중복적이며 불필요하다는 것을 시사합니다.2

 

중복성의 또 다른 발현은 부적절한 문헌 고찰(inadequate literature review)이며,21,22 이는 5가지 방식으로 나타납니다:

  • 선행 문헌에 대한 고찰이 완전히 부재한 경우. 저자들이 해당 문헌 지식체계에 기여하려고 노력하면서도 자신들의 연구와 관련된 문헌의 존재를 인정하지 않는 것은 아이러니합니다.
  • 교육 과정(educational process)의 다른 측면들보다는 특정 주제에 대한 교육과정에만 초점을 맞춘 문헌 고찰. 여기에는 두 가지 문제가 있습니다:
    • 첫째, 주제를 너무 좁게 정의하여 어떤 교육과정 접근법이든 "최초"가 되게 만드는 것이 항상 가능합니다. ("사람들이 다른 주제에 대해서는 이 교육적 접근법을 사용해왔지만, 이 특정 주제에 대해 이 특정 접근법을 사용한 사람은 아무도 없다.")
    • 둘째, 어떤 접근법이 다른 주제에서 효과가 있었다면, 이 주제에서도 효과가 있을 가능성이 매우 높습니다. 연구자는 새로운 주제가 너무나 달라서 새로운 연구나 반복 연구(replication)가 필요하다는 것을 독자들에게 납득시켜야 하지만, 저자들은 종종 이러한 입증 책임(burden of proof)을 충족하지 못합니다.
  • 교육과정의 특정 주제에 초점을 맞춘 문헌 고찰.
    • 이러한 유형의 고찰은 주제 자체의 중요성을 강조합니다("주제 X[예: 특정 의학적 상태]는 환자의 이환율(morbidity)을 크게 높이기 때문에 매우 중요하다."). 만약 이것이 주제 X에 대한 연구라면 적절하겠지만, 교육에 대한 연구에서 주제 X와 관련된 인용은 불필요하며, 교육 관련 문제(예: 이론의 강점과 약점, 교수 접근법(instructional approaches), 연구 설계(study designs), 이전 연구의 성과)에 대한 철저한 검토를 대체해서는 안 됩니다.
  • 관련 선행 연구를 누락하는(또는 그 간략함으로 인해 그러한 연구가 존재할 가능성을 열어두는) 피상적인 문헌 고찰(cursory literature review).
    • 저자들은 종종 "...하는 연구를 우리는 알지 못한다"라고 언급하며 방어적인 태도를 취합니다. 그러나 그러한 진술은 저자들이 얼마나 열심히 찾아보았는지에 대한 아무런 지표도 제공하지 못합니다. 그들이 알지 못한다는 것은 단순히 불완전한 검색을 반영할 수 있습니다. 보다 설득력 있는 주장은 "관련 검색어를 사용하여 PubMed와 Google을 성실히 검색한 결과 ...하는 연구는 발견되지 않았다"가 될 것입니다.
  • 해당 분야로 제한된 고찰(restricted-to-this-field review).
    • 보건의료 전문직 교육자들은 종종 자신들의 검색을 같은 전문직 종사자들에 대한 문헌으로 제한합니다. 예를 들어, 의사는 현재 및 미래의 의사를 포함하는 연구를 찾고, 간호사는 간호사를 포함하는 연구를 찾으며, 약사는 약사를 포함하는 연구를 찾습니다.
    • 그러나 약사, 간호사, 심지어 비보건의료 전문직 학습자(초, 중, 고, 고등 교육 기관의 학습자 포함)에게 효과가 있는 것은 의사에게도 효과가 있거나 적어도 의사(또는 간호사나 약사)를 대상으로 하는 연구의 출발점을 제공하는 경우가 많습니다.

맥락 특수성 (Context specificity) 

모든 정치는 지역적이며, 교육과정 역시 그러합니다. 한 기관에서 행해지는 것은 고유한 문화, 학습 환경, 학습자, 교육자, 그리고 자원 때문에 (엄밀히 말해) 오직 그 기관에만 관련이 있습니다. 더욱이, 교육과정을 다른 현장에서 복제하거나 구현하기가 어렵기 때문에, 교육과정이 국지적으로 효과가 있었다는 것을 아는 것은 제한적인 유용성만 가집니다.1,23 한 저자는 이러한 연구를 "시장 조사(market research)"로 해석했습니다2 (즉, 독자들이 온전한 교육과정—그리고 아마도 기관의 문화까지도—을 습득할 수 있을 때만 유용함). 맥락 특수성의 문제는 연구가 교육과정의 더 큰 구성 요소(예: 전체 프로그램 또는 대규모 블록 [단계, 연도])에 초점을 맞출 때 더욱 두드러집니다.1

교란과 희석 (Confounding and dilution) 

  • 교란(Confounding)은 관찰된 결과가 개입의 어떤 특정 특징으로 역추적될 수 없을 때 발생합니다.1,23
    • 교란은 복잡한 개입(complex interventions)(교육과정을 변경할 때 흔히 그렇듯 여러 구성 요소가 동시에 변하는 경우)이나 측정 전에 계획되지 않은 "개입"(예: 자율 학습, 인생 경험, 다른 가르침)이 발생할 때 흔히 일어납니다.
    • 구체적인 예로는 "역사(history)" 위협(연구 중인 교육과정 구성 요소 외부의 임상 또는 교육 환경에서의 사건)과 "성숙(maturation)" 위협(시간 경과에 따른 학생 내부의 변화)이 있습니다.4,24
    • 교란은 어떤 연구 프로젝트에서든 나타날 수 있지만, 더 큰 교육과정 구성 요소에 대한 연구를 수행할 때 특히 문제가 됩니다.1 질적 연구(qualitative research)에서도 참여자가 관련 경험과 관점을 과소 또는 과대 대표하거나, 연구자의 신념이 데이터 해석을 왜곡할 경우 유사한 문제가 발생합니다.25–27
  • 희석(Dilution)은 학습자의 행동과 결과 측정 사이에 개입의 감지 가능한 영향(즉, 유효한 신호 강도)을 감소시키는 어떤 일이 발생할 때 일어납니다.28
    • 개입이 "효과가 있고" 학습자가 의도한 대로 반응하더라도, 개입의 효과는 감지되지 않습니다. 희석은 연구자들이 개입에서 멀리 떨어진(distal) 결과에 초점을 맞출 때 종종 발생합니다. 결과는
      • (1) 사람 (예: 개입이 임상실습 의대생에게 초점을 맞추지만, 학생의 관리 결정이 실행 전에 인턴, 고연차 전공의, 그리고 전문의(staff attending)를 거치며 필터링됨) 또는
      • (2) 시간 간격 (예: 개입은 의대 1학년 때 발생하고, 결과 측정은 4학년 졸업 직전에 발생함) 측면에서 멀리 떨어져 있을 수 있습니다.
      • 교육과정의 결과가 드물거나 지연된 환자 사건(예: 고지혈증에 대한 새로운 교육과정의 결과로 환자의 뇌졸중 발생)을 나타낼 때도 희석이 발생합니다.

교란과 희석은 종종 함께 발생하지만, 이 둘은 뚜렷이 다릅니다:

  • 교란은 관찰된 효과의 원인(cause)을 설명하는 데 있어서의 문제를 반영하는 반면(더 나은 측정이 도움이 되지 않음),
  • 희석은 효과 자체의 감지(detection)와 관련이 있습니다(다른 측정이 도움이 될 수 있음).

피상성 (Superficiality) 

피상성(Superficiality)은 원하는 구성 개념(construct)을 대표하도록 최적화된 데이터가 아니라 얻기 쉬운 데이터를 사용하는 것을 의미합니다. 피상적인 데이터에는 정량적 결과(예: 객관적으로 측정된 지식, 기술, 행동 대신 자가 보고 사용)와 정성적 데이터(예: 의도적으로 수집된 포커스 그룹 또는 인터뷰 데이터 대신 후향적 과정 평가 서술의 얄팍한 의견 사용)가 포함될 수 있습니다. 피상적인 데이터는 종종 구성개념 무관 변량(construct-irrelevant variance)(관심 있는 특성을 넘어선 학습자나 학습 환경의 특성을 반영함) 및/또는 구성개념 과소대표(construct underrepresentation)(모든 중요한 특성을 완전히 포착하지 못함)의 문제를 겪습니다.29 피상성은 연구자들이 견고하고(robust) 관련성 있는 데이터를 수집하기 위해 의도적으로 연구를 계획하기보다는 기존 데이터(예: 일상적인 교육과정 운영 중 수집된 데이터)를 사용할 때 흔히 발생합니다. 또한 물류적인 문제로 의미 있는 결과의 측정이 축소되거나, 강력한 평가 계획 없이 교육과정이 구현되어 가용한 데이터가 거의 없을 때도 발생합니다.

개념적 모호성 (Conceptual obscurity) 

개념적 모호성(Conceptual obscurity)은 개념적/이론적 프레임워크(conceptual/theoretical framework)의 부재를 의미합니다. 개념적 프레임워크(공식 이론, 비공식 모델, 모범 사례 포함)는 "문제나 연구에 대해 생각하는 방식, 또는 ... 복잡한 것들이 왜 그런 방식으로 작동하는지"를 나타냅니다.30 이는 종종

  • 교육과정31,32이나 교육 활동(예: 콜브(Kolb)의 경험 학습 이론(experiential learning),33
  • 메이어(Mayer)의 멀티미디어 학습 이론(multimedia learning),34 그리고
  • 컨(Kern)의 프로그램 개발 6단계(6 steps to program development)35)을 계획하는 데 사용됩니다.

그러나 연구 목적에서 개념적 프레임워크는 추가적인 기능을 수행합니다. 아마도 가장 중요한 것은, 프레임워크가 연구 질문(예: 학습 이론의 특정 측면을 테스트하거나 정교화하는 질문)을 안내한다는 점일 것입니다. 프레임워크는 또한 연구 접근법(예: 질적 연구를 위한 해석적 현상학적 분석(interpretative phenomenological analysis)36 또는 평가 타당화 연구를 위한 케인(Kane)의 타당도 프레임워크(validity framework)37)을 안내하고, 연구자들이 문제의 다양한 중요한 측면을 완전히 고려하도록 그들의 사고를 구조화합니다.30 관련 개념적 프레임워크를 사용하지 않으면 종종 연구자들이 차선(suboptimal)의 방법을 사용하게 되며, 결과가 원래의 시간 및 국지적 맥락을 넘어 번역(translation)되는 것을 방해합니다.

 

해결책: 학술적 대화에 기여하기 (The Solution: Contributing to the Scholarly  Conversation) 

교육과정 중심 연구(curriculum-focused research)가 이처럼 많은 과제에 직면해 있는 상황에서, 무엇을 할 수 있을까요? 우리는 해결책의 첫 번째 단계로 교육과정에 집중하는 것을 멈출 것을 제안합니다. 이는 연구자들에게 직관에 어긋나는(counterintuitive) 것처럼 보일 수 있으며, 그들은 "이 노력의 전체 목적이 우리 교육과정에 대한 연구를 하는 것 아닌가요?"라고 물을 수 있습니다. 사실은 그렇지 않습니다. (동료심사 출판(peer-reviewed publication)으로 이어지는) 연구의 목적은 국지적인 교육과정에 대해 "연구를 하는 것"이 아니라, 전 세계적인 "학술적 대화(scholarly conversation)"38에 참여하고 유용한 기여를 함으로써 해당 분야를 발전시키는 것입니다.6,20,39,40

 

학술적 대화(scholarly conversation)(일반적인 학술활동(scholarship)11–13과 혼동해서는 안 됨)는 중요하고 시의적절한 문제에 대한 학자 그룹 간의 토론을 구성합니다. 이 대화에 대한 유용한 기여는 타 기관의 다른 사람들, 그리고 그들의 교육과정과 그들의 요구(needs)에 초점을 맞춥니다. 사교 모임에서 훌륭한 대화 상대가 되는 비결은 최근의 개인적 성취를 자랑하는 것이 아니라, 사려 깊게 듣고, 좋은 질문을 던지며, 다른 사람들이 유용하다고 여길 만한 것을 기여할 때만 말하는 것입니다. 이와 유사하게, 연구자의 임무는 대화(문헌)를 성실하게 경청하고, 유용한 관찰로 채울 수 있는 "공백(gap)"을 식별하는 것입니다.38 연구자는

  • 다른 사람들이 관련성 있고(자신들의 국지적 요구에 부합함),
  • 새롭고(아직 알려지지 않음),
  • 통찰력 있으며(미래의 행동에 빛을 비춤),
  • 신뢰할 수 있는(선택한 방법론에 의해 잘 뒷받침됨) 것으로 인식하는 질문을 던지고 답해야 합니다.

"다른 사람들"에는 연구자의 것과 정확히 같은 교육과정을 찾는 교육자들이 포함될 수 있지만, 그것은 좁은 독자층(특정 주제, 길이, 다른 교육과정 요소와의 통합, 기관 문화, 실행 자원, 국가 문화 및 보건 의료 시스템에 의해 제한됨)입니다. 연구자는 주제, 통합, 문화 및 시스템의 경계를 넘나드는 보다 광범위한 관련성을 지닌 문제를 다룸으로써 더 넓은 독자층에 도달할 수 있습니다. 이를 위해 연구자는 대개 전체 교육과정보다는 교육과정과 관련된 무언가(예: 정의된 구성 요소 또는 실행의 한 측면)를 연구하게 됩니다.1,3 국지적 요구와 성취에서 타인의 요구로 초점을 전환하는 것(즉, 학술적 대화를 진전시키고 과학을 발전시키는 것)이 모든 연구에서와 마찬가지로 교육과정 연구에서 성공의 열쇠입니다.

 

이는 다음과 같은 질문을 촉발합니다: 무엇이 학술적 대화를 진전시킬 것인가? 그 답은 대화에 달려 있습니다: 서로 다른 역할을 맡은 사람들이 서로 다른 문제를 논의할 때, 어떤 기여를 "진전(advance)"으로 인식할지는 다릅니다.9,41 일반적으로 말해서, 새롭고 경험적인 정량적 또는 정성적 데이터(empirical quantitative or qualitative data)에 의해 뒷받침되는 핵심 메시지(bottom-line message)—실용적이거나 개념적인 통찰력—가 있어야 합니다.8 통찰력의 본질과 이를 뒷받침하는 데이터는 메시지와 독자에 따라 달라질 것입니다. 박스 1(Box 1)은 타 기관의 누군가가 학술적 기여에 어떻게 반응할지 상상해보는 사고 실험(thought experiment)을 설명하며, 이는 연구자가 잠재적인 영향력을 추정하고 강화하는 데 도움을 줄 수 있습니다.


박스 1. 학술 출판을 위한 사고 실험: 관심도 및 잠재적 영향력 추정하기

(Box 1. A Thought Experiment for Scholarly Publications: Estimating Interest and Potential Impact) 

어떤 연구도 모든 사람에게 흥미로울 수는 없지만, 잠재적 독자층이 넓고 관심도가 높을수록 출판하기가 더 쉽습니다. 이 사고 실험은 연구자들이 학술 출판물에 대한 잠재적 관심과 영향력을 추정하고 강화하는 데 도움을 줄 수 있습니다. 비슷한 교육적 문제(예: 특정 요구 사항 Y와 Z를 가진 학습자들 사이에서 주제 X를 어떻게 가르치거나 평가할 것인가)에 직면한 타 기관(또는 다른 국가)의 교육자를 상상해 보고, 스스로에게 다음 질문들을 던져 보십시오:

  • 연구자로서 당신은 그 문제에 대해 이미 알려진 것을 넘어, 그 교육자의 결정에 도움이 될 만한 어떤 것을 말해줄 수 있는가?
    • 이에 답하기 위해서는 관련 선행 문헌과 당신이 공유할 수 있을 것으로 상상하는 새로운 메시지 모두에 대한 명확한 이해가 필요합니다.
  • 당신의 연구 결과(study findings)가 신뢰할 수 있으며 그들의 문제 및 맥락과 관련이 있다는 것을 교육자에게 어떻게 납득시킬 수 있는가?
    • 이에 답하기 위해서는 명확하게 진술되고, 설득력 있으며, 정직하고, 투명한 주장으로 구성된 경험적 데이터가 필요합니다. 예를 들어 무작위 대조 시험(randomized trial), 질 향상 사이클(cycles of quality improvement), 또는 포커스 그룹 연구(focus group study)를 통해 수집된 데이터의 출처와 특성은 질문과 연구 설계에 따라 다를 것입니다.
  • 새로운 제안들이 얼마나 큰 차이를 만들어낼 것인가? 그것들은 얼마나 강력하고, 광범위하게 적용 가능하며, 깊은 통찰력을 지니고 있는가?
    • 이에 답하기 위해서는 연구 결과가 교육자에게 "아하" 하는 깨달음의 순간을 촉발할지, 아니면 단지 이미 알려진 것을 확인하는 데 그칠지를 고려해야 합니다. 연구 결과가 교육자 자신의 국지적 맥락으로 번역(translate)될 수 있을까요?
  • 입장이 바뀐다면(즉, 당신이 그 교육자로부터 이 혁신에 대해 배우고 있다면), 당신은 그 제안을 따르거나 연구 결과를 적용하겠는가?
    • 이에 답하기 위해서는 당신의 환경과 그들의 환경 모두의 맥락 특수성(context-specificity)을 포함하여, 당신 노력의 한계를 인정하는 겸손함, 통찰력, 그리고 객관성이 필요합니다.

이러한 질문들에 답하다 보면 거의 항상 연구 질문이나 접근법에서 변경할 수 있는 몇 가지 사항들이 드러날 것입니다. 이러한 변경을 수행하고, 상상한 메시지가 흥미롭고, 방어 가능하며(defensible), 영향력 있을 때까지 이 과정을 반복하십시오. (또는 수정 후에도 이러한 기준을 달성하기 어려울 것으로 보인다면 새로운 프로젝트로 전환하십시오.)


많은 교육과정 연구가 "그 교육과정(또는 구성 요소)이 효과가 있었는가? 목표를 달성하거나 목적을 완수했는가?"와 같은 예/아니오 질문에 초점을 맞춥니다. 그러나 이미 축적된 풍부한 연구를 고려할 때,20 학습 및 평가에 대한 모범 사례를 사용하여 계획되고 연구된다면 사실상 모든 교육적 개입이 아무런 개입이 없는 것과 비교했을 때 "효과가 있을 것"이라는 점은 타당해 보입니다.2,19 대조적으로, 교육 연구 전문가들은 오랫동안 "효과가 있었는가?"보다는 "왜, 그리고 어떻게 작용하는가?" (작용 기전(mechanisms of action), 설명)"언제, 그리고 누구에게 작용하는가?" (맥락 특정적 상호작용(context-specific interactions))를 이해하는 것의 중요성을 강조해 왔습니다.1,2,6,7,42–45 이를 위해, "미래의 발전을 향한 길을 밝히는"5 "명료화(clarification)" 연구는 (효과가 있었는지를 묻는) "정당화(justification)" 연구나 단순한 설명보다 대화에 훨씬 더 많은 기여를 할 것입니다. 다른 학자들은 "우리가 직면한 문제에 대해 생각하는 더 나은 방법을 만들고 공유하는 것",46 "학습의 법칙을 정교화하는 것",47 또는 단순히 "다음은 무엇인가?"45라고 묻는 것을 강조해 왔습니다.

 

개입이나 활동이 왜, 그리고 어떻게 작용하는지 고려할 때, 개념적 프레임워크(conceptual frameworks)는 근본적으로 중요합니다. 문제의 특정 측면을 조명하고 확대함으로써, 프레임워크는 한 맥락을 다른 맥락으로, 과거의 발견을 미래의 적용으로, 고립된 발견을 일관된 메시지로 연결하는 "이해의 다리(bridges of understanding)"를 만듭니다.30 아래의 연구 사례들에서 설명되듯, 개념적 프레임워크는

  • 가설을 설정하고 연구 계획을 안내하기 위해 전향적(prospectively)으로 사용될 수 있을 뿐만 아니라,
  • 예상치 못하게 나타난 결과(emergent findings)를 해석하고 연구 방법의 조정을 안내하기 위해 후향적(retrospectively)으로도 사용될 수 있습니다.

6가지 전형적인 연구 설계 (Six Prototypical Study Designs) 

우리는 아래와 표 2에서 6가지 전형적인 교육과정 중심 연구(prototypical curriculum-focused research studies)를 개략적으로 설명합니다. 이것들이 연구 질문이나 접근법의 완전한 목록을 나타내는 것은 아니며, 실용적이고 구체적인 용어로 다양한 가능성의 범위를 보여주는 선택된 예시들입니다. 이 예시들은 모두 의대 2학년 학생들을 위한 형평성과 다양성(equity and diversity)에 관한 교육을 개선하기 위한 가상의 교육과정 변경과 관련이 있습니다. (구체적인 교육과정 변경은 예시마다 다릅니다.) 성공하기 위해서 각 연구는 교육과정의 실행이나 변경 자체를 넘어선 계획을 필요로 합니다. 여기에는

  • 외부의 관심을 끌 만한 중요한 학술적 공백(scholarly gap)을 식별하기 위한 성실한 문헌 고찰(중복성과 맥락 특수성을 피하기 위해),
  • 관련 개념적 프레임워크(conceptual framework)에 기초한 구축(개념적 모호성을 피하기 위해), 그리고
  • 가능할 경우 전향적인(prospectively) 고품질 데이터 출처의 선택(피상성과 희석을 피하기 위해)이 포함됩니다.
  • 교란(Confounding)은 연구 2를 제외한 모든 예시에서 위험 요소입니다. 이러한 연구들에서 실제 교란의 정도는 데이터 해석 과정에서 추정될 것입니다.

표 2. 6가지 전형적인 교육과정 중심 연구 (Table 2. Six Prototypical Curriculum-Focused Research Studies)a 

연구 설명 (Study description) 예시b (Example) 연구 질문 (Research question(s)) 전형적인 접근법 (Typical approach(es)) 데이터: 결과 및 관찰 (Data: Outcomes and observations)
1. 교육과정 또는 구성 요소 평가 (Evaluate the curriculum or a component) 형평성과 다양성에 대한 새로운 프로그램 평가c 프로그램이 그 목적을 달성했는가?

투자된 자원만큼의 이점이 있었는가?

지속 가능한가?

모방할 가치가 있는가?
• 실행 과학 (Implementation science) (예: RE-AIM 평가)

• 상황, 투입, 과정, 산출 (Context, Inputs, Process, Product, CIPP) 평가

• 논리 모델 평가 (Logic model evaluation)

• 혼합 방법론 (Mixed methods) (정량적 및 정성적)
• 도달률(Reach): 교육받은 학생 수

• 효과성(Effectiveness): 지식, 기술, 태도; 영향에 대한 서술형 증언

• 채택(Adoption): 대상 교직원, 환경, 시스템 및 지역사회에 미치는 영향과 감화

• 실행(Implementation): 일관성, 비용, 전달 중 이루어진 조정

• 유지(Maintenance): 지속 가능성, 지속적인 비용, 시간이 지남에 따라 요구되는 조정
2. 두 가지 교수 설계 접근법 비교 (동시적) (Compare 2 instructional design approaches (concurrent)) 형평성과 다양성에 관한 온라인 모듈에서 피드백을 제공하는 두 가지 접근법(아바타가 음성으로 제공 vs 화면에 텍스트로 제공) 비교d 학습을 위해 음성 제안을 제공하는 아바타가 서면 제안과 비교하여 성과를 향상시키는가? • 무작위 실험 (Randomized experiment) • 지식, 태도, 인지된 개인화, 인지된 동기 부여, 인지된 효과성 (모두 과정 후 테스트/설문지에서 측정; 정량적 데이터)
3. 두 가지 교수 설계 접근법 비교 (역사적) (Compare 2 instructional design approaches (historical)) 형평성과 다양성에 관한 4회 연속 강의의 두 가지 전달 접근법(전통적인 강의 [작년] vs 플립 러닝 [올해]) 비교e 플립 러닝(flipped classroom)이 전통적인 강의에 비해 성과를 향상시키는가? • 역사적 비교 (정적 집단) (Historical comparison (static groups)) • 지식, 태도 (과정 후 테스트); 만족도 (과정 평가) (두 연도 모두에 대해 사용 가능한 정량적 데이터)
4. 교육과정 또는 구성 요소의 반복적인 개선을 통해 얻은 교훈 (Lessons learned from iterative improvements to the curriculum or a component) 3년에 걸쳐 형평성과 다양성에 대한 새로운 교육과정c을 점진적으로 개선하기 위해 증거 기반의 작은 조정을 반복적으로 수행 실행 중 어떤 문제에 직면했는가?

성과 향상과 관련된 점진적인 변화는 무엇이었는가?
• 질 향상 (Quality improvement) (예: 계획-실행-학습-적용 [PDSA])

• 린 스타트업 (Lean Startup) 또는 애자일 (Agile) 제품 개발 방법론

• 무작위 및 비무작위 비교
• 학생 및 교수진에 대한 정량적 및 비정량적 관찰

• 기타 프로그램 산출물(artifacts) 분석 (예: 기획 위원회 회의록, 강의 계획서, 모듈, 비디오, 학생 과제)
5. 가르칠 주제의 본질 이해 (Understand the nature of the topic to be taught) 형평성과 다양성에 관한 향후 교육과정c을 위한 교육 목표 및 모범 사례 식별 학생과 교수진은 현재 (교육과정 변경 전) 형평성과 다양성이라는 주제를 어떻게 인식하고 있는가? • 질적 연구 (Qualitative research): 근거 이론 (Grounded theory) ("이 주제가 어떻게 인식되는가"에 대한 모델 구축을 위해) • 계획 과정 전 또는 도중 (실행 전)의 인터뷰 또는 포커스 그룹 (정성적 데이터)
6. 새롭거나 개정된 교육과정 구성 요소에 대한 경험 이해 (Understand the experience of a new/revised curriculum component) 형평성과 다양성에 관한 새로운 교육과정c에 참여한 학생, 교사 및 기타 관계자의 인식과 경험 탐구 참여자들이 형평성과 다양성에 대한 교육과정을 경험하는 것은 어떠했는가?

그 결과 참여자들은 어떻게 변화했는가?
• 질적 연구 (Qualitative research): 해석적 현상학 (Interpretative phenomenology) • 교육과정 완료 후 인터뷰; 교육과정 중 (현장에서의) 민족지학적 관찰 (ethnographic observations) (정성적 데이터)
  • a이 표의 예시 연구들은 예시를 위한 것이며, 포괄적인 것은 아닙니다. 수많은 다른 예시 상황, 질문, 접근법 및 결과가 나열될 수 있습니다.
  • b이 예시들은 의대 2학년 학생들을 위한 형평성과 다양성 교육을 개선하기 위한 가상의 교육과정 변경과 관련이 있습니다. 표 3은 각 연구 프로토타입의 실제 (출판된) 예시를 포함합니다.48–53
  • c이 접근법은 예를 들어 경험적 지역사회 배치(experiential community placement) 또는 임상 실습(clinical clerkship)의 개정을 연구하는 데에도 사용될 수 있습니다.
  • d이 접근법은 예를 들어 두 가지 강의 형식, 소그룹 세션을 위한 두 가지 구조, 또는 절차적 기술을 가르치기 위한 두 가지 시뮬레이션 기반 방법을 비교하는 데에도 사용될 수 있습니다.
  • e이 접근법은 예를 들어 2주간의 임상 실습을 구조화하는 두 가지 방법이나 1주간의 그룹 협업 활동을 비교하는 데에도 사용될 수 있습니다.

연구 1: 교육과정 또는 구성 요소 평가 (Study 1: Evaluate the curriculum or a component) 

연구 1은 형평성과 다양성 교육과정 전체를 평가할 것을 제안합니다.

  • 이 연구는 맥락 특수성(context specificity)의 위험이 높습니다. 이를 피하기 위해, 평가는 국지적인 맥락을 넘어서는 문제에 초점을 맞추어 타 학교의 교육자들에게 유익한 질문에 답하고, 관련 이론의 렌즈를 통해 결과를 해석해야 합니다.
  • 비교 집단이 없다는 점은 불가피하게 결론을 제약합니다. 더욱이, 단순히 "효과가 있었다"(즉, 지식이나 태도가 향상되었다)고 결론짓는 것은 제한적인 가치만 가질 것입니다.
  • 잠재적으로 더 흥미로운(일반화 가능하고 출판 가능한) 메시지는 실행, 비용, 지속 가능성 또는 예상치 못한 효과를 다룰 수 있습니다.
  • 프로그램 평가(Program evaluation)는 그 자체로 하나의 학문 분야이며, 선택할 수 있는 수많은 패러다임과 방법론(정량적, 정성적, 혼합)이 있습니다.54–56
    • 이 가상의 연구는 실행 과학 패러다임(implementation science paradigm)57,58을 따를 것이며, RE-AIM 프레임워크59를 사용하여 프로그램의 도달률(reach), 효과성(effectiveness), 채택(adoption), 실행(implementation) 및 유지(maintenance)를 체계적으로 연구할 것입니다.
    • 목표 지향적 평가(예: 커크패트릭의 모델(Kirkpatrick’s model)), 과정 지향적 평가(예: 논리 모델 및 CIPP 모델), 참여자 지향적 평가와 같은 다른 프로그램 평가 모델도 고려될 수 있습니다.54,55,60 경제성 분석(economic analysis)61–63 또한 유용할 수 있습니다.

연구 2: 두 가지 교수 설계 접근법 비교 (동시적) (Study 2: Compare 2 instructional design approaches (concurrent)) 

  • 또 다른 옵션은 1시간짜리 온라인 모듈과 같이 더 큰 교육과정 변경의 작은 구성 요소에 초점을 맞추는 것입니다.
  • 연구 2는 성과에 대해 학생들에게 피드백을 제공하는 두 가지 접근법(아바타의 음성 제공 vs 서면 제공)을 비교하는 무작위 대조 시험(randomized trial)이며, 지식, 태도, 인지된 개인화, 동기 부여 및 효과성의 결과를 사용합니다.
  • 전체 교육과정보다 구성 요소에 초점을 맞추면 학습 경험을 엄격하게 통제(즉, 이론에 기반한 예측을 정의하고 조작화함)할 수 있으므로 교란(confounding)을 최소화하는 데 도움이 됩니다.1,7,23,44 이 설계는 또한 연구 목표와 밀접하게 일치하는 결과의 선택 및 전향적 측정(prospective measurement)을 가능하게 합니다.

연구 3: 두 가지 교수 설계 접근법 비교 (역사적) (Study 3: Compare 2 instructional design approaches (historical))

  • 연구 3은 다른 교육과정 구성 요소인 4회 연속 강의에 초점을 맞추며, 올해의 새로운 플립 러닝(flipped classroom) 접근법과 이전 연도에 사용된 "전통적인" (플립 러닝이 아닌) 강의 형식을 비교합니다. 이 역사적 비교 연구(historical comparison study)는 작년과 올해 강의 모두에서 사용할 수 있는 일상적으로 수집되는 결과 척도(예: 과정 후 테스트에서의 지식 및 태도, 과정 평가에서의 만족도 데이터)로 제한될 것입니다.
  • 기존의 개입과 기존 데이터에 의존하는 것은 피상성, 개념적 모호성 및 기타 문제의 위험을 증가시킵니다. 명확한 개념적 프레임워크, 철저한 문헌 고찰, 그리고 두 개입 사이의 주요한 조작적 및 개념적 차이에 대한 신중한 기술이 이 연구의 성공에 매우 중요할 것입니다. 연구 결과의 해석은 신중해야 하며 비동시적 설계와 사전 정의된 결과의 한계를 인정해야 합니다.

연구 4: 교육과정 또는 구성 요소의 반복적인 개선을 통해 얻은 교훈 (Study 4: Lessons learned from iterative improvements to the curriculum or a component)

  • 또 다른 옵션은 여러 번의 실행 주기에 걸쳐 교육과정을 연구하면서 각 주기마다 개선 영역을 식별하고 다듬는 것입니다. 이 접근법의 결과는 일반적으로 가설에 의한 것이라기보다는 새롭게 창출된 것(emergent)일 것입니다: 결과에 영향을 미치는 데 가장 중요한 프로그램의 특징을 예측하는 것은 불가능할 수 있습니다.
  • 그러한 경우, 관련 개념적 프레임워크를 사후적으로(post hoc) 식별하고 이를 후향적으로 적용하여 결과를 해석하고 향후 적용으로 그 관련성을 확장하는 것이 종종 적절할 것입니다(이 사후 적용에 대해 독자에게 투명하게 알림).
  • 연구 4는 계획-실행-학습-적용(Plan-Do-Study-Act)의 반복적인 주기를 사용하는 질 향상 접근법(quality improvement approach)64,65을 채택하여 3년에 걸쳐 교육과정을 체계적으로 연구하고 각 주기마다 증거에 기반한 조정을 수행합니다.
  • 짧고 빈번한 주기를 통해 성공적인 접근법(예: 일련의 강의, 온라인 모듈, 임상 실습 또는 반복적인 행정 활동)에 빠르게 수렴할 수 있다면 린 스타트업(Lean Startup)66,67 및 애자일(Agile)68과 같은 다른 방법도 유용할 수 있습니다.
  • 이 모든 것에서 학생과 교수진에 대한 관찰 데이터, 그리고 강의 계획서 및 학생 과제와 같은 산출물(artifacts)에서 수집된 데이터를 포함하여 정량적 및 정성적 데이터를 모두 사용할 수 있습니다.

연구 5: 가르칠 주제의 본질 이해 (Study 5: Understand the nature of the topic to be taught)

  • 순수하게 질적인 연구(purely qualitative studies)도 고려될 수 있습니다
  • . 연구 5는 의대생과 교수진이 주제—이 경우 형평성과 다양성—에 대해 무엇을 알고 있고 믿는지 이해하여 향후 교육과정의 목표와 접근 방식을 형성하는 데 도움을 주는 것을 목표로 합니다. 이 연구는 포커스 그룹(focus groups)을 사용하여 참가자의 태도, 오해 및 개인적 경험에 대한 데이터를 수집하고, 이 데이터를 분석하여 형평성 및 다양성 신념에 대한 근거 이론 모델(grounded theory model)69을 구축할 것입니다("이 주제는 어떻게 인식되는가?").
  • 이 연구는 경험적 및 개념적 측면 모두에서 이 주제에 대한 기존 연구를 식별하고 그 위에 구축해야 합니다. 연구를 시작하기 전의 철저한 문헌 검색은 답이 이미 알려져 있음을 드러낼 수도 있습니다; 그렇다면 연구자는 질문을 수정하거나 완전히 다른 프로젝트로 전환해야 할 것입니다.

연구 6: 새롭거나 개정된 교육과정 구성 요소에 대한 경험 이해 (Study 6: Understand the experience of a new/revised curriculum component)

  • 또 다른 질적 연구는 교육과정 참여 경험에 초점을 맞출 수 있습니다. 연구 6은 1대1 인터뷰에서 수집된 데이터를 사용하고 해석적 현상학(interpretative phenomenology)36을 사용한 분석을 통해 학생과 교수진의 생생한 경험(lived experiences)을 이해합니다: 그들은 무엇이 의미 있고, 유용하며, 도전적이고, 보람 있으며, 낭비적이라고 느꼈는가? 자원이 허락한다면, 연구자들은 인터뷰에 더해 다양한 장소와 활동에서 학생과 교수진에 대한 민족지학적 관찰(ethnographic observations)을 보완할 수 있습니다. 이 연구를 위한 관련 개념적 프레임워크는 전향적으로도 후향적으로도 식별될 수 있습니다.

출판된 예시 (Published examples) 

표 3은 이러한 6가지 연구 예시를 각각 더 자세히 보여주는 출판물들을 인용합니다.48–53

 

표 3. 6가지 전형적인 교육과정 중심 연구를 보여주는 출판된 논문들 (Table 3. Published Articles Illustrating 6 Prototypical Curriculum-Focused Research Studies) 

연구 설명 (Study description)a 제1저자, 제목 (First author, Title)ref 학술적 질문 (Scholarly question)b 접근법 (Approach) 주요 결과 (Main findings)
1. 교육과정 또는 구성 요소 평가 (Evaluate the curriculum or a component) Gisondi, "Teaching LGBTQ+ health, a web-based faculty development course: program evaluation study using the RE-AIM framework"48 LGBTQ+ 문제에 대해 가르치도록 교수진을 어떻게 훈련할 수 있는가?c 무료 공개 온라인 과정에 대한 RE-AIM 프레임워크를 사용한 단일 그룹 혼합 방법론 평가(사전-사후 지식 변화, 자유 기술 의견에 대한 주제 및 감성 분석 포함) • 도달률: 1,782명

• 효과성: 지식 점수 30% 향상, 감성 분석 결과 순 긍정적

• 실행: 직접 비용 $57,000, 주요 이정표 및 배포 접근법 식별됨

• 유지: 연간 비용 $1,000
2. 두 가지 교수 설계 접근법 비교 (동시적) (Compare 2 instructional design approaches (concurrent)) Skrupky, "Personalisation and embodiment in e-learning for health professionals: a randomised controlled trial"49 개인화(personalization)(메이어의 멀티미디어 학습 이론34)가 학습에 어떤 영향을 미치는가? 2가지 이러닝 모듈 형식을 비교하는 무작위 대조 시험: 비강화형(보이지 않는 사람의 음성 해설이 있는 슬라이드) vs 개인화 및 구현을 반영하도록 강화형(대화형 스타일, 보이는 화자) • 강화된 형식에서 작지만 통계적으로 유의미하지 않은 지식 향상

• 과정에 대한 인지된 개인화 및 동기 부여 속성은 강화된 형식에서 더 높았음
3. 두 가지 교수 설계 접근법 비교 (역사적) (Compare 2 instructional design approaches (historical)) Stephenson, "Learner engagement and teaching effectiveness in livestreamed versus in-person CME"50 양식 형태(modality format)(대면 vs 라이브 스트리밍)가 *학습자 참여(learner engagement)*에 어떤 영향을 미치는가? 동일한 평생의학교육(CME) 과정을 전달하는 2가지 양식에 대한 역사적 비교: 라이브 스트리밍(2020년 및 2021년에 완료) vs 대면(2018년) • 학습자 참여도는 비슷했음

• 교사 효과성은 대면 전달에서 더 높았음

• 지식에는 차이가 없었음
4. 교육과정 또는 구성 요소의 반복적인 개선을 통해 얻은 교훈 (Lessons learned from iterative improvements to the curriculum or a component) Ogunyemi, "Graduate medical education-led continuous assessment of burnout and learning environments to improve residents’ wellbeing"51 전공의의 *웰니스(wellness)*와 학습을 향상시키기 위해 *임상 학습 환경(clinical learning environment)*을 어떻게 최적화할 수 있는가? 전공의 웰빙을 향상시키기 위한 프로그램의 반복적인 개선을 이끈 5번의 계획-실행-학습-적용(PDSA) 주기 • 교육과정 변경에는 조직적 개입(리더십 채용, 워크플로, 전공의 일정 최적화)과 개인적 개입(자기 관리, 멘토링, 회복탄력성 훈련)이 포함됨

• 프로그램 연도 동안 번아웃 및 기타 결과가 개선됨
5. 가르칠 주제의 본질 이해 (Understand the nature of the topic to be taught) Hassan, "Consensus on social determinants of health knowledge topics and behavior learning goals across primary care residencies: results of a Delphi study"52 *건강의 사회적 결정요인(social determinants of health, SDH)*의 어떤 측면을 가르치는 것이 필수적인가? SDH와 관련된 학습 목표 및 주제를 식별하기 위해 41명의 전문가가 참여한 델파이 연구 • 22개 주제는 구조적 힘, SDH의 광범위한 영역, SDH 해결을 위한 자원, 옹호 전략을 강조함

• 18개 학습 목표는 개인 및 대인 관계 행동에 중점을 둠
6. 새롭거나 개정된 교육과정 구성 요소에 대한 경험 이해 (Understand the experience of a new/revised curriculum component) Dubé, "Pathways, journeys and experiences: integrating curricular activities related to social accountability within an undergraduate medical curriculum"53 어떤 *교육적 접근법(educational approaches)*이 사회적 책무성의 발달을 촉진하는가? (학생, 교사, 관리자, 지역사회 구성원, 환자로 구성된) 16개의 포커스 그룹이 사회적 책무성에 관한 새로운 프로그램에 대해 논의함 • 식별된 4가지 주제: 사회적으로 책무성 있는 의사의 정의; 사회적으로 책무성 있는 교육 경험; 사회적으로 책무성 있는 의사 훈련의 특징; 교육과정 개선 및 실행에 대한 제안
  • 약어: CME, continuing medical education(평생의학교육); RE-AIM, reach, effectiveness, adoption, implementation, maintenance(도달률, 효과성, 채택, 실행, 유지).
  • a연구 설명은 표 2의 목록에서 가져왔습니다.
  • b이러한 질문들은 직접 인용한 것이 아니라 본 논문의 저자들이 의역하거나 추론한 것입니다. 기울임꼴로 표시된 텍스트는 연구의 기초가 되는 핵심 개념적 프레임워크를 강조합니다.
  • c주제 자체와 RE-AIM 방법론 외에는 명확한 개념적 프레임워크가 식별되지 않았습니다. 더 나은 질문은 다음과 같았을 수 있습니다: "공개 온라인 과정에서 이 주제를 어떻게 더 효과적으로 가르칠 수 있는가?"

피해야 할 연구들 (Studies to avoid) 

표 4는 교육적 증례 보고(educational case reports), 개입이 없는 것과의 비교를 수행하는 연구(studies making comparison with no intervention), 검정력이 부족한 연구(underpowered studies), 그리고 정량적 데이터가 제한적일 때 백업 옵션으로 질적 연구를 사용하는 경우 등 우리가 피할 것을 권장하는 교육과정 중심 연구들을 설명합니다. 이러한 연구들은 역사적으로 흔했으며 증거 기반이 발달하지 않았을 때는 과학적 이해에 기여했을 수 있습니다. 그러나 보건의료 전문직 교육(HPE) 연구 분야는 성숙해졌습니다. 이러한 부류의 연구들은 대개 현재의 학술적 대화에 거의 기여하지 못하며, 따라서 출판하기가 점차 더 어려워지고 있습니다.

 

 

표 4. 하지 말아야 할 것: 피해야 할 교육과정 중심 연구들 (Table 4. What Not to Do: Curriculum-Focused Studies to Avoid)a

연구 설계 (Study design) 예시b (Example) 연구 질문 (Research question) 피해야 하는 이유 (Why to avoid)
단일 그룹, 사후 테스트만 있음 (Single group, posttest only) 형평성과 다양성에 관한 새로운 과정에 대한 설명; 데이터는 과정 후 지식 및 학습자 만족도 포함 우리는 무엇을 했는가? (설명/Description)c 이것은 교육적 증례 보고(educational case report)입니다. 교육 과학에 대한 기여는 미미합니다. 교육적 접근법이 극도로 새롭지 않은 한("화제가 되는" 주제라 할지라도) 출판하기 어려울 것입니다 (이는 점점 더 드물어지고 있습니다).
단일 그룹, 사전-사후 연구 (Single group, pre–post study) 형평성과 다양성에 관한 새로운 과정에 대한 설명; 데이터는 과정 전후 지식, 그리고 과정 후 학습자 만족도 포함 효과가 있는가? (정당화/Justification)c 체계적 문헌고찰19,20에 따르면 이러한 연구들은 수많은 주제와 교육적 접근법에 걸쳐 95% 이상의 경우에서 성과가 향상되었다고 보고합니다. 더욱이 대조군이 없으면 그 과정이 지식 향상(교란(confounding))의 원인이라고 결론짓는 것은 불가능합니다.4
개입이 없는 대조군이 있는 두 그룹 연구 (Two-group study with no-intervention control) 형평성과 다양성에 관한 새로운 과정과 훈련을 받지 않은 그룹 비교; 무작위로 배정된 그룹; 데이터는 과정 전후 지식 포함 효과가 있는가? (정당화/Justification)c 체계적 문헌고찰19,20에 따르면 이러한 연구들은 95% 이상의 경우에서 성과가 향상되었다고 보고합니다. 대조군이 있고 무작위로 그룹을 배정했더라도 교육 과학에 대한 기여는 미미합니다 (교육을 더 낫게 만드는 방법에 대한 이해에 추가하는 바가 거의 없습니다).1,2,4,19
적극적인 개입에 대한 두 그룹 연구, 작은 표본 (Two-group study of active interventions, small sample) 형평성과 다양성을 가르치기 위한 두 가지 교수법 접근 방식 비교(상호작용 강의 vs 플립 러닝); 무작위로 배정된 그룹; 데이터는 과정 전후 지식 및 태도 포함; 그룹당 n = 25명 어떤 접근법이 더 효과적인가? 연구 질문은 훌륭하며, 무작위 설계는 강력합니다. 그러나 표본 크기가 너무 작습니다(underpowered): 80%의 검정력(power)을 목표로 할 경우, 그룹당 25명의 참가자는 Cohen의 $d \geq 0.8$이라는 "큰(large)" 효과 크기(effect size)에 대해서만 그룹 간 차이를 감지할 수 있습니다 (그리고 90% 검정력의 경우 $d \geq 0.9$). 그러나 두 가지 적극적인 개입을 비교하는 이러한 연구에서 예상되는 그룹 간 차이는 일반적으로 훨씬 작습니다 ($d < 0.5$ 또는 그 이하). 실제로 대부분의 교육 연구는 두 가지 적극적인 개입을 비교하기에 검정력이 부족합니다.70 검정력이 부족한 연구에서 결과가 통계적으로 유의미하지 않다면, 이는 결론을 내릴 수 없는 것(inconclusive)입니다.
과정 평가 의견에 대한 주제 분석 (Thematic analysis of comments from course evaluation) 형평성과 다양성에 관한 새로운 과정에 대한 설명; 데이터는 과정 후 평가에 대한 서술형 의견 포함 이 과정의 좋거나 나쁜 점은 무엇인가? 이것은 교육적 증례 보고입니다. 학습자의 의견은 (유용할지라도) 실제 학습 성과와 일치하지 않는 경우가 많으며 국지적 맥락에 국한됩니다. 질적 연구는 이상적으로 국지적인 과정 평가를 넘어서는 통찰력을 생성하는 질문과 분석을 포함해야 합니다.
포커스 그룹을 사용한 적극적 개입의 단일 그룹 연구, 작은 표본 (Single-group study of active intervention using focus groups, small sample) 형평성과 다양성에 관한 새로운 과정, 총 학습자 12명; 표본이 너무 작기 때문에 정량적 지표 대신 포커스 그룹의 정성적 데이터를 사용하여 평가 수행 이 과정의 좋거나 나쁜 점은 무엇인가? 문제는 질적 연구 설계를 선택한 이유(즉, 가용한 표본이 작기 때문)에 있습니다. 질적 연구 접근법은 학술적 대화를 진전시키는 질문에 답하기 위한 가장 좋은 방법이기 때문에 선택되어야지, 다른 방법이 작동하지 않을 때의 비상 계획(contingency plan)으로 선택되어서는 안 됩니다. 질적 연구는 이상적으로 국지적인 과정 평가를 넘어서는 통찰력을 생성하는 질문과 분석을 포함해야 합니다.
  • a권장되는 연구 접근법의 예시는 표 2와 3을 참조하십시오.
  • b이 예시들은 의대 2학년 학생들을 위한 형평성과 다양성 교육을 개선하기 위한 가상의 교육과정 변경과 관련이 있습니다.
  • cCook 등5은 연구를 설명(description), 정당화(justification), 또는 명료화(clarification)로 분류하는 프레임워크를 제안했으며, (표 2와 3의 연구들이 보여주듯, 어떻게 또는 왜 효과가 있었는지를 묻는) 명료화 연구가 (효과가 있었는지를 묻는) 정당화 연구나 단순한 설명보다 학술적 대화에 훨씬 더 많이 기여한다고 주장했습니다.

 

연구 질문 및 접근법 선택하기 (Choosing a Research Question and Approach) 

연구 질문과 접근법에 대한 이러한 다양한 옵션(표 2) 중에서 선택할 때, 연구자들은 먼저 스스로에게 다음과 같이 물어보아야 합니다. "나는 (출판을 위해) 교육과정 연구(curriculum research study)를 정말로 하고 싶은가? 아니면 내 관심사와 자원이 교수 학술활동(scholarship of teaching)이나 국지적인 프로그램 평가(local program evaluation)에 더 잘 부합하는가?" 정직한 대답은 훗날 겪게 될 좌절을 예방할 수 있습니다.

  • 만약 출판을 위한 연구(research for publication)를 선택했다면, 다음에 던져야 할 질문은 "무엇을 연구해야 할까?"입니다. 연구 문헌들은 일반적으로 연구자가 문헌의 공백(gap in the literature)에서 비롯되고 하나 이상의 개념적 프레임워크(conceptual frameworks)를 활용하는 개인적 관심사의 연구 질문을 식별하는 것으로 시작하여, 그 질문에 답하기 위한 연구를 설계하는 선형적 과정(linear process)을 권장합니다.
  • 그러나 교육과정 연구에서 이 과정은 대개 다르게 작동하는데, 국지적 요구와 실현 가능성(local needs and feasibility)이 질문에 강한 영향을 미치며, 질문과 연구 설계의 선택 모두 더 복잡하고 반복적인(iterative) 경향이 있습니다.71

연구 질문은 프로젝트의 초점을 맞추고 연구 설계/방법에 정보를 제공하는 중심적인 역할을 항상 유지해야 하며,72 이해의 중요한 공백(important gap in understanding)을 다루어야 합니다.73 그러나 그 질문은

  • 국지적으로 식별된 교육 실무의 과제 및 우선순위(즉, 해결해야 할 문제),
  • 자연 실험(natural experiments)(예: 역사적 대조군(historical controls)이나 과정의 대안적인 동시 실행(alternative concurrent implementations)과 비교하는 경우 선택의 여지가 많지 않음), 그리고
  • 교육과정의 본질(즉, 주어진 구조와 주제는 특정 질문에는 적합하지만 다른 질문에는 적합하지 않음)
  • ...과 같이 연구자의 상황에 고유한 기회들에 의해 형성될 것입니다.41,71

실제적인 문제들 또한 연구 방법과 실행에 영향을 미칩니다.

  • 여기에는 참여할 가능성이 있는 학습자의 수(대부분의 교육 연구는 검정력이 부족합니다(underpowered))70, 가용 자원(연구자의 시간 포함), 연구자의 기술/경험, 데이터를 계획하고 수집할 기회, 그리고 일정이 포함됩니다. 사전
  • 계획이 필요한 연구는 후향적(retrospectively)으로 수행될 수 없습니다. 연구자는 FINER74 (실현 가능하고(feasible), 흥미로우며(interesting), 새롭고(novel), 윤리적이며(ethical), 관련성 있는(relevant)) 질문과 실행 가능한 접근법이 명확해질 때까지 개인적 관심사, 문헌의 공백, 상황적 여건 및 제약(situational affordances and constraints), 그리고 실현 가능성을 반복적으로 균형 맞춰야 합니다.

교육과정 및 혁신 출판하기 (Publishing the Curriculum and Innovations) 

교육과정 자체를 출판하는 것도 선택지가 될 수 있을까요? 네. 교육자는 상세한 지침과 자료를 배포하여 다른 교육자들이 새로운 맥락에서 교육과정을 복제(replicate)할 수 있도록 할 수 있습니다. 그러나 동료심사(peer-reviewed)를 거치는 선택지는 제한적이며, 한 저자가 썼듯이 "이러한 노력 중 너무나 많은 부분이 헛수고가 된다는 것[즉, 미출판 상태로 남는 것]은 인간적인 비극입니다."2 동료심사 출판의 현재 시스템은 주로 (글로벌) 학술적 대화를 확산하고 진전시키기 위해 설계되었으며, (국지적으로 관련된) 교육과정은 이 기준을 충족하는 경우가 드뭅니다. 일부 동료심사 옵션(예: MedEdPortal75,76)은 고품질의 교육 활동을 출판하고 배포하도록 설계되었습니다. 이러한 활동은 새롭고, 신중하게 개발 및 평가되어야 하며, 일반화 가능(generalizable)해야 합니다. 다시 말해, 해당 분야의 교수 및 학습(teaching and learning)12,13을 둘러싼 학술적 대화를 진전시켜야 합니다. 교육과정을 학술적 저작물로 배포하기 위한 다른 포럼들이 이용 가능해지고 성장하고 있습니다; 여기에는 블로그, 팟캐스트, 단행본, 지속적인 온라인 자료(online enduring materials), 이러닝 모듈, 그리고 자체 출판 웹사이트가 포함됩니다.

 

교육적 "혁신(innovations)", 즉 교수/평가 접근법과 주제의 새로운 조합을 출판하는 것은 어떨까요? 일부 동료심사 저널(이 저널 포함)이 혁신을 고려하긴 하지만, 이를 출판하기는 어렵습니다.40

  • 첫째, 혁신은 종종 교육자가 생각하는 것만큼 참신하지(새롭고 전례 없지) 않습니다. 누군가가 이미 비슷한 접근법을 시도했을 가능성이 매우 높습니다.
  • 둘째, 혁신이 참신하더라도 (위에서 교육과정 배포를 위해 나열된 것과 같은) 다른 포럼이 더 적절할 수 있습니다. 혁신 출판을 위한 제안(주의사항 포함)은 문헌에서 찾아볼 수 있습니다.9,40,77–79

실제적 고려사항 (Practical Considerations) 

우리는 몇 가지 실제적인 고려사항을 논의하며 결론을 맺습니다: 연구 품질의 평가, 교육 연구의 자금 조달, 필요한 연구 기술의 접근 및 습득, 의료 제공자의 행동 및 환자 예후 측정, 연구 참여자인 학습자와 관련된 윤리적 문제, 기초 연구와 응용 연구 사이의 긴장, 그리고 연구 참여에 대한 압박.

 

학술활동의 질은 어떻게 평가되는가? 글래식의 프레임워크(Glassick’s framework)는 25년이 넘은 지금도 여전히 가장 많이 사용되고 있습니다.80,81 이 프레임워크는 학술 활동이 명확한 목표, 적절한 준비, 적절한 방법, 의미 있는 결과, 효과적인 발표, 그리고 성찰적 비판(reflective critique)을 어느 정도 반영하는지 평가합니다. 다른 저자들은 연구 질문, 방법, 해석 및 보고가 어떻게 종합적으로 과학적 엄격성(scientific rigor)을 정의하는지 추가로 강조했습니다.2,21,41,71,72,82–87

 

교육과정 전환에 참여하는 교육자들은 대개 과로에 시달리고, 마감일을 맞추기 위해 허둥대며, 턱없이 부족한 예산(shoestring budget)으로 운영합니다. 그들은 연구에 필요한 시간과 자원을 어디서 찾을 수 있을까요? 거의 모든 연구자가 이러한 제약에 직면하지만, HPE 연구를 위한 자금은 임상 연구(clinical research)에 비해 제한적입니다.88–90 자원의 투자 없이 고품질 연구를 기대하는 것은 비현실적이고 불공평해 보입니다; 실제로, 그러한 기대는 교육 연구가 저렴하거나, 쉽거나, 아니면 2류라는 것을 암시하게 될 것입니다.88,91,92 제한된 지원 상황에서는, 비용을 과소평가하여 좌절하기보다는 연구 프로젝트를 성공적으로 실행하는 데 필요한 자원을 철저히 파악하고 모으는 것(또는 시작하기 전에 프로젝트를 포기하는 것)이 더 낫다고 제안합니다.

 

교육자들은 연구 전문성(research expertise)과 멘토 또는 필요한 기술을 가진 사람들(예: 사서, 통계학자)에 대한 접근성이 부족할 수 있습니다.39 자가 학습 외에도 국가 기관(예: 특별 워크숍, 미국 의과대학 협회의 의학교육 연구 수료증93, 유럽 의학교육 협회의 의학교육 필수 기술94)과 정규 학위 프로그램(formal degree programs)95을 통해 연구 훈련을 받을 수 있습니다. 교육자들은 보건의료 전문직을 넘어 기관 내 협력자(예: 교육학 또는 심리학 교수진)를 찾고, 지역 및 전국 학회에서 전문 네트워크를 확장하고 협력자를 식별할 수 있습니다.

 

교육과정이 임상 실무에서의 제공자 행동(provider behaviors)이나 환자 예후(patient outcomes)에 미치는 영향을 측정하는 연구는 어떨까요? 이러한 연구의 까다로운 설계와 해석은 다른 곳에서 깊이 논의된 복잡한 문제의 일부입니다.28,96–101 요약하자면, 환자 예후를 사용하는 연구는 환자의 예후를 특정 교육적 개입과 다시 연결하기가 매우 어렵기 때문에 교란과 희석(confounding and dilution)의 위험이 높습니다. 희석은 제공자 행동 결과를 사용하는 연구에서는 덜 문제시되지만, 이러한 연구들 역시 수행하기 어려우며 교란, 개념적 모호성, 불충분한 통계적 검정력(statistical power)을 피하기 위해 신중한 계획이 필요합니다. 행동 및 환자 예후에 대한 연구는 종종 크고 다면적인 교육과정에 대한 개념 증명(proof of concept)을 보여주지만; 일단 교육과정이 "효과가 있다"고 밝혀지면, 그 성공에 기여한 특징들을 탐구하기 위한 추가 연구가 필요합니다. 행동과 환자 예후를 사용하는 연구가 중요하고 유용하기는 하지만, 우리는 새로운 연구자들이 이것들로 시작하지 말 것을 제안합니.

 

모든 교육 연구는 윤리 심사 위원회(ethics review board)의 검토를 포함하여 윤리적 행위의 높은 기준을 준수해야 합니다.102–104 이는 연구에서 학생이 "취약 계층(vulnerable population)"이기 때문에 매우 중요합니다.102–106 그들은 성적과 추천서를 통해 자신들의 직업적 기회에 영향을 미치는 교사와 감독관에 의해 직접적 또는 간접적으로 참여를 강요받는다(coerced)고 느낄 수 있습니다. 또한, 연구 중의 성과나 발언은 교사, 감독관, 그리고 동료들이 학생에 대해 갖는 의견에 영향을 미칠 수 있습니다.

 

우리는 "실무자를 위한 생산(production for practitioners)"(현장의 다른 교육자들이 사용할 목적으로 하는 응용 교육 연구)과 "생산자를 위한 생산(production for producers)"(예를 들어 이론이나 방법론을 발전시키기 위해 다른 연구자들이 사용할 목적으로 하는 기초 연구) 사이의 긴장을 인식합니다.107,108 두 가지 목적 모두 중요하고 유용하며, 둘 다 위에서 설명한 원칙들에 의해 촉진됩니다. 가장 유용한 것은 한 번에 두 가지 목적을 모두 다루는 연구, 즉 "파스퇴르의 사분면(Pasteur’s quadrant)"109에 있는 연구들입니다. 그러한 연구들이 의학교육 연구 출판물의 대부분을 차지합니다.110

 

마지막으로, 이 논문에서 제시된 우려, 과제 및 해결책은 동료심사 출판이 연구의 목표임을 전제로 합니다.8 일부 학자들은 이 목표를 본질적으로 지니고 자신의 분야에 진입하지만, 다른 이들은 고용이나 훈련의 기대치로서 이를 강요받습니다. "출판하지 않으면 도태된다(publish or perish)"는 압박감은 위에서 언급한 많은 문제들, 특히 맥락 특수성과 개념적 모호성을 유발하고 악화시킵니다. 우리는 교육자들이 연구에 손을 대보도록 장려하는 아이디어를 환영합니다. 실제로 첫 번째 프로젝트의 중간쯤에 이르러서야 자신이 연구를 사랑한다는 사실을 깨달은 수많은 연구자들(우리 자신을 포함하여)을 알고 있습니다. 그러나 우리는 우리의 메시지를 숙고한 후, 일부 교육자들이 자신은 정식 연구를 정말로 하고 싶지 않다는 것을 깨닫게 될 것으로 기대합니다. 이러한 깨달음은 생산적이고 중요한 진전입니다—이는 그들이 자신의 직업적 열망에 더 잘 부합하는 다른 형태의 학술활동(표 1)을 추구할 수 있게 해줍니다. 우리는 교수의 학술활동(scholarship of Teaching)을 보상하고 발견의 학술활동(scholarship of Discovery)에 대한 요구를 완화하는, 학술활동에 대한 확장된 관점을 요구하는 간청에 동의합니다.11–13,15,111–113 연구에 참여하기를 원한다는 것을 깨달은 분들께: 학술적 대화에 대한 여러분의 기여를 기대합니다.

 

 

 

 

 

 

 

 

 

Med Teach. 2025 Mar;47(3):458-466. doi: 10.1080/0142159X.2024.2339413. Epub 2024 Apr 18.

A realist evaluation of how, why and when objective structured clinical exams (OSCEs) are experienced as an authentic assessment of clinical preparedness 

 

 

[제목] 의대생 실기시험(OSCE), 어떻게 해야 '진짜' 진료 현장과 비슷해질까? 🩺

 

안녕하세요! 오늘은 의과대학이나 보건 의료 분야 교육에서 정말 중요하게 다루는 실기시험인 객관구조화진료시험(Objective structured clinical exams, OSCEs)에 대한 아주 흥미로운 논문을 하나 리뷰해 보려고 합니다.

 

OSCE를 준비하거나 치러보신 분들이라면 한 번쯤 이런 생각 해보셨을 거예요. "이거 실제 병원(real practice)에서는 이렇게 안 하는데?", "채점 기준 맞추느라 연기하는 기분이야..." 맞습니다. 기존의 OSCE는 종종 정해진 대본에 맞춘 연극처럼 느껴지거나, 파편화된 기술만 기계적으로 보여줘야 하는 한계가 있었죠.

 

오늘 소개할 논문은 어떻게 하면 OSCE를 진짜 의사들의 업무처럼 진정성(authenticity) 있게 만들 수 있는지, 그리고 그렇게 했을 때 학생과 평가자들에게 어떤 긍정적인 변화가 일어나는지를 파헤친 실재론적 평가(Realist evaluation) 연구입니다.

🤔 '진정성 있는 OSCE(Authentic OSCE)'란 무엇일까요?

연구진은 학생들이 억지로 불신을 유보하고 '허구적 계약(fiction contract)'에 억지로 짜 맞추는 대신, 스스로를 실제 의사라고 생각하고 몰입(immersion)할 수 있는 환경을 설계했습니다. 핵심 비결은 다음과 같습니다.

  • 🧩 전체 과제 수행(Whole tasks): 단편적인 기술(예: 청진만 하기)만 끊어서 평가하는 게 아니라, 실제 환자를 만나 병력을 청취하고, 진찰하고, 향후 계획을 세우는 진료의 전체 흐름을 경험하게 합니다.
  • 충분한 시간(Sufficient time): 7분, 8분 타이머에 쫓겨 기계적으로 암기한 걸 쏟아내는 대신, 실제로 생각하고 임상적 추론(clinical reasoning)을 할 수 있는 넉넉한 시간을 줍니다.
  • 🧭 자율성과 임상적 판단(Autonomy & Clinical judgement): 평가자가 "이거 하세요, 저거 하세요" 지시하는 것(prompting)을 최소화합니다. 학생 스스로 가이드라인 등 전형적인 자원(typical resources)을 찾아보고 실제 현장에서 할 법한 판단을 내리도록 유도하죠.

💡 진짜 진료 현장 같은 시험이 '진짜 실력'을 키운다 

이러한 진정성 있는 환경이 주어지자 놀라운 결과가 나타났습니다. 학생들은 이 시험을 단순히 점수를 따기 위한 관문이 아니라, 자신의 임상 준비도(clinical preparedness)를 확인하는 공정한 기회로 받아들였습니다.

시험이 실제 실무를 반영한다고 느끼니, 학생들은 OSCE 준비를 위해 시험 족보만 외우는 대신 임상 학습(clinical learning) 현장(병동 등)에서 더 많은 시간을 보내며 진짜 실력을 키우려는 동기를 얻게 되었습니다.

연구진은 이 연구의 가장 핵심적인 의견과 시사점을 다음과 같이 강조하고 있습니다.

"OSCE가 학생들이 실무에 진입할 준비도에 관한 의사 결정에 정보를 제공할 수 있는 타당도(validity)는 (적어도 부분적으로는) 학생들이 나아갈 실무 환경을 OSCE가 얼마나 진정성 있게 시뮬레이션(authentically simulate)하는지에 달려 있습니다." (The validity with which OSCEs can inform decisions on students’ preparedness to enter practice is (at least partly) dependent on how authentically the OSCEs simulate the practice into which students will progress.)

"평가 과제의 진정성(Authenticity)은 현재의 관찰로부터 실제 실무에서의 예상되는 행동을 외삽(extrapolating)하는 데 핵심적입니다. 결과적으로, 우리는 제안한 원칙들을 신중하게 적용함으로써 교육자들이 OSCE로부터 실제 생활(real life)에서의 예상 수행 능력으로 외삽할 수 있는 능력(ability to extrapolate)을 증가시킬 수 있다고 주장합니다." (Authenticity of assessment tasks is key to extrapolating from the current observation to likely behaviour in practice. Consequently, we assert that by thoughtfully applying the principles we have proposed, educators may increase the ability to extrapolate from OSCEs to likely performance in real life.)

📝 마무리하며 

결국 좋은 평가는 좋은 학습을 이끕니다. 평가자가 세세하게 지시하는 대신 학생의 주체성(agency)을 믿고 현실적인 맥락과 시간을 줄 때, 우리는 비로소 학생이 진짜 의사 가운을 입을 준비가 되었는지 정확히 확인할 수 있을 것입니다. 실기 평가를 설계하시거나 준비하시는 분들이라면, 오늘 알아본 '진정성(Authenticity)'의 요소를 꼭 한번 적용해 보시길 추천합니다! 👨‍⚕️👩‍⚕️

 


서론 (Introduction) 

객관구조화진료시험(Objective structured clinical exams, OSCEs)은 국제적으로 보건 의료 전문가 교육 내의 많은 평가 프로그램(assessment programmes)의 핵심 구성 요소입니다. 이는 고부담 목적(high-stakes purposes)을 위해 비교 가능하고 청사진이 제시된 평가(blueprinted assessments)를 제공할 수 있는 능력 때문입니다 (Boursicot et al. 2021). 이러한 유익함에도 불구하고 한 가지 피할 수 없는 관찰 결과가 있습니다. OSCE는 실제 임상 실무(real practice)가 아닌 시뮬레이션 된 환경(simulated practice) 내에서 응시자의 수행 능력(performance)을 평가한다는 것입니다 (Adamo 2003). 시뮬레이션 평가(Simulated assessment)는 학생, 모의 환자(simulated patients), 그리고 평가자가 "허구적 계약(fiction contract)"에 참여할 것을 요구합니다 (Dieckmann et al. 2007). 즉, 시뮬레이션 된 시나리오가 그들의 이전 임상 경험(clinical experience)의 현실과 동떨어져 있을 경우, 그 시나리오에 몰입하기 위해 불신을 유보(suspend disbelief)해야 합니다. 학습자가 다음 단계의 훈련이나 실무로 나아갈 준비가 되었는지 결정하기 위해 OSCE가 사용될 때, 그 타당도(validity)는 응시자가 나아갈 실무에서의 전형적인 업무, 판단, 기술 및 행동을 얼마나 진정성 있게(authentically) 나타내는가에 (적어도 부분적으로는) 달려 있습니다 (Hodges 2003b). Lavoie et al. (2020)에 따라, 우리는 진정성(authenticity)충실도(fidelity)의 요소(시나리오가 실무를 얼마나 잘 복제하는지)를 포함하지만, 학습자가 시나리오와 상호 작용하는 방식 및 이에 대한 그들의 주관적인 반응도 포함한다고 주장합니다. 이를 Kane의 타당도 모델(Kane’s model of validity)과 연관 지어 볼 때 (Cook et al. 2015), 만약 OSCE가 응시자가 실제 실무에서 어떻게 생각하거나 행동할지를 제대로 이끌어내지 못한다면, 타당도 논증의 외삽 영역(extrapolation domain)이 도전을 받게 될 것입니다.

실무 적용점 (Practice points) 

  • OSCE는 응시자의 임상 술기(clinical skills)에 대한 시뮬레이션 평가(simulated assessment)로 구성됩니다. OSCE가 실무를 시뮬레이션하는 진정성(authenticity)은 틀림없이 평가의 타당도(validity)에 기여합니다.
  • OSCE 내의 진정성은 단순히 가정될 수 없으며, 스테이션 설계(station design), 개인의 선호도, 그리고 평가에 대한 맥락적 기대(contextual expectations)의 상호 작용으로부터 나타나는 것으로 보입니다.
  • OSCE 진정성을 증진하기 위해 잠정적으로 몇 가지 조치들이 권장될 수 있지만, 그 영향은 맥락에 따라 달라지므로 실제 임상 실무(practice)에서는 신중한 적용이 요구됩니다.
  • 응시자들이 OSCE 내에서 그들의 평소 임상 수행(clinical performance)을 진정성 있게 보여줄 수 있도록 하는 것은 공정성을 높이는 동시에 임상 학습(clinical learning)에 대한 더 큰 참여를 촉진할 수 있습니다.

OSCE의 타당도(validity)에 있어 진정성(authenticity)이 중요함에도 불구하고, 이 주제에 대한 연구는 거의 이루어지지 않았습니다. 대다수의 OSCE 문헌은 그들의 심리측정적 특성(psychometric properties)에 초점을 맞추고 있습니다 (Swanson and van der Vleuten 2013). 일반적으로, 내용 근거(content evidence)는 특정 목적을 위한 해석을 뒷받침하는 증거 사슬의 일환으로 모색되지만 (Downing 2003; Kane 2013), 이러한 근거는 대개 OSCE 내의 스테이션들이 청사진(blueprint)을 얼마나 포괄적으로 표집(sample)하는지를 확립하는 것을 포함합니다 (Kreptul and Thomas 2016). 내용 일치(content alignment)표집이 중요하긴 하지만, 이는 스테이션 설계(station design) 수준에서 '진정성을 평가'하는 데는 실패합니다.

 

OSCE 내의 진정성에 관한 소수의 문헌들은 몇 가지 주제들을 강조해 왔습니다.

 

  • 임상 과제(clinical tasks)의 파편화 (Gupta et al. 2010; van der Vleuten et al. 2010; Nasir et al. 2014), 혹은 임상 실무를 제대로 반영하지 못하는 시나리오(비현실적인 환자 프레젠테이션 때문이거나, 응시자에게 기대되는 행동이 실제 임상 실무(clinical practice)에서의 일반적인 반응과 일치하지 않기 때문임 (Hyde et al. 2022))는 비진정성(inauthenticity)에 기여합니다.
  • 열악한 '과제 시간 일치(task time agreement)'(즉, 시간적 압박)는 응시자를 서두르게 만들어 (모의) 환자와의 상호작용을 변화시키고 (Gormley et al. 2016), 단순히 많은 현실적인 시나리오를 테스트하는 것을 방해하기도 합니다 (Marwaha 2011).
  • 모의 환자(Simulated patients, SP)의 사례 묘사가 비진정성적일 수 있는데, 이는 SP가 실제 환자의 전형적인 모습보다 시험 지시에 더 쉽게 순응하거나, 시나리오 스크립트가 환자에 대한 전문가적 고정관념을 반영하기 때문입니다 (Gormley et al. 2016; Hyde et al. 2022).
  • "OSCE" 자체는 연극으로 개념화되기도 하는데 (Hodges 2003a; Gormley et al. 2016), 여기서 응시자, 평가자, 그리고 모의 환자 간의 3자 상호작용은 의식화되고 리허설된 쇼를 만들어내어 응시자와 모의 환자 간의 더 진정성 있는 상호작용을 방해합니다.
  • 더욱이 스테이션이 어떻게 '채점'되는지에 대한 응시자의 기대는 비진정성적인 행동에 대한 비정상적인 유인(perverse incentives)을 만들어낼 수 있습니다 (Gormley et al. 2016).
  • Harrison (2018)은 관찰된 시나리오 내에서 응시자의 주체성(agency) 부족이 그들이 기술의 숙련도를 보여주는 것을 억제한다고 설명합니다.
  • 더 우려스러운 점은, OSCE를 앞두고 학습자들이 임상 학습(clinical learning)을 기피하는 현상(Rudland et al. 2008)이 실제 실무와 때로는 정형화된 그들의 OSCE에 대한 기대 사이의 불일치에서 비롯될 수 있다는 점입니다.

 

이러한 비판들이 OSCE의 효용성(utility)에 의문을 제기할 수 있지만, 우리는 다른 이들과 마찬가지로 (Chan and Rashid 2023) 이를 계속 유지해야 할 몇 가지 이유가 있다고 주장합니다.

  • 첫째, 직장 기반 평가(workplace-based assessments) 역시 문제점이 없는 것은 아닙니다 (Watling et al. 2016, Schumacher et al. 2022, LaDonna et al. 2017, Phinney et al. 2022, Melvin et al. 2019, Yepes-Rios et al. 2016, Sebok-Syer et al. 2018).
  • 둘째, 시뮬레이션 평가(simulated assessment)는 응시자가 실제 실무에서는 거의 또는 전혀 다루지 않을 시나리오에 대한 (특히 학부생의) 준비도를 테스트할 수 있게 해줍니다.
  • 셋째, OSCE는 응시자에 대한 동등하고 비교 가능한 테스트를 향한 헌신을 보여줍니다. 그럼에도 불구하고, 만약 그 진정성(authenticity)이 향상될 수 있다면 평가 프로그램(programmes of assessment)에 대한 OSCE의 기여도는 더욱 높아질 것입니다.

OSCE의 진정성을 어떻게 향상시킬 수 있는지에 대해 고찰한 연구가 비교적 적다는 점을 감안하여, 우리는 학생과 평가자가 스테이션 설계(station design) 및 OSCE 진행 과정과 상호 작용하는 방식이 OSCE 내에서 진정성(또는 그 부재)을 어떻게 발생시키는지 탐구했습니다. 이를 위해 우리는 유사한 접근 방식이 많은 기관에서 다양한 방식으로 사용되고 있음을 인정하면서도, 참여 기관 중 한 곳에서 사용 중인 스테이션 설계에 대한 비교적 새로운 접근 방식에 초점을 맞췄습니다. 참고로, 이들은 "진정성 있는 OSCE 스테이션(authentic OSCE stations)"이라고 불렸습니다(방법 섹션 참조). 그런 다음 우리는 다음과 같은 질문을 던졌습니다.

  • "응시자와 평가자는 어떻게 진정성 있는 OSCE 스테이션을 사용하고 상호작용하며, 어떻게, 왜, 어떤 상황에서, 누구에게 이것이 OSCE가 응시자의 미래 역할에 대한 준비도를 평가하는 진정성 있는 테스트라는 인식에 영향을 미치는가?"

방법 (Methods) 

데이터는 AD-Equiv 연구(Yeates et al. 2022) 내에서 수집되었으며, 이 연구는 분산된 졸업 수준 OSCE의 진정성(authenticity), 진단 정확도(diagnostic accuracy)동등성(equivalence)을 향상시키는 것을 목표로 했습니다. 우리는 마음 독립적인 현실이 존재하지만 이러한 현실에 대한 지식은 다양한 맥락(contexts)이 특정 기제(mechanisms)와 어떻게 상호 작용하여 다양한 사람들에게 다양한 결과(outcomes)를 만들어내는지 관찰하고 연역함으로써 구성된다고 보는 실재론적 존재론 및 인식론(Realist ontology and epistemology)을 채택했습니다 (Pawson and Tilley 1997). 최근 진정성 있는 OSCE 스테이션(authentic OSCE stations)을 경험한 학생, 평가자, 모의 환자를 대상으로 실재론적 인터뷰(realist interviews) (Manzano 2016; Greenhalgh et al. 2017) 및 포커스 그룹(focus groups)을 통해 데이터를 수집하는 실재론적 평가 접근법(Realist evaluation approach) (Duddy and Wong 2022; Trisha Greenhalgh et al. 2017)을 채택했습니다. 포커스 그룹은 OSCE 직후에 사용되어 경험이 생생하게 남아있는 동안 학생들의 관점을 탐구했으며, 상호작용을 통해 서로 다른 학생들이 왜 다르게 반응했는지 탐구했습니다. 반대로 인터뷰는 수 시간에서 몇 주 후의 시점에서 더 심층적인 개인적 반응과 성찰을 가능하게 했습니다. 우리의 방법과 RAMESES II 체크리스트(RAMESES II checklist) (Wong et al. 2016)의 비교는 보충 부록 3에 제공됩니다.

중재: '진정성 있는' OSCE 스테이션의 도입 (The intervention: introducing ‘authentic’ OSCE stations) 

진정성 있는 OSCE 스테이션(Authentic OSCE stations)은 다음과 같은 원칙에 따라 설계되었습니다:

  • 스테이션은 영국 파운데이션 의사(PGY1-2)의 전형적인 업무 시나리오를 특징으로 해야 합니다.
  • (실현 가능한 한) 응시자는 환자와의 만남 전체를 완료해야 합니다.
  • 스테이션 정보는 임상 맥락(clinical context)을 설명해야 하며, 학생들은 (특정 행동을 수행하도록 지시받는 대신) 임상적 판단(clinical judgement)을 사용하여 실제 실무에서 할 행동을 결정하고 수행해야 합니다.
  • 학생들의 주체성(agency)을 장려하기 위해 평가자와의 상호 작용은 최소한으로 유지됩니다.
  • 파일럿 연구를 통해 이러한 새로운 진정성 있는 스테이션들에 대한 과제 시간 일치(task-time agreement)를 확보했습니다. 보충 부록 2에 OSCE에 대한 추가 세부 정보가 포함되어 있습니다.

모집단, 표집 및 모집 (Population, sampling and recruitment) 

우리의 연구 모집단(population)은 학부 교육 후반 단계의 학생들을 위한 영국 학부 OSCE의 참여자(응시자, 평가자, 모의 환자)였습니다. 우리는 4개의 영국 의과대학(영국 연방인 잉글랜드, 북아일랜드, 스코틀랜드, 웨일스에서 각각 한 곳씩)에서 지리적 및 학교의 다양성을 목표로 의도적 표집(purposive sampling)을 수행했으며, 여기에는 설립된 지 오래된 곳과 비교적 새로운 의과대학의 4학년(끝에서 두 번째) 및 5학년(마지막) 학생들이 포함되었습니다. 참여자는 이메일과 구두 초청을 통해 모집되었습니다.

초기 프로그램 이론 (Initial programme theory) 

이론 기반 실재론적 조사의 핵심 측면은 초기 프로그램 이론(initial program theory, IPT)을 개발하는 것입니다. IPT는 중재가 어떻게, 누구를 위해, 왜, 그리고 어떤 맥락 하에서 작동할 것으로 기대되는지를 틀 짓고 이해하는 데 사용될 수 있습니다 (Duddy and Wong 2022).

  • 우리의 IPT는 진정성 있는 OSCE 스테이션의 요소 조합이 일상적인 임상 실무(clinical practice)를 더 밀접하게 나타내는 방식으로 학생들이 임상 과제를 수행하는 능력을 입증할 수 있게 함으로써 응시자들에게 진정성을 총체적으로 증가시킬 것이라고 가정했습니다.
  • 우리는 이것이 과제에 대한 응시자의 이해도와 스테이션이 제시하는 도전 수준에 의해 매개(mediated)될 것으로 예상했습니다.

데이터 수집 (Data collection) 

인터뷰는 OSCE 후 3개월 이내에 Microsoft Teams를 통해 수행되었습니다. 학생 포커스 그룹은 OSCE 직후 대면으로 수행되었습니다. 모든 데이터는 오디오로 녹음되고 전사되었습니다. 연구원들은 참가자들이 인식하는 진정성 있는 OSCE 스테이션(authentic OSCE stations)과 일반적인 OSCE 스테이션 형식 간의 비교를 탐구하는 질문 템플릿을 사용했으며, 중재의 요소(내용, 타이밍, 자극 자료, 전체 과제 등)가 어떻게 그리고 왜 다른 스테이션, 다른 사람, 또는 다른 학교 내에서 다양한 반응을 이끌어내고 다양한 결과를 생성하는지에 초점을 맞추었습니다. 실재론적 인터뷰에 대한 권장 사항(Greenhalgh et al. 2017)과 일관되게, 연구원들은 떠오르는 이슈를 추적하고 최근 분석에서 얻은 인상을 바탕으로 진화하는 프로그램 이론의 요소를 테스트하기 위해 질문을 조정했습니다. 인터뷰 내내 연구원들은 안전하고 포용적이며 기밀이 유지되는 환경을 구축하기 위해 노력했습니다.

분석 (Analysis) 

데이터는 분석의 실재론적 논리(realist logic)를 사용하여 분석되었습니다 (Pawson and Tilley 1997; The RAMESES II Project 2017). 데이터 분석은 데이터 수집과 병행하여 진행되었으며 후속 인터뷰 수행에 정보를 제공했습니다. 두 명의 연구원(PY와 AM)은 데이터의 일부를 읽고 익숙해지며 IPT와 관련된 민감화 개념(sensitising concepts)(예: 전체 과제, 시간, 파편화, 주체성 등)에 대해 논의했습니다. 그런 다음 한 명의 연구원(AM)이 모든 데이터를 코딩하여 IPT와 관련이 있어 보이는 개념을 귀납적(inductively)이고 이론적으로 명명했습니다. 보조 코딩은 민감화를 더욱 돕기 위해 PY에 의해 수행되었습니다. 코드들은 유사한 범주(categories)로 모아졌습니다. 연구원들은 관련된 맥락(contexts), 기제(mechanisms), 결과(outcomes)를 찾기 위해 이러한 범주들을 면밀히 조사했으며, 이는

  • 병치(패턴을 찾기 위해 다른 출처의 데이터를 비교함),
  • 조정(데이터 출처 간의 불일치를 해결함),
  • 판정(가장 그럴듯한 설명을 결정하기 위해 증거의 무게를 잰다),
  • 통합(결과를 일관된 전체로 통합함)

...의 분석적 과정을 사용하여 맥락-기제-결과 구성(context-mechanism-outcome configurations, CMOCs)으로 조직화되었습니다 (Papoutsi et al. 2018). CMOCs가 생성됨에 따라 연구원들은 진화하는 프로그램 이론과의 관련성을 고려했습니다. GW는 CMOCs가 정제될 때 추가적이고 데이터 주도적인 비평을 제공했습니다. 분석은 연구원들이 데이터 내의 반(半)규칙성(demi-regularities)(반복적으로 나타나는 결과 패턴)과 일치하고 성숙한 프로그램 이론이 도출된 그럴듯한 CMOCs가 개발되었다고 판단할 때까지 진행되었습니다.

성찰성 (Reflexivity) 

우리 연구팀에는 Keele에서 진정성 있는 OSCE 형식을 개발한 사람(RK, NC)과 다른 OSCE 형식을 사용하는 의과대학 소속 사람(KC, AC, VON, CC, RG, RV, SE)을 포함하여 임상(PY, RK, KC, AC, CC, RG, SE, RF, RMK, GW) 및 비임상(NC, VON, RV) OSCE 전문가가 포함되었습니다. 또한 실재론적 평가 전문가(GW)와 OSCE 경험이 거의 없는 다른 연구원(AM)도 포함되었습니다. 결과적으로, 팀이 진정성 있는 OSCE(authentic OSCEs)의 잠재적 이점에 관심이 있었음에도 불구하고, 이러한 다양성은 중재 요소의 이점과 과제(예: 학생에게 지시를 내리는 것과 자율성을 부여하는 것의 균형), 그리고 CMOC 설명의 과제 및 개선에 대한 대조적인 견해를 생성했습니다.

윤리 (Ethics) 

연구에 대한 모든 참여는 자발적이었으며, 참가자는 철회할 권리가 있었습니다. 사전 동의(Informed consent)는 전자 동의서를 통해 문서화되었습니다. 모든 데이터는 가명 처리(pseudonymised)되었으며 기밀로 취급되었습니다. 인터뷰 담당자(PY 또는 AM) 중 누구도 학생이나 그들의 진급에 대한 직접적인 과정 책임이 없었습니다. 이 연구에 대한 윤리적 승인은 Keele 연구 윤리 위원회(참조 MH-210209)에 의해 승인되었습니다.

 

결과 (Results) 

총 15명의 응시자(candidates), 13명의 평가자(examiners), 7명의 모의 환자(simulated patients)로 구성된 35건의 인터뷰(interviews)와 3건의 포커스 그룹(focus groups)의 관련 부분이 포함되었습니다. 우리의 분석은 13개의 맥락-기제-결과 구성(CMOCs)을 도출했으며, 각각은 주어진 맥락에서 중재의 특정 측면이 어떻게 기계적으로(mechanistic) 작동하는지에 대한 데이터 기반의 이론적 주장(theoretical claim)을 제공합니다. 근거 자료를 포함한 개별 CMOC는 보충 부록 1에서 확인할 수 있으며, 표 1에 요약되어 있습니다. 여기에서는 텍스트 내에 관련 CMOC를 참조하고 요약된 예시 인용문을 함께 제시하여, 이들이 뒷받침하는 프로그램 이론(programme theory)에 대한 서술(narrative)을 제공합니다.

 

 

표 1. CMOC의 제목. 

 

이 연구에서 우리가 만든 많은 시나리오들은 학생들이 실제 임상 실무(practice)에서 전형적으로 어떻게 행동할지를 그들 스스로 매우 진정성 있게 나타낸다(authentic representation)고 느끼게 해주었습니다. 따라서 이는 실무로 나아갈 준비가 되었는지를 평가하는 공정한 수단으로 여겨졌습니다. 그들에게 있어 이것은 기존의 평가(assessments)보다 개선된 것이었습니다. 하지만 이것이 모든 사람이나 모든 스테이션에서 효과가 있었던 것은 아닙니다.

 

학생과 평가자가 시나리오를 진정성(authentic) 있다고 경험하는 정도는 각 시나리오마다 서로 다르게 상호 작용하는 여러 요인의 영향을 받았습니다.

  • 이 중 몇 가지는 스테이션 설계(station design)의 특성이었으며, 중재의 기반이 된 진정성 있는 OSCE 스테이션의 원칙에서 비롯되었습니다.
  • 일부는 사람과 관련된 요인이었고, 다른 일부는 사람들의 규범(norms)기대(expectations), 또는 더 넓게는 평가 내의 문화(culture)와 관련이 있었습니다.

진정성이 향상되었을 때 (When authenticity was enhanced) 

시나리오가 F1(파운데이션 1년차) 의사의 전형적인 업무(typical work)를 효과적으로 나타낼 때, 이는 시나리오에 신뢰성(credibility)을 부여했고(CMOC_1a_TW), 학생들의 미래 역할에 대한 경험 및 기대와 일치했기 때문에 학생들의 사고를 임상 환경(clinical environment)에 위치시켰습니다(CMOC_1b_TW).

"또한 환자가 가진 프레젠테이션이 F1으로서 관리해야 할 것들이라는 점이 좋았습니다 [네]. 그것은 단지 어떤 징후를 발견하는 것이 아니라, 급성 프레젠테이션(acute presentation)에 가깝고, 환자를 관리하며, 다음 팀에 의뢰하기 전에 환자를 안정시키기 위해 하는 일들이었습니다. 그래서 저는 그것이 꽤 유용하다고 생각했습니다." (24th AD equiv, Focus Group Site4, Students)

 

이는 결과적으로 그들이 그 역할에 자신을 투영하게 만들었고, 실제 실무에서 할 것처럼 생각하고 행동할 수 있게 했습니다(CMOC_1c_TW). 이것은 그들이 자연스럽게 행동하는 데 도움이 되었습니다.

  • 임상 문제(clinical problems)가 미리 연습하기 어려울 만큼 풍부하고 복잡하며, 미묘한 접근(nuanced approaches)을 요구할 때, 학생들은 표준화된 정답이 적절하지 않다는 것을 깨달았고 해결책을 제시하기 위해 자신의 경험을 이끌어내야 했습니다(CMOC_1b_TW 및 CMOC_2_WT).
  • 반대로 덜 복잡하거나 예측 가능한 시나리오일수록 연습된 반응을 이끌어낼 가능성이 높았습니다.
  • 학생들에게 전체 임상 과제(clinical task)를 완료하도록 요구하는 것은 그들이 수집하기로 선택한 정보를 통합(integrate)하고 끝까지 수행할 수 있는 공간을 제공했습니다. 이는 파편화(fragmentation)를 피하면서 그들의 발달 중인 임상적 통찰력(clinical acumen)을 활용하게 했고, 따라서 학생들이 실제 실무에서 할 행동을 더 잘 보여주었습니다(CMOC_2_WT).

"이것[진정성 있는 OSCE를 지칭함]은 제가 몇 달 후에 다 같이 할 수 있어야 하는 종류의 일입니다... 제 병동 실습(ward placements)에서도 그런 식으로 반영되어 있습니다. ... 저는 꽤 포괄적인 병력(comprehensive history)을 청취하는 방법을 알고 있습니다. 환자를 진찰하는 방법도 압니다. 하지만 그것은 모든 것을 하나로 모으는 것이고, 그 과정과 그 이후에 나오는 의사 결정(decision-making)입니다; ... 모든 것을 하나로 모으고 모든 정보를 합성(synthesising)하는 것입니다." (23rd AD-Equiv, interview, site3 Stud6).

 

이는 수행해야 할 행동에 대한 비교적 제한된 지시(limited direction)와 평가자의 개입(prompting)을 피함으로써 더욱 도움을 받았습니다. 학생들은 무엇을 해야 할지 스스로 알아내야 했고, 그들의 선택은 스테이션의 결과에 영향을 미쳤습니다. 이는 학생들이 무엇이 적절한지에 대해 스스로 판단(judgements)하도록 강제했고(CMOC_3a_LP), 이는 임상 환경에 더 많이 참여했던 학생들에게 유리하게 작용했는데, 그들은 자신의 경험을 바탕으로 정보를 통합하고 행동을 지시할 수 있었기 때문입니다(CMOC_3b_LP).

"스테이션을 더 실제 생활(real-life)과 같은 것으로 보는 데 도움이 되었습니다... 들어가서 제 나름의 계획을 세우고 제 방향대로 갈 수 있었습니다. 올바른 길로 가고 있는지 아닌지 모르기 때문에 약간의 불확실성이 더해진 것 같습니다. ... 제가 잘못된 것을 하고 있더라도, ... 아무도 제지하고 말해주지 않을 것이라는 것을 알기 때문에 ... 확실히 실제 생활과 훨씬 더 비슷했습니다." (23rd AD-Equiv, interview, Site3 Stud6)

 

충분한 시간을 제공하는 것은 학생들이 당황하거나 연습된 루틴으로 되돌아가지 않고 생각하고 통합할 수 있게 해주어 도움이 되었습니다(CMOC_4_Ti).

"이것은 제가 약간 더 현실적이 되게 만들었습니다. 왜냐하면 '좋아. 7분 타이머, 8분 타이머를 걱정할 필요가 없어'라는 식이었기 때문입니다. 그냥 기계적으로 반복(regurgitate)하는 것이 아니라 실제로 생각할 수 있었습니다." (16th AD-Equiv, interview, site 3 stud3)

 

관련 리소스(가이드라인 등)를 제공하는 것은 기억에 대한 인위적인 의존을 피하고 학생들이 정보 접근에 대한 친숙함을 보여줄 수 있게 했습니다. 이는 실무에서 할 일과 더욱 일치했습니다(CMOC_5_Tr). 간단한 소품(props)(예: 전화기)의 사용은 시나리오를 더 현실적으로 보이고 느껴지게 만들어 학생들의 몰입(immersion)을 돕고 따라서 자연스럽게 행동하도록 도왔습니다(CMOC_6_Pr). 시나리오가 학생들에게 특정 행동을 시연(demonstrate)하도록 요구할 때(예: 산소 포화도를 측정하겠다는 의도를 단순히 말하는 대신 프로브를 사용하여 측정하는 것), 이는 단지 지식(knowledge)이 아닌 관련 직장 기술(workplace skills)을 테스트하기 때문에 평가의 진정성을 더욱 높였습니다(CMOC_7_Dem). 이는 학생들이 미래의 역할에 자신을 투영하고 그들의 준비도(preparedness)를 보여주는 능력에 기여했습니다.

진정성이 도전받았을 때 (When authenticity was challenged) 

이것이 모든 사람에게 효과가 있었던 것은 아닙니다. 예를 들어, 소수의 학생과 평가자들은 배우가 환자가 아니며 학생의 행동이 그들에게 아무런 영향을 미치지 않는다는 사실을 넘어서는 데 어려움을 겪었습니다. 실무와의 이러한 불가피한 차이점에 초점을 맞추는 것은 시나리오의 허구(fiction)에 대한 그들의 몰입을 감소시켰고, 따라서 평가가 학생들의 실무를 유용하게 보여주는 것이라기보다는 인위적인 테스트(artificial test)처럼 느껴지게 만들었습니다(CMOC_8_DFC).

"누군가 당신을 지켜보고 있다는 것을 알기 때문에, 문제의 원인을 정말로 찾기보다는 무언가를 하고 있는 것처럼 보이기 위해 행동하게 됩니다. 반면에 실제 환자의 경우, OSCE의 번거로움(faff)에 신경 쓰지 않습니다. 중요한 것만 바로 처리합니다." (11th AD-Equiv, interview Site3 st1)

 

시나리오가 실행되는 방식 또한 학생들의 몰입에 영향을 미쳤습니다. 어떤 요소가 실제 실무와 일치하지 않을 때(incongruous) (예: 심각하게 아파야 할 모의 환자가 편안해 보이는 경우), 이는 학생들이 잘못된 가정을 하거나 혼란을 느끼게 하여 수행(performance)에 영향을 미칠 수 있었지만(CMOC_9_Inc), 아마도 더 중요한 것은 실무에서 해야 할 일을 하는 것과 인위적인 방식으로 기술을 시연하는 것 사이의 경계가 어디인지에 대한 딜레마를 제시했다는 점입니다. 시나리오가 합리적으로 각기 다른 방식으로 접근될 수 있는 경우 (예: 집중적인 신체검사 대 보다 체계적인 신체검사; 다양한 합리적 관리 접근법), 학생과 평가자는 실무에서 허용될 수 있는 접근법과 공식 시험의 전형적인 기대치 사이의 차이를 조화(reconcile)시키는 데 어려움을 겪었기 때문에 무엇을 기대하거나 어떻게 행동해야 할지 확신하지 못했습니다(CMOC_10_LDP). 이는 학생들이 자신의 진정성 있는 임상 수행(authentic clinical performance)을 보여주려는 경향을 더욱 감소시켰습니다.

"환자와 자연스럽게 대화하고 인위적으로 그 시나리오에 놓이지 않은 채 자연스럽게 진찰로 이어지는 아이디어가 너무 좋습니다 ... [하지만] 정해진 채점 기준(marking scheme)이 있고, 우리가 해야 할 정해진 일들이 있습니다 ... 저는 생각하려고 노력했습니다. 좋아, 평가자들이 나에게 무엇을 원하지? [네] 만약 제가 곤봉지(clubbing) 검사를 하지 않으면 감점(marked down)을 받을까?" (24th AD Equiv focus group, site4 students).

 

일부 학생들은 수행해야 할 행동에 대한 정확한 지시(precise direction)가 부족하여 어려움을 겪었습니다. 그들은 명시된 기술을 보여주는 데 익숙해져 있었고, 판단(judgement)을 사용해야 한다는 점이 그들을 불안하게 만들었으며 진정성 있게 행동하기 어렵게 만들었습니다(CMOC_11a&b_Anx).

 

학생들은 의식적이고 비진정성적인 기대를 강요하는 OSCE가 그들의 임상 학습(clinical learning)이 OSCE에서 보상받지 못하기 때문에 임상 학습 환경에 대한 참여를 감소시킨다고 설명했습니다(CMOC_12_Rit). 반대로, 학생들은 OSCE가 진정성 있는 실무(authentic practice)를 보여주는 것에 더 많은 보상을 제공할수록, 그들이 임상 환경에서 시간을 보냄으로써 실무 준비도를 더 높이는 결과를 가져와 준비를 더 잘하게 될 것이라고 인식했습니다(CMOC_13a&b_IOL).

"그래서 어쩌면 OSCE를 조금 더 현실적으로 만들고 우리가 병동에 있으면서 배울 수 있는 것으로 만들면, 그것이 우리가 실무를 위해 조금 더 준비하도록 장려할 수도 있을 것입니다." (8th AD-Equiv, focus group, site2 students)

 

고찰 (Discussion) 

프로그램 이론 요약 (Summary of programme theory) 

 

대부분의 학생들은 "진정성 있는(authentic)" 시나리오에 반응하도록 요구받았을 때, 해당 시나리오가 자신의 미래 역할에 갖는 적용 가능성(applicability)을 인식했으며, 자연스럽게 행동하고 점차 발전하는 임상적 통찰력(clinical acumen)을 사용하여 실무에 대한 준비도(preparedness for practice)를 진정성 있게 보여줄(authentic representation) 수 있었습니다. 이러한 인식은 시나리오가

 

  • 신입 의사들의 전형적인 업무(typical of the work)이고,
  • 완전한 과제(complete tasks)로 제시되며,
  • 학생들이 정보를 수집하고 통합하여 판단을 내린 다음 환자와 소통하고 관리하기 위해 자신의 판단력(judgement)을 사용해야 할 때

 

...촉진되었습니다. 학생들에게는 생각하고 서두르지 않을 충분한 시간(sufficient time)이 필요했습니다. 해당 상황의 전형적인 소품과 자원(Props and resources)은 몰입(immersion)을 도왔습니다. 임상 실무(clinical practice)에 더 많이 참여했던 학생들은 시나리오가 미래 역할에 적용될 수 있음을 더 잘 인식했고 더 자연스럽게 행동할 수 있었습니다.

 

일부 상황은 진정성(authenticity)에 도전이 되었습니다:

 

  • 학생이나 평가자가 실무와의 불가피한 차이(unavoidable differences)에 초점을 맞추거나,
  • 스테이션 실행 과정의 일치하지 않는 요소(incongruous elements)가 학생들에게 추측이나 혼란을 야기하거나,
  • 학생들이 평가자의 기대(examiners’ expectations)에 사로잡혀 있을 때,

 

...이는 몰입을 방해(inhibit immersion)하는 경향이 있었습니다. 이러한 맥락(contexts)은 학생들로 하여금 얼마나 자연스럽게 행동해야 하는지에 대해 의문을 품게 만들었고, 이는 불안감(anxiety)을 유발하여 학생과 평가자 모두에게 평가의 진정성(authenticity of the assessment)을 떨어뜨렸습니다.

이론적 해석 (Theoretical interpretation) 

우리의 연구 결과는 OSCE의 진정성이 응시자(그리고 정도는 덜하지만 여전히 중요한 평가자와 모의 환자)가 시나리오에서 요구하는 "허구적 계약(fiction contract)" (Dieckmann et al. 2007)에 불신을 유보(suspend their disbelief)하고 얼마나 효과적으로 몰입(immerse)하는지에 결정적으로 달려 있음을 시사합니다. 우리의 연구 결과 중 일부는 시뮬레이션의 충실도(fidelity)에 관한 문헌과 공명합니다:

 

  • 실제 실무(real practice)에서 도출된 사례의 사용 (Maclean et al. 2019),
  • 과제를 (말로 설명하기보다는) 실제로 수행(perform)해야 할 필요성 (Engström et al. 2016),
  • 환경적 단서(environmental cues)(예: 소품)의 사용 (Nanji et al. 2013), 그리고
  • 학생의 행동에 따라 시나리오가 발전(evolve)할 기회 (Marei et al. 2018)가 그것입니다.

 

우리 연구가 추가한 점은, 이러한 요소들이 OSCE 시나리오 내에서 결합되어 학생들이 미래의 역할에 자신을 투영(project)하고 다음 단계의 임상 실무(clinical practice)로 나아갈 준비도를 행동으로 보여줄(demonstrate) 수 있게 하는 방식을 관찰했다는 것입니다. 더욱이, 평가 맥락(assessment context)에서 좋은 성적을 얻고자 하는 학생들의 욕구는 때때로 그들의 몰입 능력과 충돌하는 것처럼 보였으며, 이는 시뮬레이션이 학습(learning)에 초점을 맞출 때보다 평가 시나리오(assessment scenarios)에서 몰입이 더 복잡하다는 것을 시사합니다. 이는 부분적으로 사람들이 관찰당하는 동안 자연스럽게 행동하기 어려워하기 때문일 수 있는데(즉, 호손 효과(Hawthorne Effect)) (Adair 1984), 이러한 현상은 직장 기반 평가(workplace-based assessment)에서도 발생합니다 (Watling et al. 2016). 또한 평가 맥락은 학생들로 하여금 불신을 어디까지 유보해야 할지(점수를 얻기 위해 "환자"에 대한 나의 시각적 형태(visual gestalt)를 믿어야 할까, 아니면 더 아픈 환자에게 취할 조치들을 시연해야 할까?) 판단하기 어렵게 만들 수 있습니다. 이것은 Dieckmann(2007)의 공유된 규칙(shared rules) 개념과 관련이 있으면서도, 평가 맥락에서는 진정성 있게 행동할 수 있는 충분한 자율성(autonomy)을 허용하는 것기대치(expectations)를 공정하게 전달하는 것 사이에 갈등(conflict)이 발생할 수 있음을 보여줍니다. 결과적으로, 시뮬레이션 충실도(simulation fidelity)의 많은 원칙이 잘 확립되어 있지만, 우리는 이러한 원칙을 평가에 적용하는 것이 훨씬 더 복잡해야 함을 보여주었습니다.

 

Dieckmann의 “공유된 규칙(shared rules)”은 여기서 왜 중요한가?

시뮬레이션은 사실 모두가 어떤 암묵적 합의 위에서 돌아갑니다.
예를 들면,
  • 학생은 “이 배우를 환자로 받아들이겠다”
  • 시뮬레이터의 한계를 어느 정도 감안하겠다
  • 완벽히 현실과 같지 않아도 교육적 목적으로 참여하겠다
이런 것이 shared rules, 즉 공유된 규칙입니다.
그런데 평가 상황에서는 이 규칙이 더 복잡해집니다.
왜냐하면 학생은 이렇게 궁금해하기 때문입니다.
  • “이 상황에서 어느 정도까지 자유롭게 행동해도 되지?”
  • “평가자는 내가 창의적으로 대응하는 걸 좋아할까, 아니면 정해진 절차를 따르길 원할까?”
  • “환자 중심적으로 자연스럽게 해야 하나, 아니면 채점표 중심으로 해야 하나?”
즉, 평가에서는
시뮬레이션 참여 규칙시험 채점 규칙이 겹쳐지는데,
이 둘이 항상 잘 맞아떨어지지 않습니다.

연구자들이 말하는 “갈등(conflict)”은 정확히 무엇인가?

핵심 갈등은 이것입니다.

평가 설계자는 두 가지를 모두 원합니다.

  1. 학생이 진정성 있게(authentically) 행동하길 원함
  2. 동시에 평가의 공정성(fairness)기대치의 명확성도 보장해야 함
그런데 이 둘은 긴장 관계에 있습니다.

너무 자유를 많이 주면

  • 학생마다 다른 방식으로 행동
  • 채점이 어려워짐
  • 공정성 문제가 생길 수 있음

너무 기대치를 강하게 규정하면

  • 학생이 자연스럽게 행동하지 못함
  • “정답 연기”만 하게 됨
  • 진정성이 떨어짐
즉,
진정성(authenticity)표준화(standardization) 사이의 긴장이라고 볼 수 있습니다.
이건 의학교육 평가에서 아주 중요한 주제입니다.
조금 더 넓은 개념으로는 assessment authenticity paradox 같은 문제와도 연결해서 생각할 수 있습니다.
즉, “진짜 같게 만들수록 좋은 평가인가?”라는 질문인데, 실제로는 진짜 같음채점 가능성이 항상 함께 가지 않습니다.

마지막 문장의 뜻: 왜 fidelity 원칙을 평가에 적용하는 것이 더 복잡한가?

시뮬레이션 교육에서는 흔히
“충실도(fidelity)가 높을수록 좋다”
는 식으로 생각하기 쉽습니다.

여기서 fidelity는 단순히 기계가 정교하다는 뜻만이 아니라,
  • 상황이 얼마나 실제처럼 느껴지는지
  • 학습자가 얼마나 몰입할 수 있는지
  • 맥락이 얼마나 진정성 있게 구성되는지
를 포함하는 넓은 개념입니다.
그런데 연구자들은 말합니다.
학습용 시뮬레이션에서는 fidelity 원리가 비교적 잘 작동할 수 있지만, 평가용 시뮬레이션에서는 사정이 다르다.
왜냐하면 평가에서는 학생이
  • 상황에 몰입해야 하고,
  • 동시에 채점당하고 있으며,
  • 점수에 대한 불안이 있고,
  • 평가자의 기대를 추측해야 하고,
  • 표준화된 행동도 요구받기 때문입니다.
그래서 평가 맥락의 fidelity는 단순히
“더 실제처럼 만들면 된다”
로 해결되지 않습니다.

오히려 이렇게 물어야 합니다.
  • 학생이 실제로 몰입할 수 있는 평가인가?
  • 학생이 무엇을 믿고 행동해야 하는지 명확한가?
  • 진정성과 공정성 사이의 균형이 적절한가?
  • 평가가 학생에게 ‘환자를 대하는 것’ 을 요구하는가, 아니면 ‘정답을 연기하는 것’ 을 요구하는가?

 

시나리오에 대한 몰입(Immersion)은 사람에 따라 그 효과가 다르게 나타났습니다. 우리의 데이터로는 이 관찰을 완전히 설명할 수 없으며 추가적인 조사(further investigation)가 필요합니다. 추상적 사고 능력(abstract thinking ability)이나 상상력(imagination)의 개인차(individual differences)에서 추가적인 설명이 나올 수 있습니다. 다른 문헌에서, 사람들이 가상 현실(virtual reality)에 몰입하는 능력의 차이는 공간 지각력(spatial awareness)의 차이에 기인하며 (Coxon et al. 2016), 이야기의 서사(narrative)에 참여하는 차이는 감정적 민감성(emotional sensitivity)의 차이에 기인한다고 보았습니다 (Samur et al. 2021). 결과적으로, 허구적 계약(fiction contract)에 참여하는 것이 단순히 더 어려운 개인이 있을 수 있습니다. 이는 그러한 사람들에게 OSCE가 갖는 타당도 함의(validity implications)에 대한 추가적인 탐색의 필요성을 시사합니다.

실무적 함의 (Practical implications) 

우리의 연구 결과를 바탕으로, 총괄 평가 맥락(summative contexts)에서의 반복(replication) 필요성을 인정하면서, 우리는 OSCE에서 평가의 진정성을 향상하는 데 사용될 수 있는 몇 가지 원칙을 잠정적으로 제안합니다(상자 2 참조). 모든 복잡한 중재(complex interventions)와 마찬가지로, 이러한 원칙을 구현하려면 적용되는 맥락(context) 내에서 신중한 고려가 필요합니다.

 

  • 충분한 시간을 허용하라는 제안은 스테이션의 수를 줄이고 길이를 늘리는 결과를 낳을 수 있습니다. 이는 그 자체로 주요한 타당도 근거(validity evidence)의 원천으로 제안되어 온 OSCE 청사진(blueprint)의 표집(sampling)을 감소시킬 수 있습니다 (Wass et al. 2001). 이러한 스테이션들의 상대적인 신뢰도(comparative reliability)는 아직 잘 확립되지 않았으며 예측하기 어렵습니다. 한편으로,
    • 독립적인 관찰(independent observations) 횟수가 적어지면 신뢰도(reliability)가 떨어질 수 있지만 (Eva 2018),
    • 임상의의 실무 경험과 더 일치하는 평가자의 판단(judgements)은 현대 학습 분류체계(contemporary taxonomies of learning)의 전형적인 특징인 복잡한 문제 해결 기술(problem solving skills)에 평가를 더 집중시킴으로써 신뢰도를 뒷받침할 수도 있습니다 (Crossley et al. 2010; Dubas and Toledo 2016).
  • 이 논쟁은 새로운 것이 아닙니다. Cook et al. (2015)은 Kane (2013)이 묘사한 외삽(extrapolation)(점수를 실제 세계의 수행 능력을 반영하는 것으로 사용)일반화(generalisation)(점수를 모든 가능한 테스트 환경에서의 예상 수행 능력을 반영하는 것으로 사용) 사이의 긴장, 혹은 역사적으로 단순히 타당도 대 신뢰도(validity versus reliability)로 지칭되던 것들 사이의 긴장 관계를 언급합니다 (van der Vleuten 1996).
    • 평가 과제의 진정성(Authenticity)은 현재의 관찰로부터 실제 실무에서의 예상되는 행동을 외삽(extrapolating)하는 데 핵심적입니다. 결과적으로, 우리는 제안한 원칙들을 신중하게 적용함으로써 교육자들이 OSCE로부터 실제 생활(real life)에서의 예상 수행 능력으로 외삽할 수 있는 능력(ability to extrapolate)을 증가시킬 수 있다고 주장합니다. 이를 일반화(generalisation)에 미치는 영향과 균형을 맞추기 위한 추가 작업이 필요할 것입니다.

 

 

이러한 질문들의 실무 중심적인(practice-focused) 특성을 고려할 때, 우리는 스테이션 작성(station writing)과 평가(examination) 모두 이상적으로는 신입 의사의 현재 업무와 그 역할에 대한 기대에 매우 익숙한 사람들에 의해 수행될 것을 권장합니다.

 


박스 2. OSCE의 진정성을 향상시키기 위한 요약 권장 사항
(Box 2. Summary recommendations to enhance authenticity in OSCEs)
 

  1. 신임 의사 업무의 전형적인 과제(typical tasks)를 선택하십시오.
  2. 학생들에게 가능한 한 전체 임상 만남(whole clinical encounter)을 완료하도록 요구하십시오.
  3. 학생들의 판단(judgement)을 장려하십시오: 평가자의 지시(prompting)와 개입(intervention)을 제한하십시오.
  4. 서두르지 않도록 충분한 시간(sufficient time)을 제공하십시오. 이는 임상 추론(clinical reasoning)을 가능하게 합니다.
  5. 가이드라인이나 처방 자원과 같은 현실적인 지식 자원(knowledge resources)에 대한 접근을 제공하십시오.
  6. 시나리오에 대한 몰입(immersion)을 돕기 위해 소품(props)을 사용하십시오.
  7. 학생들에게 기술을 단순히 말로 표현하는(verbalizing) 대신 시연(demonstrate)하도록 요구하십시오.
  8. 시나리오 몰입을 방해할 수 있는 일치하지 않는 요소(incongruent elements)를 피하십시오.
  9. 안전하고 효과적인 결과를 위한 다수의 합리적인 접근법(legitimate approaches)을 인정하면서, 학생과 평가자가 불확실성(uncertainty)에 대비하도록 하십시오.

강점 및 한계점 (Strengths and limitations) 

우리의 연구 결과는 다양한 맥락(contexts)에서 이 스테이션 형식의 작동 방식을 연구하기 위해 실재론적 평가(Realist evaluation)를 사용하여, 4개의 다른 기관에서 표집되고 다수의 참가자가 포함된 데이터에 의해 뒷받침됩니다. 그럼에도 불구하고 이 연구에는 몇 가지 한계점이 있습니다.

  • 첫째, 학생과 평가자의 참여가 자발적 성격(voluntary nature)을 띠었기 때문에, 이들의 관점이 전체 참가자들을 완전히 대변하지 못했을 수 있다는 한계가 있습니다. 평가는 형성 평가 맥락(formative context)에서 수행되었으며, 이는 총괄 평가 환경(summative setting)과 비교할 때 참가자들의 다른 행동이나 반응을 유도했을 수 있습니다. 결과적으로 우리의 연구 결과가 일상적인 총괄 평가 환경에서도 여전히 유효한지 확인하는 것이 유용할 것입니다.
  • 우리의 연구 결과는 우리가 사용한 스테이션의 표본(sample of stations)에 의해 제한됩니다. 이들이 대표적인 과제 범위(representative range of tasks)를 포괄하긴 했지만, 동일한 원칙에 따라 설계된 추가적인 스테이션 표본은 잠재적으로 다른 결과를 도출할 수도 있습니다. 학생들은 학업 중 이전 시기에 모의 환자(simulated patients)가 다른 역할을 맡았을 때 본 연구의 모의 환자들을 만났을 가능성이 있습니다. 우리는 이에 대한 데이터를 수집하지 않았으므로, 이것이 진정성(authenticity)에 어느 정도 영향을 미쳤는지에 대해서는 언급할 수 없습니다. 이는 향후 연구에서 탐구할 가치가 있을 것입니다.

향후 연구 (Future research) 

향후 연구는 이러한 원칙들이 총괄 평가(summative assessments) 및 졸업 후 평가(postgraduate assessments)를 포함한 다른 맥락(contexts) 전반에 걸쳐, 그리고 광범위한 다른 OSCE 스테이션 형식에 적용되었을 때 어떻게 작동하는지 조사해야 합니다. 추가 연구는 해당 원칙들이 다른 결과를 달성할 수 있는 추가적인 맥락을 모색하거나, 동일한 과제에 대한 합리적으로 다른 접근법(legitimately different approaches), 스테이션 지시(station instruction)의 다른 형식, 또는 스테이션 설계 시 일치하지 않는 요소(incongruous elements)를 피하는 방법과 같이 남아있는 몇 가지 과제에 대한 추가적인 통찰력을 제공해야 합니다. 이론적 연구(Theoretical work)는 응시자, 평가자, 모의 환자가 총괄 평가(summative assessment) 내에서 허구적 계약(fiction contract)에 어떻게 참여하는지, 그리고 이것이 평가 타당도(assessment validity) 및 개인의 결과(outcomes)에 미치는 함의를 탐구해야 합니다.

결론 (Conclusions) 

학생들이 실무에 진입할 준비도에 관한 의사 결정에 OSCE가 정보를 제공할 수 있는 타당도(validity)는 (적어도 부분적으로는) 학생들이 나아갈 실무 환경을 OSCE가 얼마나 진정성 있게 시뮬레이션(authentically simulate)하는지에 달려 있습니다. OSCE 진정성에 대한 도전과제에 대응하여, 우리는 "진정성 있는 OSCE 스테이션(authentic OSCE stations)" 내에서 사용된 설계 특징들의 결합이 어떻게 다양한 시나리오 전반에서 대다수 학생들의 평가 진정성(assessment authenticity)을 높이는 데 작용했는지 보여주었습니다. 우리가 개발한 원칙들은 좋은 평가 설계(assessment design)에 대한 공유된 이해의 한 단계 더 나아간 진전을 나타내며, 우리는 OSCE 내에서 평가 진정성을 향상시키기 위해 이 원칙들을 사용할 것을 권장합니다.

 


표 1. CMOC(맥락-기제-결과 구성)의 제목. (Table 1. Titles of CMOCs) 

CMOC 1a-c 신임 의사의 전형적인 업무 (Typical Work of new doctors, TW) 

  • a/. 시나리오가 신임 의사의 전형적인 업무에서 도출되었을 때(C), 학생들은 이를 자신의 임상 술기(clinical skills)에 대한 더 신뢰할 수 있는 평가로 경험했는데(O), 이는 실제 실무에서 일했던 경험과 일치했기 때문이다(M).
  • b/. OSCE 스테이션이 신임 의사 업무의 전형적인 시나리오를 묘사할 때(C), 이는 학생들의 사고를 그들의 실무 경험에 위치시키는 경향이 있는데(O), 학생들은 신임 의사로서 해당 시나리오에서 어떻게 행동할지 보여주기 위해 임상 현장(clinical workplaces)에서 배우고 관찰한 경험을 이끌어내야 하기 때문이다(M).
  • c/. OSCE 스테이션이 신임 의사의 전형적인 업무에서 도출된 임상 시나리오를 묘사할 때(C), 학생들은 자신을 미래의 역할에 투영하는데(O), 이는 시나리오가 주니어 의사로서 일하는 느낌을 불러일으키기 때문이다. (원문 기재 유지)

CMOC 2 전체 과제의 사용 (Use of whole tasks, WT)

  • 스테이션이 임상 과제의 파편이 아닌 전체 과제(whole-tasks)를 제시할 때(C), 이는 학생들의 실무 준비도(preparedness for practice)에 대한 더 도전적인 평가를 제공하는데(O), 학생들이 미래 역할의 요구사항과 더 밀접하게 일치하는 방식으로 정보를 수집하고 통합(integrate)하도록 요구하기 때문이다(M).

CMOC 3a&b 제한된 개입/지시 (Limited Prompting, LP) 

  • a/. 신임 의사의 전형적인 업무에 기반한 전체 과제 OSCE 스테이션이 학생에 대한 지침(C)과 평가자 개입의 양(C)을 모두 제한할 때, 학생들은 임상 술기에 대한 도전적이고 진정성 있는 테스트(authentic test)를 경험하는데(O), 그들이 스테이션에 어떤 접근법과 문제 해결 기술(problem solving skills)이 필요한지 판단하도록 강제되기 때문이다(M).
  • b/. 경험이 풍부한 학생들에게 어떤 행동을 수행해야 할지에 대한 평가자의 개입(prompting) 없이 OSCE 시나리오가 주어졌을 때(C), 그들은 시나리오를 더 잘 탐색하고 관리할 수 있는데(O), 이는 임상 경험을 통해 정보를 통합하고 자신의 행동을 지시하는 방법을 배웠기 때문이다(M).

CMOC 4 충분한 시간 (Sufficient Time, Ti) 

  • OSCE 스테이션이 요구되는 과제에 대해 학생들에게 충분한 시간(sufficient time)을 제시할 때(C), 그들은 연습된 루틴에 의존하기보다는 자신의 반응을 성찰하고 계획할 가능성이 더 높은데(O), 시간 압박으로 인해 당황하지 않기 때문이다(M).

CMOC 5 전형적인 자원의 사용 (Use of typical resources, TR) 

  • OSCE 스테이션이 학생들이 일상적인 임상 실무를 반영하는 방식으로 전형적인 자원(예: 관련 가이드라인/처방 자원)을 사용할 수 있게 할 때(C), 이는 스테이션의 진정성(authenticity)을 돕는데(O), 학생들이 실무에서 직접 하거나 다른 사람들이 하는 것을 보는 것과 공명하며(M) 기억에 대한 인위적인 의존을 줄여주기 때문이다(M).

CMOC 6 소품의 사용 (Use of Props, Pr) 

  • OSCE 스테이션이 임상 시나리오의 시뮬레이션 내에서 관련 소품(props)을 활용할 때(C), 이는 시나리오를 더 현실적으로 보이고 느껴지게 만들기 때문에(M) 학생들이 시나리오에 몰입(immersed)하는 데 도움을 준다(O).

CMOC 7 설명하기보다는 시연하기 (Demonstrate rather than describe, Dem) 

  • 환자를 관리할 때 OSCE 스테이션이 학생들에게 행동을 설명하기보다는 시연(demonstrate)하도록 요구할 때(C), 이는 임상 술기에 대한 더 진정성 있는 테스트를 만들어내는데(O), 해당 행동이 필요하다는 지식(knowledge)보다는 그 기술을 수행하는 능력을 테스트하기 때문이다(M).

CMOC 8 허구적 계약의 붕괴 (Disruption to Fiction Contract, DFC) 

  • 학생과 평가자가 실무와의 불가피한 차이에 초점을 맞출 때(C), 그들은 그 평가를 학생들의 임상 술기에 대한 인위적인 테스트(artificial test)로 경험하게 되는데(O), 이러한 초점이 허구적 계약(fiction contract)에 대한 그들의 참여를 감소시키기 때문이다(M).
  • 이 시뮬레이션 된 맥락을 어렵게 만드는 요소들의 예: 시간, 관찰, 무언가를 하고 있는 것처럼 보이기 위해 행동하는 것, 환자에게 신체적 징후(physical signs)가 없는 것, 환자가 실제로 치료를 필요로 하지 않는 것.

CMOC 9 불일치의 영향 (Impact of incongruity, Inc) 

  • 시나리오의 특정 요소가 진정성 있는 실무(authentic practice)와 일치하지 않는 시뮬레이션 된 시나리오에서 학생들에게 수행하도록 요구될 때(C), 시나리오에 대한 학생들의 몰입감(sense of immersion) 붕괴(M) 또는 혼란이나 오해를 불러일으키는 가정(M) 때문에 그들의 수행(performance)에 해로운 영향을 미칠 수 있다(O).

CMOC 10 임상 실무에서의 합리적 차이 (Legitimate differences in clinical practice, LDP) 

  • OSCE 스테이션이 임상 실무에 합리적인 변동성(legitimate variations)이 존재하는 시나리오를 묘사할 때(C), 학생과 평가자는 어떤 행동을 수행해야 하는지 확신하지 못하는데(O), 이는 임상 실무에서 허용될 수 있는 접근법과 공식 시험의 전형적인 기대 사이의 차이를 해결하는 방법을 모르기 때문이다(M).

CMOC 11a&b 학생의 불안 (Student anxiety, Ax) 

  • a/. OSCE 스테이션이 시간과 활동을 어떻게 구성할지 학생의 결정에 의존할 때, 해당 형식에 덜 능숙하거나 덜 익숙한 학생들은(C) 자신이 무엇을 해야 하는지에 대한 불확실성을 경험할 수 있는데(O), 이는 자신이 예상되는 기술을 보여주고 있다는 외부의 안심(external reassurance)을 얻는 데 지나치게 의존하기 때문이다(M).
  • b/. OSCE 스테이션의 학생들이 자신이 무엇을 해야 할지 확신하지 못할 때(C), 그들은 불안해질 수 있는데(O), 이는 자신의 점수를 낮출 수 있는 행동을 선택하는 것을 두려워하기 때문이다(M).

CMOC 12 OSCE에서의 의식화된 행동 (Ritualised behaviours in OSCEs, Rit) 

  • 평가가 수행에 대해 의식적이고 비진정성적인 기대를 강요할 때(C), 이는 학생들의 실무 기반 학습(practice-based learning)에 대한 참여를 감소시키는데(O), 실무에서 배우는 기술이 시험에서 보상받지 못한다는 것을 깨닫기 때문이다(M).

CMOC 13a&b 진정성 있는 스테이션이 학생들의 학습에 미치는 영향 (Impact of authentic stations on students’ learning, IOL) 

  • a/. 의과대학이 실제 임상 학습 기회를 밀접하게 복제하는 OSCE 스테이션을 사용하여 학생들을 평가할 때(C), 학생들은 임상적 만남(clinical encounters)을 적극적으로 모색하고 그로부터 배울 가능성이 높은데(O), 그렇게 하는 것이 그들의 평가에 도움이 될 것이라는 것을 알기 때문이다(M).
  • b. OSCE 평가의 형식이 학생들로 하여금 실무 기반 학습(practice-based learning)에 더 깊이 참여하도록 장려할 때(C), 학생들은 의사로 일하기 위한 전환을 더 잘 준비하게 될 것인데(O), 그들의 초점이 해당 역할에서 필요로 할 기술과 판단력(judgement)을 보여주는 데 맞춰져 있었기 때문이다(M).

박스 1. 실재론적 평가 용어집 (Box 1. Glossary of Realist Evaluation Terminology): 

  • 맥락 (Context): 기제의 행동을 촉발하거나 수정하는 모든 조건. 맥락은 중재가 '작동하는'(또는 현상이 발생하는) 상황의 중요한 특징(들)을 의미하며, 이는 결과를 생성하는 기제를 '촉발(trigger)'합니다.
  • 기제 (Mechanism): 결과가 야기되는 근본적인 과정. 기제는 대개 과정에 관여하는 행위자나 중재 참여자의 성향, 추론 및 행동에 대한 설명이며, 그들이 존재하는 중요한 맥락(context)에 대한 반응입니다.
  • CMOC (맥락-기제-결과 구성, Context–mechanism–outcome configuration): 특정 맥락(들), 기제(들) 및 결과(들) 사이의 관계에 대한 설명을 제공하는 도식적 또는 서술적 설명. 단일 프로그램 이론(programme theory) 내에 여러 CMOC가 존재할 수 있습니다.
  • 프로그램 이론 (Programme theory): 중재가 무엇으로 구성되어 있고 어떻게 작동할 것으로 기대되는지, 또는 관심 있는 결과가 어떻게 나타날 것으로 생각되는지에 대한 과정(서술적 설명이나 도식으로 표현됨)을 설명하는 이론. 실재론적 프로그램 이론은 관련된 맥락(들), 기제(들) 및 결과(들) 간의 관계(CMOCs)—그리고 CMOC들 간의 관계로 표현됩니다.
  • 참고문헌은 (Duddy and Wong 2022)를 참조하십시오.

 

 
J Eval Clin Pract. 2026 Feb;32(1):e70349. doi: 10.1111/jep.70349.

Why Desirable Difficulties 'Work': A Review of the Evidence From Cognitive and Educational Psychology and Some Caveats for the Health Professions Education Field 

 

 

 

공부가 너무 힘들다고요? 뇌과학이 증명한 '바람직한 어려움'의 비밀 🧠✨

안녕하세요! 혹시 책을 여러 번 읽고 다 외웠다고 생각했는데, 막상 시험을 보거나 실무에 적용하려고 하면 머릿속이 새하얗게 변한 경험 있으신가요?

우리는 보통 '쉽게 술술 읽히면 학습이 잘 되고 있다'고 착각하기 쉽습니다. 하지만 인지 심리학(Cognitive Psychology)과 교육학 연구진들은 진짜 내 것으로 만드는 학습을 위해서는 오히려 '어려움'이 필요하다고 말합니다. 단, 무작정 괴로운 어려움이 아니라 뇌를 적극적으로 깨우는 '바람직한 어려움(Desirable Difficulties)'이어야 하죠.

오늘은 의대생 등 보건 의료 전문직 교육(Health Professions Education)을 위해 작성된 흥미로운 논문을 바탕으로, 우리의 장기 기억력과 응용력을 폭발적으로 높여주는 학습 전략을 쉽고 재미있게 풀어볼게요!


🤔 1. 쉽게 배운 지식은 쉽게 날아간다?

우리가 눈으로 텍스트를 반복해서 읽을 때, 정보 처리(Processing information)가 너무 쉽게 느껴져서 미래에도 이 내용을 잘 기억할 것이라고 착각하게 됩니다. 이를 '유창성 편향(Fluency bias)'이라고 해요.

연구진은 이 부분에 대해 아주 명확하게 짚어줍니다.

"재읽기는 더 나은 즉각적인 회상을 만들어내지만, 시험은 새로운 학습에 대한 더 나은 장기 파지와 전이를 만들어냅니다." (Re-reading does produce better immediate recall, but testing produces better long-term retention and transfer of new learning.)

즉, 진짜 지식을 오래 남기고 다양한 상황에 적용하는 학습의 전이(Transfer of learning)를 원한다면, 뇌를 조금 괴롭혀야 한다는 뜻입니다.


🚀 2. '바람직한 어려움'을 만드는 3가지 특급 전략 

그렇다면 구체적으로 어떻게 공부해야 할까요? 논문에서 제시하는 3가지 핵심 전략을 소개합니다.

 

 

  • ① 인출 연습 (Retrieval Practice) / 형성 평가 (Formative Testing) 평가를 받기 위해 시험을 치는 것이 아니라, '학습을 위해' 스스로 시험을 치는 것입니다. 방금 배운 내용을 덮고 백지에 써보거나, 플래시카드(Flashcards)를 활용해 억지로 기억을 끄집어내는(Retrieval) 훈련을 해보세요. 기억해 내려고 낑낑대는 그 순간, 지식은 뇌에 강력하게 새겨집니다.
  • ② 분산 연습 (Distributed Practice / Spaced Practice) 시험 전날 벼락치기(Cramming)를 하는 대신, 시간을 두고 간격을 벌려서 복습하는 방법입니다. 동일한 시간을 공부하더라도 하루에 몰아서 10시간을 하는 것보다, 일주일에 2시간씩 5번을 나누어 학습할 때 장기 파지(Long-term retention) 효과가 훨씬 뛰어납니다. 기억이 희미해질 때쯤 다시 끄집어내는 과정이 뇌의 기억 회로를 단단하게 만들어주거든요.
  • ③ 교차 연습 (Interleaved Practice / Mixed Practice) 비슷한 유형의 수학 문제를 10개 연달아 푸는 방식(차단된 연습, Blocked practice) 대신, 덧셈, 곱셈, 나눗셈 등 서로 다른 유형의 문제를 섞어서 푸는 방식입니다. 처음엔 헷갈리고 진도도 느리게 나가는 것 같아 답답할 수 있습니다. 하지만 이 방식은 상황에 맞춰 '어떤 해결책을 꺼내 써야 할지' 구분하는 능력을 길러주어 실전에서 엄청난 위력을 발휘합니다.

 


⚠️ 3. 잊지 말아야 할 주의 사항 (연구진의 핵심 당부!) 

이처럼 훌륭한 전략들이지만, 무조건 어렵게만 만든다고 능사는 아닙니다. 저자는 교육자들과 학습자들에게 다음과 같은 핵심적인 주의 사항(Caveats)을 강조합니다.

"교육자는 훈련을 더 힘들고 스트레스 받게 만드는 모든 관행이 필연적으로 학습에 유익하다고 가정해서는 안 됩니다." (Educators must not assume that any practice that makes training more arduous and stressful is perforce beneficial to learning.)

 

만약 기초 지식이 아예 없는 초보자에게 처음부터 너무 섞인 문제(교차 연습)를 주면 어떨까요? 오히려 인지적 과부하가 와서 학습을 포기하게 만드는 '바람직하지 않은 어려움(Undesirable difficulties)'이 될 수 있습니다. 즉, 학습자의 수준과 다루는 지식의 종류에 따라 적절한 수준의 어려움을 설계하는 것이 핵심입니다.


💡 마무리하며

공부하다가 막히고 잘 안 외워져서 스트레스받으신 적 있나요? 축하합니다! 🎉 여러분의 뇌는 지금 지식을 깊은 곳에 단단히 저장하기 위해 열심히 근육을 키우고 있는 중입니다. 오늘부터는 눈으로만 읽는 쉬운 공부 대신, 스스로 묻고, 간격을 두고, 섞어서 연습하는 '바람직한 어려움'을 학습에 적용해 보는 건 어떨까요?

 


전문성(expertise) 발달을 촉진하기 위한 효과적인 전략(effective strategies)을 찾고 사용하는 것은 모든 분야의 교육자들에게 항상 어려운 과제였습니다. 특히 보건 의료 직종(health professions)의 교육자들은 방대한 지식과 기술의 습득(acquisition), 파지(retention), 그리고 궁극적으로는 전문적인 실무에서의 적용 또는 전이(transfer)를 촉진하기 위해 고군분투합니다. 실제로, 전이(transfer)는 교육의 궁극적인 목표이자 '성배(holy grail)'이지만, 달성하기가 악명 높을 정도로 어렵다는 것이 입증되었습니다 [1]. 오래전, Salomon과 Perkins [2]는 하위 경로 전이(low-road transfer)와 상위 경로 전이(high-road transfer)를 구분했습니다.

 

  • 하위 경로 전이는 잘 확립된 루틴(routines)의 수행을 수반하며 광범위한 연습(extensive practice)을 통해 달성됩니다. 반면,
  • 상위 경로 전이는 상황이나 문제의 원리(principles), 개념적 요소(conceptual elements) 또는 심층 구조(deep structure)에 대한 의도적인 추상화(deliberate abstraction)를 포함합니다 [2].
  • 하위 경로 전이는 범위와 적용 가능성(applicability)이 제한적인 반면,
  • 상위 경로 전이는 사람들이 표면적으로 다양한 맥락(superficially diverse contexts)에서 원리나 문제 해결책(problem solutions)의 적용 가능성을 인식할 수 있게 해줍니다.

 

보다 최근에 LoGiudice 등 [3]은 '학습 시점에 수행되는 특정 정신적 조작(specific mental operations enacted at the time of learning)'(p. 58)이 학습의 '깊이(depth)'와 학습의 전이(transfer of learning) 가능성을 결정한다고 언급했습니다. 교육 심리학(educational psychology) 및 인지 심리학(cognitive psychology)의 증거에 따르면, 바람직한 어려움(desirable difficulties)은 지식과 기술의 파지(retention) 및 전이(transfer)를 뒷받침하는, 학습 중 수행되는 정신적 조작(mental operations)을 효과적으로 이끌어냅니다. 바람직한 어려움(desirable difficulties) [4]이라는 용어는 실행되는 동안에는 노력이 필요하거나 힘들어 보이고 실제로 즉각적인 수행(immediate performance)을 손상시키지만, 덜 힘들어 보이는 전략에 비해 우수한 장기 파지(long-term retention) 및 전이(transfer)를 이끌어내는 교육(educational) 또는 훈련 전략(training strategies)을 의미합니다. 예를 들어,

 

  • 학생들은 일반적으로 정보의 인출(retrieve information)을 시도하는 것보다 텍스트 구절을 다시 읽는 것(re-reading)이 더 쉽기 때문에 그 내용에 대해 시험을 치르는 것보다 다시 읽는 것을 선호합니다 [5, 6]. 정보 처리(processing information)가 쉬울 때, 학습자는 유창성 편향(fluency bias)의 희생양이 될 수 있습니다. 즉, 그들은 쉽게 처리된 정보가 미래에도 쉽게 회상될 것(recalled)이라고 잘못 믿습니다 [7]. 다시 읽기(re-reading)는 더 나은 즉각적인 회상(immediate recall)을 만들어내지만, 시험(testing)은 새로운 학습에 대한 더 나은 장기 파지(long-term retention)와 전이(transfer)를 만들어냅니다.
  • 바람직한 어려움(desirable difficulties)으로 알려진 관행 중에는 형성 평가(formative testing), 간격 연습(spaced practice) 또는 분산 연습(distributed practice), 혼합 연습(mixed practice) 또는 교차 연습(interleaved practice), 그리고 생산적 실패(productive failure) 접근법이 있습니다.
    • 연습 시험(practice testing) 또는 인출 연습(retrieval practice)이라고도 알려진 형성 평가(formative testing)는 특정 영역에서 학습자의 지식을 측정(measure)하기 위한 총괄 평가(summative testing)와 대조적으로 학습 및 학습의 전이(transfer of learning)를 향상시키기 위한 것입니다.
    • 간격 연습(spaced practice) 또는 분산 연습(distributed practice)에서는 집중 연습(massed practice)이나 '벼락치기(cramming)'와 대조적으로, 연습 세션(practice sessions)이나 학습 이벤트(learning events)가 시간적으로 압축되는 대신 시간에 따라 분산(spread out over time)됩니다.
    • 혼합 연습(mixed practice) 또는 교차 연습(interleaved practice)에서는 문제 유형(problem types), 범주(categories) 또는 과제(tasks)의 제시나 연습이 번갈아 가며(alternated) 이루어집니다. 예를 들어, 기초 산수(elementary arithmetic)에서의 교차 연습 일정(interleaved practice schedule)은 동일한 문제 유형을 차단된 방식(blocked fashion)으로 묶어서 제시하는 것(AAAMMMDDD) 대신에, 학습자에게 덧셈 문제에 이어 곱셈 문제, 그 다음 나눗셈 문제(AMDAMD)를 제시할 수 있습니다.

 

이러한 관행은 어떻게, 그리고 왜 효과적일까요? Bjork, Bjork [8]는 바람직한 어려움(desirable difficulties)에 대한 기술적 설명(descriptive account)을 제공합니다. 이 이론은 두 가지 다른 기억 구성 요소(memory components)인 저장 강도(storage strength)인출 강도(retrieval strength)를 상정합니다.

 

  • 저장 강도(storage strength)는 일반적으로 정보가 장기 기억(long-term memory)에 얼마나 강하게 확립되어 있는지를 나타내는 반면,
  • 인출 강도(retrieval strength)는 특정 시간에 기억에 얼마나 쉽게 접근할 수 있는지(accessible)를 나타냅니다.

 

저장 강도와 인출 강도는 서로에게 영향을 미칩니다.

 

  • 인출 강도(retrieval strength)가 높을 때, 저장 강도(storage strength)는 거의 증가하지 않습니다.
  • 그러나 인출 강도가 낮을 때, 즉 특정 기억 표상(memory representation)을 회상(recall)하기 어려울 때, 저장 강도(storage strength)의 증가는 그에 상응하여 더 높아집니다. 결과적으로 저장 강도(storage strength)는 인출 강도(retrieval strength)가 얼마나 빨리 회복되거나 상실되는지를 결정합니다.
  • 저장 강도가 높다면, 즉 정보의 한 조각이 수년간 살았던 주소처럼 장기 기억(long-term memory)에 잘 자리 잡고 있다면(well-entrenched), 인출 강도는 쉽게 회복됩니다(restored).
  • 반대로 한 번만 방문할 건물의 주소처럼 특정 정보의 저장 강도(storage strength)가 낮을 때, 인출 강도(retrieval strength)는 빠르게 감소하고(diminish) 쉽게 회복되지 않습니다.

Bjork [9]는 새로운 폐기 이론(new theory of disuse)이 과정 모델(process model)이 아님을 인정합니다. 즉, 그것은 메커니즘(mechanisms)에 대한 설명을 제공하지 않은 채 기억 현상(memory phenomena)을 기술합니다. 그러나 Bjork는 시간이 지남에 따라 정보를 잊어버리는 것(forgetting information)이 학습자가 자료에 다시 관여하도록(re-engage) 촉구하기 때문에 실제로는 학습에 도움이 될 수 있다고 주장합니다. 이러한 주장을 뒷받침하기 위해, 그는 Jacoby의 예시를 인용합니다.

 

 

  • 당신이 37 + 15 + 12의 합(sum)을 구하라는 요청을 받았다고 가정해 보십시오. 이 합을 얻은 후, 당신은 즉시 동일한 문제를 제시받습니다. 반복 제시(repeated presentation)에서 당신이 수행할 처리 유형(type of processing)은 크게 다를 것입니다. 첫 번째 조우(encounter)에서 당신은 합을 얻기 위해 의심할 여지 없이 덧셈 과정(process of addition)을 거쳤을 것입니다. 하지만 두 번째 조우에서는 합산 결과를 즉시 이용할 수 있으므로 숫자를 더하는 연산(operation of adding)으로 되돌아가지 않고도 답을 제시할 수 있습니다. 실제로, 약간의 지연(delay)이 없다면 처리 활동(processing activities)의 완전한 반복은 불가능하지는 않더라도 어려울 수 있습니다 [10] (p. 649).

 

검토할 증거는 학습 및 전이의 이점(learning and transfer benefits)을 가져오는 것그 자체로의 어려움(difficulty per se)이라기보다는 바람직하게 어려운 관행(desirably difficult practices)을 실행할 때 학습자가 참여하는 처리 활동(processing activities)이라는 것을 시사합니다. 실제로 학습자가 힘들고 좌절감을 느끼면서도 학습의 이점(learning benefits)을 낳지 않는 관행들이 존재합니다. 즉, 바람직하지 않은 어려움(undesirable difficulties)입니다 [11]. McDaniel과 Butler [12]는

 

  • '어려움'에 의해 유도된 처리 유형(type of processing)이
    • 결과 평가(outcome test)나 활동에서 요구되는 것과 일치(congruent)할 때,
    • 학습자가 해당 활동에 참여하는 데 필요한 지식(requisite knowledge)을 가지고 있을 때 (예: 합리적인 수준의 읽기/쓰기/산술 능력(literacy/numeracy) 보유), 그리고
    • 과제에서 요구되는 처리 유형이 자료에 의해 자발적으로 유도되는 것과 다를 때, 그 어려움은 바람직하다고 제안합니다.
  • 후자 기준의 한 예는 범주(category)별로 구성된 단어 목록에서 각 단어의 유쾌함(pleasantness)을 평가(rate)하라는 지시일 것입니다.
    • 범주적 구성(categorical organisation)은 단어의 그룹화(grouping)나 군집화(clustering)를 자발적으로 유도하는 반면,
    • 유쾌함 평가(pleasantness ratings)는 개별 단어에 대한 특이한 평가(idiosyncratic evaluation)를 요구합니다.

 

 

1 형성 평가 또는 시험 강화 학습 (1 Formative Testing or Test-Enhanced Learning) 

개인의 지식과 기술 수준을 평가하기 위한 시험인 총괄 평가(summative testing)는 학업 성취(academic progression) 및 실무 적합성(fitness-for-practice)에 대한 결정을 알리는 증거를 제공하기 때문에 오랫동안 보건 의료 전문직 교육(health professions education, HPE)에서 주요 관심사였습니다 [13-20]. 그러나 최근 몇 년 동안 인지 심리학자(cognitive psychologists)와 임상 교육자(clinician educators) 간의 협력을 바탕으로 보건 의료 전문직 교육계 내에서 형성 평가(formative testing) 또는 학습을 위한 시험(testing for learning)에 대한 관심이 커졌습니다 [21]. 형성 평가, 즉 학습을 위한 시험은 지식의 파지(knowledge retention) 및/또는 전이(transfer)를 측정하기 위해 의도되고 설계된 총괄 평가(summative testing), 즉 학습의 시험(testing of learning)과 대조적으로, 지식의 파지(retention) 및 적용(application)을 촉진하도록 의도되고 설계되었습니다. 형성 평가에 대한 관심은 시험이 학습과 학습의 전이(transfer of learning)에 신뢰할 수 있을 만큼 강력한 효과를 미친다는 인식에 의해 주도되었습니다. 연구에 따르면 이러한 효과는 다양한 내용 영역(content domains) [24, 25]과 다양한 학습자 집단(populations of learners) [26, 27]을 대상으로 실험실과 교실 환경(laboratory and classroom settings) 모두에서 뚜렷하게 나타납니다 [22, 23]. 이러한 효과를 더 조사하기 위해 Green 등 [28]은 시험의 직접적 효과(direct effect of testing)를 보고하는 보건 의료 전문직 교육(HPE) 문헌에 대한 체계적 문헌 고찰(systemic review)을 수행하여 그 결과가 인지 심리학 문헌의 결과와 일치하는지 확인했습니다. 그들은 시험이 특히 해부학(anatomy) [26], 방사선 판독(radiologic interpretation) [29], 병태생리학(pathophysiology) [30-33], 심폐소생술(resuscitation) [34]의 학부 교육(undergraduate education)과 다양한 평생 교육(continuing education) 주제 [35]에서 파지(retention)와 전이(transfer)에 상당한 영향을 미친다는 것을 발견했습니다.

1.1 시험 효과 (1.1 Test Effects) 

시험에는 직접적 효과간접적 효과가 모두 있습니다.

 

  • 시험의 직접적 효과(direct effect) 또는 후방 효과(backward effect)는 무언가를 기억하려고 시도하는 것 자체가, 비록 인출 시도(retrieval attempt)가 실패하더라도, 미래에 그 정보를 회상(recall)할 가능성을 높인다는 발견입니다.
  • 시험은 또한 간접적 효과(indirect effects) 또는 전방 효과(forward effects)를 가질 수 있습니다. 즉, 시험은 후속 학습(subsequent learning)을 향상시키는 인지적(cognitive), 메타인지적(metacognitive), 정의적(affective) 및 동기 부여적 과정(motivational processes)을 유도할 수 있습니다.

 

1.1.1 시험의 직접적 효과 (1.1.1 The Direct Effect of Testing) 

일반적으로 시험의 직접적 효과를 조사하기 위해 설계된 실험은 즉각적 및 지연된 준거 검사(criterial tests)에서 두 집단 간의 수행(performance)을 비교합니다 [36]. 준거 검사는 교육 연구에서 교수 개입(pedagogical interventions)의 특정 결과(specific outcomes)를 평가하는 데 사용됩니다 [37]. 예를 들어, 준거 검사는 특정 개입이 사용된 후 회상(recall)을 평가하기 위해 학습자에게 정의(definitions)를 제공하도록 요구하거나, 전이(transfer)를 평가하기 위해 새로운 문제(novel problems)를 해결하도록 요구할 수 있습니다 [38]. 한 집단(시험 집단, test group)은 제시된 자료의 인출(retrieval)을 연습하는 반면, 다른 집단(재학습 집단, re-study group)은 단순히 자료를 다시 읽습니다(re-reads). 지배적인 결과는 재학습 집단이 즉각적인 회상 검사(immediate recall test)에서는 시험 집단보다 우수한 성과를 내지만, 지연된 준거 검사(delayed criterial test)에서는 시험 집단이 재학습 집단보다 우수한 성과를 낸다는 것입니다 [39]. 이 결과는 연구가 재학습(re-study)에 유리하게 편향되어 있을 때, 즉 참가자가 시험 조건(test conditions)에 비해 재학습에서 자료에 더 많이 노출되었을 때도 유지됩니다 [40].

 

Rowland [36]가 수행한 시험의 직접적 효과(direct effect of testing)에 대한 이론적 설명의 포괄적인 메타 분석(meta-analysis)은 시험 집단과 재학습 통제 집단(re-study control group) (개념도(concept mapping)와 같은 다른 통제 조건 대비) 간의 결과를 비교하고 시험과 재학습의 총 지속 시간(total duration)을 동일하게 맞춘 실험실 연구들을 검토했습니다. 결과는 새로운 폐기 이론(new theory of disuse)과 같은 인출 노력 이론(retrieval effort theories)의 예측과 일치했습니다. 이러한 이론은 초기 또는 연습 시험 단계(practice testing phase)에서 인지된 인출 노력(perceived effort of retrieval)이 증가함에 따라 시험 효과(testing effect)의 크기도 증가해야 한다고 예측합니다. 그러나 시험으로부터 이점을 얻으려면 인출(retrieval)이 성공적이어야 합니다. 그렇지 않은 경우 교정적 피드백(corrective feedback)이 필수적입니다 [41]. Kornell과 Vaughn [41]은 인지 처리(cognitive processing)의 두 단계, 즉 인출이 시도되는 처리정답(correct answer)을 처리하는 단계가 시험 강화 학습(test-potentiated learning)에 필수적이며, 더 나아가 인출 시도(retrieval attempt)가 어떤 의미에서는 마음이 정답을 처리하도록 점화(primes)한다고 제안합니다. 인출에 더 많은 노력이 필요하거나 실패할 경우, 정답이 처리될 때 더 큰 학습이 일어납니다.

 

  • 인출 난이도(Retrieval difficulty)
    • 시험을 더 까다롭게 만들고,
    • 시험 세션 내에서 다양한 종류의 문제를 혼합(mixing)하며,
    • 학습과 시험 사이의 지연(delay), 즉 파지 간격(retention interval)을 늘림으로써 촉진될 수 있습니다 [41].

1. 시험의 효과 (Rowland의 연구)

연구진이 학생들을 두 그룹으로 나누어 실험했습니다. 한 그룹은 **'그냥 배운 내용을 다시 읽기(재학습)'**만 했고, 다른 그룹은 **'시험 보기'**를 했습니다. 두 그룹이 공부한 총 시간은 똑같았지만, 결과적으로 시험을 본 그룹의 학습 효과가 훨씬 더 컸습니다.

2. 뇌를 고생시킬수록 기억에 남는다 (인출 노력 이론)

'인출(Retrieval)'이란 머릿속에 저장된 기억을 끄집어내는 과정을 말합니다. 이 이론에 따르면, 연습 시험을 볼 때 정답을 쉽게 떠올리는 것보다 "아, 뭐였지?" 하고 끙끙거리며 힘들게 떠올리려고 노력할수록 나중에 그 내용을 훨씬 더 잘 기억하게 됩니다.

3. 단, 정답을 알아야만 의미가 있다 (교정적 피드백)

시험을 보는 것만으로 무조건 좋은 것은 아닙니다. 두 가지 조건 중 하나가 충족되어야 합니다.
  • 힘들게 노력해서 결국 스스로 정답을 떠올리는 데 성공하거나,
  • 만약 틀렸거나 끝내 기억나지 않았다면 반드시 **올바른 정답을 확인(교정적 피드백)**해야 합니다.

4. 틀렸는데 왜 학습 효과가 더 클까? (Kornell & Vaughn의 제안)

우리의 뇌는 두 단계를 거칩니다. 첫째는 '기억을 떠올리려고 애쓰는 단계'이고, 둘째는 '정답을 확인하는 단계'입니다. 정답을 떠올리려고 노력하는 과정 자체가 우리 뇌를 **'정답을 스펀지처럼 흡수할 준비 상태(점화, primes)'**로 만듭니다. 그래서 끙끙대다가 틀린 후 정답을 보게 되면, 뇌가 그 정답을 훨씬 더 강렬하게 받아들이고 기억하게 됩니다.

5. 학습 효과를 극대화하는 공부법 (인출 난이도 높이기)

위의 원리를 이용해 뇌를 더 '힘들게(효과적으로)' 만들려면 다음 세 가지 방법을 쓰면 좋습니다.
  • 시험을 더 어렵게 만들기: 단순한 객관식보다 주관식으로 출제하기.
  • 다양한 문제 섞기 (Mixing): 한 과목만 주구장창 푸는 게 아니라, 여러 종류의 문제를 섞어서 뇌가 계속 다른 방식을 쓰게 만들기.
  • 시간 차이 두기 (Retention interval): 공부를 하고 직후에 바로 시험을 보는 게 아니라, 하루나 이틀 뒤에 시험을 봐서 기억이 가물가물할 때 억지로 떠올리게 만들기.

 

 

 

1.1.2 시험의 간접적 효과 (1.1.2 Indirect Effects of Testing) 

시험의 전방 효과(forward effects) 또는 간접적 효과(indirect effects)인출 시도(retrieval attempts)가 주의 할당(attentional allocation), 학습 판단(judgments of learning), 동기 부여(motivation) 및 부호화 과정(encoding processes)과 같이 후속 학습(subsequent learning)을 촉진하는 과정에 미치는 영향입니다 [42].

 

시험은 특히 긴 강의나 학습 세션 중에 간헐적으로 제공될 때 마음 방황(mind-wandering)을 줄이고 주의(attention)를 집중시키는 것으로 알려져 있습니다 [43, 44]. 시험은 또한 학습자에게 자신이 아는 것과 모르는 것에 대한 피드백을 제공하여 시간과 노력을 적절히 할당할 수 있도록 합니다 [45, 46]. 따라서 시험은 학습 판단(judgments of learning)을 조정(calibrating)하는 데 특히 중요합니다. 학습자가 주로 책을 읽는 동안 처리(processing)가 쉽고 유창하다(fluent)고 느낄 때, 그들은 미래의 회상(future recall)을 과대평가(over-estimate)하고 학습 노력을 줄일 수 있습니다. 대조적으로, 시험은 처리를 더 노력이 필요한 것으로 보이게 하여, 회상 능력(recall ability)에 대한 더 정확한 자기 평가(self-assessments)로 이끕니다. 이러한 메타인지적 인식(meta-cognitive awareness)—또는 자신의 인지 과정(cognitive processes)에 대한 인식—과 자기 조절(self-regulation)은 학습이 점차 온라인과 교실 밖으로 이동함에 따라 학습자가 개발해야 할 중요한 요소입니다 [47]. Rivers [48]는 학습자가 일반적으로 시험의 이점에 대한 인식이 부족하기 때문에, 강사는 자가 테스트(self-testing)와 관련하여 학습자의 신념과 행동에 영향을 미치는 개입(interventions)을 제공해야 한다고 제안합니다. 그러한 개입에는

 

  • 시험의 기억상 이점(memorial benefits)에 대한 직접 교수(direct instruction),
  • 학습자가 재학습에 비해 시험의 효능(efficacy)을 경험하도록 유도하는 것, 그리고
  • 잦은 부담 없는 퀴즈(low-stakes quizzes)를 제공하거나
  • 강의 또는 수업 중 질문을 한 후 모든 학습자가 인출(retrieval)을 시도할 수 있도록 3~5초간 일시 정지(pausing)하는 등
    • 인출을 촉진하는 관행에 참여하는 것이 포함됩니다.

 

학생들은 자신을 테스트하기 위해 Anki 및 First Aid와 같은 상업용 전자 플래시카드 애플리케이션(electronic flashcard applications)을 점점 더 많이 사용하고 있습니다 [49].

 

사용자는 교육적 필요를 충족하기 위해 질문 '덱(Decks)'을 다운로드하거나 만들 수 있습니다. 전공의(Medical residents)들은 당직 시간 중 휴식 시간(downtime)에 사용할 수 있기 때문에 이러한 애플리케이션을 선호한다고 보고합니다 [49]. 미국 의사 면허 시험(USMLE) 1단계를 준비하는 데 사용되는 AnKing 덱에는 40,000개 이상의 플래시카드가 있으며, 이 애플리케이션의 높은 사용 수준은 더 높은 시험 점수와 관련이 있습니다 [49]. 이러한 상용 애플리케이션과 관련하여 한 가지 주의할 점은 교육의 불평등(inequity)을 악화시킬 수 있다는 것입니다. Landoll 등 [50]은 학교가 학생들에게 무료로 제공될 수 있는 자체 복습 시험 문제 은행(bank of review test questions)을 만들고 유지함으로써 이러한 우려를 완화할 수 있다고 제안하지만, 그러한 프로젝트의 실현 가능성(feasibility)은 불확실합니다.

 

임상 분야(clinical area)에서 시험은 교수 전략(teaching strategy)으로 비교적 쉽게 사용될 수 있습니다. 회진(rounds)에서 논의된 주제에 대한 복습 질문(Review questions)은 학습자 참여(learner engagement)를 높이기 위해 청중 반응 시스템(audience-response system)을 활용하여 학습자에게 이메일로 전송되거나 사례 컨퍼런스(case conferences)에서 제시될 수 있습니다 [51].

지속적인 전문성 개발(continuing professional development)의 영역에서, 전자 형성 평가(electronic formative testing)는 매우 큰 가정의학과 의사(family physicians) 코호트에서 지식 파지(knowledge retention)와 최선의 진료 지침(best practice guidelines) 준수를 지원하는 데 사용되었으며 [52], 기술 및 지식의 쇠퇴(decay)를 완화하기 위해 다른 전문 분야에서도 사용될 수 있습니다. 새로운 자료에 대한 교육 이전에 수행되는 사전 검사(Pre-testing) 또는 시험은 새로운 학습에 고유한 이점을 갖는 것으로 나타났습니다. 사전 검사는 학습자가 새로운 내용 영역(novel content domain)의 질문에 대한 답변을 생성(generate)하려고 시도하도록 요구하기 때문에 이러한 시도는 거의 항상 실패합니다. Pan과 Sana [53]는 시험 형식(예: 단서 회상(cued recall) 대 다중 선택(multiple choice)), 정답 피드백(제공 여부), 길고 짧은 파지 간격(retention intervals), 연구 참가자(학부생 대 Amazon Mechanical Turk를 통해 모집된 참가자) 및 환경(온라인 대 실험실 환경)을 다르게 한 5개의 실험에 걸쳐 사후 검사(post-testing)에 비해 사전 검사(pre-testing)의 일관된 이점을 발견했습니다. 이 저자들은 다른 저자들 [54, 55]이 보고한 사전 검사에 비해 사후 검사를 선호하는 결과를 학습과 시험을 번갈아 하거나(alternating) 정답 피드백을 제공하는 것과 같은 교란 요인(confounds) 때문이라고 생각합니다. 사전 검사는 일반적으로 주의 집중(attentional focus)을 향상시키고 특히 시험된 자료에 주의를 집중시킴으로써 후속 학습(subsequent learning)에 도움이 되는 것으로 생각됩니다. 사전 검사는 주의를 이끄는 텍스트 구절의 섹션 제목처럼 기능하는 '조직적 신호(organisational signals)' [53] 또는 교육 이전에 적극적으로 생성된 설명과 새로운 정보의 통합(integration)을 촉진하는 '선행 조직자(advance organisers)' [56]를 제공할 수 있습니다.

 

흥미롭게도, 한 세트의 자료에 대해 학습자를 시험하는 것은 나중에 제시되는 다른 세트의 자료에 대한 학습을 강화(potentiate)하는 것으로 보입니다 [45]. 이 현상에 대한 메타 분석에서 Chan 등 [45]은 이러한 시험 강화 새로운 학습(test-potentiated new learning)에 대한 '통합(integration)' 이론을 뒷받침하는 증거를 발견했습니다. 시험은 첫 번째 자료 세트에 더 쉽게 접근할 수 있게(accessible) 만들어, 특히 두 자료 세트가 의미론적으로 관련되어 있을 때(semantically related) 은연중에 마음속에 떠오르게 하고 새로운 자료와 통합되도록 합니다. 따라서 최종 준거 검사(final criterial test)에서 원래 배운 자료는 나중에 배운 자료에 대한 기억 단서 기능(mnemonic cuing function)을 수행합니다. 이러한 시험 강화 새로운 학습의 다른 메커니즘도 아마 작동할 것입니다.

 

  • 메타인지 이론(Metacognitive theories)은 시험이 후속 학습 과제의 요구 사항에 대해 학습자에게 단서를 제공하고 그에 따라 주의 할당, 부호화, 노력과 같은 메타인지 전략(metacognitive strategies)을 변경하도록 유도할 수 있다고 제안합니다.
  • 맥락 이론(Context theories)은 학습(studying)과 시험(testing)이 서로 다른 부호화 과정을 수반하기 때문에 두 가지 다른 내부 맥락(internal contexts)을 제공한다고 상정합니다. 이는 학습자가 학습-시험 맥락(study-test context)과 연관된 자료와 학습 맥락(study context)에만 연관된 자료를 구별(differentiate)하는 데 도움을 줍니다.

 

사전 학습의 파지(retention)와 새로운 학습에 대한 시험의 효과는 모든 인지 심리학에서 가장 강력한(robust) 발견 중 하나입니다. 교사와 학생은 시험을 교수 전략(pedagogical strategy)으로 자신 있게 사용할 수 있습니다.

 

1. 나의 진짜 실력을 깨닫게 해줌 (메타인지 강화)

그냥 눈으로 책이나 자료를 읽을 때는 내용이 술술 읽히니까 "나 이거 다 안다"라고 착각하기 쉽습니다(이를 '유창성 착각'이라고 합니다). 하지만 시험을 쳐서 머리를 쥐어짜다 보면 "어, 나 이거 확실히 모르는구나" 하고 뼈맞는 깨달음을 얻게 되죠.
시험은 이렇게 내가 진짜 아는 것과 모르는 것을 정확히 구분하는 능력(메타인지)을 높여주어, 모르는 부분에만 시간과 노력을 효율적으로 투자할 수 있게 만들어 줍니다.

2. 수업 중 '딴생각' 원천 차단

길고 지루한 강의를 들을 때 뇌는 쉽게 멍해집니다. 하지만 수업 중간중간에 짧고 부담 없는 퀴즈를 보면, 뇌가 긴장 상태를 유지해서 딴생각으로 빠지는 것(마음 방황)을 확 줄여줍니다.

3. 배우기 전에 틀려보기 (사전 검사의 마법)

아직 배우지도 않은 내용을 먼저 시험(Pre-testing) 치면 당연히 틀리거나 대답하지 못하겠죠? 그런데 이 '실패하는 경험'이 엄청난 효과를 냅니다.
뇌가 미리 "아, 이 질문의 답이 대체 뭐지?" 하고 고민하게 되면, 이것이 일종의 '표지판'이나 '빈 상자(선행 조직자)' 역할을 합니다. 나중에 실제 수업을 들을 때 그 정답에 해당하는 내용이 나오면 스펀지처럼 훨씬 더 강력하게 흡수하게 됩니다.

4. A를 시험 보면 B도 잘 배우게 된다 (시험 강화 새로운 학습)

특정 주제(A)에 대해 시험을 치고 나면, 이어서 배우는 전혀 다른 새로운 주제(B)에 대한 학습 능력도 덩달아 올라갑니다. 여기에는 세 가지 이유가 있습니다.
  • 통합: A와 B가 관련 있는 내용일 경우, A 시험을 보며 떠올린 생각들이 B를 이해하는 데 강력한 힌트(단서)가 됩니다.
  • 메타인지 전략: 뇌가 눈치를 챕니다. "아, 시험이 이런 식으로 나오는구나. 다음 내용은 이렇게 집중해서 요령껏 공부해야지" 하고 스스로 공부법을 교정합니다.
  • 맥락 분리: '공부할 때'와 '시험 볼 때'의 뇌 환경이 달라서, 머릿속에서 정보들이 뒤죽박죽 섞이지 않고 방마다 깔끔하게 정리되는 효과가 있습니다.

5. 실생활 적용: 퀴즈와 플래시카드

학생들은 본능적으로 시험을 귀찮아하기 때문에, 이 엄청난 효과를 누리려면 억지로라도 환경을 만들어야 합니다.
  • 선생님이 질문을 던지고 학생들이 속으로 정답을 떠올리도록 3~5초간 침묵하며 기다려주기.
  • 성적에 안 들어가는 가벼운 미니 퀴즈 자주 보기.
  • AnkiFirst Aid 같은 '전자 플래시카드(단어장) 앱' 적극 활용하기. (실제로 암기량이 방대한 의대생들이 틈틈이 이 앱으로 스스로를 테스트해서 엄청난 효과를 보았다고 합니다.)

2 시험 강화 학습의 전이 (2 Transfer of Test-Enhanced Learning) 

한 맥락에서 학습한 지식을 새롭거나 다른 맥락에 적용하는 능력인 학습의 전이(transfer of learning)는 교육 및 훈련의 궁극적인 목표로 묘사되어 왔습니다 [57]. Pan, Rickard [58]는 192개의 보고된 효과 크기(effect sizes)에 대한 메타 분석(meta-analysis)에서 시험이 학습의 전이를 향상시킬 수 있다는 개념을 뒷받침하는 증거를 발견했습니다. 그들은 발생하는 전이의 정도에 영향을 미치는 세 가지 요인의 프레임워크를 제안합니다: 초기 검사와 최종 검사 간의 반응 일치성(response congruency), 정교화된 인출 연습(elaborated retrieval practice)의 존재, 그리고 높은 초기 검사 수행(initial test performance)입니다.

 

  • 반응 일치성이 있을 때, 비록 각 경우에 질문이 다르게 제기될 수 있지만 연습 검사(practice tests)와 준거 검사(criterial tests)는 동일한 정답을 갖습니다. 반응 일치성은 준거 검사 시점에 단서(cues)나 인출 경로(retrieval pathways)를 복원함으로써 정답의 접근성(accessibility)을 높여 전이를 촉진할 수 있습니다.
  • 정교화된 인출 연습은 인출뿐만 아니라 추가적인 인지 처리(cognitive processing)를 수반하며, 광범위한 부호화(broad encoding)와 정교화된 피드백(elaborative feedback)을 포함합니다. 광범위한 부호화 전략(Broad encoding strategies)은 추가적인 유형의 인지 처리와 함께 인출을 수반합니다. 이러한 광범위한 부호화는 교사가 내리는 특정 지시(specific instructions)에 의해 유도될 수 있습니다. '정답과 관련될 수 있는 모든 것을 생각해 보시오'는 광범위한 인출 지시(broad retrieval instruction)의 한 예입니다. 예를 들어,
    • 학생들에게 흉통(chest pain)의 원인에 대해 묻는다면 그들은 허혈(ischaemia), 염증(inflammation), 외상(trauma) 등과 같은 다양한 병인(etiologies)을 고려할 수 있습니다. '대답하기 전에 각 옵션을 신중하게 고려하시오'는 객관식 질문 시험(multiple-choice question test)의 문항에 답하기 위한 변별 지시(discrimination instructions)의 한 예입니다. '그 답이 정답이라고 생각하는 이유를 가능한 한 자세히 설명하시오'는 설명적 회상 지시(explanatory recall instruction)의 한 예입니다.
  • 단순한 회상 질문 외에 적용 질문(application questions)과 같이 다른 수준의 인지 처리를 유도하는 질문을 사용하는 것도 광범위한 부호화를 이끌어낼 수 있습니다.
    • 정교화된 피드백(Elaborative feedback)은 학습자가 시험 후 학습된 자료를 다시 검토하도록 허용하거나 답변이 왜 맞거나 틀린지에 대한 설명(explanations)을 제공하는 것을 수반할 수 있습니다.
    • 학습자가 시험 후 받은 피드백을 장기간 검토할 기회를 갖는 연장된 피드백(extended feedback)
    • 각 시험 문항의 모든 응답 옵션에 대해 설명적 피드백이 제공되는 상세한 피드백(detailed feedback)
      • ...정교화된 피드백을 제공하기 위한 다른 전략들입니다.

1. 학습의 전이 (Transfer of Learning)란?

수학 공식 하나를 배워서 전혀 다른 유형의 심화 문제나 실생활에 적용해 내는 것처럼, 한 번 배운 지식을 새로운 맥락에 써먹는 능력을 말합니다. 교육의 최종 보스이자 궁극적인 목표죠. 연구에 따르면 '단순히 다시 읽기'보다 **'시험 보기'**가 이 응용력을 훨씬 높여준다고 합니다.

2. 응용력(전이)을 폭발시키는 3가지 조건

연구자들(Pan & Rickard)은 시험이 단순 암기를 넘어 '응용력'으로 이어지려면 다음의 조건들이 필요하다고 말합니다. (문단에서는 주로 앞의 두 가지를 상세히 설명하고 있습니다.)
  • ① 반응 일치성 (질문은 달라도 정답의 뿌리는 같게)
    • 연습할 때 푼 문제와 실제 시험(준거 검사)의 문제 형태가 완전히 달라도, 결국 요구하는 핵심 지식(정답)이 같을 때 응용력이 높아집니다. 연습 과정에서 정답으로 가는 '길(인출 경로)'을 탄탄하게 닦아놓았기 때문에, 실전에서 질문이 조금 꼬여서 나와도 힌트를 찾아 정답을 쉽게 떠올리게 됩니다.
  • ② 정교화된 인출 연습 (단순 암기를 넘어 깊고 넓게 생각하기)
    • 단순히 "정답은 A" 하고 꺼내는 것을 넘어, 뇌를 더 복잡하게 쓰게 만드는 과정입니다. 여기에는 두 가지 강력한 무기가 있습니다.
      • 광범위한 부호화 (다각도로 생각하게 만들기): 선생님(또는 스스로)이 뇌를 쥐어짜도록 특별한 지시를 내리는 겁니다.
        • 예: "이 현상의 원인이 될 만한 걸 전부 다 말해봐." (의대생에게 흉통의 모든 원인을 묻는 것처럼요.)
        • 예: 객관식을 풀 때 "답만 고르지 말고, 나머지 보기가 왜 답이 아닌지 하나씩 다 따져봐."
        • 예: "이게 왜 정답인지 최대한 자세히 설명해봐."
      • 정교화된 피드백 (친절하고 끈질긴 오답 노트): 시험을 친 후 정답만 알려주고 끝내는 게 아니라, "왜 맞았고 왜 틀렸는지" 이유를 설명해 주는 겁니다. 피드백을 오랫동안 복습하게 하거나, 객관식 오답 보기 하나하나에 모두 해설을 달아주는 식입니다.
  • ③ 높은 초기 검사 수행 (기본기 탄탄)
    • 문단에 이름만 살짝 언급되었지만, 처음에 보는 연습 시험에서 어느 정도 성적이 잘 나와야(즉, 기본 지식이 머릿속에 있어야) 응용도 가능하다는 뜻입니다.

 

3 간격 연습 또는 분산 연습 (3 Spaced or Distributed Practice) 

총 연습 또는 학습 시간이 일정하게 유지되더라도, 간격 연습(spaced practice) 또는 분산 연습(distributed practice)은 학습의 파지(retention) 및 전이(transfer)에서 더 큰 이득을 가져옵니다. Versteeg 등 [59]은 간격 연습 또는 학습을 특정 시간 간격(specified intervals of time)을 두고 동일한 자료를 제시하거나 인출하거나 동일한 기술을 실행하는 것으로 정의합니다. 이는 시간적으로 압축된, '벼락치기(cramming)'로도 알려진 집중 연습(massed practice) 또는 차단된 연습(blocked practice)과 대조됩니다 [60]. 간격 효과(Spacing effects)는 환경, 학습자 집단, 교육 수준 전반에 걸쳐 강력하며 최대 d = 1.0의 효과 크기(effect sizes)를 보입니다 [60]. 게다가 간격의 효과는 개념적/사실적 학습(conceptual/factual learning)과 심운동성 학습(psychomotor learning) 모두에서 관찰됩니다 [61, 62].

 

  • Moulton 등 [61]은 외과 전공의(surgical residents)들에게 미세 혈관 문합술(micro-vascular anastomosis)을 집중 조건(massed condition, 연습이 단 하루로 압축됨) 또는 간격 조건(spaced condition, 4주 동안 매주 1회의 연습 세션 진행) 중 하나로 연습하도록 할당했습니다. 총 연습 시간은 두 집단 간에 동일했습니다. 간격 조건의 참가자들은 훈련 1개월 후 실시된 기술 평가에서 집중 조건의 참가자들보다 우수한 성과를 보였습니다. 

 

여러 이론이 분산 연습의 메커니즘을 설명하려고 시도합니다.

 

  • 학습 단계 인출 이론(Study-phase retrieval theories)은 항목을 다시 마주하는 것이 학습자로 하여금 이전의 조우를 회상(recall)하도록 촉구한다고 제안합니다. 연속적인 제시 사이의 지연 시간(lag time)이 길어질수록 이 회상은 더 어려워지며, 이는 해당 항목에 대한 기억을 강화합니다 [63, 64].
  • 부호화 다양성 이론(Encoding variability theories)은 학습자가 환경의 특징이나 내부 상태와 같이 학습이 발생하는 맥락(context)의 요소를 부호화(encode)한다고 제안합니다. 이렇게 부호화된 요소들은 이후에 기억 단서(mnemonic cues) 역할을 합니다. 부호화 사건이 시간적으로 분리될 때 맥락적 요소가 다양해질 가능성이 더 높으며, 따라서 회상을 돕기 위해 더 많고 다양한 단서를 제공합니다.
  • 결핍 처리 설명(Deficient processing accounts)은 동일한 항목을 시간적으로 가깝게 연속해서 제시하면 주의력(attention)과 결과적으로 처리(processing)가 감소한다고 제안합니다. 대조적으로 항목의 반복 제시(repeated presentation) 사이에 일정 시간이 경과하면, 해당 항목은 더 이상 작업 기억(working memory)에 없게 되고 학습자는 그것을 처리하는 데 더 많은 주의를 기울입니다 [63].

 

분산 연습의 일정(schedule)에 대해 상당한 연구 관심이 주어졌습니다.

 

  • 균일 일정(uniform schedule)에서는 자료의 재제시(re-presentations) 사이의 간격이 동일합니다.
  • 수축 일정(contracting schedule)에서는 제시 간격이 점진적으로 짧아지는 반면,
  • 확장 일정(expanding schedule)에서는 제시 간격이 점진적으로 길어집니다.
  • Toppino와 동료들 [63]은
    • 초기 훈련 수준이 낮을 때(참가자가 자료를 두 번 재학습함) 확장 일정(expanding schedule)이 장기 파지(long-term retention)에 이점을 주지만,
    • 초기 훈련 수준이 높을 때(참가자가 자료를 한 번 학습한 후 교정적 피드백과 함께 다섯 번 시험을 치름)는 그렇지 않다는 것을 발견했습니다.

 

분산 연습은 시험(testing) 및 혼합 연습(mixed practice)과 같은 다른 전략과 결합될 때 특히 효과적일 수 있습니다. 메타 분석에서 Latimier 등 [65]은 혼합 인출 연습(mixed retrieval practice)에 비해 간격 인출 연습(spaced retrieval practice)의 큰 이점을 발견했습니다 (g = 1.01, (95% CI [0.68, 1.34], p < 0.0001)). 이 연구자들은 또한 중요한 것은 시험의 일정(예: 균일 대비 확장)이 아니라 시험의 횟수(number of tests)라고 보고하며, 간격 재학습(spaced re-study)보다 간격 시험(spaced testing)에서 다른 인지 과정이 작동할 수 있음을 시사했습니다.

 

적응형 평가(Adaptive testing)는 학습과 전이를 향상시키기 위해 시험과 분산 연습을 결합한 비교적 최근의 혁신입니다. 이러한 시스템은 응답 시간(response time) 및 정확도(accuracy)와 같은 지표(metrics)를 평가하기 위해 알고리즘(algorithms)을 사용합니다. 그런 다음 이러한 지표를 사용하여 사용자에게 질문이나 과제의 순서(sequence), 간격(spacing) 및 난이도(difficulty)를 조정합니다.

 

  • Anki, Quizlet, Brainscape 및 RemNote 애플리케이션은 모두 이러한 알고리즘을 사용하여 선언적 지식(declarative knowledge)을 테스트합니다 [66].
  • 적응형 평가 알고리즘을 사용하는 전문 분야별 애플리케이션(Specialty-specific applications)이 개발되어 널리 사용되고 있습니다. 그러한 애플리케이션 중 하나가 이비인후과(otolaryngology)에 대한 방대한 문제 은행을 제공하는 OtoRecall입니다 [67].
  • 적응형 평가는 또한 지금까지 경식도 심초음파(transesophageal echocardiography) 및 심전도 판독(electrocardiogram interpretation)을 가르치는 데 효과적으로 사용되었으며 다른 많은 절차적 기술(procedural skills)을 가르치는 데에도 유망합니다 [68].
  • 간격 연습 제공의 실현 가능성(feasibility)에 대한 교육자들의 우려는 학습이 분산될 때 기술 및 지식 습득(skill and knowledge acquisition)에 실제로 더 적은 시간이 필요하다는 증거에 의해 완화될 수 있습니다 [69].
이번 문단도 이전 내용들과 자연스럽게 이어지는 아주 중요한 학습 이론입니다. 앞서 "어떻게(시험을 통해)" 공부해야 하는지를 다뤘다면, 이번에는 "언제(시간 간격을 두고)" 공부해야 하는지를 설명하고 있습니다.
이 문단의 핵심을 한 줄로 요약하면 **"총 공부 시간이 똑같다면, 하루에 몰아서 벼락치기하는 것보다 며칠에 걸쳐 쪼개서 복습하는 것이 기억에 훨씬 오래 남고 시간도 절약된다"**입니다.
이해하기 쉽게 5가지 핵심 포인트로 풀어서 설명해 드릴게요.

1. 벼락치기(집중 연습) VS 쪼개서 공부하기(간격 연습)

시험 전날 밤을 새워 10시간을 공부하는 것(집중 연습)보다, 매일 2시간씩 5일에 걸쳐 공부하는 것(간격 연습)이 훨씬 효과적입니다. 놀라운 점은 이것이 단순한 암기뿐만 아니라 **'몸으로 익히는 기술'**에도 똑같이 적용된다는 것입니다. 연구진이 외과 의사들에게 미세 혈관 수술 기술을 가르칠 때, 하루 만에 몰아서 연습시킨 그룹보다 4주에 걸쳐 일주일에 한 번씩 연습시킨 그룹이 나중에 수술을 훨씬 더 잘했습니다.

2. 왜 간격을 두는 게 더 효과적일까? (3가지 과학적 이유)

학자들은 벼락치기보다 간격 연습이 통하는 이유를 다음 3가지로 설명합니다.
  • ① 잊을 만할 때 뇌를 괴롭히기 (학습 단계 인출 이론): 공부하고 시간이 조금 지나면 배운 내용을 살짝 까먹게 됩니다. 이때 다시 복습을 하면, 희미해진 기억을 끄집어내느라 뇌가 더 고생하게 되고, 이 과정이 기억을 엄청나게 단단하게 만듭니다.
  • ② 기억의 단서 늘리기 (부호화 다양성 이론): 오늘 낮에 카페에서 공부하고, 내일 저녁에 내 방에서 복습하면 뇌는 '다양한 시간과 장소의 느낌'을 정보와 함께 저장합니다. 나중에 기억을 떠올릴 때 연결 고리(힌트)가 많아져서 훨씬 쉽게 떠오릅니다.
  • ③ 뇌의 '지루함' 방지 (결핍 처리 설명): 똑같은 내용을 연달아 계속 보면 우리 뇌는 "아, 이거 아까 본 거네" 하고 대충 처리해버립니다(주의력 감소). 하지만 며칠 쉬었다가 다시 보면 뇌가 다시 신선하게 집중하게 됩니다.

3. 복습 주기는 어떻게 짜는 게 좋을까?

복습하는 간격에 대해서도 연구를 했습니다.
  • 균일 일정: 매일 똑같이 하루 간격으로 복습
  • 수축 일정: 처음엔 5일, 그다음엔 3일, 그다음엔 1일 간격으로 점점 짧게 복습
  • 확장 일정: 처음엔 1일, 그다음엔 3일, 그다음엔 7일 간격으로 점점 길게 복습
연구 결과, 처음에 내용을 잘 모를 때는 **점점 간격을 늘려가는 '확장 일정'**이 유리합니다. 하지만 어느 정도 내용을 숙지한 상태라면 주기의 모양보다는 **'얼마나 여러 번 스스로를 시험(테스트)했는가'**가 훨씬 중요합니다.

4. 기술의 발전: 적응형 평가 (알고리즘의 도움)

이러한 완벽한 복습 주기를 사람이 일일이 계산하기 힘들기 때문에 인공지능 알고리즘이 등장했습니다. Anki, Quizlet 같은 앱들이 바로 이 원리를 씁니다. 내가 어떤 플래시카드를 맞혔는지 틀렸는지, 대답하는 데 몇 초나 걸렸는지를 앱이 분석해서 "이 내용은 완벽히 아니까 한 달 뒤에 보여주고, 이 내용은 방금 틀렸으니 10분 뒤에 다시 보여줘야지" 하고 알아서 문제를 섞어줍니다. 의대생들이 이 앱으로 엄청난 양의 의학 지식을 외우고, 심지어 심전도 판독 같은 기술을 배울 때도 널리 쓰이고 있습니다.

5. "시간이 너무 오래 걸리지 않을까요?"

선생님이나 학생들은 "조금씩 쪼개서 언제 다 진도를 나가냐"라고 걱정할 수 있습니다. 하지만 연구 결과에 따르면, 간격을 두고 공부하면 뇌가 훨씬 효율적으로 정보를 흡수하기 때문에 결과적으로 해당 지식이나 기술을 완벽히 마스터하는 데 들어가는 '총 시간'은 오히려 줄어듭니다.

 

 

4 혼합 연습 또는 교차 연습 (4 Mixed or Interleaved Practice) 

교차 연습(interleaved practice) 또는 혼합 연습(mixed practice)에는 필연적으로 어느 정도의 간격 요소가 있습니다. 그러나 그 이점은 간격을 넘어섭니다. 예를 들어, 다른 범주(categories)의 예시(exemplars)를 혼합하는 것은 변별적 대조 처리(discriminative contrastive processing)를 유도합니다: 학습자는 특히 범주가 매우 유사할 때 범주를 구별(differentiate)하는 특징(features)에 주의를 기울입니다.

 

  • 자극이 나비와 새 종(species) [70], 그리고 예술가의 화풍(painting styles) [71]이었던 시각적 범주 학습(visual category learning) 연구에서 교차(interleaving)의 강력한 효과가 나타났습니다.
  • 보건 의료 전문직 교육(HPE) 맥락에서 이러한 결과는 방사선 판독(radiologic interpretation)이나 피부과(dermatology)의 피부 병변(skin lesions) 식별과 같은 시각적 진단 과제(visual diagnostic tasks)와 관련이 있을 것입니다.
  • 두 가지 실험에서 Kornell과 Bjork [71]는 참가자들에게 12명의 다른 예술가의 그림을 차단된 일정(blocked schedule) 또는 교차된 일정(interleaved schedule)으로 학습하도록 했습니다. 두 실험 모두에서 교차 조건(interleaved condition)의 참가자는 동일한 예술가의 새로운 그림을 올바르게 식별하는 데 있어 차단된 조건(blocked condition)의 참가자보다 우수한 성과를 보였습니다.
  • 수학 학습에 대한 일련의 연구에서 다른 문제 유형(problem types)을 교차하는 것이 유익한 것으로 나타났습니다 [72-74]. Rohrer 등 [73]은 학생들이 차단된 일정 또는 교차된 일정으로 네 가지 다른 유형의 문제(선형 방정식, 비례, 선형 방정식 그래프 및 기울기 문제)를 해결하는 연습을 한 후 2주 뒤에 실시된 예고 없는 시험(unannounced test)에서 교차 연습의 큰 효과(d = 1.05)를 발견했습니다.
    • 문제가 다른 유형일 때, 학습자는 먼저 문제 유형을 식별(identify)한 다음 적절한 해결책을 적용해야 합니다.
    • 문제가 모두 같은 유형일 때, 학습자는 단순히 동일한 해결책을 반복적으로 적용하기만 하면 됩니다.
    • 따라서 이 경우 교차(interleaving)는 인출 메커니즘(retrieval mechanisms)을 수반할 가능성이 높습니다.

 

초보자(Novices)는 범주화 결정(categorisation decisions)을 내릴 때 개념적 특징(conceptual features)보다는 표면적 특징(superficial features)에 의존하는 경향이 있습니다 [75]. 교차는 주어진 개념의 구조적 원리(structural principles)에 대한 인식을 촉진할 수 있는 맥락적 변동(contextual variation)을 제공합니다. Kulasegaram 등 [76]은 세 가지 생리학적 개념(physiological concepts)이 동일한 맥락 대비 여러 맥락에 적용되었을 때 학습자가 근거리 및 원거리 전이 검사(near and far transfer tests) 모두에서 우수한 수행을 보였다는 것을 발견했습니다.

 

교차 연습(Interleaved practice)은 많은 상황에서 학습에 유익하지만 모든 상황에서 유익한 것은 아닐 수 있습니다. 규칙 기반 범주(Rule-based categories)는 범주화 결정이 기반이 되는 각각의 속성(properties)이 의미론적 '레이블(label)'을 가지며 구두로 설명될 수 있는 범주입니다. 따라서 범주화 결정은 작업 기억(working memory)에 유지되는 결합된 '규칙(rules)'의 집합을 기반으로 합니다 [77]. 심전도(ECG) 리듬 판독은 규칙 기반 범주화 과제(rule-based categorisation task)의 한 예입니다. 심전도 파형(ECG waveform)의 각 구성 요소에 적용되는 기준(Criteria)이 결합되어 각 심장 리듬(cardiac rhythm)을 정의합니다. 즉, 개인은 각 구성 요소에 대해 정상과 비정상을 구별하는 값의 범위를 회상하고, 규칙을 결합한 다음, 결합된 규칙 집합에 의해 정의된 범주를 회상해야 합니다. 서로 다른 심장 리듬의 예시(exemplars)를 교차하는 것은 초보 학습자의 작업 기억 자원을 압도할 수 있습니다. 따라서 규칙 기반 범주를 학습하는 초기 단계에서는 교차 연습보다 차단된 연습(blocked practice)이 더 바람직할 수 있습니다 [78, 79]. 실제로 이것은 Monteiro 등 [80]의 정확한 발견이었습니다: 심전도 판독을 배우는 초보자에게는 차단된 연습이 교차 연습보다 우수했습니다.

 

일반적으로 증거는 혼합 연습 또는 학습의 사용을 지지하지만 학습자의 기술 수준(skill level) 및 범주 유형(category type); 즉, 규칙 기반 범주 대 시각적 지각(visual perception)에 크게 의존하는 범주와 관련하여 주의 사항(caveats)이 적용됩니다. 교육자는 문제 또는 과제의 순서(sequencing)를 결정할 때 이러한 요소들을 고려할 것을 권장합니다.

 

1. 차단된 연습(AAA) vs 교차 연습(ABC)

우리는 보통 수학을 공부할 때 '방정식' 단원을 다 끝내고(AAA), 그다음 '함수' 단원을 풀고(BBB), 그다음 '도형' 단원(CCC)을 풉니다. 이를 한 우물만 파는 **차단된 연습(Blocked practice)**이라고 합니다. 반면 교차 연습은 방정식, 함수, 도형 문제를 무작위로 섞어서(ABC, BCA, CAB) 푸는 방식입니다. 연구 결과, 이 '섞어 풀기'가 실제 시험 성적을 압도적으로 높여줍니다.

2. 미세한 차이를 캐치하는 능력 (변별적 대조 처리)

비슷해 보이는 화가의 그림들, 여러 종류의 나비, 혹은 피부과의 미세한 피부 병변이나 X-ray 사진들을 구별해야 할 때 섞어서 공부하는 것이 훨씬 유리합니다. A만 계속 볼 때는 A의 특징만 보이지만, A와 B와 C를 번갈아 가며 섞어 보면 뇌가 "아, A는 B랑 이 부분이 다르고, C랑은 저 부분이 다르구나" 하고 미세한 차이점을 본능적으로 구별(변별적 대조)하게 되기 때문입니다.

3. '뇌의 자동 주행' 방지

수학 문제집에서 '방정식' 단원만 20문제를 연달아 풀면, 나중에는 문제를 제대로 읽지도 않고 기계적으로 공식만 대입하게 됩니다. 뇌가 생각하기를 멈추는 것이죠. 하지만 문제 유형을 마구 섞어 놓으면, 문제를 맞닥뜨렸을 때 "잠깐, 이거 무슨 유형의 문제지? 어떤 공식을 써야 하지?" 하고 뇌가 매번 새롭게 판단하고 해결책을 꺼내야(인출 메커니즘) 합니다. 이것이 진짜 응용력을 길러줍니다.

4. 결정적 예외: 섞으면 독이 되는 경우 (규칙 기반 과제)

이 문단에서 가장 중요한 반전입니다. 교차 연습이 만병통치약은 아닙니다. 초보자가 복잡한 '규칙'을 외우고 조합해야 하는 분야에서는 오히려 독이 됩니다. 대표적인 예가 심전도(ECG) 그래프 읽기입니다. 심전도를 읽으려면 파동의 높이, 넓이 등 엄격하고 복잡한 수치 규칙들을 머릿속(작업 기억)에 꽉 채워두고 하나하나 따져야 합니다. 초보자에게 이런 복잡한 심장 리듬 예시들을 막 섞어서 던져주면 뇌에 과부하가 걸려 포기하게 됩니다. 따라서 복잡한 규칙을 처음 배우는 단계에서는 한 가지를 완벽히 마스터하는 '차단된 연습'을 먼저 하는 것이 정답입니다.

5 생산적 실패 접근법 (5 Productive Failure Approaches) 

생산적 실패(productive failure, PF) 접근법에서 학습자는 교육을 받고 '정준의(canonical)', 즉 표준적이거나 널리 받아들여지는 문제 해결책(problem solution)을 제공받기 전에 새로운 문제를 해결하기 위해 데이터 세트(datasets)나 사례(cases)를 비교하여 규칙을 귀납적으로 도출(induce a rule)하도록 요구받습니다 [81]. 학습자는 종종 문제의 복잡성(complexity)과 참신함(novelty) 때문에 문제를 푸는 데 어려움을 겪습니다(struggle). 이러한 접근법은

  • '문제 해결-학습(problem-solving-instruction, PS-I)' 순서라고도 알려져 있으며,
  • 학습자가 새로운 내용에 대해 직접 교수(direct instruction)를 받은 후 관련 문제 해결을 연습하는 전통적인 '설명 및 연습(tell-and-practice)' 또는 '학습-문제 해결(instruction-problem-solving, I-PS)' 순서와 대조됩니다.

이러한 접근법을 비교한 실험의 전형적인 결과는 전통적인 I-PS 조건의 학습자가 즉각적인 습득 평가(immediate tests of acquisition)에서는 PS-I 조건의 학습자보다 우수한 성과를 내지만, 전이 평가(transfer tests)에서 새로운 지식의 적용(application of new knowledge)을 평가할 때는 PS-I 조건의 학습자가 I-PS 조건의 학습자보다 우수한 성과를 낸다는 것입니다 [81-84]. 예를 들어,

  • Steenhof 등 [85]은 참가자들에게 크레아티닌 청소율(creatinine clearance)에 영향을 미치는 변수에 대한 원시 데이터(raw data)를 사용하여 크레아티닌 청소율 공식을 고안하도록 시도하게 했습니다. 이는 그들이 '정준의(canonical)' Cockcroft-Gault 방정식에 대한 교육을 받기 전에 수행되었습니다. 실험 조건(experimental condition)의 참가자들은 방정식에 대한 새로운 지식과 추가 정보를 모두 사용하여 새로운 문제를 해결해야 하는 '미래 학습을 위한 준비도(preparation for future learning)' 평가에서, 해결책에 대해 먼저 직접 교수를 받은 참가자들보다 우수한 성과를 거두었습니다.

생산적 실패(PF) 문헌의 결과를 설명하기 위해 여러 메커니즘이 제안되었습니다.

  • 학습자가 새로운 문제에 대한 해결책을 찾으려 하거나 데이터 전반에 걸쳐 일반화(generalise)되는 규칙을 귀납적으로 도출(induce)하려고 시도할 때, 그들은 관련이 있을 수 있는 사전 지식(prior knowledge)—일반적, 경험적 지식 또는 그들이 가지고 있을 수 있는 영역 특이적 선언적 지식(domain-specific declarative knowledge)—을 활성화(activate)합니다 [86, 87]).
  • 또한, 사례를 비교하고 대조(comparing and contrasting)할 때, 그들은 무관한 맥락적 또는 표면적 특징(surface features)과 대조적으로 사례들이 공통으로 갖는 '구조적(structural)' 특징이나 여러 사례에 적용되는 개념적 원리(conceptual principle)를 알아차릴 수 있습니다 [88, 89]. 이러한 개념적 원리의 귀납적 도출(induction)은 학습자가 올바른 해결책이 다양한 맥락(diverse contexts)에 어떻게 적용될 수 있는지, 즉 원거리 전이(far transfer)를 볼 수 있게 해줍니다.
  • 문제와 씨름하면서 그들은 전반적인 지식 결핍(global knowledge deficits)을 인식하게 되며, 이는 결과적으로 호기심(curiosity)을 증가시키고 [90] 교육에 대한 주의(attention)를 예리하게 할 수 있습니다.
  • 후보 해결책(candidate solutions)을 생성하려고 시도할 때, 그들은 교육이 제시될 때 그 부호화(encoding), 파지(retention) 및 전이(transfer)를 촉진하는 여러 인출 단서(retrieval cues)를 생성할 수도 있습니다 [91]. 따라서 생산적 실패(PF) 활동은 학습자가 교육으로부터 최적의 이점을 얻을 수 있도록 준비시키는 어느 정도 일관된 문제의 정신적 표상(mental representation of a problem)을 형성하게 할 수 있습니다.

모든 바람직한 어려움(desirable difficulties) 중에서 생산적 실패(productive failure) 접근법은 교육자와 학생 모두에게 가장 큰 저항에 부딪힐 수 있으며, 특히 한편으로는 서비스 제공 및 치료의 요구와 다른 한편으로는 교육을 위한 최적의 관행 사이에 종종 갈등이 있는 임상 환경(clinical setting)에서 그러합니다 [92]. Mylopoulos 등 [92]은 인증 표준 및 절차(accreditation standards and processes)를 활용하여 '구조적, 문화적, 절차적(structural, cultural and procedural)' (p. 3) 요인이 학습자의 성장 및 발달과 상충되지 않도록 보장할 수 있다고 제안합니다. 실패와 고군분투(struggle)에 대한 보건 의료 직종의 문화적 혐오(cultural aversion)에서 벗어나기 위해 교수 개발 이니셔티브(Faculty development initiatives)가 필요할 수 있습니다.

 

1. 두 가지 공부법의 대결: 전통적 방식 vs. 생산적 실패

  • 전통적 방식 (설명 및 연습, I-PS): 선생님이 먼저 "이 공식은 이거야"라고 가르쳐 주고(Instruction), 학생이 그 공식에 숫자를 대입해 문제를 푸는(Problem-solving) 방식입니다. 우리가 아는 아주 흔한 수업 방식이죠.
  • 생산적 실패 (문제 해결-학습, PS-I): 공식이나 정답을 절대 먼저 알려주지 않습니다. 대신 복잡한 원시 데이터나 사례들을 툭 던져주고, "여기서 규칙을 스스로 찾아내서 문제를 해결해 봐"라고 요구합니다. 학생들은 배운 게 없으니 당연히 끙끙대며 좌절하고 '실패'하게 됩니다. 그제야 선생님이 진짜 정답과 공식을 가르쳐 줍니다.

2. 당장 성적은 낮아져도, '응용력'은 폭발한다

이 두 그룹을 비교해 보면 결과가 아주 재미있습니다. 수업 직후에 보는 단순한 시험에서는 '전통적 방식'으로 배운 학생들의 성적이 더 좋습니다. 하지만, 배운 것을 새로운 상황에 적용해야 하는 '전이 평가(응용 시험)'에서는 끙끙대며 실패를 맛본 '생산적 실패' 그룹이 압도적으로 높은 성과를 냅니다. 의대생들에게 크레아티닌 수치 계산법을 가르칠 때도, 공식부터 외운 학생들보다 수많은 환자 데이터를 보며 스스로 공식을 만들어보려다 실패했던 학생들이 나중에 훨씬 더 복잡한 의료 문제를 잘 해결했습니다.

3. '실패'가 뇌에 미치는 4가지 마법 (왜 효과적일까?)

정답 없이 문제를 풀려고 '삽질'하는 동안 우리 뇌에서는 엄청난 일들이 벌어집니다.
  • ① 잠자는 지식 깨우기: "아, 이거 어떻게 풀지?" 하면서 자기가 예전에 지나가듯 들었던 지식이나 경험까지 총동원하게 됩니다.
  • ② 겉모습에 속지 않고 뼈대 보기: 여러 사례를 비교하면서, 문제의 겉모습(표면적 특징)에 속지 않고 그 안에 숨겨진 진짜 원리(구조적 특징)를 간파하는 눈이 생깁니다.
  • ③ 지적 호기심과 메타인지 폭발: 끙끙대다 보면 "아, 내가 이 부분을 진짜 모르는구나" 하고 뼈저리게 느끼게 됩니다. 이때 정답을 가르쳐 주면, 호기심이 최고조에 달해 있어 스펀지처럼 쫙쫙 흡수합니다.
  • ④ 나만의 오답 노트 생성: 스스로 온갖 가설을 세워보며 실패했던 흔적들이 나중에 정답을 들었을 때 "아, 그래서 내 방법이 틀렸던 거구나!" 하는 강력한 연결 고리(인출 단서)가 되어 기억에 평생 남습니다.

4. 현실적인 장벽: "실패를 허락하지 않는 문화"

이론적으로는 이렇게 완벽한 공부법이지만, 현실(특히 의대나 임상 환경)에서는 적용하기 가장 어렵습니다. 학생들은 "그냥 빨리 정답이나 알려주지 왜 고생을 시키냐"며 불만을 가질 수 있고, 의료계 자체가 사람의 생명을 다루다 보니 '실패'라는 단어 자체에 엄청난 거부감을 가지기 때문입니다. 그래서 이 방법을 쓰려면 학교 시스템이나 교수님들의 문화적인 인식 변화가 먼저 필요하다고 지적하고 있습니다.

 

6 연구에 대한 시사점 (6 Implications for Research) 

통칭하여 '바람직한 어려움(desirable difficulties)'으로 알려진 관행들은 학습자가 노력이 필요하고 오류가 발생하기 쉬운(effortful and errorful) 것으로 경험하지만, 학습 및 학습의 전이에 강력한 이점(robust benefits)을 제공합니다. 증거에 따르면 이러한 관행이 수반하는 다양한 인지 처리(cognitive processing)어려움 그 자체(difficulty itself)보다 학습 이점에 더 많이 기여합니다. 그러나 생산적 실패(productive failure)와 비생산적 실패(unproductive failure)의 구분에서 알 수 있듯이 가장 강력한 결과에도 적용되는 경계 조건(boundary conditions)이 존재합니다. 범주 학습 패러다임(category learning paradigm)에서 범주와 그 구성원이 매우 유사할 때는 차단된 학습(blocked study)보다 교차 학습(interleaved study)이 더 유익합니다 [93, 94].

  • 교차 학습방사선 사진 판독(radiograph interpretation)과 같이 시각적 지각(visual perception)에 크게 의존하는 범주를 학습하는 데 유익합니다.
  • 차단된 학습명확하게 설명될 수 있는 규칙을 기반으로 멤버십이 결정되는 범주를 학습하는 데 일반적으로 유익합니다 [95]. 보건 의료 전문직 교육(HPE) 맥락에서 이러한 규칙 기반 범주(rule-based category)의 한 예는 동맥혈 가스 판독(arterial blood gas interpretation)일 것입니다.

규칙 기반 범주에 대한 차단된 학습의 이점에는 추가적인 조절 변수(moderators)가 있습니다: 규칙의 수와 학습자의 기술 수준(skill level)입니다. de Croock과 van Merriënboer [96]는 교차 학습이 매우 복잡하고 규칙 기반의 주제를 학습하는 과제를 맡은 초보자(novices)의 작업 기억 자원(working memory resources)을 압도한다 것을 발견했습니다. 바람직한 어려움의 경계 조건(boundary conditions)에 대한 이해를 개선하기 위해 추가 연구가 필요합니다. 우리는 이러한 관행의 다른 실제 세계 조절 변수(real-world moderators)뿐만 아니라 이를 조작화(operationalise)할 방법도 식별해야 합니다. 예를 들어, Hughes와 Thomas [97]는 자연주의적 실체(naturalistic entities)에서 유사성(similarity)을 정량화하는 방법의 필요성을 지적하는데, 그 이유는 범주 유사성(category similarity)과 학습 일정(study schedule) 간의 상호작용에 대한 많은 연구가 연구자가 원하는 유사성 정도를 달성하기 위해 조작될 수 있는 컴퓨터 생성 자극(computer-generated stimuli)을 사용하여 수행되었기 때문입니다.

 

디지털 플랫폼(digital platforms)의 광범위하고 빠른 채택은 연구를 위한 새로운 길을 열어줍니다. 이러한 플랫폼은 학습자를 참여시키고 총괄 평가 점수(summative test scores)를 향상시키는 것으로 보이지만 잠재적인 부작용(adverse effects), 비용-편익의 상충 관계(cost-benefit tradeoffs) 및 형평성(equity)에 미치는 영향에 대해서는 알려진 바가 거의 없습니다 [98].

 

학습자는 임상 전 기간(pre-clinical years)이 끝나면 더 큰 규모로 자신의 학습을 조절(regulating)할 책임이 있습니다. 학습자가 학습 및 연습 전략을 선택하는 방법과 이유, 그리고 학습 순서를 어떻게 정하는지 명확히 하기 위한 연구가 필요합니다. 그러한 통찰력은 그들이 명확하게 표현할 수 있는 전략 사용에 대한 인식(awareness)을 가진 우수한 성과를 내는 학습자(high-performing learners)들로부터 얻을 수 있을 것입니다 [50, 78].

 

사용하지 않음(disuse)으로 인해 발생하는 지식과 기술의 감소, 즉 기술 및 지식 쇠퇴(skill and knowledge decay)를 이해하기 위한 추가 연구가 필요합니다.

 

이러한 감소는 임상의들 사이에서 고위험-저빈도(high-acuity, low-frequency) 절차적 기술 [99]과 연구 펠로우십의 훈련생들 사이에서 발생할 수 있습니다 [100, 101]. 이러한 연구는 이 문제를 완화하기 위한 최적의 확장 시험 일정(optimal expanding schedules of testing)과 같은 전략을 알리기 위한 목적으로 쇠퇴에 가장 취약한 실제 지식과 기술 및 쇠퇴의 시간 경과(time course of decay)를 조사할 것입니다 [102].

1. 만병통치약은 없다: 언제 쓰고 언제 피할 것인가? (경계 조건)

앞서 배운 내용의 중요한 복습이자 주의사항입니다. '바람직한 어려움'도 상황에 맞게 써야 합니다.
  • 시각적 구별 (교차 학습 승리): X-ray 사진이나 피부병 사진을 구별하는 것처럼 '눈치'와 '감'이 필요한 과제는 여러 개를 마구 섞어서(교차해서) 훈련하는 것이 최고입니다.
  • 복잡한 규칙 (차단된 학습 승리): 동맥혈 가스 분석(ABGA)처럼 공식과 수치를 엄격하게 따져야 하는 분야는 초보자에게 섞어서 가르치면 뇌(작업 기억)에 과부하가 옵니다. 이때는 한 놈만 패는 방식(차단된 학습)이 먼저입니다. 학자들은 현실 세계에서 이 '섞는 비율'을 어떻게 조절해야 할지 더 연구해야 한다고 말합니다.

2. 디지털 학습 앱의 명암 (플랫폼의 부작용)

요즘 학생들이 Anki나 Quizlet 같은 스마트폰 단어장/복습 앱을 쓰면서 성적이 오르고 있지만, 학자들은 조심스럽게 묻습니다. "이게 무조건 좋기만 할까?" 이런 앱들이 혹시라도 모르는 부작용은 없는지, 혹은 이런 유료 앱이나 기기를 살 수 있는 학생과 없는 학생 간의 **'교육 불평등(형평성)'**을 만들지는 않는지 파악해야 한다고 지적합니다.

3. 최상위권 학생들의 영업 비밀 캐내기 (자기 주도 학습)

학교를 졸업하거나 고학년이 되면, 누가 공부 스케줄을 짜주지 않습니다. 스스로 알아서 해야 하죠. 그래서 연구자들은 공부 잘하는 학생들(우수한 성과를 내는 학습자)이 실제로 이 '바람직한 어려움' 전략들을 어떻게 선택하고 섞어서 스케줄을 짜는지 그들의 머릿속을 심층적으로 인터뷰하고 분석해서 다른 학생들에게 알려줄 필요가 있다고 강조합니다.

4. 안 쓰면 잊어버린다: '기억상실' 막기 (기술 및 지식 쇠퇴)

의사들이 매일 하는 진료는 절대 안 까먹지만, 아주 가끔 일어나는 초응급 상황(고위험-저빈도) 대처법은 시간이 지나면 까먹기 마련입니다.
이렇게 '사용하지 않아서 생기는 지식의 증발'을 막으려면, 잊어버릴 만할 때쯤 기가 막힌 타이밍에 알림을 줘서 시험을 보게 만드는 **'최적의 복습 주기(확장 시험 일정)'**를 찾아내야 한다고 마무리합니다.

 

7 교육자 및 저자를 위한 주의 사항 (7 Caveats for Educators and Authors) 

이 논문 전체에서 저는 교육자가 장기 파지(long-term retention) 및 학습의 전이(transfer of learning)에 유익한 종류의 노력적 처리(effortful processing)를 촉진하기 위해 사용할 수 있는 여러 전략을 제안했습니다. 그러나 교육자는 이러한 전략이나 기타 교육 전략의 실행에 대해 주의를 기울이는(mindful) 것이 중요합니다. 교육적 혁신과 관행이 채택될 때, 한 가지 측면이 전경화(foregrounded)되는 반면 중요한 뉘앙스(nuances)는 잊혀질 위험이 있습니다. 바람직하게 어려운 관행(desirably difficult practices)의 경우, 어려움(difficulty)이 바람직함(desirability) 또는 효과성(effectiveness)과 잘못 혼동(conflated)될 수 있습니다 [103]. 따라서 바람직하게 어려운 관행과 관련하여 강력한 주의 사항(caveat)이 제기됩니다: 교육자는 훈련을 더 힘들고 스트레스 받게 만드는 모든 관행이 필연적으로(perforce) 학습에 유익하다고 가정해서는 안 됩니다.

 

교육자와 연구자 모두 바람직하게 어려운 관행의 이론적 기반(theoretical basis)을 잘못 지정(mis-specification)하는 것을 주의해야 합니다. 바람직한 어려움 이론(Theories of desirable difficulties)은 주로

  • 개인 수준의 인지적 및 메타인지적 메커니즘(cognitive and meta-cognitive mechanisms)을 지정하며
  • 사회문화적(socio-cultural) 또는 상황 학습 메커니즘(situated learning mechanisms)을 지정하지 않습니다.
  • 따라서, 예를 들어 순환 훈련 모델(rotational training models)은 교차 연습(interleaved practice)의 예시(instantiation)로 구현되거나 평가되어서는 안 됩니다 [104, 105]. 교육자는 규칙 기반 범주를 학습하는 초보자에게 교차 연습보다 차단된 연습(blocked practice)이 선호된다는 것과 같이 바람직하게 어려운 관행의 알려진 경계 조건(boundary conditions)을 염두에 두어야 합니다.

연구와 실무를 방해할 수 있는 또 다른 문제는 용어 정의의 명확성 부족(lack of clarity)입니다. 교차 연습(interleaved practice)에 내재된 간격(spacing)의 요소가 있지만, 일부 저자는 '간격 연습(spaced practice)'과 '교차 연습'이라는 용어를 잘못 상호 교환하여(interchangeably) 사용합니다 [106]. 교차 연습(Interleaved practice)은 비교적 제한된 영역(circumscribed domain) 내에서 문제나 과제를 번갈아 수행(alternating)하여 학습자가 과제나 문제의 중요한 개념적 또는 실질적 요소를 대조(contrasting)함으로써 이점을 얻는 것을 의미합니다. 예를 들어, 다양한 유형의 봉합술(suturing) 연습을 번갈아 하는 것과 봉합술 연습과 청진(auscultation) 연습을 번갈아 하는 것을 대조해 보십시오: 전자는 교차 연습(interleaved practice)을 구성하는 반면, 후자는 단지 과제 전환(task switching)을 구성할 뿐입니다. 교차 연습과 과제 전환은 마치 그 인지적 메커니즘(cognitive mechanisms)과 결과가 상응하는(commensurate) 것처럼 구현되거나 조사되어서는 안 됩니다. 따라서 연구자와 교육자는 무엇이 바람직하게 어려운 관행(desirably difficult practices)을 구성하는지 명확히 이해하도록 촉구됩니다.

8 결론 (8 Conclusions) 

평가를 위한 시험(testing-for-assessment), 교차 및 간격 연습(interleaved and spaced practice), 생산적 실패(productive failure) 접근법과 같이 바람직한 어려움(desirable difficulties)으로 알려진 관행은 광범위한 맥락에서 장기 파지(long-term retention) 및 학습의 전이(transfer of learning)를 촉진하는 데 효과적인 것으로 나타났습니다. 교육자는 자원을 과도하게 지출(undue outlay of resources)하지 않고도 이러한 전략을 교수 관행(teaching practice)에 통합할 수 있습니다. 그러나 교육자와 연구자는 무비판적으로(uncritically) 모든 어려움을 교육적 이점과 혼동(conflate)해서는 안 되며, 더 큰(greater) 어려움이 반드시 더 큰(greater) 이점을 낳는다고 가정해서도 안 됩니다. 인지 및 교육 심리학(cognitive and educational psychology) 분야의 많은 연구가 바람직하게 어려운 관행의 사용을 지지하지만, 보건 의료 직종 교육(health professions education) 분야 내에서는 해당 주제에 대한 연구가 덜 수행되었습니다. 보건 의료 전문직 교육(HPE)의 연구자는 다른 모든 분야와 마찬가지로, 조사를 위한 정보를 제공하고 특히 보건 의료 전문직 교육 실무를 위한 권장 사항을 만들기 위해 바람직하게 어려운 관행에 대한 명확한 정의적, 이론적 이해(definitional and theoretical understanding)를 가지고 있어야 합니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Med Teach. 2025 Aug;47(8):1252-1261. doi: 10.1080/0142159X.2024.2445045. Epub 2025 Jan 10.

Moving Beyond Static, Individualistic Approaches to Agency: Theories of Agency for Medical Education Researchers: AMEE Guide No. 177 

 

 

제목: 의대생의 성공은 오로지 '개인의 노력' 탓일까요? 주체성(Agency)을 다시 생각하다 💡

 

안녕하세요! 오늘은 의학 교육 연구에서 정말 중요한 개념이지만, 우리가 흔히 오해하고 있는 '주체성(Agency)'에 대한 흥미로운 논문을 소개하려고 해요. 바로 AMEE Guide No. 177로 발표된 논문인데요. 우리가 흔히 "쟤는 참 주도적이야"라거나 "학생이 스스로 잘해야지"라고 말할 때의 그 '주체성'을 완전히 새로운 시각으로 바라보게 해주는 연구입니다.


1. 우리가 알던 '주체성', 무엇이 문제일까요?  🤔

보통 의학 교육에서 주체성(Agency)이라고 하면, '어떤 효과를 만들어내는 개인의 능력'이라고 생각하죠.

"Agency–broadly defined as the capacity to produce an effect–is a foundational aspect of medical education." (광의적으로 효과를 산출하는 능력으로 정의되는 주체성은 의학 교육의 근본적인 측면입니다.)

 

그래서 우리는 학생이 잘하면 "능력이 뛰어나다"고 하고, 못하면 "노력이 부족하다"고 생각하곤 해요. 서구적인 관점에서 개인주의적(Individualist) 시각이죠.

"Individuals are viewed as responsible for their own success and failure."
(개인은 자신의 성공과 실패에 대해 책임이 있는 것으로 간주됩니다.)

 

하지만 연구진은 묻습니다. "협력과 팀워크가 필수인 의료 현장에서, 그리고 복잡한 사회적 구조 속에서 과연 개인이 혼자 모든 걸 통제할 수 있을까요?

 

이 논문은 주체성을 단순히 개인의 고정된 특성(trait)이 아니라, 사회적이고(social), 문화적이며(cultural), 변화하는(shifting) 복잡한 경험으로 봐야 한다고 주장해요. 그리고 그 방법을 4가지 차원으로 제시합니다.


2. 주체성을 바라보는 4가지 새로운 렌즈 🔍

연구진은 주체성을 더 깊이 이해하기 위해 시간적(Temporal), 관계적(Relational), 문화적(Cultural), 구조적(Structural) 차원을 제안합니다. 하나씩 살펴볼까요?

① 시간적 차원 (The Temporal Dimension)

주체성은 고정불변이 아닙니다. 과거의 경험, 현재의 판단, 그리고 미래의 상상이 뒤섞여 매 순간 만들어지는 것이죠.

"Agency is a construction that we create as we move through the hours, days, and years of our lives."
(주체성은 우리가 삶의 시간, 날, 해를 거치며 만들어내는 구성물입니다.)

 

예를 들어, 어떤 전공의가 힘든 상황을 버티는 건 단순히 '지금' 참을성이 많아서가 아니라, 과거의 경험을 바탕으로 미래의 멋진 의사가 된 자신의 모습을 상상하고 있기 때문일 수 있습니다.

② 관계적 차원 (The Relational Dimension) 🤝

우리는 혼자서 주체적일 수 없습니다. 동료, 멘토, 환자 등 타인과의 상호작용 속에서 주체성이 공동 생성(Co-created)됩니다.

"Each individual’s agency is better conceptualized as interdependent with the agency of others."
(각 개인의 주체성은 타인의 주체성과 상호 의존적인 것으로 개념화하는 것이 더 낫습니다.)

 

혼자 끙끙대는 게 아니라, 동료에게 도움을 요청하거나 팀과 협력하여 문제를 해결하는 능력, 이것이 바로 관계적 주체성(Relational Agency)입니다.

③ 문화적 차원 (The Cultural Dimension) 🎭

우리가 속한 조직이나 집단의 문화(형상화된 세계, Figured Worlds)가 우리의 행동 가능성을 열어주기도 하고 제한하기도 합니다.

"Agency depends on one’s position within those frameworks... complete with the constraints and possibilities of that position."
(주체성의 발휘는 그러한 틀(즉, 형상화된 세계) 내에서의 개인의 위치에 달려 있으며, 그 위치의 제약과 가능성을 완비하고 있습니다.)

 

같은 의사라도 병원 문화, 학교 문화, 혹은 특정 진료과의 문화에 따라 발휘할 수 있는 주체성의 모습이 완전히 달라질 수 있다는 거죠. 때로는 문화적 규범을 이용해 즉흥적 수행(Improvisation)을 하며 새로운 변화를 만들기도 합니다.

④ 구조적 차원 (The Structural Dimension) 🏛️

이 부분이 특히 중요한데요, 인종차별, 성차별, 장애 차별 같은 거대한 권력 구조(Structures of power)가 개인의 주체성을 부당하게 제한할 수 있음을 직시해야 합니다.

"Notice how the actions of the individual and the group push against unjust structures and to how the unjust structures themselves operate and respond."
(개인과 집단의 행동이 부당한 구조에 어떻게 대항하는지, 그리고 부당한 구조 자체가 어떻게 작동하고 반응하는지를 주목해야 합니다.)

 

구조적 차원에서의 주체성은 이러한 불공정한 시스템에 맞서 저항(Resistance)하고 변화를 요구하는 힘으로 나타납니다.


3. 마치며: 우리는 여전히 선택할 수 있습니다

이 논문은 우리에게 "주체성은 복잡하다"는 것을 알려줍니다. 하지만 단순히 "환경 탓"을 하라는 게 아닙니다. 오히려 복잡한 구조와 환경 속에서도 우리가 어떻게 의미 있는 성찰과 행동을 할 수 있는지 보여줍니다.

 

연구진은 마지막으로 이렇게 강조합니다.

"We contend that our agency is underdetermined by these factors, leaving us room for meaningful reflection and action."
(우리는 우리의 주체성이 이러한 요인들에 의해 과소결정된다고 주장하며, 이는 우리에게 의미 있는 성찰과 행동의 여지를 남겨줍니다.)

 

의학 교육 연구자, 그리고 교육자 여러분! 이제 학생을 평가할 때, 단순히 "걔는 주체성이 부족해"라고 말하기보다, 그 학생의 시간, 관계, 문화, 그리고 구조적 환경이 어떻게 작용하고 있는지 한번 들여다보는 건 어떨까요?


Introduction (서론) 

넓은 의미에서 효과를 산출하는 능력(capacity)으로 정의되는 [1] 주체성(Agency)은 의학 교육의 근본적인 측면이다. 주체성(Agency)의도적으로 특정 효과(즉, 효과적인 환자 진료 제공자가 되는 것)를 산출하기 위해 학습자의 능력(capacity)(즉, 지식, 기술 및 태도)을 개발하려는 의학 교육 커리큘럼의 목표를 뒷받침한다. 이러한 지향점은 주체성에 대한 개인주의적 지향(individualist orientation), 즉 개인(individual)이 특정 효과를 산출할 능력을 보유하고 있다는 관점과 일치한다. 이러한 서구적 지향(Western orientation)에서, 각 개인은 알 수 있고 조절할 수 있는 ‘자아(self)’에 대한 인식을 가지고 있으며, ‘개인은 자신의 성공과 실패에 대해 책임이 있는 것으로 간주된다’ [2]. 우리는 이러한 지향점이 각 후보자가 자신을 최고의 지원자로 위치시킬 가장 강력한 지원 패키지를 만들기 위해 노력하는 의과대학 입학 및 전공의(residency) 선발 경쟁에 반영되어 있음을 본다. 우리는 집단적(collective) 역량이 아닌 개인적(individual) 역량(competency)에 초점을 맞추는 우리의 평가 전통에서 이를 본다. 또한 자수성가(bootstrapping)와 자조(self-help)의 태도에 대한 우리 분야의 찬탄에서도 이를 확인한다 [3]. Bleakley가 적절히 요약했듯이, 의학 교육은 ‘개인이 자신의 운명을 책임지고, 자신의 행동에 책임을 진다’는 기풍(ethos)을 지지한다(p.1182). 실제로 ‘지식과 기술은 개인의 노력을 통해 획득되며 개인의 자산(personal capital)으로 보유된다’(p.1186)는 규범은 (의과대학을 폐쇄함으로써 흑인 및 아프리카계 미국인 의사 지망생들에게 초래한 재앙적인 효과를 넘어 [4]) 의학 교육에 대한 플렉스너 보고서(Flexner report)의 지속적인 영향력을 보여주는 잔재이다.


Practice points (실천 요점)

  • 주체성(Agency)은 넓은 의미에서 효과를 산출하는 능력(capacity)으로 정의될 수 있다.
  • 의학 교육 연구에서 주체성은 전통적으로 복잡한 사회적(social) 및 구조적 현상(structural phenomenon)이라기보다는 단순한 개인적 특성(individual trait)으로 개념화되어 왔다.
  • 의학 교육 연구에 주체성을 적용하는 한 가지 방법은 이를 네 가지 차원, 즉 시간적(temporal), 관계적(relational), 문화적(cultural), 그리고 구조적(structural) 차원을 가진 것으로 보는 것이다.
    • 주체성의 시간적 차원(temporal dimension)은 개인이 현재의 문제에 대해 결정을 내리고 행동하기 위해 과거의 자원과 이해, 그리고 미래의 가설과 가능성을 어떻게 활용하는지를 강조한다.
    • 주체성의 관계적 차원(relational dimension)은 타인과의 상호작용을 통해 주체성이 어떻게 공동 생성(co-created)되는지에 중점을 둔다.
    • 주체성의 문화적 차원(cultural dimension)은 문화적 세계 내에서 개인과 집단의 위치가 행위자(agents)로서의 제약과 가능성에 어떤 영향을 미치는지에 주목한다.
    • 주체성의 구조적 차원(structural dimension)은 불공정한 구조(unjust structures)와 소외되고(marginalized) 억압받는 집단(oppressed groups)이 자신의 필요를 충족하고 변화를 만들기 위해 그러한 구조에 어떻게 작용하는지에 초점을 맞춘다.

하지만 이러한 개인주의적 지향은 의학 교육자들에게 강력한 도구들을 제공해 왔으며, 그중 다수는 Albert Bandura의 사회인지이론(social cognitive theory)에서 도출된 것이다.

 

  • Bandura는 주체성예견(forethought), 자기 반응성(self-reactiveness), 그리고 자기 성찰성(self-reflectiveness)(후자는 지속하려는 동기와 결부됨)이라는 세 가지 핵심 속성을 가진 것으로 생각한다 [5].
  • Bandura에게 있어 주체성의 발휘는 과제를 완수할 수 있는 자신의 능력에 대한 판단인 자기 효능감(self-efficacy)과도 밀접하게 관련되어 있다 [6]. 예를 들어, 다가오는 평가에 대해 미리 생각하고, 그 순간의 단서(cues)에 반응하며, 이후에 이에 대해 성찰함으로써, 의대생은 평가에서 좋은 성적을 거두고 다음을 위해 어떻게 개선할지 이해하게 되어, 평가에 대한 자기 효능감을 높일 수 있다.
  • 더욱이 Bandura는 이러한 ‘개인적(personal)’ 과정(개인 내부의 것)이 행동적(behavioral) 요인 및 환경적(environmental) 요인과 본질적으로 연결되어 있다고 보며, 사회적(social) 요소를 끌어들인다 [5]. 이러한 접근 방식은 의학 교육에서 다양한 유용한 도구들(예: 성취 동기(achievement motivation) [6, 7] 및 자기 조절(self-regulation) [8]과 관련된 도구들)을 만들어냈다.
  • 그러나 이 주체성 이론은 여전히 개인을 환경적인 것, 심지어 행동적인 것과 분리(separates)시킨다. 또한 무엇이 ‘사회적(social)’인 것으로 간주되는지에 대해 좁은 초점을 가지고 있으며, 이는 주로 의사소통과 상호작용에 국한된다 [2].
  • 따라서 이 렌즈를 통해 개발된 개입(interventions)들은 관계의 역사(relationship histories), 문화적 규범(cultural norms)과 관행(practices), 그리고 권력 구조(structures of power)를 간과하는 경향이 있으며, 대신 연구가 진행되는 좁은 학습 환경에만 초점을 맞춘다.

 

 

주체성에 대한 이러한 개인 중심적 개념화(individual-focused conceptualization)가 계속 유용하기는 하지만, 이 개념화에만 초점을 맞추는 것은 여러 이유로 의학 교육에 있어 매우 문제가 있다.

 

  • 첫째, 협업(collaboration)은 환자 진료의 핵심 구성 요소 [9]이므로, 의학 실무 및 보건 전문직 교육에 대한 ‘각자도생(every-person-for-themselves)’ 방식과는 양립할 수 없다.
  • 둘째, 점점 늘어나는 문헌들은 우리가 어떻게 소수자화되고 소외된(minoritized and marginalized) 의학 수련생들, 특히 유색인종 수련생(trainees of color) [10], 장애를 가진 수련생 [11], 그리고 퀴어(queer) 수련생 [12, 13]들에게 장벽을 만들고 있는지(즉, 본질적으로 그들의 주체성을 제한하고 있는지)를 기록하고 있다.
  • 셋째, 의학은 정책(예: CanMEDS) [14], 조직(예: 의학교육연락위원회 [LCME]), 심지어 사물(예: 임상 환경의 배치)과 같은 많은 비인간 실체(nonhuman entities)들이 환자 진료에 효과를 산출하는 복잡하고 살아있는 시스템(system)이다.
  • 의학 학습자들이 교육받고 실습하는 협력적이지만 불평등한 시스템 속에서, 개인주의적이고 ‘스스로의 힘으로 일어서는(pull-yourself-up-by-your-bootstraps)’ 방식의 주체성 개념화는 시대에 뒤떨어진 것이다. 이는 현대 의학 교육, 의료 제공(healthcare delivery), 그리고 사회 정의(social justice) 책무의 요구와 기대를 고려하지 못한다.

 

우리의 사고방식을 확장하기 위해서는 주체성에 대한 우리의 개념화와 주체성이 의학 교육 관행을 형성하는 방식에 대한 인식을 조정해야 한다. 이것은 개인의 주체성이 의학 교육에 중요하지 않거나 무관하다는 말이 아니다. 그것은 중요하며 관련성이 있다. 대신, 우리는 우리 분야의 주체성 개념화가

 

  • (a) 개인이 시간(time)에 걸쳐 자신의 주체성과 어떻게 씨름하는지;
  • (b) 주체성이 다른 개인 및 구조와 대화적으로(dialogically) 어떻게 공동 생성(co-created)되는지;
  • (c) 문화(culture)와 문화적 자원(cultural resources)이 어떻게 주체성의 가능성을 형성하는지; 그리고
  • (d) 개인의 주체성을 부당하게 축소시키는 인종차별(racism) 및 비장애인 중심주의(ableism)와 같은 억압적 구조가 어떻게 생성, 유지 및 저항받는지 또한(also) 통합해야 한다고 주장한다.

 

우리는 확장된 주체성 개념이 문헌에 완전히 부재하다고 주장하는 것은 아니다 (예를 들어, Kuper, Whitehead, and Hodges의 2013 AMEE Guide는 주체성을 명시적으로 거명하지는 않았지만 역사적, 담론(discourse), 텍스트 분석을 사용하면서 주체성(agency)에 관한 질문을 제기한다 [15]). 그러나 우리는 이러한 확장된 주체성 개념을 사용(using)하기 위한 지침을 찾을 수 없었다. 다행히도 수많은 이론적 전통(theoretical traditions)이 이 중요한 작업을 수행할 수 있는 자원을 우리에게 제공한다. 이 가이드(Guide)에서 우리는 이러한 전통들을 (개인을 넘어서는) 주체성의 네 가지 추가적인 차원(dimensions of agency)으로 추출하고, 의학 교육 학자들이 자신의 맥락에서 이를 검토하는 데 사용할 수 있는 각 차원에 대한 실용적인 도구를 제공한다.

 

 

주체성의 네 가지 차원 (Four dimensions of agency) 

사회학, 철학, 교육학, 인류학, 심리학 및 언어학의 이론적 전통(theoretical traditions)을 바탕으로, 우리는 주체성(agency)의 네 가지 개념화(conceptualizations) 또는 차원(dimensions)을 제안한다: 즉, 시간적(temporal), 관계적(relational), 문화적(cultural), 그리고 구조적(structural) 차원이다. 이러한 차원들을 기술함으로써, 우리는 의학 교육 연구자들이 주체성을 내재적이고(internal), 개인적이며(individual), 안정적이고(stable), 단일한(monolithic) 특성(trait)이나 행동으로 보는 것에서 벗어나, 이를 사회적(social)이고, 문화적(cultural)이며, 변화하고(shifting), 복잡한 일련의 실천(practices)이자 경험(experiences)으로 바라보도록 돕는 것을 목표로 한다.

 

그러나 우리는 이러한 차원들을 구성하는 데 있어 우리 자신의 주체성 발휘(exercise of agency)를 주목한다. 주체성의 개념(notions)을 조직하고 명명하는 데는 무수히 많은 다른 방법들이 존재하기 때문이다. 우리는 의학 교육 학자로서 우리에게 유용했기 때문에, 그리고 우리 분야에서 최근 출판된 일부 연구들과 일치하기 때문에 이 네 가지를 구성하였다. 더욱이 명확성(clarity)을 위해, 우리는 이 차원들을 서로로부터, 그리고 개인적 차원(individual dimension)으로부터 분리하여 설명한다; 하지만 실제(practice)에서는 이론적 뿌리와 적용 모두에서 이들은 중첩(overlap)된다. 우리는 해석과 사용의 용이함을 위해 이들을 별개의 차원으로 제시한다 (Figure 1 참조).

 

Figure 1. 주체성 이론의 개요 (An overview of theories of agency)


 

1. 상단: 정의 및 관련 개념 (Definition & Relatives) 

  • DEFINITION (정의):
    • 주체성을 "효과를 산출하는 능력(capacity)"으로 정의합니다.
    • 이 논문에서 제안하는 주체성의 4가지 차원(시간적, 관계적, 구조적, 문화적)을 나열하고 있습니다.
  • RELATIVES (관련 개념):
    • 주체성과 밀접하게 관련되거나 혼용되기 쉬운 심리학적/교육학적 개념들을 나열합니다.
    • 자율성(Autonomy), 자유 의지(Free will), 그릿(Grit), 자기 조절(Self-regulation), 자기 결정(Self determination)이 포함됩니다.
    • 가운데의 화살표는 이러한 정의와 관련 개념들이 서로 영향을 주고받거나 비교될 수 있음을 시사합니다.

2. 하단: 주체성의 네 가지 차원 (Dimensions) 

논문의 핵심인 네 가지 차원을 아이콘과 함께 설명하고 있습니다.

  • TEMPORAL (시간적 차원) - 시계 아이콘
    • 주체성은 시간이 지남에 따라 끊임없이 변화합니다.
    • 개인의 주체성은 다음 두 가지와의 관계 속에서 지속적으로 협상(negotiated)됩니다:
      1. 개인적 및 사회적 역사(histories) (과거)
      2. 우리 자신과 공동체를 위해 우리가 상상하는 미래(future).
  • RELATIONAL (관계적 차원) - 사람 아이콘
    • 주체성에서 타인(others)이 수행하는 역할을 고려합니다.
    • 개인의 주체성은 타인의 주체성과 상호 의존적(interdependent)인 것으로 개념화하는 것이 더 적절합니다.
    • 주체성은 진공 상태(vacuum)에서, 즉 홀로 동떨어져서 발휘될 수 없습니다.
  • CULTURAL (문화적 차원) - 가면 아이콘
    • 주체성은 대화적(dialogical)이며 사회적입니다.
    • 문화를 우리를 둘러싸고 있는 것이자 함께 엮어내는 것으로 주목합니다.
    • 주체성은 유동적인 기반(shifting sands) 위에 서 있습니다(즉, 문화적 맥락에 따라 정의와 양상이 변할 수 있음).
  • STRUCTURAL (구조적 차원) - 정부 청사 아이콘
    • 사람들을 부당하게 제약하는 구조(structures)와 권력(powers)에 초점을 맞춥니다.
    • 구조적 힘(예: 백인, 남성 등)으로 인해 특정 집단은 주체성에 더 많이 접근할 수 있는 반면, 다른 집단은 더 제약을 받습니다.

이 도표는 주체성을 단순히 개인의 내적 특성으로 보던 기존 관점에서 벗어나, 시간, 관계, 문화, 구조가 복합적으로 작용하는 다차원적인 현상으로 이해해야 함을 보여줍니다.

 


 

각 차원에 대해, 우리는 먼저 여러 학문 분야의 이론가(theorists)들의 연구를 바탕으로 요약하여 이를 설명한다. 다음으로, 우리는 해당 차원을 특히 잘 활용한 의학 교육 논문을 강조하며, 그 논문의 관련 연구 결과(findings) 일부를 논의한다. 마지막으로, 우리는 의학 교육 연구자들이 자신의 연구에서 주체성의 차원을 부각시키기 위해 던질 수 있는 일련의 질문들을 제공하고, 미래의 탐구(future inquiry)를 위한 잠재적 방향을 제안한다 (차원에 대한 개요는 Table 1을, 해당 차원들의 도해는 Figure 1을 참조).

 

Table 1. 주체성의 네 가지 차원 (The four dimensions of agency).

차원 (Dimension) 설명 (Description) 유용성 (Affordances) 적용 예시 (Example Application)
시간적 (Temporal) 주체성을 지속적으로 *과거(past)*의 경험을 끌어오고, *현재(present)*에 성찰적 판단(reflective judgment)을 사용하며, 가상의 미래(future) 시나리오를 실행해보는 것으로 보는 관점. • 주체성의 역동적(dynamic)이고 순간순간 변화하는(moment-by-moment) 요소를 강조함.

• 변화하는 사회적 맥락(social contexts)에 대한 개인적 이해를 도출함.
의과대학 1학년 여성들과의 인터뷰는 젠더 규범(gender norms)과 여성들이 이를 어떻게 탐색(navigation)하는지에 대한 통찰을 제공했음.

Konopasky et al. 2023
관계적 (Relational) 주체성을 ‘실천의 문제(problems of practice)를 해석하고 그 해석에 대응하기 위해 자신의 생각과 행동을 타인의 것과 일치시키는 능력(capacity)’으로 보는 관점. [1] (pp.169-170) • 주체성의 언어적 및 신체적(embodied) 공동 구성(co-construction) 모두를 드러낼 수 있음.

• 주체성의 다양한 유형(예: 공동 주체성[joint agency], 대리 주체성[proxy agency])을 지적함.
‘이단아(maverick)’ 학습자들과의 인터뷰는 그들이 자신의 학습을 진정으로 주도하기 위해 필요한 작업(work)을 강조함.

Watling et al. 2021
문화적 (Cultural) 주체성은 의미의 틀(frames of meaning)(즉, 형상화된 세계[figured worlds]) 내에서의 개인의 위치(position)에 달려 있으며, 그 틀이 가진 제약(constraints)과 가능성(possibilities)을 포함함. • 즉흥적 주체성(improvisational agency)을 강조함.

• 주체성을 제약하고 지지하는 문화적 규범(cultural norms), 관행(practices), 신념(beliefs) 등에 주목함.
고위 리더(senior leaders)들과의 인터뷰는 그들이 의학 교육 내에서 탐색하는 서로 다른 문화들을 강조함.

McOwen et al. 2024
구조적 (Structural) 주체성은 억압적 구조(oppressive structures)(예: 인종차별, 비장애인 중심주의)와 개인 또는 집단의 권력(power) 행사 사이의 변증법(dialectic)임.  억압(oppression) 속에서의 관행 및 저항(resistance) 행위를 강조함.

• 개인 및 집단의 주체성을 무엇이 *제한(bounds)*하는지 인정함; 변화를 주도할 수 있음.
불의(injustice)의 렌즈를 통한 여의대생들과의 인터뷰는 억압적 구조를 강조함.

Blalock & Leal, 2023

 

Table 2. 학자들이 의학 교육 연구에 주체성 차원을 적용하는 방법의 예 (Examples of how scholars might apply agency dimensions to medical education research).

구분 연구 목적 (Research purpose) 인터뷰 가이드 (Interview guide) 표집 (Sampling) 분석 질문 (Analytic questions)
시간적 주체성 (Temporal Agency) 특정 결정과 행동의 순간순간의 탐색(moment-by-moment navigation)을 이해하는 것이 목적일 때 사용함 (예: 도덕적 딜레마(moral dilemmas)에 대한 전공의의 경험을 탐구). 포괄적인 ‘...했을 때에 대해 말해주세요’라는 프롬프트로 시작하고, 참여자들이 왜 그리고 어떻게 그렇게 선택하고 행동했는지에 대한 탐색 질문(probes)을 통합함. 가능하다면 선택하고 행동한 최근의(recent) 생생한 경험(lived experiences)을 가진 이들을 표집함. 다음의 다양성을 표집하는 것을 고려: 개인적 배경, 취해진 행동, 미래 계획 또는 경로. • 참여자들은 어떤 이전 경험(prior experiences)을 끌어오거나 참고했는가?

• 그들은 현재 상황을 탐색하기 위해 어떤 전략을 사용했는가?

• 참여자들은 미래에 무엇이 가능하다고 믿었으며, 그러한 가능성이 그들의 행동에 어떤 영향을 미쳤는가?
관계적 주체성 (Relational Agency) 공동으로(jointly) 함께 일하기, 대리인(proxy)에게 손을 뻗기, 또는 사람과 그룹 간의 주체성 분배(distribution)와 같은 주체성의 다양한 배열을 발견하는 것이 목적일 때 사용함 (예: 전문직 간 팀(interprofessional teams)이 어떻게 기능하는지 이해하기 위해). 참여자가 조직 내 개인과 그룹에 대한 묘사(representation)를 그리는 것으로 시작하는 것을 고려하고, 다양한 상황에서 타인이 언제 어떻게 관여되는지에 대해 탐색 질문을 던짐. 기관 전반에 걸쳐 폭넓게 상호작용하는 이들을 표집함. 자주 상호작용하는 사람들의 네트워크에 대한 사례 연구(case study)를 고려함. • 동일한 조직 내의 서로 다른 쌍이나 그룹은 대화를 어떻게 다르게 구조화하는가?

• 서로 다른 쌍이나 그룹이 개발하는 공동 목표(joint goals)와 전략은 무엇인가?

• 조직 내에서 타인과 함께 일하는 데 가장 능숙하다고 여겨지는 사람은 누구이며 그 이유는 무엇인가?

• 개인들은 쌍이나 그룹의 행동과 각자의 기여를 어떻게 특성화하는가?
문화적 주체성 (Cultural Agency) 공간의 기저에 깔린 규범과 그곳의 거주자들이 이러한 규범 내에서 효과를 산출하기 위해 어떻게 즉흥적으로 수행(improvise)하는지 탐구하는 것이 목적일 때 사용함 (예: 시뮬레이션에서 학습자를 위한 명시적 및 암묵적 ‘규칙’과 그들이 이 규칙에 어떻게 반응하는지 기술). 참여자의 일상적 관행에 대해 포괄적인 질문을 던진 다음, 왜 그런 방식으로 행동하는지에 대해 탐색함. 또한 여러 개인이 포함된 시나리오를 작성하고, 각자가 무엇을 ‘해야만 하는지(should)’ 그리고 그 이유는 무엇인지 참여자에게 이야기하도록 요청할 수도 있음. 기관 내의 *역할(roles)*과 기관으로 가져온 정체성(identities) 전반에 걸쳐 표집함. 만약 여러 하위 문화(subcultures)가 있다면, 하나 이상의 하위 문화에서 상당한 시간을 보내는 이들을 표집하는 것을 고려함. • 참여자들이 자신들이 이동하고 있다고 인식하는 서로 다른 형상화된 세계(figured worlds)는 무엇이며, 그러한 세계들의 명시적이고 암묵적인 규범들은 서로 어떻게 다른가?

• 개인들은 주체성을 어떻게 정의하며, 무엇이 그것을 제약하거나 가능하게 하는가? 그리고 이러한 응답들은 어떻게 다른가?

• 참여자들이 새롭거나, 다르거나, 특이하다고 지적하는 관행은 무엇이며, 이것은 아마도 즉흥적 수행(improvisation)을 나타내는가?
구조적 주체성 (Structural Agency) 억압(oppression)과 저항(resistance)의 메커니즘을 명료화하는 것이 목적일 때 사용함 (예: 정책, 관행, 구조가 장애인 의대생들에게 어떤 부정적인 영향을 미치는지, 그리고 그들이 이에 어떻게 저항하는지 이해). 억압의 메커니즘(mechanisms of oppression)(예: 비장애인 중심주의, 인종차별, 트랜스젠더 혐오)에 대한 참여자의 경험과 그들이 이를 어떻게 탐색하는지에 대해 명시적으로 질문함. 이론이나 선행 연구가 이 맥락에서 억압을 경험했다고 가리키는 개인들을 표집함. 메커니즘에 대한 더 넓은 그림을 얻기 위해 기관의 리더십과 대화하거나 서면 정책을 검토하는 것도 고려함. • 기관, 분야, 또는 학문 내 어디에 차별적 접근(differential access)이나 대우가 존재하며, 누가 이익을 얻고 있는가?

• 이러한 구조에 의해 부당하게 제약받는 사람들은 그것을 어떻게 경험하며, 그들은 주체성과 저항을 어떻게 이해하는가?

• 이러한 구조로부터 이익을 얻는 사람들은 불의(injustice)를 어느 정도까지 인식하고 있으며, 그들은 저항에 있어서 자신의 역할을 어떻게(만약 한다면) 보고 있는가?

 

 

시간적 차원 (The temporal dimension) 

주체성의 시간적 차원(temporal dimension)은 주체성이 시간에 따라 일관되지 않음(not consistent)을 전제로 한다. 이 차원은 우리가 개인적 및 사회적 역사(histories)와의 관계 속에서, 그리고 우리 자신과 공동체를 위해 가능할 것이라고 상상하는 미래(future)와의 관계 속에서 우리의 개인적 주체성에 대한 이해를 지속적으로 협상(negotiating)하고 있음을 인식할 것을 요구한다. 주체성의 시간적 차원을 탐구하기 위해 우리는 사회학자 Emirbayer와 Mische의 연구를 인용하는데, 그들은 주체성이란 우리가 삶의 시간, 날, 해를 거치며 만들어내는 구성물(construction)이라고 주장한다 [16]. 이 구성물은 개인이 자원과 이해를 위해 지속적으로 과거(past)의 경험을 끌어오고, 순간의 우발적 사건(contingencies)을 다루기 위해 현재(present)의 성찰적 판단(reflective judgment)을 사용하며, 무엇이 가능할지 그려보기 위해 가상의 미래(future) 시나리오를 실행해보는 의도적인 작업(intentional work)의 결과이다 (p.968). 다시 말해, 주체성의 이 차원은 여전히 개인주의적 개념화(즉, 개인이 보유한 주체성에 초점을 맞춤)에 뿌리를 두고 있지만, 다음을 주장함으로써 이 개념화를 복잡하게 만든다:

 

  • (a) 주체성은 개인에 의해 창조된 구성물(construction)이며,
  • (b) 시간에 따라 유동적으로 변화(changes fluidly)하고,
  • (c) 현재의 맥락이나 문제에 대한 개인의 접근 방식을 포함하는 동시에 과거의 경험과 미래의 가능성을 능동적으로 활용한다는 것이다.

 

이 차원은 주체성의 역동적(dynamic)이고 복잡한 본질을 강조한다. 이는 개인이 과거의 자원과 이해, 그리고 현재의 문제와 결정, 그리고 미래의 가설과 가능성을 고려하기 위해 매 순간 수행하는 끊임없는 내적 이동(internal shifting)으로 우리의 주의를 환기시킨다. 주체성의 시간적 차원은 개인의 경험에 중점을 두지만, 우리의 경험이 어떻게 사회적 상황(social situations)에 내재되어(embedded) 있는지를 우리가 인정하고 주의를 기울일 것을 요구한다. 따라서 우리의 주체성 경험은 그러한 상황에 대한 우리의 지향(orientation) 및 관여(engagement)와 관련하여 끊임없이 진화한다. 이 차원 내에서 주체성을 발휘한다는 것은 전개되는 현재 상황과 과거 상황에서 얻은 이해 사이를 유연하게(lithely) 오가며, 이들 각각이 미래로 향하는 우리 이야기의 전개(evolution)에 어떤 영향을 미칠지 가설을 세우는 것이다.

 

주체성의 시간적 차원은 사람들이 의학 교육에서 겪는 경험에 대한 유용한 통찰을 제공할 수 있다. 예를 들어, 의과대학에 입학하는 여성들에 대한 연구에서, Konopasky 등은 이 여성들이 의학의 가부장적 시스템(patriarchal system)에 대한 공유된 저항(resistance)으로 특징지어지는 공동체에 어떻게 진입했는지를 탐구했다 [17].

 

  • 그들은 자신을 여성으로서, 소속되지 않은 자로서, 타자(Other)로서 인식했던 그들 자신의 개인적 역사(histories)를 끌어왔으며, 그러한 인식이 그들이 상상하는 의료 전문직에서의 미래 가능성(possibilities for the future)에 어떻게 기여했는지를 활용했다 (예: 다른 가능성을 가진 미래 – 그들이 지배적인 권력 관계(power relations)에 순응하고 의료 전문직이 크게 변하지 않은 채로 남는 미래, 또는 그들이 자신의 주체성을 활용하여 직업의 가부장적 규범을 변화시키는 미래) [17].
  • 시간이 지남에 따라, 이러한 주체성 개념화는 그들이 의과대학에서의 현재 경험(present experiences)에 대해 갖는 해석을 형성하고, 미래의 전문직 맥락에 영향을 미칠 수 있는 오늘날의 행동에 대해 내리는 전략적 결정에 정보를 제공했다. 주체성의 시간적 차원을 활용하여 도출된 이러한 통찰은 의과대학이 어떻게 사회 정의(social justice) 책무를 진전시킬 수 있는지 이해하는 데 도움을 줄 수 있다. 수련 중인 의사이자 여성으로 자기 정의(self-defined)를 내리는 이러한 수련 의사들을 지원함으로써, 우리는 사회적 변화(social change)를 촉진하기 위한 수단을 식별할 수 있다.
  • 예를 들어, 공동체를 적극적으로 만들고 지원하는 것은 해당 연구의 여성들과 같은 집단이 집단적 공동체(collective communities)의 일원으로서 자신의 주체성을 인식하고, 자신들을 기다리는 가능한 미래를 변화시키기 위해 그 주체성을 활용할 수 있게 한다. 주체성에 대한 이러한 시간적 프레임의 조사는 사회적 규범(social norms)과 의학 학습자들을 기다리는 가능한 미래를 변화시키기 위한 실질적인 가능성을 제공한다. (주체성의 시간적 차원을 사용한 다른 연구에 대해서는 Balmer 등 [18]과 Ajjawi 등 [19]을 참조하라.)

 

이러한 실질적으로 유용한 결과를 도출하기 위해, 의학 교육 연구자들은 주체성의 시간적 차원을 사용할 수 있다; 그러나 시간적 주체성을 적용하기 위해서, 학자들은 참여자들로부터 의학 교육 환경을 탐색(navigating)하는 경험, 특히 도전적이었을 수 있으며 그들의 주체성 감각의 현저성(salience)을 높이는 경험에 대한 풍부한 데이터를 수집해야 한다 [20]. 그들은 다음과 같은 질문을 탐구할 수 있을 것이다:

 

  • 참여자들은 어떤 이전 경험(prior experiences)을 끌어오거나 참고했는가?
  • 그들은 현재 상황을 헤쳐나가기 위해 어떤 전략을 사용했는가?
  • 참여자들은 미래에 무엇이 가능하다고 믿었으며, 그러한 가능성이 그들의 행동에 어떤 영향을 미쳤는가?

 

참여자들에게 삶의 특정 시기, 경험 또는 사건에 대한 이야기를 해달라고 요청하는 것은 그들이 그 순간 주체성을 발휘하면서 역사와 가능한 미래를 활용한 방식에 대한 정보를 이끌어낼 수 있다 (연구 적용에 대한 추가 지침은 Table 2 참조).

 

Table 2. 학자들이 의학 교육 연구에 주체성 차원을 적용하는 방법의 예 (Examples of how scholars might apply agency dimensions to medical education research) .

 

주체성의 시간적 차원은 개인이 현재의 관심사나 과제(project)를 진전시키기 위해 과거 및/또는 미래를 활용할 때 언제나 관련이 있다. 의학 교육에서 이것의 한 가지 잠재적 적용 분야는 임상적 의사 결정(clinical decision making)이다. 예를 들어, 미래의 연구자들은 의대생들이 현재의 임상 추론(clinical reasoning) 과제에 대한 성찰 속에 과거의 교육적 경험과 투영된 미래의 임상 경험을 엮어내는 방식을 조사할 수 있다. 학생들이 단순히 의학 지식이나 메타인지 기술(metacognitive skills)을 넘어 어떤 자원을 활용하고 있는지에 대한 이러한 확장된 이해는, 아마도 전통적인 개입(interventions)에 반응하지 않는 학생들을 지원하는 데 도움을 줄 수 있을 것이다.

 

관계적 차원 (The relational dimension) 

주체성의 시간적 차원(temporal dimension)이 시간에 따른 개인의 주체성 구성을 강조하는 반면, 관계적 차원(relational dimension)은 주체성을 고려할 때 타인이 수행하는 역할을 고려하도록 우리의 초점 범위를 넓힌다. 주체성의 관계적 차원을 연구하는 이론가들은 각 개인의 주체성이 타인의 주체성과 상호 의존적(interdependent)인 것으로 개념화하는 것이 더 낫다고 강조하며, 이는 우리가 자신의 주체성을 발휘할 때 상당한 정도로 타인의 주체성에 의존한다는 것을 시사한다 [21]. 예를 들어, 박사 학위를 소지한 연구자는 문제 공간을 이해하고, 참여자를 모집하며, 결과를 해석하기 위해 임상 동료들의 주체성에 자주 의존할 가능성이 높다. 우리의 실천 맥락을 탐색하고 그 안에서 의미 있는 기여를 하기 위해서는 Edwards가 말하는 관계적 주체성(relational agency), 즉 ‘실천의 문제를 해석하고 그 해석에 대응하기 위해 자신의 생각과 행동을 타인의 것과 일치시키는 능력(capacity)’이 필요하다 [22] (p.169–170). 주체성의 이 관계적 차원은 주체성을 사회적 관계(social relationships)의 맥락에서 프레임화한다 –

 

  • 예를 들어 전문직 간 팀(interprofessional teams)의 협업에서 볼 수 있는 고도로 상호 의존적인 경험이나, ‘독립적으로’ 개원한 의사의 덜 상호 의존적이지만 여전히 관계적인 업무와 같은 것이다.
  • 관계적 주체성은 우리가 타인의 주체성(others’ agency)과 그들이 우리의 상호작용에 가져오는 신념, 감정, 사회적 복잡성에 조율할 것을 요구한다.

 

이 차원에서 작업할 때, 주체성을 가지고 행동하는 것은 타인과 관련하여(with respect to others) 행위자가 되는 것을 포함한다; 누구도 진공 상태에서 주체성을 발휘할 수는 없다. 따라서 주체성의 관계적 차원은 주체성이 타인과의 상호작용을 통해 어떻게 생성되는지 – 더 정확히 말하면 공동 생성(co-created)되는지 – 에 집중하고 이를 도출한다. 언어적 및 신체적 대화(embodied dialogue)를 통해, 우리는 각 사람이 상황에 가져오는 필요, 욕구, 신념, 자원, 한계를 고려함으로써 타인과 상호작용한다 [21]. 때로는 이것이

 

  • 타인과 함께 주체성을 활용하는 것 (공동 주체성(joint agency))을 의미할 수도 있고 [23];
  • 때로는 우리 대신 행동을 취해 달라고 타인에게 요청하는 것 (대리 주체성(proxy agency))을 의미할 수도 있으며 [5];
  • 때로는 우리가 특정 행동을 취할 수 없음을 의미하는 것 (제한된 주체성(bounded agency))일 수도 있다 [24].

 

주체성의 관계적 차원은 의학 교육 연구에서 개인이 자신의 업무를 구성하는 관계들에 직면하여 갖는 경험을 탐구하는 데 사용되어 왔다. 예를 들어, Watling 등은 의학 교육의 문화적 기대, 위계적 구조(hierarchical structures), 그리고 사회적 규범에 직면하여 ‘이단아(maverick)’ 학습자들이 수행하는 주체성 작업(work)을 연구함으로써 학습자 중심 교육 이론의 시사점을 이해하고자 했다 [25, p.943].

 

  • 이러한 이단아들의 작업 중 일부는 관계적(relational)이었으며, 유연하지 못한 시스템을 우회하기 위해 타인과 함께 작업하는 것이었다: ‘참여자들, 특히 수련생들은 눈에 띄는 것(standing out)과 어울리는 것(fitting in) 사이의 까다로운 긴장을 항해했다’ (p.946).
  • 이는 눈에 띄기 위해 일부 관계를 거부하고, 자신이 어디에 어떻게 어울리는지 이해하기 위해 다른 관계, 특히 멘토와의 관계를 활용하는 것을 의미했다: ‘멘토들은… 이례적인 길을 비춰주기도 하고 그 길을 택하는 데 필요한 지지를 제공하기도 한다’ (p.946).

 

이 연구는 우리의 학습 이론에 존재하는 모순을 강조한다. 즉, 학습자 중심성(learner-centeredness)은 학습자가 상당한 개인적 주체성(individual agency)을 행사한다는 것을 암시할지 모르지만, 그들의 경험은 이것이 보이는 것만큼 간단하지 않음을 강조한다. 실제로, 이 연구는 관계들이 그들의 주체성을 구속하기 때문에 학습자가 주체적이 되기 위해 얼마나 많은 작업이 필요한지, 그리고 관계적 주체성에 접근하는 능력이 얼마나 가변적인지에 우리의 주의를 환기시킨다. 만약 의학 교육 공동체가 진정으로 학습자 중심 교육을 수용하고자 한다면, 관계적 주체성 차원을 채택한 이 연구는 그 이상이 실현될 수 있는지, 실현될 수 있다면 어떻게 가능한지 이해하기 위해 해야 할 일이 많음을 경고한다. (주체성의 관계적 차원을 사용한 의학 교육의 추가 연구에 대해서는 Paes 등 [26]을 참조하라).

 

주체성의 관계적 차원이 학습자와 교수진의 경험을 어떻게 형성하는지 이해하기 위해, 의학 교육 학자들은 그러한 경험을 가진 사람들과 인터뷰를 수행하거나, 상호작용(특히 결정이나 행동 계획이 형성되는 상호작용)이 실현되는 데이터를 수집할 수 있다. 인터뷰 및/또는 관찰을 통해 연구자들은 다음과 같이 질문할 수 있다:

 

  • 동일한 조직 내의 서로 다른 쌍이나 그룹은 대화를 어떻게 다르게 구조화하는가(예: 발언 기회의 분배, 지시적 대 질문적, 느리고 차분함 대 빠르고 들뜸)?
  • 서로 다른 쌍이나 그룹이 개발하는 공동 목표(joint goals)와 전략은 무엇인가?
  • 조직 내에서 타인과 함께 일하는 데 가장 능숙하다고 여겨지는 사람은 누구이며 그 이유는 무엇인가?
  • 개인들은 쌍이나 그룹의 행동과 각자의 기여를 어떻게 특성화하는가? (연구 적용에 대한 추가 지침은 Table 2 참조).

 

의학 교육은 거의 항상 다른 사람들 – 학습자, 교사, 평가자, 멘토, 환자와 그 가족, 다른 보건 전문가 등 – 을 포함하므로, 주체성의 관계적 차원은 항상 작용하고 있다. 우리의 학문 활동에 주체성의 이 차원을 사용하는 것은 대학교에서 의과대학으로, 의과대학에서 전공의(residency)로, 수련생에서 스태프 직위로, 또는 임상의에서 교육자로의 이행(transitions)을 조사할 때 특히 유익할 수 있다. 예를 들어, 학자들은 이행기에 있는 사람들이 새로운 맥락에서 번성하기 위한 기술, 지식, 관계를 얻으려고 노력함에 따라 개인적(individual), 공동적(joint), 그리고 대리적(proxy) 주체성 사이를 어떻게 오가는지 탐구할 수 있다. 이러한 개인들이 어떤 유형의 주체성을 효과적이라고 생각하는지 아는 것은 그들이 그것을 발휘할 기회를 강화함으로써 이행을 용이하게 하는 데 도움이 될 수 있다.

문화적 차원 (The cultural dimension) 

주체성의 문화적 차원(cultural dimension)은 관계적 차원과 마찬가지로 사회적인 것(the social)에 의존하지만, 대화적인 것을 넘어 더 넓은 맥락과 과정으로 나아간다. 이는 우리가 자라나는 문화적 ‘토양(soil)’과 우리의 뿌리, 영양분, 그리고 그 토양 사이의 끊임없이 발전하는 상호작용을 포함하여, ‘둘러싸고 있는 것인 동시에 함께 엮어내는 것’으로서의 문화(culture)에 주목한다 [27, p.143]. 의학 교육에서 우리는 개인이 형상화된 세계(figured worlds) – 즉, 사람들이 주변의 사람들과 관행에 대한 해석을 협상하는 특정한 개념적 틀 – 에 깊이 위치해 있다고 제안하는 Holland와 동료들의 이론을 통해 이 차원에 익숙해졌다 [28]. 이 이론에서 주체성의 발휘는 그러한 틀(즉, 형상화된 세계) 내에서의 개인의 위치(position)에 달려 있으며, 그 위치의 제약과 가능성을 완비하고 있다. 예를 들어, ‘병원 의학(hospital medicine)’이라는 틀 안에서 전공의(resident) 학습자로 위치하는 것과 지도 전문의(attending physician)로 위치하는 것은 매우 다른 제약과 가능성을 탐색할 것을 요구한다. 결정적으로, 이 이론에서 개인의 위치가 주체성을 완전히 결정하지는 않는다; 대신, 형상화된 세계의 거주자들은 주변의 문화적 자원을 새롭고 예상치 못한 방식으로 사용하여 새로운 접근 방식을 즉흥적으로 만들어낼(improvise) 수 있으며, 아마도 그로 인해 문화 자체를 변화시키고 타인을 위한 새로운 가능성을 창출할 수 있다. 예를 들어, 전공의 교육 책임자가 아님에도 불구하고, 전공의 그룹이 자신들의 교육적 이익을 증진하기 위해 일련의 런치 앤 런(lunch and learn) 행사를 즉흥적으로 마련할 수 있다.

 

그러나 주체성의 문화적 차원은 유동적인 기반(shifting sands) 위에 서 있다. 왜냐하면 주체성의 기본적인 정의조차 사람들이 거주하는 형상화된 세계(대부분의 사람들은 여러 프레임워크를 넘나들기 때문에 그들이 거주하는 많은 형상화된 세계들)에 의해 영향을 받기 때문이다. 예를 들어,

 

  • Stephens와 동료들은 허리케인 카트리나 생존자 인터뷰에서 주체성에 대한 두 가지 뚜렷한 정의를 발견했다:
    • 떠난 사람들은 선택, 독립성, 그리고 미래에 대한 초점을 강조했고 (분리 모델(disjoint model)), 반면
    • 남은 사람들은 힘, 연결, 그리고 타인을 돌보는 것을 강조했다 (결합 모델(conjoint model)) [29].
  • 이 연구는 이러한 차이를 계급(class)과 잠재적으로 다른 문화적 경험에 기인한다고 보았다:
    • 떠난 사람들은 더 높은 소득, 더 높은 교육 수준, 그리고 자원에 대한 더 많은 접근성(예: 이 그룹의 모든 참여자는 차를 소유함)을 갖는 경향이 있었던 반면,
    • 남은 사람들은 더 낮은 소득, 더 낮은 교육 수준, 그리고 제한된 자원 접근성(예: 이 참여자들의 54%만이 차를 소유함)을 보였다 [29].
  • 두 생존자 그룹 모두 주체성을 발휘했다고 이야기했지만, 그들의 서로 다른 형상화된 세계가 그들의 경험과 주체성의 발휘를 변화시켰다.

 

주체성의 문화적 차원은 문화가 의학 교육에서 주체성을 형성하고 심지어 주도하는 방식에 빛을 비춘다. 예를 들어,

 

  • McOwen과 동료들은 Holland 등의 이론을 사용하여 의학 교육 고위 리더(senior leaders)(즉, 미국의과대학협회[AAMC]를 통해 공식적인 의학 교육 고위 리더 커뮤니티의 일원이었던 개인들)의 형상화된 세계를 조사했다 [30]. 그들은 이 리더들이 효과적으로 일하기 위해 여러 하위 문화(즉, 임상 의학, 대학 행정, 병원 행정)를 넘나들며 항해해야 함을 발견했다. 한 참여자는 학부 의학 학습자들을 위한 임상 교육 기회를 확보하기 위해 ‘서로 다른 보건 시스템’과 ‘복잡한 춤(complex dance)’을 춘다고 묘사했다 (p.228).
  • McOwen 등은 그들의 참여자들이 의학 교육 문화 내에서 특히 특권적인 사회적 맥락(즉, 그들에게 상대적인 권력(power)을 부여하는 역할)에 위치해 있으며, 이것이 그들로 하여금 상당한 주체성을 발휘하게 한다고 논의한다: ‘만약 내가 학생들을 환자 진료에 대해 다르게 생각하도록 훈련시킬 수 있다면, 나는 더 동정심 많고, 공감적이며, 환자 중심적인… 진료를 제공할 더 잘 훈련된 의사들의 군대를 출범시킬(unleash) 수 있다’ (p.231).
  • 의학에서의 교수와 학습에 대한 온전한 설명은 그것이 발생하는 맥락에 주의를 기울여야 하며, 그래야만 발전적인 노력이 그러한 형상화된 세계의 상충되는 문화적 규범(cultural norms)이나 관행과 충돌하지 않을 수 있다. (주체성의 문화적 차원을 사용한 의학 교육의 추가 연구에 대해서는 Blalock 등 [31]과 Strand 등 [32]을 참조하라).

 

따라서 주체성의 문화적 차원을 탐구하고자 하는 의학 교육 연구자들은 자신들과 참여자들이 학습하고 일하는 사회적 맥락(social contexts)에 초점을 맞춰야 한다. 연구자들은 다음과 같이 질문할 수 있다:

 

  • 참여자들이 자신들이 이동하고 있다고 인식하는 서로 다른 형상화된 세계(figured worlds)(즉, 프레임워크)는 무엇이며, 그러한 세계들의 명시적이고 암묵적인 규범들은 서로 어떻게 다른가?
  • 특정 문화적 세계에 있는 사람들은 주체성을 어떻게 정의하며, 무엇이 그것을 제약하거나 가능하게 하는가?
  • 밀접하게 관련된 문화적 세계들(예: 의과대학 문화 대 병원 문화)에서 정의, 제약, 가능하게 하는 요인들은 어떻게 다른가?
  • 하루, 한 달, 일 년, 경력(career)의 과정에서 더 분명하거나 덜 분명한 선택 지점(choice points)은 어디이며 개인들은 어떻게 그러한 선택을 하는가?
  • 참여자들이 새롭거나, 다르거나, 특이하다고 지적하는 관행은 무엇이며, 이것은 아마도 즉흥적 수행(improvisation)을 나타내는가? (연구 적용에 대한 추가 지침은 Table 2 참조).

 

의학 교육은 다양한 수준의 문화가 합류하는 곳(confluence)이다; 이곳은 다양한 경험과 전통을 가진 여러 곳 출신의 개인들을 한데 모으고, 이들은 각자의 전문직 문화를 가진 다양한 다른 임상의 및 직원들과 함께 임상 및 교육 문화를 유동적으로 넘나들며 일한다. 주체성의 관계적 차원(relational dimension)(역주: 문맥상 문화적 차원이 적절해 보이나 원문을 따름)은 이러한 과다한 문화적 원천들이 수련생과 교육자의 삶에서 어떻게 기능하고 있는지 이해하는 데 도움을 줄 수 있다. 예를 들어, 연구자들은 간호와 의학의 문화적 규범이 전문직 간 교육자들이 커리큘럼을 설계하기 위해 취하는 행동에 어떻게 다르게 정보를 제공하는지 조사할 수 있다. 이러한 지식을 바탕으로, 리더들은 예를 들어 두 분야의 사람들이 명시적으로 동의한 공유된 문화적 규범 세트를 만들려고 노력하는 공동 규범 구축(joint norm building)을 통해 이러한 문화적 격차를 명시적으로 연결할 수 있다.

 

구조적 차원 (The structural dimension) 

문화적 차원과 마찬가지로, 구조적 차원사람들이 거주하는 세계를 고려하지만, 특정 개인을 부당하게 제약하는 권력(power)과 구조(structures) [33, 34] – 인종차별(racism), 비장애인 중심주의(ableism), 동성애 혐오(homomisia), 트랜스젠더 혐오(transmisia), 성차별(sexism), 그리고 이러한 구조들의 무수한 교차성(intersections) 그리고 이에 대한 사람들의 행동과 반응에 특별한 초점을 맞춘다. 권력 구조(structures of power)와 주체성의 이러한 교차점은 이론가들에게 많은 당혹감을 안겨주었는데,

 

  • 그들은 개인이 구조에 완전히 종속되는지(따라서 주체성이 없는지)
  • 아니면 완전히 주체적인지(agentive)(따라서 모든 구조로부터 자유로워질 수 있는지)에 대해 논쟁해 왔다.

 

일부 현대 이론가들은 구조와 주체성을 서로 상호작용(interacting)하는 것으로 봄으로써 이 논쟁을 해결하려고 노력해 왔다 [35].

 

  • 예를 들어, 의과대학 지원자는 청각 장애인은 의사가 될 수 없다는 믿음(이념적 구조(ideological structure))에 의해 제약받을 수 있으며, 이는 이 학습자를 입학시키는 것뿐만 아니라 명시적인 포용 정책을 만들도록 밀어붙이는 스폰서를 통한 지원자의 주체성 발휘와 상호작용할 수 있다.

 

그렇다면 이 차원을 사용한다는 것은 개인과 집단의 행동이 부당한 구조에 어떻게 대항(push against)하는지, 그리고 부당한 구조 자체가 어떻게 작동하고 반응하는지를 주목하는 것이다. 이에 대한 한 가지 접근 방식은 불의에 직면한 사람들을 사회적 및 제도적 구조에 의해 제약받으면서도 여전히 의도와 통제력을 드러내는, 제한된(bounded) 존재로 보는 것이다 [36]. 비판 이론가(Critical theorists)들은 이를 제한된 주체성이 아닌 저항(resistance)으로 명명하며, 저항을 ‘사회적 해악과 불의에 대한 비난의 개인적 및 집단적 표현’으로 정의한다 [37, p.970]. 저항은 주체성의 특정한 형태로 간주될 수 있는데, 이는 ‘개인이 단순히 구조에 의해 영향을 받는 것이 아니라’, 그들이 ‘구조와 협상하고 투쟁하며 이러한 상호작용으로부터 자신만의 의미를 창조한다는 점을 강조’하는 것이다 [38, p.315]. 이러한 저항 작업은 문화적 차원의 즉흥적 주체성(improvisational agency)과 자질을 공유하지만, 구조적 차원은 억압적인 사회 구조와 사람들이 이를 변화시키기 위해 독립적으로 그리고 공동으로 어떻게 작업하는지를 강조한다 [39].

 

의학 교육 연구 분야가 마침내 억압(oppression)과 해악(harm)을 탐구하기 시작함에 따라, 일부 학자들은 개인이 억압적 구조에 대항(push back)하기 위해 주체성을 발휘하는 방식을 조사하고 있다. 예를 들어,

 

  • Blalock과 Leal [40]은 여성 의대생들의 주체성이 여성이라는 정체성에 근거하여 타인들이 그들을 ‘정당한 인식 주체(legitimate knowers)로서 불신하고, 무시하거나, 의심함’으로써(즉, 인식론적 불의(epistemic injustice)의 경험) 어떻게 제약받는지, 그리고 그 여성들이 저항하기 위해 어떻게 개인적으로 그리고 협력적으로 주체성을 발휘했는지 설명했다 [40, p.742].
  • 예를 들어, 여성 환자를 성적 대상화하는 읽기 자료를 배정받은 후, 자신들이 성적 대상화되고 침묵당했다고 느꼈을 수 있는 상황에서, 몇몇 참여자들은 함께 뭉쳐서 그것을 배정한 교수진에게 접근했고, 그렇게 함으로써 강의계획서에서 그 읽기 자료를 제거하는 데 성공했다.
  • Blalock과 Leal은 이러한 성공적인 행동을 통해 참여자들이 자신의 지식을 정당한 것으로 인식했으며, 한 참여자가 말했듯이 그들의 ‘의견이 중요하다’는 것을 인식했다고 주장한다 (p.751).
  • 주체성의 이 구조적 차원은 억압받을 수 있는 사람들이 권력(power)을 주장하기 위해 노력하는 방식과 그들이 그 권력을 행사하여 대항하는 특정한 억압적 구조(oppressive structures) 모두에 이중 초점을 제공한다. 의학 교육 학자들은 주체성과 억압 사이의 이러한 변증법을 탐구하면서 주체성의 구조적 차원을 점점 더 인식하고 있다 [41–44].

 

주체성의 구조적 차원은 학자들이 의학 교육 내의 불공평한 관행(inequitable practices), 규범, 정책을 찾아내어 조사하고, 그로 인해 부당하게 소외된 사람들의 내러티브(narratives)를 이끌어내고 신빙성을 부여할 것을 요구한다 [45]. 주체성의 구조적 차원을 활용하는 연구는 다음과 같이 질문할 수 있다:

 

  • 기관, 분야, 또는 학문 내 어디에 차별적 접근(differential access)이나 대우가 존재하며, 누가 그로 인해 고통받고 있고, 누가 이익을 얻고 있는가?
  • 이러한 구조에 의해 부당하게 제약받는 사람들은 그것을 어떻게 경험하며, 결정적으로 그들은 이 맥락에서 주체성과 저항을 어떻게 정의하는가?
  • 이러한 구조로부터 이익을 얻는 사람들은 불의를 어느 정도까지 인식하고 있으며, 그들은 저항에 있어서 자신의 역할을 어떻게(만약 한다면) 보고 있는가?
  • 학자들은 참여자들이 주체성을 발휘하는 지역적 맥락뿐만 아니라, 그들이 그러한 맥락을 통해 더 넓은 규범, 정책, 법률, 이념에 저항하는 것을 어떻게 생각하는지도 고려해야 한다 (연구 적용에 대한 추가 지침은 Table 2 참조).

 

주체성의 구조적 차원은 특히 전 세계적으로 새롭게 제정된 법률과 정책들이 인종차별, 성차별, 트랜스젠더 혐오, 동성애 혐오, 비장애인 중심주의에 민첩하게 대응하는 의료 기관의 능력을 위협함에 따라 고려해야 할 특히 중요한 차원이다. 이러한 각 유형의 억압에 대한 연구와 개입이 절실히 필요하지만, 모든 의학 교육 연구자는 연구 주제가 무엇이든 적어도 주체성의 구조적 차원을 고려해야 한다. 이 차원을 사용하는 연구는 책무성(accountability)을 위한 기회를 창출하며, 실증 연구(empirical research)를 통해 억압을 밝히 드러냄으로써 권력 구조를 개발하고 유지하는 데 책임이 있는 우리(연구자 포함)가 그것을 변화시키는 데 책임을 지도록 한다. Jain 등은 ‘연구자로서 우리의 특권적 위치는 포용성을 증진하고 인간 차이(human difference)를 지우는 대신 그 힘을 활성화하기 위해 새롭고 잠재적으로 불편한 접근 방식을 사용하여 관여할 것을 요구한다’고 주장한다 [46, p.6]. 우리는 이에 동의한다.

주체성을 위한 논변: 환원주의와 구조적 결정론에 저항하고 이동하는 개념을 수용하기
(Arguing for agency: Resisting reductionism and structural determination to embrace a travelling concept)
 

의학 교육이 주체성의 복잡성과 씨름하고 단순한 해답의 유혹을 받는(또는 Bleakley [2020]가 주장하듯이 개인주의적 이데올로기의 유혹을 받는) [3] 첫 번째 분야는 아니다. 사실, 심리측정 분석(psychometric analysis)을 위해 인간 행동을 정량적으로 구조화해 온 역사를 가진 심리학은 오랫동안 주체성에 대한 ‘환원주의적(reductionist)’ 설명이라고 명명된 것들과 씨름해 왔다 [2, p.17]. Martin, Sugarman, Thompson은 심리학이 종종 생물학적, 신경생리학적, 환경적 요인을 통해(via) 주체성을 설명하려고 하며, 따라서 문화, 사회적 구조, 진화하는 맥락, 개인의 성찰과 숙고의 역할을 간과한다고 주장한다. 물론 심리측정 작업은 우리의 개입이 의학 교육 학습 환경에 있는 사람들의 주체성을 지원하는지 확인하기 위해 자율성(autonomy) [47], 자기 조절(self-regulation) [48], 그릿(grit) [49], 자기 결정(self-determination) [47]과 같은 구성 개념(constructs)의 연구를 통해 우리의 이해를 증진시켰다. 그러나 Martin 등은 주체성이 이러한 렌즈를 통해 이해될 수 있기는 하지만 훨씬 더 복잡하다고 경고하며, 주체성은 다음과 같다고 주장한다:

  • 상황지어진(Situated): 우리의 생물학적 자아, 물리적 맥락, 문화적 규범과 신념, 사회적 구조 내에 위치함;
  • 창발적인(Emergent): (즉, 능동적으로 발달하거나 진화함) 발달하는 자아의 상호작용과 (역시 창발적인) 맥락, 문화, 구조를 가로지르며 우리가 내리는 선택으로부터 발현됨; 그리고
  • 숙고하는(Deliberative): ‘이용 가능한 사회문화적 관행과 관습을 선택적으로 취하고, 수정하며, 고용하는 자기 해석적이고 자기 결정적인 행위자의 능력’에 달려 있다는 점에서 숙고적임. [2, p.131]

우리는 인간이 구조적 요인에 영향을 받으면서도 여전히 ‘우리가 만들지 않은 상황에서 무엇을 할지 내부적으로 숙고하는 힘’을 보유하고 있음을 인식하는 성찰적 주체성(reflexive agency)을 주장하는 Archer와 Martin 등의 입장을 지지한다 [33, p.342]. 다시 말해, 무수한 요인들이 우리에게 영향을 미치지만, 우리는 우리의 주체성이 이러한 요인들에 의해 과소결정된다(underdetermined)고 주장하며, 이는 우리에게 의미 있는 성찰과 행동의 여지를 남겨준다 [2].

 

주체성의 복잡성으로부터 우리를 멀어지게 부르는 마지막 사이렌의 노래(siren song)는 이론, 특히 주체성과 관련된 복잡한 이론에 대한 우리의 불편함이다. 주체성을 둘러싼 길고 다양한 학문의 역사는 자원으로 볼 수도 있지만, 이론의 다른 가닥들이 희망 없이 엉켜 있는 불가사의한 매듭처럼 느껴질 수도 있다. 주체성은 Veen과 van der Tuin이 부르는 이동하는 개념(travelling concept)이다: 즉, 학제간 뿌리를 둔 분석 도구이다 [50]. 주체성과 같은 개념이 시간과 학문 분야를 가로질러 이동함에 따라, ‘그들은 도중에 “짐(baggage)”을 얻기도 하고 버리기도 하며’, 우리의 적용을 복잡하게 만든다 (p.146). 그러나 Veen과 van der Tuin은 이 ‘짐’이 우리에게 비평가로서 참여하고, 이론의 경계에 도전하며, 적용 범위를 수정할 기회를 제공한다고 주장한다 [50].

결론 (Conclusion) 

의학 교육 분야는 주체성에 대한 접근 방식을 포함하여 이론의 적용에 있어 더 요령이 생기고 있다(becoming savvier). 그러나 의학 교육 연구는 지금까지 주체성을 주로 개인적, 내적, 안정적인 심리학적 뿌리에서 개념화해 왔으며, 다른 학문 분야의 집단적, 외적, 변화하는 전통은 소홀히 했다. 우리는 여기서 연구자들이 분야를 발전시키고 새로운 문제를 해결함에 있어 주체성의 네 가지 차원, 즉 시간적(temporal), 관계적(relational), 문화적(cultural), 구조적(structural) 차원을 고려해야 한다고 주장했다. Figure 2에는 제안된 주체성의 네 가지 차원 각각을 통해 전공의(resident)의 교육적 경험을 어떻게 이해할 수 있는지에 대한 예시가 제공되어 있다. 각 차원은 주체성의 발휘에 대해 서로 다른 초점을 제공한다.

 

 

 

 

 

이 그림(Figure 2)은 앞서 논문에서 설명한 주체성(Agency)의 네 가지 차원이 실제 의료 현장, 특히 전공의(Resident)의 직장 기반 학습(workplace-based learning) 과정에서 어떻게 구체적으로 발휘되는지를 보여주는 예시입니다.

중앙의 전공의(Resident)를 중심으로 네 개의 분면이 각각의 차원을 설명하고 있습니다. 상세 내용은 다음과 같습니다.

1. 시간적 주체성 (Temporal Agency) - 좌측 상단

  • 아이콘: 시계, [학생 -> 의사 -> 노인]으로 변화하는 과정
  • 설명:
    • 전공의는 시간의 흐름 속에서 자신의 주체성을 협상(negotiating)합니다.
    • 현재의 문제뿐만 아니라, 자신의 과거(past) 모습(의대생 시절 등)과 미래(future)의 모습(숙련된 의사 등)을 참조하여 행동을 결정합니다.

2. 관계적 주체성 (Relational Agency) - 우측 상단

  • 아이콘: 사람들의 무리, 동료와 함께 있는 모습, 환자를 진료하는 모습
  • 설명:
    • 전공의는 타인과 공동으로 생성(co-creates)하고 보조를 맞춥니다.
    • 동료, 환자, 팀 관계를 활용하여 행동하며, 때로는 개인적으로, 때로는 공동으로(jointly), 때로는 대리인(proxy)을 구하여 행동합니다.

3. 문화적 주체성 (Cultural Agency) - 좌측 하단

  • 아이콘: 가면(연극), 병원 건물
  • 설명:
    • 전공의는 의료 시스템(healthcare system) 내에서 자신의 위치(place)를 협상합니다.
    • 그들의 위치(position)에서 환자 진료와 학습 사이의 균형을 맞추며, 병원의 규범(norms)과 시스템을 탐색(navigate)합니다.

4. 구조적 주체성 (Structural Agency) - 우측 하단

  • 아이콘: 정부 청사(법/제도), 정의의 저울, 촛불과 철조망(저항과 인권을 상징)
  • 설명:
    • 전공의의 주체성은 사람, 관행, 그리고 이데올로기에 의해 제한(bounded)됩니다.
    • 전공의는 개인적으로, 그리고 타인과 함께 억압적 구조(structures of oppression)에 대항(push against)합니다.

요약하자면: 이 그림은 전공의가 단순히 진료만 하는 것이 아니라, 과거와 미래를 연결하고(시간적), 동료/환자와 협력하며(관계적), 병원의 규범에 적응하고(문화적), 부당한 구조에 저항하는(구조적) 복합적인 과정을 통해 주체성을 발휘하고 있음을 시각화한 것입니다.

Adv Health Sci Educ Theory Pract. 2026 Jan 30. doi: 10.1007/s10459-026-10503-5. Online ahead of print.

Mixed up: evidence of integration in health professions education mixed methods research

 

 

[논문 리뷰] 혹시 내 연구도 '무늬만' 혼합 연구? 🤔 MMR에서 가장 중요한 '통합'을 확실하게 보여주는 법

안녕하세요! 오늘은 보건 전문직 교육(Health Professions Education, HPE) 분야에서 연구하시는 분들이라면 꼭 한 번 읽어봐야 할 뼈 때리는(?) 논문을 하나 소개해 드리려고 해요.

요즘 질적 연구와 양적 연구를 함께 진행하는 혼합 연구 방법(Mixed Methods Research, MMR)이 대세죠? 복잡한 교육 현상을 이해하는 데 이만한 게 없으니까요. 그런데, 단순히 설문조사(양적) 한번 하고 인터뷰(질적) 한번 했다고 해서 그게 진짜 '혼합 연구'일까요?

오늘 소개할 논문은 "우리가 MMR이라고 부르는 연구들이 과연 제대로 '섞이고(Integrated)' 있는가?"에 대해 아주 날카로운 질문을 던집니다.


1. 1 + 1 = 3 이 되어야 진짜 혼합 연구! 💡

많은 분들이 다중 방법 연구(Multi-methods Research)와 혼합 연구 방법(Mixed Methods Research, MMR)을 혼동하곤 해요.

  • 다중 방법: 그냥 여러 방법을 씀. 서로 섞이지 않고 따로 놂. (1+1=2)
  • 혼합 연구(MMR): 두 방법이 섞여서 새로운 통찰을 만들어냄. (1+1=3)

이 논문의 저자들은 MMR의 핵심을 바로 '통합(Integration)'이라고 강조합니다.

"통합은 이론, 데이터의 유형, 그리고 분석 방법론의 구조화된 혼합으로서, 메타 추론, 즉 어떤 종류의 단독 방법이 제공할 수 있는 것 이상의 더 높은 수준의, 더 포괄적인 통찰을 제공하는 것입니다."

"Integration is the structured mixing of theories, types of data, and analytic methodologies to provide meta-inferences, i.e., higher-level, more comprehensive insights beyond what a stand-alone method of any variety could offer."

 

즉, 양적 데이터와 질적 데이터를 비빔밥처럼 잘 섞어서(Mixing), 그전에는 안 보이던 새로운 맛(Meta-inferences)을 내야 한다는 거죠!


2. 현실은? "통합의 증거가 사라졌다" 😱

연구진이 주요 저널에 실린 43개의 MMR 논문을 뜯어봤더니 충격적인 결과가 나왔습니다.

  • 연구 설계에서 왜 섞어야 하는지 설명한 논문: 4.6%
  • 데이터가 어떻게 연결되는지 그림(Design Diagram)으로 보여준 논문: 4개 뿐
  • 결과를 통합해서 보여주는 표(Joint Display)가 있는 논문: 6개 뿐

상당수 연구가 "통합했다"고 주장하지만, 실제로 어떻게 통합했는지 보여주는 증거가 없었다는 거예요. 저자들은 이에 대해 아주 단호하게 말합니다.

"MMR 연구라고 주장하는 보고서에서 통합의 증거가 부재한 것은 근본적인 방법론적 결함입니다."

"The absence of evidence of integration in a purported MMR study report is a fundamental, methodological flaw."


3. 제대로 된 MMR을 위한 4단계 처방전 💊

그렇다면 어떻게 해야 할까요? 저자들은 연구의 4단계(설계, 수집, 분석, 보고)마다 통합의 흔적을 명확히 남기라고 조언합니다.

① 연구 설계 (Study Design)

왜 MMR이 필요한지 논리적으로 설명해야 합니다. 단순히 "둘 다 하면 좋으니까"가 아니라, 이론적 틀(Theoretical Framework) 안에서 두 방법이 왜 필요한지 설득해야 해요.

② 데이터 수집 (Data Collection)

데이터를 언제, 어떤 순서로 모을지, 그리고 이들이 서로 어떻게 영향을 주는지 보여줘야 합니다. 이때 말로만 하지 말고 설계 도표(Design Diagram)를 꼭 넣으세요! (논문의 Fig 1처럼요 🗺️)

③ 분석 (Analysis)

따로따로 분석하고 끝내지 마세요.

  • 서사적 엮기(Narrative Weaving): 글을 쓸 때 두 결과를 엮어서 서술하기
  • 결합 디스플레이(Joint Display): 표 하나에 양적 결과와 질적 결과를 나란히 놓고 비교하기 (논문의 Fig 2 강추! 📊)

④ 보고 (Reporting)

여기가 하이라이트입니다. 고찰(Discussion) 부분에서 단순히 결과를 요약하는 게 아니라, 통합을 통해 얻어낸 '메타 추론(Meta-inferences)'을 제시해야 합니다.

"메타 추론은 반드시 최종 정답이 아니라, 더 높은 차원의 통찰을 제공합니다."

"Meta-inferences provide higher-level insights, not necessarily a final answer."


4. 마치며: 체크리스트를 활용하세요!

저자들은 GRAMMSMMARS 같은 보고 지침(Reporting Guidelines)을 적극 활용하라고 권장합니다. 내 연구가 진짜 MMR인지, 아니면 그냥 두 가지 일을 따로 한 건지 헷갈린다면 이 논문이 제시하는 표(Table 1)를 옆에 두고 논문을 작성해 보세요.

진정한 혼합 연구는 두 가지 언어(숫자와 이야기)를 모두 사용하여, 교육 현장의 복잡함을 온전히 담아내는 매력적인 과정이니까요!

📝 오늘의 요약:

  1. MMR의 핵심은 통합(Integration)이다.
  2. 설계부터 보고까지 모든 단계에서 '섞었다는 증거'를 보여줘라.
  3. Joint DisplayMeta-inferences를 잊지 말자!

 


배경 (Background)

 

보건 전문직 교육(Health Professional Education, HPE) 분야는 다양하고 복잡한 질문들을 탐구하며, 여기서는 여러 요소들이 예측할 수 없는 방식으로 역동적인 맥락 안에서 상호 작용합니다. 복잡한 질문들은 단순한 해결책을 거부합니다. 그러한 질문들은 HPE 내의 광범위한 학문 분야를 반영하여, 다원적인 방법론(plurality of methodologies), 데이터 소스, 그리고 관점이 필요합니다 (Norman et al., 2022). 예를 들어, 전자의무기록(electronic health record) 문서를 사용하여 의료 팀의 상호의존성을 탐구한 Sebok-Syer와 동료들의 연구(Sebok-Syer et al., 2023)는 팀 성과에 미치는 사회학적, 심리학적, 기술적 영향을 고려하기 위해 다수의 질적(qualitative) 및 양적(quantitative) 데이터 세트를 필요로 했습니다.

 

복잡한 HPE 문제를 이해하고자 할 때, 단일 연구 방법론(single research methodology)은 불충분할 수 있으며, 일부 연구 질문은 질적 방법론과 양적 방법론의 다양한 조합을 포함하는 설계를 사용할 때 가장 잘 해결될 수 있습니다. 혼합 연구 방법(Mixed Methods Research, MMR)은 HPE에서 분리된 연구 패러다임(paradigms) 간의 간극을 메우는 데 도움을 줄 수 있습니다 (Shannon-Baker, 2016). MMR은 복잡한 문제에 대한 새로운 통찰(novel insights)을 생성하기 위해 이론, 데이터, 방법론의 통합(integration)을 필요로 하는 문제를 해결하기 위한 유망한 접근법으로 부상했습니다. MMR은 단일 연구 내에서 여러 유형의 데이터와 분석 방법을 결합함에 있어 실용주의적 인식론(pragmatic epistemology)에 의해 인도됩니다 (Creswell & Clark, 2018; Lavelle et al., 2013). 몇 가지 핵심 기능이 MMR을 다른 접근법과 구별하는 역할을 하는데, 여기에는

 

  • 연구 질문에 답하기 위한 질적 및 양적 데이터와 관련 분석 접근법의 목적 지향적인 통합(purposeful integration),
  • 분석과 통합의 반복적이고 순환적인 과정(iterative and cyclical processes),
  • 메타 추론(meta-inferences) 생성에 있어서 데이터와 해석의 맥락화(contextualization), 그리고
  • 특정 방법론적 입장을 엄격히 고수하기보다는 연구 질문을 해결하는 데 가장 적합한 방법론을 통합하는 데 중점을 둔 실용주의적 초점(pragmatic focus)이 포함됩니다 (Creswell & Clark, 2018).

 

MMR과는 대조적으로, 다중 방법 연구(multi-methods research)는 데이터를 수집하고 분석하기 위해 하나 이상의 방법을 사용하지만, 질적 접근법과 양적 접근법 모두를 요구하지도 않고 그들의 통합을 요구하지도 않습니다. 다중 방법 연구는 일반적으로 단일 연구 패러다임(single research paradigm)(예: 전체 연구 내에서 주관주의적(subjectivist), 질적 방법론만 사용) 내에 존재합니다 (Nanthagopan, 2021). 데이터 수집 및 분석을 위해 사용된 여러 방법들은 결과를 통합하는 어떠한 과정도 없이 서로 독립적으로(independently) 작동합니다. 단일 방법 연구(single-method study)와 대조적으로, 다중 방법 연구는 공통의 연구 질문으로 수렴되는 여러 관련 소규모 분석들의 결합을 통해 질문에 대한 더 깊거나 넓은 탐구를 가능하게 합니다 (Greene, 2015). 다중 방법 연구가 표면적으로는 MMR과 유사해 보일 수 있지만, 근본적인 차이점은 데이터와 분석의 결합이 어떻게 메타 추론(meta-inferences)을 생성하는지에 대한 관심이 부족하다는 것입니다.

 

MMR의 차별화된 특징은 통합(integration)입니다. 통합 과정은 연구 질문을 해결하는 복합적인 해결책과 새로운 통찰을 생성하기 위해 이론, 데이터, 분석을 체계적이고 의도적으로 혼합(mixing)하는 것을 포함합니다 (Bazeley, 2024). Fetters와 Freshwater는 이를 1 + 1 = 3 통합 과제(integration challenge)라고 다르게 표현했는데, 이는 서로 다른 분석적 접근법의 통합이 성과(outcomes)에 있어서의 시너지(synergy)를 가능하게 한다는 것을 의미합니다 (Fetters & Freshwater, 2015). MMR은 양적 및 질적 방법론의 순차적(sequential) 또는 병렬적(parallel) 사용과 보고를 넘어서, 통합의 '어디서(where), 언제(when), 어떻게(how)'에 대한 신중한 고려를 요구합니다. 절차적 기술(Procedural descriptions)은 서로 다른 유형의 데이터와 분석이 어떻게 정보를 교환하여 메타 추론(meta-inference), 즉 질적 또는 양적 접근법 단독 분석만으로는 접근할 수 없었던 통찰(insight)에 도달하는지를 안내합니다 (Schoonenboom, 2022). MMR 연구라고 주장하는 보고서에서 통합의 증거가 부재한 것은 근본적인 방법론적 결함(methodological flaw)입니다.

 

우리가 아래에 보고하는 바와 같이, HPE MMR 연구에서 통합의 증거(evidence of integration)가 부족합니다. 이는 통합의 증거를 명시적으로 밝히는 것의 필요성에 대한 연구자와 검토자(reviewers)의 오해를 반영하는 것일 수 있습니다. 이 글의 목적은 MMR 설계를 채택한 HPE 연구에서 통합 보고 관행의 더 큰 정밀성(precision)을 옹호하는 것입니다.

 

  1. 통합에 대한 더 명확한 보고를 위한 주장을 강화하기 위해, 우리는 5개의 주요 HPE 저널에서 MMR로 명명된 최근 연구들의 종합(synthesis)을 통해 통합이 어떻게 보고되었거나 보고되지 않았는지를 상술합니다.
  2. 다음으로, 우리는 HPE 연구의 네 가지 단계(연구 설계, 데이터 수집, 분석, 그리고 보고) 전반에 걸쳐 통합 절차가 어떻게 개선될 수 있는지를 정의합니다.
  3. 마지막으로, 우리는 두 가지 주요 MMR 보고 지침(reporting guidelines)에 비추어 우리의 연구 결과를 논의하고 통합의 증거 보고가 어떻게 개선될 수 있는지 제안하며 결론을 맺습니다.

 

HPE에 게재된 MMR 연구들의 통합 증거 현황 (The current state of integration evidence in HPE published MMR studies)

게재된 MMR 연구들에서 통합 증거의 현재 상태를 평가하기 위해, 문헌의 단면(cross-section)을 검토했습니다. 2023년 1월부터 2024년 6월까지 OVID 데이터베이스에서 다음 저널들을 대상으로 검색을 수행했습니다: Academic Medicine, Advances in Health Sciences Education, Medical Education, Medical Teacher, 그리고 Perspectives on Medical Education. 이 저널들은 피인용 지수(impact factor)*에 따른 최상위 일반 의학 교육 저널로서의 지위를 바탕으로 선정되었습니다. 키워드 "mixed method"가 논문과 관련된 제목, 초록, 또는 키워드에서 검색되었습니다.

 

원저 연구(original research)만 포함되었으며, 논평(commentaries)과 종합 연구(syntheses)는 제외되었습니다. 191건의 연구가 식별되었습니다. 중복을 제거한 후 58건의 논문이 남았습니다. 한 명의 검토자가 제목과 초록 수준에서 포함 여부를 위해 모든 기사를 스크리닝했습니다. 스크리닝 후, 스스로를 혼합 방법 연구라고 기술한 43건의 원저 연구가 남았습니다.

 

각 연구는 통합의 증거가 연구 설계(study design), 데이터 수집(data collection), 분석(analysis) 또는 보고(reporting) 단계에 포함되었는지 식별하기 위해 코딩(coded) 되었습니다. 두 명의 검토자가 포함된 연구의 10%를 독립적으로 코딩했습니다. 코딩의 불일치는 검토되었고 합의에 의해 해결되었습니다. 그 후, 한 명의 검토자가 포함된 기사 전체 세트를 코딩했습니다.

 

부록(appendix)은 각 연구의 주요 특징을 기술합니다. 통합의 증거는 연구의 각 단계에서 이론, 데이터 또는 분석의 혼합에 대해 논문 내에 구체적이고 명백한 표현이나 설명이 이루어진 경우 명시적(explicit)인 것으로 판정되었습니다. 통합이 설계나 결과로부터 추론될 수 있지만 통합 과정으로 구체적으로 식별되지 않은 경우, 이는 암묵적(implicit)인 것으로 점수 매겨졌습니다.

(누락된) 통합의 증거 (The (Missing) evidence of integration) 

MMR 설계에 대한 설명에서, 단 두 건의 연구(4.6%)만이 통합에 대한 이론적 근거(rationale)와 서로 다른 데이터 유형 및 분석의 의도적인 혼합이 연구 질문을 해결하는 데 가장 효과적이라는 정당성(justification)을 명시적으로 진술했습니다. 연구 문제의 개념화를 뒷받침하기 위해 이론적 틀(theoretical framework)에 통합된 관련 이론들의 명시를 포함하여, 혼합 방법론의 필요성을 정당화하는 이러한 연구들의 개념적 틀(conceptual frameworks)에 있어 눈에 띄는 격차가 있습니다.

  • 데이터 절차(data procedures)에 대한 설명에서, 43개 연구 중 단 18개 연구만이 명시적으로(그리고 1개는 암묵적으로; 총 44.2%) 데이터의 순서와 시기를 포함하여 데이터 유형들이 어떻게 관련되는지를 상세히 기술하며 통합 과정(integration process)을 명확히 설명했습니다. 특히, 데이터 절차를 강조하는 설계 도표(design diagrams)를 포함한 연구는 단 4건에 불과했습니다.
  • 분석 절차(analytical procedures)에 대한 설명에서, 단 14개 연구만이 명시적으로(그리고 3개는 암묵적으로; 총 39.5%) 다양한 하위 분석들이 어떻게 혼합되어 메타 추론(meta-inferences)을 도출하는지를 설명했습니다. 특히, 통합된 연구 결과를 보여주는 데이터 디스플레이(data displays)는 단 6개 연구에서만 나타나, 그 부재가 두드러졌습니다.

통합의 부재는 메타 추론(meta-inferences) 보고의 부족에도 반영되었습니다. 고찰(discussion) 섹션에서, 하위 연구들의 병렬 보고(parallel reporting)가 제공할 수 있는 것을 넘어서는 새로운 통찰(novel insight)을 제공하는 결론을 명시적으로 보고한 연구는 단 5건뿐이었습니다. 추가로 11개 연구(총 37.2%)가 MMR 접근법을 통해 가능해진 메타 추론을 제공했으나, 그들은 그러한 결과에 라벨을 붙이거나, 맥락을 제공하거나, 연구 질문과 연결 짓는 데 실패했습니다.

 

통합의 정의와 바람직한 통합 관행 (Defining integration and desirable integration practices)

통합은 혼합 연구 방법(MMR)의 정의적 특징으로 인식되고 있지만, MMR 커뮤니티는 집단적인 정의를 발전시키는 데 어려움을 겪고 있습니다. 진행 중인 논의의 복잡성은 MMR 연구에서 통합을 기술하고 수행하기 위한 개념화(conceptualizations)와 방법론적 절차(methodological processes)를 모은 MMR 방법론 저널의 특별호가 필요했다는 사실에서도 잘 드러납니다 (Guetterman et al., 2020). 핵심 교과서들의 정의는 모호성(ambiguity)과 동어반복(tautology)으로 특징지어집니다:

  • “…혼합 연구 방법 연구에서 질적 결과와 양적 결과를 하나로 모으는 방법” (Creswell, 2015) 또는
  • “…연구의 양적 및 질적 구성 요소를 명시적으로 상호 연관시키는 것” (Plano Clark & Ivankova, 2016).

기존의 논쟁을 종합(synthesizing)하는 것은 통합 보고 관행을 개선하려는 우리의 목표에 결정적이지 않습니다. 따라서 우리는 Fetters와 Molina-Azorin의 틀(Fetters & Molina-Azorin, 2017)에 기반하여, 보건 전문직 교육(HPE) MMR에서 사용할 수 있는 통합에 대한 더 명확한 정의와 관련된 통합의 증거를 제안합니다. 통합(Integration)은 이론, 데이터의 유형, 그리고 분석 방법론의 구조화된 혼합(structured mixing)으로서, 메타 추론(meta-inferences), 즉 어떤 종류의 단독 방법(stand-alone method)이 제공할 수 있는 것 이상의 더 높은 수준의, 더 포괄적인 통찰(insights)을 제공하는 것입니다. 아래에서 우리는 통합의 증거를 필요로 하는 연구의 전형적인 4단계 내의 명시적인 영역들을 식별합니다.

연구 설계 단계에서의 통합 (Integration at study design stage) 

  • 통합을 위한 설계는 연구 근거를 뒷받침하기 위해 MMR을 사용하는 것에 대한 논리적 주장(logical argument)을 명시하는 동시에 후속 데이터 절차와의 일치(alignment)를 보장하는 개념적 틀(conceptual framework) (Varpio et al., 2020)을 필요로 합니다. 연구 설계 단계에서의 통합은 구체적인 MMR 질문을 해결하고 연구 문제에 대한 더 큰 이해에 기여하기 위해 왜, 그리고 어떻게 질적 접근과 양적 접근의 결합이 필요한지를 명시적으로 서술할 것을 요구합니다. 왜 단일의 객관주의적(objectivist) 또는 주관주의적(subjectivist) 접근만으로는 연구 질문에 답하기 불충분한지에 대한 구체적인 설명이 제공되어야 합니다. 하지만 분명히 말하자면, 많은 연구 질문에 있어 MMR 접근법이 반드시 필요한 것은 아닙니다.
  • 연구 설계 단계에서, 이론적 틀(theoretical framework) (즉, 연구 질문을 지지하고 범위를 한정하며 분석의 렌즈에 정보를 제공하는 이론들의 발판)은 관련 이론들의 필요하고도 적절한 혼합에 대한 명시적인 논증을 해야 합니다 (Varpio et al., 2020; Haynes-Brown, 2023). 여기서도 역시 이론 통합의 증거는 명확히 제시되어야 합니다.
  • 설계 단계에서의 통합의 증거(Evidence of integration)는 개념적 틀 내에서 MMR 사용에 대한 정당성(justification)과 이론적 틀 내에서의 이론 통합에 대한 설명을 포함합니다.

데이터 수집 단계에서의 통합 (Integration at data collection stage)

  • MMR 설계를 구현하는 것은 통합의 지점들과 데이터의 순서(sequencing), 시기(timing), 그리고 순차적 또는 병렬적으로 수집된 다양한 소스와 유형의 관계를 기술하는 것을 포함합니다. 연구자들은 데이터의 순서가 분석과 생성될 수 있는 통찰에 영향을 미칠 것임을 인식하고, 데이터 세트들이 어떻게 혼합될지에 대한 의도를 사전에(a priori) 기술해야 합니다. 데이터 수집 절차의 순서가 미치는 영향과 결과를 명확히 하기 위해서는 데이터 수집 단계에서의 의도적인 통합(intentional integration)의 증거가 필수적입니다.
  • MMR 설계에서 데이터 수집에 대한 두 가지 일반적인 접근법은 순차적(sequential) 방식과 병렬적(parallel) 방식입니다.
    • 순차적으로 수집된 데이터는 하나의 데이터 수집 단계가 다른 단계를 뒤따르는 것을 포함합니다. 이러한 데이터 통합 접근법은 후속 단계가 선행된 데이터 수집 및 분석 단계를 기반으로 구축되는 결과를 낳습니다. 이와 대조적으로,
    • 병렬적 데이터 수집은 데이터를 동시적으로(concurrently) 통합할 기회를 포함하며, 이는 분석이 진행됨에 따라 데이터 수집 절차에 반복적인 변화(iterative changes)를 가져올 수 있습니다 (Fetters et al., 2013).
    • 데이터 수집 단계에서 통합의 증거를 명시적으로 만들기 위해 설계 도표(design diagram)의 유용성을 주목하는 것이 중요합니다. 전형적으로, 설계 도표는 통합 절차에 대한 서사적 기술(narrative description)을 보완합니다.
      • HPE 문헌에서 모범적인 설계 도표는 Burt-Miller와 동료들 (Burt-Miller et al., 2024), 그리고 Baig와 동료들 (Baig et al., 2024)의 연구에서 제공된 설계 도표에서 볼 수 있으며, 여기서 설계 도표는 서사적 기술에 대한 보완적인 시각적 설명을 제공합니다. 가상의 설계 도표 예시는 그림 1을 참조하십시오.
  • 데이터 수집 단계에서의 통합의 증거(Evidence of integration)는 수집 과정이 데이터 세트의 혼합에 어떻게 정보를 제공하는지에 대한 설명을 포함합니다. 설계 도표가 포함되어야 합니다.

Figure 1: 설계 도표 (Design Diagram) 

1. 범례 번역

Fig. 1 설계 도표(design diagram)의 예시. 임상 실습(clerkship)에서의 공감 훈련 커리큘럼이 미치는 영향을 조사하고 공감을 발전시키는 의대생들의 경험을 탐구하기 위해 수렴적 혼합 연구 방법(convergent mixed methods approach)을 사용한 가상의 예시 연구이다. 이 설계 도표는 질적 및 양적 데이터가 어떻게 수집되고 분석되는지, 그리고 그 후에 통합(integration)과 해석(interpretation)이 어떻게 일어나는지를 시각적으로 나타낸다.

2. 그림 설명

이 그림은 혼합 연구 방법(MMR)의 설계 단계에서 연구의 흐름을 보여주는 도표입니다.

  • 좌측 (병렬적 진행): 연구는 두 가지 트랙으로 동시에 시작됩니다.
    • 상단 트랙 (양적 연구): 공감 척도를 이용한 설문조사(Survey)를 수행하고, 시간 경과에 따른 변화를 보기 위해 분산 분석(ANOVA)을 실시합니다.
    • 하단 트랙 (질적 연구): 심층 인터뷰(In-depth interviews)를 수행하고, 주제 분석(Thematic Analysis)을 통해 임상 실습 및 공감 발달과 관련된 주제를 식별합니다.
  • 중앙 (통합): 두 트랙이 합쳐지는 지점입니다. 양적 점수(scores)와 질적 주제(themes)를 병합(merge)하여 커리큘럼과 공감 발달 사이의 연결 고리를 식별합니다.
  • 우측 (해석): 통합된 데이터를 바탕으로 공감 발달에 영향을 미치는 맥락적, 교육 과정적 요인을 이해하고, 커리큘럼 개선안을 권고하는 최종 결론을 도출합니다.

분석 단계에서의 통합 (Integration at analysis stage)

  • 통합된 결과(integrated findings)의 증거를 제공하는 것은 메타 추론(meta-inferences)의 생성을 가능하게 하는 데 필수적입니다. 이 단계는 새로운 통찰(novel insights)의 생성을 촉진하기 위해 하위 분석들(예: 독립적인 질적 및 양적 분석)을 결합하거나 혼합하는 분석 과정을 기술하는 것을 포함합니다. 분석에서의 통합 증거는 전체 연구가 단순히 별개의 하위 연구들의 병렬 보고(parallel reporting)에 그치지 않도록 보장하는 데 도움을 줄 수 있습니다.
  • Fetters, Curry, 그리고 Creswell은 여기서 우리의 논의 범위를 제공하는 세 가지 통합 전략을 기술합니다: 서사적 엮기(narrative weaving), 데이터 변환(data transformation), 그리고 결합 디스플레이(joint display) (Fetters et al., 2013).
    • 서사적 과정(narrative process)은 포괄적인 결론을 도출하기 위해 다양한 데이터 하위 분석들을 개념별(concept-by-concept) 기초 위에서 엮어냅니다.
    • 데이터 변환 과정은 통일된 분석을 위해 다양한 데이터 유형을 공통의 형태로 변환하는 것을 요구합니다. 예를 들어, 통계적 조작을 허용하기 위해 질적 데이터를 수치적 형태로 의미론적 변환(semantic conversion)을 하거나, 후속 질적 분석을 위해 양적 분석에서 확인된 주제들을 서면으로 기술하는 것입니다. 마지막으로,
    • 더 일반적으로 데이터 디스플레이(data displays)라고도 불리는 결합 디스플레이(joint display)는 데이터 하위 집합의 개별 분석으로는 불가능했던 누적 분석을 분명하게 보여주기 위해 서로 다른 데이터 유형을 시각적으로(그림, 매트릭스, 그래프 등을 통해) 전시합니다. 결합 디스플레이의 주요 유형 중 일부는
      • 나란히 배치(side-by-side),
      • 주제별 통계(statistics-by-themes) 또는 통계별 주제(themes-by-statistics), 그리고
      • 도구 개발(instrument development) 결합 디스플레이를 포함합니다 (Guetterman et al., 2015).
      • HPE 문헌에서 결합 디스플레이의 두 가지 예는 McDonald, Hu, Heeneman (McDonald et al., 2024)과 Rueb 및 동료들 (Rueb et al., 2024)의 연구에서 볼 수 있으며, 여기에는 서로 다른 데이터가 후속 결과를 도출하기 위해 어떻게 통합되었는지에 대한 명확한 시각화가 있습니다. 그림 1의 동일한 가상 연구를 기반으로 한 결합 디스플레이의 예시는 그림 2를 참조하십시오.
  • 데이터 통합의 서로 다른 강도(intensity) 수준을 고려하는 것도 중요합니다. 통합된 데이터로부터 결론을 연결하고 도출하기 위한 추론 만들기(inference-making) 과정은 데이터 세트들이 순차적으로 연결되거나 구축되는지, 아니면 동시에 병합되는지를 포함하여 명확하게 기술되어야 합니다. 분석에서의 통합 증거는
    • 수렴(convergence) 또는 불일치(divergence)나란히 비교(side-by-side comparisons),
    • 단일 데이터베이스로의 데이터 변환, 또는 연결, 비교,
    • 메타 추론을 예시하는 결합 디스플레이 등을 통해 더 풍부하고 시너지 효과가 있는 결과(synergistic results)를 보장합니다.
  • 마지막으로, 통합은 획일성(uniformity)을 의미하지 않습니다. 통합의 특수한 사례는 서로 발산하는(diverge)(불일치하는) 결과를 다루는 것을 포함합니다. 사실, 일부 결합 디스플레이는 특히 발산하는 결과에 주의를 환기시키기 위해 양적 분석과 질적 분석 간의 통합 적합성을 분류하기도 합니다 (McCrudden et al., 2021). 두 가지 주요 전략이 이러한 사례를 다룹니다.
    • 첫째, 불일치의 감지(detection of divergence)는 수렴하지 않거나 상호 보완적이지 않은 하위 분석들을 해결하기 위한 추가 분석의 기회를 제공합니다. 이는 발산하는 결과들을 기반으로 구축하기 위해 추가적인 데이터 수집과 분석을 필요로 할 수도 있습니다. 그러나, 이것이 항상 필요한 것은 아닙니다.
    • 연구자들은 귀추법(abduction)의 형태를 통해, 벗어나는 결과들을 설명하는 더 포괄적인 이론을 개발하는 것을 선택할 수 있습니다.
      • 귀추법은 관찰된 발산하는 결과들에 대해 논리적으로 일관된 설명을 제공하는 설명적 가설(explanatory hypothesis)을 형성하는 것을 포함합니다.
      • 일반적인 전제에서 구체적인 결론을 도출하는 연역법(deduction)이나, 구체적인 사례들로부터 일반화하는 귀납법(induction)과는 달리, 귀추법은 관찰된 관계들에 대한 최선의 설명을 제안하며, 추가적인 정교화에 열려 있습니다.
  • 분석 단계에서의 통합의 증거(Evidence of integration)는 하위 분석들이 누적 분석(cumulative analysis)을 위해 어떻게 혼합되는지에 대한 구체적인 설명을 포함합니다.

보고 단계에서의 통합 (Integration at the reporting stage) 

  • 보고 단계에서 새로운 통찰을 논의하는 것은 MMR 연구의 궁극적인 목적이며, 이는 이론, 데이터, 분석의 통합을 통해서만 유일하게 가능한 메타 추론(meta-inferences)의 구체적인 제공을 의미합니다. 통합의 분석 단계보고 단계는 밀접하게 연결되어 있습니다.
    • 분석 단계는 전형적으로 연구 원고의 결과(results) 섹션을 구성하는 반면,
    • 보고 단계고찰(discussion) 섹션시작 요약을 구성합니다.
  • 너무 빈번하게 메타 추론이 분석 단계에서 제안되지만, 필요한 라벨링, 적절한 프레이밍(framing)을 통한 연구 질문과의 연결, 그리고 그 의미에 대한 맥락화(contextualization)가 결여되어 있습니다. 그 결과, 독자는 분석 단계에서 이용 가능한 메타 추론을 스스로 식별하고 자신의 연결과 결론을 도출해야 하는 상황에 남겨집니다.
  • 보고 단계에서는 연구 설계, 데이터 수집, 분석의 모든 요소를 하나로 모아 연구의 메타 추론(결론)을 명료하게 서술해야(articulated) 합니다.
    • 예시는 그림 2를 참조하십시오. 또한, 이 논문의 서두에서 언급한 Sebok-Syer 등의 연구는 다음과 같은 다수의 메타 추론에 도달했습니다: “교수진은 자신의 전자의무기록(EHR) 기반 지표와 해당 벤치마크에 대해 제한된 인식을 보였으며, 이는 지지적인 상호의존성을 통해 모범 사례(best practices)의 역할 모델이 되는 그들의 능력에 영향을 미친다” (Sebok-Syer et al., 2023).
      • 그들의 분석은 혼합된 데이터 세트들의 관계적 연결(relational connection)을 입증합니다. 
      • 고찰에서 그들은 이 결과를 임상 훈련 시스템의 맥락에서 설명하여, 전공의의 임상 성과에 특화된 교수진 교육의 영향에 대한 더 미묘한 이해를 가능하게 합니다.
    • 이와 대조적으로, 다중 방법(multi-methods) 연구였다면 아마도 교사의 임상 성과에 대한 제한된 통찰력이나 교수진의 감독 기능에 따른 전공의 성과의 분산을 각각 따로 보고했을 것입니다. 혼합 방법 설계는 감독의 유형에 따른 임상 결과들 간의 상호 연결(interconnection)을 입증할 수 있게 했습니다.
  • 메타 추론은 관계적, 예측적, 인과적, 비교적, 그리고 부연적인 결론을 명시할 수 있습니다 (Younas et al., 2025). 그러나, 확정적인 결론은 그들이 답하고 있는 질문의 유형에 따라 조절되어야 합니다. 복잡한 문제의 본질은 단순하고, 확정적이며, 불변하는 해결책을 거부합니다; 메타 추론은 반드시 최종 정답이 아니라, 더 높은 차원의 통찰(higher-level insights)을 제공합니다.
  • 보고 단계에서의 통합의 증거(Evidence of integration)는 연구 질문을 다루는 메타 추론의 명시적이고 맥락적인 서술을 포함합니다.

Figure 2: 결합 디스플레이 (Joint Display) 

1. 범례 번역

Fig. 2 결합 디스플레이(joint display)의 예시. 임상 실습(clerkship)에서의 공감 훈련 커리큘럼이 미치는 영향을 조사하고 공감을 발전시키는 의대생들의 경험을 탐구하기 위해 수렴적 혼합 연구 방법(convergent mixed methods approach)을 사용한 예시 연구이다. 이 가상의 연구에서, 공감 설문조사의 양적 점수(quantitative scores)와 지지적 멘토링의 중요성을 포착한 질적 인터뷰 데이터(qualitative interview data)의 통합은, 역할 모델링 및 상황 토론을 위한 의도적인 기회가 어떻게 학습자의 공감 기술을 증진시키는지를 조명한다.

2. 그림 설명

이 그림은 분석 및 보고 단계에서 양적 결과와 질적 결과를 통합하여 어떻게 메타 추론(Meta-inferences)을 도출하는지 보여주는 표(Table)입니다.

  • 첫 번째 열 (양적 결과): ANOVA 분석 결과, 처음과 마지막 시점 사이에 공감 점수의 통계적으로 유의미한 변화가 있었음을 보여줍니다.
  • 두 번째 열 (질적 결과): 연구 일지와 인터뷰 데이터를 분석한 결과, '지지적인 멘토링이 학습자의 공감 접근 방식을 구축하는 데 도움을 준다'는 주제(Theme 3)가 도출되었습니다.
  • 세 번째 열 (결과 통합 - 메타 추론): 앞선 두 결과를 합쳐서 새로운 통찰을 도출합니다. 단순히 "점수가 올랐다"와 "멘토링이 중요하다"를 나열하는 것이 아니라, "교수진과 학습자 간의 의도적인 역할 모델링 기회와 상황 토론이 실습 기간 동안 학습자의 공감 발달을 지원한다"는 더 깊은 결론(1+1=3)을 이끌어냅니다.

 


추가적인 고려사항들 (Additional considerations) 

통합을 연구 설계, 데이터 수집, 분석, 그리고 보고에만 국한된 것으로 보는 개념화는 불완전합니다. Fetters와 Molina-Azorin은 통합의 추가적인 차원(additional dimensions)을 주장합니다 (Fetters & Molina-Azorin, 2017). 이러한 차원들은 팀 구성원의 혼합(예: 전문성, 학문적 배경)과 보급 플랫폼(dissemination platforms)의 혼합(예: 출판 유형, 출판 독자)을 포함합니다.

 

  • 팀 구성원의 다양성은 방법론적 선호가 균형을 이루도록 보장함으로써 통합의 장애물을 극복할 수 있습니다. 마찬가지로,
  • 보급 플랫폼의 다양성은 저널이나 학술대회 논문집 등의 제약과 규범이 연구 내의 데이터와 방법의 혼합을 동시에 제약하지 않도록 보장할 수 있습니다. 다수의 보급 플랫폼은 연구 프로젝트의 전체 이야기(full story)가 공유되도록 보장할 수 있습니다.

 

통합 증거 보고의 개선 (Improving the reporting of integration evidence) 

위에서 분석된 대다수의 HPE MMR 연구들에서 통합 증거가 누락된 것은 문제입니다.

  • 어떤 경우에는, 다중 방법 연구(multi-methods research)가 잘못 분류되어 MMR 연구라고 주장되기도 합니다.
  • 다른 경우에는, 통합의 방법론적 엄격성(methodological rigor)이 부족합니다. 그리고 마지막으로,
  • 다른 경우에는 원고 내에 있는 통합의 암묵적 가정(implicit assumptions)을 파악하기 위해 독자가 추가적인 노력을 들여야 하며, 이는 MMR 연구를 제약하고 안내하는 요소가 됩니다.

잠재적인 해결책은 보고 지침(reporting guidelines)의 사용입니다. 저자와 검토자에게 필요한 통합의 증거에 주의를 환기시키는 보고 지침은 MMR 연구의 엄격성을 높이고, 연구에 정보를 제공하는 통합 요소들의 더 큰 명확성과 구체성을 통해 독자의 이해도를 향상시킬 수 있습니다 (O’Cathain et al., 2007; Guetterman et al., 2023).

 

우리는 HPE 커뮤니티가 MMR 연구의 설계와 출판을 안내하기 위해 보고 지침에서 확인된 원칙들을 채택할 것을 옹호합니다. HPE 저널들은 원고 내 통합 관행의 보고를 강화하기 위해 저자들에게 기존의 지침들을 안내해야 합니다. 우리는 연구에 대한 체크리스트 접근법(checklist approach)을 옹호하는 것이 아닙니다; 오히려 우리는 보고 지침에 명시된 바와 같이 통합 과정에 대한 인식을 높이는 것이 HPE 내 MMR의 질을 높일 것이라고 믿습니다.

 

HPE 내에서 보편적으로 합의된 MMR 보고 지침은 없지만, 우리는 HPE가 무작위 대조 시험(randomized controlled trial)에 대한 분야별 보고 지침을 필요로 하지 않는 것과 마찬가지로, 분야별(field-specific) 지침이 필요하다고 믿지 않습니다. 오히려 HPE는 지침을 위해 다른 분야를 참고할 수 있습니다. 혼합 방법 연구의 올바른 보고(Good Reporting of a Mixed Methods Study, GRAMMS) 도구는 보건 서비스 연구(health services research) 분야의 혼합 방법 연구에 포함되어야 할 6가지 기술 세트를 나열하고 있는데, 예를 들어 “통합이 어디서 발생했는지, 어떻게 발생했는지, 누가 참여했는지 기술하라”와 “방법의 혼합이나 통합으로부터 얻은 통찰을 기술하라” 등이 있습니다 (O’Cathain et al., 2007). GRAMMS는 MMR에서 가장 많이 인용되는 보고 지침입니다.

 

미국심리학회(American Psychological Association)는 혼합 방법 논문 보고 기준(Mixed Methods Article Reporting Standards, MMARS) (Levitt et al., 2018)을 개발하였으며, 이는 혼합 방법 연구의 각 섹션이 기술해야 할 내용을 더 정교하게 상술하고 있습니다. 여기에는 다음이 포함됩니다:

  • 연구 설계(Study Design):
    • “탐구 접근법들이 결합된 방식을 기술하여 목적과 혼합 방법의 근거를 조명하라,” 그리고
    • “질적 및 양적 데이터를 모두 수집해야 할 필요성과 두 데이터베이스의 결과(findings)를 통합하는 것의 부가가치에 대한 근거 또는 정당성을 제공하라.”
  • 데이터 수집(Data Collection):
    • “데이터가 다수의 소스로부터 수집될 때, … 데이터 세트 간의 관계를 명확히 식별하라.”
  • 분석(Analysis):
    • “질적 및 양적 결과가 어떻게 ‘혼합’되거나 통합되었는지 표시하라 (예: 고찰, 결합 디스플레이 표, 그래프, 양적 텍스트·코드·주제를 빈도수나 변수로 변환하는 것과 같이 한 형태의 데이터가 다른 형태로 변환되는 데이터 변환).”

GRAMMS와 MMARS의 현재 버전은 가치 있는 출발점이지만, MMR의 방법론적 발전에 보조를 맞추기 위해 이 지침들의 추가적인 개선이 요구됩니다. 실제로 이 분야는

  • 구체적인 통합 전략 (Greene, 2015; Fetters & Molina-Azorin, 2019; Åkerblad et al., 2021; Onwuegbuzie and Hitchcock, 2022; Pluye et al., 0000; Tunarosa & Glynn, 2017; Younas & Durante, 2023a),
  • 통합 및 메타 추론의 적합성(fit) 평가, 결합 디스플레이(joint displays) (McDonald et al., 2024; Guetterman et al., 2021; Haynes-Brown & Fetters, 2021),
  • 방법론적 품질 및 보고 (Guetterman et al., 2021; Fàbregues et al., 2020), 일반화(generalization), 그리고
  • 교차 문화 MMR(cross-cultural MMR) (Younas & Durante, 2023b) 등의 특정 영역에서 상당히 발전했습니다. 이를 인식하여, GRAMMS를 업데이트하는 과정이 시작되었습니다 (Munce, 2025).

GRAMMS와 MMARS 모두 MMR의 모든 요소와 관련된 포괄적인 지침을 제공합니다. 그 결과, 통합 증거 보고에 대한 권고 사항은 본질적으로 일반적(general)입니다. 특히 설계, 데이터 수집, 분석, 보고 전반에 걸쳐 정렬된 구체적인 통합 절차를 보고하는 것은 HPE MMR 연구의 엄격성(rigor)과 가독성을 향상시킬 수 있습니다. 표 1은 통합 증거의 더 큰 구체성을 위한 잠정적인 권고안을 요약합니다.

결론 (Conclusion) 

보건 전문직 교육에서 혼합 방법 연구의 채택이 증가하고 있는 것은 마주하고 있는 복잡한 문제들을 해결할 수 있는 분석적 접근법에 대한 필요성이 커지고 있음을 시사합니다. MMR의 정의적인 구성 요소는 통합(integration), 즉 메타 추론을 제공하기 위한 이론, 데이터 유형, 분석 방법론의 구조화된 혼합입니다. HPE 연구의 단면에 대한 종합(synthesis)은 명시적인 통합 증거의 부족이나 MMR로 라벨링된 연구들의 빈번한 잘못된 표현을 드러냅니다. 통합은 연구 과정의 각 단계인 연구 설계, 데이터 수집, 분석, 그리고 보고에서 신중하게 고려되고 명시되어야 합니다. 향후의 작업은 통합의 증거를 강조하는 보고 지침에 명시된 원칙들을 채택하도록 HPE 커뮤니티를 참여시켜야 합니다.

 

 

 

 

표 1. 통합 증거의 구체성을 강화하기 위한 권고 사항 
(Table 1. Recommendations to enhance the specificity of evidence of integration)

이 표는 연구의 각 단계(설계, 데이터 수집, 분석, 보고)에서 통합의 증거를 높이기 위한 구체적인 질문 및 조치 사항을 제시하며, 이를 기존의 GRAMMS 지침과 비교하고 있습니다.

1. 설계 (Design) 

  • 통합의 증거 높이기 (Increasing the Evidence of Integration):
    • 왜 MMR이 필요한가? (Why is MMR required?) 다양한 데이터 세트와 분석의 통합이 연구 질문을 해결하는 데 왜 필요한지 개념적 틀(conceptual framework) 안에서 기술하십시오.
    • 필요한 지지 이론(supporting theories) 혹은 경계 설정 이론(delimiting theories)들의 혼합(mixing)이 입증되었습니까? 이론들의 통합이 연구에 어떻게 정보를 제공하는지 이론적 틀(theoretical framework) 안에서 기술하십시오.
  • 현재 GRAMMS 권고 사항:
    • 연구 질문에 혼합 연구 방법 접근법을 사용하는 것에 대한 정당성(justification)을 기술하십시오.

2. 데이터 수집 (Data collection) 

  • 통합의 증거 높이기 (Increasing the Evidence of Integration):
    • 어떤 MMR 설계가 사용되었습니까? 
      • 순차적 탐색 (sequential exploratory)
      • 순차적 설명 (sequential explanatory)
      • 병렬 (parallel)
      • 또는 기타 (other)?
    • 데이터 수집의 순서(sequence), 시기(timing), 그리고 관계(relationship)를 기술하십시오.
    • 설계 도표(design diagram)를 제공하십시오.
  • 현재 GRAMMS 권고 사항:
    • 목적(purpose), 우선순위(priority), 방법의 순서(sequence) 측면에서 설계를 기술하십시오.

3. 분석 (Analysis) 

  • 통합의 증거 높이기 (Increasing the Evidence of Integration):
    • 데이터를 결합(combining)하기 위해 어떤 과정이 사용되었습니까? 하위 분석들(예: 질적 분석과 양적 분석)을 결합하는 과정을 기술하십시오.
      • 서사적 엮기 (Narrative weaving)
      • 데이터 변환 (Data transformation)
      • 결합 디스플레이 (Joint display)
      • 기타 (Other)
  • 현재 GRAMMS 권고 사항:
    • (이미지상 해당 칸은 비어 있거나 병합되어 있으나, 통상적으로 분석 단계의 통합 기술을 요구함)

4. 보고 (Reporting) 

  • 통합의 증거 높이기 (Increasing the Evidence of Integration):
    • 어느 한 데이터셋만으로는 제공할 수 없는 어떤 새로운 메타 추론(meta-inference)이 도출됩니까? 
    • 이 메타 추론은 어떻게 맥락화(contextualized)되고 연구 질문과 관련됩니까? 
    • 연구 질문(들)에 대한 맥락화와 함께 메타 추론(들)을 강조하십시오.
  • 현재 GRAMMS 권고 사항:
    • 통합이 어디서 발생했는지, 어떻게 발생했는지, 누가 참여했는지 기술하십시오.
    • 방법을 혼합하거나 통합함으로써 얻은 통찰(insights)을 기술하십시오.

 

 

 

Clin Teach. 2025 Dec;22(6):e70211. doi: 10.1111/tct.70211.

How to Engage With Longitudinal Qualitative Research (LQR) in Health Professions Education Research 

 

 

시간이 흐르면 무엇이 변할까? 🕰️ 보건의료교육 연구에서 LQR 활용하기

안녕하세요! 오늘은 보건의료전문직교육(Health Professions Education, HPE) 연구자라면 주목해야 할 흥미로운 방법론을 소개해 드리려고 해요. 우리가 보통 수행하는 연구들은 특정 시점의 단면을 잘라낸 '스냅샷'일 때가 많죠. 하지만 사람은, 그리고 교육은 시간의 흐름에 따라 계속 변하잖아요? 이 '변화'와 '시간' 자체를 연구의 중심으로 가져오는 방법, 바로 종단적 질적 연구(Longitudinal Qualitative Research, LQR)입니다.


1. LQR이 도대체 뭔가요? 🤔

기존의 횡단적 연구(Cross-sectional research)가 멈춰있는 한 순간을 깊게 파고든다면, LQR은 연구 참여자와 긴 시간 동안 반복적으로 만나며 그들의 여정을 함께하는 연구입니다.

연구진은 LQR을 이렇게 정의해요.

"LQR은 역동적인 HPE 환경을 진정성 있게 탐구하기 위해 시간의 흐름에 따른 참여자의 경험에 초점을 맞춥니다."
[LQR focuses on participants' experience through time to authentically explore the dynamic HPE environment.]

 

단순히 시간을 '두고(over time)' 보는 게 아니라, 시간의 흐름을 '통해(through time)' 경험이 어떻게 흘러가는지를 본다는 게 핵심이죠!

2. 왜 굳이 '긴 시간'을 들여 연구해야 할까요?

학생이 의사가 되어가는 과정, 리더십이 형성되는 과정, 새로운 교육 프로그램에 적응하는 과정... 이런 건 한 번의 인터뷰로는 다 알 수가 없어요. 우리의 생각은 어제 다르고 오늘 다르니까요. 연구진은 이 변화의 유동성을 강조합니다.

"변화에 대한 우리의 경험은 정적이지 않습니다—성찰과 시간의 경과에 따라 우리의 생각과 행동은 변화합니다."
[Our experiences of change are not static—with reflection and time passed, our thoughts and actions change.]

 

LQR을 하면 참여자의 전문직 정체성(Professional Identity)이 어떻게 형성되는지, 혹은 개입(Intervention)에 대한 반응이 처음 거부감에서 어떻게 수용으로 바뀌는지 그 미묘한 패턴을 포착할 수 있습니다.

3. 어떻게 연구하나요? (LQR의 도구들 🛠️)

이 논문에서는 Table 1을 통해 몇 가지 유용한 방법들을 소개하고 있어요.

  • 종단적 인터뷰 (Longitudinal Interviews): 일정한 간격을 두고 같은 사람을 여러 번 인터뷰합니다.
  • 음성 일기 (Audio-diaries): 참여자가 자신의 경험을 그때그때 녹음해서 보냅니다. (가장 생생한 날것의 데이터를 얻을 수 있어요!)
  • 펜 포트레이트 (Pen Portraits): 여러 데이터를 통합해서 참여자의 이야기를 그려내는 방식입니다.
  • 비디오 성찰적 문화기술지 (Video Reflexive Ethnography): 실제 현장을 영상으로 찍고, 나중에 연구자와 참여자가 같이 보며 토론합니다.

4. 성공적인 LQR을 위한 핵심 꿀팁! 💡

긴 시간 연구를 끌고 가려면 무엇이 가장 중요할까요? 연구진은 단연코 '관계(Relationship)'를 꼽습니다.

"LQR의 성공에 있어 핵심은 연구자와 참여자 간의 신뢰 관계를 형성하는 것입니다."
[Central to the success of LQR is the development of a trusting relationship between researchers and participants.]

 

연구자가 참여자의 인생 한 챕터를 함께 읽어가는 특권(Privilege)을 누리는 만큼, 그들의 이야기를 소중히 여기고 라포(Rapport)를 쌓는 게 중요해요.

 

⚠️ 주의할 점 (Key Considerations)

  • 참여자 이탈 방지 (Participant Retention): 시간이 길어지면 참여자가 지쳐서 그만둘 수 있어요. 음성 일기에 꼬박꼬박 코멘트를 달아주는 등 "당신의 이야기를 잘 듣고 있어요"라는 신호를 계속 보내야 합니다.
  • 윤리적 고려 (Ethical Considerations): 관계가 깊어질수록 사적인 이야기가 많이 나옵니다. 고지된 동의(Informed Consent)를 지속적으로 확인하고 기밀 유지에 각별히 신경 써야 해요.
  • 시간의 개념화 (Conceptualising Time): 단순히 달력상의 시간만 볼 건지, 발달 단계로서의 시간을 볼 건지 연구 설계 때부터 고민해야 합니다.

5. 마무리하며

LQR은 연구자에게 많은 자원과 노력을 요구하지만, 그만큼 다른 방법으로는 볼 수 없는 깊이 있는 통찰을 줍니다. 마지막으로 연구진의 결론을 인용하며 마칠게요. 보건의료교육의 복잡한 풍경을 시간의 흐름 속에서 그려보고 싶은 연구자분들, LQR에 도전해보시는 건 어떨까요? 🙌

"LQR은 보건의료전문직교육 환경의 복잡성을 연구하는 데 있어 보다 미묘하고, 시간적으로 정보를 갖춘 접근 방식을 위한 잠재력을 가지고 있습니다."
[LQR has the potential for a more nuanced, temporally informed approach to researching the complexities of the health professions education landscape.]


1 Introduction (서론) 

보건의료전문직교육 연구(Health Professions Education Research)가 확립된 학문 분야로 발전함에 따라, 우리의 방법론(methodologies)과 방법론에 대한 논의는 그 어느 때보다 정교해지고 있습니다. 우리 학문 분야는 보건의료전문직교육(Health Professions Education, HPE)이 연결된 양상들의 복잡한 집합체임을 점점 더 인식하고 있으며, HPE 연구는 개인, 팀, 맥락, 시스템 간의 다중적이고 역동적이며 변화 가능한 연결성을 탐구함으로써 미래 의료 제공자 교육의 기저에 깔린 복잡성을 풀어내는 경우가 많습니다 [1]. 종단적 질적 연구(Longitudinal Qualitative Research, LQR; 문헌에 따라 QLR로 지칭되기도 함)를 다루는 '방법론 3부작 시리즈(How To Triptych Series)' [2]의 첫 번째 논문인 본고에서는, 변화를 연구 접근 방식의 중심에 두는 방법론으로서 LQR을 소개합니다. 구체적으로, LQR은 역동적인 HPE 환경을 진정성 있게 탐구하기 위해 시간의 흐름에 따른 참여자의 경험(participants' experience through time)에 초점을 맞춥니다 [1, 3-5]. 이 논문은 독자들이 보건의료전문직 연구에서 LQR 접근법을 이해하고, 선택하며, 실행하는 것을 돕는 것을 목표로 합니다. 이 3부작의 두 번째 파트 [6]는 HPE에서 LQR을 사용한 실제 사례를 제공하며, 마지막으로 세 번째 파트 [7]는 방법론으로서 LQR을 사용함으로써 얻을 수 있는 고유한 가능성 중 일부를 깊이 있게 파헤칩니다.

LQR은 역동적인 HPE 환경을 진정성 있게 탐구하기 위해 시간의 흐름에 따른 참여자의 경험에 초점을 맞춥니다.

 

이 방법론을 처음 접하는 연구자들을 위한 입문서로서, 우리는 LQR이 무엇인지, 연구자가 자신의 연구 질문(research questions)을 해결하기 위한 방법론으로 왜 LQR을 선택해야 하는지를 실용적으로 살펴보고, LQR에 참여하는 방법과 방법론의 주요 고려 사항을 설명하며, 마지막으로 LQR 방법론이 HPE 및 보건 서비스 연구(health services research)에 적용되었을 때 사용된 방법의 예를 기술합니다. 이것은 간략한 입문 논문으로서 포괄적인 자료로 간주되어서는 안 되며, 방법론으로서의 LQR에 '발을 담그는(dip a toe in the water)' 유용한 방법으로 보아야 합니다. 만약 LQR에 대한 우리의 소개가 반향을 일으킨다면, 우리는 본문 전반에 걸쳐 더 깊이 탐구할 수 있는 여러 리소스와 사례를 안내하고 인용하였습니다. 여기에는 HPE 연구에서 LQR을 사용하는 실제 사례를 고려한 이 'How to... 3부작 시리즈'의 두 번째 및 세 번째 파트 [ref]와 LQR이 제공하는 고유한 가능성에 대한 심층적인 고찰 [ref]이 포함됩니다.

2 What Is Longitudinal Qualitative Research? (종단적 질적 연구란 무엇인가?) 

보건 서비스 및 HPE 연구에서 점점 인기를 얻고 있는 접근법인 LQR 방법론(LQR methodology)일정 기간 동안 동일한 참여자 그룹과 반복적인 관여(repeated engagement)를 가지며 질적 데이터를 순차적으로 수집 및 분석(sequential collection and analysis)하는 방법을 사용합니다. 이러한 종단적 접근(longitudinal approach)은 보다 일반적인 횡단적 질적 연구 설계(cross-sectional qualitative research designs)와는 다릅니다. 횡단적 질적 연구 방법론은 종종 인터뷰, 포커스 그룹 또는 관찰과 같은 방법을 통해 단일 시점에서 심층 데이터(in-depth data)를 수집하여 풍부한 맥락적 및 해석적 통찰을 산출합니다. 그러나 횡단적 접근법은 가장 전형적으로 정적이며, 참여자의 시간과 변화에 대한 경험을 맥락화하는 데 어려움을 겪는 경우가 많습니다. 인간은 시간적 존재(temporal beings)임에도 불구하고, 특히 시간은 HPE 연구에서 좀처럼 초점이 되지 않습니다 [4]. 그러나 점점 더 많은 HPE 연구자들이 연구 과정에 시간의 흐름과 시간에 걸친 변화에 대한 추가적인 고려를 가져옴으로써 스스로를 차별화하는 LQR 방법론을 사용하고 있습니다 [4, 5, 8, 9]. 해석주의적 전통(interpretivist traditions)에 기반을 둔 LQR 연구자들은 시간을 고정적이고 객관적이며 선형적인 것(즉, 시간에 '걸쳐(over)' 생각하는 것)으로 보는 것과 대조적으로, 유동적이고 주관적이며 역동적인 것(즉, 시간의 흐름을 '통해(through)' 경험을 연구하는 것)으로 취급할 것입니다 [5].

LQR 연구자들은 시간을 유동적이고, 주관적이며, 역동적인 것으로 취급할 것입니다 (즉, 시간의 흐름을 '통해' 경험을 연구함).

 

더 확장하자면, 우리는 삶을 연결되지 않은 순간들의 연속인 횡단적인 것으로 경험하지 않습니다. 오히려 우리는 과거, 현재, 미래의 가능성이 우리가 세상을 해석하고 관여하는 방식을 형성하는 연속적인 서사(continuous narrative) 속을 살아갑니다. LQR 방법론은 시간의 흐름에 따른 개인이나 집단의 경험을 탐구하는 방법을 제공함으로써 이러한 현실을 반영하고, 변화에 대한 풍부한 통찰력을 제공합니다. 선택한 방법에 따라, 이러한 시간의 흐름에 따른 변화는 즉각적인 순간(in-the-moment)(예: 일기를 통해)에 탐구되거나 성찰(reflected upon)(예: 반복적인 참여자 인터뷰를 통해)될 수 있습니다 [4, 5, 8]. Rees와 Ottrey는 LQR에서 시간이 어떻게 다루어질 수 있는지를 다음과 같이 이론화합니다:

  • 관심 현상(phenomenon of interest)(예: 변화 또는 전환 연구),
  • 맥락(context)(예: 시간에 걸쳐 발생하는 경험), 또는
  • 결과를 이해하는 수단(means of understanding outcomes)(예: 변화의 기제 식별) [5].

LQR은 변화에 대한 우리의 경험이 정적이지 않다는 것을 인정합니다—성찰과 시간의 경과에 따라 우리의 생각과 행동은 변화하고, 기억을 통해 여과되며, 재해석(reinterpreted)되고 재맥락화(recontextualised)됩니다 [10]. 이러한 유동성과 진화는 참여자와의 반복적인 관여를 수반하는 방법을 통해 탐구될 수 있으며, 주제나 현상에 대한 역동적인 관점을 제공합니다. LQR은 복잡한 현상(예: 전환(transitions), 정체성 발달(identity development), 리더십 과정(leadership processes))이 변화함에 따라 이를 탐구할 수 있게 해줍니다 [3]. 그 차이를 명확히 하기 위해 다음의 예를 고려해 보십시오:

  • 횡단적 인터뷰 의대생들이 특정 순환 실습(rotation) 동안 팀워크를 어떻게 인식하는지 드러낼 수 있지만, 훈련 과정을 거치면서 이러한 인식이 어떻게 변할 수 있는지는 추적할 수 없습니다. 대조적으로,
  • LQR은 역동적인 관점을 제공하여 개인이나 그룹의 진화하는 서사를 포착합니다. 연구자들은 LQR을 사용하여 동일한 학생들이 다른 순환 실습을 경험하고, 도전에 직면하며, 자신의 성장을 성찰함에 따라 팀워크에 대한 인식이 어떻게 변화하는지 탐구할 수 있습니다.

변화에 대한 우리의 경험은 정적이지 않습니다—성찰과 시간의 경과에 따라 우리의 생각과 행동은 변화합니다.

 

시간과 변화를 핵심 원칙으로 삼는 LQR은 참여자와의 장기적인 관여를 수반하는 다른 질적 방법론들과 구별됩니다. 예를 들어,

  • 문화기술지(Ethnography)는 특정 시점이나 정해진 기간 동안 문화 집단과 그들의 관행에 대한 상세한 기술(description)을 제공하는 데 중점을 둡니다; 반면, LQR은 본질적으로 개인, 집단 또는 현상이 시간이 지남에 따라 어떻게 진화하는지에 초점을 맞춥니다.
  • 마찬가지로, 실행 연구(Action Research)는 변화를 구현하고 관찰하기 위해 참여자와 협력하는 것을 포함하지만, 일반적으로 더 미묘하고 장기적인 변화의 궤적을 추적하기보다는 개입(interventions)의 즉각적인 영향과 실질적인 적용을 우선시합니다. LQR의 강점은 체화된 경험(lived experiences)의 복잡성과 유동성을 포착하는 능력에 있으며, 이는 다른 질적 방법론에서는 덜 중심적인 시간적 깊이(temporal depth)와 통찰력을 제공합니다.
  • 변화를 이해하는 렌즈로서 시간에 대한 이러한 독특한 초점은, 변화하는 맥락과 상황에 대응하여 과정들이 어떻게 전개되고 적응하는지에 대한 풍부하고 층위가 있는(layered) 이해를 제공할 수 있게 합니다.

3 Why Engage With Longitudinal Qualitative Research? (왜 종단적 질적 연구에 관여하는가?) 

횡단적 접근법에서는 놓치는 경험에 대한 풍부한 통찰력을 제공하는 것 외에도, LQR은 우리가 인간 경험의 복잡성에 의미 있게 관여하도록 돕습니다. 종단적 접근법은 우리가 시간의 흐름에 따라 참여자들과 더 가까이 동행함에 따라 그들의 경험에서 나타나는 미묘한 변화(subtle changes)와 뉘앙스(nuances)에 우리를 적응시킬 수 있습니다 [11, 12].

  • 예를 들어, Brown 등 [13]과 Gordon 등 [14]은 의대생과 전공의(resident doctors)의 발달 과정에서 시간의 흐름에 따른 변화의 중요한 역할을 강조했습니다. Brown 등은 장기 통합 임상 실습(longitudinal integrated clerkships)이 지속적인 관계, 누적된 경험, 성찰적 학습을 통해 어떻게 전문직 정체성(professional identities)의 점진적인 형성을 가능하게 했는지 보여주었습니다.
  • Gordon 등은 전공의에서 전문의(fully trained doctor)로의 복잡하고 다차원적인 전환을 탐구했습니다. 시간의 흐름에 따라 참여자를 추적한 결과, 전문직으로서의 성장이 역동적이고 진화하는 과정을 통해 어떻게 발생하는지 보여주었습니다. 이 두 연구 모두 시간의 흐름에 따른 이러한 변화를 이해하기 위해 LQR 방법론을 사용하는 것이 결정적이었음을 강조하며, 저자들이 보건의료전문직 교육 및 실무에서의 적응(adaptation)을 위한 제언을 할 수 있게 해주었습니다 [12].

종단적 연구자들은 참여자의 여정을 따라가며 그들의 성장, 도전, 변화를 목격하면서 시간이 지남에 따라 이러한 이야기들에 깊은 연결감을 형성합니다. 이러한 지속적인 관여(sustained engagement)는 연구자가 신뢰를 쌓고, 더 풍부한 통찰력을 얻으며, 개인이 실제 맥락(real-world context) 속에서 어떻게 살아가고 움직이는지에 대한 보다 완전한 이해를 개발할 수 있게 합니다 [15]. 우리는 이 3부작 시리즈의 세 번째 파트 [7]에서 LQR의 고유한 가능성 중 일부를 더 깊이 논의합니다.

 

집단이나 커뮤니티 수준에서, LQR은 예를 들어 건강이나 교육을 목표로 하는 개입(interventions)에 대한 반응과 같은 행동 패턴(patterns of behaviour)에 대한 풍부한 이해를 산출할 수 있습니다 [16]. 단일 시점의 스냅샷을 제공하는 횡단적 연구와 달리, LQR은 장기간에 걸친 변화와 발전을 추적하는 것을 가능하게 합니다. 이러한 시간적 깊이(temporal depth)는 연구자가 개입의 즉각적인 효과뿐만 아니라 그것이 사회적, 문화적, 맥락적 역동성과 상호작용하면서 그 영향이 어떻게 진화하는지 식별할 수 있게 해줍니다. 예를 들어, HPE 이니셔티브에 대한 초기 저항이 어떻게 점차 수용으로 바뀔 수 있는지 밝혀내거나, 성공을 저해하는 반복적인 장벽을 강조할 수 있습니다. 개입 실행의 다양한 단계에서 이러한 패턴을 식별함으로써, 지속적인 문제를 해결하기 위한 표적화된 조정(targeted adjustments)과 더 미묘한 전략이 가능해질 수 있습니다 [16]. 이러한 방식으로, LQR이 낳을 수 있는 깊은 이해의 결과로서, LQR 프로젝트가 정책과 실무(policy and practice)에 영향을 미칠 수 있는 기회가 존재합니다 [16].

 

4 How to Engage With LQR—Some Key Considerations and Choosing the Right Method (LQR에 관여하는 방법—몇 가지 주요 고려 사항 및 올바른 방법 선택) 

LQR의 성공에 있어 핵심은 연구자와 참여자 간의 신뢰 관계(trusting relationship)를 형성하는 것입니다 [17]. 모든 연구 당사자 간의 신뢰(trust), 라포(rapport), 공감(empathy)은 공유에 대한 개방성을 촉진할 수 있습니다 [3]. 이는 참여자의 체화된 경험(lived experiences), 시간적 경험(temporal experiences), 그리고 변화의 경험에 대한 깊은 공통의 이해와 학습으로 이어질 수 있습니다 [18]. 예를 들어,

  • LQR에서 관여의 반복적이고 순환적인 성격은 연구자와 참여자 모두가 데이터 수집 과정 초기의 첫인상과 이해를 다시 방문하고, 관계적 성찰성(relational reflexivity)의 과정을 통해 시간이 지남에 따라 해석을 다듬고 심화시킬 수 있음을 의미합니다 [18, 19]. 여러 차례의 연구 만남(encounters) 동안 경험을 사려 깊게 탐구하는 것은 연구자와 참여자로 하여금 이전에는 어느 쪽도 이용할 수 없었던 관점을 재고하고 개발하게 할 수 있습니다 [20].

연구자가 참여자에 대한 사전 지식이 거의 없거나 전혀 없는 상태에서 연구 인터뷰에 들어가는 횡단적 연구(cross-sectional work)와 달리, LQR에서 연구자는 참여자와 종단적 관계(longitudinal relationship)를 갖게 됩니다. 연구자는 이전의 상호작용에 대한 메모, 생각, 성찰을 준비했을 수 있으며, 따라서 현재까지의 참여자 경험에 대한 자신의 관점을 가지고 연구 만남에 들어갑니다. 연구 참여자와 종단적 관계를 발전시키는 것은 더 풍부한 데이터로 이어질 수 있으며, 많은 연구자들은 참여자와의 향상된 라포를 LQR의 독특하게 보람 있는 요소로 꼽습니다(비록 종단적 관계를 구축하고 유지하는 것이 도전이 없는 것은 아니지만) [21]. 참여자의 이야기에 대해 신뢰를 받는 것은 특권(privilege)이며, 시간의 흐름을 통해 반복적으로 연결됨으로써 참여자와 연구자는 서로에게서 배우고 상호 성장할 기회를 얻게 됩니다 [6, 16]. 연구 참여자와의 종단적 관여를 유지하려면 참여를 유지하고, 신뢰를 쌓으며, 시간이 지남에 따른 참여자 이탈(participant attrition)을 방지하기 위한 도전을 해결하는 데 추가적인 노력이 필요합니다. 정기적인 연구자-참여자 접촉과 그들의 이야기에 대한 관여, 예를 들어 음성 일기(audio-diary) 항목이 들어올 때마다 이를 확인하고 코멘트를 남기는 것은 우리가 연구에서 참여 유지를 지원했던 한 가지 방법입니다—즉, 참여자들은 우리가 이러한 접근 방식을 사용했을 때 자신의 이야기를 경청하고 있다고 느꼈다고 보고합니다 [14].

 

고품질의 LQR 연구를 수행하는 데 있어 핵심

  • 참여자와의 일관되고 개방적인 의사소통,
  • 유연하면서도 체계적인 데이터 수집 및 분석 방법, 그리고
  • 발견에 대한 시간과 연구자 관점의 영향에 대해 성찰적(reflexive) 태도를 유지하면서 진화하는 관점을 포착하기 위한 철저한 기록(documentation)입니다.

LQR 내에는 수많은 방법이 사용됩니다. 때로는 동일한 연구 내에서 데이터 수집 및 분석의 여러 방법을 사용할 수 있습니다. 예를 들어, Finn과 동료들은 횡단적 인터뷰 연구와 종단적 일기(longitudinal diaries)를 결합했습니다 [22]. Table 1은 HPE 내에서 인기 있는 LQR 방법의 몇 가지 예(종단적 인터뷰, 펜 포트레이트, 음성 일기, 비디오 성찰적 문화기술지)를 기술합니다. 이 표를 개발하기 위해 우리는 ‘LQR’ 또는 ‘QLR’ 및 ‘HPE’라는 검색어를 사용하여 논문의 방법론 섹션을 읽었습니다. 또한, 논의와 합의를 통해 우리 자신의 연구와 일부 HPE 동료들의 연구 사례를 사용하여 이러한 권장 사항을 뒷받침했습니다. 각 방법에는 요약, 방법론적 정보에 대한 인용, 그리고 해당 방법이 보건 서비스 또는 HPE 연구 내에서 활용된 사례 연구가 포함되어 있습니다. 이 목록은 포괄적인 것으로 간주되어서는 안 되지만, LQR을 사용할 때 이용 가능한 방법의 범위를 보여주는 다양한 예를 제공한다고 생각합니다. 데이터 수집 및 분석에 가장 적합한 방법을 선택할 때 고려해야 할 몇 가지 실용적인 사항이 있으며, 이는 Box 1에 명시되어 있습니다.

TABLE 1. Examples of longitudinal qualitative research methods (표 1. 종단적 질적 연구 방법의 예) 

연구 방법 (Research method) 요약 (Summary) 방법론 인용 (Methods citations) 사례 연구 (Example studies)
종단적 인터뷰 (Longitudinal interviews) 참여자와 동일한 연구팀에 의해 일정한 시간 간격을 두고 반복되는 심층 인터뷰(In-depth interviews). Hermanowicz, 2013 [23]

Carduff et al., 2015 [10]

Calman et al., 2013 [9]
Avonts et al., 2023 [24]

Balmer et al., 2021 [25]
펜 포트레이트 (Pen portraits) 펜 포트레이트 분석 과정은 시간이 지남에 따라 수집된 여러 질적 방법을 효과적으로 통합하기 위해 개발되었습니다. 펜 포트레이트는 적응 가능하고 유연하도록 의도되었습니다. Sheard and Marsh, 2019 [26] Baxter et al., 2020 [27]

Sheard et al., 2017 [28]

Blair et al., 2023 [29]
종단적 음성 일기 (Longitudinal Audio-diaries, LAD) LAD는 사회과학에서 질적 종단 접근법을 대표하며, 연구자가 장기간에 걸쳐 특정 맥락 내에서 전개되는 참여자의 체화된 경험(lived experiences)을 탐구할 수 있게 합니다. 종종 인터뷰로 시작과 끝을 맺는(bookended) 형식을 취합니다. Verma., 2021 [30]

Crozier and Cassel., 2016 [31]
Ottrey et al., 2025 [32]

Finn et al., 2022 [33]

Collett et al., 2017 [34]

Stephens et al., 2023 [35]

Gordon et al., 2020 [36]
비디오 성찰적 문화기술지 (Video reflexive ethnography) 비디오 성찰적 문화기술지(VRE)는 실시간 업무 및 교육 관행을 기록, 설명 및 향상하는 것을 목표로 하는 시각적 연구의 협력적 방법입니다.

일반적으로 VRE는 세 가지 주요 단계를 포함합니다: (a) 현장 관찰을 통해 관행에 익숙해지기; (b) 관행을 비디오로 녹화하기; (c) 편집된 영상을 가지고 참여자와 연구자가 함께 성찰적 토론(reflexive discussions)에 참여하기.
Ajjawi et al., 2020 [37]

Idema et al., 2018 [38]
Gordon et al., 2017 [39]

McHugh et al., 2020 [40]

Box 1. Considerations when Designing a Longitudinal Qualitative Research Study (박스 1. 종단적 질적 연구 설계 시 고려 사항) 

  • 연구 목표 및 질문 (Aims and research questions): 선택한 방법은 시간의 흐름에 따른 체화된 경험 탐구에 초점을 맞춘 연구 목표를 직접적으로 뒷받침해야 합니다. 반복적인 관여가 탐구 중인 현상에 대한 공유된 이해를 어떻게 다듬고 심화시킬 수 있을지 고려하십시오.
  • 시간의 개념화 및 관리 (Conceptualising and managing time):
    • 종단적 연구는 몇 주에서 수년에 걸쳐 진행되므로, 가용한 시간 프레임 내에서 실행 가능하고 지속 가능한 방법을 선택하십시오.
    • LQR은 시간의 흐름에 따른 관여에 기반하므로 연구 기간과 시간을 어떻게 개념화할 것인지(예: 연대기적(chronological), 발달적(developmental) 또는 경험적(experiential))를 모두 고려하는 것이 중요합니다.
    • 실질적으로 이는 자금, 자원 및 참여자 관여의 지속성을 고려하는 것도 포함합니다. 시간이 연구 참여자와 조사 중인 현상 모두에 어떤 영향을 미칠지 고려하십시오. 여기에는 연구 맥락에 영향을 줄 수 있는 사회적, 문화적, 기술적 변화를 염두에 두는 것이 포함됩니다. 연구에서 시간을 어떻게 개념화할지 결정하는 것은 핵심 고려 사항입니다 [8, 41].
  • 윤리적 고려 사항 (Ethical considerations):
    • 모든 연구는 신중한 계획이 필요하지만 [42], LQR은 시간이 지남에 따라 고지된 동의(informed consent)를 유지하고 참여자와의 관계가 깊어짐에 따라 사생활과 기밀을 관리하는 것과 같은 독특한 윤리적 도전을 제기합니다. 지속적인 관계는 상호작용이 깊어짐에 따라 신뢰, 고지된 동의, 기밀성에 대한 세심한 주의를 요합니다.
    • 윤리적 실천에는 참여자의 기여에 반응하고(예: 음성 일기에 대한 인정), 진화하는 개인적 서사에 접근하는 특권을 소중히 여기는 것도 포함됩니다. 참여자와의 지속적인 접촉과 음성 일기나 비디오와 같은 데이터가 참여자와 연구자 간에 어떻게 전송될지는 신중한 고려가 필요합니다—예를 들어, 파일 암호화가 필요할 수 있습니다 [22].
  • 참여자 유지 (Participant retention):
    • 종단적 연구는 시간이 지남에 따라 동일한 사람들을 추적하는 데 의존하므로, 참여자 관여를 유지하고 중도 탈락을 최소화하는 전략이 매우 중요합니다. 참여자 유지는 지속적인 라포, 상호 존중, 참여자의 이야기에 대한 의미 있는 관여를 기반으로 합니다. 일기에 코멘트를 달거나 인터뷰 전에 성찰 내용을 준비하는 것과 같은 전략은 참여자들에게 그들의 이야기가 경청되고 있고 소중히 여겨지고 있음을 보여줍니다.
  • 자원 및 예산 (Resources and budgets):
    • 연구 기간 동안 사용할 수 있는 재정적, 인적, 기술적 자원을 평가하십시오. 종단적 연구는 횡단적 연구보다 더 많은 자원이 소요될 수 있으므로 신중한 계획이 필요합니다. 시간의 흐름에 따른 관계적이고 반복적인 관여는 적절한 계획과 자원 배분을 필요로 합니다. 여기에는 반복적인 접촉, 분석적 성찰 및 적응을 위한 시간이 포함됩니다. 연구자-참여자 관계를 유지하고 복잡한 데이터 세트를 관리하는 것은 자원 집약적일 수 있습니다.
  • 데이터 수집 방법 (Data collection methods):
    • 종단적 인터뷰, 음성 일기 또는 펜 포트레이트와 같이 반복적이고 진화하는 관여를 지원하는 데이터 수집 방법을 선택하십시오. 이러한 도구는 참여자와 연구자 모두가 이해를 다시 방문하고 다듬을 수 있게 하며, 만남 전반에 걸쳐 서사적 연속성(narrative continuity)을 지원합니다. 가장 적합한 데이터 수집 방법은 연구 기간 내내 실용적이고 관련성을 유지할 것입니다 [9, 16]. 데이터 수집의 용이성은 LQR 연구의 참여자 이탈에 있어 중요한 요소입니다 [33].
  • 장기적 관여를 위한 표본 추출 (Sampling for long-term engagement):
    • 표본 추출 접근법(Sampling approaches)은 연구의 전체 기간을 감당할 수 있는 참여자를 어떻게 선정하고 유지할지 고려하여 장기적인 참여를 감안해야 합니다. 표본 추출 전략은 여러 데이터 수집 지점에 걸쳐 신뢰 구축과 재관여(re-engagement)를 허용해야 합니다. 잠재적인 참여자 이탈과 이를 어떻게 해결할지 계획하십시오; 데이터 수집에 대한 연구 접근 방식에 유연성을 갖는 것(예: 음성 일기 대신 서면 일기나 전화 인터뷰 제공)은 이탈을 방지하고 유지율을 높일 수 있습니다 [42].
  • 종단적 데이터 분석 (Longitudinal data analysis):
    • 지속적인 재해석, 복잡한 서사의 궤적, 시간의 흐름에 따른 모순을 수용하는 분석 접근법을 계획하십시오. 새로운 데이터가 등장함에 따라 해석을 다듬을 준비를 하고 연구자의 관점이 어떻게 진화하는지에 대한 명확한 기록을 유지하십시오. 데이터 수집 및 분석 전반에 걸쳐 성찰성(reflexivity)을 고려하도록 하십시오 [20, 43].
  • 유연성과 반응성 (Flexibility and responsiveness):
    • LQR은 방법론적 유연성(methodological flexibility)을 필요로 합니다. 방법을 조정하고, 참여자의 변화하는 요구에 반응하며, 변화하는 이해를 탐색할 준비를 하십시오—이 모든 과정에서 연구 설계의 무결성과 일관성을 유지해야 합니다 [42].

현재 LQR이 다른 질적 방법론을 통한 종단적 데이터 수집을 사용하는 것과 비교하여 별개의 방법론으로서 어느 정도까지 적용되고 있는지를 보여주는 연구는 없습니다 [41]. 연구에서의 LQR 사용에 대한 체계적 문헌고찰(systematic review)에 따르면, 연구의 절반이 LQR을 사용한다고 주장했지만, LQR 지침이나 방법을 사용한 연구는 20% 미만이었습니다 [41]. 이는 많은 연구가 시간의 흐름에 따라 데이터를 수집했지만 LQR을 별개의 접근법으로 완전히 따르지는 않았음을 의미합니다. 이는 HPE 연구에서 LQR이 어떻게 사용되고 보고되는지에 대해 더 명확한 정의와 더 나은 일관성(consistency)을 확보할 필요성을 강조합니다.

 

종단적 데이터 세트의 데이터 분석은 복잡합니다. Vogl 등은 연구자들이 방법론적 엄격성(methodological rigour)과 명확성을 유지하면서, 신중한 계획, 구조화된 프레임워크, 그리고 새롭게 떠오르는 복잡성에 대응할 수 있는 유연성을 가지고 분석에 접근해야 한다고 주장합니다. 그들은 주요 도전 과제로서 다음을 주장합니다:

  • 관리하고 해석하기 어려운 방대하고 복잡한 데이터 세트;
  • 시간의 흐름에 따른 개인 및 관계 서사의 변화를 추적할 필요성;
  • 참여자 간의 모순된 진술(contradictory accounts)(이는 신중한 비교와 해석을 요구함);
  • 새로운 데이터가 이전의 이해를 변화시킬 수 있기 때문에 발생하는 분석적 종결(analytical closure)의 부재;
  • 높은 자원 요구; 그리고
  • 시간이 지남에 따른 분석적 초점과 신뢰성 유지 [44].

또한 LQR은 기존의 종단적 데이터 세트에 대한 2차 분석(secondary analysis)에도 적합합니다; 수집된 방대한 양의 풍부한 데이터와 시간의 흐름에 따른 변화에 대한 초점은 연구자들이 데이터 세트를 재검토하여 역동적인 과정과 진화하는 현상에 대한 새로운 통찰력을 밝혀내기 위해 다른 질문을 던질 수 있게 해줍니다 [36]. 참여자의 말이나 경험을 시로 변환하는 시적 탐구(poetic inquiry)와 같은 창의적인 분석 방법이나 만화책 개발 등은 시간의 흐름에 따른 인간 경험의 역동적인 본질을 검토하는 창의적인 렌즈를 제공하므로 고려할 가치가 있습니다 [45, 46].

5 Conclusion (결론) 

요약하자면, LQR은 HPE 연구자들의 방법론 도구 상자(methodology toolkit)에 있는 유용한 도구입니다. 시간의 차원을 강조함으로써, LQR은 연구자가 참여자의 진화하는 서사와 경험을 포착할 수 있게 하여 횡단적 연구의 한계를 뛰어넘는 통찰력을 제공합니다. 이러한 연구 접근 방식은 인간 경험의 연속적인 본질과 일치할 뿐만 아니라, HPE 내에서의 변화, 정체성 및 전환(transitions)에 대한 미묘한 이해를 촉진합니다.

 

우리는 LQR에서 신뢰와 라포(rapport)를 구축하는 것의 중요성을 강조하며, 이러한 요소들이 어떻게 연구자와 참여자 모두에게 있어 시간의 흐름에 따른 참여자의 경험에 대한 더 깊고 의미 있는 통찰력에 기여하는지 강조합니다. 또한, 방법론적 선택에 있어 LQR의 유연성과 창의적 탐구(creative inquiry) 또는 2차 분석에 대한 수용력은 다양한 연구 목표에 대한 적응성을 두드러지게 합니다.

 

나아가, 논의된 윤리적 고려 사항(ethical considerations), 참여자 유지 전략 및 분석적 도전 과제들은 LQR을 사용하고자 하는 미래의 연구자들에게 필수적인 지침이 됩니다. 이러한 측면들을 다룸으로써, 우리 논문은 HPE 연구의 방법론적 담론에 기여를 제공합니다.

 

미래를 내다볼 때, LQR 연구는 HPE의 정책과 실무(policy and practice)에 정보를 제공할 상당한 잠재력을 가지고 있습니다. LQR은 보건 전문직의 교육 전략 및 개입의 향상에 기여할 약속을 담고 있습니다. 결과적으로, HPE 연구에서 LQR에 대한 추가적인 탐구는 유익할 뿐만 아니라 보건 의료 전문가들의 교육 여정에 대한 우리의 이해와 지원을 진전시키기 위해 필요합니다.

 

결론적으로, 이 논문은 HPE 내에서 LQR의 풍부한 잠재력을 명료하게 설명하며 연구자들을 위한 입문 가이드 역할을 합니다. 이는 LQR 연구를 설계하고 실행하는 데 있어 중요한 고려 사항들을 강조합니다. LQR은 보건의료전문직교육 환경의 복잡성을 연구하는 데 있어 보다 미묘하고, 시간적으로 정보를 갖춘(temporally informed) 접근 방식을 위한 잠재력을 가지고 있습니다.

 

 

“Being Really Confidently Wrong”: Qualitative Researchers’ Experiences of Methodologically Incongruent Peer Review Feedback 

Victoria Clarke , Virginia Braun, Jeffery Adams, Jane E. M. Callaghan, Andrea LaMarre, Joanna Semlyen

 

Clarke, V., Braun, V., Adams, J., Callaghan, J. E. M., LaMarre, A., & Semlyen, J. (2025). “Being really confidently wrong”: Qualitative researchers’ experiences of methodologically incongruent peer review feedback.Qualitative Psychology, 12(1), 7–24. https://doi.org/10.1037/qup0000322

 

 

"리뷰어님, 정말 자신 있게 틀리셨네요?" 🤦‍♀️ 질적 연구자를 괴롭히는 황당한 동료 심사 경험

안녕하세요! 오늘은 질적 연구(Qualitative Research)를 하시는 분들이라면 무릎을 탁 치며 공감할만한, 아니 어쩌면 읽다가 혈압이 조금 오를 수도 있는 흥미로운 논문을 하나 소개해드리려고 해요.

 

연구를 마치고 설레는 마음으로 저널에 투고했는데, 돌아온 동료 심사(Peer Review) 결과가 내 연구의 철학이나 방법론과는 전혀 맞지 않는 엉뚱한 지적들로 가득했던 경험, 혹시 있으신가요?

 

오늘 소개할 논문의 제목부터 심상치 않습니다. 바로 <“정말 자신 있게 틀리기”: 방법론적으로 부조화한 동료 심사 피드백에 대한 질적 연구자들의 경험> 입니다.

 

연구진은 트위터에서 "리뷰어들이 질적 연구를 이해하지 못한다"는 불만을 토로하다가, "이거 우리만 겪는 문제가 아니구나!"를 깨닫고 본격적인 연구를 시작했다고 해요. 전 세계 163명의 질적 연구자들의 목소리를 담은 이 논문, 핵심 내용을 함께 살펴볼까요? 🔍


1. 도대체 뭐가 문제인가요? : 방법론적 부조화 (Methodological Incongruence)  

이 논문에서 가장 중요하게 다루는 개념은 바로 방법론적 부조화(Methodological Incongruence)입니다. 쉽게 말해, 질적 연구의 고유한 가치와 철학을 무시하고, 엉뚱한 기준(주로 양적 연구의 기준)을 들이대는 것을 말해요.

연구진은 이를 이렇게 정의합니다.

우리는 (방법론적) 부조화(Incongruence)라는 용어를 저자의 연구 가치 및 방법론(Methodology)—이는 그들의 연구가 위치한 더 넓은 지식 프레임워크(Frameworks)를 포함합니다—과 일치하지 않는 동료 심사자(Peer reviewer) 및 편집자의 코멘트를 지칭하기 위해 사용합니다.

We use (methodological) incongruence to denote peer reviewer and editor comments that do not align with the authors’ research values and methodology, which includes the broader knowledge frameworks within which their work is situated.

 

즉, 축구 경기(질적 연구)를 하는데 심판이 야구 규칙(양적 연구 기준)을 들고 와서 "왜 배트를 안 휘두르냐"고 따지는 상황인 거죠. 😅

2. "샘플이 너무 작아요!" : 부적절한 보편화 (Inappropriate Universalization) 

연구 참여자들의 가장 큰 불만은 리뷰어들이 양적 연구(Quantitative Research)나 후기 실증주의(Postpositivism)의 잣대를 질적 연구에 강요한다는 점이었어요. 이것을 논문에서는 부적절한 보편화(Inappropriate Universalization)라고 부릅니다.

가장 흔한 지적들은 이런 것들이었어요.

  • "표본 크기(Sample size)가 너무 작아서 일반화할 수 없다." (질적 연구는 원래 일반화가 목적이 아닌데 말이죠!)
  • "코딩의 신뢰도(Reliability)를 검증할 수 있는 통계 수치를 가져와라."
  • "데이터를 정량화(Quantification)해서 빈도를 보여달라."

이런 리뷰어들의 태도를 연구진은 아주 날카롭게 꼬집습니다.

수십 년간의 질적(Qualitative) 학문 연구(Scholarship)에도 불구하고, 이 리뷰어들은 여전히 양적/후기 실증주의적(Quantitative/postpositivist) 규범을 보편화하여 질적 학문 연구를 본질적으로(Inherently) 방법론적으로 불충분한 것으로 구성(Construct)하는 것으로 보입니다.

Despite decades of qualitative scholarship, these reviewers appear to still universalize quantitative/postpositivist norms to construct qualitative scholarship as inherently methodologically insufficient.

3. 연구자들의 고충: 권력 역학(Power Dynamics)과 감정 노동 

이런 말도 안 되는 리뷰를 받으면 연구자들은 어떻게 반응할까요? 화가 나지만, 논문을 출판해야 하는 '을'의 입장이기에 울며 겨자 먹기로 따르거나, 엄청난 에너지를 쏟아 리뷰어를 설득해야 합니다. 😭

특히 신진 연구자(ECR)들의 경우, 이런 경험이 연구 의욕을 꺾거나 심지어 '가면 증후군(Impostor Syndrome)'을 느끼게 만들기도 한다고 해요. 한 참여자의 말이 너무 짠하네요.

동료 심사(Peer review)는 좋을 때는 좋지만, 나쁠 때는 종종 나쁩니다. 왜냐하면 기본적으로 리뷰어/편집자들에게 '질적 연구 개론(Qual 101)'을 가르치는 셈이고 그것은 극도로 지루하기 때문입니다. ... 당신은 그저 어떤 리뷰어의 손을 잡고 질적 연구(Qualitative research)의 기초를 안내하고 있으며 모두의 시간이 낭비되고 있습니다.

Peer review is good when it’s good, but it’s often bad because you’re basically just teaching Qual 101 to reviewers/editors and it’s extremely boring. ... you’re just handholding some reviewer through the basics of qualitative research and everyone’s time is wasted.

4. 그래서 어떻게 해야 할까요? : 제언 (Recommendations) 

이 논문은 단순히 불평만 늘어놓는 게 아니라, 질적 연구 심사의 무결성(Integrity)을 지키기 위한 구체적인 제언을 내놓습니다.

👩‍🏫 편집자(Editors)에게: "아무 리뷰어나" 쓰지 말고, 해당 방법론에 전문성(Expertise)이 있는 리뷰어를 섭외하세요. 그리고 리뷰어가 헛소리(?)를 하면 편집자가 중간에서 개입해야 합니다!

편집자들은 일부 리뷰어들의 포화(Saturation)나 일반화 가능성에 대한 제안(Suggestions)이 그냥 명백히 틀렸다는 것을 더 강력하게 명시해야 하며—이것을 리뷰어들에게 말해줘야 합니다!!!

editors need to be stronger in stating that suggestions of saturation or generalisability by some reviewers is just plain wrong—and tell reviewers this!!!

 

🕵️‍♂️ 리뷰어(Reviewers)에게: 자신의 전문 분야가 아니라면 솔직하게 인정하고 거절하거나, 모르는 부분에 대해서는 코멘트를 자제해 주세요. "정말 자신 있게 틀리지(Confidently wrong)" 말고요!

마치며 

이 논문은 질적 연구자들이 겪는 부조리함을 시원하게 긁어주면서도, 학계가 나아가야 할 방향을 명확히 제시하고 있습니다. 여러분도 혹시 "자신 있게 틀린" 리뷰를 받아본 적이 있으신가요?

그럴 때마다 너무 좌절하지 마세요. 여러분의 연구가 잘못된 게 아니라, 심사 시스템의 방법론적 부조화(Incongruence) 때문일 수 있으니까요. 우리 모두 "방법론적 무결성"을 지키며 꿋꿋하게 연구해 나가요! 💪

 


 

이 논문(Article)은 저희 중 한 명이 트위터(Twitter, X)에서 리뷰어들이 질적 연구(Qualitative research)를 "이해하지 못하는(not getting)" 것에 대해, 그리고 우리가 제출한 연구의 방법론적 접근과 일치하지 않는(Incongruent) 수정을 요구하는 것에 대해 좌절감(Frustration)을 토로했던 대화에서 발전했습니다. 이러한 좌절감은 우리만의 것이 아니었습니다! 활발한 대화 끝에, 우리는 질적 연구의 동료 심사(Peer review) 과정에서 발생하는 부조화(Incongruity)에 대해 더 엄밀한 탐구가 필요하다고 판단했고, 널리 공유된 문제로 보이는 것을 이해하기 위한 프로젝트를 시작했습니다. 저자들의 동료 심사 경험과 부적절한 동료 심사 관행에 대한 대부분의 연구는 과학, 기술, 공학, 수학 학문 분야(Disciplines)에 집중되어 있거나(Atjonen, 2019), 자연과학/양적 연구(Hard sciences/Quantitative research)와 호환되는 동료 심사 모델만을 암묵적으로 적용하고 있으며(e.g., Allen et al., 2019), 질적(Qualitative) 연구자들의 동료 심사 경험이나 열악한 심사 관행에는 거의 관심을 기울이지 않았습니다.

(질적 연구의) 동료 심사 — 뿌리 깊게 자리 잡았으나 망가졌는가?
Peer Review (of Qualitative Research)—Entrenched but Broken?
 

동료 심사는 지식 생산의 질을 보장하고 신뢰성을 강화하는 것으로 이해되는 학술(Academic) 출판의 초석입니다(Tennant & Ross-Hellauer, 2020). 그러나 동료 심사(Peer review)에 결함이 있다는 것은 이미 널리 인정되고 있습니다. 너무 많은 논문(Articles)에 비해 이를 심사할 전문가는 너무 적다는 도전(Challenge)(Rodríguez-Bravo et al., 2017)뿐만 아니라, 이 과정은 자원 집약적이며(Aczel et al., 2021), 투명성(Transparency)이 부족하고(O’Brien et al., 2021), 불공평하며(Steinberg et al., 2018), 때로는 적극적으로 적대적이기까지 합니다(Mavrogenis et al., 2020). 저자들의 동료 심사 경험에 관한 연구는 저자들, 특히 신진 학자들(e.g., Horn, 2016; Watling et al., 2023)과 소외된 집단 출신의 학자들(e.g., Silbiger & Stubler, 2019)에게 동료 심사가 끼치는 해악을 강조해 왔습니다. 입증된 부적절한 동료 심사 관행에는 수준 이하의, 모순적이며, 파괴적인 피드백(Feedback)(Atjonen, 2018)과 리뷰어나 편집자의 개인적 편향(Biases) 또는 서로 다른 학파에 기반한 피드백이 포함됩니다(McCloskey & Merz, 2022; Overall, 2015). 저자들은 부적절한 동료 심사 관행이 적어도 부분적으로는 잘못 선정된 리뷰어들(Jamali et al., 2020)과 저자의 방법론 및 패러다임(Paradigms)에 대한 친숙성(Familiarity) 부족을 포함한 리뷰어의 역량(Competence) 결핍으로 설명된다고 인식합니다(Atjonen, 2018, 2019; Watling et al., 2023). 문제가 있는 동료 심사는 저자들이 논문 게재를 위해 자신이 동의하지 않거나 부정확하다고 생각하는 변경 사항을 수정하도록 이끌 수 있습니다(McCloskey & Merz, 2022; Overall, 2015). 이 시스템을 망가진 것으로 묘사하며, Overall (2015, p. 287)은 학계에 "학술 저널 심사 과정의 쇠약하게 만드는 문제들을 수정(Correcting)하는 데 집중할 것"을 촉구했습니다. 우리의 논문은 질적(Qualitative) 연구자의 경험에 내재된 문제를 이해하는 것을 넘어, 질적 연구 동료 심사의 방법론적 무결성(Methodological integrity)(Levitt et al., 2017)을 지원하기 위한 자원을 개발함으로써 그 수정(Correction)에 기여하고자 합니다(see also Levitt et al., 2021).

 

이 문제는 새로운 것이 아닙니다. 20년 전, 동료 심사(Peer review)가 처음인 학자들을 지도하던 한 노련한 의학 저널 편집자는 질적(Qualitative) 논문 심사를 의뢰받은 이들에게 다음과 같이 조언했습니다. "첫째, 당신의 전문성(Expertise)이 질적 연구(Qualitative research)에 있지 않다면 이를 분명히 하십시오"(Clark, 2003, p. 228, 강조 추가). Clark의 조언은 현재 훌륭한 동료 심사 관행에 대한 논의(e.g., Spigt & Arts, 2010; J. Taylor & Bradbury-Jones, 2014)와 출판 윤리 위원회(Committee on Publication Ethics Council, COPE, 2017) 지침과 같은 동료(Peer) 리뷰어를 위한 윤리 지침, 그리고 출판사의 동료 심사 지침(Guidance)(e.g., Sage, n.d.; Wiley, 2024)에 명시된 원칙을 반영합니다. Wiley(2024)의 지침(Guidelines)은 부정적인 리뷰의 일반적인 원인이 자신의 지식 한계에 대한 리뷰어의 인식 부족임을 시사하며, 리뷰어들에게 유의미한 피드백(Feedback)을 제공할 수 있는 자신의 능력에 대해 스스로 솔직해질 것을 권합니다. 편집자들 또한 공정하고 적절한 동료 심사 과정을 보장해야 하는 더 넓은 책임의 일환으로 적절한 전문성을 갖춘 동료 리뷰어를 선정할 윤리적 책임이 있습니다(e.g., see Herber et al., 2020; Kleinert & Wager, 2011).

 

질적 연구(Qualitative research)에 대한 친숙성(Familiarity) 부족(그리고 이러한 부족의 정도에 대한 인식 부재)은 동료 심사(Peer review)에서 방법론적 부조화(Incongruence)를 야기할 수 있습니다(Levitt et al., 2017, 2021).

  • 예를 들어 건강 심리학(Health psychology) 분야에서 리뷰어들은 종종 고유한 질적(Qualitative) 전통(Traditions)보다는 후기 실증주의(Postpositivist) 규범과 가치에 더 친숙(Familiar)합니다(Braun & Clarke, 2023). 이는 질적 연구가 그 자체의 장점으로 평가받지 못하게 만들며, 리뷰어들은
    • 변수 간 관계 검증, 평가자 간 신뢰도(Intercoder reliability) 점수 제공, 결과 검증, 집단 간 차이에 대한 질문, 표본 크기(Sample size), 일반화 가능성(Generalizability)객관성(Objectivity)의 (부재)에 대한 우려와 같이, 양적(Quantitative) 연구나 데이터 분석에 더 적합한 관행의 부재를 비판하거나 수정을 요구하게 됩니다(Braithwaite et al., 2014; Herber et al., 2020; Martin et al., 1999).
  • 최근 의학 저널에 제출된 질적 논문(Articles)의 다양한 요소에 대해 리뷰어들이 흔히 하는 코멘트 유형을 매핑하고 종합(Synthesis)한 연구는 일부 리뷰어들의 코멘트가 "근본적인 양적 사고방식(Mindset)"(Herber et al., 2020, p. 1)과 질적 연구의 기본 원칙에 대한 이해 부족뿐만 아니라, 어떤 경우에는 질적 연구에 대한 적대감(Hostility)을 시사한다고 주장했습니다. 적대감이 없더라도 질적 연구의 목적, 방법, 가정에 대한 오해와 "질적 연구를 '양적화(Quanti-sise)' 하려는 시도(질적 평가에 양적 패러다임(Paradigms)의 가정을 적용하는 것)"(Clark, 2003, p. 220)는 저자들을 좌절하게 할 뿐만 아니라 "그들 연구의 출판을 금지(Prohibit)"(Clark, 2003, p. 220; see also Martin et al., 1999)시켜, 좋은 품질의 연구가 (부당하게) 거절당하게 만듭니다.
  • 이러한 경험과 영향은 질적 패러다임과 양적 패러다임 전반에 걸쳐 균등하게 분포되지 않습니다. 질적 연구에 대한 친숙성 부족 문제는 저널 편집자들의 지식 격차로 인해 더욱 악화될 수 있으며, 일부 편집자들은 특히 리뷰어들의 방법론적 피드백이 모순될 때 저자들에게 그러한 피드백(Feedback)에 어떻게 대응해야 할지 안내할 자신감과 기술이 부족합니다(Levitt et al., 2017).

Herber et al. (2020)은 질적 연구(Qualitative research)에 익숙하지 않은(Unfamiliar) 리뷰어들은 이러한 지식 부족에 대해 정직해야 하며, 단순히 "질적 연구물 평가에 양적 렌즈(Quantitative lens)를 적용"(p. 13)하기보다는 심사 요청을 거절해야 한다고 결론지었습니다. 그렇다면 이러한 도전(Challenges)들은 질적(Qualitative) 연구자들이 동료 심사(Peer review)를 제공할 때 해결될까요? 제한된 연구 증거는 이 질문에 대해 '그렇기도 하고 아니기도 하다'는 답변을 제시합니다. 교육 연구라는 광범위한 영역에서 1990년대의 두 리뷰는 낙관론(Optimism)과 신중론(Caution)을 동시에 제공합니다.

  • Zaruba et al. (1996)은 The Review of Higher Education에 리뷰된 질적 논문(Articles)에 대한 분석(Analysis)에서, 일반적으로 ("대체로 질적 전통(Tradition)에 정통한", p. 438) 리뷰어들이 저자들에게 방법론적으로 일치하는 언어와 적절한 섹션(Section) 제목을 사용하도록 장려하고, 분석적 관찰의 정량화(Quantification)를 요구하거나 통계적 일반화 가능성(Generalizability)의 부족을 한탄함으로써 양적 규범을 불러오지 않고 전통적인 보고 형식을 탈피하도록 하는 등 "질적 연구의 '문화'를 고수했다"(p. 454)고 언급했습니다.
  • 그러나 E. W. Taylor et al. (2001)—역시 교육 분야—은 동료(Peer) 리뷰어들 전반에 걸쳐 질적 연구에 대한 암묵적인 공유 표준 세트(철학적 우려보다는 기술적(Technical) 우려에 종종 초점을 맞춘)가 분명히 존재한다고 설명했습니다. 그들은 해당 분야가 덜 "전통적인" 형태의 질적 연구에 대해 얼마나 개방적인지에 대해 우려를 제기하며, 리뷰어(및 편집자)들에게 "다른 형태의 질적 연구를 접하고 자연주의적 탐구 관행에서 현재 일어나고 있는 일을 파악할 것"(p. 176)을 장려했습니다.

질적 연구(Qualitative research)에 대한 질적(Qualitative) 동료 심사(Peer reviews)의 논평과 분석 전반에 걸쳐, 우리는 데이터 포화(Saturation)(Clark, 2003; Herber et al., 2020), 연구자 삼각측량/코딩 일치도(Triangulation/coding agreement)(Clark, 2003) 및 연구 참여자 확인(Member checking)(Braithwaite et al., 2014; Clark, 2003; Herber et al., 2020; Zaruba et al., 1996)과 같은 특정 개념들을 (모든) 질적 연구 관행과 호환되는 것으로 지정하려는 경향을 확인했습니다. 하지만 이러한 관행들은 많은 이들에 의해 논쟁이 되거나 비판받고 있습니다(e.g., Motulsky, 2021; Varpio et al., 2017, 2021). 보편화(Universalizing)는 방법론적 부조화(Incongruence)의 위험을 초래합니다. 또한 이는 일치성(Congruence)이 단지 기술적(Technical) 고려사항일 뿐만 아니라, 존재론적 및 인식론적(Ontoepistemological)이며 개념적인 고려사항이라는 점에 대한 이해가 필요함을 강조합니다.

 

동료 심사에서의 방법론적 (불)일치 정의하기
Defining Methodological (In)Congruence in Peer Review
 

우리는 (방법론적) 부조화(Incongruence)라는 용어를 저자의 연구 가치 및 방법론(Methodology)—이는 그들의 연구가 위치한 더 넓은 지식 프레임워크(Frameworks)를 포함합니다—과 일치하지 않는 동료 심사자(Peer reviewer) 및 편집자의 코멘트를 지칭하기 위해 사용합니다.1 많은 질적(Qualitative) 연구자들은 이러한 정렬(Alignment) 개념을 "건전하고 의미 있는 연구 성과"를 산출하는 데 중요한 질적 연구(Qualitative research)의 핵심 (품질) 원칙으로 간주합니다(Chamberlain et al., 2011, p. 152). 이 개념은 많은 질적 품질 기준 및 보고 표준(Levitt et al., 2017; Tracy, 2010; Yardley, 2024)에서 특징적으로 나타나며,

 

  • 방법론적 무결성(Methodological integrity)(Levitt et al., 2017, 2021),
  • 패러다임적 무결성(Paradigmatic integrity)(Hills, 2000),
  • 의미 있는 일관성(Meaningful coherence)(Tracy, 2010), 그리고
  • 방법론적 일치성(Methodological congruence)(Pearson et al., 2015)이라는 언어를 통해 전달됩니다.

 

일치성(Congruence)은 종종 연구 설계(Research design)와 관련하여 논의되며, 철학적 지향부터 데이터 생성(Generation) 방법에 이르는 연구의 모든 측면 간의 정렬 필요성을 지향합니다(Hills, 2000).

 

  • 또한 일치성(Congruence)은 예를 들어 패러다임(Paradigm), 존재론(Ontology), 또는 인식론(Epistemology)의 선택과 관련하여 논의되기도 하는데, 이러한 선택들은 다른 선택들을 제한하고 방향을 제시합니다(Crotty, 1998).
  • 서로 다른 패러다임의 "모순되고 상호 배타적인(Mutually exclusive)" 측면을 끌어오는 것을 피해야 한다는 점이 강조됩니다(Lincoln et al., 2024, p. 99).
  • 이는 일치성(Congruence)을 효과적으로 달성(Achieve)하는 능력은 연구자가 방법과 이론(Theory) 모두를 파악하고 있는지에 달려 있음을 의미합니다(Yardley, 2024).

 

따라서 방법론적 부조화(Methodological incongruence)는 (아마도 무지하게) 양립 불가능한(Incommensurate) 프레임워크들, 그리고 양립 불가능한 프레임워크에 뿌리를 둔 개념과 관행들을 아무런 설명(Explanation) 없이 결합함으로써 발생할 수 있습니다. Tracy (2010)는 자신의 8가지 "포괄적인(Big-tent)" 품질 기준 중 하나로 의미 있는 일관성을 논의하면서, 만약 연구자가 다른 프레임워크에서 개념을 차용한다면 "두 관점 사이의 단절(Disjuncture)을 주의 깊게 언급하고 어떻게 [그들이] 의도적으로 그 접근법들을 엮어냈는지 설명해야 한다"(p. 849)고 주장했습니다. 질적 연구자들이 패러다임 혼합(Paradigm-blending)의 문제점에 대한 동의/부동의 여부에서 때때로 의견을 달리한다는 점, 그리고 어떤 접근법들은 서로 다른 패러다임을 결합한다는 점(e.g., 합의적 질적 연구[Consensual qualitative research], Hill et al., 1997, 응용 주제 분석[Thematic analysis], Guest et al., 2012)을 인정하는 것이 중요합니다.

 

우리에게 있어 방법론적 일치성(Methodological congruence)질적 연구(Qualitative research) 전통(Traditions)의 다양성(Diversity)을 고려할 때 리뷰어와 편집자를 위한 필수적인 지침 원칙입니다. 좋은 질적(Qualitative) 동료 심사(Peer review)란 특정 질적 전통에 국한된 엄격성(Rigor) 개념을 강요하기보다는, 연구자가 무엇을 수행했고 그것을 어떻게 보고했는지에 대한 전반적인 일치성(Congruence)을 평가하는 것을 포함합니다.

 

  • 문헌들은 일치된 동료 심사에 대한 주요 위험이 양적(Quantitative) 가치질적이지만 후기 실증주의적(Postpositivist)인 가치, 개념, 관행(데이터 포화[Saturation], 참여자 확인[Member checking], 연구자 삼각측량[Triangulation] 등, see Varpio et al., 2017)을 그것들이 많은 질적 접근법의 기초 가정에 부합(Fit)하지 않음에도 불구하고 보편화(Universalizing)하는 데서 온다고 시사합니다. 이는 일치된 심사를 위해 질적 연구의 철학적, 개념적, 그리고 실천적 변이(Variation)에 대한 어느 정도의 이해를 필요로 합니다.

 

이 다양성을 "매핑(Map)"하는 데는 여러 가지 방법이 있지만, 우리가 유용하다고 생각하는 기본적인 구분은 소위 '소문자 q 질적 연구(small q qualitative)''대문자 Q 질적 연구(Big Q Qualitative)' 사이의 구분입니다(Braun & Clarke, 2022; Kidder & Fine, 1987). 소문자 q와 대문자 Q 연구 모두 질적 데이터(Qualitative data) 생성(Generation) 및 분석 기법을 포함하지만,

 

  • 대문자 Q는 이를 질적 연구 가치라는 프레임워크 내에서 배치합니다. 대문자 Q는 뚜렷하게 질적이고 비실증주의적인(Qualitative, nonpositivist) 패러다임(Paradigm)(e.g., 해석주의[Interpretivist] 및 구성주의[Constructionist]) 내에서 수행되는 반면,
  • 소문자 q는 종종 많은 학문 분야(Disciplines)(e.g., Varpio et al., 2017)와 심리학(Gough & Lyons, 2016; Morrill & Rizo, 2023; Riley et al., 2019)을 지배하는 후기 실증주의적 규범과 가치를 기본값으로 합니다.
  • 소문자 q기술적(Technical) 혹은 절차주의적(Proceduralist) 지향을 제공하며, 여기서 질적 접근법은 "심리학자의 도구 상자에 있는 또 다른 (기술적이고 합리적인) 도구 세트"로 이해됩니다(Gough & Lyons, 2016, p. 237).
  • 출판된 소문자 q 연구는 이론적 가정에 대한 명시적인 논의를 거의 포함하지 않습니다(Braun & Clarke, 2023).
  • 부조화(Incongruity)는 소문자 q 질적 연구에 적용될 수 있는 표준과 기준들—널리 사용되는 질적 연구 보고 통합 기준(COREQ) 체크리스트(Checklist)(Tong et al., 2007)에서 입증된 많은 것들과 같은—이 대문자 Q 질적 연구에 (무지하게) 적용되어, 대문자 Q 연구가 부족하거나 심지어 치명적인 결함이 있는 것으로 판단될 때 발생합니다(Braun & Clarke, 2024).

 

부조화한 동료 심사에 대한 질적 연구자들 Qualitative Researchers on Incongruous Peer Review 

우리의 연구는 질적(Qualitative) 연구자들의 목소리를 추가함으로써 질적 연구(Qualitative research)의 동료 심사(Peer review)에 관한 제한된 문헌을 확장합니다. 그들 자신의 경험과 질적 연구(Qualitative research) 모두에 전문성(Expertise)을 가지고 있기에, 우리는 방법론적으로 부조화한 피드백(Feedback)이 무엇인지, 그것을 받는 것이 어떤 것인지, 그리고 그들이 그러한 피드백을 어떻게 헤쳐 나가고 대응했는지 알고자 했습니다. 동료 심사가 이러한 방식으로 질적 연구자들을 실망시키는 방식을 체계적으로 탐구함으로써, 우리는 궁극적으로 동료 심사 과정의 무결성(Integrity)(그리고 그 안의 질적 연구자들)과 출판된 질적 연구의 방법론적 일치성(Congruence)을 지원하는 것을 목표(Aim)로 합니다(see also Note 1 of the Supplemental Material).

방법론 Methodology 

우리는 질적(Qualitative) 설문조사를 사용했고, 광범위한 소셜 미디어와 네트워크(Network) 공유를 통해 참여자를 모집했으며, "코드북(Codebook)" 주제 분석(Thematic analysis)과 다소 유사한 요약-기술적(Summative-descriptive) 접근법을 사용하여 데이터를 분석했습니다. 프로젝트에 대한 윤리적 승인은 제1저자의 보건, 과학 및 사회 대학 연구 윤리 위원회(College of Health, Science and Society Research Ethics Committee)로부터 받았습니다.

질적 설문조사 및 모집 The Qualitative Survey and Recruitment 

질적(Qualitative) 설문조사(Survey)를 사용하기로 한 결정은 실용적이고 참여자 중심적인 선택이었습니다. 이것은 지원금을 받지 않은 연구였습니다. 우리는 학자들(Academics)의 바쁜 직장 생활과 연구 참여(Participation)를 위한 제한된 시간, 지리적 분산(Dispersal), 그리고 일부에게는 연구의 잠재적으로 민감한(Sensitive) 성격(질적 설문조사는 강력한 익명성(Anonymity) 감각을 제공합니다; Terry & Braun, 2017)을 염두에 두었습니다. 우리는 전반적인 질적 연구자들의 동료 심사(Peer review) 경험을 이해하고자 했으며, 따라서 학문 분야(Discipline)/분야(Field), 경력 단계, 사용된 질적 접근법과 관련하여 다양한 학자 그룹의 의견을 듣고 싶었습니다. 서면 양식(Modality)은 또한 기여자들에게 그들의 동료 심사 내용과 그에 대한 대응(많은 이들이 그렇게 했습니다)을 인용하도록 요청할 수 있게 해주었습니다.

 

우리의 짧은 질적(Qualitative) 설문조사(Survey)(see Note 3 in Supplemental Materials)는 기여자들에게 동료(Peer) 리뷰어와 편집자로부터 받은 "방법론적으로 일관성 없는(Methodologically incoherent)" 코멘트에 대해, 그리고 기회가 있었다면 이에 대해 어떻게 대처했는지 물었습니다. 또한 그들은 그러한 코멘트를 받은 저널(우리는 이를 식별하지 않기로 선택했습니다), 그들의 학문 분야(Discipline)/연구 영역, 그리고 경력 단계(박사 과정 학생, 신진[박사 학위 취득 후 10년 이내], 중견[10-20년], 중진[20년 이상] 연구자, 그리고 "기타" 옵션으로 미리 정의됨)를 식별하도록 요청받았습니다. 우리는 설문조사를 가능한 한 간결하게 유지하고(참여[Participation]를 장려하기 위해) 익명성(Anonymity)에 대한 체감(Felt sense)을 극대화하기 위해 기여자들에 대해 묻는 질문을 제한하기로 했습니다. 이러한 예방 조치에도 불구하고, 일부는 저널 이름, 학문 분야/연구 영역 및 경력 단계에 대한 정보를 제공하지 않기를 선택했습니다—일부는 이러한 질문이 신원을 너무 드러낸다고 표시했거나, 저널의 명성을 보호하기를 원했습니다. 우리는 또한 기여자들이 원하는 다른 내용을 추가할 수 있는 개방형 질문을 포함했습니다(절반 조금 넘는 인원이 작성했습니다). 우리는 기여자들에게 인용되거나 의역될 수 있는 옵션을 제공했습니다. 또한 감사의 말(Acknowledgements)에 이름을 올릴 수 있는 옵션도 제공했는데, 절반 조금 안 되는 인원이 이를 선택했습니다.

 

우리는 2022년 7월 7일에 설문조사(Survey)를 시작했으며, (업무 관련) 소셜 미디어 계정, 질적(Qualitative) 연구자들을 위한 이메일 리스트, 그리고 전문적인 네트워크(Network)를 통해 공유했습니다. 응답 수와 내용(Content)/깊이(Depth)를 확인하고 우리의 목적을 위해 충분한 데이터가 생성되었다고 판단한 후, 우리는 2022년 10월 8일에 설문조사를 종료했습니다.

기여자들 Contributors 

참여(Participation)는 질적 논문(Article)의 동료 심사(Peer review)에서 방법론적으로 부조화한 코멘트를 경험한 모든 질적(Qualitative) 연구자에게 열려 있었습니다. 우리는 163개의 완료된 설문조사를 받았으며, 절반 조금 넘는(n = 85; 52%) 응답이 신진 연구자(ECRs)로부터 왔고, 35명(21%)은 중견 연구자로, 29명(18%)은 박사 과정 학생으로, 10명(6%)은 중진 연구자로 확인되었습니다; 나머지 5명(3%)은 다른 옵션을 선택했습니다. 이들은 학부생, 대학원 석사 과정, 박사 학위 취득 후 10년 이내이지만 중견 경력자, 그리고 박사 학위가 없는 연구자(n = 2)였습니다. ECR과 박사 과정 학생의 우세는 소셜 미디어에 참여하는 학자들(Academics)의 인구통계학적 프로필(Profile)을 반영할 수 있습니다—초기 경력 학자들이 소셜 미디어를 사용할 가능성이 더 높을 수 있습니다(Chugh et al., 2021)—그리고/또는 동료 심사 과정을 헤쳐 나가는 것이 경력 단계와 어떻게 교차하는지를 반영할 수 있습니다—초기 및 후기 경력 연구자들은 동료 심사를 다르게 보고 경험하는 것 같습니다(e.g., Atjonen, 2019; Horn, 2016; Severin & Chataway, 2021; Watling et al., 2023). 질적 연구(Qualitative research)의 인기 증가(및 정상화)(e.g., Gough & Lyons, 2016)를 감안할 때, 초기 경력 학자들이 질적 접근법에 더 큰 관심과 관여를 가질 수도 있습니다.

 

거의 모든 기여자(151명)가 광범위한 학문 분야(Discipline) 또는 특정 연구 초점을 언급했습니다(많은 이들이 여러 연구 영역을 나열했습니다). 절반 가까이(75명)가 건강(Health)을 표시했는데, 이는 다양한 학문 분야(e.g., 간호학[Nursing], 공중 보건, 의학 교육)를 아우릅니다; 심리학도 잘 나타났으며(39명), 교육학과 사회학(Sociology)은 10명 이상이 언급한 유일한 다른 학문 분야였습니다. 기타 학문 분야/분야에는 인간 컴퓨터 상호작용, 장애, 젠더(Gender) 및 레즈비언, 게이(Gay), 양성애자, 트랜스젠더(Transgender), 및 퀴어(Queer) 연구, 사회 복지(Social work), 사회 정책, 범죄학(Criminology), 경영학, 스포츠 과학(Sport science)이 포함되었습니다. 구체적으로 묻지는 않았지만, 응답을 통해 기여자들의 질적 연구(Qualitative research) 경험과 관행이 소문자 q와 대문자 Q 스펙트럼(Spectrum)을 가로지르고 있음이 분명했습니다.

 

데이터 분석 Data Analysis 

우리의 분석 전략은 코드북 주제 접근법(Thematic approaches)(Braun & Clarke, 2022)과 유사하며, 설문조사(Survey) 응답을 읽고 메모한 후에 결정되었습니다. 우리는 분석 결과를 보고하기 위한 범주(Categories)를 개발했고, 이 범주 내에서 관련 데이터를 정리하고 요약했습니다. 우리는 처음에 6개의 범주를 사용했으나, 이후 3개를 더 넓은 (보편화) 범주로 병합하여(Collapsing) 4개로 정제했습니다:

 

  • (a) 부적절한 보편화;
  • (b) 방법론적으로 부조화한 코멘트를 헤쳐 나가는 전략;
  • (c) 권력 역학(Power dynamics), 상실, 그리고 (감정) 노동(Labor);
  • (d) 질적(Qualitative) 논문(Articles)의 동료 심사(Peer review) 무결성(Integrity) 향상을 위한 제언.

 

데이터에 대한 우리의 분석적 처리는 대체로 경험적(Experiential)이었습니다. 우리는 기여자(Contributor)들의 설명을 그들의 인식과 경험에 대한 다소 직접적인 표현으로 간주했으며(Braun & Clarke, 2013), 기여자들에게 해석적 권위(Interpretative authority)를 부여함으로써(동시에 우리의 본질적으로 해석적인 역할을 인식하면서) 그들이 "전문가 증언(Expert testimony)"을 제공하는 것으로 불러일으키고자 했습니다. 이는 참여자(Participants) 대신 기여자(Contributors)라고 지칭하기로 한 우리의 결정에도 반영되어 있습니다.

분석 Analysis 

대부분의 기여자는 동료 심사(Peer review)에서 방법론적으로 부조화한 피드백(Feedback)을 광범위하게 경험했다고 보고했습니다.

 

  • 다양한 형태의 부조화(Incongruity)를 하나로 묶는 핵심 개념은 양적(Quantitative) 연구나 특정 질적 연구(Qualitative research) 접근법과 관련된 규범이나 관행을 보편화(Universalizing)하는 것이었습니다. 이는 우리의 첫 번째 범주인 '부적절한 보편화'에서 전달됩니다.
  • 부조화한 동료 심사의 함의에 대한 우리의 관심은 두 번째와 세 번째 범주에서 전달됩니다.
    • 이를 헤쳐 나가는 전략에 대한 논의(두 번째 범주)는 학계 내 권력 구조가 대응 방식과 어떻게 교차하는지, 그리고 (부조화한) 동료 심사를 둘러싼 (감정) 노동(Labor)에 대한 탐구를 통해 맥락화됩니다.
    • 전통적인 고찰(Discussion) 섹션(Section) 대신, 우리는 질적 연구 동료 심사의 방법론적 무결성(Integrity)을 향상시키기 위한 기여자들의 제안(Suggestions)을 종합(Synthesizing)하며 마무리합니다.

 

부적절한 보편화 Inappropriate Universalization 

방법론적으로 부조화한 심사는 가장 전형적으로 심사 대상인 논문(Article)에 부적절한 기준이나 관행을 적용하는 코멘트, 주장 또는 기대 등을 통해 나타났습니다. 이들은 주로 후기 실증주의(Postpositivist) 및/또는 양적 연구(Quantitative research) 관점(Perspectives)과 기준을 반영했지만, 일부는 한정된(Delimited) 질적(Qualitative) 기준이 부적절하게 보편화된 경험을 보고하기도 했습니다. 기여자들은 일부 학문 분야(Disciplines)(e.g., 기여자들이 종사하는 주요 분야인 보건 분야)에서 양적(Quantitative) 연구자들이 후기 실증주의적 렌즈(Lens)를 통해 접근하며 질적 연구(Qualitative research)에 "가볍게 손대기(Dabbling)" 시작했다고 설명했는데, 이는 그들이 생산한 연구와 그들의 동료 심사(Peer reviews) 모두에서 분명하게 드러납니다(Riley et al., 2019에서도 언급된 경향).

 

어떤 경우에는 동료(Peer) 리뷰어와 편집자들이 질적 연구(Qualitative research)가 양적 연구(Quantitative research)와 어떤 측면(Respects)에서는 다르다는 것을 어느 정도 이해하는 듯 보였지만, 그럼에도 불구하고 질적 연구가 동일하거나 유사한 연구 가치를 따를 것을 기대했습니다. 가장 흔하게 보고된 보편화 방식은 "표본 크기(Sample size)", (코딩[Coding]을 위한) "신뢰도 관행(Reliability practices)"의 필요성, 그리고 정량화(Quantification)(의 부재)와 관련이 있었습니다. 예를 들어:

제가 받는 주된 코멘트는 표본 크기(Sample size)에 관한 것과 그것이 "대표성(Representative)"이 없으므로 데이터로부터 어떠한 결론도 도출할 수 없다는 것입니다. 다중 코더(Multiple coders)평가자 간 신뢰도(Intercoder reliability)에 대한 강조가 심한데, 이는 그것이 양적(Quantitative) 측정치이기 때문이며, 연구에 그것이 없다면 리뷰어들은 당신의 엄격성(Rigour)을 의심합니다. (C140)

 

일부 기여자들의 경험에 따르면, 리뷰어와 편집자들은 작게 구성된(따라서 비대표적이고, 비일반화 가능하며, 비무작위적이고, 통계적으로 유의하지 않은; see also Clark, 2003; Herber et al., 2020; Martin et al., 1999; Zaruba et al., 1996) 데이터 세트(Data set)논문(Article) 거절의 근거로 취급했습니다.

리뷰어의 코멘트와 질적(Qualitative) 리뷰에 선정된 매우 적은 수의 참여자를 고려할 때, 원고는 출판에 적합하지 않다고 판단됩니다. (C144, 편집자 인용)

우리가 질적(Qualitative) 연구를 출판하기는 하지만, 우리는 모든 연구가 큰 집단이나 문화로 일반화될 수 있는 결과를 갖기를 기대합니다. 당신이 인터뷰한 15명의 개인이 [국가]의 수천 명의 이민자를 대표할 가능성은 낮습니다. (C69, 편집자 인용)

 

대안적으로, 리뷰어와 편집자들은 저자들에게 더 많은 데이터를 수집하고/하거나 "작은 표본"을 연구의 한계점으로 언급할 것을 요구했습니다. 우리는 변경 사항에 대해 "요구했다(Requested)"라는 용어를 사용하지만, 종종 이러한 요구는 더 유동적으로 프레임 되기도 했습니다—리뷰어는 특정 관행이 필수라고 명시적으로 말하기보다는 무엇이 수행되지 않았거나 누락되었는지에 대해 코멘트할 수 있습니다. 반대되는 편집상의 지침(Guidance)이 없는 한, 이것들은 사실상의 요구가 됩니다. 일부 기여자들은 리뷰어와 편집자가 표본 크기(Sample size)의 타당성(Validity)을 입증하기 위해 검정력 분석(Power analysis) 및 기타 계산을 요구하거나, 중단 기준(Criterion)으로서 데이터 포화(Saturation)(즉, 정보 중복성[Redundancy])의 증거를 요구하는 경우를 접했습니다(Herber et al., 2020). 예를 들어:

저는 근거 이론(Grounded Theory)을 사용하지 않았음에도 불구하고, 우리가 어떻게 데이터 포화(Saturation)를 달성했는지 나타내라는 요청을 여러 차례 받았습니다. 사람들은 이것이 통계(Statistics)를 사용할 때 표본 크기(Sample size)와 검정력(Power)을 산출하는 것의 질적(Qualitative) 등가물이라고 생각하는 것 같습니다. (C72)

포화(Saturation)를 달성했습니까? 이 중요한 문제는 해결되어야 합니다. (C8, 편집자 인용)

 

코딩(Coding)의 "신뢰도(Reliability)" 측정에 대한 요구는 방법론적으로 부조화한 심사의 또 다른 흔한 예였습니다(see Braithwaite et al., 2014; 비록 Herber et al., 2020은 이를 드물게 보고했지만). 예를 들어, C161은 다음과 같이 묘사했습니다:

보조 코더로부터의 평가자 간 신뢰도(Interrater reliability) 통계(Statistics)에 대한 요구... 그들은 보통 심층적인 질적(Qualitative) 분석(e.g., 성찰적 주제 분석[Reflexive TA], 해석학적 현상학적 분석[IPA], 담론 분석[Discourse analysis])을 보완하기 위해 카파(Kappa), 감마(Gamma) 또는 ICC를 원합니다. ... 표본 크기(Sample size)와 관련된 일반화 가능성(Generalisability): 저는 IPA, 내러티브 등의 설계에 대해 질적 연구(Qualitative research)를 수행하려면 "일반화 가능성을 위해" 큰 표본 크기(수백 명의 참여자)가 필요하다는 말을 끊임없이 듣습니다. ... 이것은 심리학을 괴롭히는 실증주의적 존재론(Ontology) 때문입니다. ... 그들은 빈도/백분율(Frequencies/percentages)이 있는 표(Table)를 원하는데, 그래야 주제 내의 변동성(Variability)을 이해할 수 있다고 합니다—예를 들어 6명만 있는 연구에서는 이것이 어렵습니다. 또는, 그들은 "일부", "대부분" 등에 대한 명확한 기술을 원합니다. ... 그들은 최소한의 연구자 개입, 표준화된 코드북 등을 원합니다. ... 그들은 이론적 프레임워크/렌즈(Frameworks/lenses)를 전혀 이해하지 못합니다.

 

여기에 보고된 것과 같은 리뷰어 및 편집자의 피드백(Feedback)에서, 양질의 (대문자 Q) 질적 연구(Qualitative)(Gough & Madill, 2012)에 필수적인 연구자의 주관성(Subjectivity)은 문제이자 객관성(Objectivity)에 대한 위협(Threat), 따라서 연구의 결함으로 개념화됩니다. 단 한 명의 코더만 있는 것(질적 연구에서는 흔한 일)은 리뷰어와 편집자들에게 문제가 있는(Problematic) 것으로 이해되었습니다. 리뷰어와 편집자들은 저자들이 분석 절차에 코드북, 코딩(Coding) 규칙, 추가 코더, 코더 훈련, 그리고 합의(Consensus) 관행(e.g., 여러 코더가 코드에 동의, 여러 연구자가 주제에 동의/연구자 삼각측량[Triangulation])을 추가하기를 원했습니다. 질적 데이터 분석 소프트웨어(Software)(QDAS)—구체적으로 NVivo—를 사용하지 않는 것은 신뢰도를 높이는 방법으로 간주되었기 때문에 리뷰어와 편집자들에게 문제로 인식되었습니다. 일부 기여자들은 동료(Peer) 리뷰어와 편집자들이 녹취록의 정확성(Accuracy)에 대한 참여자 검증(Validation)과 해석(Interpretations)의 정확성을 보장하기 위해 연구 참여자 확인(Member checking)을 사용할 것을 요구했다고 보고했습니다(Zaruba et al., 1996)—이는 연구자의 주관성을 억제해야 할 편향(Bias)과 위협의 잠재적 원천으로 개념화(Conceptualization)하고 있음을 다시 한번 시사합니다.

 

세상이 분절적으로(그리고 객관적으로) 알 수 있다는 생각은 분석의 정량화(Quantification)에 대한 수많은 요청에서도 전달되었습니다—이미 C161에 의해 언급됨(see Clark, 2003). 기여자들은 리뷰어와 편집자들이 논문(Article)에 빈도수(Frequency counts)에 대한 (논의)를 추가하거나 심지어 데이터 세트(Data set)에 대한 통계적 분석(Statistical analysis)을 원했다고 보고했습니다. C105는 리뷰어와 편집자로부터 자주 받는 부조화한 리뷰의 예로 한 리뷰어의 말을 인용했습니다:

저는 주제 코딩(Coding)을 수행하는 방법에 대한 Braun [sic]의 연구를 사랑(Love)하지만, 왜 다른 기법들이 사용되지 않았는지 궁금합니다. 예를 들어, 양적(Quantitative) 내용 분석(Content analysis)은 주제의 빈도를 다루고 연구자들이 응답자(Respondent) 집단(즉, 응답자의 인구통계학적 특성) 간의 응답을 비교할 수 있게 해주었을 것입니다.

 

이 예가 보여주듯이, 기여자들은 리뷰어와 편집자들이 참여자 인구통계를 변수로 취급하고 비교 분석이 수행되기를 원한다고 설명했습니다(see also Braithwaite et al., 2014; Martin et al., 1999). 기여자 C67은 25건의 의사-환자 상호작용 코퍼스(Corpus)에 대한 대화 분석(Conversation analysis)을 "엄격한 양적 분석(Quantitative analysis)"으로 재작업할 것을 권장한 편집자의 말을 인용했습니다:

당신은 관심 있는 패턴을 식별하고, 대화(Conversations) 속에서 그것들을 코딩하고, 허위 효과(Spurious effects)에 대해 검증하기 위해 그 발생을 통계적으로 평가할 수 있습니다. 물론 데이터 분석(Data analysis)에 대해 대안적인 양적(Quantitative) 접근 방식을 취할 수 있지만, 숫자와 허위(우연) 패턴에 대한 테스트 없이는 결론을 신뢰(Trust)할 수 없으므로 충분히 엄격해야 합니다.

 

이러한 다양한 방법론적으로 부조화한 요구들은 질적 연구(Qualitative research)를 그 자체의 방법론적 용어로 검토하지 못했음을 보여줍니다.

 

이러한 정기적으로 보고된 방법론적으로 부조화한 심사 요구들은 종종 널리 사용되는 COREQ 체크리스트(Checklist)(Tong et al., 2007) 및 광범위하게 보건 과학 분야의 다른 품질 및 보고 기준에 명시된 관행들과 일치했습니다(see Santiago-Delefosse et al., 2016). 일부 기여자들은 COREQ가 좋은 질적 연구(Qualitative research) 보고에 대한 동료(Peer) 리뷰어와 편집자의 (좁지만 보편화된) 견해를 형성한다고 언급했습니다:

더 일반적으로, 리뷰어는 방법론 보고, 그리고 대개 분석 보고에서 어떤 핵심 단어(들)를 찾고 있습니다. 물론, 그들이 찾는 단어들(e.g., 포화[Saturation])은 해당 방법론(Methodology)과 관련이 없을 수도 있습니다. ...
아마도 가장 흔한 것은 포화일 것입니다. 예컨대 10개의 인터뷰(Interviews)로는 데이터 포화에 도달했을 가능성이 낮은데 당신은 그것을 언급하지 않았다는 식입니다. 때때로 이와 같은 코멘트는 Tong et al.의 체크리스트(COREQ)에 있는 데이터 포화 항목에 대한 참조를 동반합니다.
그 다음으로 흔한 것은 성찰적 주제 분석(Thematic analysis)과 같이 설명된 방법론과 일치하지 않음에도 불구하고 "코딩 트리(Coding tree)"나 "코드북(Code book)"을 요구받는 것입니다. 다시 말하지만, 이는 코딩 트리에 대한 설명을 요구하는 COREQ 항목에 대한 참조를 동반할 수 있습니다.
세 번째로 흔한 것은 녹취록이 독립적으로 코딩되었는지, 얼마나 많은 코더가 있었는지, 그리고 어떤 코더 일치도(Agreement) 척도가 사용되었는지에 대한 질문을 받는 것입니다. (C87)

 

대문자 Q 질적 연구(Bigger Q Qualitative) 기여자들은 여기에 기술된 모든 다른 유형의 코멘트들을 문제가 있다고 보는 경향이 있었습니다(see Morrill & Rizo, 2023). 대조적으로, (일부) 소문자 q 질적(Qualitative) 기여자들은 COREQ의 가치를 인정하거나 방법론적으로 부조화한 리뷰를 반박하기 위해 COREQ를 사용했습니다. 그들은 주로 질적 연구(Qualitative research)를 이해하지 못하거나 가치를 발견하지 못하고 질적 연구가 양적 연구(Quantitative research)처럼 보이기를 원하는 동료(Peer) 리뷰어와 편집자들의 코멘트로 인해 어려움을 겪었습니다.

 

기여자들은 후기 실증주의/양적 접근법(Approaches)과 규범(e.g., 대표성 있고 일반화 가능한 표본, 통계적 분석[Statistical analysis])을 보편화하는 연구 설계(Design)에 관한 코멘트를 보고했습니다. 많은 이들이 질적 연구(Qualitative research)가 가설을 가져야 한다거나, 질적(Qualitative) 연구자들이 무엇을 발견할 것으로 기대했는지 논의해야 한다는 가정에 직면했다고 보고했습니다:

제시된 인터뷰 프로토콜(Interview protocol)이 가설을 검증하는 데 어떻게 독특하게 적합한지 평가하기가 어려웠습니다. (C156, 리뷰어 보고서 인용)

논문을 더 출판 가능하게 만들기 위해, 우리는 이 논문의 저자들이 더 견고한 분석을 위해 비교 집단(Comparison group) 모집을 고려할 것을 강력히 권장합니다. (C66, 리뷰어 보고서 인용)

 

일부 기여자들은 리뷰어와 편집자들이 이론은 오직 경험적(Empirical) 예측을 하는 데에만 사용되어야 한다고 언급했다고 지적했습니다. C28은 리뷰어를 인용했습니다:

만약 그들이 이론적 프레임워크를 사용하려면 ... 그것은 경험적(Empirical) 예측을 자신 있게 할 수 있는 것이어야 합니다. 현재의 "이론"은 그들의 논문에 아무것도 더해주지 않으며, 과학적 용어로 볼 때 이론이 아닙니다.

 

이와 같은 코멘트는 보고된 방법론적으로 부조화한 동료 심사(Peer review)의 상당 부분에 대한 우리의 "자신만만하게 틀린(Confidently wrong)" 특성화를 전형적으로 보여줍니다.

 

수많은 기고문이 질적(Qualitative) 연구의 스타일과 제시(Presentation)에 혼란스러워하고 낯설어하는 동료(Peer) 리뷰어와 편집자들을 전달했습니다. (예상되고 보편화된) 규범을 따르지 않는 것은 일부 리뷰어와 편집자들에게 질적 연구(Qualitative research)를 당혹스럽거나 심지어 이해할 수 없는(따라서 틀린) 것으로 만들었으며, 일부는 양적(Quantitative)이지 않은 연구에서는 어떠한 가치도 확인하지 못했습니다. 예를 들어, C96은 "결과는 어디에 있습니까? 당신은 인용문만 제공하고 있습니다"라고 묻는 리뷰어의 보고서를 인용했습니다. 기여자들은 또한 연구의 제시를 후기 실증주의/양적 보고 규범에 맞추기 위해 논문(Article)의 구성이나 내용(Content)을 변경하라는 요구/필수 사항을 보고했습니다(Tracy, 2012; Walsh, 2015). 예를 들어, C9는 리뷰어 보고서를 인용했습니다:

"방법론(Method)에 개인적인 경험이 많이 포함되어 있는데 이 연구에 필요한 것인지 확신할 수 없습니다" 그리고 "당신이 데이터 수집(Data collection)에 개인적으로 관여했지만, 전체적으로 3인칭으로 쓰인다면 더 잘 읽힐 것이라고 생각합니다"
... "저자가 강력한 내러티브를 만들기보다 이야기를 전달하기 위해 인용문에 지나치게 의존한다고 느꼈습니다. 개선을 위해 사용된 인용문을 줄이고 더 많은 내러티브를 갖도록 고려하십시오"
... "결과(Results) 섹션(Sections)은 일반적으로 데이터에서만 나옵니다. 이 섹션에서 다른 연구에 대한 모든 참조를 제거하십시오. 또한 데이터에 대한 성찰은 고찰(Discussion) 섹션을 위해 남겨두십시오."

 

이 인용문은 많은 이들이 지적한 주요 문체적 측면들을 전달합니다. 예를 들어:

 

  • "결과"와 "고찰"을 분리하고 전자에서 연구자의 해석(Interpretation)과 문헌 참조를 제거하는 것(see also Clark, 2003);
  • "결과"에서 데이터 인용문을 제거하거나 줄이는 것(see also Martin et al., 1999);
  • 반대로 "결과"에 데이터 인용문만 제시하고 분석적 해설은 하지 않는 것;
  • 3인칭으로 작성하는 것;
  • (질적) "전문 용어"(실용주의[Pragmatism]와 같은 용어)를 제거하는 것; 그리고
  • 성찰성(Reflexivity), 방법론(Methodology), 존재론(Ontology)인식론(Epistemology), 그리고 기타 이론에 대한 (논의를) 제거하는 것 등입니다.

 

기여자의 경험은 일부 리뷰어와 편집자가 자신들을 전문가로서 명백히 옳고, 저자(들)는 틀렸으며 변경이 필요한 존재로 위치시키는 감각을 전달했습니다:

결과와 고찰을 결합하지 말고 따로 작성하라는 지시를 받았고, 각 섹션(Section)에 무엇이 포함되어야 하는지에 대해 거들먹거리며(Condescendingly) 설명 들었습니다. ... 1인칭을 사용하는 것은 학문적(Academic)이지 않으니 사용하지 말라는 말을 들었습니다. (C45)

 

이러한 경험은 동료(Peer) 리뷰어보다는 시험관(Examiner)에 더 가까운 역할을 상기시킵니다—이는 우리가 동료 심사(Peer review)에서의 권력과 감정 노동(Labor)을 논의할 때 다시 다룰 내용입니다. 질적 연구(Qualitative research) 보고 관행에 대한 리뷰어와 편집자의 친숙성(Familiarity) 부족은 때때로 질적 연구에 대한 노골적인(그리고 암묵적인) 무례함이나 묵살과 결합되었습니다(see also Herber et al., 2020)—대개는 비/덜 과학적이고, 체계적이거나 엄격하기보다는 특이한(Idiosyncratic) 것이라는 식의 주장입니다. 예를 들어:

이 논문은 특히 특이하고, 비일반화 가능하며, 개인 수준의 의견(Opinion)으로 다가옵니다—아마도 정신분석가(Psychoanalyst)나 최면술사의 상담 의자(Couch)에서 나온 것 같습니다. (C79, 리뷰어 보고서 인용)

이것은 단지 저자의 주관적인(Subjective) 의견(Opinion)입니다. 논문의 형식이 아닙니다. (C106, 리뷰어 보고서 인용)

이 논문(Article)은 확실히 수락될 수 없습니다, 여기엔 데이터가 없습니다. 저자는 방정식에 있어 투명하지 않습니다. (C10, 리뷰어 보고서 인용)

 

일부 기여자들은 이러한 질적 연구(Qualitative research)에 대한 경멸이 특히 혼합 방법 연구(Mixed method research)를 둘러싸고 나타난다고 언급했습니다(see also Morrill & Rizo, 2023):

또한 질적(Qual) 연구는 그 자체로 절대 충분하지 않다고 느껴집니다—진심으로요. 우리는 그것들을 [양적 및 질적] 서로 병치(Juxtapose)해야 하며, 그런 다음 양적(Quant) 연구가 더 낫고 질적 연구는 분석을 "보충"하는 것임을 알려야 합니다. ... 리뷰어들은 질적 연구가 양적 연구처럼 작성되기를 원합니다—그들은 설문조사(Survey)처럼 보이는 천편일률적인(Cookie cutter) 연구를 원합니다. (C161)

 

수십 년간의 질적(Qualitative) 학문 연구(Scholarship)에도 불구하고, 이 리뷰어들은 여전히 양적/후기 실증주의적(Quantitative/postpositivist) 규범을 보편화하여 질적 학문 연구를 본질적으로(Inherently) 방법론적으로 불충분한 것으로 구성(Construct)하는 것으로 보입니다. 그러나 부적절한 보편화는 질적(Qualitative) 연구 그 자체를 둘러싸고도 나타났는데, 일부 질적 연구(Qualitative research) 접근법에 친숙한(Familiar) 동료(Peer) 리뷰어와 편집자들이 특정 접근법의 관행이 모든 것에 적용된다고 가정함으로써 질적 연구를 보편화할 때 발생했습니다. 일부는 특정 질적 방법에 대한 일종의 "경계 단속(Boundary policing)"과 그것이 어떻게 사용되어야 하는지에 대해 언급했습니다:

덜 빈번한 문제이지만, 떠오르는 한 가지는 "방법"이 무엇을 할 수 있고 무엇을 할 수 없는지에 대한 과도한 확신/과장된 주장입니다. "주제가 있기 때문에 이것은 템플릿 분석이 아니다"라거나, "두 개의 표본이 있으므로 이것은 IPA [해석학적 현상학적 분석]가 될 수 없다" 등등. 저는 약간 덜한 경계 단속과 약간 더한 호기심(Curiosity)("IPA 연구에서 두 개의 표본을 보는 것은 흥미롭군요, 그것이 접근법과 어떻게 부합(Fits)하는지 좀 더 설명해 주시겠습니까?")이 여기서 필요한 전부라고 생각합니다. (C124)

저는 편집자로부터 "질적 연구(Qualitative research)는 파일럿(Pilots) 사용을 포함하지 않는다"는 이유로 인터뷰(Interview)를 파일럿(예비 조사) 하지 말았어야 했으며, 따라서 논문(Article)에서 이 과정에 대한 언급을 삭제해야 한다는 코멘트를 받았습니다. (C53)

 

(특정 형태의) 질적 연구(Qualitative research)의 보편화나 전체화하는(Totalizing) 선언은 좌절감(Frustration)을 낳았고, 질적(Qualitative) 연구자들이 자신들의 전문성(Expertise)의 경계와 한계를 인식하기를 바라는 마음(Wish)을 낳았습니다:

저는 질적 연구자들이 자신의 전문 분야 밖의 논문을 심사하면서 그것을 고려하지 않는 것에 매우 지쳤습니다—예를 들어, 주제 분석가가 대화 분석(Conversation analysis)을 심사하는 것 말이죠. 질적 연구자들이 양적(Quantitative) 리뷰어들에 대해 하는 모든 불평에 대해, 분명히 그들은 자신들에게도 똑같은 접근 방식을 적용하고 싶을 것입니다! (C90)

 

담론(Discourse)이나 대화 분석(Conversation analysis)과 같이 언어를 생산적인 것으로 취급하는 접근법으로 작업하는 기여자들은 이러한 방법론적으로 부조화한 형태의 심사를 특히 경험하는 것으로 보였습니다:

담론 분석(Discourse analysis)에 익숙하지 않은 것이 분명한 리뷰어들은 담론적 기능에 대한 해석(Interpretations)이 과잉 해석이고 근거 없는 주장이라고 주장하며 "데이터가 스스로 더 많이 말하게 하라"고 제안합니다. (C47)

 

이러한 반응들은 방법론적 부조화(Incongruence)(그리고 이와 관련된 질적(Qualitative) 방법론적 확장[Expansion] 문제)가 다양한 형태의 질적 연구(Qualitative research)의 다양한 관행과 관습, 또는 다른 접근법의 다양한 철학적 기초와 가정을 완전히 이해하지 못하는 질적 리뷰어들에 의해 영속화됨을 시사합니다. 기술된 동료 심사(Peer review) 경험의 종류는 낯선 방법론적 접근을 마주했을 때 전문 지식과 개방성, 유연성을 모두 갖춘 "감식안이 있는(Connoisseur)" 리뷰어(Sandelowski, 2015; Sparkes & Smith, 2009)의 필요성을 시사합니다. 그러나 그러한 전문성(Expertise)—그리고 심사할 의지/능력—을 갖춘 리뷰어를 충분히 확보하는 것은 여전히 도전(Challenge)으로 남아 있습니다.

 

한 기여자는 우리가 대문자 Q 질적(Qualitative) 연구와 방법론적으로 일관성 없는 리뷰어 및 편집자의 요구 목록을 작성하여 이 논문(Article)에 제시해 줄 것을 요청했습니다. 우리는 이를 보충 자료(Supplemental Material)의 Note 1에 제공했습니다. 그러한 목록이 요청된 이유는 그것이 방법론적으로 일관성 없는 피드백(Feedback)에 대응하고 반박하는 데 도움이 되는 자원이 될 것이기 때문입니다. 이제 우리는 그러한 피드백을 헤쳐 나가는 기여자들의 전략으로 넘어갑니다.

 

 

방법론적으로 부조화한 피드백을 헤쳐 나가는 전략들
Strategies for Navigating Methodologically Incongruent Feedback 

비록 리뷰어/편집자의 코멘트가 방법론적으로 일관성이 없더라도, 저자인 우리가 그들의 체면을 세워주어야 한다는 느낌(Felt sense)이 있기 때문에 이것은 까다로운 문제입니다. 여기에는 부분적으로 저널과 저자인 우리 사이의, 그리고 연구를 출판하고자 하는 우리의 필요와 욕구 사이의 권력 격차(Power differential)가 작용합니다. 또 다른 부분은 편집자와 리뷰어들이 흥미를 잃게(Turned off) 만들기보다 무언가 배울 수 있는 방식으로 그들을 이끌도록 돕는 것에 관한 것입니다. (C31)

 

이 인용문은 많은 기여자가 묘사한 동료 심사(Peer review)의 경험, 정동(Affect), 그리고 권력 격차(Power differentials)를 강력하게 전달합니다.

 

일부 기여자들은 편집자들이 종종 "추가적인 코멘트나 피드백(Feedback) 없이 리뷰를 공유"(C14)하거나 "지침(Guidance)을 제공하지 않았음"(P122)을 지적했으며, 따라서 그들은 어떠한 편집상의 지원이나 투입(Input) 없이 방법론적으로 부조화하고 때로는 모순적인 피드백을 헤쳐 나가야 했습니다:

리뷰어 1은 (의역하자면) "이 논문(Article)은 확실히 수락될 수 없습니다, 여기엔 데이터가 없습니다. 저자는 방정식에 있어 투명하지 않습니다"라고 답신했습니다. 다른 리뷰어는 "이것은 훌륭하고 풍부한 질적(Qualitative) 연구입니다..."라고 썼습니다. 편집자는 저에게 두 리뷰어를 모두 고려하고 응답하라고 요청했습니다. (C10)

 

기여자들은 편집자들이 리뷰어들의 방법론적으로 부조화한 피드백(Feedback)과 질적 연구(Qualitative research)에 대한 비하적인 코멘트를 단순히 "통과시키는(Wave through)"(C102) 것에 대해 놀라움(Surprise)과 실망감을 표했습니다; 다른 이들은 일부 편집자들이 리뷰어의 코멘트 중 일부가 부조화하다는 사실을 단순히 "몰랐다(Did not know)"(C122)고 생각했습니다. 일부는 편집상의 지침(Guidance) 없이 흔들리기도 했습니다:

저는 동료 심사(Peer review) 과정에서 논문(Article)을 철회했습니다. 편집자에게 먼저 이야기했어야 했지만, 당시에는 코멘트가 그것을 어떻게 다루어야 할지에 대한 메모도 없이 공유되었기 때문에 아무 소용이 없다고 느꼈습니다. (C73)

 

대부분은 (심지어 모순적인) 피드백(Feedback)을 헤쳐 나가 재투고했습니다(몇몇은 논문[Article]이 거절되었습니다). 많은 이들이 그러한 피드백을 다루기 위한 전략을 개략적으로 설명했는데, 이는 때로는 구체적이고 때로는 일반적인 전략으로 종종 시간과 경험을 통해 연마된 것이었습니다(see also Watling et al., 2023). 일부는 방법론적으로 부조화한 코멘트를 선택적으로 무시했습니다; 일부는 코멘트가 너무 강력한 방법론적 단절을 보여줄 때 논문을 철회하기로 했습니다(see also Cerejo, 2014). 보고된 전략들은 대체로 (서로 겹치는)

 

  • 교육하기(Educating)(선제적 대응 포함),
  • 지원 구하기(Seeking support),
  • 결정에 대해 이른바 "이의 제기하기(Calling out)",
  • 순응(Acquiescence), 그리고
  • 편집자와 소통하기(Engaging with the editor)로 분류되었습니다.

 

기여자들이 보고한 가장 흔한 전략인 교육하기(Educating)는 전형적으로 요청된 변경 사항을 만들지 않는 것을 포함했습니다. 이는 그들이 왜 논문(Article)에 요청된 변경을 하지 않았는지, 그리고 그 피드백(Feedback)이 그들의 특정 질적(Qualitative) 접근법과 어떻게 부조화(Incongruence)한지 설명하는 것을 포함했습니다. 기여자들은 자신의 입장을 뒷받침하기 위해 관련 방법론 문헌을 인용하거나, 리뷰어에게 읽을거리를 추천하고, 사실상 그들(과 편집자)에게 일반적인 질적 연구(Qualitative research)의 가정과 자신의 접근법에 특화된 가정을 교육했다고 보고했습니다. 반박 답변을 작성하는 데 걸린 시간의 길이가 몇몇에 의해 언급되었습니다—기여자들은 리뷰어 및/또는 편집자의 예상되는 수용 태도에 부분적으로 의존하여 "장문의 답변"과 "직설적인 반박" 모두를 묘사했습니다. C161이 이 중 많은 부분을 전달했습니다:

저는 맞서 싸웁니다(Fight back)—굴복하지 않습니다. 저는 (여러 문단의) 긴 답변을 보내고 그들이 이해하기를 희망(Hope)합니다. 저는 명시적으로 주장을 심문하고, 질적 연구(Qual)를 위해 검정력 분석(Power analysis)을 하지 않는 것, 성찰적 주제 분석(RTA)을 위해 평가자 간 신뢰도(IRR)를 하지 않는 것, 해석학적 현상학적 분석(IPA) 연구를 위해 100명의 참가자를 두지 않는 것 등을 뒷받침하기 위해 참고문헌을 제공합니다. 그렇게 저는 인용문과 함께 각각의 부정확한 주장(Arguments)을 방어하고 반박하는데, 이것은 소모적이며(Exhausting), 종종 리뷰어들이 뜻을 굽히지 않아서 저는 질적 연구를 출판해 주는 새로운 저널을 찾습니다.

 

이 과정은 여기서(그리고 다른 이들에 의해) (소모적인) 전투로 프레임 되었으며, 이는 다른 이들이 언급한 적대적인 경험을 상기시킵니다(Jamali et al., 2020). 작업의 층위는 다음 섹션(Section)에서 권력과 함께 논의될 동료 심사(Peer review) 과정의 심리적 복잡성을 암시합니다. 이는 또한 특히 신진 연구자(ECRs)가 주목한 점과도 연결됩니다: 리뷰어와 편집자의 부조화한 코멘트에 대응하기 위해 적절한 지원 시스템을 갖추는 것의 중요성(see also Watling et al., 2023)—특히 반박을 장려하는 시스템 말입니다:

코멘트에 대해 함께 논의할 수 있는 좋은 지도 팀(Team)이 뒤에 있어서 운이 좋았습니다. (C151)

리뷰어에게 정중하게 안 된다고 말할 수 있다고 상기시켜 준 것은 더 선임인 다른 팀(Team) 구성원들이었습니다. (C58)

 

지원은 전형적으로 저자 주위의 혹은 배후의 "팀"을 의미하며, "질적 연구(Qualitative research)에 대한 오랜 참여의 역사와 그러한 연구 출판에 있어 확고한 명성을 가진"(C163) 사람들과 함께하는 것은 눈에 띄게 도움이 되었습니다. 이는 그러한 지원에 접근(Access)할 수 없는 사람들에게 어떻게 자원을 제공할 것인가에 대한 문제를 제기합니다—우리는 이 논문(Article)이 그 점에 기여하기를 희망(Hope)합니다.

 

또 다른 전략은 제출한 저널이나 동일한 방법론적 접근법을 사용한 유사 저널의 논문(Article)을 인용하는 것이었습니다. 기여자들은 자신의 논문이 질적 연구(Qualitative research)에서 확립된(Established) 관행을 대표한다는 주장(Argument)을 뒷받침하기 위해 이 접근법을 사용했습니다:

저는 또한 제가 제출한 저널에 최근 출판된 논문(Article)을 자주 인용하여, 해석적/비판적 질적(Qualitative) 연구(Scholarship)가 방법론적 헌신(Commitments)을 타협하지 않고 수락된 사례들을 보여줍니다. (C24)

 

한 중진 연구자는 리뷰어들 간의 불일치를 자신에게 유리하게 이용하여, 리뷰어 중 한 명의 방법론적으로 부조화한 피드백(Feedback)을 무력화했다고 설명했습니다. 일부는 편집자에게 직접 연락하여 "이러한 진술들의 문제점을 알리거나"(C90), 심사 과정에 대해 불평하거나, 요구된 수정 사항이 거래를 결렬시킬 만한(Deal breakers) 것인지 확인했습니다. 이러한 전략들은 그것을 알고 있고, 그렇게 할 수 있다고 느끼는 연구자를 필요로 합니다.

 

다른 이들은 논문(Article)을 작성할 때 선제적(Preemptive) 전략을 사용한다고 설명했습니다. 한 ECR은 논문 내에서 왜 특정 관행이 사용되지 않았는지 설명하고 관련 문헌을 인용함으로써 비판을 선제적으로 방어하려고 노력했다고 언급했습니다. 이 전략이 항상 통하는 것은 아니었습니다. 또 다른 ECR은 자신이 이미 하지 않은 이유를 정당화했던 바로 그 일을 하도록 요청받았다고 설명했습니다.

 

전반적으로, 이러한 전략들은 때로는 효과적이었고, 때로는 그렇지 않았습니다. 만약 밀어붙이는 것이 통하지 않는다면, "굴복하기(Caving)"/"투항하기(Capitulating)", 타협하기 또는 다른 곳에 제출하기가 주된 대응이었습니다. 일부는 논문(Article)을 다시 수정하거나 거절당하고 싶지 않았기 때문에 리뷰어와 편집자의 요구를 따르기로 실용적인 결정을 내렸다고 설명했습니다:

저는 수정본이 다시 반려될까 봐 걱정되어(Worry) 리뷰어들에게 투항하는 편입니다. (C162)

설명하려고 노력했지만 ECR로서 저는 종종 리뷰어의 코멘트에 신세를 지고 있다는 느낌과 그것을 해결해야 한다는 압박감을 느낍니다. (C84)

 

이는 심사 과정에 내재된 권력을 강조하며, 이는 ECR이나 경험이 적은 질적(Qualitative) 학자들에게 잠재적으로 더 예리하게 영향을 미칩니다. 일부는 경험이 적고 자신감이 덜했을 때, 과거에 투항했던 경험을 언급했습니다:

경력 초기에는 그냥 참고 견디며(Sucked this up) 누군가에게 일정 비율을 이중(Double) 코딩하게 했습니다. 지금은 거절하고, 대신 팀(Team)이 처음부터 어떻게 코딩(Coding) 프레임워크를 개발하고 주제를 다듬는 데 관여했는지 포함시키며, 인식론적으로 이 입장을 방어합니다. (C115)

 

그러나 부조화한 관행을 요구하는 것은 무엇이 일치하는(Congruent) 혹은 좋은 관행으로 이해되는지(Understood as)에 대해 "미래에 영향(Play forward)"을 미칠 수 있습니다. 한 ECR은 논문(Article)에서의 투항뿐만 아니라, 그들이 질적(Qualitative) 방법을 가르치는(Taught) 방식의 변화에 대해 설명했습니다:

이 경우, 저는 테뉴어 트랙(Tenure track) 교수(Faculty)로서 이 논문(Article)을 출판해야 할 필요성을 느꼈기 때문에 그들의 요구에 전적으로 굴복했습니다(Caved). 더 나아가, 이와 같은 리뷰어/편집자의 코멘트는 제가 질적(Qualitative) 방법을 가르치는 방식에 영향을 미쳤습니다—저는 학생들이 출판하려고 할 때 마주할 이러한 기대에 대비시키기 위해 평가자 간 신뢰도(Interrater reliability) 통계/방법에 더 큰 초점을 맞추기 시작했습니다. (C83)

 

다른 이들은 맞서 싸우기(Fighting)와 투항하기 사이에서 줄타기를 했습니다: 그들은 리뷰어와 편집자의 코멘트를 부분적으로 수용했지만, 연구의 무결성(Integrity)을 완전히 훼손했다고 느낄 정도까지는 아니었습니다. 예를 들어:

평가자 간 신뢰도(Interrater reliability)는 제공하지 않았지만 결과에서 정서의 유병률(Prevalence)을 나타내는 몇 단어(e.g., "대부분의 참가자는 ...라고 느꼈다")를 삽입했습니다. (C132)

 

일부는 피드백(Feedback)에 응답할 때 리뷰어나 편집자의 기분을 상하게 할 것에 대한 두려움과, 이것이 논문(Article) 출판 및 경력 진행에 미칠 잠재적 함의를 언급했습니다. 이것은 우리를 권력과 (감정) 노동(Labor)의 문제로 이끕니다.

 

 

권력 역학, 상실, 그리고 (감정) 노동
Power Dynamics, Loss, and (Emotional) Labor
 

편집자에게 이의를 제기하는 것은 매우 어렵습니다. 만약 제가 편집자와 동료(Peer) 리뷰어들의 기분을 상하게 했을 때의 여파에 대한 두려움이 적었다면, 저는 답장으로 ... 코멘트 중 일부가 방법론(Methodology)과 분석에 대한 철저한 이해를 보여주지 못한다고 생각한다고 말했을 것입니다 (C156).

 

이 섹션(Section)은 동료 심사(Peer review) 시스템 내의 권력 역학(Power dynamics), 이것의 영향, 그리고 참여자들이 이를 헤쳐 나가며 관여했던 감정적 및 기타 노동(Labor)에 초점을 맞춥니다. 앞서 인용한 문구들은 이미 저자들이 상대적으로 무력하다고 느끼는 시스템을 환기했으며, 이는 우리에게 동료(Peer) 관여 역학이라기보다는 시험(Examination)처럼 느껴졌던 점입니다. 일부에게 있어, 이러한 권력 역학은 질적(Qualitative) 접근법에 양적(Quantitative) 접근법과 동등한 지위를 부여하지 않는 학문적/학술적 실패를 반영하기도 했습니다:

저는 이 분야에 익숙하지 않은(Familiar) 사람들이 심사를 할 수 있다고 느끼는 것은 오만의 극치라고 생각합니다. 저는 이것이 질적 연구(Qualitative research)가 어딘가 "부족하며(Less than)" 그 자체의 엄격한 방법론(Methodology)을 가지고 있지 않다는 일부 학문 분야(Disciplines) 및 분야의 태도에서 비롯된다고 느낍니다. (C78)

 

이전의 인용문들은 동료 심사(Peer review)에서 질적 연구(Qualitative research)의 언어와 프레이밍(Framing)이 어떻게 그것을 양적(Quantitative) 연구보다 덜한 것, 비엄격한 것으로 위치시켰는지 보여주었습니다. 일부는 방법론적으로 부조화한 코멘트가 미묘한 인종주의(Racism)와 같은 다른 유형의 부적절한 동료 심사 관행과 함께 가거나, 그것을 가리는 베일(Veil) 역할을 했다고 지적했습니다. 예를 들어, 원주민 공동체를 대상으로 한 연구는 한 리뷰어에 의해 "다소 편협한(Parochial)" 것으로 특징지어졌습니다 (C141). 또 다른 기여자는 작동 중인 글로벌 노스/사우스(Global North/South) 권력 역학(Power dynamics)에 주목했습니다:

제 경험과 "글로벌 사우스(Global South)"에서 질적 연구(Qualitative research)를 수행하고 "글로벌 노스(Global North)" 저널(심지어 비판적[Critical] 저널이라도)에 논문을 제출하는 동료들의 경험에 비추어 볼 때, 이 또한 주목할 가치가 있습니다. 종종 우리가 받는 "방법론적으로 일관성 없는 코멘트"는 지적 우월감의 미묘하고도 명백한(Overt) 어조(Tones)로 포장되어 있습니다: 이 문장을 저런 방식이 아닌 이런 방식으로 써라, (당면한 주제와 더 관련이 있을 수 있는) 현지 소스가 아닌 글로벌 노스 연구자들의 연구와 방법을 인용해라 등입니다. (C143)

 

이러한 설명들은 소외된 집단 출신의 연구자들에게 동료 심사(Peer review)가 끼치는 불균형한 해악을 상기시킵니다(e.g., Rodríguez-Bravo et al., 2017; Silbiger & Stubler, 2019). 많은 기여자가 방법론적으로 부조화한 심사의 영향을 언급했습니다. 부적절한 심사 코멘트는 감정적인 영향을 미쳤는데—특히 신진 연구자(ECRs)들에게 그러했습니다(see also Majumder, 2016; Watling et al., 2023). C156은 "이러한 코멘트에 완전히 압도당했다(Floored)"고 했으며, C30은 다음과 같이 느꼈다고 언급했습니다:

비참하고 자신감이 떨어졌으며, 이미 심했던 가면 증후군(Impostor syndrome)이 만연해졌습니다.

 

응답의 노동(Labor)을 묘사하면서, 일부는 그러한 코멘트에 대응할 때 어조(Tone)의 중요성을 언급했습니다: "정중하지만 단호하게"(C142) 대응하는 관행, "친절하고 단호하게"(C87), "인내심 있게"(C99), "존중하며"(C122), 그리고 "'달래는(Appeasing)' 언어"(C85)와 "전문적이고 친근한 어조"(C146)를 사용하는 것 등입니다. 동료 심사(Peer review)의 심리적 부담에 대한 기존 보고(e.g., Horn, 2016; Majumder, 2016; Watling et al., 2023)와 일치하게, 일부 기여자들은 방법론적으로 부조화한 리뷰어와 편집자의 코멘트에 피로감과 좌절감을 느꼈다고 보고했습니다. 후기 경력 연구자들은 그러한 코멘트가 ECR들에게 미치는 해로운 심리적 영향에 대해 우려를 표했습니다(광범위한 문헌에서도 언급됨; Hollister et al., 2023). 이러한 유형의 코멘트는 일부 ECR들로 하여금 특정 유형의 질적 연구(Qualitative research)나 질적 연구 전반을 계속해야 할지에 대해 의문을 갖게 만들었습니다:

그것은 매우 좌절감을 주며, 리뷰어들과의 힘겨운 싸움(Uphill battle)이 너무 잦기 때문에 미래에 공동 생산(Co-production) 작업을 계속하는 것을 꺼리게 만듭니다. (C162)

저는 이것이 심각한 문제라고 생각합니다—초기 경력 연구자들이 이런 종류의 조언을 받을 때 특히 매우 사기를 꺾을 수 있습니다. (C14)

 

일부 ECR들의 우려는 좌절감(Frustration)을 넘어섰는데, 그들은 그러한 심사가, 그리고 그에 수반되는 그들 학문 분야(Disciplines)질적 연구(Qualitative research) 지식의 부재가 자신의 경력 진행에 미칠 영향을 고려했기 때문입니다. 기여자들은 방법론적으로 부조화한 코멘트를 반박하는 데 소요되는 시간(Time)—다른 곳에 더 생산적으로 쓰일 수 있었을 시간—을 지적했습니다. 일부 ECR들은 부적절한 동료 심사(Peer review) 관행 때문에 피드백(Feedback), 학습 및 개발, 지적 대화(Dialogue) 또는 논문(Article) 개선을 위한 기회를 놓치고 있다고 느꼈습니다(see also Watling et al., 2023). 예를 들어, C94는 다음과 같이 언급했습니다:

저 자신의 질적 연구 방법에 대한 이해도 분명 개선될 수 있겠지만, 훨씬 더 흥미롭고 풍요로운 논쟁 대신 반박을 통해 얕고 기본적인 논쟁(Arguments)을 해야 한다는 것은 좌절감을 줍니다.

 

출판 의무는 ECR들에게 추가적인 압박을 가중시켰고, 이는 부정적인 동료 심사(Peer reviews)를 받을 때 불안을 야기할 수 있습니다(Horn, 2016):

극도로 불공평해 보이고 내 경력을 위태롭게 하는 코멘트에 대응할 기회가 없었던 적이 여러 번 있었습니다. 그런 코멘트에 대응하는 것은 특히 초기 경력 단계에서 너무 오랜 시간이 걸립니다. 질적(Qualitative) 연구자로서 제 직업(Profession)에 대한 동기를 유지하는 것이 개인적으로 힘들었습니다. (C146)

초기 경력 연구자로서, 저는 최근 두 번이나 리뷰어들로부터 질적(Qualitative) 논문을 위한 제 표본이 통계적으로 유의하지 않다는 말을 들었습니다. 자신의 전문적인 경력이 그것을 존중(Respect)하지 않거나 이해하지 못하는 사람들에 의해 결정된다는 것을 아는 것은 절대적으로 비참한 일(Gutting)입니다. (C33)

 

일부는 더 오래 근무했거나 더 경험이 많은 리뷰어와 편집자들에게 질적 연구(Qualitative research)에 대해 "교육해야만 했다(Having to educate)"(P127)고 보고했습니다:

리뷰어들에게 질적(Qualitative) 방법에 대해 가르쳐야 한다는 것은 스트레스 받고 좌절감을 주는 일이며(애초에 그들이 논문을 심사할 방법론적 전문성[Expertise]을 갖추었다고 동의했음에도 불구하고), 편집자들 또한 더 잘 알지 못하거나 이러한 리뷰를 논문 거절의 구실로 사용할 때 실망스럽습니다. (C144)

동료 심사(Peer review)는 좋을 때는 좋지만, 나쁠 때는 종종 나쁩니다. 왜냐하면 기본적으로 리뷰어/편집자들에게 '질적 연구 개론(Qual 101)'을 가르치는 셈이고 그것은 극도로 지루하기 때문입니다. 저는 제 작업이 개선되거나 명확해진다고 느끼기보다, 제 작업을 심사해서는 안 될 사람들을 위해 노동(Labor)에 참여하고 있다고 느낍니다. ... 박사 과정/초기 경력 연구자로서 동료 심사(Peer review)가 종종 당신의 아이디어나 당신이 이야기하는 문헌에 진지하게 관여하는 사람들을 포함하지 않는다는 것은 정말로 실망스럽습니다. 대신, 당신은 그저 어떤 리뷰어의 손을 잡고 질적 연구(Qualitative research)의 기초를 안내하고 있으며 모두의 시간이 낭비되고 있습니다. (C8)

 

한 기여자는 방법론적으로 부조화한 동료 심사를 통해 질적 연구(Qualitative research)의 타당성(Validity)과 무결성(Integrity)에 대한 도전(Challenges)이 가져오는 현실 세계의 결과를 고려할 때, 부조화한 동료 심사(Peer review) 경험이 자신을 어떻게 느끼게 만들었는지를 "극적으로" 표현했습니다:

이것이 얼마나 극적으로 들리는지 알고 있지만, 리뷰어들이 이 방법론(Methodology)과 분석을 이해하지 못한다는 현실은 제가 박사 학위를 하느라 시간을 낭비했다고 생각하게 만듭니다. ... 만약 제가 출판할 수 없다면, 정규직 자리를 확보하는 것은 믿을 수 없을 정도로 어려울 것입니다. 저는 이 연구의 가치를 강하게 믿지만, 시간을 되돌려 그냥 박사 학위를 하지 않았으면 좋겠다고 바랍니다(Wish). (C156)

 

이 시스템 내에서, 일부 ECR들은 출판이 필요했기 때문에 방법론적으로 부조화한 요구를 따라야 할 의무감을 느꼈다고 보고했습니다:

테뉴어 트랙(Tenure track) 교수(Faculty)라는 저의 지위 또한 저로 하여금 리뷰어의 요구에 동의하지 않더라도 출판하고 따르도록 압박감을 느끼게 만듭니다. (C83)

 

이러한 알고도 하는 타협(knowing compromise)(see also Overall, 2015)은 불평등한 권력을 강조하며, 동료 심사(Peer review)가 어떻게 의도된 것과 정반대로 행해지고 품질에 반(反)하여 작동할 수 있는지를 입증합니다. 다른 이들에게는 방법론적 무결성(Integrity)을 가지고 질적 연구(Qualitative research)를 계속 수행하고 출판하는 작업이 무엇보다 중요했습니다—C161이 사용한 언어는 그것이 필요로 할 수 있는 노력을 전달합니다:

저는 학과에서 혼자라고 느끼며, 끊임없이 싸우고(Fighting) 있습니다. ... 저는 질적 연구(Qual)에 열정적이며, 계속 싸울 것입니다—저는 이 고지에서 죽을 것입니다(I will die on this hill)!!!!

 

이것은 질적(Qualitative) 연구자들이 "동화(Assimilation), 오용, 그리고 흡수(Co-option)에 저항하기 위해 방법론적 다원주의(Methodological pluralism)와 질적 패러다임(Paradigms)의 변혁적 가능성을 보존하도록 굳건히 버틸 것"을 요구한 Morrill and Rizo (2023, p. 416)의 주장을 메아리(Echoes)칩니다. 비록 우리는 이에 동의하지만, 우리의 연구는 이것이 가져올 수 있는 부담을 보여줍니다. 이미 제시된 인용문 전반에 걸쳐, 기여자들의 좌절감(Frustration)은 명백하며, 그러한 심사가 미치는 정동적(Affective) 영향과 이에 대응하기 위해 필요한 노동(Labor) 또한 명백합니다. C78은 이를 적나라하게 환기했습니다:

저는 이런 코멘트를 받는 것에 너무 지쳤습니다. 이것이 제가 이런 일을 겪은 유일한 경우가 아니며, 단지 가장 최근의 일일 뿐입니다.

 

질적 논문의 동료 심사 무결성 향상을 위한 제언
Recommendations for Improving the Integrity of Peer Review of Qualitative Articles
 

여기서 우리는 질적 연구(Qualitative research)의 동료 심사(Peer review)에 대한 방법론적 무결성(Integrity)을 향상하기 위한 기여자들의 제언을 종합(Synthesize)합니다(이는 때때로 기존의 제언들과 일치하기도 했습니다; e.g., Braun & Clarke, 2023; Levitt et al., 2018). 우리는 제안(Suggestions)을 (a) 저널; (b) 편집자; 그리고 (c) 리뷰어의 책임으로 분류했습니다.

 

일부는 저널/편집 위원회저널의 "가치" 선언(목표 및 범위[Aims and scope])에서 질적 연구(Qualitative research)가 범위 내에 있는지, 만약 그렇다면 어떤 유형(Types)의 질적 연구가 그 범위에 속하는지를 명확히 해야 한다고 제안했습니다. 보고 지침이나 체크리스트(Checklists)에 대한 저널의 사용에 대해서는 엇갈린 관점(Perspectives)이 있었으며—이는 더 넓은 범위에서의 서로 다른 입장을 반영합니다(e.g., Allen et al., 2019; Barbour, 2001; Braun & Clarke, 2024; Buus & Perron, 2020; Herber et al., 2020; Spigt & Arts, 2010). 체크리스트(등)에 대해서는 신중론이 표명되었습니다:

품질 평가의 수단으로서 [그것들은] 다소 제한적이며, 경험 많고 지식 있는 리뷰어가 제기할 핵심적인 개념적 질문들을 피하려는 경향이 있습니다. (C124)

 

일부는 많은 체크리스트(Checklists)가 보건 연구에서 후기 실증주의(Postpositivism)의 지배(Dominance)를 입증한다고 주장하며(Buus & Perron, 2020), 편집 위원회/편집자들이 COREQ(Tong et al., 2007)나 비판적 평가 기술 프로그램(Critical Appraisal Skills Programme)(2018)과 같은 체크리스트의 제한된 적용 가능성을 인식하기를 원했습니다. 한 후기 경력 연구자는 일부 편집자들이 이 논문(Article)에 대한 반응으로 동료(Peer) 리뷰어들에게 체크리스트나 보고 지침 사용을 의무화할까 봐 우려를 표했는데—그들은 이것이 정답이 아니라고(Not) 느꼈습니다. 더 유익한 것은 편집 위원회와 리뷰어 풀(Pool)에 질적(Qualitative) 전문가를 포함하도록 보장하는 것입니다. 그리고 다른 리뷰어들과 함께 질적(Qualitative) 방법론(Methodology)에 전문성(Expertise)을 갖춘 부편집자나 리뷰어가—방법론에 초점을 두고—질적 논문을 동료 심사(Peer review)해야 합니다(see also Cooper, 2009; Herber et al., 2020; Spigt & Arts, 2010).

 

편집자에 대한 핵심 요구사항은 "아무 리뷰어면 된다"는(C17) 입장을 거부하고 적절한 방법론적 전문성(Expertise)을 갖춘 리뷰어를 선정하는 것이었으며(see also Herber et al., 2020), 여기에는 그러한 전문성에 대해 리뷰어를 선별(Screening)하는 것도 포함됩니다(see Cooper, 2009; Majumder, 2016). 기여자들은 동료(Peer) 리뷰어를 위한 "역량(Competence)의 표준"(C84)과 동료 심사(Peer review)를 위한 훈련(Training)의 필요성을 언급했습니다(문헌에서 널리 권장됨; e.g., Cooper, 2009; Majumder, 2016; Overall, 2015). 편집자에 대한 또 다른 핵심 제언은 동료 리뷰어가 부조화한 코멘트를 할 때 편집자가 개입해야 한다는 것입니다—리뷰어의 의견을 기각하고 저자에게 일관성 없는 코멘트를 무시하라고 조언하는 것뿐만 아니라, 리뷰어에게 피드백을 주고 교육하는 것까지 포함해서 말입니다.

비질적(Non-qual) 혹은 특정 전통(Tradition)의 리뷰어로부터 온 코멘트를 다루는 편집자들은 더 주의를 기울여야 합니다. 심사가 어렵다는 것은 알지만, 편집자들은 일부 리뷰어들의 포화(Saturation)나 일반화 가능성에 대한 제안(Suggestions)이 그냥 명백히 틀렸다는 것을 더 강력하게 명시해야 하며—이것을 리뷰어들에게 말해줘야 합니다!!! 그것이 그들이 정보를 얻을 수 있는 유일한 방법일지도 모릅니다. 우리는 리뷰어들이 자신의 방법론적 약점을 인식하거나, 질적 연구(Qual)는 그저 질문을 던지고 종이에 비웃음을 적는 것이라는 일부의 인식을 바꿀 만큼 충분히 겸손할 것이라고 의존할 수 없습니다. (C127)

 

편집자인 한 참여자는 정확히 이러한 유형의 개입에 참여하고 있다고 설명했습니다:

저는 그러한 논문들에 대해 적어도 한 명의 리뷰어는 질적(Qualitative) 연구자가 되도록 항상 보장합니다. 저는 질적 방법을 부정확하게 비판하는 양적(Quantitative) 연구자들의 코멘트가 옳지 않다면 항상 기각(Overule)합니다. 저는 또한 그들에게 사적으로 메시지를 보내 왜 그 코멘트가 옳지 않은지 설명하는데, 이것이 그들이 미래에 질적 논문에 대한 리뷰를 개선하는 데 도움이 되기를 희망(Hope)해서입니다. (C118)

 

부적절한 동료 심사(Peer review)에 대한 더 큰 편집상의 개입에 대한 이 제언은 다른 곳에서도 언급된 바 있습니다(Cooper, 2009; Hollister et al., 2023).2

 

리뷰어 자신들에 관해서는, 일부는 만약 동료(Peer) 리뷰어들이 적절한 방법론적 지식을 갖추지 못했다면 코멘트를 주제(Subject matter)에 한정하거나 초대를 수락하지 말아야 한다고 제안했으며, 이는 동료 심사(Peer review)에 대한 기존의 윤리적/훌륭한 관행 지침(Practice guidelines)과 일치합니다(e.g., COPE, 2017; Napolitani et al., 2017; Spigt & Arts, 2010). 자신의 지식과 전문성(Expertise)의 한계에 대해 솔직하게(Honestly) 성찰하는 것 또한 리뷰어들에게 권장되었습니다(see also Herber et al., 2020):

만약 당신이 질적(Qualitative) 연구자가 아니고 다양한 질적 접근법의 뉘앙스를 이해하지 못한다면, 질적 논문(Articles)을 심사하지 말거나 적어도 당신의 리뷰어 피드백(Feedback)에서 이를 인정하고 당신이 잘 모르는 것에 대해서는 코멘트하지 마십시오. (C101)

 

개선을 위한 기여자들의 제안(Suggestions)은 때때로 변화를 실행하는 데 따르는 도전(Challenges)에 대한 인식 속에서 표현되었습니다—많은 분야에서 동료 심사(Peer review) 및 저널 편집의 자발적(Voluntary)이고 무보수인 성격, 편집자들이 리뷰어를 확보하는 데 겪는 어려움의 증가(적절한 지식을 갖춘 리뷰어는 말할 것도 없고; Overall, 2015), 그리고 깊은 질적(Qualitative) 지식을 갖춘 잠재적 리뷰어 풀의 한계 등을 포함해서 말입니다. 그러나 변화를 실행하지 않았을 때의 영향—개인과 더 넓게는 학문 연구(Scholarship)에 미치는—은 더 나은 질적 심사 관행에 대한 시급한 필요성을 시사합니다.

결론 Conclusions 

기여자들에 의해 묘사된 부적절한 동료 심사(Peer review) 관행들, 특히 후기 실증주의적 가정과 규범의 보편화(Universalizing)와 관련된 관행들은, "질적(Qualitative) 방법들이 과학주의(Scientism)에 의해 제약받아 왔으며 후기 실증주의 프레임워크 내로 포섭(Subsumed)되었다"는 Morrill and Rizo (2023, p. 404)의 주장(Argument)을 입증합니다(see also Gough & Lyons, 2016). 그들은 출판 절차가 질적 연구(Qualitative research)의 다양성(Diversity)을 제한할 수 있다고 언급했습니다. 우리의 연구는 동료 심사가 이 현상에 기여하는 바를, 그리고 (다양한 접근법의) 질적 연구에 익숙하지 않은 리뷰어와 편집자들, 그리고 출판 압력이 어떻게 질적 연구의 방법론적 무결성(Integrity)을 훼손(Compromise)할 수 있는지를 입증합니다. Morrill and Rizo는 방법론적 무결성을 "흡수(Co-option)에 대항하는 급진적 도구"(p. 404)로 주장했습니다. 우리의 연구는 많은 질적 연구자가 실제로 방법론적으로 부조화한 코멘트에 반발(Push back)하고 있음을 입증하지만, 항상 성공적인 것은 아닙니다. 방법론적으로 부조화한 심사는 때때로 지식 생산의 문지기(Gatekeeping)를 위한 도구로 작용하여, 리뷰어와 편집자가 연구를 수행하는 올바른(Right) 방법을 정의하기도 했습니다(see Atjonen, 2018). 동료 심사(Peer review)는 학습과 기술 구축을 위한 잠재력(Potential)을 제공합니다. 그러나 기여자들이 보고한 경험들은 종종 동료 심사(Peer review)를 위한 윤리적이고 훌륭한 관행 지침(Practice guidelines)(e.g., Allen et al., 2019; COPE, 2017)에서 논의된 건설적인(Constructive) 피드백—피드 포워드(Feeding forward)(Atjonen, 2018)—과는 거리가 멀었습니다.

 

우리 기여자들에 의해 묘사된 방법론적으로 부조화한 코멘트의 종류가 1990년대 후반/2000년대 초반(e.g., Clark, 2003; Martin et al., 1999; Zaruba et al., 1996)과 그 이후(e.g., Braithwaite et al., 2014; Herber et al., 2020)에 기록된 것들을 메아리(Echo)친다는(상기시킨다는) 사실은, 수십 년에 걸친 질적 연구(Qualitative research)에 대한 열악한 심사의 지속성(Persistence)을 강조하며, 심지어 최근 질적 연구가 더 널리 가치 있게 여겨지고 사용됨에도 불구하고 좌절스러울 만큼 변한 것이 거의 없음을 시사합니다. 우리는 동료(Peer) 리뷰어와 편집자들에게 동료 심사(Peer review)의 윤리적 원칙과 책임을 진지하게 받아들이고 질적 연구(Qualitative research) 동료 심사의 무결성(Integrity)을 향상하기 위한 기여자들의 제안(Suggestions)을 고려할 것을 촉구합니다. 그리고, 우리는 출판사들3이 이 과업에서 리뷰어와 편집자를 지원하고, 동료 심사의 방법론적 무결성과 모든 형태의 질적 연구의 품질이 번영(Flourish)할 수 있는 동료 심사 시스템을 개발할 것을 촉구합니다.

 

 

 

 

 

Clin Teach. 2025 Aug;22(4):e70145. doi: 10.1111/tct.70145.

Sampling Thoughtfully in Qualitative Research: Hallmarks of Rigour in Health Professions Education 

Affiliations Expand

 

📚 질적 연구, '누구'를 인터뷰해야 할까? (feat. 신중한 표집)

안녕하세요! 연구자 여러분, 혹은 예비 연구자 여러분. 👋 오늘은 질적 연구(Qualitative Research)를 준비할 때 가장 골치 아픈 문제 중 하나인 '표집(Sampling)'에 대해 아주 명쾌하게 정리해 둔 논문을 소개해 드리려고 해요.

보건 의료 교육 분야의 논문이지만, 질적 연구를 하는 모든 분에게 피와 살이 되는 내용이랍니다. 특히 "도대체 몇 명을 인터뷰해야 통과될까?"를 고민 중이시라면 꼭 끝까지 읽어보세요!


1. 양적 연구와는 출발점부터 다릅니다 💡

보통 통계 돌리는 양적 연구(Quantitative Research)에서는 표본이 전체 모집단을 대표(Represent)할 수 있는지가 중요하죠. 그래서 무작위로, 많이 뽑으려고 노력합니다.

하지만 질적 연구는 다릅니다. 우리는 일반화(Generalization)가 목적이 아니라, 어떤 현상을 깊이 있게 이해(In-depth understanding)하는 게 목표니까요. 그래서 연구진은 이렇게 강조합니다.

"사례 선택은 질적 탐구의 기초입니다. 당신의 탐구에서 무엇을 발견할지는 당신이 연구하는 사례들에 의해 결정될 것입니다." "Case selection is the foundation of qualitative inquiry. What you find from your inquiry will be determined by the cases you study."

 

즉, 아무나 많이 뽑는 게 아니라, 내 연구 질문에 가장 풍부한 이야기를 들려줄 수 있는 '정보가 풍부한 사례(Information-rich cases)'를 찾는 게 핵심입니다.


2. 전략적으로 뽑아라: 의도적 표집 (Purposive Sampling) 🎯

이 논문에서는 다양한 표집 전략을 소개하는데요, 결국 모든 것은 '의도적 표집(Purposive Sampling)'으로 귀결됩니다. 연구 목적에 맞는 사람을 전략적으로 선택한다는 뜻이죠. 가장 흔히 쓰이는 세 가지 방법을 알아볼까요?

① 편의 표집 (Convenience Sampling) 

말 그대로 연구자가 접근하기 쉬운 사람들을 뽑는 거예요. "내 주변 동료 의사", "우리 학교 학생" 등이죠.

  • 장점: 빠르고 쉽다. 파일럿 연구에 좋다.
  • 단점: 데이터가 편향될 수 있고, 연구의 엄격성이 떨어져 보일 수 있다.

② 최대 변이 표집 (Maximum Variation Sampling)

연구진이 가장 추천하는 방법 중 하나입니다. 성별, 경력, 인종 등 다양한 배경을 가진 사람들을 골고루 뽑는 거예요.

  • 이유: 다양한 시각을 통해 공통적인 패턴을 발견하면 이론을 만들기(Theory development) 좋고, 결과가 더 풍부해집니다.

③ 눈덩이 표집 (Snowball Sampling) ❄️

한 명을 인터뷰하고, 그 사람에게 "주변에 이런 경험 있는 다른 분 소개 좀..." 하고 연결받는 방식입니다.

  • 이유: '가면 증후군'처럼 남들에게 잘 드러내지 않는 민감한 주제나, 찾기 힘든 전문가 집단을 연구할 때 아주 유용합니다.

3. 그래서, 몇 명이나 인터뷰해야 하냐고요?  🤔

이게 제일 궁금하시죠? "15명이면 될까요, 20명이면 될까요?" 연구진은 "고정된 공식(Fixed formula)은 없다"고 못 박습니다. 단순히 숫자를 채우는 게 중요한 게 아니기 때문이죠. 대신 '정보력(Information Power)'이나 '정보의 풍부함(Informational Richness)'을 생각해야 합니다. 10명이라도 그 내용이 엄청나게 깊고 새롭다면 충분하고, 50명이라도 뻔한 소리만 한다면 부족한 겁니다.

 

연구진의 핵심 조언을 들어보세요.

"표본 크기 결정은 정보적 풍부함을 우선시해야 합니다." "Sample size decisions should prioritize informational richness."

 

즉, "더 이상 새로운 얘기가 안 나온다(Saturation)" 싶거나 "이론을 설명하기에 충분하다" 싶을 때가 멈출 때입니다.


4. 연구자는 '작곡가'와 같습니다 🎼

마지막으로 이 논문의 결론 부분이 참 인상적이에요. 연구자가 표본을 뽑는 과정을 오케스트라의 작곡가에 비유했거든요. 어떤 사람의 목소리를 담아야 내 연구가 아름다운 화음을 낼지, 혹은 독특한 불협화음으로 새로운 통찰을 줄지 고민하는 과정이라는 거죠.

"표집에서 연구자의 역할은 단순한 선택을 초월합니다; 그것은 다성적 서사를 형성할 독특한 목소리들을 의식적으로 큐레이팅하는 작곡가의 역할과 흡사합니다." "The researcher's role in sampling transcends mere selection; it is akin to that of a composer, consciously curating the distinct voices that will form a polyphonic narrative."


📝 요약하며

질적 연구를 준비하시나요? "몇 명 뽑지?"를 고민하기 전에 "누가 내 연구 질문에 가장 깊이 있는 답을 줄 수 있지?"를 먼저 고민해 보세요. 그 신중한 표집(Judicious sampling)이 여러분 논문의 퀄리티를 결정지을 것입니다.

여러분의 멋진 연구를 응원합니다! 💪

 

 

1. 서론 (1 Introduction) 

질적 연구(qualitative research)에서 방법론적 엄격성(methodological rigour)의 성공에 있어 핵심은 표집(sampling) 과정이다 [1]. 사실, Patton [2]은 모집단(population)으로부터 표집하는 것—그가 정보가 풍부한 사례(information rich cases)를 선택하는 것이라고 명명한 것—으로서, 의미 있는 결과를 도출하기 위해서는 신중한 표집(judicious sampling)이 필수적이라고 주장한다: ‘사례 선택(case selection)은 질적 탐구(qualitative inquiry)의 기초이다. 당신의 탐구에서 무엇을 발견할지는 당신이 연구하는 사례들에 의해 결정될 것이다’. (p. 265). 의학 교육(medical education)에서, 질적 연구는 연구 탐구(research inquiry)와 관련된 풍부하고 미묘한 관점(nuanced perspectives)과 폭넓은 견해를 제공할 수 있는 참여자들을 모집함으로써 경험, 신념, 행동의 '무엇', '왜', '어떻게'를 탐구하는 것을 목표로 한다 [3]. 이러한 표집 선택(sampling choices)은 연구 결과(research findings)에 강력한 영향을 미치므로, 연구자들은 '연구 질문에 대한 철저한 탐구를 달성하려는 목표를 가지고' [3] 연구 질문(research question)과 관련하여 최상의 정보를 가진 사람들을 찾아야 한다. 연구자가 내리는 표집 결정(sampling decisions)은 무엇보다 중요하다. 예를 들어, 제한된 관점만을 제공함으로써, 부적절한 표집 전략(poor sampling strategies)은 연구의 진실성(integrity)을 심각하게 훼손하며, 이미 과소대표(underrepresented)되거나 침묵당한 모집단의 소외(marginalization)를 강화할 뚜렷한 위협을 제기한다 [4].

 

표집 선택(sampling choices)은 연구 결과에 강력한 영향을 미친다. 

 

양적 연구(quantitative research)에서의 표본은 연구 대상 모집단을 대표(represent)하기 위한 것이며—결과를 모집단으로 일반화(generalizing)하려는 의도를 가짐—반면, 질적 연구(qualitative research)에서는 사람들과 맥락에 대한 풍부하고, 심층적이며, 상세한 이해를 위한 기회에 관한 것이다 [5, 6]. 질적 연구자들은 연구 문제(research problem)에 대해 가치 있는 통찰(insights)을 제공하기에 가장 적합한 참여자들을 찾으며, 연구 질문에 가장 적절한 지식, 경험 또는 특성을 지닌 개인, 집단 또는 사례를 선택한다 [7]. 연구 시작부터 실행된 신중하게 설계된 표집 전략(sampling strategy)은 연구팀이 최종 분석 단계에서 발전시킬 수 있는 통찰의 질(quality)에 직접적인 영향을 미친다. 중요하게도, 누구를 표집할 것인가에 대한 결정은 얼마나 많은 참여자가 충분한가에 대한 결정—이것이 포화(saturation), 정보력(information power), 또는 자료 적합성(data adequacy)으로 프레임화되든지 간에—과 밀접하게 연결되어 있다. 우리는 이 문제를 논문의 뒷부분에서 다시 다룰 것이다.

 

질적 탐구에서의 다양한 표집 접근법들(Table 1 참조)은 근본적으로 의도적(purposive)인 성격에 의해 통합된다. 이러한 공유된 원칙은 분석 자체의 요구에 의해 주도되는데, 분석은 다양한 관점을 통합함으로써 의미의 패턴(patterns of meaning)을 식별하고자 하며, 따라서 정보가 풍부한 사례(information-rich cases)의 전략적 선택을 필요로 한다 [7]. 표집은 사람, 환경(settings), 사건(events), 그리고 과정(processes)을 포함한다. 이러한 매개변수들을 연구 질문과 일치시키는 것(aligning)이 중요하며, 선택된 것들이 이를 다루는 데 있어 대표성(representative)이 있고 시간 효율적(time-efficient)인지를 고려하는 것이 필요하다 (Miles & Huberman, 1984, 41, as cited in [20, 113]).

 

TABLE 1. Patton [2, 8]에 의해 정의된 질적 표집 전략 (Qualitative sampling strategies as defined by Patton [2, 8]) 

표집 기법 (Sampling technique) 정의 (Definition)
접근 주도적 또는 실용적 전략 (Access-driven or practical strategies) 실행 가능성(feasibility), 접근 제약(access constraints) 또는 네트워크 기반 모집(network-based recruitment)에 의해 주도됨
의도적 무작위 표집 (Purposeful random sampling) 연구자가 의도적으로 참여자를 선택하기 위해 일부 기준을 사용하면서도, 표본 내의 다양성을 확보하기 위해 선택 과정에 무작위성(randomness) 요소를 도입하는 하이브리드 접근법.

Example: [9]
전형적 또는 평균적 사례 (Typical or average cases) 모집단에서 공통적이거나 대표적인 것을 탐구하기 위함
동질적 표집 (Homogeneous sampling) 연구 목표와 관련된 유사한 특성이나 성향을 공유하는 참여자를 선택함. 목표는 선택된 참여자들이 연구 초점과 적절한 공통점(commonalities)을 갖도록 보장하여, 연구 중인 현상에 대해 보다 집중적이고 타겟팅된 조사를 가능하게 하는 것임.

Example: [10]
전형적 사례 표집 (Typical case sampling) 연구 대상 모집단의 '평균적(average)' 또는 '전형적(typical)' 특성을 대표하는 참여자를 선택함. 이는 전체 모집단을 정확하게 반영하는 대표 표본(representative sample)을 제공하여, 연구자가 결과를 더 넓은 집단으로 일반화(generalize)할 수 있게 함.

Example: [11]
최대 변이/다양성 (Maximum variation/diversity) 복잡성(complexity)과 패턴을 탐구하기 위해 광범위한 경험과 관점을 포착함
층화 의도적 표집 (Stratified purposeful sampling) 연구자는 연구 목표와 관련된 특정 특성이나 기준에 따라 모집단을 별개의 하위 그룹 또는 층(strata)으로 나눔. 각 층 내에서, 주요 특성이나 관심 있는 변이(variations)의 대표성을 보장하기 위해 참여자를 의도적으로 선택함.

Example: [12]
결합 또는 혼합 의도적 표집 (Combination or mixed purposeful sampling) 한 가지 유형의 의도적 표집에만 의존하는 대신, 연구자는 연구 목표와 관련된 다양한 기준에 따라 참여자를 선택하기 위해 여러 전략의 혼합(mixture of strategies)을 사용함. 이 접근법은 연구자가 표본 내에서 다양한 관점, 경험 또는 특성을 포착할 수 있게 하여, 수집된 자료(data)의 풍부함과 깊이를 향상시킴.

Example: [13]
극단적 또는 핵심 사례 (Extreme or key cases) 특이하거나, 강렬하거나, 중추적인 사례에 초점을 맞춰 통찰을 제공함
극단적 또는 일탈 사례 표집 (Extreme or deviant case sampling) 규범(norm)에서 극단적이거나 일탈적인 사례를 선택함. 이러한 사례들은 연구 중인 현상에 대한 독특한 통찰을 제공할 수 있는 특이한 특성, 행동 또는 결과를 보이기 때문에 선택됨.

Example: [14]
강도 표집 (Intensity sampling) 연구되는 현상의 높은 강도(intensity)나 집중도를 보여주는 사례 또는 참여자를 선택함. 이 방법은 현상이 특히 두드러지거나 만연한 경우에 초점을 맞추는 것을 목표로 함.

Example: [15]
결정적 사례 표집 (Critical case sampling) 연구자는 연구 중인 현상을 이해하는 데 있어 결정적(critical)이거나 중추적(pivotal)이라고 간주되는 사례를 의도적으로 선택함. 이러한 사례들은 주요 통찰을 제공하거나, 지배적인 가정(prevailing assumptions)에 도전하거나, 연구 질문과 관련된 극단적 또는 독특한 상황을 대표할 것으로 기대되기 때문에 선택됨.

Example: [16]
이론적/개념적 검증 (Theoretical/conceptual testing) 기존 이론이나 개념을 검증하거나 정교화하기 위함
준거 표집 (Criterion sampling) 연구 질문과 직접적으로 관련된 사전에 정의된 기준(predefined criteria)에 기초하여 참여자를 선택하는 것을 포함함.

Example: [17]
확증 및 반증 사례 (Confirming and disconfirming cases) 연구 중인 현상과 관련된 지배적인 이론, 가설 또는 가정을 확증(confirm)하거나 반증(disconfirm)하는 사례를 선택함.

Example: [18]
전략적 관련성 (Strategic relevance) 정책이나 대중적 담론과 높은 관련성이 있는 사례를 다루기 위함
정치적으로 중요한 사례 표집 (Sampling politically important cases) 정치, 거버넌스(governance) 또는 공공 정책 영역 내에서 중요성을 갖는 사례를 선택함. 이러한 사례들은 일반적으로 의사 결정, 여론 또는 정부 기관의 기능에 시사점(implications)을 가짐. 정치적으로 중요한 사례를 표집하는 것은 연구자가 정치적 사건, 정책 또는 행위자가 사회, 거버넌스 및 대중적 담론에 미치는 영향을 조사할 수 있게 함.

Example: [19]

 

이 논문에서 우리는 일반적인 표집 전략(sampling strategies)을 탐구하는 것으로 시작하여, 표본 크기(sample size)를 고려하고, 연구 전체에 걸친 표집의 역할을 고찰하는 것으로 마무리하며, 질적 연구에서의 표집에 대한 실용적인 가이드를 제공한다.

 

2 시작하기 (Getting Started) 

질적 연구 설계(qualitative research design)에서 가장 중요한 단계 중 하나는 표집 전략(sampling strategy)을 개발하는 것이다 [7]. 연구자들은 수행 중인 연구와 관련된 특정 기준에 따라 참여자나 사례를 식별하고 선택한다. 이를 통해 연구 주제에 대한 심층적인 통찰을 제공할 수 있는 관련 지식, 경험 및 관점을 보유한 참여자를 선택할 수 있다. 종종, 질적 연구에서의 표집은 반복적 과정(iterative process)으로 수행된다. 예를 들어, 표집 전략과 참여자 선택은 고정되어 있기보다는 연구자의 통찰이 깊어짐에 따라 함께 진화하는 것이 일반적이다. 자료 수집, 분석 및 집필 중에 자료의 공백(gaps)을 식별하게 되면, 연구자는 표집에 대한 결정을 재고하고, 충분한 정보를 얻기 위해 초점을 확장하거나 좁히도록 조정 및 정교화해야 할 수도 있다.

 

연구 주제에 대한 심층적인 통찰을 제공할 수 있는 관련 지식, 경험 및 관점을 보유한 참여자의 선택.

 

질적 연구에서의 표집은 양적 연구(quantitative research)의 표집과 근본적으로 다른데, 이는 한쪽은 연구자의 판단이 개입되고 다른 쪽은 그렇지 않기 때문이 아니라, 서로 다른 과학적 근거와 철학에 뿌리를 두고 있기 때문이다 [21].

 

  • 양적 표집 전략은 일반적으로 확률적 논리(probabilistic logic)에 기초하며, 더 큰 모집단을 통계적으로 대표(statistically representative)하는 표본을 생성하는 것을 목표로 한다 [22]. 이 접근법은 실증주의 패러다임(positivist paradigm)에 기반을 두고 있으며, 여기서 일반화 가능성(generalizability)과 객관성이 우선시되고, 연구자의 판단은 적격 기준(eligibility criteria)과 표집 틀(sampling frames)을 사전에 정의하는 데 집중된다.
  • 대조적으로, 질적 표집해석주의(interpretivist) 또는 구성주의(constructivist) 패러다임에 의해 안내되며, 여기서 목표는 특정 현상에 대한 깊고 맥락화된 이해(contextualized understanding)를 얻는 것이다. 여기서 연구자의 판단은 연구 목표와 일치하는 풍부하고, 관련성 있으며, 다양한 관점을 제공할 수 있는 참여자를 의도적으로 선택(purposefully select)하는 데 사용되는 핵심적인 방법론적 강점이다 [6].

 

다양한 연구 시나리오를 효과적으로 다루기 위해 수많은 표집 전략이 식별되었다 (Table 1 참조). Table 1의 전략들은 그 전략적 목적에 따라 그룹화되었다.

 

Table 1에 설명된 모든 표집 기법이 의학 교육의 질적 연구에 적절하게 적용될 수 있지만, 우리 분야의 연구에서 빈번하게 사용되기 때문에 특별히 주목할 가치가 있는 세 가지가 있다. 여기에는 편의 표집(convenience sampling), 최대 변이 표집(maximum variation sampling), 그리고 눈덩이 표집(snowball sampling)이 포함된다. 독자들이 이 세 가지 접근법을 적용하는 것을 돕기 위해, 우리는 각각을 더 자세히 논의한다. 우리는 의료 전문가들의 가면 현상(imposter phenomenon)을 가상의 연구 사례로 사용하여, 표집 기법들이 실제로 어떻게 작동하며 사용된 전략에 따라 어떻게 달라지는지를 보여준다.

2.1 편의 표집 (Convenience Sampling) 

편의 표집(Convenience sampling)은 가용성(availability), 근접성(proximity), 접근의 용이성(ease of access)에 기초하여 참여자를 선택하는 것을 포함한다 [23]. 연구자들이 편의 표집을 사용하기는 하지만, 내재된 의도적 접근(purposive approach)의 결여로 인해 일반적으로 선호되지는 않는다. 연구자들은 연구 설계에 영향을 미치는 요인들이 있어 시간 소모가 크고 비용이 많이 드는 다른 표집 기법을 사용할 수 없을 때 이 접근법을 채택한다. 편의 표집은 또한 파일럿(pilot), 탐색적(exploratory) 또는 예비(preliminary) 연구를 수행할 때 유용하다. 연구자들은 더 심층적인 연구를 위한 정보를 얻기 위해 빠르게 자료를 수집할 수 있다. 편의 표집은 질적 연구에서 견고한(robust) 기법으로 간주되지 않는다. 파일럿 연구에는 편리할 수 있지만, 유용하고 더 광범위한 통찰을 생성하는 것이 목표라면 권장되지 않는다.

 

실제 편의 표집의 예시는 Box 1을 참조하라.


Box 1: 실제 편의 표집 (Convenience sampling in practice) 

  • 연구 목표 (Study aim): 의사들 사이의 가면 현상(imposter phenomenon) 경험 조사.
  • 모집 전략 (Recruitment strategy): 연구자는 이메일, 메일링 리스트(listserv) 또는 게시된 광고를 통해 소속 기관의 임상 부서 내에서 쉽게 구할 수 있는 참여자를 모집하여, 가면 증후군(imposter syndrome)에 대한 경험, 전문적 환경에서의 발현, 그리고 그것이 웰빙에 미치는 영향을 탐구하는 인터뷰에 의사들을 초대한다.
  • 표집 고려사항 (Sampling considerations): 이 표집 접근법은 쉬운 접근성, 연구자나 환경에 대한 친숙함으로 인한 참여 의지 증가, 그리고 일정 잡기의 유연성과 같은 이점을 제공한다. 그러나 만약 모든 참여자가 가면 증후군을 거의 또는 전혀 경험하지 않는다고 말한다면, 편의 표집은 가면 증후군을 더 자주 경험하는 개인을 의도적으로 찾아내도록 수정되어야 하며, 아마도 최대 변이 표집(maximum variation sampling)으로 강화하고 다른 부서 및/또는 기관을 포함시켜야 할 것이다. 하지만, 인터뷰어와 인터뷰이의 친숙함은 모르는 참여자들과의 신뢰에 영향을 미칠 수 있고, 아는 참여자들과는 사회적 바람직성(social desirability)에 영향을 미칠 수 있다.

3 최대 변이 (이질성) 표집 (Maximum Variation (Heterogeneity) Sampling) 

최대 변이 표집(Maximum variation sampling)은 특정 연구 문제나 질문과 관련하여 광범위한 관점, 경험 또는 특성을 대표하는 개인들을 포함하는 것을 목표로 한다. 이 접근법은 다양한 표본을 구축하는 데 도움을 주어, 연구자가 주제에 대해 더 풍부하고, 포괄적이며, 폭넓은 이해를 얻을 수 있게 한다. 이 표집 방법은 이론 개발(theory development), 가설 생성(hypothesis generation) 또는 다른 기법(예: 편의 표집)이 연구 중인 현상에 대해 좁은 범위의 경험을 가진 참여자들로부터만 데이터를 제공했을 때 연구 모집단에 폭(breadth)을 더하는 데 특히 유용하다.

 

최대 변이 표집을 위해서는, 누구와 이야기하고 싶은지 식별하기 위해 잠재적 참여자들로부터 공식적인 인구통계학적 자료(demographic data)를 수집하는 것이 필요할 수 있으며, 여기에는 더 표적화된 모집이 필요한 공백을 파악하는 것도 포함된다. 최대 변이 표집은 의도적 표집(purposive sampling)의 한 형태라는 점에 유의해야 하며, 여기서 연구자는 다양한 대표성을 확보하기 위해 특정 기준에 따라 참여자를 선택한다.

 

현상 내의 변이의 범위를 탐구함으로써, 연구자는 이론적 프레임워크의 개발이나 정교화에 정보를 제공하는 패턴이나 공통점을 식별할 수 있다. 실제 최대 변이 표집의 예시는 Box 2를 참조하라.


Box 2: 실제 최대 변이 표집 (Maximum variation sampling in practice) 

  • 연구 목표 (Study aim): 의사들 사이의 가면 현상(imposter phenomenon) 경험 조사.
  • 모집 전략 (Recruitment strategy): 연구자는 예를 들어 초기 및 후기 경력 단계, 다양한 전문 분야, 다양한 성 정체성(gender identities), 그리고 서로 다른 인종 및 민족 정체성을 가진 의사들을 의도적으로 선택(purposefully selects)한다. 초기 및 후기 경력 의사들은 경력에 따라 가면 증후군이 어떻게 달라질 수 있는지에 대한 통찰을 제공하며, 다양한 전문 분야는 서로 다른 분야가 가면 증후군의 강도(intensity)에 어떻게 영향을 미치는지 강조한다. 다양한 성별 및 인종/민족 정체성을 포함하는 것은 구조적 편향(systemic bias)이 어떻게 가면 증후군에 기여할 수 있는지를 부각시킬 수 있다.
  • 표집 고려사항 (Sampling considerations): 여러 범주에 걸친 광범위한 의사들을 인터뷰함으로써, 이 연구는 연구자가 다른 유사한 맥락이나 환경에서도 적용 가능하거나 유용할 수 있는 가면 증후군 관련 이론을 개발하거나 더 정교화(refine)하도록 할 수 있다. 이는 연구에서 도출된 통찰과 결론이 초기 연구 표본을 넘어 다른 집단, 환경, 또는 상황에 잠재적으로 적용될 수 있음을 의미한다.

3.1 눈덩이 또는 연쇄 표집 (Snowball or Chain Sampling) 

눈덩이 표집(Snowball sampling)은 기존의 사회적 및 전문적 네트워크를 통해 참여자를 모집하는 것을 포함한다. 이 접근법은 연구자가 연구 주제의 민감한 성격이나 연구 기준을 충족하는 개인의 수가 제한되어 있어 잠재적 참여자에게 접근하고 식별하는 데 어려움을 겪을 때 종종 채택된다. 또한 연구자가 특정 공동체나 네트워크에 고유한 현상을 이해하고자 할 때도 사용된다. 눈덩이 표집은 연구자가 사회적 네트워크의 상호 연결성(interconnectedness)을 활용하여 광범위한 참여자에게 도달할 수 있게 한다.

 

눈덩이 표집 과정은 연구 기준을 충족하며 연구에 참여할 의사가 있는 소수의 개인을 식별하고 모집하는 것으로 시작된다. 이 개인들은 네트워크 내의 '시드(seeds)'로 간주된다. 이 개인들이 인터뷰되거나 관찰되고 나면, 연구자는 그들에게 연구 표집 기준에 맞는 다른 사람들을 연결해 달라고 요청한다. 이러한 소개의 사슬(chain of referrals)은 눈덩이 효과(snowball effect)를 만들어내며, 연구에 참여하는 참여자의 수는 시간이 지남에 따라 기하급수적으로(exponentially) 증가한다.

 

눈덩이 표집의 주요 이점 중 하나는 접근하기 어려운(hard-to-reach) 개인과 긴밀한 네트워크(tight networks)에 접근할 수 있는 능력이다. 그러나, 이러한 긴밀한 네트워크는 연구자가 표집하는 경험의 범위를 제한할 수 있으며, 연결이 덜 된 사람들을 배제할 수 있다는 점에 유의해야 한다. 또한 지인에 의해 참여해야 한다는 압박감을 느끼는 것과 관련된 윤리적 고려사항(ethical considerations)도 있다. 실제 눈덩이 표집의 예시는 Box 3을 참조하라.


Box 3: 실제 눈덩이 표집 (Snowball sampling in practice) 

  • 연구 목표 (Study aim): 의사들 사이의 가면 현상(imposter phenomenon) 경험 조사.
  • 모집 전략 (Recruitment strategy): 연구자는 가면 증후군(imposter syndrome)을 경험한 것으로 알고 있는 몇몇 의사들을 식별하고 모집한다. 인터뷰가 끝날 때, 인터뷰어는 참여자가 알고 있는 의사 중 가면 현상을 경험했을 수 있는 다른 의사들에 대해 문의한다.
  • 표집 고려사항 (Sampling considerations): 이러한 눈덩이 표집의 반복적 과정(iterative process)은 연구자가 의사들의 경험 전반에 걸친 공통점과 차이점을 매핑(mapping)하기 시작하기 위해, 의사들이 종종 이야기하기 불편해하는 현상을 연구할 수 있게 해준다. 그러나 이 방법이 연구 목표나 질문에 명시적으로 연결되어 있지 않기 때문에, 표집된 네트워크의 범위(breadth)에 따라 특정 유형의 가면 증후군 경험에 공백(gaps)이 생길 수 있다.

3.2 표본 크기 (Sample Size) 

질적 연구에서, 표본 크기를 결정하는 것은 고정된 공식(fixed formula)을 적용하거나 딱 떨어지는 숫자(예: 15, 20, 25)를 찾는 문제가 아니라, 연구의 목표와 자료의 풍부함(richness)에 대한 미묘한 고려 사항이다. 연구자가 자료 수집을 언제 중단할지 파악하도록 돕는 몇 가지 프레임워크가 있다.

 

  • 한 가지 접근법은 정보 충분성(information sufficiency)으로, 연구자가 수집된 자료가 연구 중인 현상에 대한 포괄적인 이해를 제공한다고 느낄 때 표본 크기가 적절하다고 간주하는 것이다 [24]. 이는 연구 과정 전반에 걸쳐 자료를 지속적으로 평가하고, 새로운 정보가 중복되거나(redundant) 연구 질문에 대해 추가적인 통찰을 거의 제공하지 않을 때 자료 수집을 중단하는 것을 포함한다.
  • 대안적으로, 정보력(information power)은 다섯 가지 주요 지표, 즉 연구 목표, 표본 특수성(sample specificity), 확립된 이론의 사용, 대화의 질(quality of dialogue), 그리고 분석 전략(analysis strategy)에 기초하여 표본 크기를 고려하는 프레임워크를 제공한다 [25]. 이 접근법은 정보가 풍부하고 연구 질문과 관련이 있다면 더 작은 표본 크기도 충분할 수 있음을 강조한다.
  • 의학 교육 연구의 다른 일반적인 접근법으로는 포화(saturation)이론적 충분성(theoretical sufficiency)이 있다 (논의 [26, 27] 참조).
    • 포화 [28]는 자료 수집이 더 이상 중요한 새로운 통찰을 산출하지 않을 것 같은 지점을 의미하는 반면,
    • 이론적 충분성 [29]은 이론적 프레임워크의 개발이나 정교화를 가능하게 하는 이해의 깊이를 달성하는 데 초점을 맞춘다.
  • 어떤 접근법이든, Vasileiou 등 [30]은 표본 구성과 크기에 대한 성찰적 고려(reflective consideration)를 옹호하며, 연구자들에게 맥락적 요인, 연구 목표, 가용 자원을 평가할 것을 촉구한다. 궁극적으로, 표본 크기 결정은 평가 과정에 대한 투명성(transparency)을 갖추고 정보적 풍부함(informational richness)과 연구 질문에 대한 관련성을 우선시해야 한다 [30, 31]. 연구자들은 그들이 선택한 전략을 투명하게 기술하고 최종 표본 크기 결정을 정당화해야 한다.

 

 

표본 크기 결정은 정보적 풍부함(informational richness)을 우선시해야 한다. 

4 방법 (How to) 

누구를, 어떻게, 그리고 얼마나 오랫동안 표집할지 결정하는 것은 간단한 일회성 과제가 아니라, 연구 과정 전반에 걸쳐 내려지고 다시 검토되는 일련의 신중한 결정(deliberate decisions)들이다. 아래에, 우리는 연구 설계 및 실행 중 표집 결정을 안내하는 주요 고려 사항들과 원고 작성(manuscript writing)을 위한 모범 사례를 개략적으로 설명한다.

 

누구를, 어떻게, 그리고 얼마나 오랫동안 표집할지 결정하는 것은 간단한 일회성 과제가 아니라, 연구 과정 전반에 걸쳐 내려지고 다시 검토되는 일련의 신중한 결정들이다. 

 

연구를 설계(designing)할 때,

 

  • 연구자는 먼저 선택된 현상이 왜 조사를 필요로 하는지에 초점을 맞추고 탐구의 목적을 결정해야 한다. 이러한 초기 초점은 표집 결정을 연구 목표와 일치시킨다. 마찬가지로, 연구 질문(research questions)을 다양한 관점에서 검토하는 것은 이러한 질문에 답하는 데 가장 잘 기여할 수 있는 참여자 선택을 안내하는 데 도움이 될 수 있다. 마지막으로, 표집 계획은 선택된 개념적 또는 이론적 틀(conceptual or theoretical framework)과 일치해야 한다. 표본 모집단을 식별하고 진행 중인 표집 노력을 안내하기 위해 명확한 전략이 초기에 수립되어야 한다.

 

연구 실행(execution) 중에,

 

  • 연구자가 표집이 자료 수집 방법 및 선택과 어떻게 교차하는지를 지속적으로 정당화함에 따라 이 명확하게 기술된 전략은 중요하다. 연구자는 현상에 대한 포괄적인 이해를 제공하는 자료를 수집함으로써 표집 충분성(sampling sufficiency)이 충족되도록 해야 한다. 이 단계는 표본이 현상에 대한 포괄적인 이해를 제공하고 있는지, 따라서 새로운 자료가 등장함에 따라 여전히 적절한지를 지속적으로 평가하는 것을 포함한다. 이 단계에서, 창발적 인터뷰 자료(emergent interview data)가 가장 관련성 높은 경험을 가진 참여자들의 하위 집합(subset)과 추가적인 관여를 필요로 할 수 있음을 고려하는 것이 현명하다.

 

원고를 준비(preparing the manuscript)할 때,

 

  • 저자는 방법 섹션(methods section)에 표집 전략을 상세히 기술해야 하며, 여기에는 그것이 어떻게 계획되고 실행되었는지, 연구 설계를 어떻게 뒷받침했는지, 그리고 관련 정보를 포착하는 데 있어 그 적절성이 포함되는 것이 중요하다. 그러나 표집에 대한 고려는 방법 섹션을 넘어 논문의 나머지 부분으로도 이동해야 한다. Table 2는 표집 전략을 설계하고 원고의 다른 섹션을 초안할 때 고려해야 할 구체적인 질문들을 제공한다.

 

TABLE 2. 고려해야 할 질문들 (Questions to consider) 

섹션 질문
서론 (Introduction) 이전 연구 분야들은 어떤 모집단을 살펴보았는가?

당신의 연구는 현상을 어떻게 새롭게 조명할 것인가?

당신의 독자는 누구이며, 그들은 어떤 모집단에 관심이 있는가?
방법 (Methods) 목표 모집단(target population)은 무엇이며 이 모집단은 연구 질문과 어떻게 관련되는가?

표집 전략은 무엇이며 왜 이 접근법이 선택되었는가?

당신의 접근법은 연구 중에 어떻게 발전했는가?

참여자는 어떻게 식별되고 모집되었는가?

참여에 대한 부당한 압력(undue pressure)과 같은 표집과 관련된 윤리적 고려사항이 해결되었는가?
결과 (Results) 표본의 어떤 특성(인구통계 및 배경 등)이 연구 결과와 관련이 있는가?

인용구(quotes)들은 표본의 다양성(multiplicity)을 대표하는가?

인용구들은 연구 대상 모집단에 대한 풍부한 서사(rich narrative)를 제공하는가?
고찰 (Discussion) 다른 연구자들은 현상을 더 잘 이해하기 위해 추후 연구에서 어떻게 다르게 표집할 수 있을까?

당신의 표집 전략은 어떤 한계점(예: 주요 인구통계의 누락)을 가져왔는가?

5 결론 (Conclusion) 

표집 결정(Sampling decisions)은 엄격한 질적 연구(rigorous qualitative study)의 핵심 요소이다. 그러나 표집의 ‘최고의’ 방법에 대한 규칙서(rule book)는 없다—대신, 연구 목표와 질문이 그들이 직면한 표집 결정에 어떻게 정보를 줄 수 있는지를 깊이 있게 고려하는 것은 연구자의 몫이다. 표집은 맥락(context), 범위(scope), 성격 및 연구 설계와 같은 연구의 내재적 매개변수(intrinsic parameters)를 고려하는 창발적 과정(emergent process)이다 [30]. 따라서, 표집에서 연구자의 역할은 단순한 선택을 초월한다; 그것은 다성적 서사(polyphonic narrative)를 형성할 독특한 목소리들을 의식적으로 큐레이팅(curating)하는 작곡가(composer)의 역할과 흡사하다. 각 참여자의 지식이 다른 사람들과 어떻게 조화를 이루거나 갈라질지를 초인지적으로 성찰(metacognitively reflecting)하는 것이 무엇보다 중요하다. 결국 최종 구성(composition)의 울림(resonance)—풍부하고, 설득력 있으며, 통찰력 있는 능력—은 전적으로 이 초기, 예술적 큐레이션(artful curation)에 달려 있기 때문이다.

 

표집의 ‘최고의’ 방법에 대한 규칙서는 없다—대신, 연구 목표와 질문이 그들이 직면한 표집 결정에 어떻게 정보를 줄 수 있는지를 깊이 있게 고려하는 것은 연구자의 몫이다. 

 

 

 

 

 

 

 

 

Thematic Analysis: The ‘Good’, the ‘Bad’ and the ‘Ugly’ 

 

 

안녕하세요! 오늘은 질적 연구(Qualitative Research)를 하시는 분들이라면 누구나 한 번쯤 고민해 보셨을 '주제 분석(Thematic Analysis)'에 대한 흥미로운 논문을 소개해 드리려고 합니다. 바로 Linda Finlay가 쓴 "Thematic Analysis: The Good, the Bad, and the Ugly"라는 논문인데요. 제목부터 심상치 않죠? 영화 제목을 패러디해서 주제 분석의 다양한 면모를 아주 날카롭게 파헤친 글입니다.

연구를 진행하면서 "내 분석이 과연 괜찮은 걸까?" 고민하셨던 분들께 꿀팁이 될 내용들을 정리해 봤습니다. 🍯


1. 주제 분석은 하나가 아니다? (Science vs Art) ⚖️

많은 분들이 주제 분석을 정해진 순서대로만 하면 되는 '요리법'처럼 생각하곤 합니다. 하지만 저자는 주제 분석이 '방법들의 가족(Family of methods)'이라고 말해요. 크게 두 가지 진영으로 나눌 수 있죠.

  • 🔬 과학적 기술적(Scientifically descriptive) 진영: 객관성, 신뢰도, 체계적인 코딩을 중시합니다. (예: 후기 실증주의, 코딩 신뢰성 접근)
  • 🎨 예술적 해석적(Artfully interpretive) 진영: 창의성, 연구자의 주관, 성찰을 중시합니다. (예: 해석학적 현상학, 성찰적 주제 분석)

저자는 어느 한쪽이 맞다기보다, 자신의 연구 목적과 철학에 맞는 방법을 선택하는 것이 중요하다고 강조합니다.

"어떤 유형의 주제 분석이 수행되는지는 연구/연구자의 인식론적 입지(epistemological positioning)에 따라 달라진다." (What type of thematic analysis is engaged depends on the epistemological positioning of the research/researcher.)


2. 주제는 '발견'되는 게 아니라 '만들어지는' 것! 🔨

"데이터를 계속 읽다 보니 주제가 짠! 하고 나타났어요." 혹시 논문에 이렇게 쓰고 싶으신가요? 저자는 이런 생각에 제동을 겁니다. 주제 분석은 기예(Craft)와 고된 노력(Graft)이 모두 필요한 과정이거든요.

데이터 속에 숨겨진 진주를 캐내는 게 아니라, 연구자가 치열하게 고민하고 다듬어서 만들어내는 조각품에 가깝습니다.

"주제는 단순히 '드러나는' 것이 아닙니다... 데이터를 점진적으로 끌어모으는 공들인 과정이 있습니다. 연구자는 딱 맞는 단어/이미지가 찾아질 때까지 적극적으로 관여하고, 탐색하고, 공명하고, 창조하고, 공예해야 합니다." (Themes don’t simply ‘emerge’... Instead, there is painstaking process of gradually pulling the data together... The researcher needs to be actively involved, searching, resonating, creating, crafting until just the right words/images are found.)


3. 좋은 분석을 위한 4가지 기준: The 4 R's  🥧

내 분석이 잘 되었는지 평가할 때, 저자는 '4 R'이라는 기준을 제안합니다. 마치 파이(Pie) 조각처럼 연구 성격에 따라 각 요소의 크기는 달라질 수 있어요.

  1. 엄격성 (Rigour): 분석이 체계적으로 수행되었나요? 증거(인용문)는 충분한가요?
  2. 관련성 (Relevance): 이 연구가 학계나 실무에 어떤 기여를 하나요?
  3. 울림 (Resonance): 글이 독자의 마음을 움직이나요? (밋밋한 제목 대신 은유적이고 생생한 표현을 써보세요!)
  4. 성찰성 (Reflexivity): 연구자 자신의 주관과 위치를 투명하게 밝혔나요?

특히 성찰성(Reflexivity)은 최근 질적 연구에서 매우 중요하게 다뤄집니다.

"성찰성은 연구자의 비판적 자기 인식으로 정의될 수 있다... 성찰적 주제 분석(Reflexive Thematic Analysis)은 지식 생산에 있어서 연구자의 역할을 심문하고 투명하게 만든다." (Reflexivity can be defined as researcher’s critical self-awareness... Reflexive Thematic Analysis (RTA) thus interrogates, and makes transparent, the researcher’s role in knowledge production.)


4. 좋은 놈, 나쁜 놈, 추한 놈 판별법  🧐

그렇다면 과연 어떤 분석이 Good, Bad, Ugly일까요?

  • 😇 좋은 놈 (The Good): 설득력이 있고 강력합니다. 주제 제목이 생생하고(Punchy), 분석이 풍부하며, 연구자의 방법론적 입장과 일치합니다. 우리에게 새로운 관점을 제공해 주죠.
  • 😈 나쁜 놈 (The Bad): 이론과 데이터가 따로 놉니다. 방법론적 일관성이 없고(이건 구성주의인데 절차는 실증주의를 따르는 등), 주제가 너무 많아 파편화되어 있습니다. "매시업(Mash-up)"처럼 엉망인 상태죠.
  • 👽 추한 놈 (The Ugly): 지루하고 생기가 없습니다. 연구자가 분석을 '공예(Crafting)'하는 데 정성을 들이지 않아, 단순히 참가자의 말을 그대로 뱉어낸(Regurgitation) 수준에 그친 경우입니다.

📝 마치며

이 논문은 우리에게 단순히 방법론의 절차를 따르는 것을 넘어, 연구자로서 데이터와 깊이 있게 '공명'할 것을 주문합니다.

마지막으로 논문에 인용된, 질적 연구자의 태도를 너무나 아름답게 표현한 문구로 포스팅을 마칩니다. 지금 분석과 씨름하고 계신 모든 연구자분들, 파이팅입니다! 💪

"나는 내 앞에 쌓인 더미들을 바라본다... 그리고 나의 의지를, 이야기되기를 기다리는 데이터 이야기의 의지에 항복시킨다." (So I eye the stacks before me… and surrender my will to the will of the data’s story waiting to be told.) - Rockwell (2013)


 

주제 분석(Thematic analysis)은 데이터 내의 패턴과 의미를 식별하는 것을 목표로 하는 질적 연구 방법(qualitative research method)이다. 주제 분석은 다양한 형태를 띨 수 있는데, 어떤 것은 체계적(systematic)이고 다른 것은 직관적(intuitive)이며, 어떤 것은 더 명시적으로 과학적(scientific)이고 다른 것은 창의적으로 예술적(artful)이다. 연구자가 과정에 참여하고 주제(themes)를 작성하는 방식 또한 상당히 다양하다. 여러 면에서 ‘좋은’ 주제 분석은 연구의 목표와 맥락, 그리고 채택된 특정 방법론(methodology)에 달려 있다. 어떤 유형의 주제 분석이 수행되는지는 연구/연구자의 인식론적 입지(epistemological positioning)에 따라 달라진다.

 

실제로, 주제 분석을 포함하여 출판된 연구는 온갖 형태와 스타일로 나타난다: 좋은 것, 나쁜 것, 그리고 아주 추한 것(ugly) 등이다. (‘추하다’는 개념이 다소 가혹하게 여겨질 수 있지만, 나는 여기서 내 주장을 강조하기 위해 약간의 예술적 허용(artistic license)을 발휘하여 도발적으로 사용하고 있다.) 저널 편집자로서, 나는 많은 기대감을 가지고 투고 논문들을 읽었으나, 불충분하게 다듬어진 주제들 때문에 유망했던 논문이 실망스러워지는 것을 발견하곤 했다. 그러한 논문의 저자는 어떻게 하면 더 나은 주제 분석을 만들어낼 수 있었을까?

 

이 논문은 주제 분석의 이론과 실제를 검토함으로써 논의를 촉진하는 것을 목표로 한다. 다음 내용에서, 나는 주제 분석의 본질과 실제를 명확히 함으로써 몇 가지 지침을 제시하고자 한다. 나는 내가 모범 사례(good practice)라고 생각하는 구체적인 예시$^1$와, 주제 분석이 적절하게 체계적인 방식으로 수행되어 연구 목표와 일치하는 풍부하고 유익한 연구 결과(findings)를 도출했다고 생각하는 사례들을 제공한다.

 

$^1$ 나는 이 특정 연구들을 온라인에서 무료로 접근할 수 있고, 주제 분석적 선택의 범위에 대한 나의 주장을 잘 보여주는 것 같아서 예시로 선택했다.

 

전체적으로, 나는 예술과 과학의 스펙트럼을 아우르며 주제 분석이 포함할 수 있는 광범위한 범위를 보여주려 노력한다. 내 개인적인 선호는 예술적/문학적 주제 기술(artful/literary thematic descriptions)에 기울어져 있지만 (나의 해석학적 현상학적 방법론적 지향(hermeneutic phenomenological methodological orientation)에 부합하듯이), 나는 더 후기 실증주의적(post-positivist)이거나 실재론적 가치(realist values)를 수용하는 연구들(예: 일부 근거 이론(grounded theory) 및 기술적 현상학(descriptive phenomenology))을 위한 더 과학적인 버전들도 존중하고 가치 있게 여긴다.

 

 

  • 첫 번째 섹션에서는 다양한 유형의 주제 분석을 식별하고 대조한다.
  • 두 번째 섹션에서는 분석 수행의 단계와 과정을 고찰한다.
  • 세 번째 섹션에서는 주제 분석을 평가하는 네 가지 핵심 기준인 엄격성(Rigour), 울림(Resonance), 성찰성(Reflexivity), 관련성(Relevance) – 즉 4 R을 탐구한다.
  • 전체에 걸쳐, 나는 '좋은 놈, 나쁜 놈, 추한 놈(The Good, the Bad, and the Ugly)'이라는 나의 주제를 반복적으로 변주한다.

 

 

주제 분석의 유형 (Types of Thematic Analysis) 

 

‘주제 분석(thematic analysis)’이라는 용어는 제목의 주제적 구조와 주제에 대한 설명(explication) 모두를 지칭한다 (여기에는 서사적 기술, 설명, 그리고/또는 입증하는 인용구나 성찰이 포함될 수 있다). 주제 분석은 범주 태그라인(category tag-lines)이나 참가자가 말한 내용에 대한 요약 설명 이상의 것을 제공한다. 대신, 이는 연구자가 데이터에서 식별한 명시적(explicit) 의미와 암묵적(implicit) 의미를 확인하거나 직면하고, 이러한 연구 결과를 종합하는 증류 과정(distillation process)에 비유될 수 있다. ‘좋은’ 주제 분석은 단순히 드러나는 것이 아니다. 그것은 적극적으로 ‘작업되어야(worked with)’ 하며, 공들인 추출과 재구성을 수반한다.

 

주제 분석을 수행하는 단 하나의 방법은 없다. 그 내용, 형식, 스타일은 관련된 서로 다른 철학적 및 방법론적(즉, 인식론적) 전념(commitments)에 따라 달라진다. 이러한 변형은 과학-예술, 객관적-주관적, 실재론적-상대주의적(realist-relativist), 후기 실증주의적-구성주의적(post-positivist-constructivist), 기술적-해석적(descriptive-interpretive), 귀납적-연역적(inductive-deductive), 의미적-잠재적(semantic-latent) 등과 같은 양극단에 걸쳐 있다. Braun and Clarke (2021, p. 39)이 주장하듯이, 주제 분석은 “방법들의 가족(family of methods)”으로 보는 것이 가장 적절하다. 더 복잡하게는, 주제 분석은 (Braun and Clarke를 따라) 그 자체로 하나의 방법(method)으로 사용되거나, 데이터에서 패턴을 찾고 연구 결과를 주제(themes)로 제시할 수 있는 다른 방법론(예: 근거 이론(grounded theory))의 일부로 사용될 수도 있다.

 

그들의 접근 방식이 다른 패턴 기반 접근 방식들, 즉 질적 내용 분석(qualitative content analysis), 해석학적 현상학적 분석(Interpretative Phenomenological Analysis, IPA), 근거 이론(grounded theory), 담론 분석(discourse analysis)과 어떻게 대조되는지에 대한 포괄적인 설명은 Braun and Clarke (2021)를 참조하라.

 

대략적으로 말해서, 주제 분석은 두 개의 (중첩되는) 진영으로 나눌 수 있다: ‘과학적으로 기술적인(Scientifically descriptive)’ 대 ‘예술적으로 해석적인(Artfully interpretive)’ 

 

  • 한 진영에는 더 과학적으로 지향되고, 후기 실증주의적이며, 객관적이고, 실재론적/본질주의적 인식론적 입장(realist/essentialist epistemological stance)을 취하는 연구자들이 속한다. 여기서 강조점은 체계적이고 신뢰할 수 있는(reliable) 코딩 절차에 있으며, 귀납적으로 생성된 주제 범주들은 ‘타당한(valid)’ 것으로, 그리고 명시적 데이터(manifest data)를 대표하는 것으로 간주된다. 혼합 연구 설계(mixed methods designs)나 더 실재론적인 버전의 근거 이론에서 특히 볼 수 있는 이 접근 방식은 종종 프로토콜과 정해진 절차에 의해 안내된다. 때로는 NVivo® (QSR International Pty Ltd)나 ATLAS.ti®와 같은 소프트웨어가 데이터를 정리하고 연구자가 패턴을 보는 것을 돕기 위해 사용된다. 이러한 분석이 어떻게 수행되든, 목표는 설명을 제공하거나 예측을 하기 위해 분석에 객관적 접근 방식을 사용하는 것이며, 동시에 인간의 주관성/편향(subjectivity/biases)을 최소화하기 위해 노력한다 (Levitt et al, 2016).
  • 해석주의적 경로(interpretivist paths)를 택하고 범주의 표상적 ‘진실’을 피하는 더 상대주의적 입장(relativist positions)을 수용하는 연구자들은 다른 진영에 속한다. 이 연구자들은 더 명시적으로 창의적이고, 예술적이며, 그리고/또는 성찰적(reflexive)이다. 그들은 (잠재적) 의미((latent) meanings)를 밝혀내기 위해 참가자들과의 대화적 교류를 사용하며, 분석 과정에서 자신의 해석적 과정을 투명하게 만들려고 노력한다 (Levitt et al, 2016). 대안적으로, 그들은 당연시되는 확실성을 교란하고 비판하는 것을 목표로 하는 아이러니하고 후기 구조주의적(post-structural) 형식을 통해 담론을 비판적으로 해체(deconstruct)할 수도 있다. 이러한 유형의 주제 분석에서, 의미는 특정 맥락과 그것을 바라보는 특정한 해석적/이론적 렌즈(interpretive/theoretical lens)에 따라 달라지는(contingent) 것으로 이해된다.

 

$^2$ Braun and Clarke (2019a)는 주제 분석의 세 가지 주요 유형을 구별한다: 코딩 신뢰성 접근법(coding reliability approaches), 코드북 접근법(code book approaches), 성찰적 접근법(reflexive approaches).
$^3$ 컴퓨터 보조 질적 데이터 분석 소프트웨어(Computer-Assisted Qualitative Data Analysis Software, CAQDAS)는 연구자가 대량의 질적 데이터를 정리하는 데 도움을 줄 수 있지만, 분석은 여전히 연구자가 주도해야 한다.

 

이런 종류의 주제 분석에 참여하는 연구자들은 정해진 방법을 마치 요리법(recipe)처럼 따르지 않는 경향이 있다. 다른 연구자들이 참여하는 경우, 그들은 협력하지만 합의(consensus)에 도달할 것이라는 기대는 없다. 연구자의 성찰성(reflexivity)과 (상호)주관성((inter-)subjectivity)은 신뢰성(credibility)과 타당성(validity)에 대한 위협이 아니라 자원(resources)으로서 환영받는다.

 

그림 1: 주제 분석에 대한 과학적 기술적 접근 대 예술적 해석적 접근 (Scientific descriptive versus artfully interpretive approaches to thematic analysis) 

 

실제로 대부분의 질적 연구자들은 아마도 양쪽 진영에 적어도 한 발씩을 걸치고 있으며, 일부는 확고하게 중간에 위치한다. 이러한 질적 연구자들은 실용적으로 분석을 만들어가면서, 비판적 실재론(critical realist) 혹은 구성주의적(constructivist) 인식론적 입장을 취하는 경향이 있는데, 이는 모든 앎(knowing)이 참가자와 함께 의미를 적극적으로 (공동)구성((co-)constructing)하는 연구자에 의해 생산된다는 것을 인식하는 입장이다. 그들은 의미가 유동적이라고 생각하면서도, 참가자의 이야기가 그들의 경험에 대한 주관적 인식(subjective perceptions)의 일부를 반영한다는 것을 받아들인다(비록 실제 경험 그 자체는 아닐지라도). 따라서 과학과 예술 모두가 수용될 수 있다. 이 연구자들은 코딩/범주화(coding/categorising)에 체계적이고 단계적인 접근 방식을 취하고, 최종적인 주제 제목들이 정당화되고 잘 입증되도록 보장함으로써, 그리고 아마도 공동 연구자나 참가자들에 의해 주제가 ‘타당성 검증(validated)’을 받게 함으로써 엄격성(rigorous)을 갖추려 시도한다. 동시에, 이 연구자들은 창의적인 기회와 문학적 윤색(literary embellishment)을 받아들일 수도 있다.

 

이러한 다양한 주제 분석들이 어떤 모습인지 구체적인 예를 들기 위해, 다음 세 가지 연구가 취한 대조적인 접근 방식을 고려해보자:

  • Herron and Sani (2021)는 ‘공허함(emptiness)’을 경험한 사람들의 관점에서 그 의미를 탐구한다. 240명의 참가자가 설문조사에서 자신의 경험을 상세히 기술했다. 그리고 공허함의 다양한 징후를 설명하기 위해 귀납적(데이터 주도적) 주제 분석(inductive (data driven) thematic analysis)이 수행되었다. 설문 데이터의 통계적 분석 외에도, 참가자들의 개방형 텍스트 응답은 암묵적 의미보다는 의미적(semantic) 혹은 명시적(explicit) 의미에 대해 검토되었다. 연구 결과는 정동적(affective), 행위적(agentic), 신체적 자아(bodily self); 자아와 타인; 자아와 외부 세계와 관련된 구성 요소들로 분류되었다. 공허함에 대한 종합적이고 요약된 정의가 제시되었다: 심리적이고 신체적으로 느껴지는 내면의 목소리와 함께, 기계적이고 목적 없이 무감각하게 삶을 살아가는 느낌, 타인과의 단절감, 그리고 변하지 않았지만 멀고 동떨어진 세상에 기여하지 못한다는 느낌. (Herron & Sani, 2021)
  • Finlay and Payman (2013)은 ‘외상적 낙태(traumatic abortion)’(심각한 수준의 복합적 비탄(complicated grief)과 해리(dissociation)를 수반하는)의 체험(lived experience)에 대한 해석학적-실존적 현상학적 분석(hermeneutic-existential phenomenological analysis)을 제공한다. 연구자들은 1970/80년대에 낙태를 경험한 여성들과 인터뷰 대화를 수행했다. 하나의 심층 사례 연구는 다양한 관계적-성찰적(relational-reflexive) 방식으로 데이터를 처리함으로써 수행되었다. 암묵적(잠재적) 의미((latent) meanings)를 포착하는 세 가지 해석적 주제가 도출되었는데, ‘찢겨진 느낌(Feeling Torn)’; ‘수치심과 죄책감에 시달림(Racked with Shame and Guilt)’; 그리고 ‘괴물 같은 (어)머니 되기(Monstrous (M)othering)’는 그 경험의 모호성과 모순적인 측면을 강조한다. ‘갇힌 비탄(Entrapped Grief)’이라는 추가적인 주제는 세 여성의 이야기를 참조한 후속 논문에서 상세화되었다 (Finlay, 2015). 이 연구는 지속되는 트라우마의 층위들과, 낙태의 즉각적인 신체적 트라우마 이면에 놓여 있는 비지지적(unsupportive)이거나 유해한(toxic) 관계의 이야기를 강조했다.
  • Mitchell (2020)은 심리치료를 위한 화상 회의 사용의 체험을 탐구하기 위해 현상학적으로 지향된 성찰적 주제 분석(phenomenologically orientated Reflexive Thematic Analysis)을 사용한다. 실무의 일부로 화상 심리치료를 사용하는 6명의 숙련된 통합적 심리치료사(integrative psychotherapists)의 주관적 경험을 탐구하기 위해 반구조화된 인터뷰(semi-structured interviews)가 수행되었다. 주제 분석(귀납적 및 연역적)은 네 가지 주제를 식별했다: ‘보이는 것과 숨겨진 것(Seen and Hidden)’, ‘친밀감과 거리(Intimacy and Distance)’, ‘연결을 위해 열림(Open to Connect)’, ‘유사하지만 다른 세계들(Similar but Different Worlds)’. 이 분석은 통합적 심리치료사들이 온라인에서 관계적 깊이(relational depth)를 가지고 참여할 수 있으며, 온라인 치료가 대면 작업보다 열등한 것이 아니라 다를 뿐임을 시사한다.

아마도 Mitchell (2020)처럼 주제 분석을 수행하는 심리치료 분야의 대부분의 질적 연구자들은 과학과 예술, 귀납적 방법과 연역적 방법, 그리고 기술(description)과 해석(interpretation) 사이를 걸치고 있는 그 ‘구성주의적 공예(constructivist crafting)’ 범주의 어딘가에 속할 것이다. 이상적으로, 이러한 연구자들은 자신의 위치와 가치를 명시적으로 드러내야 하는데, 이는 연구의 목표와 제기될 수 있는 지식 주장(knowledge claims)의 성격에 영향을 미치기 때문이다.

 

약한 논문들에서, 저자들은 자신의 인식론적 전념을 명시적으로 밝히지 않는 경향이 있다. 그들은 단순히 주제 분석 수행을 위한 요리법을 따를 뿐이다. 이러한 연구자들은 가능한 패턴 분석의 다양성을 인식하지 못할 수 있다. Braun and Clarke와 동료들은 (Clarke & Braun, 2013; Braun, Clarke, & Terry, 2014; Terry et al, 2017) 이러한 다양성에 주의를 기울이지 못하면 연구자들이 양립할 수 없는 기법들을 비일관적으로 뭉뚱그려 놓은 ‘매시업(mash-ups)’을 만들어내게 된다고 주장한다.

 

일관성을 유지하는 것이 중요하며, 바로 이 지점에서 방법론적 진실성(methodological integrity)이 등장한다. Levitt et al (2016)은 질적 연구의 진실성이 다음과 같을 때 확립된다고 말한다:

연구 설계 및 절차(예: 자전적 민족지학, 담론적 분석)가 연구 목표(즉, 연구 문제/질문)를 지원하고... 연구자의 탐구 접근 방식(즉, 세계관, 패러다임 또는 철학적/인식론적 가정으로 묘사되는 연구 전통)을 존중하며... 주제와 연구자의 근본적인 특성에 맞춰 조정될 때. (2016, pp. 9-10)

 

좋은 놈, 나쁜 놈, 추한 놈

(The Good, the Bad, and the Ugly) 

 

그렇다면 ‘좋은’ 주제 분석연구 방법론, 목표, 그리고 연구자의 신념 간의 적합성을 반영한다. 연구자는 선택이 이루어져야 한다는 점, 그리고 주제 분석에 대한 서로 다른 접근 방식들은 모순되는 인식론적 전념을 나타내기 때문에 무작위로 묶일 수 없다는 점을 성찰적으로 인식한다. 연구자는 또한 자신의 구체적인 방법론적 선택에 대해 명확하지만, 때로는 이것이 이해할 만한 혼란의 원인이 될 수도 있다. 예를 들어,

 

  • 어떤 (비판적 실재론적) 근거 이론 연구는 더 귀납적인 접근 방식을 취하고, 어떤 (구성주의적) 근거 이론은 더 연역적이다.
  • 마찬가지로, 어떤 현상학적 연구들(기술적 접근 방식을 사용하는 연구 등)은 더 귀납적이고 과학적인 경향을 보이는 반면, 해석학적(해석적) 변형(hermeneutic (interpretive) variants)들은 예술적 글쓰기를 하거나 특정 개념적 렌즈를 통해 데이터를 연역적으로 바라보는 경향이 있다.

 

‘나쁜’ 그리고 ‘추한’ 주제 분석은 개념적으로나 방법론적으로나 문제들을 혼동하여 결국 불만족스러운 결과를 낳는다. 예를 들어,

 

  • 연구자들은 주제가 해석적으로 연역되었음에도 불구하고 평가자 간 신뢰도(inter-rater reliability)를 확립하려고 시도할 수 있다. 해석주의 연구에서는 의미가 다양하다고 보기에, 이는 잘못된(misguided) 기획이다.
  • 혹은 연구자들은 사회 구성주의적(social constructionist) 접근 방식을 취한다고 주장하면서 참가자들의 언어를 그들의 경험과 행동에 대한 투명한 반영으로 취급할 수도 있다.
  • 또는 (지속적 비교 분석, 줄 단위 코딩 같은 절차를 사용하는) 근거 이론 접근 방식을 사용하는 연구자들이 성찰적 주제 분석(Reflexive Thematic Analysis)(Braun and Clarke, 2019b; 2021)을 하고 있다고 주장할 수도 있다.
  • 이러한 모든 불일치는 질적 연구의 본질과 가능성에 대한 혼란을 드러낸다.

 

이상적으로 연구자들은 자신의 인식론적 및 방법론적 전념에 대해 명확하고 성찰적이어야 하지만, 실제로는 두 가지 측면 모두에서 부족한 경우가 많다. 좋은 논문은 전체적으로 접근 방식의 일관성과 방법론적 진실성을 드러낼 것이고, 약한 논문은 듬성듬성하고(patchy) 비일관적일 것이다. 대개 약한 연구들에서, 연구자들은 선택의 여지가 있다는 것을 인식하지 못하는 듯하며, 자신의 분석 방법을 당연하게 여기거나 그것을 경직되게 고정시킨다(Braun and Clarke, 2021이 분석 접근 방식을 “신성한 방법(hallowed method)”으로 보는 것이라고 언급한 것).

 

  • 과학적으로 지향된 연구의 예를 들어보자.
    • 여기서 연구자는 자동적으로 타당성(validity), 신뢰성(reliability), 일반화 가능성(generalizability)의 관점에서 생각할 것이다. 비록 그들이 자신의 후기 실증주의적 가치를 명시적으로 진술하지 않더라도, 논문에서 수행하는 토론이나 평가의 종류에서 그들의 입장을 드러낼 가능성이 높다. 예를 들어,
    • 그들은 “멤버 확인(member checking)”, “참가자 타당성 검증(participant validation)”, “평가자 간 신뢰도(inter-rater reliability)”에 대해 이야기할 것이다.
    • 그들은 참가자 표본과 연구의 주제적 결과가 어느 정도까지 “일반화(generalized)”될 수 있는지에 대해 논의할 것이다. 이러한 유형의 연구들 중 약한 것들은 문제를 명시적으로 논의하거나 문제시하기보다는 특정 입장을 당연시하는 가정을 하는 경향이 있다. (예를 들어, ‘참가자 타당성 검증’은 연구의 가치를 증명하기 위한 좋고 필수적인 단계라고 단순히 가정될 수 없다. 이 과정은 품질을 보장하지 않으며, 특히 일부 참가자를 혼란스럽게 할 수 있기 때문이다.)
  • 더 나은 연구들은 대개 주제 분석에 착수하기 전부터 어떤 종류의 분석이 수행되어야 하고 어떻게 평가되어야 하는지를 이미 결정했다. 분석은 연구의 목표에 부합해야 한다. 주제들은 이론적으로 일관성이 있어야 하며, 채택된 인식론적/방법론적 및 개념적 틀(epistemological/methodological and conceptual framework)과 일치해야 한다.

 

연구자가 자신의 설계와 전념(commitments)을 확립하고 나면, 데이터 수집과 분석을 시작할 준비가 된 것이다.

 

 

주제 분석의 단계와 과정

(Stages and Processes of Thematic Analysis) 

 

주제 분석의 단계(stages)는 식별되거나 심지어 처방될 수 있지만, 주제 분석의 과정(process)은 체계적인 동시에 직관적이며, ‘기예(craft)’와 ‘고된 노력(graft)’을 모두 포함한다. 이 섹션에서는 먼저 주제 분석을 위한 기본적인 템플릿 절차를 확인한 다음, 그 변형들에 대해 상세히 설명할 것이다.

 

주제 분석의 기본 절차 (Basic Procedures of Thematic Analysis) 

 

모든 질적 분석 과정은 프로토콜을 기계적으로 적용하기보다는 데이터에 유동적으로 반응할 때 강화될 가능성이 높다. 창의적 직관의 상상력 넘치는 도약을 위한 공간과, 시간이 지남에 따라 반복되는 버전들을 공들여, 주의 깊게, 그리고 체계적으로 작업해 나가는 공간 모두가 남겨져야 한다. 기예(craft), 고된 노력(graft), 그리고 예술성(artistry)이 모두 포함된다. 가치 있게 여겨지고 강조되는 측면은 적용되는 주제 분석의 버전에 따라 달라진다. 해석학적 현상학적 연구(hermeneutic phenomenological study)는 직관적인 봄(seeing)을 우선시하고 환기적인 은유와 영감 어린 깨달음(epiphany)의 순간을 추구할 수 있는 반면, 혼합 연구(mixed methods study)는 대조적으로 체계적인 과학적 코딩 과정을 강조할 것이다.

 

주제 분석을 수행하는 단 하나의 방법은 없지만, Braun and Clarke (2006; 2019a; Clarke & Braun, 2013)는 일반적인 주제 분석(Thematic Analysis, TA)을 수행하기 위한 접근하기 쉽고 자주 인용되는 6단계 프레임워크를 제시했다. 이 단계들은 선형적(linear)인 것을 의도하지 않았다; 특히 복잡한 데이터가 관련된 경우 이전 단계로 재귀적으로(recursively) 되돌아가는 것이 필요할 수 있다. 그들은 코딩에 대한 자신들의 접근 방식이 유연하고, 유기적이며, 코딩 과정을 통해 창발적(emergent)임을 강조한다:

  • 1단계: 데이터에 친숙해지기 (Become familiar with the data) – 연구자는 데이터/녹취록을 읽고 또 읽으며 초기 거친 메모를 작성해야 한다. 이것은 연구자가 데이터와 밀접하게 친숙해지는 몰입(immersion)의 단계이다.
  • 2단계: 초기 코드 생성하기 (Generate initial codes) – 여기서 연구자는 데이터를 의미 있고 체계적인 방식으로 정리하기 시작한다. 주요 특징을 식별하기 위해 데이터에 간결한 라벨을 붙인다. 각 데이터 항목의 코딩에 이어, 모든 코드와 데이터 발췌문이 수집(collated)된다.
  • 3단계: 주제 찾기 (Search for themes) – 이 단계에서 연구자는 데이터의 패턴을 설명하기 위해 코드와 데이터를 한데 모으기 시작한다. 각 주제에 연결된 데이터가 수집되고, 연구자는 의미의 범주(categories of meaning)들을 그룹화하는 데 있어 선별적이 되기 시작한다.
  • 4단계: 주제 검토하기 (Review themes) – 여기서 주제들은 수정되고 발전된다. 주제들을 하나로 합치거나(collapse), 더 세분화하거나(split), 중심적이지 않은 것들을 버려야 할 수도 있다. 연구자는 주제들이 (데이터 및 다른 주제들과 관련하여) 작동하는지 확인하고 연구 질문에 답하는 설득력 있는 이야기를 하려고 노력한다.
  • 5단계: 주제 정의 및 명명하기 (Define and name themes) – 이것은 주제가 그 본질(essence)을 드러내도록 다듬어지고 공예되는 더 예술적인 단계이다. 연구자는 각 주제에 대해 상세한 분석을 작성하며, 주제와 데이터 전체에 대한 이야기를 하려고 모색한다. 또한 각 주제에 대해 간결하고 유익하며 – 이상적으로는 강력하고 흥미로운 – 제목을 찾을 때이기도 하다.
  • 6단계: 보고서 작성 (Write-up) – 이 단계에서 연구자는 더 넓은 보고서(문헌 검토, 논의 등을 포함) 안에 주제들을 작성한다. 이는 정보를 제공하고 생생한 데이터 발췌문을 증거로 사용하여 분석적 서사를 설득력 있는 이야기로 엮어내는 것을 포함한다.

Braun and Clarke (2006; Clarke and Braun, 2013)는 이러한 단계별 절차가 특정 인식론적 또는 이론적 전념에 묶인 전체 방법론(methodology)을 구성하는 것은 아님을 분명히 한다. 오히려, 그들은 데이터 분석의 기본적인 방법(method)을 제공한다. 따라서, 이것은 초보 연구자들에게 이상적인 ‘입문용’ 분석 방법이 된다.

(더 자세한 내용, 논의 및 토론은 다음을 참조: https://www.psych.auckland.ac.nz/en/about/thematic-analysis.html )

 

Braun and Clarke (2006; Clarke and Braun, 2013)가 제시한 유연한 절차는 더 과학적이고 기술적인 코딩을 요구하는 것이든, 예술적이고 해석적인 모드를 수용하는 것이든 다양한 이론적 틀에 맞춰 조정될 수 있다. 이러한 절차는 데이터 분석 접근 방식으로서 단독으로 사용될 수 있지만(주로 학부 및 혼합 연구에서 발견됨), 다른 방법론 안에 포함될 수도 있다. 흔히 이 방법을 사용하는 연구들은 체험(lived experience)을 주제화하는 현상학적 지향(phenomenological orientation)을 갖는다. 그렇지 않으면, 주제 분석은 서사 분석(narrative analysis)이나 담론 분석(discourse analysis) 등을 수행하는 것의 일부로 관여될 수 있다. TA의 내재적인 인식론적 유연성(epistemological flexibility)은 종종 엄격성(rigour)과 명확성의 부족으로 오해되곤 한다. 사실, 이러한 유연성은 특히 연구자의 인식론적 전념이 명확할 때 강점이 된다.

 

더 최근에, Braun and Clarke (2019a, 2019b, 2021)는 자신들의 명시적으로 구성주의적 접근(constructivist approach)을 주제 코딩 절차의 다른 변형을 사용하는 접근들과 구별하기 위해 그들의 방법을 확장하고 정교화했다. Braun and Clarke가 과정에 추가한 중요한 요소는 성찰성(reflexivity)이다.

 

성찰성은 연구자의 비판적 자기 인식으로 정의될 수 있다: 자아/타자에 대한 이해를 검토하고 이러한 선입견이 연구에 어떻게 영향을 미치고 작용하는지를 분석하는 과정이다 (Finlay, 2016). 따라서 성찰적 주제 분석(Reflexive Thematic Analysis, RTA)은 지식 생산에 있어서 연구자의 역할을 심문하고 투명하게 만든다. Braun and Clarke는 연구자들에게 자신의 철학적 감수성과 이론적 가정을 명시하고, 이것들이 일관되고 조리 있으며 투명하게 관여되도록 보장할 것을 요구한다. 그들에게 있어, RTA는 평가자 간 신뢰도(inter-rater reliability)/합의(consensus)를 보장하기 위해 절차를 ‘올바르게’ 따르는 것에 관한 것이 아니다. 대신, 그들은 연구자가 데이터와 과정에 사려 깊고 성찰적으로 참여할 것을 요청한다. (예를 들어, 오클랜드 대학교 웹사이트에 있는 그들의 방법에 대한 포괄적인 요약을 참조하라: https://www.psych.auckland.ac.nz/en/about/thematic-analysis.html.)

 

다양한 방법론을 위한 다양한 과정과 절차
(Varying Processes and Procedures for Different Methodologies)
 

 

데이터에서 패턴을 찾고 위에서 설명한 기본 단계를 넘어서는 다른(비록 중복되지만) 절차들이 다른 학자들에 의해 제시되었다. Braun and Clarke (2021)가 언급했듯이, 그들의 주제 분석 접근 방식과 다른 방법론적 접근 방식에서 발견되는 것을 구별하는 것은 중요하다.

 

예를 들어, 근거 이론(grounded theory)의 지지자들(예: Glaser, 1962; Glaser & Strauss, 1967)은 그들만의 코딩 절차 버전을 명시한다:

 

  • 바로 귀납적, 데이터 주도적 접근(inductive, data-driven approach)$^4$이다. 이는 데이터/텍스트를 줄 단위(line-by-line)로 코딩하고 개념적 구성 요소들이 드러나는 대로 분석하는 것으로 시작한다.
  • 이것은 “지속적 비교 방법(constant comparative method)”을 사용하여 예비 이론화(preliminary theorizing)로 이어진다.
  • 다음 단계인 “메모하기(memoing)”이론화“부정적 사례(negative case examples)”를 사용하는 통합과 정교화의 최종 단계로 병합된다.
  • 최종적인 분석은 창발적 이론(emergent theory)으로 작성된다.

 

$^4$ Braun and Clarke (2019a; Braun, Clarke & Terry, 2014)는 TA와 근거 이론의 주요 차이점을 명시한다:
i. TA는 방법론(methodology)이 아니며
ii. TA가 데이터에 대한 개념적으로 정보를 갖춘 이해를 생산할 수는 있지만 이론(theory)을 개발하려고 시도하지는 않는다.
참조: https://www.psych.auckland.ac.nz/en/about/thematic-analysis.html

 

해석학적 현상학적 분석(Interpretative Phenomenological Analysis, IPA)의 경우, Smith et al (2009)은 Braun and Clarke가 제시한 주제 분석 단계와 시작점이 유사한 유동적이고 창발적인 접근 방식을 사용한다. 그러나, Smith et al (2009)은 개별 기술적 요소(idiographic element)가 파악되도록 하기 위해 각 개별 사례(각 참가자의 이야기)를 먼저 분석할 것을 권장한다$^5$. 여기서 연구자는 각 사례의 개별성을 정당하게 다루기 위해 이전 주제들을 괄호 치기(bracket)하고 열린 마음을 유지하려고 시도한다. 나중에, 해석은 은유나 시간적 참조를 활용하고 분석을 바라보는 렌즈로서 다른 이론들을 도입함으로써 더 깊은 분석 수준으로 넘어간다. 실제로 약한 IPA 연구들은 주제 분석처럼 보이며, 명시적으로 현상학적이 되게 하는 철학적 근거(grounding)를 놓치곤 한다.

 

$^5$ Braun and Clarke (2019a; Braun, Clarke & Terry, 2014)는 경험에 대한 1인칭 설명이 아닌 연구 질문을 다룰 때 그리고/또는 더 큰 표본으로 작업할 때 TA를 사용할 것을 권장한다.
IPA는 종종 작은 표본 크기를 가지며 개별 기술적(idiographic) 통찰력을 높이 평가한다;
TA는 데이터 전반에 걸친 패턴을 포착하기 위해 훨씬 더 큰 표본을 권장한다.
참조: https://www.psych.auckland.ac.nz/en/about/thematic-analysis.html

 

또 다른 현상학적 예시는 Giorgi (2009)가 제시한 기술적 현상학적 방법(descriptive phenomenological method)인데, 그는 분석이 경험적이고 체화된(embodied) 방식으로 관여되어야 한다고 주장한다. 단순히 처방된 단계를 따르거나 정해진 절차를 적용하는 대신,

  1. 연구자는 과거의 지식을 괄호 치기(bracketing)하고 현상의 실재를 가정하는 것을 보류하면서 현상학적 환원(phenomenological reduction)의 태도를 취한다.
  2. 기술(description)(녹취록 또는 작성된 프로토콜)은 전체적인 감을 잡기 위해 현상학적 태도 내에서 읽힌다.
  3. 그런 다음 녹취록은 “의미 단위(meaning units)”(구절, 전체 단락)로 나뉘고 각 구절에 대해 성찰한다.
  4. 참가자의 일상적 표현에 포함된 심리적 의미들이 추출되고 상세화된다.
  5. 연구자는 본질적인(essential) 측면과 특수하거나 부수적인 측면을 구별하기 위해 “자유 변경(free imaginative variation)”을 엄격하게 적용함으로써 경험의 구조를 결정하고 분석을 종합한다.

채택된 주제 분석의 접근 방식과 관계없이, 이 섹션에서 강조하는 핵심 포인트는 주제가 적극적으로 작업되어야(worked with) 하고 함께 직조되어야(woven together) 한다는 것이다.

 

나 자신의 체화된 글쓰기 과정(Finlay, 2014)의 경우, 나는 주제를 쓰고 내 감각하는 신체(sensing body)에게 그것이 옳게 느껴지는지 묻는다... 나는 그것을 다시 읽고, 가지고 놀고, 다시 빚는다(remould)... 그리고 다시 확인하며, 내 감각하는 신체에게 그것이 작동하는지 묻는다... 나는 데이터로 돌아가 더 많은 연결을 만든다...

 

분석 과정은 접목(grafting)과 기예(crafting)의 과정이다.

 

  • 주제는 단순히 ‘드러나는(emerge)’ 것이 아니다; 그것은 해저의 조개 속 진주처럼 ‘발견되기를 기다리며’ 데이터 안에 이미 ‘들어 있는’ 것이 아니다.
  • 주제가 도착하거나 발견되기를 수동적으로 기다리는 것은 소용없다. 대신, 주제가 반복적으로 진화하고, 형성되고, 다듬어지고(polished), 체계적으로 입증됨에 따라 데이터를 점진적으로 끌어모으는 공들인 과정이 있다.
  • 연구자는 딱 맞는 단어/이미지가 찾아질 때까지 적극적으로 관여하고, 탐색하고, 공명하고(resonating), 창조하고, 공예(crafting)해야 한다.

 

반복적 과정(iterative process)의 예를 들자면, 영국에서 심리치료사가 국가 공인을 받게 되는 것이 무엇을 의미하는지에 대한 작은 파일럿 연구에서, 내 동료 Ken Evans와 나(Evans & Finlay, 2009)는 데이터에서 발생하는 11개의 (이슈와 의미의) 범주로 시작하여 결국 4개의 양극성 주제(bi-polar themes)로 좁혔다: ‘자랑스러움 느낌-수치심 느낌’; ‘소속감-고립감’; ‘신뢰성-부적격성’; 그리고 ‘투쟁-도피’. ‘자랑스러움 느낌-수치심 느낌(Feeling proud-feeling shame)’ 주제에 대한 우리의 최종 분석은 참가자들과 두 연구자가 느낀 양가감정(ambivalence)을 전경화하는 층위가 있는 복잡성(layered complexity)을 보여주었다:

우리 모두에게, 등록(registration) 문제는 평생의 투쟁과 그 과정에서의 성취에 대한 기쁨을 포함하는 여정과 연결되어 있다. 우리는 우리의 작업이 마침내 공식적이고 공적인 방식으로 가치 있게 여겨지고 타당성을 인정받기를 추구한다. 우리는 우리 직업의 미래에 대해 마음을 쓰며 그 안에서 우리의 위치를 자랑스러워한다... 수치심은 충분하지 않다는 것과 충분히 소속되지 않았다는 것 두 가지 모두이다. 우리는 스스로를 결함이 있다고 믿으며, 따라서 수용과 소속의 가치가 없다고 믿는다. 우리가 배제되는 것에 대해 화가 나거나 분개할 수도 있지만, 우리가 거절당해 마땅하다고 스스로를 설득하고 우리 자신을 소외시키면서 그 감정은 너무나 쉽게 내부로 향한다. 그러나 우리가 억압을 내면화할 때조차, 우리는 우리가 가치 있다는 타인으로부터의 타당성 확인(validation)을 얻기를 갈망한다; 수용할 만하고 또 수용되었다고 느끼기 시작하기를. (2009, pp. 7-8)

 

좋은 놈, 나쁜 놈, 추한 놈
(The Good, the Bad, and the Ugly)
 

 

주제 분석은 연구자가 적극적으로 관여하고 성찰적(reflexive)이었으며 연구 과정을 투명하게 만들었다는 것이 분명할 때 ‘좋다’고 간주될 수 있다.

코딩 과정은 지속적으로 자기 자신에게 되돌아오는 것(bending back on oneself)을 요구한다 – 데이터를 해석하고 코딩할 때 우리가 하고 있는 가정들에 대해 질문하고 의문을 제기하는 것이다. 주제는 우리 코딩의 창의적인 노동(creative labour)을 통해 그리고 그로부터 개발된 분석적 산출물이다. 그것들은 상당한 분석적 ‘작업’을 반영하며, 데이터, 분석 과정, 그리고 주관성의 교차점에서 연구자에 의해 적극적으로 생성된다. (Braun & Clarke, 2019b)

 

주제 분석에서 ‘나쁜’ 관행의 사례로는 연구자가 사려 깊은 관여를 보여주지 않았거나 반복(iterations)을 통해 체계적으로 작업하지 못한 연구들이 포함된다. 아마도 주제가 충분히 유익하거나, 명확하거나, 독특하지 않을 수 있다. 또한 증거가 되는 인용문이 충분하지 않을 수 있으며, 그것들을 얻는 과정에서 필요한 성찰적 투명성(reflexive transparency)이 결여되어 있을 수 있다.

 

그러한 연구들에서, 주제는 불충분하게 소화되었을 수 있다. 혹은 주제가 너무 많아 추가적인 처리가 필요함을 시사할 수도 있다. 예를 들어, 나는 한때 8개의 상위 주제를 포함하고, 각 주제가 6-10개의 하위 주제를 포함하는(총 63개의 주제!) 보고서를 읽은 적이 있다. 이 주제들의 과잉(superabundance)이 주는 짓눌리는 무게가 연구를 압도했다. 저자들이 묘사하려고 했던 현상 바로 그 자체가 사실상 사장되었다. 통찰력의 덩어리들 – 몇몇 진짜 보석들 – 은 불충분하게 작업 된 데이터의 쓰나미 속에 묻혀버렸다.

 

Braun, Clarke, and Terry (2014)는 약하거나 설득력 없는 분석의 증거와 관련하여 다음과 같은 지침을 제공한다:

  • 주제가 너무 많거나 너무 적은가?
  • 주제 단계(levels)가 너무 많은가?
  • 코드와 주제 간의 혼동이 있는가?
  • 데이터 발췌문과 분석적 주장 간의 불일치가 있는가?
  • 데이터 발췌문이 너무 적거나 너무 많은가?
  • 주제 간의 중복이 있는가?

위에서 언급한 낙태 연구는 발생할 수 있는 심층적인 성찰적 처리의 유용한 예를 제공한다. 첫 번째 사례 연구 기사에서, Finlay & Payman (2013)은 ‘괴물 같은 (어)머니 되기(Monstrous (M)othering)’라는 주제를 만드는 데 무엇이 들어갔는지 논의한다. 다음 인용문은 Barbara Payman의 성찰 일기에서 발췌한 것으로, 그녀는 여기서 자신의 모성적 역전이(maternal counter-transference)를 처리했다.

Mia가 자신의 이야기를 할 때 나는 그녀에 대해 매우 보호적이고 지지적인 느낌을 받았다. 그녀는 나의 깊은 연민을 불러일으켰고, 나는 그녀에게 ‘관계적으로 결여된 것’이 무엇인지 내내 모니터링하고 있었음을 알 수 있다; 그리고 이 ‘부재’의 영향을 기저에 깔린 슬픔의 감정으로 느끼고 있었다. 인터뷰 중 내가 그녀에게 슬픔에 대해 언급할 때마다 그녀는 아무것도 느끼지 않는다고 보고했으므로, 내가 나 자신의 ‘내면의 연민의 눈물’뿐만 아니라 그녀의 억압된 슬픔까지 ‘안고(holding)’ 있었을 가능성이 적지 않다... 나는 듣고 있는 다양한 장면들에 대해 ‘주의 깊고 사랑스러운 어머니’라면 어떻게 반응할지를 매우 명백하게 인식하고 있었다; 나는 이것을 강하게, 그리고 분명하게, 아마도 많은 보호적인 ‘모성적 열정(maternal fervour)’(!)을 가지고 느끼고 있었다 (2013, p.166)

 

이 성찰은 우리가 처리한 데이터의 일부가 되었고, 이는 우리로 하여금 세 참가자 모두가 자신의 어머니와 문제가 있고 손상을 주는 관계를 맺고 있었음을 인식하게 이끌었다. 우리의 최종 주제 분석에서, 우리는 사례 연구 참가자인 Mia가 어느 수준에서 자신이 다음과 같았다고 믿었다고 제안했다:

‘괴물 같은 어머니(monstrous mother)’; ‘괴물 같은 타자(monstrous other)’를 낳은 사람. 그러나 이 주관성 속에 굴절되어 우리는 태아로서, 그리고 낙태를 선택한 젊은 여성으로서 그녀 자신의 ‘괴물 같은 어머니’와 그녀 자신의 ‘괴물 같은 자아’의 유령 같은 이미지들을 발견한다 (Finlay & Payman, 2013, p. 162).

 

나에게 있어, ‘괴물 같은 (어)머니 되기’라는 주제 제목과 관련된 성찰적 논의들은 강력한 주제 분석을 만들어내는데, 이는 모호하게 층을 이루고, 가슴 저미며, 잊혀지지 않고, 도전적이며, 생각을 자극하는 것이다.

 

무엇이 ‘추한(ugly)’ 주제 분석이 될 수 있는지에 대한 판단은 물론 주관적이다; ‘추하다’는 결정은 특정한 기호와 선호를 가진 독자의 눈에 달려 있을 뿐이다. 지나치게 가혹하게 들릴 위험을 무릅쓰고, 나는 다음과 같은 주제들을 ‘추하다’고 간주한다:

 

  • i. 분석적 사고의 결여 (Lacking in analytic thinking) – 예를 들어, 분석이 너무 많은 처리되지 않은 파편화된 세부 사항(fragmented detail)을 포함하여 결국 참가자들이 말한 것을 단순히 피상적으로 토해내는 것(regurgitation)으로 끝나는 경우이다. 또는 분석이 지나치게 복잡한 주제 구조에 의해 부담을 갖는 경우이다.
  • ii. 불충분하게 공예되었기 때문에 진부함 (Banal) – 진부한 분석은 지루한 경향이 있으며 예상치 못한, 흥미로운 통찰력을 거의 제공하지 못한다.
  • iii. 발표가 엉성함 (Sloppy in presentation) – 여기서 글쓰기는 지나치게 상투적(clichéd)이거나, 흐름이 끊기거나, 표현이 서툴 수 있다. 대안적으로, 소화할 수 없는 전문 용어로 가득 차서 거의 의미를 파악할 수 없을 수도 있다.

 

주제 분석 평가하기

(Evaluating Thematic Analysis) 

 

주제 분석이 좋은지, 나쁜지, 혹은 단순히 추한지(ugly)에 대한 평가는 부분적으로 분석의 유형, 방법론(methodology), 그리고 보는 사람의 가치관에 따라 달라진다. 단순화된 수준에서, 과학적으로 지향된 학자가 더 예술적인 발표를 일축하는 것은 놀라운 일이 아니다. 마찬가지로, 해석적이고 예술적인 형식을 선호하는 학자들은 자신들이 건조하고 이해할 수 없는 전문 용어(jargon)로 가득 차 있다고 여기는 과학적 보고서에 덜 감명을 받을 수 있다.

 

주제 분석의 품질은 또한 전체로서 판단되어야 한다. 그것은 주제 제목의 ‘태그 라인(tag line)’보다 훨씬 더 많은 것을 포함한다. 어떤 논문들은 훌륭한 주제 제목을 가지고 있지만, 주제에 대한 설명이나 성찰적 분석(reflexive analysis)이 부족한 경우가 있다. 아마도 주제가 충분히 설명되지 않았거나, 인용문이 충분히 연결되지 않거나, 분석적 경로(analytic trail)가 투명하지 않을 수 있다. 반대로, 밋밋한 제목이 생생하고 강력한 입증 인용문들에도 불구하고 서술의 힘을 약화시키는 경우도 있다.

 

주어진 주제 분석의 품질을 평가하기 위해, 나는 확립된 평가 기준(인정받는 많은 기준이 이용 가능하다)을 사용할 것을 권장한다.

 

  • Lincoln and Guba (1985)는 신뢰성(trustworthiness)을 확립하기 위한 네 가지 기준, 즉 신빙성(credibility), 전이 가능성(transferability), 의존 가능성(dependability), 확증 가능성(confirmability)을 제안한다.
  • Yardley (2000)는 질적 연구의 품질을 평가하기 위한 네 가지 광범위한 원칙을 제시한다: 맥락에 대한 민감성(sensitivity to context), 헌신과 엄격성(commitment and rigour), 투명성과 일관성(transparency and coherence), 그리고 영향력과 중요성(impact and importance).

 

내가 사용하는 편리한 약칭 도구 중 하나는 ‘4 R’: 엄격성(Rigour), 관련성(Relevance), 울림(Resonance), 성찰성(Reflexivity)이다 (Finlay & Evans, 2009; Finlay, 2011). 나는 이것들을 파이의 네 조각으로 보지만, 각 조각의 크기는 변할 수 있다. 사분면의 크기는 관련된 연구 유형에 따라 더 작아지거나 커질 수 있다. 예를 들어, 과학적 연구는 ‘엄격성’을 우선시할 가능성이 높은 반면, 더 예술적인 연구는 ‘울림’을 더 높게 평가할 것이다.

 

당신이 논문을 읽을 때 어떤 측면을 소중히 여기는지 자문해 볼 가치가 있다. 나는 특히 연구 결과를 흥미롭고 전문 용어를 사용하지 않은 방식으로 제시하는 울림 있는 논문들을 좋아한다. 그리고 질적 연구에 관해서라면, 연구자가 연구 결과를 만들어내는 데 일조했으므로 성찰적 설명(reflexive accounting)을 찾아본다.

 

엄격성 (Rigour) 

 

  • 주제 분석에 적용될 때, 엄격성은 분석이 유능하게 관리되고 체계적으로 작업 되었는지를 묻는다. 연구 결과가 설득력 있는 방식으로 증거와 일치하는가? 지식 주장(knowledge claims)이 검증되고 논증되었는가?
  • 예를 들어, 해석학적 현상학적 분석(Interpretative Phenomenological Analysis, IPA) 연구에서 엄격성은 주제 기술(thematic descriptions)의 품질을 통해 확립된다:

 

분석은... 단순히 무엇이 있는지에 대한 기술을 넘어 그것이 무엇을 의미하는지에 대한 해석으로 나아가며 충분히 해석적이어야 한다. 좋은 IPA 연구는 독자에게 특정 개별 참가자들에 대한 중요한 무언가뿐만 아니라 그들이 공유하는 주제에 대한 중요한 무언가를 말해준다. (Smith et al, 2009, p. 181)

 

 

  • Smith 등은 각각의 모든 주제가 참가자들의 인터뷰 발췌문으로 예시되어야 한다고 권장한다. 더 작은 표본 크기에 기초한 분석의 경우, 그들은 모든 참가자의 발췌문이 제시되어야 한다고 제안한다.
  • 엄격성은 또한 체계적인 작업의 가시적 증거에 의해 확립된다. 더 약한 주제 분석들은 불완전하거나 끝나지 않은 것처럼 보인다; 분석이 충분히 증류되지 않았거나 의미 있게 ‘덩어리로 묶이지(chunked)’ 않았을 수 있다. 이는 코드, 범주, 주제 간에 혼란이 있을 때 가장 분명하게 나타난다. 또한 아마도 함께 그룹화되어야 할 자잘한 주제들이 과도하게 많이 떠다니는 경우에서도 볼 수 있다$^6$.
  • 때로는 주제가 너무 많은 문제가 ‘영역 요약(domain summaries)’$^7$, 상위 주제(superordinate themes), 하위 주제(subthemes)의 층위를 포함하는 지나치게 정교한 구조로 인해 악화되기도 한다. 그러한 경우, 연구자들은 모든 것을 다루려고 하기보다는 가장 중요한 몇 가지 주제에 집중하는 것이 더 나을 수 있다. 마치 그들이 연구 결과에 대해 무언가를 말하기 위해 주제 구조를 사용하는 대신, 주제 구조를 상세히 기술하는 데 사로잡힌 것처럼 보인다.

 

$^6$ Braun and Clarke는 단일 저널 논문이나 학위 논문의 경우 2-6개의 주제를 가질 것을 권장한다. 그들은 연구자들에게 하위 주제와 관련해서는 아껴서 사용할 것을 권장한다.
$^7$ Braun and Clarke는 영역 요약(domain summary)이 분석적 관찰을 조직하는 기저 개념/주제 없이, 하나의 인터뷰 질문과 관련하여 참가자들이 말한 모든 것과 같이 데이터의 한 영역을 요약한 것이라고 말한다.

 

상위 주제와 하위 주제를 포함하는 ‘좋은’ 주제 구조의 예로 나는 Westland (2020)를 제시하고 싶다. 그녀는 자신이 문제적으로 덩치가 크다고 생각하는 6명의 여성(모두 체질량 지수(BMI)가 30 이상)을 인터뷰했다. 그들의 체험(lived experience)을 탐구하기 위해 IPA를 방법론으로 채택하여, 그녀는 단 2개의 상위 주제와 6개의 하위 주제를 식별했다. 전체적으로 볼 때, 주제들은 모두 명확하게 연결된다:

 

상위 주제 1: 괴물처럼 거대한 몸이기 (Being a Monstrously Huge Body)

  • 비열하고 실망스러운 형태 (Despicable and disappointing form)
  • 까다롭고 모든 것을 삼켜버리는 피할 수 없는 육체 (Demanding and all-consuming inescapable physical body)
  • 부인 (Disownment)
  • 자신과 맞지 않음 (Mis-fitting myself)

상위 주제 2: 타인의 시선을 느낌 (Feeling the Eyes of Others)

  • 수치심 (Shame)
  • 보이지 않게 존재함 (Invisibly present)

Westland는 이 제목들에 이어 강력한 분석을 덧붙였다. 예를 들어, 첫 번째 주제 아래에서 그녀는 ‘증거’로 제시된 참가자 자신의 은유적 진술을 강조하며 다음과 같은 해석적 기술을 포함했다:

모든 참가자는 자신의 몸에 대해 극심하고 강렬한 혐오감을 가지고 있었다. 그들은 자신의 몸의 무거움, 생김새, 제약, 의미에 대해 역겨움을 느꼈다. 그들은 이 끔찍한 물체, 자신의 세상에서 제멋대로 움직이는 이 형태 같은 것을 거부함을 나타내기 위해 “살찐 흰 구더기(fat white grub)”, “다리 달린 술통(kegs with leg)”, “콩알 머리에 거대 몸집”, “오동통(roly-poly)”, “해변에 갇힌 고래(beached whale)”, “고통스러운”, “추한”, “역겨운”, “크고 뚱뚱하고 추한 덩어리(big fat ugly blob)”와 같은 문구를 사용했다. (Westland, 2020, p. 7)

 

엄격성은 또한 위에서 설명한 Herron & Sani (2021)의 설문 조사 결과에서도 나타나는데, 그들은 기술적 연구에 이어 첫 번째 설문 조사에서 확립된 정의의 정확성을 평가한 178명의 참가자를 대상으로 한 또 다른 설문 조사를 수행했다. 두 연구에 대한 그들의 비판적 평가는 관련된 비대표적 표본(non-representative samples)을 강조하고 지식 주장의 한계를 지적한다:

첫째, 설문 조사를 기반으로 했기 때문에, 이 연구는 공허함에 대한 1인칭 경험의 비교적 간결한 설명을 이끌어냈다. 향후 연구는 행위 주체성(agency) 및 체화(embodiment)와 같이 우리 연구에서 중요하게 드러난 공허함의 현상학적 측면뿐만 아니라, 우리 참가자들에 의해 다루어지지 않았지만 관련이 있을 수 있는 시간성(temporality)과 같은 측면에 대한 심층적인 탐구를 목표로 해야 한다. 아마도 이는 반구조화된 인터뷰를 통해 달성 가능할 것이다.


둘째, 우리 연구는 주로 영국인과 아일랜드인 참가자를 포함했다. 향후 연구는 공허함이 문화 특이적인지, 아니면 보편적인 인간 경험인지를 탐구하기 위해 인종적으로 다양한 표본(ethnically diverse samples)을 모색해야 한다.


셋째, 우리는 기존 문헌(Blasco-Fontecilla et al., 2016)과 일치하게 공허함의 만성성과 자살 행동 사이의 중요한 연관성을 확인했다. 그러나 우리 연구는 그러한 관계의 본질이나 관련 매개 요인을 밝킬 수 없었다. 따라서 향후 작업은 고위험군을 식별하고 개입함으로써 자살 예방 전략에 기여하기 위해 이 연결 고리를 이해하는 것을 목표로 해야 한다.


이 연구에 이어 명확히 해야 할 마지막 중요한 영역은 공허함이 서로 다른 진단을 가진 사람들에게 질이나 형태가 다르지 않은 초진단적(transdiagnostic) 경험이라는 우리의 제안을 더 탐구하는 것이다. 따라서 경계성 인격 장애(BPD) 진단을 받은 사람들을 포함하여 다양하고 검증된 임상 집단에서 공허함을 평가하는 것을 목표로 하는 연구는 이 결론의 정확성을 결정하는 데 도움이 될 것이다.

 

관련성 (Relevance) 

 

 

  • 관련성은 적용 가능성과 기여 측면에서 연구의 가치를 다룬다. 연구 중인 현상에 대한 우리의 이해를 더해주는가? 어떤 방식으로든 실천(practice)을 개선하는가? 이는 이 *유럽 심리치료 질적 연구 저널(European Journal of Qualitative Research in Psychotherapy)*과 같이 직업 및 실천 지향적인 저널에 게재된 논문에 특히 중요하다.

 

예를 들어, 위에서 논의된 낙태 연구에서 제시된 토론을 고려해 보라:

우리는 중요한 여성 문제인 낙태를 연구하기 위해 페미니스트에게 영감을 받은 관계적-성찰적 방법론을 사용함으로써 페미니스트 현상학 분야에 기여하고자 했다... 우리는 이 사례 연구가 겪은 트라우마의 정도에 대한 의미 있는 이해를 얻기 위해 (젊은) 여성의 낙태에 대한 개인적 및 관계적 맥락을 인식하는 것의 중요성을 보여준다고 제안한다. 또한 “낙태 후 증후군(post-abortion syndrome)”과 같은 라벨과 범주로 너무 빨리 뛰어들기 전에, 트라우마적 경험이 복합적으로 다양하고 층위가 있을 것이라는 점을 진지하게 받아들여 다른 여성들의 경험도 들어보는 것이 가치 있을 것이다... 심리치료 분야에 적용할 때, 이 연구는 더 넓은 관계적 의미 맥락 전체와 함께 신중하고, 자비로우며, 느린 현상학적 머무름(dwelling)의 가치를 강조한다. 만약 내담자가 낙태를 했다고 공개한다면, 그것이 그녀에게 그리고 그녀의 세계에 어떤 의미인지 탐구하는 것은 우리의 의무다. 그래야만 우리는 내담자가 그 경험을 이해하고 헤쳐 나가도록 도울 수 있다. (Finlay & Payman, 2013, pp. 171-172)

문제적 체중을 가진 여성들에 대한 Westland의 연구는 ‘관련성’과 씨름하는 방법에 대한 또 다른 좋은 예를 제공한다. 임상적 함의에 대한 논의에서, Westland는 현재 체중 관리를 돕기 위해 사람들에게 제공되는 심리적 도움의 많은 부분이 그 사람의 몸과 세상 사이에 거리를 만든다고 주장한다.

여기서의 연구 결과는 이러한 접근 방식이 세상 속의 자신으로부터의 거리두기, 즉 신체를 소외시키고 그들의 진정한 자아를 소외시키며 실존적 성장(의미, 목적, 선택, 가능성 등)을 억압하는, 점점 좁아지는 존재 방식 이외의 다른 것을 선택할 자유가 거의 없는 탈신체화(disembodiment) 상태를 만든다는 것을 시사한다. (2020, p. 11)

 

그녀는 이에 이어 문제적 체중을 가진 내담자와 작업할 때 치료사를 위한 몇 가지 실질적인 조언을 덧붙인다. 구체적으로, 그녀는 치료사들이 그러한 내담자들이 체험된 몸(body as lived)에 대한 인식, 신체 소유권(body ownership), 자아감(sense of self)을 향상하도록 돕기 위해 노력할 것을 권장한다. 유용하게도, 그녀는 이러한 각 목표를 위해 수행될 수 있는 치료적 연습의 예시를 제공한다.

 

울림 (Resonance) 

 

  • 울림은 연구의 정서적, 예술적 차원을 활용한다. 주제 분석이 가슴 저미고, 강력하고, 환기적이고, 감동적이며, 우아하고, 그리고/또는 생생한가?

 

주제 분석에 문학적 감수성을 가져오는 방법에 대해 더 구체적으로 생각해보면,

 

  • 우리는 “지각(perception)”이나 “신체(body)”와 같은 주제 제목이 다소 밋밋하고, 재미없고, 정보를 주지 못한다고 판단할 수 있다.
    • 연구자가 그 동일한 주제들의 제목을 “안개 속에서 길을 잃음(lost in a fog)”, “쳇바퀴에 갇힘(stuck in a hamster wheel)”, “정상인 척하기(passing as normal)”, 혹은 “병에서 건강으로 그리고 다시 돌아가는 변신(shapeshifting for illness to health and back again)”으로 붙였다면 어땠을지 그 대조를 고려해 보라. 이러한 주제 제목들은 환기적인 이미지를 활용하기 때문에 더 잘 작동한다.
  • 단지 “외로움” 대신
    • “아린 공허함(Aching emptiness)”이라는 은유를 사용하는 것은 어떤가? “상실과 갈망(Lost and longing)”처럼 두운(alliteration)을 좀 적용해보는 것은 어떤가? “분노”라는 주제 제목을 갖는 대신, 상황을 생생하게 만들기 위해 참가자 중 한 명의 인용구를 빌려오는 것은 어떤가? “그를 목 졸라 죽일 수도 있었어요!”는 특히 감질나는(tantalising) 예가 될 것이다.
  • 복잡성과 양가감정은
    • ‘투쟁과 적응(struggling and adapting)’; ‘부정과 수용(denying and accepting)’; ‘후퇴와 전투(retreating and battling)’(Fitzpatrick and Finlay, 2008의 연구 주제들)와 같은 양극성을 사용하여 포착될 수 있다.

 

위에서 설명한 Westland (2020)의 연구는 생생하고, 울림 있으며, 강력한 글쓰기와 참가자 자신의 은유적 언어를 환기적으로 사용한 좋은 예이다:

그들의 몸에 대한 큰 실망과 대상화(objectification)가 있었다; 그들은 몸을 자신들에게 가치 없는 쓸모없는 쓰레기 조각처럼 내려다보았다.

Anne은 자신의 몸을 “무너져 내리는(falling apart)” 것으로 묘사했고, 몸이 어떻게 자신을 실망시키고 삶을 살아가는 것을 방해했는지 끊임없이 상기되었다. Sarah 또한 자신의 몸을 증오하며, 몸이 자신의 과거를 상기시키고, 마치 인생에서 원하는 것을 하지 못하게 막는 별개의 존재인 것처럼 몸을 질질 끌고 다니며 돌봐야 한다는 사실을 상기시켰다. 그녀는 “나는 원망 속에 갇혀 있다”고 말했다. Alison은 자신의 몸을 “크고 뚱뚱하고 역겨운 덩어리(big fat repulsive blob)”이자 비극적인 이야기를 담고 있는 공포의 형태라고 불렀다.

이러한 혐오와 실망은 그들의 일상적 경험의 배경을 형성한다. (Westland, 2020, p. 7)

 

화상 회의 치료의 경험에 대한 연구(위에서 설명됨)에서 Mitchell (2020)은 그녀의 연구 결과에 약간의 울림을 주입하는 데 성공했다. 주제는 지루하고 기술적일 수 있었지만, 그녀는 언어 사용과 참가자 인용문 선택을 통해 치료사들의 불편함과 현상의 모호함을 끄집어내는 데 성공했다. 온라인으로 작업하는 법을 배우느라 씨름했던 치료사 독자들은 보이는 것과 숨겨진 것을 동시에 다루어야 하는 그녀의 묘사에 공감할 것이다:

참가자들에게 화상 회의 심리치료 사용의 근본적인 부분은 무엇이 보이고 무엇이 보이지 않는지에 대한 개념이었다; 온라인 렌즈를 통해 치료사가 볼 수 있는 것과 숨겨지거나 보이지 않는 상태로 남아있는 것. 참가자들은 내담자와의 물리적 가까움을 묘사한다. 내담자의 표정을 면밀히 관찰할 수 있게 해주는 확대(magnification)의 감각이 있지만, 이는 또한 서로를 더 면밀히 훑어보거나 판단할 기회를 만들 수도 있다. 이 더 가까운 정밀 조사는 몰입하게 하면서도 주의를 산만하게 한다:

당신은 정말 얼굴을 마주하고 있어서(so face to face) [미소] 사실 사람들이 당신을 읽습니다. 그들은 자신들이 당신을 그렇게 가까이서 읽고 있다는 것을 인식하지 못할 수도 있지만, 그들은 그러고 있습니다. (Claire)

나는 그들의 턱이 굳어지는 것을 볼 수 있어요... 온라인에서, 나는 그들의 동공을, 동공의 확장이 다른지 볼 수 있어요, 피부색이 다른지 볼 수 있어요... 내 생각엔 당신이 그 사람을 얼마나 볼 수 있느냐에 달린 것 같아요. (Boris)…

Claire는 때때로 몹시 고통스럽게 느껴질 수 있는 고조된 노출(exposure) 감각을 묘사한다. 하지만 그것은 또한 기꺼이 받아들여야 할 어떤 것일 수도 있다. 치료사 신체의 일부는 숨겨져 있지만, 치료사는 전시되고 드러난 것처럼 느낄 수 있다:

사람들은 당신에 대한 그 매우 가까운 정밀 조사를 바탕으로 당신에 대해 정말 빨리 결정을 내립니다... 갈 곳이 없어요, 정말로; 숨을 수가 없어요. (Claire)

 

마찬가지로, Herron & Sani (2021)의 더 과학적으로 지향된 논문에서도, 저자들은 은유적 인용문의 사용을 통해 여전히 참가자 경험의 ‘느낌’을 환기하려고 노력한다. 다음은 그들의 ‘자아와 타인(self and others)’ 주제에 대한 연구 발췌문이다:

공허함은 전형적으로 타인과의 관계와 관련하여 경험되었다. 첫째, 참가자들은 타인에게 줄 것이 아무것도 없다고 느꼈다. 그들은 영향력을 미치거나, 개인적 관계 및 공동체 생활에 어떤 실질적인 기여도 할 수 없다고 느꼈다. 이와 관련하여, 그들은 무가치함과 내재적 가치의 결여를 표현했고, 자신을 타인에게 성가신 존재이자 짐(burden)으로 묘사했다. 추가로, 참가자들은 인정(recognition)의 결핍을 경험했다. 그들은 주변 사람들에게 마치 “투명 인간(invisible)”인 것처럼 느꼈다. 그들은 가장 아끼는 사람들을 포함하여 타인에게 자신의 말이 경청되지 않거나 주목받지 못한다고 느꼈으며, 타인들에게 둘러싸여 있음에도 불구하고 “실종된 사람(missing person)”이라고 느꼈다. 이는 대상화되고 소모품(예: “발매트(doormat)”, “도구”처럼 취급됨)이 되는 느낌과 관련이 있었다. 참가자들은 또한 혼자이고, 연결이 끊어지고, 주변 사람들로부터 차단되고 멀어진 느낌에 대해 이야기했다. 일반적으로, 이 영역에 관련된 구성 요소들은 예리하게 느껴지는 고립감과 완전한 외로움, 연결되지 못하고, 어울리지 못하고, 보이지 않으며, 사회적 세계의 필수적인 부분이 되지 못하는 무능력을 강조한다.

 

이러한 확장된 예시들은 좋은 글쓰기의 중요성을 강조한다. 단순히 주제 분석을 ‘보고’해야 한다고 생각하는 함정에 빠지는 대신, 연구자들은 연구 결과를 제시하고, 기술하고, 입증하는 방식에 정성과 상상력을 쏟아야 한다. 이것이 주제 분석의 결과가 소통될 수 있고, 더 넓은 영향력을 가질 수 있는 기초이다.

 

Halling (2002)이 언급했듯이, 연구자들의 도전 과제는 저널 독자들과 지적 및 개인적 수준 모두에서 효과적으로 소통하는 것이다. 예를 들어, 현상학적 텍스트는 독자들이 끌려들어 가고 그것이 주는 가슴 저림(poignancy)에 의해 말 걸어진다고 느낄 때 가장 성공적이다: “텍스트적 감정, 텍스트적 이해는 평소에 냉철한 사람(독자뿐만 아니라 저자도)을 눈물 흘리게 하고, 더 깊이 이해된 세속적 관여(worldly engagement)로 이끌 수 있다” (van Manen, 1990, p. 129).

 

 

성찰성 (Reflexivity) 

 

  • 마지막으로, 성찰성은 연구자의 자기 인식, 개방성, 그리고 윤리적 감수성(ethical sensibility)을 의미한다 (Finlay, 2016).
  • 그들은 자신의 주관성과 위치성(subjectivity and positioning)을 어느 정도까지 고려했는가?

 

다음 발췌문에서, Westland (2020)는 자신의 연구 결과를 성찰적이고 포괄적으로 처리한다. 여기서 그녀는 연구의 한계, 자신의 역할, 그리고 해석학적 현상학적 분석(Interpretative Phenomenological Analysis, IPA) 연구의 요구 사항을 인식한다:

비록 이 연구가 모든 여성에게 덩치가 크다는 것이 어떤 것인지 정의하는 것을 목표로 하지는 않았지만, 모든 참가자에 걸친 연구 결과의 일반적인 요약을 시도했다. 연구 결과의 일반화 가능성(generalisability)과 이 표본 크기에 기초하여 제기될 수 있는 일반적 주장에는 명백한 한계가 있다. 이 연구는 더 광범위한 사회경제적 인구통계(socio-economic demographic)를 가진 표본, 예를 들어 더 다양한 사회경제적 지위와 더 큰 민족적 다양성(diversity of ethnicity)을 가진 여성들을 포함했다면 혜택을 보았을 것이다. 그러나 표본의 한계를 인정하면서도, 나는 그러한 기준의 사용이 방법론적 진실성(methodological integrity)과 체험(lived experience)을 환기하는 능력에서 가치가 나오는 현상학적 접근 방식에는 적합하지 않다는 점을 제안하고 싶다.


더 깊은 언어적 분석(linguistic analysis) 그리고/또는 서사 분석(narrative analysis)은 추가적인 – 아마도 다른 – 통찰력을 제공했을 수 있다. 참가자들은 어린 시절부터 현재까지 자신의 이야기를 들려주고 싶어 했으므로, 서사 분석은 그들의 의미 만들기(meaning-making)를 더 깊이 조사하여 문제적으로 덩치가 크고 체중 감량에 실패하는 것이 어떤 것인지를 더 완전히 드러냈을 수 있다.


IPA는 연구 과정에 미치는 연구자의 경험(개인적 및 직업적 모두)의 영향을 인정하므로(Smith et al, 2009), 나와는 다른 심리치료 배경을 가진 다른 연구자가 인터뷰와 후속 분석 동안 이 현상의 다른 측면에 끌리고 다른 측면을 보았을 가능성이 있으며, 이는 의심할 여지 없이 다른 것들을 희생하여 다른 분석을 생산했을 수 있음을 인정해야 한다. 또한 인터뷰가 단순히 탐구되는 현상에 의해서만 영향을 받은 것이 아니라 연구자인 나 자신에 의해서도 영향을 받았다고 말하는 것이 공정할 것이다. 참가자들은 날씬한 미지의 개인과 마주하게 되었고, 공감적이고 비판단적이려는 나의 노력에도 불구하고, 라포(rapport)를 형성할 시간은 거의 없었다. 만약 내가 다시 연구를 한다면, 나는 우리 사이의 공간과 상호 영향에 관해 참가자들과 더 관계적으로(relationally) 작업했을 수도 있다. (2020, p. 12)

 

또 다른 예를 들자면, 위에서 설명한 낙태 연구(Finlay & Payman, 2013; Finlay, 2015)는 분석적 추론이 투명하게 드러나는 것처럼 연구자의 목소리를 전면에 내세운다. 예를 들어, 아래 발췌문에서 나는 참가자 중 한 명인 ‘Eve’(가명)와의 만남을 성찰한다. 나는 나의 존재가 Eve로 하여금 자신의 비탄(grief)을 인정할 수 있게 한 방식을 인식한다. 동시에, 내가 주제 분석에 참여했을 때의 인터뷰 후 성찰에서, 나는 나의 현존(presence)을 유지하고 Eve의 트라우마와 공포와의 융합(confluence) 속에서 그것을 잃지 않는 것이 얼마나 힘들었는지를 인식한다:

전사(Transcription) 작업은 힘들었다... 3일째다... 나는 계속 멈춰야만 한다. 나는 내가 동요하고 있다는 느낌, 뱃속에서 흐릿하지만 단단하게 나선형으로 조여오는 불안한 움켜쥠을 인식한다. 멈추고 싶다. 나는 나의 느껴지는 감각(felt-sense)에 주파수를 맞춘다: 뱃속에서 모든 것이 뒤섞인 듯한 흐릿한 느낌이 든다 (내 과정이 건드려질 때 얻는 것과 같은 느낌). 숨쉬기가 어렵다 – 얕은숨을 쉰다. 나는 전사본으로 돌아가면서 포커싱(Focusing)을 계속 밀고 나간다. 그녀가 죽은 파란 아기를 보는 지점에 와 있다. 나는 다시 그 흐릿한 배의 느낌을 느낀다. 나는 그것에게 나에게 말해달라고 요청한다. “이건 힘들다. 숨쉬기가 힘들다. 할 말이 없다”... 거기엔 약간의 눈물이 있다; 외로움; 말할 수 없는 공포. 내 배가 좀 더 조여든다. “나는 버텨야 해; 나는 안으로 삼켜야 해; 나는 울지 말고, 말하지 말아야 해.” 나는 그러고 나서 이 말들을 성찰한다. 나는 이 말들이 Eve의 경험을 어느 정도까지 반영하는지, 그리고 그녀가 어떻게 자신의 감정을 붙잡고 자신의 말을 억누르고 있어야 했는지 궁금해한다. (Finlay, 2014, p. 13)

 

이처럼 보고될 때, 성찰성은 그 자체로 흥미로울 수도 있고 아닐 수도 있다. 그러나 이것이 자기애적인 자기 몰입(narcissistic navel gazing)이나 감정 표출의 변명이 되어서는 안 된다. ‘좋은’ 성찰성의 핵심은 분석과 평가를 심화시키고 연구 과정을 더 투명하게 만드는 것이다. 위의 예는 연구를 더 깊은 수준으로 가져가려는 내 시도의 일부였다. 이 성찰은 내가 복합적이고 갇힌 비탄(complicated and entrapped grief)과 대처의 본질에 대한 추가적인 주제 분석을 착수하도록 자극했다 (Finlay, 2015). 최종 논문은 성찰성과 세 참가자의 이야기를 더 깊이 관여시켰다. 네 가지 추가 주제가 생성되었다: ‘수치스러운 침묵’, ‘자기 박해적 죄책감’, ‘해리(dissociation)를 통한 대처’, 그리고 ‘유해한(toxic) 맥락’.

 

낙태 연구에서 주제를 재작업한 것은 언제나 더 많은 것이 존재한다는 유용하고 적절한 상기(reminder)였다. 인간 경험의 사회적 세계는 결코 완전히 포착되거나 고정될 수 없다. 주제 분석은 – 그리고 더 일반적으로 질적 연구는 – 결코 확정적(definitive)이지 않다. 연구 결과는 항상 잠정적이고 창발적(emergent)으로 남는다. 말해질 수 있는 것은 항상 더 있을 것이다.

 

결론 (Conclusion) 

 

이 논문에서, 나는 주제 분석을 수행하는 단 하나의 방법은 없음을 강조했다. 마법의 공식은 없다. 주제 분석은 다양한 모양과 겉모습으로 나타난다. 중요하게도, 수행되는 분석의 형태는 연구 및 방법론적 맥락뿐만 아니라 수집된 데이터의 유형, 연구자 자신의 선호도, 그리고 타인(예: 저널, 심사위원)이 요구하는 것에 따라 달라진다.

  • 목표가 데이터의 명시적 내용(manifest content)을 나타내는 기술적 주제를 갖는 것인가? 아니면 목표가 해석적 재구성(interpretive revisioning)을 제공하는 것인가?
  • 주제들이 과학적 엄격성과 데이터에 대한 체계적인 작업을 통해 도출되었는가? 아니면 더 직관적이고, 유동적으로 역동적이며, 성찰적인 과정에서 발생했는가?
  • 주제 분석의 변형이 무엇이든, 주제는 데이터에서 단순히 드러나는 것이 아니다 (Braun and Clarke, 2019a; Braun, Clarke & Terry, 2014). 의미는 찾아져야 하며; 주제는 반복적인 버전을 통해 공들여 형성되고 다듬어져야 한다.
  • Braun and Clarke (2021, p. 44)처럼, 나는 주제 분석의 “광범위하고 생각 없는 수용(widespread thoughtless uptake)”을 지양하고, 대신 “사려 깊고 의도적인 실천(thoughtful and deliberate practice)”을 포함하는 접근 방식으로 장려하고 싶다 (2021, p. 44).

물론, 청중/독자층에 따라 다른 종류의 주제 분석과 글쓰기를 위한 자리가 있다. 과학 저널을 대상으로 하는 연구 논문은 과학적 엄격성에 더 관여해야 하며 신뢰성(reliability), 타당성(validity), 그리고 일반화 가능성(generalizability)과 관련된 우려를 다루어야 한다. 예술 기반 질적 연구 저널을 위해 작성된 논문은 예술적 또는 문학적 창의성과 기예(craft)의 추가적인 층위를 보여줄 필요가 있다.

 

나에게 있어, ‘좋은’ 주제 분석은 강력하고 설득력이 있다.

  • 그것들은 생동감 있고 강력한 주제 제목을 가지고 있거나, 풍부하고 강렬하며 독특한 기술적-해석적 분석(descriptive-interpretive analyses)을 포함한다. 그러한 분석은 당연시되는 가정들에 도전할 수도 있다.
  • 좋은 분석은 유익하다 – 그것은 우리에게 무언가를 가르쳐주고 신선한 관점을 제공한다. 좋은 주제들은 서로 잘 어우러지며(hang together); 일종의 이야기를 들려주고; 그것들을 지지하고 입증할 충분한 데이터를 가지고 있다.
  • 좋은 분석은 또한 연구의 목표를 적절하게 다루며 그 방법론적 및 인식론적 입장을 완전히 따른다. 내 개인적인 선호는 주제에 대한 환기적이고 문학적인 제시로 향하지만, 나는 또한 견고하게 엄격한 설명을 제공하는 과학적 연구들도 가치 있게 여기며, 특히 그것들이 잘 쓰이고 명확하게 쓰인 경우 더욱 그렇다.

‘나쁜’ 주제 분석은 이론에 – 그리고 또한 자체 데이터에 – 불충분하게 고정된(anchored) 것이다.

  • 최종 결과는 꽤 응집되지 않거나, 연구의 방법론적 진실성(methodological integrity)이 훼손된 분석이다. 여기서 연구자들은 주제 분석을 수행하는 대조적인 방법들을 인식하지 못하는 것처럼 보이며 자신의 방법론적 위치에 전념하지 않았다.
  • 이러한 더 약한 연구들에서, 주제 분석은 너무 많은 파편화되거나 불충분하게 처리된 주제들의 존재로 인해 손상될 수도 있다.
  • 더 약한 분석은 또한 불충분하게 입증된 것들이다 (예를 들어, 참가자들로부터의 입증 인용문이 불충분한 경우).

내 관점에서, ‘추한(ugly)’ 주제 분석은 따라가기 힘들거나 지루하고 생기가 없는 것들이다.

  • 여기에는 연구자가 주제의 공예(crafting), 제시, 글쓰기에 거의 주의를 기울이지 않아 문학적 울림이 결여된 논문들이 포함된다. 그로 인해 연구 결과의 전반적인 영향력이 손상된다.

다음에 주제 분석에 착수하기 위해 자리에 앉을 때, 당신의 연구 목표와 방법론적 전념을 고려하여 무엇이 요구되는지에 대해 가능한 한 명확히 하라. 다음 질문들은 엄격하고 풍부한 결과를 보장하는 데 도움이 될 수 있다:

  1. 나의 포괄적인 방법론(overarching methodology)을 고려할 때 어떤 종류의 주제 분석 방법이 요구되는가? 나의 분석이 그 역할을 수행하는가? (다른 버전들을 구별하려면 Braun & Clarke, 2021을 참조)
  2. 나의 주제 분석이 연구와 데이터의 중심 아이디어를 중심으로 응집하며 서로 잘 어우러지는가? 
  3. 나의 주제 분석이 엄격하고 성찰적으로 관여되었으며, 체계적으로 입증되었는가? 
  4. 나의 주제들(제목과 기술)이 (뻔하거나, 관련 없거나, 밋밋한 것과 대조적으로) 유익하고, 적절하며, 풍부한가? 
  5. 주제 기술들이 충분히 울림 있고, 기억에 남고, 흥미롭고, 그리고/또는 환기적이도록 작성되었는가? (Braun and Clarke, 2019a, b)

나는 (나의 특별한 방법론적 선호를 좇아) 약간의 예술적 장식(artistic flourish)으로 이 글을 마치고 싶다. 아래는 한 연구자가 자신의 질적 분석에 관여하는 과정에 대해 쓴 생각들이다. 나에게 있어, 그녀가 하는 말은 질적 연구자로서 우리 과업의 정신, 섬세함, 그리고 지속적인 도전을 포착한다. 우리는 주제 분석이 단순히 참가자의 말을 범주로 반복하고 요약하는 것을 넘어, 그 이상의 무언가를 포착하려는 시도임을 상기하게 된다. 나는 그녀의 말에 감동을 느낀다 – 그리고 아마 당신도 그럴 것이다:

그래서 나는 내 앞에 쌓인 더미들을 바라본다... 그리고 나의 의지를, 이야기되기를 기다리는 데이터 이야기의 의지에 항복시킨다. 나는 데이터에 귀 기울이는 능력을, 단어와 단어 주변의 공간(space around the words)을 듣는 능력을 높이기를 희망하며 내 목소리를 잠재우고 눈을 감는다. 눈 덮인 들판처럼 고요하게, 독특하고 유일무이한, 경험의 결정체 같은 표현들이 내 혀에 내려앉는 동안... 그리고 나는 그 한가운데서 내가 아주 가만히 있어야 함을 발견한다. 그래야 그것들이 녹는 것을 목격하고, 맛보고, 수령인이 할 수 있는 최선으로 그것들을 알 수 있기 때문이다... 나는 내 손바닥 아래서 우르릉거리는 그 이야기를 느낀다. 말하는 이에게서 듣는 이에게로 전달되는 떨리는 생명의 숨결, 본질(essence), 생명 그 자체의 물질을 만지는 것—질문, 투쟁, 견해, 경험, 해결에 대한 갈망, 하나의 인간적인 이야기. (Rockwell, 2013, pp. 90-91).

 

 

 

 

Conceptual and design thinking for thematic analysis. 

Braun, V., & Clarke, V. (2022). Conceptual and design thinking for thematic analysis. Qualitative Psychology, 9(1), 3–26. https://doi.org/10.1037/qup0000196

 

 

 

 

안녕하세요, 연구자 여러분! 👋 질적 연구를 하시는 분들이라면 주제 분석(Thematic Analysis, TA)이라는 용어, 정말 많이 들어보셨을 거예요. 특히 Braun & Clarke(2006) 논문은 TA의 바이블처럼 여겨지죠. 그런데 최근(2021/2022) 이 두 분이 TA를 연구 디자인 단계에서부터 어떻게 '제대로' 설계하고 생각해야 하는지에 대해 아주 중요한 논문을 발표했습니다.

오늘은 <Conceptual and Design Thinking for Thematic Analysis> 논문을 통해, 우리가 TA에 대해 흔히 하는 오해와 성찰적 TA(Reflexive TA)를 잘 수행하기 위한 꿀팁을 정리해 드릴게요! 🧐


1. TA는 '방법론'이 아니라 '방법'입니다 🛠️

많은 분들이 TA를 근거 이론(Grounded Theory)이나 현상학처럼 하나의 거창한 방법론으로 생각하곤 합니다. 하지만 저자들은 TA가 이론에 얽매이지 않는 유연한 도구라고 강조해요.

"TA는 방법론(이론적으로 정보를 갖춘 연구 프레임워크)이라기보다는 방법(이론을 초월한 도구 또는 기법)에 더 가깝습니다." "TA is more akin to a method (a transtheoretical tool or technique) than a methodology (a theoretically informed framework for research)."

 

즉, TA는 유연한 도구이기 때문에 연구자가 어떤 철학적 입장을 취하느냐에 따라 연구 설계가 완전히 달라져야 한다는 뜻이죠. 그래서 연구 시작 전에 "나는 어떤 입장에서 이 도구를 쓸 것인가?"를 깊게 고민하는 개념적 사고(Conceptual Thinking)가 필수입니다!

2. TA의 세 가지 유파: 당신은 어디에 속하나요? 🤔

저자들은 TA를 크게 세 가지 학교(School)로 나눕니다.

  1. 코딩 신뢰도 TA (Coding Reliability TA):
    • '정확성'과 '신뢰도' 중시.
    • 여러 명의 코더가 일치하는지 확인(Intercoder agreement).
    • 약간 양적 연구 느낌이 나는 (후기)실증주의((post)positivist) 기반입니다. (Small q)
  2. 코드북 TA (Codebook TA):
    • 미리 정해진 틀(Codebook)을 사용.
    • 실용적인 응용 연구에서 많이 쓰입니다.
  3. 성찰적 TA (Reflexive TA):(이 논문의 핵심!)
    • 연구자의 주관성을 적극 활용.
    • 유연하고 유기적인 코딩.
    • 질적 연구 고유의 가치를 중시합니다. (Big Q)

많은 연구자가 이 차이를 모르고 섞어서 쓰는 '실수'를 한다고 해요. Braun & Clarke가 지향하는 것은 바로 세 번째, 성찰적 TA입니다.

3. 성찰적 TA의 핵심: 주관성은 '편향'이 아닙니다! 💡

성찰적 TA에서 가장 중요한 마인드셋은 바로 연구자의 주관성(Subjectivity)을 바라보는 태도입니다.

"연구자의 주관성은 성찰적 TA를 위한 일차적인 '도구'입니다; 주관성은 관리되거나 통제되어야 할 문제가 아니라, 연구를 위한 자원입니다." "Researcher subjectivity is the primary 'tool' for reflexive TA; subjectivity is not a problem to be managed or controlled, it is a resource for research."

 

따라서 "연구자 편향(Researcher bias)"을 없애려고 노력할 필요가 없습니다. 오히려 나의 경험과 관점이 데이터 해석을 더 풍부하게 만드는 자원이 되니까요.

또한, 주제(Theme)에 대한 생각도 바꿔야 합니다. 주제는 데이터 속에 숨겨져 있어서 우리가 찾아내야 하는 보물찾기가 아닙니다.

"주제는 연구자가 그것들을 '발견'할 때 '나타나기' 위해 데이터 속에서 기다리고 있는 것이 아닙니다; 주제는... 연구자에 의해 생산되는 것으로 개념화됩니다." "Themes are not waiting in the data to 'emerge' when the researcher 'discovers' them; they are conceptualized as produced by the researcher."

 

주제는 발견(Discovery)이 아니라 생산(Production)과 구성(Construction)의 결과물이라는 점, 꼭 기억하세요! ✍️

4. 연구 설계: '포화'라는 말, 조심해서 쓰세요 🚫

연구 참여자를 몇 명이나 모아야 할까요? 많은 연구자가 "더 이상 새로운 내용이 안 나올 때까지(Saturation)"라고 답합니다. 하지만 저자들은 성찰적 TA에서 데이터 포화(Data Saturation) 개념을 비판합니다.

"이것은 성찰적 TA와 개념적으로 일관되지 않습니다... 그것은 사실상 연구자의 과업을 발견으로—발견되기를 기다리고 있는 주제를 인식하는 것으로—위치시키기 때문입니다." "It is not conceptually coherent with reflexive TA... because it effectively positions the researcher’s task as discovery—as recognizing themes that are waiting to be discovered."

 

대신 정보력(Information Power)이라는 개념을 제안합니다. 참여자 수가 중요한 게 아니라, 데이터가 얼마나 풍부하고 내 연구 질문을 답하기에 충분한 정보(Information Richness)를 담고 있느냐가 핵심이라는 것이죠.

5. 보고서 작성 팁: '방법' 말고 '방법론'이라고 쓰세요 📝

마지막으로 논문을 쓸 때의 팁입니다. 단순히 절차만 나열하는 'Method' 섹션보다는, 나의 이론적 배경과 성찰적 고민이 담긴 'Methodology'라는 제목을 쓸 것을 권장합니다. 그리고 결과 섹션 제목도 'Results(결과)'보다는 'Analysis(분석)'가 좋습니다. 결과는 왠지 고정된 정답 같은 느낌을 주지만, 분석은 연구자의 해석 과정을 보여주니까요.

"우리는 결과/발견 섹션에 대해 분석이라는 제목을 선호합니다. 왜냐하면 그것이 발견과 종결성을 모두 환기시키는 것을 피하기 때문입니다." "Our current preferred heading for the results/findings section is analysis because it avoids evoking both discovery and finality."


요약하자면! 📌

성찰적 TA를 잘하려면 다음 세 가지를 기억하세요.

  1. 개념적 일관성(Conceptual Coherence): 내 연구의 철학적 배경과 분석 방법이 잘 맞는지 확인하기.
  2. 성찰성(Reflexivity): 나의 주관성을 숨기지 말고 분석의 도구로 적극 활용하고 드러내기.
  3. 적절한 설계: 기계적인 '포화'나 '신뢰도' 측정 대신, 데이터의 깊이와 정보력에 집중하기.

질적 연구는 정답을 찾는 과학이라기보다, 의미를 만들어가는 예술(Art)에 가깝습니다. Braun & Clarke의 조언대로 여러분만의 깊이 있는 통찰을 보여주는 멋진 연구 하시길 바랍니다! 💪


 

 

주제 분석(Thematic Analysis, TA)은 질적 심리학(qualitative psychology)에서 널리 실행되고 있습니다. TA가 근거 이론(grounded theory)이나 내러티브 분석(narrative analysis)과 같은 대부분의 다른 질적 분석 접근법과 구별되는 점은, 이것이 방법론(methodology, 연구를 위한 이론적 기반을 갖춘 프레임워크)이라기보다는 방법(method, 이론을 초월한 도구 또는 기법)에 더 가깝다는 것입니다. 근거 이론이나 내러티브 분석과 같은 접근법들은 분석적 기법뿐만 아니라 철학적 가정(philosophical assumptions), 이론적 프레임워크(theoretical framework)를 모두 포괄하며, 특정 유형의 연구 질문, 참여자/데이터 항목 선정 관행, 데이터 수집 방법 및 품질 절차로 나아간다는 점에서 "기성품(off-the-shelf)" 방법론이라고 불려왔습니다(Chamberlain, 2012). 이로 인해 일부 질적 방법론 학자들은 TA를 사용하는 것이 기성품 방법론을 사용하는 것에 비해 연구자들에게 더 많은 개념적 및 설계적 사고(conceptual and design thinking)를 요구한다고 주장하게 되었습니다(McLeod, 2015; Willig, 2013). Willig(2013)에게 있어 TA는 종종 인식되는 것처럼 "쉬운 선택(easy option)"(p. 66)이 아닌데, 그 이유는 연구자가 "연구 자체에 착수하기 전에 많은 개념적 작업(conceptual work)을 수행해야 하기"(p. 65) 때문입니다. McLeod(2015)는 TA를 "자신이 무엇을 달성하려고 하는지 알고 있다는 확신이 있는 연구자들에게 좋은 선택"(p. 147)이라고 설명했습니다.

 

방법(method)으로서의 TA의 지위는 때때로, 특히 질적 연구 초심자들에게 있어 좋은 관행(practice)에 대한 장애물로 구성되기도 합니다. 일부는 TA가 접근하기 쉬운 방법이라는 평판과 내재된 이론(inbuilt theory)의 부재가 결합하여, 연구자들이 이론적으로 명시적인 위치를 설정하지 않고 TA를 수행하는 실수를 저지르게 만들 수 있다고 주장했습니다(King & Brooks, 2017; Willig, 2013). Brown과 Locke(2017)는 TA가 응용 심리학 연구에서 인기 있는 이유는 연구자들이 "어떠한 방법론적 공포(methodological horrors)도 고려하지 않고 주제 내용(topic content)에 대해 질적 데이터를 분석"할 수 있다고 인식되기 때문이라고 시사했습니다(p. 425). 그러한 인식은 명시적인 개념적 기반(conceptual underpinning)이 없는 주제(themes)들을 보고하는 결과로 이어질 수 있습니다. 이는 잘못된 관행이며, Qualitative Psychology 저널의 투고 지침에서도 경험적 연구가 "(단순한 기술이나 주제의 보고와 대조되는) 적절한 개념화(adequate conceptualization)가 있는지"에 따라 평가될 것임을 명시적으로 언급하고 있습니다(American Psychological Association, 2020). 방법(method)으로서의 TA에 대한 우리의 관점은 더욱 낙관적입니다. TA의 사용은 연구자들의 숙고를 요구하므로, 사려 깊고 성찰적인 연구 관행(reflective research practice)—많은 품질 기준 및 지침에서 결정적으로 중요하다고 강조되는 관행(예: Elliott et al., 1999; Levitt et al., 2017; Yardley, 2015)—의 중요성이 강조됩니다. 우리는 이러한 입장에서 혼자가 아닙니다. 다른 학자들도 "생각 없는(thought-less)" 질적 연구를 허용한다는 이유로 기성품 방법론들의 "미리 결정된(predetermined)" 본질을 비판해 왔습니다(예: Chamberlain, 2012). 최상의 경우, TA는 진실성(integrity)으로 특징지어지는 성공적인 질적 분석을 위해 함께 모여야 할 다양한 요소들을 가시화할 뿐만 아니라, 그것들이 어떻게 연결되고 서로를 기반으로 구축되는지 고려하도록 돕습니다. TA는 질적 접근법으로서 초기에 가르쳐지거나 학습될 수 있기 때문에<sup>1</sup>,  우리는 새로운 연구자들이 모든 (좋은) 연구 관행 뒤에 있는 개념적 사고(conceptual thinking)의 수많은 층위를 인식하고 (깊이 있게) 생각하도록 만들 중요한 기회—또는 의무—를 가지고 있습니다.

1 어떤 이들은 TA가 질적 연구의 "메커니즘(mechanics)"—개념적 및 설계적 사고—을 새로운 연구자들에게 가시화시켜 준다는 바로 그 이유 때문에 초기에 가르쳐져야 한다고 주장합니다. 이 점을 제기해 준 익명의 검토자에게 감사드립니다.

 

우리는 TA의 유연성을 가치 있게 여기지만, TA 연구를 개념화(conceptualizing)하고 설계(designing)하는 것이 특히 질적 연구 초심자들에게는 벅찰 수 있다는 점을 이해합니다. 왜냐하면 질적 방법론 문헌(qualitative methodological literature)은 방대하고 복잡하며, 수많은 모순되고 논쟁적인 설명들을 제공하기 때문입니다. 이 논문에서 우리는 TA, 특히 우리가 발전시킨 성찰적 접근(reflexive approach)(예: Braun & Clarke, 2006, 2012, 2019a)에 대한 개념적 및 설계적 사고에 관한 지침을 제공함으로써 그러한 연구자들을 지원하는 것을 목표로 합니다. 이를 위해 우리는 심리학 및 관련 학문의 TA 및 더 넓은 질적 방법론 문헌을 활용합니다.

 

개념적 및 설계적 사고(Conceptual and design thinking)연구 프로젝트의 모든 요소를 포함하며, 서로 다른 요소들이 함께 잘 작동할지를 평가하고, 내려진 선택에 대한 설명을 생산하는 것을 포함합니다(개요는 Box 1 참조). 질적 연구 설계의 일반적인 원칙은 일관성(coherence) 또는 "적합성(fit)"(Braun & Clarke, 2013; Willig, 2013)이며, 여기서 연구의 목표와 목적, 철학적(philosophical), 이론적(theoretical), 그리고 방법론적 가정(methodological assumptions), 그리고 방법(methods)이 서로 조화를 이룹니다(Chamberlain et al., 2011; Tracy, 2010). Levitt 등(2017)은 다음과 같은 경우를 포착하기 위해 방법론적 무결성(methodological integrity)이라는 유사한 개념을 제안했습니다.

연구 설계와 절차(예: 자전적 문화기술지[autoethnography], 담론 분석[discursive analysis])가 연구 목표(즉, 연구 문제/질문)를 뒷받침하고; 연구자의 탐구 접근법(즉, 세계관, 패러다임 또는 철학적/인식론적 가정[philosophical/epistemological assumptions]으로 묘사되는 연구 전통)을 존중하며; 주제와 연구자의 근본적인 특성에 맞춰 조정되어야 한다. (pp. 9–10)

 

경계가 정해진 방법론(delimited methodology)이 아닌, 유연한 방법(flexible method)으로서의 TA의 지위는 질적 연구 초심자들이 방법론적 무결성(methodological integrity)을 달성하는 데 있어 하나의 도전 과제를 제공합니다. TA 내부의 다양성(multiplicity)은 또 다른 도전 과제를 제공합니다. TA는 공통된 몇 가지 요소를 가진—동시에 철학적 가정(philosophical assumptions), 핵심 구성 개념(constructs)의 개념화, 그리고 분석 절차에 있어 상당한 차이점들을 가진—방법들의 가족(family of methods)으로 생각하는 것이 가장 좋습니다. 그러나 이러한 다양성은 종종 제대로 이해되지 않고 있으며, 드물게만 인정되고 있고, 출판된 연구들에서 개념적으로 일관성 없는 관행(conceptually incoherent practices)들이 겉보기에 "생각 없이" 뒤죽박죽 섞여 있는 상당한 증거들이 있습니다(Braun & Clarke, 2020).

 

이 논문은 두 섹션으로 나뉩니다.

 

  • 첫 번째 섹션은 TA를 위한 개념적 사고(conceptual thinking)에 초점을 맞춥니다.
    • 성찰적 TA(reflexive TA)의 개념적 기반을 이해하고, 이것이 다른 유형의 TA와 관련된 기반들과 어떻게 다른지 이해하는 것은 방법론적 무결성을 위해 결정적으로 중요합니다. 우리의 논의는 TA의 세 가지 주요 "학파(schools)"에 대한 유형론(typology)을 중심으로 하며, 특히 우리의 성찰적 접근에 초점을 맞춥니다. 이 유형론은 방법들의 가족으로서 TA 내에 존재하는 주요 분기점 중 일부를 포착합니다. 이 섹션은 연구자들이 자신의 TA 접근법에 대해 숙고된 결정(deliberative decisions)을 내리고, 그 접근법을 알면서(knowingly) 사용하며, 내재된 연구 가치를 "소유(owning)"하도록(Elliott et al., 1999) 돕는 것을 목표로 합니다.
  • 두 번째 섹션은 성찰적 TA에서의 설계적 사고(design thinking)를 중심으로 합니다.
    • 이는 연구 질문, 데이터 수집 방법 및 출처, 참여자 그룹/데이터 세트 구성(participant group/data set constitution) 및 크기, 윤리, 그리고 품질 기준 및 관행의 문제들을 다룹니다. 이 섹션은 연구자들이 방법론적 무결성을 갖춘 성찰적 TA 연구를 설계하도록 도울 것입니다. 우리는 성찰적 TA 연구를 위한 보고 기준(reporting standards)에 대한 논의로 끝을 맺습니다.

 

TA 연구를 위한 개념적 사고 (Conceptual Thinking for TA Research) 

하나의 가족(family)으로서 TA 방법들은 다음과 같은 특징들을 공유합니다:

 

  • 이론적 유연성(theoretical flexibility) (비록 의미 있는 지식 생산 및 질적 연구의 개념화 방식에 대한 가정들에 의해 어느 정도 제약을 받기는 하지만);
  • 코딩(coding) 및 주제 개발(theme development)의 절차;
  • 분석에 대한 귀납적(inductive)연역적(deductive) 지향의 가능성 (비록 이러한 지향들이 어떻게 개념화되는지에 대해서는 뚜렷한 차이가 있을 수 있지만); 그리고
  • 명시적(manifest) (의미적[semantic] 또는 기술적[descriptive]) 의미—데이터의 표면에서 직접 관찰할 수 있는 의미—와 잠재적(latent) (암묵적[implicit] 또는 개념적[conceptual]) 의미—데이터 표면 아래에 있는 의미—모두를 코딩할 가능성 (Boyatzis, 1998; Braun & Clarke, 2006; Joffe, 2012).
  • 동시에, 다양한 TA 접근법 사이에는 몇 가지 주목할 만한 차이점이 존재하며, 이는 경우에 따라 뚜렷하게 다른 개념화와 가치들에 의해 뒷받침됩니다.

 

질적 연구자에게 있어 도전 과제이자, 개념적으로 일관된 TA 연구 설계의 출발점은 자신이 선택한 TA 접근법의 세부 사항을 이해하고, 우리가 구상하는 TA 스펙트럼(TA spectrum) 상에서 그 접근법이 어디에 위치하는지를 파악하는 것입니다. 이것이 도전적인 이유는 구체적인 절차들이 일련의 기저에 깔린 연구 가치(research values)에 의존하고 그것을 암호화(encode)하고 있지만, 이러한 가치들이 항상 명시적으로 진술되지는 않기 때문입니다(Carter & Little, 2007 참조). 실제로, 일부 맥락, 특히 양적 실증주의(quantitative positivism)가 지배적인 맥락에서는, 연구 가치 자체가 단일하고 보편적인 것으로 가르쳐지거나 아예 당연한 것으로 가정되기도 합니다. 우리는 연구 가치에 대한 명료성양질의 (TA) 연구에 있어 근본적인 것으로 봅니다. 이는 연구 가치와 그에 연관된 존재론적(ontological) (실재와 존재에 대한 이론) 및 인식론적(epistemological) (의미 있는 지식과 지식 생산에 대한 이론) 가정들의 다양성 때문에 질적 연구에서 특히 중요합니다. TA가 하나의 방법이 아니라, 서로 다른 개념적 모델과 연구 가치들에 의해 뒷받침되는 방법들의 군집(cluster of methods)임을 이해하는 것은, 품질 기준 및 원칙들에서 강조되는 자신의 (이론적 및 방법론적) 관점을 "소유하는(owning)" 관행(Elliott et al., 1999)과 (이론적) 맥락에 대한 민감성을 입증하는 것(Yardley, 2015)을 촉진합니다.

주제 분석의 유형론: 코딩 신뢰도, 코드북, 그리고 성찰적 TA (A Typology of Thematic Analysis: Coding Reliability, Codebook, and Reflexive) 

우리는 TA의 세 가지 주요 학파를 구분하며, 이를 코딩 신뢰도(coding reliability), 코드북(codebook), 그리고 성찰적(reflexive) TA라고 부릅니다.<sup>2</sup> 우리는 이 유형들 간의 차이를 이해하는 데 있어 Kidder와 Fine(1987)의 "소문자 q(small q)""대문자 Q(Big Q)" 질적 연구의 구분이 유용하다고 생각합니다.

 

  • Small q는 질적 데이터를 다루지만 양적/(후기)실증주의적(quantitative/(post)positivist)<sup>3</sup> 연구 가치와 관행에 의해 정보를 얻습니다.
  • 반면 Big Q는 질적 데이터뿐만 아니라 질적 패러다임(qualitative paradigm)에 내재된 가치와 관행을 모두 포함합니다.
  • 코딩 신뢰도 TA는 small q 질적 연구를 전형적으로 보여주며, 성찰적 TA는 Big Q를, 그리고 코드북 TA는 small q와 Big Q 사이 어딘가에 위치합니다.
  • 이러한 유형들은 TA 스펙트럼 상에 위치하는 것으로 개념화될 수 있는데, 코딩 신뢰도 접근법은 스펙트럼의 small q/(후기)실증주의적 끝에, 성찰적 접근법은 다른 쪽 끝인 Big Q/비실증주의적(nonpositivist), 구성주의적(constructionist) 끝에 위치합니다(Terry & Hayfield, 2020 참조).<sup>4</sup>

 

이것이 TA의 "지형"에 대한 우리의 위치적 매핑(positioned mapping)이라는 점을 주목하는 것이 중요합니다. 우리는 해당 접근법들을 개발한 저자들이 반드시 인지할 방식으로 설명하는 것은 아니며, 명시되지 않은 가정들을 풀고 코드(codes)나 주제(themes)와 같은 핵심 개념이 이해되는 방식에서의 차이점을 끌어내려고 노력했습니다.

 

<sup>2</sup> 이 이름들은 각 유형의 코딩의 핵심 특징을 반영하며, 따라서 접근법들 간의 차이점 중 한 가지 요소만을 포착할 뿐이며, 실제 TA를 수행하는 관행의 한 요소만을 포착합니다.

<sup>3</sup> 우리는 심리학 내에서 실증주의의 쟁점이 되는 영역을 알리기 위해 (후기)실증주의((post)positivist)라는 용어를 사용합니다. 일부는 주로 실증주의와 후기 실증주의를 양적 연구와 연관 지으며, Popper(1959)와 다른 학자들(예: Ponterotto, 2005)의 비판에 따라 양적 연구의 기본 패러다임이 이제는 (순진한[naïve]) 실증주의가 아니라 후기 실증주의라고 주장합니다. 다른 이들은 후기 실증주의가 양적 연구와 질적 연구 모두에 걸쳐 있다고 보며, 이를 비판적 실재론(critical realist) 존재론 및 합의적 질적 연구(consensual qualitative research, CQR)나 객관주의적 근거 이론(objectivist grounded theory)과 같은 질적 방법론들과 연관 짓습니다(예: Morrow, 2007). 우리의 (후기)실증주의 사용은 패러다임적 가치와 연결된 small q((후기)실증주의적)와 Big Q 질적 연구(Kidder & Fine, 1987) 사이의 구분을 반영합니다. 우리는 코딩 신뢰도 TA뿐만 아니라 CQR과 객관주의적 근거 이론을 small q 질적 연구의 예로 봅니다.

<sup>4</sup> 이 유형론은 TA 가족(family) 내의 다양성 중 많은 부분을 포착하지만, 쉬운 분류를 거부하고 서로 다른 유형들의 요소를 결합하는 다른 (종종 특이한[idiosyncratic]) 접근법들도 존재합니다(예: Buetow, 2010; Malterud, 2012); 게다가 질적 데이터로부터 주제를 개발하기 위해 근거 이론의 코딩 기법과 다른 분석 관행(지속적 비교 분석[constant comparative analysis] 및 메모 작성[memo writing] 등)을 사용하는 것은—주제 코딩(thematic coding)(예: Flick, 2014; Gibbs, 2007)이라고 알려진 별도의 TA 접근법으로 구획되기도 하고 더 특이하게 사용되기도 하는데—여전히 비교적 흔합니다.

코딩 신뢰도 주제 분석 (Coding Reliability Thematic Analysis) 

코딩 신뢰도(coding reliability) 접근법은 분석 절차가 (후기)실증주의적 패러다임이나 연구 가치에 의해 뒷받침되어, 데이터 코딩의 "정확성(accuracy)" 또는 "신뢰도(reliability)"를 확립하는 데 지향점을 두고 있기 때문에 그렇게 명명되었습니다(Ponterotto, 2005 참조). 그 결과, 연구자의 주관성이나 "편향(bias)"을 통제하고, 측정의 신뢰도와 반복 가능성(replicability)을 확보하며, 가능한 한 객관적인(as-objective-as-possible) 지식을 생성하는 데 관심이 있습니다. 일부 코딩 신뢰도 저자들은 자신들의 접근법을 질적 기법 및 데이터 사용과 의미 있는 지식 생산에 관한 (후기)실증주의적 가치를 결합함으로써, 실증주의적(양적) 패러다임과 해석적(interpretive)(질적) 패러다임 사이의 "격차를 잇는(bridging the divide)" 것으로 프레임화합니다(예: Boyatzis, 1998; Guest et al., 2012). 이 small q 형태의 TA를 설명하면서, 우리는 코딩과 주제의 개념화, 연구자 주관성, 의미 있는 지식 생산, 그리고 품질 기준 및 관행에 초점을 맞춥니다.

 

코딩 신뢰도 TA는 전형적으로 다음 중 일부 또는 전부를 포함합니다.

 

  • 주제(themes)는 어느 정도의 데이터 친숙화(familiarization) 이전이나 이후에, 분석 과정의 초기에 개발되며, 종종 데이터 수집 질문들을 반영합니다.
  • 주제는 코딩 과정의 산출물(outputs)이라기보다는 사실상 투입물(inputs)로 간주됩니다. 주제는 (암묵적으로) "바위 속에 숨겨진 화석(fossil)"(King & Brooks, 2017, p. 220) 또는 연구자에 의한 "발견(discovery)"을 기다리며 데이터 속에 숨어 있는 "모래 속에 흩어진 다이아몬드(diamonds)"(Braun & Clarke, 2016, p. 740)로 개념화됩니다.
  • 또한 주제는 의미 기반(meaning-based)이라기보다는 토픽(topic)으로 이해되는 경향이 있으며(다시 말해 암묵적으로), 특정 토픽과 관련하여 참여자들이 말한 것들의 요약이나 개요인 토픽 요약(topic summaries)으로 이해됩니다. 토픽들은 종종 데이터 수집 질문들과 밀접하게 매핑됩니다. 이는 토픽 요약인 "주제"가 사실상 데이터 수집 질문에 대한 응답들의 요약임을 의미합니다.
  • 예를 들어, 인터뷰 질문이 아프리카계 여성들이 산후 우울증에 대한 전문적 지원에 접근하는 데 있어서의 장벽에 초점을 맞출 수 있으며, 이 질문의 토픽—지원 접근에 대한 장벽—이 "주제"의 초점이 됩니다. 이 "주제"는 사실상 참여자들이 논의한 모든 주요 장벽들의 요약입니다. 보고된 관찰들을 하나로 묶는 것은 응답들 전반에 걸쳐 명백한 공유된 의미(shared meaning)의 패턴이라기보다는 토픽(topic)—그 장벽들—입니다.
  • 이러한 주제 개념화는 주제에 대해 어떻게 이야기되었는지를 상세히 분석하지 않고도 토픽을 식별하는 것이 비교적 간단하기 때문에, 초기 주제 개발/식별(즉, 실질적인 분석이 이루어지기 전)을 용이하게 합니다. 종종 토픽 외에는 토픽 요약 내의 의미들을 하나로 묶는 것이 거의 없습니다. 그러한 "주제들"은 약간의 데이터 친숙화 이후 귀납적(inductively)으로 개발될 수도 있고, 선행 연구나 이론으로부터 연역적(deductively)으로 개발될 수도 있습니다.

 

코딩 신뢰도 TA에 대한 귀납적 및 연역적 지향 모두에서, 미리 결정된 주제들에 데이터를 할당하는 것을 안내하기 위해 코드북(codebook) 또는 코딩 프레임(coding frame)이 구성됩니다.<sup>5</sup>

 

  • 코드북은 일반적으로 코드/주제의 확정적인 목록, 각 코드/주제에 대한 코딩 라벨과 정의, 제외 사항을 포함하여 각 코드/주제를 식별하는 방법에 대한 지침, 그리고 각 코드/주제의 예시들로 구성됩니다. 우리가 "코드/주제"라고 사용하는 이유는 코딩 신뢰도 접근법에서는 코드와 주제 사이에 항상 명확한 구분이 있는 것은 아니기 때문입니다. 과정으로서의 코딩은 종종 "주제"와 구별되지만 그에 기여하는 분석적 실체인 "코드(code)"보다 더 전면에 내세워집니다.
  • 코드북은 데이터의 전부 또는 일부에 적용되며, 이상적으로는 독립적으로 작업하는 다수의 코더(multiple coders)에 의해 수행됩니다. 그런 다음 코딩 신뢰도(coding reliability)의 척도를 제공하기 위해 코더 간 일치도(intercoder agreement) 수준이 계산됩니다(O’Connor & Joffe, 2020). 여기에는 "신뢰할 수 있는" 코딩이 가능하며, 두 명 이상의 연구자가 동일한 데이터 조각을 동일한 코드/주제에 할당하는 것이 이에 대한 의미 있는 척도라는 가정이 깔려 있습니다.
  • 일부 코딩 신뢰도 연구자들은 이러한 지식으로 인한 코딩 과정의 "오염(contamination)"을 최소화하고 객관성(objectivity)을 극대화하기 위해, 연구 질문에 대해 "맹검(blind)" 상태이거나 연구 분야에 대한 사전 지식이 없는 코더를 사용할 것을 옹호합니다(예: Bond et al., 2008).
  • 최종 데이터 코딩은 일반적으로 합의의견 일치에 의해 결정됩니다. 질적 가치가 여전히 주변적인 심리학과 같은 학문의 질적 연구자들이 겪는 어려움 중 하나는, 코딩 신뢰도 TA에서 우선시되는 (후기)실증주의적 품질 기준들이 성찰적 TA를 포함한 모든 형태의 TA에서의 품질 관행과 종종 동일시된다는 점입니다(Braun & Clarke, 2020). 대신, 그것들은 이론적으로 내재된 특정 연구 가치(research values) 세트를 반영합니다.
<sup>5</sup> 코딩 신뢰도 TA 내에서의 연역적 접근은 종종 가설을 검증(testing)—반박하거나 확인—하기 위한 도구를 제공하는 것으로 개념화됩니다. 이 모델은 과학적 방법(scientific method)의 연역적 지향 및 가정과 일치합니다; 이것은 다른 많은 버전의 TA 및 실제로 Big Q 접근을 취하는 질적 접근법들에서의 연역 사용과는 상충됩니다. 

 

코드북 주제 분석 (Codebook Thematic Analysis) 

코드북(codebook) 접근법들은 TA 스펙트럼에서 코딩 신뢰도성찰적 접근법 사이 어딘가에 위치합니다.

  • 이러한 접근법들은 코드북이나 코딩 프레임의 사용을 통한 보다 구조화된 코딩 접근법, (일부) 초기 주제 개발, 주제를 토픽 요약(topic summaries)으로 보는 (전형적인) 개념화—이 모두는 small q 코딩 신뢰도 접근법과 관련된 것들입니다—를 성찰적 TABig Q 가치들(예: 연구자의 주관성(subjectivity)을 연구를 위한 자원(resource)으로 개념화하고, 데이터의 코딩과 해석을 본질적이고 피할 수 없는 주관적 관행으로 보는 것, 이에 대해서는 아래에서 더 논의함)과 결합합니다.
  • 우리의 코드북이라는 라벨은 매트릭스(matrix)(예: Miles & Huberman, 1994; Nadin & Cassell, 2004), 프레임워크(framework)(예: Ritchie & Spencer, 1994), 네트워크(network)(예: Attride-Stirling, 2001), 그리고 템플릿(template)(예: King, 2012) 분석과 같은 접근법들을 포괄하며, 이들은 종종 응용 연구를 위해 개발되었고 그 안에서 인기가 있습니다.
  • 코드북 TA에서 코드북은 일반적으로 코더 간 일치도 측정을 용이하게 하기 위해 사용되는 것이 아니라,
    • 미리 정해진 정보 요구 충족(일부 응용 연구 분야에서 일반적임),
    • 데이터의 서로 다른 부분을 코딩하는 데이터 분석가 팀의 협업(연구 훈련을 받지 않은 질적 초보자나 사용자/이해관계자가 팀에 포함될 가능성이 있음), 그리고/또는
    • 신속하고 "효율적인" 분석(자금 제공자/서비스의 촉박한 마감 기한 때문에)과 같은 실용적 고려사항(pragmatic considerations)을 지향합니다.
  • 코드북은 데이터 코딩을 안내할 뿐만 아니라 발전 중인 분석을 기록하거나 도표화(chart)하는 데 사용됩니다.
  • 일부 코드북 저자들은 코드북 접근법이 일부 질적 연구 가치들의 실용적 타협(pragmatic compromise)을 반영한다고 주장합니다. 질적 연구의 개방적이고, 탐색적이며, (때로는) 귀납적인 요소들은 위에서 상세히 설명한 것과 같은 실질적인 제약 조건들이 존재할 때 도전 과제가 됩니다(Smith & Firth, 2011).

성찰적 주제 분석 (Reflexive Thematic Analysis) 

성찰적 접근법은 Big Q 질적 패러다임(qualitative paradigms)의 가치를 우선시하며, 데이터 코딩과 분석의 불가피한 주관성(inevitable subjectivity), 그리고 코딩과 주제 생성(theme generation)에 있어서 연구자의 능동적인 역할(active role)을 강조합니다(예: Gleeson, 2011; Hayes, 2000). 이 논문에서 우리의 주된 초점은 성찰적 TA를 위한 개념적 및 설계적 사고에 있으므로, 다음 섹션에서 우리의 성찰적 접근법의 핵심적인 개념적 토대(conceptual foundations)를 다소 상세하게 개괄합니다.<sup>6</sup>

<sup>6</sup> 우리는 성찰적 TA의 분석 과정 6단계—데이터 친숙화, 데이터 코딩, 코드와 코딩된 데이터로부터 초기 주제 생성, 주제 검토 및 개발, 주제 정의·명명 및 정교화, 보고서 작성—를 개괄하지 않습니다. 왜냐하면 이것들은 더 실천 지향적이기 때문입니다. 이 내용들은 다른 곳에서 광범위하게 논의되었습니다(예: Braun & Clarke, 2006, 2012 참조). 

성찰적 주제 분석의 개념화 (Conceptualizing Reflexive Thematic Analysis) 

우리의 Big Q 성찰적 TA 접근법은 (후기)실증주의적((post)positivist) TA의 기저에 깔린 가치들에 대한 비판과 거부로부터 발전했습니다(Braun & Clarke, 2019a). TA와 더 넓은 의미에서의 질적 연구(예: Morrow, 2007)는 종종 주관성(subjectivity)과 체험된 경험(lived experience)에 대한 연구(예: Flick, 2014), 그리고 현상학(phenomenology)(예: Guest et al., 2012; Joffe, 2012)과 동일시됩니다. 게다가, 심리학에서 질적 연구의 개념적 토대를 매핑할 때, 종종 서로 다른 질적 패러다임들을 경험(experience) 연구에 대한 서로 다른 지향점을 반영하는 것으로 프레임화하곤 합니다(예: 해석주의-구성주의(interpretivist–constructivist)이데올로기적-비판적(ideological–critical) 질적 패러다임 간의 구분이 흔히 이루어지지만, 둘 다 경험과 주관성 연구를 지향하는 것으로 개념화됩니다, Morrow, 2007 참조). 그러나 사회 구성주의(social constructionism)(Gergen, 2015 참조) 교육을 받은 연구자로서, 우리(그리고 다른 이들)는 TA와 질적 연구를 경험적 현상(experiential phenomena)에 대한 관심을 넘어 사회적 과정(social processes)과 의미의 사회적 구성(social construction)으로 확장되는 것으로 이해합니다.<sup>7</sup> 우리는 TA 저자들 중에서 TA에 대한 경험적(experiential) 지향과 구성주의적(constructionist) 지향을 구분한다는 점에서 비교적 독특합니다(King, 2012; King & Brooks, 2017 참조).

<sup>7</sup> 근거 이론(grounded theory)의 구성주의적 버전(예: Charmaz, 2006)과 내러티브 분석(narrative analysis)의 구성주의적 버전(예: Sparkes & Smith, 2008)에서도 유사하게 포착되는 지향점입니다. 

 

대체로 말해,

  • 경험적 TA(experiential TA)(경험적 지향으로 사용될 때의 성찰적 TA를 포함하여)는 참여자들의 맥락적으로 위치지어진 경험(contextually situated experiences), 관점, 행동의 진실(truth) 혹은 진실들을 탐구하는 데 관심을 둡니다. 이는 전형적으로 어떤 형태의 실재론적(realist) (순진한[naïve] 및 비판적[critical]) 존재론(ontology)(Maxwell, 2012 참조)과, 해석주의-구성주의(interpretivism–constructivism), 이데올로기적-비판적(ideological–critical)(Morrow, 2007 참조), 맥락주의(contextualism)(Madill et al., 2000 참조) 및 현상학(phenomenology)(Willig, 2013 참조)을 포함하여 교차하고 중첩되는 다양한 인식론(epistemologies)에 의해 뒷받침됩니다.
  • 언어에 대한 개념화경험적/구성주의적 구분에 있어 핵심입니다(Reicher, 2000).
    • 경험적 TA에서 언어는 사물의 진정한 본질이나 참여자들의 맥락적으로 위치지어진 고유한 실재(realities) 또는 진실을 반영하는 것으로 개념화됩니다(Braun & Clarke, 2013).
    • 언어에 대한 구성주의적 지향(constructionist orientations)특정한 의미 패턴언어적 관행의 수사적 함의(rhetorical implications)와 효과를 심문하는 데 관심을 둡니다(Braun & Clarke, 2013). 언어는 능동적(active)이고 상징적(symbolic)인 것으로, 단순히 의미를 반영하는 것이 아니라 창조하는(creating) 것으로 개념화됩니다. 구성주의적 TA에서 언어는 정보에 접근하기 위한 단순한 도관(conduit)으로 취급되지 않습니다.
    • 구성주의적 TA 연구는 다양한 형태를 취합니다; 연구자들은 상대주의적(relativist)비판적 실재론적(critical realist) 존재론과 포스트모던(postmodern)포스트구조주의적(poststructuralist) 인식론과 방법론을 모두 표방할 수 있습니다(Clarke & Braun, 2014).

성찰적 TA의 이론적 유연성(theoretical flexibility)은 종종 이론적 중립성(theoretical neutrality)으로 오인됩니다. 모든 형태의 TA와 마찬가지로, 성찰적 TA는 지식이 어떻게 (가장 잘) 생산되는지에 대한 다양한 이론적 기반의 가정(theoretically based assumptions)들을 반영하며(Mauthner & Doucet, 2003), 이것들은 질적 패러다임들과 연관되어 있습니다.

  • 이러한 Big Q 입장은 "순수한(pure)" 귀납(induction)을 불가능하게 만듭니다; 연구자는 항상 철학적 메타이론적 가정(philosophical metatheoretical assumptions)과 자기 자신을 분석에 가져오며, 이는 귀납적 지향(inductive orientation)데이터에 "근거한(grounded)" 것으로 이해되는 것이 더 낫다는 것을 의미합니다.
  • 성찰적 TA에서의 연역적 지향(deductive orientation)기존 이론을 데이터를 해석하는 렌즈(lens)로 사용하는 것을 포함합니다; 연역적 성찰적 TA는 기존의 이론적 프레임워크나 가설을 "검증(testing)"하는 것에 관한 것이 아닙니다.

성찰적 TA의 핵심 가정들은 다음 10가지 요점으로 요약될 수 있습니다:

  1. 연구자의 주관성(Researcher subjectivity)은 성찰적 TA를 위한 일차적인 "도구(tool)"입니다; 주관성은 관리되거나 통제되어야 할 문제가 아니라, 연구를 위한 자원(resource)입니다(Gough & Madill, 2012). 편향되지 않거나 객관적인 지식 생성의 가능성을 암시하는 "연구자 편향(researcher bias)"이라는 개념은 성찰적 TA와 양립할 수 없는데, 왜냐하면 지식 생성은 본질적으로 주관적(subjective)이고 위치지어진(situated) 것이기 때문입니다.
  2. 이에 따라, 데이터의 분석과 해석은 정확하거나 객관적일 수 없으며, 더 약하거나(예: 저개발된, 설득력 없는, 얄팍한, 피상적인, 얕은) 더 강할(예: 설득력 있는, 통찰력 있는, 사려 깊은, 풍부한, 복잡한, 깊이 있는, 미묘한 차이가 있는) 수 있습니다.
  3. 양질의 코딩과 주제는 몰입(immersion) 또는 참여의 깊이, 그리고 거리두기(distancing)의 이중 과정에서 비롯되며, 이는 성찰(reflection)과 통찰(insight), 영감(inspiration)이 발전할 시간과 공간을 허용합니다.
  4. 코딩의 품질은 다수의 코더에 의존하지 않습니다; 단일 코더/분석가(single coder/analyst)가 성찰적 TA에서는 일반적입니다. 좋은 코딩(및 주제 개발)은 단독으로 달성되거나, 코더 간의 합의보다는 성찰성(reflexivity)과 해석적 깊이(interpretative depth)를 향상시키고자 하는 협업을 통해 달성될 수 있습니다.
  5. 주제(Themes)는 투입물(inputs)이 아니라 분석적 산출물(analytic outputs)이며, 코딩 이후에 그리고 코드들(이 또한 분석적 산출물임)로부터 개발됩니다; Saldaña(2013)가 언급했듯이, 주제는 "코딩의 결과물(outcome)이지... 그 자체로 코딩되는 무언가가 아닙니다"(p. 14).
  6. 주제는 토픽과 관련된 의미의 요약이 아니라, 공유된 아이디어(shared idea)나 개념(중심 조직화 개념[central organizing concept])에 의해 고정된 의미의 패턴입니다.
  7. 주제는 연구자가 그것들을 "발견(discovers)"할 때 "나타나기(emerge)" 위해 데이터 속에서 기다리고 있는 것이 아닙니다; 주제는 연구자가 데이터 세트와의 체계적인 분석적 참여를 통해, 그리고 개인적 위치(positioning) 및 메타이론적 관점 측면에서 데이터에 가져오는 모든 것을 통해 생산(produced)되는 것으로 개념화됩니다.
  8. 데이터 분석은 항상 이론적 가정(theoretical assumptions)에 의해 뒷받침되며, 이러한 가정들은 인정되고 성찰되어야 합니다.
  9. 성찰성(Reflexivity), 즉 연구에 있어서 연구자의 생성적 역할(generative role)에 대한 통찰과 그에 대한 명확한 표현은 양질의 분석에 핵심적입니다. 연구자는 "자신의 관점을 소유(own their perspectives)"하기 위해 노력해야 합니다(Elliott et al., 1999).
  10. 데이터 분석은 과학(science)이 아니라 예술(art)로 개념화됩니다;<sup>8</sup> 엄격함(rigor)의 프레임워크 내에서 창의성(creativity)이 과정의 중심입니다.
8 예술과 과학의 정의는 가변적이고 논쟁의 여지가 있지만, 여기서 우리는 우리의 과학의 경계 설정(demarcation)과 관련하여 (순진한[naïve]) 실재론적 실증주의 경험주의(realist positivist empiricism)를 환기시킵니다.

 

이 목록은 연구자의 주관성을 성찰적 TA의 가장 앞과 중심에 둡니다. 우리는 연구자의 주관성과 그에 부합하는 성찰성의 관행을 성공적인 성찰적 TA의 열쇠로 봅니다—그래서 성찰적(reflexive)이라는 라벨이 붙습니다. 여기서 우리는 연구를 보고할 때 정체성이나 경험 범주를 단순히 나열하는 것(예: Trainor & Bundon, 2020 참조)이 아니라, 연구자의 가정과 관행에 대한 깊이 있는(deep) 성찰적 질문(interrogation) 과정을 의미합니다.

 

예를 들어, 코딩(Coding)은 단순한 식별의 과정이 아니라 해석(interpretation)의 과정이며—연구자의 주관성이 이 과정에 연료를 공급합니다. 좋은 코딩(더 복잡하고 뉘앙스가 풍부한 코딩)은 종종 데이터와의 깊고 장기적인 참여(engagement)의 결과입니다; 코드는 통찰력이 이동하고 변화함에 따라 코딩 과정 전반에 걸쳐 유기적인 방식(organic way)으로 진화할 수 있고 또 그래야만 합니다. 개별 코드들은 범위가 확장되거나 축소될 수 있고, 다른 코드들과 함께 합쳐질 수도 있으며, 두 개 이상의 코드로 분할될 수도 있고, 코딩 라벨이 다듬어질 수도 있습니다. 이 유기적인 코딩 과정의 요점은 정확히 연구자의 발전하고 깊어지는 데이터 해석을 포착하는 것입니다. 심지어 코딩의 종착점에서도, 상황은 여전히 잠정적(provisional)입니다.

 

이러한 유기적인 과정은 데이터 코딩을 지시하기 위한 코드북(codebook)의 사용을 성찰적 TA와 양립할 수 없게 만듭니다. 코드북은 분석 과정의 시작 시점에 코딩을 제한할 수 있기 때문에(특히 코딩 신뢰도 실무자들이 선호하는 더 고정된 코드북의 경우), 이러한 유형의 데이터 참여를 허용하지 않습니다. 또한 코딩이 멈춘 후에 코드북을 개발하는 것(그리고 이 코드북을 사용하여 데이터를 다시 코딩하는 것)도 별 의미가 없는데, 왜냐하면 코딩에는 고정된 종착점(fixed endpoint)이 없으며, 데이터에 대한 추가적인 참여는 언제나 새로운 통찰로 이어질 수 있기 때문입니다(Trainor & Bundon, 2020이 이 점을 잘 보여줍니다).<sup>9</sup>

 9 이 유기적이고 발전적인 코딩 과정은 여전히 체계적인 추적(tracking)과 기록 보관을 필요로 합니다. 성찰적 TA에서 코딩 과정을 추적하는 방법에 대한 실질적인 조언은 Braun과 Clarke(2012)를 참조하고, 풍부하게 예시된 사례는 Trainor와 Bundon(2020)을 참조하십시오.

 

코드와 마찬가지로 주제(Themes)는 분석의 산출물로 이해됩니다; 주제를 매우 초기에 "식별(identification)"하는 것은 저개발된 주제(underdeveloped themes)와 분석적 조기 종결(analytic foreclosure)의 위험을 초래하며, 여기서 분석은 피상적인 결과 수준에서 멈추게 됩니다(Connelly & Peltzer, 2016). 코드로부터 개발된 주제들은 데이터, 연구자의 주관성, 이론적 및 개념적 이해, 그리고 훈련과 경험의 교차점에서 구성(constructed)됩니다.

 

  • 데이터 세트는 그 안에 단 하나의 TA 분석만을 "담고(hold)" 있는 것이 아닙니다. 다수의 분석이 가능하지만, 연구자는 자신의 프로젝트에 가장 잘 맞는 특정 주제들을 결정하고 개발해야 합니다—분석의 목표와 목적, 그리고 이론적 및 철학적 기반이 이러한 가능성들을 어느 정도 제한할 것임을 인식하면서 말입니다.
  • 기존의 이론, 개념, 지식은 데이터를 분석하기 위한 성찰적 TA 연구자의 자원(resources) 세트의 일부입니다. 분석 과정에서 각각이 얼마나 기여하는지는 분석이 성찰적 TA의 귀납적–연역적 스펙트럼(inductive–deductive spectrum) 어디에 위치하느냐에 달려 있습니다.
  • 심지어 연역적 또는 이론 주도적(theory-driven) 지향에서도, 이것들은 미리 결정된 구조를 제공하여 그 안에서 데이터를 코딩하거나 데이터를 검증(test)하는 것이 아니라, 데이터 코딩과 분석을 위한 최종 주제의 탐색 및 결정을 안내(guide)하는 역할을 합니다.

 

성찰적 주제 분석을 위한 설계적 사고
(Design Thinking for Reflexive Thematic Analysis)
 

설계적 사고(design thinking)는 일관성 있는 연구뿐만 아니라, 윤리 심사(ethics review), 연구 제안서(research proposals), 또는 연구비 신청(funding applications)과 같은 연구 평가의 여러 시점에서 필요합니다. 이러한 맥락에서 연구자는 자신이 무엇을 하려는지 의도를 드러내고, 자신의 설계 결정에 대한 정당성(justification)을 제시합니다. 성찰적 TA를 위한 연구 설계에는 단일한 출발점이나 경로가 존재하지 않습니다. 때로는 메타이론적 철학적 가정(metatheoretical philosophical assumptions)과 정치적 헌신(political commitments)이 출발점을 구성하기도 하는데, 이는 페미니스트 연구나 다른 정치적 지향을 가진 연구에서 빈번한 시작점입니다(Braun & Clarke, 2013 참조). 연구 질문(research questions) 또한 일반적인 출발점을 구성합니다. 

 

연구 질문을 설계의 출발점으로 사용한다는 것은, 그 질문이

 

  • 데이터 수집 및 분석 방법의 선택,
  • 참여자/데이터 세트 선정 전략(participant/data set selection strategies), 그리고
  • 특정 철학적 메타이론, 방법론적(methodological)설명적 이론(explanatory theories)
    • ...과 관련된 연구의 위치 설정을 안내해야 함을 의미합니다.

 

실제로는, 더 실용적(pragmatic)이고 심지어 정서적인 고려사항들이 연구 설계에서 전면에 등장하는 경우가 많습니다. 예를 들어, 학생 연구자가 이전에 사용해 본 적이 있어 다소 자신감이 있다는 이유로, 혹은 지도 교수가 선호하는 접근법이라는 이유로 특정 분석 지향을 선택하는 경우가 그렇습니다. 그러한 실용적 출발점들이 설계가 사려 깊게 고려되고 전반적인 설계가 개념적으로 일관성(conceptually coherent)이 있다면, 반드시 나쁜 설계로 이어지는 것은 아닙니다.

 

이러한 설계 일관성(design coherence)(Braun & Clarke, 2013; Willig, 2013), 또는 방법론적 무결성(methodological integrity)(Levitt et al., 2017)의 핵심 원칙은 TA 연구에서 매우 중요한데, 그 이유는 TA의 연구 설계에 내재된 한계나 처방(prescriptions)이 거의 없기 때문입니다. 일반적으로,

 

  • 광범위한 철학적 메타이론, 방법론, 설명적, 그리고 정치적/이데올로기적 프레임워크 내에서 사용될 수 있는 이론적 유연성(theoretical flexibility)을 갖추고 있을 뿐만 아니라,
  • TA는 광범위한 연구 질문을 다루고, 거의 모든 유형의 데이터를 분석하며,
  • 더 동질적(homogenous)이거나 이질적(heterogeneous)인 참여자 그룹/데이터 세트로부터 수집된 작거나 큰 데이터 세트를 분석하는 데 사용될 수 있습니다(King & Brooks, 2017).

 

우리는 성찰적 TA를 위한 설계적 사고에 대한 논의를 연구 질문에서 시작하여, 데이터 수집 방법 및 출처, 참여자 그룹/데이터 세트 구성(participant group/data set constitution) 및 크기, 품질 기준 및 관행으로 이어가며, 성찰적 TA를 위한 보고 기준(reporting standards)의 개요로 마무리할 것입니다.

연구 질문 (Research Questions) 

연구는 연구자가 데이터 분석을 통해 이해하고자 하는 것이 무엇인지를 포착하는 질문에 의해 안내됩니다. 질적 연구자들은 다양한 범위의 현상을 이해하는 데 관심이 있습니다; 이것들은 서로 다른 "유형"의 질문들로 군집화될 수 있습니다(Braun & Clarke, 2013 참조).

 

  • 성찰적 TA는 이러한 연구 질문 유형의 대부분을 다룰 수 있습니다(Table 1 참조). 만약 연구자가 이해하고자 하는 것의 "본질(essence)"이 이러한 연구 질문 유형 중 하나에 부합한다면, 성찰적 TA는 개념적으로 일관성 있는 설계 내에서 사용되는 한 그들의 연구에 적합한 방법일 가능성이 높습니다.
  • 성찰적 TA가 다룰 수 없는 유형의 질문들은 언어 관행(language practice) 및/또는 내러티브 구조에 대한 기술적 이해를 요구하는 질문들입니다. 이러한 질문들은 일부 유형의 담론 심리학적(discursive psychological)(예: Wiggins, 2017), 대화 분석적(conversation analytic)(예: Schegloff, 2007) 그리고 내러티브(narrative)(예: Reissman, 2007) 접근법들과 관련이 있습니다; 그러한 접근법들이 해당 질문들을 다루기에 가장 적합합니다.

 

표 1. 성찰적 주제 분석에 적합한 연구 질문의 유형 체계 

연구 질문의 초점 예시
사람들의 맥락에 따른 생생한 삶의 경험 및 주관적 현상에 대한 해석 미국 내 보스니아 난민들의 차별 경험 (Komolova et al., 2020); 고국을 떠나온 것에 대한 남아프리카 이주민들의 죄책감과 수치심 (Ivey & Sonn, 2020)
특정 맥락에서 특정 현상에 대한 특정 집단의 견해, 인식, 이해, 관점, 욕구, 동기 (흔히 삶의 경험에 관한 질문과 결합됨) 영국 내 전력망 기술에 대한 대중의 인식과 상징적 연상 (Devine-Wright & Devine-Wright, 2009); 아프리카계 미국인 여대생의 미(美)의 기준과 신체 이미지에 대한 고민 (Awad et al., 2015)
특정 현상의 형태와 질감에 영향을 미치는 요인이나 사회적 과정 성인기로 이행하며 고등 교육을 시작하는 젊은 남성들에게 대인 관계를 의미 있게 만드는 과정과 요인, 그리고 이러한 관계가 그들의 인생 계획에 미치는 영향 (Arbeit et al., 2016); 일차 의료 기관에서 신체 활동 중재 도입에 영향을 미치는 요인들 (Huijg et al., 2015)
사람들이 세상에서 하는 일—맥락에 따라 다양하게 개념화되는 행동이나 실천, 그리고 그에 대한 의미 부여 사별 가족 치료를 받는 가족들의 대화에서 나타나는 애착 불안의 서사적 지표인 비일관성 (Willcox et al., 2019); 초보 아빠들이 온라인 채팅방에서 사회적 지지를 요청하고, 제안하고, 받는 방식 (Fletcher & StGeorge, 2011)
특정 현상을 규제하는 (종종 암묵적인) 맥락 중심의 규칙과 규범 스포츠 문화적 가치와 불문율이 리듬체조 내 과사용 부상의 발생과 경험에 미치는 영향 (Cavallerio et al., 2016); 엘리트 청소년 축구 선수들의 조직 문화 경험이 그들의 정체성 발달과 행동을 형성하는 방식 (Champ et al., 2020)
특정 맥락에서 특정 '사회적 대상'이나 현상의 재현(Representation), 그리고 그에 따른 함의나 영향 대통령의 정치 연설에서 '테러리스트'라는 범주가 구축되는 도덕적 차원과 이것이 대테러 정책을 정당화하는 데 미치는 함의 (Pilecki, 2017); 미국 주류 언론에 비친 아이티 여성의 재현 방식 (Rendón & Nicolas, 2012)
특정 맥락에서 특정 '사회적 대상', 주체적 위치(Subject positions) 또는 기타 사회적 현상의 사회적 또는 담론적 구성, 그리고 그에 따른 함의와 영향 반규범적인 체모 관리 실천에 대한 사람들의 구성과 의미 부여 (Jennings et al., 2019); 체중 감량 프로그램에 참여하는 고령 비만 남성들이 자신의 신체와 신체 변화를 구성(인식)하는 방식 (Gough et al., 2016)

 

참여자의 경험과 의미 만들기(sense-making)(이해, 인식, 동기, 욕구, 견해 등으로 다양하게 묘사됨)를 탐구하는 데 중점을 둔 질문들은 심리학자들에게 가장 흥미로운 것으로 보입니다.

 

  • 경험적 현상(experiential phenomena)에 초점을 맞춘 다른 질문들에는
    • 사람들의 행동이나 관행(그들이 하는 일), 그리고 이에 대한 그들의 의미 만들기,
    • 특정 현상을 형성하고 영향을 미치는 요인과 과정, 그리고
    • 인간 행동이나 관행을 규제하고 지배하는 규칙과 규범을 이해하는 것과 관련된 질문들이 포함됩니다.
  • 구성주의적 연구 질문(Constructionist research questions)은 전형적으로 사회적(그리고 심리사회적) 세계에서의 의미 만들기를 심문합니다. 이들은 종종
    • 실재의 사회적 구성(social construction of reality),
    • 관심 현상을 둘러싸고 구성하는 의미 프레임워크(meaning frameworks) 또는 담론(discourses), 그리고 이것들의 함의에 중심을 둡니다(Gergen, 2015).

 

TA 연구에서의 연구 질문에 대해 주목해야 할 한 가지 중요한 점은 다음과 같습니다: 어떤 경우에는 질문들이 처음부터 (다소) 고정되어 있고 엄격하게 고수될 수 있습니다. 이는 특히 일부 형태의 응용 연구와 더 (후기)실증주의적 TA의 경우에 그렇습니다. 대조적으로, 성찰적 TA에서의 연구 질문은 연구 과정 전반에 걸쳐 진화(evolve)하는 것이 더 일반적입니다. 초기 연구 질문(들)은 꽤 개방적일 수 있으며, 데이터 수집과 분석이 진행됨에 따라 더 초점이 맞춰지거나 확장되거나 심지어 초점이 이동할 수도 있는 "출발점(starting point)"을 구성합니다. 그것들은 분석을 위한 출발점이지 반드시 종착점은 아닙니다. 성찰적 TA는 패턴화된 의미의 해석과 연구 질문 사이의 "대화(dialogue)"를 포함합니다. 연구 질문을 연마하고 정교화하는 것은 나쁜 품질의 관행이나 나쁜 설계의 지표가 아니라, 더 깊은 통찰이 생성되는 과정의 지표입니다.

데이터 수집 방법 (Methods for Data Collection) 

성찰적 TA 연구에는 데이터 수집 방법이나 출처에 대한 내재된 제한이 거의 없습니다.

 

  • 인터뷰(예: Robinson-Wood et al., 2020)나 포커스 그룹(focus groups)(예: Tebbe et al., 2018)과 같이 더 전통적이고 광범위하게 사용되는 방법들부터,
  • 개방형/질적 설문 응답(open-ended/qualitative survey responses)(예: Blackie et al., 2020) 및 요청된 일기(solicited diaries)(예: Schnur et al., 2009)와 같은 다른 자기보고 기법들에 이르기까지 광범위한 데이터 출처가 출판된 TA 연구에서 사용되어 왔습니다. 또한
  • 이야기 완성(story completion)(예: Jennings et al., 2019) 및 시각적 방법(visual methods)(예: Devine-Wright & Devine-Wright, 2009)—이미지 분석을 위해 특별히 개발된 성찰적 TA 형태(예: Gleeson, 2011)를 포함하여—과 같은 혁신적이고 창의적인 방법들, 그리고
  • 심리치료 세션(예: Willcox et al., 2019), 온라인 포럼 게시물(예: Fletcher & StGeorge, 2011), 정치 연설(예: Pilecki, 2017)과 같은 "자연주의적(naturalistic)"이고 기존에 존재하는 데이터 출처들도 포함됩니다.
  • 분석은 (명확한 근거가 있다면) 인터뷰와 설문 데이터처럼 두 가지 이상의 다른 데이터 유형에 걸쳐 수행될 수도 있습니다.

 

성찰적 TA의 이론적 유연성(theoretical flexibility)은 이것이 문화기술지적 설계(ethnographic designs)(예: Devaney et al., 2018)와 기억 작업(memory work)(예: Delgado-Infante & Ofreneo, 2014)과 같은 참여적 방법론(participatory methodologies)에 통합될 수 있음을 의미합니다.

 

  • "지역사회에 위치한(community-located)" 모델 내에는 다양한 연구 설계가 존재합니다. 여기에는
    • 지역사회를 참여시키지만 연구자가 주도하고 지휘하는 "지역사회 기반 및 위치(community based and located)" 연구에서부터,
    • 보다 완전히 "참여적(participatory)"이며 참여자를 공동 연구자(co-researchers)로 참여시키고 연구자와 지역사회 참여자 간의 "권력 공유(power-sharing)" 모델을 따르는 연구(Coughlin et al., 2017 참조)에 이르기까지 다양합니다.
  • TA는 이 두 가지 광범위한 모델 모두에서 사용될 수 있습니다. TA의 상대적 접근 용이성(절차와 산출물 측면 모두에서)과, 앞서 언급된 "방법론적 공포(methodological horrors)"(Brown & Locke, 2017, p. 452)를 비켜갈 수 있는 잠재력—여기서는 알고서 하는 것이며, 실용적이고 정치적인 목적(예: 지역사회 구성원들이 분석에 기여하도록 촉진하는 것)을 위해—은 이것이 권력 공유형 참여적 방법론에 특히 잘 적합함을 의미합니다(예: Rowley et al., 2020).

 

데이터 품질(Data quality)은 성찰적 TA를 위한 또 다른 중요한 설계 고려사항입니다. 왜냐하면 양질의 분석은 충분한 양의 데이터보다도 양질의 데이터를 확보하는 것에 달려 있기 때문입니다(Connelly & Peltzer, 2016). 데이터는 이상적으로 풍부하고, 뉘앙스가 있으며, 복잡하고 상세해야 합니다. Connelly와 Peltzer는 "표면적 인터뷰(at-surface interviewing)"(p. 53)를 데이터 품질이 낮은 이유 중 하나로 강조했는데, 이는 프롬프트(prompts)탐색적 질문(probes), 그리고 연구자와 참여자 간의 관계에 거의 또는 전혀 주의를 기울이지 않은 것을 의미합니다. 데이터 품질은 분석이 시작되기 전에 고려해야 할 중요한 사항입니다. 데이터 수집 방법과 연구 질문, 이론적 프레임워크, 분석적 지향, 그리고 참여자 생성 데이터의 경우 참여자 그룹의 특성 및 요구 간의 적합성(fit)을 고려하는 것이 중요합니다.

 

또한 방법들이 어떻게 사용될 것인지 고려하는 것도 중요합니다. 예를 들어,

 

  • 코딩 신뢰도 연구자들은 인터뷰에 대해 비교적 구조화되고 일관된 접근을 우선시합니다—"데이터 포화(data saturation)"의 결정과 더 구조화된 코딩 접근을 용이하게 하고, 코딩 신뢰도 TA의 (후기)실증주의적 개념적 기반과 조화를 이루기 위해 동일한 질문을 동일한 순서로 묻습니다(예: Guest et al., 2006).
  • 대조적으로, 성찰적 TA
    • 그 질적 감수성(qualitative sensibility)에 따라, 실제 대화의 더 "어수선한(messier)" 흐름과 더 유사한, 인터뷰에 대한 유연하고 유동적인 접근을 우선시합니다:<sup>10</sup>
    • 질문과 주제는 신중하게 고려되지만, 인터뷰는 연구자와 참여자 간의 상호작용과 의미의 공동 구성(co-construction)을 중심에 둡니다; 연구자가 참여자의 전개되는 이야기에 자발적으로 반응할 수 있는 상당한 여지가 있습니다.
    • 목표는 "느슨함을 유지하면서 과녁을 맞추는 것(on target while hanging loose)"(Rubin & Rubin, 1995, p. 42)이며, 획일적으로 구조화된 설명이 아니라 각 참여자의 이야기에 대한 심층적인 탐구를 얻는 것입니다.

 

인터뷰나 포커스 그룹과 같은 상호작용적 방법(interactive methods)의 데이터 수집을 사용하는 경우, 초기 인터뷰나 포커스 그룹의 전사본(transcripts)을 검토하여 그것들이 풍부하고 "과녁을 맞춘(on target)" 데이터를 생성하고 있는지 확인하는 것이 필수적입니다. 경험이 없는 연구자들은 이에 대해 멘토나 조언자에게 피드백을 요청해야 합니다—인터뷰와 포커스 그룹 진행(moderation)은 대부분의 사람들에게 "자연스럽게" 다가오지 않는 숙련된 활동입니다(몇 가지 제안은 Braun & Clarke, 2013 참조; Connelly & Peltzer, 2016은 충분한 탐색적 질문이 있는 인터뷰와 없는 인터뷰의 전사본 예시를 유용하게 제공합니다). 질적 설문조사, 요청된 일기, 비네트(vignettes), 이야기 완성(Braun et al., 2017 참조)과 같은 비상호작용적 데이터 수집 도구를 사용하는 경우, 데이터의 "적합성(fit)"과 "품질(quality)"을 평가하기 위해 파일럿 실행(piloting)이 중요합니다. 그러한 방법들에서 풍부함(richness)은 종종 각 데이터 항목 내에서뿐만 아니라 데이터 세트 전체에 걸쳐 평가됩니다. 연구 설계와 일정 내에 이러한 검토나 파일럿 실행을 설계해 넣는 것이 중요합니다.

10 Conversation analysts (e.g., Schegloff, 2007) would point to the patterning and structure of real-world interactions; our emphasis on looseness or messiness here does not negate this aspect.

 

참여자 그룹/데이터 세트 선정 및 구성
(Participant Group/Data Set Selection and Constitution)
 

또 다른 중요한 설계 고려사항은 데이터 세트의 선정(selection)(혹은 연구의 개념화에 따라 생성[generation] 또는 구성[construction])입니다. 이는 프로젝트를 위한 참여자 모집을 통해서든, 관심 주제에 대한 소셜 미디어 게시물 선정을 통해서든, 혹은 무수히 많은 다른 방법 중 하나를 통해서든 이루어집니다.

 

  • 양적 및 (후기)실증주의적((post)positivist) 연구 용어로는 이것이 "표본(sample)"—질적 연구(우리 자신의 연구 일부를 포함하여)에서도 여전히 만연한 프레임—을 구성합니다. 데이터를 표본으로 개념화하는 것은 관련된 정보가 전체 가능한 출처들("모집단[population]")로부터 선택되었으며, 이 표본이 연구 질문을 다루는 데 사용된다는 아이디어를 반영합니다. 여기서 우리는 참여자 그룹/데이터 세트 선정 전략, 참여자 그룹/데이터 세트의 크기, 그리고 (크기에 대한) 정당화(저자들이 표본[sample]을 사용하는 경우 우리는 그들의 언어를 유지함)를 논의함에 있어, 이러한 단순한 재현적 추론(representational inference)을 피하고자 합니다.

 

그에 앞서, 우리는 TA에서의 강조점이 개별 사례 내의 의미보다는 사례 전반에 걸친 주제(themes), 즉 패턴화된 의미(patterned meaning)에 있다는 점을 주목합니다. 따라서 참여자 그룹/데이터 세트는 패턴화된 의미에 관한 주장을 정당화할 수 있을 만큼 충분히 커야 합니다. 이는 소수의 사례, 심지어 단일 사례(예: Josselson, 2009)의 구체적인 특성을 깊이 있고 상세하게 분석하는 내러티브 분석(narrative analysis)과 같은 더 개별 기술적(idiographic) 접근법들과는 대조적입니다.<sup>11</sup>

<sup>11</sup> 성찰적 TA는 소수의 사례, 심지어 단일 사례에 초점을 맞추는 사례 연구(case study research)에서도 사용되어 왔습니다(예: Cedervall & Åberg, 2010; Manago, 2013 참조). 게다가, 일부 연구자들은 성찰적 TA를 내러티브 방법론(narrative methodologies) 및 절차와 결합하여 내러티브 구조와 "사례 전반(across case)"의 의미 패턴화 모두에 관심을 갖는 독특한 "하이브리드(hybrid)" 방법을 생산해 냈습니다(예: Palomäki et al., 2013; Ronkainen et al., 2016). 

 

TA가 전형적으로 데이터 항목 전반에 걸친 의미에 관심을 둔다는 주의사항과 함께, 성찰적 TA(reflexive TA) 연구에는 특별한 참여자 그룹/데이터 세트 선정 요건이 없습니다. 이는 데이터 항목의 수에 관해서나, 흔히 "표집(sampling)" 방법 또는 전략이라 알려진 참여자 그룹/데이터 세트가 선정되는 방식에 관해서나 마찬가지입니다. Robinson(2014)의 표집에 대한 4단계 "범패러다임적(pan-paradigmatic)" 가이드는 성찰적 TA에서 참여자 그룹/데이터 세트를 선정하고 생성하는 다양한 측면을 생각해보는 데 유용한 출발점을 제공합니다:

  • 포함 기준(inclusion criteria)(참여자나 데이터 항목이 반드시 갖춰야 할 속성)과 배제 기준(exclusion criteria)(자격을 박탈하는 속성)을 사용하여 "표집 우주(sampling universe)"를 정의하십시오. 기준이 구체적일수록 표집 우주는 (특정 측면에서) 더 동질적(homogenous)이 될 가능성이 높습니다.
    • 예를 들어, "자녀가 없는 사람"에서 "자발적으로 자녀를 갖지 않은(childfree by choice) 사람"으로, 다시 "자발적으로 자녀를 갖지 않은 남성"으로 이동하는 것은 풀(pool)을 특정 방식으로 좁힙니다.
  • 무엇이 이상적인지(연구 목적, 분석적 지향, 이론적 기반과 조화를 이루는 것)와 무엇이 실용적인지(practical)(예: 시간, 자원, 또는 지역적—제도적 및 연구 분야—맥락의 규범이나 기대)를 성찰하여 표본 크기(sample size)(또는 크기 범위)를 결정하십시오.
  • 포함시킬 항목이나 참여자를 선정하기 위한 표집 전략(sampling strategy)을 개발하십시오.
  • 표집 우주로부터 참여자를 모집하거나 항목을 선택하여 표본을 조달(source)하십시오.

참여자/데이터 항목 선정 전략
(Strategy for Selecting Participants/Data Items)
 

질적 패러다임 내에서 수행되는 질적 연구에서, 연구의 목표, 그리고 그에 따른 참여자/데이터 항목 선정은 일반적으로 "모집단(population)"에 대한 어떤 "양적 재현(quantified representation)"을 제공하는 것(Gaskell, 2000)이라기보다는, 그 안의 의미의 범위(range)와 다양성(diversity)의 일부를 포착하는 것입니다. 그리고 연구 질문(들)에 대한 심층적인 탐구를 허용하여, 결과의 "전이 가능성(transferability)"(Spencer et al., 2003)에 대한 기회를 극대화하는 것입니다. 편의 표집(convenience sampling)유목적 표집(purposive sampling)(Patton, 2015; Sandelowski, 1995)으로 알려진 것들이 TA 연구에서 가장 흔한 참여자/데이터 항목 선정 전략으로 보입니다.

 

  • 편의 표집은 연구자가 쉽게 접근할 수 있는 "사례(cases)"(참여자 또는 데이터 항목)를 선정하는 것을 포함합니다.
    • 실제로 이는 종종 프로젝트를 광고하고, 우연히 응답한 누구라도 참여자 그룹을 구성하게 됨을 의미합니다. 심리학자들은 흔히—그리고 문제적으로—연구 참여 제도를 통해 심리학과 학부생들을 모집해 왔는데, 이는 편의 표본의 또 다른 형태입니다(Arnett, 2008).
    • 편의 표집은 종종 가장 덜 엄격하고 정당화하기 힘든 참여자 선정 방법으로 간주됩니다(Sandelowski, 1995)—특히 관심 있는 더 넓은 집단이 구체적으로 심리학 학생들이 아닐 때 그렇습니다. 그러나 이러한 비판이 참여자/데이터 항목 선정 전략으로서의 인기를 꺾지는 못했으며, 편의 전략 내에서 다양성을 촉진할 수 있는 방법들(예: 연구가 광고되는 장소와 방식)이 존재합니다.
  • 유목적 표집은 조사 중인 현상에 대한 이해를 극대화할 잠재력을 가진 "정보가 풍부한(information-rich)" 사례들(Patton, 2015)을 의도적으로 선정하는 것을 포함할 수 있습니다.
    • 유목적으로 선정된 참여자 그룹/데이터 세트는 구성 면에서 동질적(homogenous)이거나 이질적(heterogeneous)일 수 있습니다; 의도적으로 다양성을 추구하는 것은 최대 변이(maximum variation)(Sandelowski, 1995) 또는 이질성(heterogeneity)(Fassinger, 2005) 표집이라고 불립니다(Onwuegbuzie & Leech, 2007 참조).
    • 참여자 그룹/데이터 항목 선정 전략들은 결합될 수 있고 흐릿해질 수 있습니다; 실제 세계의 관행은 교과서적인 설명과 특별히 같지 않은 경우가 많습니다. 성찰적 TA를 위한 이상적인 "표집" 전략은 없습니다: 성찰적 TA 설계 일관성 관점에서 가장 중요한 것은, 연구자가 자신의 전략이 무엇인지, 왜 그것을 선택했는지, 그것의 강점과 한계를 이해하고, 그것이 어떻게 그리고 왜 연구 질문(들)을 의미 있게 다룰 데이터 세트를 제공하는지를 명확히 표현(articulate)할 수 있어야 한다는 점입니다. 이는 참여자 그룹/데이터 세트 크기와 연결됩니다.

 

참여자 그룹/데이터 세트 크기
(Participant Group/Data Set Size)
 

참여자 그룹/데이터 세트는 얼마나 커야 할까요? 이는 TA뿐만 아니라 질적 연구 전반에 걸쳐 까다로운 질문입니다(예: Malterud et al., 2016; Morse, 2000; Sim et al., 2018 참조). TA를 위한 참여자 그룹/데이터 세트 크기를 결정하는 것은 참여자나 데이터 항목의 "정확한 숫자(correct number)"를 식별하는 것만큼 간단하지 않습니다. 우선 고려해야 할 데이터 유형이 있고, 각 데이터 항목의 "분량(volume)" 및 풍부함에 대한 관련 고려사항뿐만 아니라, 동질성이질성에 대한 고려사항도 있습니다.

 

  • 더 큰 참여자 그룹/데이터 세트는 연구의 범위(scope)가 비교적 넓고, 주제가 잠재적으로 "파악하기 어렵거나(difficult to grab)"(Morse, 2000, p. 4) 참여자들에게 민감하며, 관심 있는 더 넓은 집단 내에 상당한 다양성이 존재할 때 유용할 수 있습니다.
  • 더 작은 참여자 그룹/데이터 세트(예: 10회 이하의 인터뷰)로 작업할 때는, 동질성(예를 들어 인구통계, 경험, 위치 및 기타 여러 가지에 기반할 수 있음; Robinson, 2014)이 주제 개발을 촉진하는 데 도움이 될 수 있습니다. 그러나 동질적인 참여자 그룹/데이터 세트를 생산하기 위해 명시적으로 설계된 포함 및 배제 기준조차도 의미 만들기(sense-making)의 동질성을 보장할 수는 없습니다.

또한 연구의 목적과 맥락(Morse, 2000 참조), 그리고 출판 가능성을 둘러싼 규범(Dworkin, 2012)과 같은 실용적 고려사항(pragmatic considerations)도 있습니다.

 

 

  • 맥락은 무엇이 관리 가능한지를 결정하는 것의 일부입니다—분석은 단순히 완료 가능한 것이 아니라 잘 수행되어야 합니다. 구체적인 마감 기한이 있는 연구의 맥락에서는, TA에 타당성(validity)을 부여할 만큼 충분한 넓이와 깊이를 가진 데이터 세트와, 마감 기한 전에 데이터를 의미 있게 분석할 시간 사이의 균형을 맞출 필요가 있습니다.
  • 연구자들은 끊임없이 압도감을 느끼거나 "데이터에 빠져 익사하는(drowning in data)" 기분을 느껴서는 안 되며, 데이터를 제대로 다루지 못해서도 안 됩니다(비록 이런 일이 일어날 수 있지만, Braun & Clarke, 2020).
  • TA 연구는 교과서적인 방식으로 연구를 실행하는 데 필요한 모든 자원, 시간, 기술을 갖춘 "완벽한(perfect)" 조건 하에서 수행되는 경우가 거의 없으므로, 참여자 그룹/데이터 세트 크기 결정은 필연적으로 경쟁하는 우선순위들—실용적/실제적(pragmatic/practical)인 것과 방법론적/이론적(methodological/theoretical)인 것—을 협상하면서 생겨나는 타협을 포함합니다.

 

질적 연구에서의 참여자 그룹/데이터 세트 선정에 관한 일반적인 지침들은 성찰적 TA 연구에 유용하지만(예: Malterud et al., 2016; Morse, 2000), 질적 연구 지형의 모호한 본질(fuzzy nature)(Madill & Gough, 2008)을 반영하듯, 참여자 그룹/데이터 세트 크기를 결정하기 위해 널리 합의된 정확한 기준은 없습니다. 게다가, "연구의 목표를 충족시키기에 적절한 표본 크기를 구성하는 것은 연구자에 의한 지속적인 해석(ongoing interpretation) 과정이 필수적이다. 그것은 반복적이고, 맥락 의존적인 결정이다"(Sim et al., 2018, p. 630). 심지어 분석 전이라도 참여자 그룹/데이터 세트 크기를 결정하기 위한 더 정확한 기준을 제공하는 것처럼 보이는 두 가지 공식은 포화(saturation)와 통계적 모델(statistical models)입니다. 이것들은 TA 방법론 문헌에서 널리 논의되었으므로, 우리는 이제 성찰적 TA에 대한 이 두 가지의 관련성을 탐구합니다.

포화 (Saturation) 

"데이터가 포화되었다(The data were saturated)"는 TA 연구에서 가장 널리 사용되는 참여자 그룹/데이터 세트 크기 근거 중 하나이며, 종종 너무 자명한 것으로 받아들여져 정의조차 되지 않습니다(Braun & Clarke, 2019b). "데이터 포화(data saturation)" 또는 "정보 중복성(information redundancy)" 개념은 근거 이론(grounded theory)의 방법론과 밀접하게 정의되고 연결된 "이론적 포화(theoretical saturation)"(Glaser & Strauss, 1967)에서 진화한 것으로 보입니다(O’Reilly & Parker, 2013). 이론적 포화는 근거 이론에서의 이론적 표집(theoretical sampling) 관행 및 동시적인 데이터 수집·분석과 불가분의 관계에 있습니다(Morse, 2015; O’Reilly & Parker, 2013).

 

데이터 포화(Fusch & Ness, 2015)와 그 변형인 코드 포화(code-saturation)(Hennink et al., 2017), 주제 포화(theme-saturation)(Guest et al., 2006), 그리고 의미 포화(meaning-saturation)(Hennink et al., 2017)는 이제 TA 연구에서 데이터 세트 생성을 위한 "골드 스탠다드(gold standard)"(Guest et al., 2006, p. 60)로 자리 잡았습니다. 그러나 데이터 세트의 적절성에 대한 일반적 척도(generic measure)로서의 사용은 문제가 있는데, 왜냐하면 그것이 성찰적 TA와 철학적으로나 방법론적으로 일관되지 않기 때문입니다.<sup>12</sup> Morse(1995)에게 있어 데이터 적절성은 "새로운 정보가 얻어지지 않을 때까지 데이터를 수집하는 것"(p. 147)으로 조작화(operationalized)되었습니다; 이러한 "새로운 것이 없음(no new)"이라는 개념은 포화의 다양한 종류(데이터, 코드, 또는 주제) 전반에 걸쳐 공통적입니다. 그러나 주장된 포화의 정의와 의미가 종종 모호할 뿐만 아니라, 정확히 어떻게 포화가 달성되었는지가 논의되지 않는 경우가 흔합니다(Bowen, 2008). 포화에 대한 주장—어떤 방식으로든 정의 및/또는 설명되었든 아니든—은 종종 TA 연구에서 데이터 수집을 중단하는 근거로 제공됩니다(예: Grabe et al., 2015; Staneva & Wittkowski, 2013). 그것은 종종 데이터 분석과는 별개이며, 분석에 선행하는 것으로 위치지어집니다(Saunders et al., 2017).

12 포화의 개념이나 사용은 많은 일반적인 질적 품질 지침 및 기준에서 참조됩니다(예: Levitt et al., 2018; Morrow, 2005); 가장 좋은 것들은 포화와 같은 기준이 보편적으로 적용 가능하거나 이론적으로 중립적이지 않다는 점을 명확히 합니다(예: Levitt et al., 2018). 

 

데이터 포화에 대한 주장은 (알고서 했든 의도치 않게 했든) TA 연구에서 표본 크기에 대한 수사적으로 강력한 근거로 작동합니다.

 

  • 이 용어의 대부분의 사용은 연구자가 추가적인 데이터를 수집함으로써 새로운 통찰(new insights)이 생성되지 않는 데이터 수집의 지점에 도달한다는, 앞서 언급된 아이디어를 환기시키는 것으로 보입니다. 이것은 성찰적 TA 관점에서 볼 때 문제가 되는데, 왜냐하면 그것은 사실상 연구자의 과업을 발견(discovery)으로—발견되기를 기다리고 있는 주제를 인식하는 것으로—위치시키기 때문입니다. 이는 성찰적 TA에서 주제나 연구 과정이 개념화되는 방식이 아닙니다(Braun & Clarke, 2019b).<sup>13</sup>
  • 질적 연구를 발견이 아닌 지식 생성(generation) 또는 구성(construction)의 성찰적 과정으로 개념화하는 것 내에서는, 지속적인 데이터 참여를 통해, 혹은 다른 관점에서 데이터를 읽음으로써(Ho et al., 2017이 잘 보여주듯이) 발전되는 새로운 이해(new understandings)(Mason, 2010)에 대한 잠재력이 항상 존재합니다. 만약 우리가 분석을 데이터와의 참여를 통해 그리고 (분석 시점의) 우리의 위치설정(positionings)과 일치하여 발전되는 분석적 통찰(analytic insight)의 과정으로 상상한다면, "포화시키는 것(saturate)"이 가능하다는 개념은 말이 되지 않게 됩니다(Malterud et al., 2016).

 

13 근거 이론 내에서의 포화에 대한 더 구성주의적인 재작업에 대해서는 Charmaz(2006)를 참조하십시오.

 

지난 10년 정도 동안, 포화를 결정하기 위한 구체적인 지침의 부재에 대한 우려는 몇몇 저자들로 하여금 포화를 "조작화(operationalize)"하고, TA 연구에서 포화 또는 특정 수준의 포화에 도달하기 위해 얼마나 많은 인터뷰(또는 포커스 그룹)가 충분한지를 결정하려고 시도하게 만들었습니다(예: Guest et al., 2006; Hagaman & Wutich, 2017; Hancock et al., 2016; Hennink et al., 2017). 그러한 지침들은 TA 참여자 그룹/데이터 세트 크기에 대한 근거로 채택되어 사용되어 왔지만, 성찰적 TA를 위한 지침으로는 적합하지 않습니다. 왜냐하면 그것들은 성찰적 TA의 개념적 기반, 가치, 그리고 관행과 상충하는 (때로는 인정되지 않은) 가정들을 포함하고 있기 때문입니다(Braun & Clarke, 2019b). 이것들은 다양한 방식으로 분명해집니다.

 

대부분은 코딩 신뢰도(coding reliability) 또는 코드북(codebook) 버전의 TA를 사용하며—비록 더 넓은 접근법의 특정 반복(iteration)으로 인정되는 경우는 드물지만—실재론적 존재론(realist ontology)과 (후기)실증주의적 연구 가치를 입증합니다. 데이터 수집은 종종 다소 구조화되고 표준화되어 있으며, 생성된 데이터는 응용적 초점을 가지고 다소 구체적입니다. "발견(discovery)" 모드 내에서, 주제는 분석 이전에 존재하며 연구자가 참여자로부터 끌어내거나 분석 과정을 통해 밝혀내는 실체로 암묵적으로 개념화됩니다(Saunders et al., 2017). 주제는 종종 인터뷰 질문을 반영하는 토픽 요약(topic summaries)이자 분석적 투입물(analytic inputs)입니다. 연구 질문과 관련된 중요성과 의미보다는 빈도(Frequency)가 전형적으로 주제/코드의 일차적 혹은 유일한 결정 요인입니다; 이에 대한 근거는 거의 설명되지 않습니다.

 

비록 우리는 성찰적 TA 연구자들이 데이터 포화 개념을 아예 피하는 것이 더 낫다고 생각하지만(Braun & Clarke, 2019b 참조), 이것이 실용적으로 항상 가능한 것은 아님을 인식합니다. 이러한 경우 양질의 관행을 위해 결정적인 것은, 포화가 정확히 무엇을 의미하는지 정의되고, 연구자가 그러한 포화가 정확히 어떻게 결정되었는지에 대해 명확히 하는, 알고서 하는 사용(knowing use)을 입증하는 것입니다.

통계적 공식 (Statistical Formula) 

Fugard와 Potts(2015)는 TA에서 표본 크기를 전향적(prospectively)으로 결정하기 위한 양적 도구를 개발했습니다. 가장 덜 만연한 주제의 예상 모집단 주제 유병률(population theme prevalence), 원하는 주제 사례(instances)의 수, 그리고 연구의 검정력(power)을 연구자가 결정해야 하는 이 도구는 여러 질적 연구자들로부터 비판적인 논평을 불러일으켰습니다(예: Braun & Clarke, 2016; Hammersley, 2015). 표본 크기나 데이터 포화를 전향적으로 결정하기 위한 다른 똑같이 문제가 있는 공식과 도구들도 출판되었습니다(예: Galvin, 2015; Tran et al., 2017). 이러한 도구들의 많은 다른 측면들은 그것들을 성찰적 TA와 개념적으로 양립 불가능(conceptually incompatible)하게 만듭니다. 그러나 TA의 서로 다른 유형 간의 근본적인 개념적 차이를 깨닫지 못하는 사람들이 그러한 도구들로 TA 연구 설계를 평가하려 할 위험이 있습니다(Hammersley, 2015). 따라서, 우리는 성찰적 TA를 사용하는 연구의 "정확한(correct)" 데이터 세트 크기를 결정하거나 상상하기 위해 이러한 통계적 도구 중 어떤 것도 사용하는 것을 권장하지 않는다는 점을+ 매우 분명히 하고자 합니다.

 

성찰적 TA에서 참여자 그룹/데이터 세트 크기 결정 및 정당화
(Determining and Justifying Participant Group/Data Set Size in Reflexive TA)
 

성찰적 TA에서 참여자 그룹/데이터 세트 크기를 정당화하는 실패 없는 방법(failsafe way)은 없습니다. 우리는 크기 결정을 어떤 이상화된 개념의 "일반화 가능성(generalizability)"에 근거하려는, 그리고 암묵적으로 '크면 클수록 좋다'는 생각과 통계적 일반화 가능성(statistical generalizability)이 모든 연구의 이상형이라는 생각에 "동조하는(buying into)" (후기)실증주의적 유혹((post)positivist temptation)을 피할 것을 권장합니다(단, 질적 연구에서 일반화 가능성이 어떻게 재구성될 수 있는지에 대한 중요한 논의는 Smith, 2017을 참조하십시오). 대신, (윤리 심사 등의 목적을 위해 데이터 분석에 앞서) 참여자 그룹/데이터 세트 크기를 추정하기 위한 개념적 모델로서, 우리는 Malterud 등(2016)의 정보력(information power) 개념이 유용하다고 봅니다. 이는 정밀한 계산이라기보다는, 연구자가 데이터 세트의 "정보적 풍부함(information richness)"과 그것이 연구의 목표 및 요구사항과 어떻게 맞물리는지를 성찰하도록 초대합니다—서로 다른 목적은 표본 크기에 대한 서로 다른 접근법을 요구합니다. 이러한 성찰을 사용하여, 다음과 같은 연구는:

  • 광범위한 목표(broad aim);
  • 비구체적이거나 적은 포함 기준(inclusion criteria);
  • 더 귀납적(inductive)이고 탐색적(exploratory)인 접근;
  • 각 참여자나 데이터 항목으로부터 생성된 더 얇은(thinner) 데이터;
  • 데이터 세트 전반(across)에 초점을 맞춘 분석; 그리고
  • 초심자 연구자(novice researcher)에 의해 수행되는 분석

일반적으로 적절한 정보력을 갖기 위해—즉, (질적으로) 의미 있는 무언가를 말할 수 있기 위해—더 큰 참여자 그룹/데이터 세트를 필요로 할 것입니다. 대조적으로, 더 좁은 목표, 더 구체적인 모집단/데이터 세트 초점, 아마도 더 연역적(deductive)인 접근, 그리고 "더 두터운(thicker)" 혹은 더 풍부한 개별 데이터 항목을 가진 연구는 일반적으로 더 적은 데이터 항목을 필요로 할 것입니다. 이러한 측면들은 독립적이고 합산적으로 작동하는 것이 아니라, 잠재적으로 상호작용하는(interacting) 것으로 보아야 합니다(Sim et al., 2018). 이는 데이터 수집 도중이나 친숙화(familiarization) 또는 코딩 이후와 같은 현장에서의(in situ) 데이터 세트 평가를 연구 시작 전의 명확한 결정보다 더 중요하게 만듭니다.

 

데이터 세트의 적절성을 생각할 때 유용할 수 있는 또 다른 개념은 "이론적 충분성(theoretical sufficiency)"입니다. 포화(saturation)를 이해의 완전성과 고정된 지점을 암시하는 "불행한 은유(unfortunate metaphor)"(p. 257)라고 묘사했던 근거 이론가 Ian Dey(1999)에 의해 개발된 이론적 충분성은, 연구자가 이론을 구축하기 위해 충분하거나 적절한 깊이의 이해에 도달했을 때 데이터 수집을 멈춘다는 개념을 포착하기 위한 것입니다. 이를 프레임화하는 유사한 방식으로는 "개념적 밀도(conceptual density)" 또는 "개념적 깊이(conceptual depth)"(Nelson, 2017)가 있습니다. "이론 구축(building theory)"이 목표인지 여부와 관계없이, 이러한 개념들은 의미-풍부함(meaning-richness)을 데이터 세트(의 크기) 타당성의 핵심으로 강조합니다. 우리에게 있어, 정보적 또는 의미적 충분성(informational or meaning sufficiency)은 TA에서 데이터 수집을 중단할 시점을 위한 유용한 개념으로 보이며, 이는 오직 성찰적으로(reflexively) 그리고 현장에서(in situ) 결정될 수 있는 것입니다.

 

데이터 수집에 앞서 참여자 그룹/데이터 세트 크기를 결정하는 것이 어렵다는 우리의 인정에도 불구하고, 기관생명윤리위원회(institutional review boards), 학위 위원회, 자금 지원 기관의 요구사항을 충족시키기 위해, 그리고 시간과 자원을 계획해야 하는 실질적인 필요 때문에, 참여자 그룹/데이터 세트 크기에 대한 어떤 지표(indication)를 제공해야 할 실용적 필요(pragmatic need)가 종종 존재합니다. 우리는 연구자들이 참여자 그룹/데이터 세트 크기 범위(size range)를 제공하고, 최종 크기는 데이터 수집 중이나 분석 과정의 초기 단계 후에 결정할 것을 제안합니다(학생 프로젝트를 위한 몇 가지 제안은 Braun & Clarke, 2013 참조).

TA 연구를 위한 윤리적 사고 (Thinking Ethically for TA Research) 

윤리(Ethics)는 모든 연구 설계 및 관행의 핵심 요건이며, 절차적(procedural)인 동시에(참여자와 관련하여 우리가 하는 일), 연구의 정치학, 연구자와 참여자 간의 권력 관계(power relationship), 그리고 연구자의 가치와 관련된 더 사회정치적(socio-political)인 것입니다. 연구 윤리는 미국심리학회(American Psychological Association, 2017)나 뉴질랜드심리학회(New Zealand Psychological Society, 2012)의 규정들과 같은 윤리 강령 내에 성문화(codified)되어 있으며, 기관의 윤리 심사를 통해 적용됩니다. 윤리적 지침은 특정 탐구 양식(modes of inquiry)(예: 온라인 연구; Association of Internet Researchers, 2012), 연구 참여자(예: 원주민 인구 [예: Smith, 2013] 또는 아동 [예: Shaw et al., 2011]), 또는 협력 조직(일부—특히 보건 및 의료 조직—는 자체적인 윤리 심사 절차와 요건을 가질 수 있음)과 관련하여 변경될 수 있습니다. 강조해야 할 핵심 사항은 윤리 강령이 최소한의 요건(minimal requirements)을 나타낸다는 점입니다. 영국심리학회(British Psychological Society, 2009)는 "생각하는 것은 선택 사항이 아니며(thinking is not optional)"(p. 5; 강조는 저자), "어떤 강령도 심리학자들이 자신의 전문적이고 윤리적인 판단을 사용해야 할 필요성을 대체할 수는 없다"(p. 4)고 언급했습니다.

 

분석적 접근법으로서의 TA 사용은 그 자체로(per se) 윤리적 논의를 거의 필요로 하지 않지만, 질적 연구 전반, 특히 질적 패러다임 내에서의 연구는 중요한 윤리적 고려사항들을 제기합니다. 질적 연구 맥락에서의 윤리 논의—데이터가 연구자에게 미치는 정서적 영향 포함—에 친숙해지는 것이 중요합니다(예: Brinkmann & Kvale, 2017; Denzin & Giardina, 2016; McClelland, 2017; Miller et al., 2012). 윤리에 대해 더 폭넓게 생각해보면, 질적 연구의 설계와 수행은 종종 차이(difference), 권력(power)(Karnieli-Miller et al., 2009) 및 통제의 문제, 그리고 우리가 참여자와 어떻게 관계 맺고 그들을 어떻게 재현(represent)하는지(Fine, 1992)와 같은 복잡하고 "모호한(fuzzy)" 윤리적 및 도덕적 고려사항들을 포함합니다. 이러한 고려사항 중 어느 것도 구체적으로 TA 연구만의 필수적인 특징은 아니지만, 우리는 TA 연구자들이 질적 연구와 연구 윤리에 대해 복잡하고 세련된 성찰적 접근(reflexive approach)을 추구할 것을 장려합니다. 특히 차이의 문제와 관련하여 참여자와 관계 맺고 재현하는 데 있어 모범 사례(best practice)를 예시하고, 진정으로 포용적(inclusive)이고, 문화적으로 민감(culturally sensitive)하며, 정치적으로 기민한(politically astute) 연구를 수행하기 위해서입니다.

품질 기준 및 관행 (Quality Standards and Practice) 

우리가 설계적 사고를 위해 마지막으로 고려하는 영역은 품질(quality)이며, 이는 개념적 사고와 깊이 교차하며 논의를 다시 그곳으로 되돌립니다. 우리가 여기서 논의하는 품질 보증 전략들은 Big Q 질적 패러다임의 이론적 가정과 가치들(Braun & Clarke, 2013)에 의해 정보를 얻으며, 코딩이나 주제 식별의 "정확성(accuracy)"을 결정하기보다는 성찰(reflection), 엄격함(rigor), 체계적이고 철저한 접근, 그리고 훨씬 더 깊은 참여의 깊이(depth of engagement)를 장려하는 데 초점을 맞춥니다.

 

품질에 대한 판단은 과정(process)결과(outcome) 모두와 관련됩니다. 우리는 연구자들이 연구 설계에 통합하는 품질 관행(quality practices)과, 연구자들이 준수하려고 노력하며 검토자, 편집자, 심사위원이 질적 연구의 품질을 평가하는 데 사용하는 품질 기준(quality standards) 및 척도 모두에 초점을 맞춥니다. 흔히 모든 형태의 질적 연구에 적용되는 보편적 품질 기준(universal quality criteria)이 있다고 가정됩니다—우리는 앞서 코딩 신뢰도 척도가 모든 형태의 TA에 관련이 있다는 문제가 있는 가정에 대해 언급했습니다. 이러한 가정은 전형적으로 질적 연구를 주관적 경험의 연구와 동일시하는 (제한된) 개념화와 (후기)실증주의적 연구 가치에 의해 뒷받침됩니다. 예를 들어, 많은 품질 기준과 표준은 신뢰성(credibility) 확인의 한 형태로 "참여자 검토(member checking)" 또는 "참여자 타당성 검증(participant validation)"을 포함합니다(예: Elliott et al., 1999; Morrow, 2005). 어떤 경우에는 이 품질 관행이 모든 형태의 질적 연구와 개념적으로 일관되지 않다는 인정 없이(Reicher, 2000), 또는 이 관행을 실행하는 데 따르는 실질적이고 실용적인 어려움에 대한 고려 없이(Braun & Clarke, 2013) 그렇게 합니다. 따라서 품질 관행과 기준은 개념적 사고를 필요로 하는 연구 설계의 또 다른 측면입니다—연구자들은 특정 표준과 관행에 내재된 이론적 가정(theoretical assumptions)을 성찰하여 그것들이 자신의 연구 설계 및 성찰적 TA 사용과 일관성이 있는지 결정해야 합니다.

 

비록 이러한 품질 기준 중 일부 측면이 성찰적 TA에 잘 번역되지 않거나 전혀 번역되지 않더라도, 그럼에도 불구하고 우리는 Elliott 등(1999)의 체크리스트 기준(checklist-criteria) 출판 가능성 지침, 광범위한 질적 연구 방법 및 접근법에 적용되도록 의도된 Yardley(2015)의 훨씬 더 느슨하고 유연한 원칙(flexible principles), Tracy(2010)의 8가지 "빅 텐트(big tent)" 유연한 기준, 그리고 APA 저널 보고 표준(Levitt et al., 2018)이 유용하다고 생각합니다. 성찰적 TA—그리고 사실 더 넓은 의미의 질적 연구—에 있어 그러한 "기준"들은 경직된 방식으로 적용되도록 설계된 것이 아니라, 품질에 대해 일반적으로 생각하고 특정 성찰적 TA 연구에 적용되어야 할 적절한 품질 기준에 대해 생각하기 위한, 재해석이 가능한 유연한 자원(flexible resources)으로 설계되었습니다(Sparkes & Smith, 2009). 다른 곳에서, 우리는 연구자들이 자신의 성찰적 TA 관행의 품질과 엄격함을 성찰할 수 있는 15개 항목의 체크리스트(Braun & Clarke, 2006)와, 출판을 위해 성찰적 TA 연구를 평가하는 검토자 및 편집자를 위한 지침(Braun & Clarke, 2020)을 제공했습니다.

 

성찰적 TA를 위해, 우리는 연구 과정 전반에 걸친 깊이 있고, 참여적이며, 비판적으로 열려 있는 성찰성(reflexivity)의 중요성을 강조합니다. 연구자가 다음을 성찰하고, 이해하려고 노력하며, 심문하는 것의 중요성 말입니다:

 

  • 자신의 가치와 개인적 위치(personal positioning);
  • 연구 주제에 대한 자신의 가정과 기대;
  • 그리고 (참여자가 있는 설계의 경우) 참여자에 대한, 그리고 참여자와의 관계(Wilkinson, 1988은 이를 개인적 성찰성[personal reflexivity]이라 칭함);
  • 자신의 설계 및 방법론적 선택(기능적 성찰성[functional reflexivity]); 그리고
  • 자신의 학문적 위치와 관점(학문적 성찰성[disciplinary reflexivity]).

 

그리고 실제로 이 모든 것들이 연구 과정 및 생산된 지식과 어떻게 교차하고, 그것을 형성하는지에 대해서도 성찰해야 합니다. 더 정치적으로 지향된 연구에서는, 연구의 권력 역학(power dynamics)을 강조하는 성찰성의 개념화 또한 중요합니다(예: Ramazanoğlu & Holland, 2002). 우리에게 있어 성찰성은 (Big Q) 연구 관행의 맞물린(meshed-in) 모드로 개념화하는 것이 가장 좋습니다; 이것이 낯설다면, 접근하기 쉬운 출발점으로 Finlay와 Gough(2003)를, 성찰적 TA를 수행할 때의 예시로 Trainor와 Bundon(2020)을 참조하십시오.

 

연구자 성찰성(Researcher reflexivity)은 많은 품질 기준과 척도에서 강조됩니다—예를 들어 Elliott 등(1999)은 출판 가능성 지침에 "자신의 관점 소유하기(owning one’s perspective)"를 포함시켜, 연구자들이 자신의 이론적 지향과 개인적 기대를 명시할 필요성을 강조했습니다. 성찰성의 불완전성(incompleteness)—완전한 통찰은 거의 불가능함—과 우리 관점의 다양성(multiplicity)을 인정하며, 우리는 이것을 연구자가 자신의 관점을 "소유(own)"하려고(인정하고 책임을 진다는 의미에서) 노력하는 것으로 재구성합니다. 이러한 성찰 중 일부는 이상적으로 연구 보고서에 포함되어, 독자에게 연구 맥락의 일부 측면을 가시화해야 합니다. 그러나 우리는 다른 이들(Levitt et al., 2018)과 마찬가지로, 저널의 엄격한 단어 수 제한이 질적 연구의 보고를 다양한 방식으로 제약하며, 성찰성이 종종 그러한 제한 내에 머물기 위해 "희생(sacrificed)"되는 것임을 인식합니다. 성찰성은 또한 텍스트 안으로 개별 연구자의 목소리를 가져오기 때문에, "과학적(scientific)" 글쓰기 관행에 교육받은 이들에게는 문체적으로 대면하기 힘든 것일 수 있습니다.

 

우리가 강력히 권장하는 하나의 품질 관행은 연구 과정 전반에 걸쳐 연구자의 성찰과 통찰을 기록하기 위한 성찰 일지(reflexive journal)를 유지하는 것이며, 또한 글쓰기 관행 자체를 성찰성을 심화시키는 도구로 사용하는 것입니다. 논의된 바와 같이, 품질 관행에 대한 관심은 성찰적 TA 과정 전반에 내재되어 있습니다—유기적이고 개방적인 코딩, 주제 검토 및 정교화, 그리고 분석 단계들의 순환성(recursivity)과 같은 절차들은, 연구자로 하여금 피상적이고 뻔한 것을 넘어서는 의미 있고 유용한 분석을 생산하기 위해 데이터와의 장기적이고 깊은 참여(prolonged and deep engagement)가 필요함을 민감하게 인식하도록 의도된 것입니다.

 

성찰적 TA 보고를 위한 모범 사례 (Best Practice for Reporting Reflexive TA) 

성찰적 TA의 품질에 대한 논의를 돕기 위해, 우리는 이제 성찰적 TA 보고를 위한 모범 사례에 대해 간략히 논의합니다. 이것은 연구자가 개념적 및 설계적 사고의 관행에 철저히 참여한 성찰적 TA 연구가 이상적으로 어떻게 보고되어야 하는지를 포착합니다.<sup>14</sup> 우리의 목표는 다음을 지원하는 것입니다: (a) 연구자들이 최고 수준의 성찰적 TA 서면 보고서를 생산하는 것; 그리고 (b) 검토자, 편집자, 심사위원들이 성찰적 TA 서면 보고서를 적절하게 평가하는 것. 전반적으로, 우리는 방법론 섹션에서 일인칭을 사용하는 것과 같이 개별 연구자의 "목소리(voice)"를 텍스트로 가져오는 글쓰기 스타일을 권장합니다. 이 섹션의 목적을 위해, 우리는 주장된 개념적 또는 다른 입장들이 실제 보고된 관행 및 분석과 일치한다고 가정합니다.

<sup>14</sup> 적어도 현재의 맥락에서, 이러한 모범 사례 지침들은 부분적으로 열망적인(aspirational) 것으로 남아 있습니다. 이것들은 (후기)실증주의적 규범과 가치를 지향하는 더 넓은 학계의 수용된 보고 기준들과 여러 면에서 차이가 있습니다(Levitt et al., 2018 참조). 

서론 (Introduction) 

논문의 서론 섹션은 기존 연구, 관련 이론, 그리고 더 넓은 맥락(예: 사회적, 문화적, 정책적, 정치적, 미디어, 그리고 건강)을 참조하여 연구에 대한 맥락화(contextualization)와 정당성(rationale)을 제공해야 하며, 전통적인 문헌 고찰(literature review)을 포함할 수도 있고 포함하지 않을 수도 있습니다. 기존 문헌을 종합하는 목적은 반드시 지식의 "격차(gaps)"를 식별하는 것이 아니라, 현재 연구를 맥락화하는 것입니다; 이러한 이유로 우리는 섹션 제목이 필요한 경우 문헌 고찰보다는 서론을 권장합니다. 성찰적 TA에 적절한 연구 질문(Research question)은 명확하게 표현되어야 하며, 분석에서 보고된 TA의 형태와 개념적으로 일치해야 합니다(초기의 더 광범위한 연구 질문을 정교화하는 과정을 논의하는 것이 유용할 수 있습니다).

방법론 (Methodology) 

우리는 연구 과정에 대한 이론적으로 내재되고 성찰적인 설명을 신호하기 위해 방법(method)보다는 방법론(methodology)이라는 제목을 선호합니다.

 

  • 연구의 개념적 기반(conceptual underpinnings)존재론적(ontological)인식론적(epistemological) 가정; 데이터 분석에 정보를 제공하는 방법론적(methodological), 설명적(explanatory), 그리고 정치적/이데올로기적(political/ideological) 이론—은 명확하게 식별되어야 하며, 이론이 어떻게 데이터 분석에 정보를 제공했는지 논의되어야 합니다.
  • 성찰적 TA에 대한 구체적인 지향—귀납적(inductive)<>연역적(deductive); 의미적(semantic)<>잠재적(latent) 의미—은 명시적이어야 하며, 일반적이라기보다는 위치지어진(situated) 방식, 즉 프로젝트에 구체적인 방식으로 설명되어야 합니다.
  • 성찰성(Reflexivity)은 글쓰기 스타일, 과정 전반에 걸친 성찰적 관행(예: 일지 작성)에 대한 논의, 그리고 적절한 경우 주제 및 참여자와 관련한 연구자의 개인적 위치(personal positioning)에 대한 고려를 통해 분명히 드러나야 합니다(Trainor & Bundon, 2020 참조). 후자는 재현(representation)을 둘러싼 것을 포함하여 더 넓은 질적 연구 윤리(ethics)<sup>15</sup>와 연결됩니다.
  • 참여자 그룹/데이터 세트는 명확하고 풍부하게 위치지어져야 하며(익명성을 훼손하지 않으면서), 참여자 그룹/데이터 세트의 구성과 크기에 대한 약간의 설명 및 정당성이 제공되어야 합니다—포화(saturation)나 통계적 모델(statistical models)에 대한 언급 없이 말입니다(Braun & Clarke, 2019b 참조).
  • 적절한 경우, 방법/데이터 출처의 선택이 연구 과정과 생산된 지식을 어떻게 형성했는지가 고려될 수 있습니다. 분석 과정은 일반적인 방식이 아닌 위치지어진(situated) 구체적인 방식으로, 그리고 최신 용어를 사용하여 기술되어야 합니다(Braun & Clarke, 2019a 참조).
  • 성찰적 TA 과정에 적합한 다양한 품질 조치들(예: 주제 검토 및 정교화)이 어떻게 실행되었는지 포함되어야 합니다. 저자가 한 명 이상인 경우, 각 저자가 분석에 어떻게 기여했는지 논의되어야 합니다.
15 윤리적 논의는 공식적인 심사 절차와 같은 더 표준적인 학문적 절차들도 포함할 것입니다.

 

 

분석 (Analysis) 

결과/발견(results/findings) 섹션에 대해 우리가 현재 선호하는 제목은 분석(analysis)입니다. 왜냐하면 그것이 발견(discovery)과 종결성(finality)을 모두 환기시키는 것을 피하기 때문입니다. 이 섹션은—주제 보고 시 분석적 관찰들이 기존 연구 및 이론과 관련하여 맥락화된다는 의미에서 종종 논의(discussion)를 포함하는데—앞으로 나올 분석에 대한 간략한 개요(그림이나 표, 또는 단순한 설명이나 목록; 주제 간의 관계를 전달하는 데 사용될 수도 있음)로 시작해야 합니다. 분석적 서사(analytic narrative)는 데이터의 의미와 중요성을 설명해야 하며, 데이터의 바꿔쓰기(paraphrasing)와 데이터와 "언쟁하는 것(arguing with)" 모두를 피해야 합니다. 주제 빈도 수(Theme frequency counts)는 피해야 하며, 특히 분석적 내용과 구조에 대한 근거로 사용해서는 안 됩니다. 성찰적 TA는 빈도를 중요성과 동일시하지 않기 때문입니다. 다수의 참여자가 연구 질문과 관련 없는 것을 말하거나 쓸 수 있는 반면, 소수의 참여자는 결정적인 것을 말하거나 쓸 수 있습니다. 게다가 질적 데이터의 정량화(quantification)는, 심지어 단순한 빈도 수의 형태일지라도, 종종 간단하지 않습니다. 왜냐하면 데이터 수집이 전형적으로 참여자나 데이터 항목 전반에 걸쳐 정밀한 비교 가능성을 갖추고 엄격하게 구조화되거나 체계화되어 있지 않기 때문입니다.

 

주제들은 데이터에 대한 일관성 있는 전반적인 "이야기(story)"를 형성해야 하며, 전반적인 이야기를 가장 잘 전달하는 순서로 제시되어야 합니다.

 

  • 우리는 일반적으로 단일 보고서에서 2~6개의 주제(하위 주제 포함)를 논의할 것을 권장합니다; 더 많은 주제는 저개발된 분석(underdeveloped analysis)을 시사합니다.
  • 하위 주제(subthemes)를 신중하게 사용하십시오; 지나치게 정교한 주제 구조 또한 마찬가지로 저개발을 시사합니다(Connelly & Peltzer, 2016 참조). 각 주제는 풍부하고, 복잡하며, 다면적(multifaceted)이어야 하며(즉, 하나 이상의 분석적 관찰로 구성됨), 뚜렷한 핵심 의미(core meaning) 또는 중심 조직화 개념(central organizing concept)을 가져야 합니다(주제는 토픽 요약[topic summaries]이어서는 안 됩니다).
  • 주제 간의 중첩(경계 흐림)은 거의 없거나 없어야 합니다. 각 주제의 이름은 각 주제의 "본질(essence)"을 전달해야 합니다;
  • 한 단어 이름은 피해야 합니다. 각 주제에 대한 상세한 논의는 데이터 추출물(data extracts)이 더 예시적으로 사용되든 분석적으로 사용되든 관계없이, 데이터 추출물과 분석적 서사(해석)의 균형을 포함해야 합니다.<sup>16</sup>
  • 생생하고 설득력 있는 데이터 추출물은 패턴화를 입증하기 위해 데이터 세트 전반에서 추출되어야 합니다; 제시된 데이터 추출물은 분석적 주장에 "부합(fit)"(또는 "증거가 됨[evidence]")해야 합니다. 표에 데이터 추출물을 제시하는 것은 피해야 합니다.
 16 데이터의 분석적 사용은 데이터 추출물이 분석적 관찰을 예시하기 위해 더 일반적으로 사용되는 것이 아니라, 특정 데이터 추출물의 구체적인 특징에 대한 상세한 분석을 포함합니다(Braun & Clarke, 2013 참조).

 

결론 (Conclusion) 

마지막 결론(또는 때로는 논의) 섹션에서, 분석적 결론과 함의는 주제들로부터 발생하거나 주제들을 가로질러야 하며, 주제 그 자체가 분석적 결론은 아님을 반영해야 합니다—주제별(theme-by-theme) 맥락화는 피해야 합니다(이는 종종 결과와 논의가 결합되었어야 함을 나타내는 신호입니다). 이 섹션은 또한 설계 선택이 생산된 지식을 어떻게 형성(하고 아마도 제한)했는지에 대한 평가적 성찰(evaluative reflection)을 포함해야 하며, 연구의 한계와 전반적인 분석에 대한 더 넓은 성찰도 포함해야 합니다; 통계적 확률적 일반화 가능성(probabilistic generalisability)의 결여에 대한 주장은 피해야 합니다.

요약 (Summary) 

이 논문에서, 우리는 TA가 단일한 이론적 토대를 가진 단일한 접근법이 아님을 강조했습니다; 우리는 TA의 세 가지 다른 학파를 개괄하고 성찰적 TA(reflexive TA)에 초점을 맞췄습니다. 건전한 성찰적 TA 관행은 연구의 개념적 토대에 대한 깊은 사고와 효과적인 계획—우리가 개념적 및 설계적 사고(conceptual and design thinking)라고 칭하는 과정—에 달려 있습니다. 구체적으로, 우리는 성찰적 TA가 데이터를 분석하는 데 사용되는 질적 프로젝트를 구성하는 다양한 측면들에서 일관성(coherence) 또는 적합성(fit)의 중요성을 강조했습니다; 이러한 요소들을 고려하는 것은 방법론적 무결성(methodological integrity)(Levitt et al., 2018)으로 특징지어지는 TA 연구를 생산하는 데 도움이 될 것입니다. 성찰적 TA의 유연성을 감안하여, 우리는 이것이 다룰 수 있는 다양한 유형의 연구 질문, 작업할 수 있는 다양한 데이터 유형을 언급했으며, 데이터 세트 구성 및 크기와 관련된 문제들을 논의했습니다. 특히, 우리는 TA 데이터 세트 크기의 근거로서 (주장된) 데이터 포화(data saturation)의 만연한 사용과, 분석에 앞서 데이터 세트 크기를 결정하기 위한 통계적 모델(statistical models)의 사용을 비판적으로 논의했습니다. 대신, 우리는 참여자 그룹/데이터 세트 크기에 대한 결정의 핵심으로서 데이터의 정보적 풍부함(information richness)에 대해 비판적이고 성찰적으로, 그리고 위치지어진 방식(located way)으로 생각하는 것을 강조했습니다. 우리는 또한 윤리성(ethicality)의 중요성과, 양질의 관행을 돕기 위한 성찰적 일지 작성(reflexive journaling)의 사용을 언급했습니다.


 

 

 

How do you solve a problem like COREQ? A critique of Tong et al.’s (2007) Consolidated Criteria for Reporting Qualitative Research

Palliat Med. 2024 Jun;38(6):608-616. doi: 10.1177/02692163241234800. Epub 2024 Mar 12.

Supporting best practice in reflexive thematic analysis reporting in Palliative Medicine: A review of published research and introduction to the Reflexive Thematic Analysis Reporting Guidelines (RTARG)

 

 

안녕하세요, 연구자 여러분! 🎓 혹시 질적 연구(Qualitative Research)를 진행하면서 주제 분석(Thematic Analysis)을 사용해 보신 적 있나요? 아마 많은 분들이 Braun & Clarke의 방법론을 참고하셨을 텐데요. 오늘은 바로 그 Braun과 Clarke 연구팀이 Palliative Medicine 저널에 게재한 아주 중요한 논문을 소개해 드리려고 합니다. 많은 연구자가 주제 분석을 사용하지만, '방법론적 비일관성(Methodological Incoherence)'이라는 함정에 빠지곤 합니다. 이 논문은 그 문제점을 꼬집고, 새로운 해결책인 RTARG를 제시하고 있어요.

핵심 내용을 쏙쏙 뽑아 정리해 드릴게요! 📝


1. 주제 분석은 '하나의 방법'이 아닙니다 ☝️

흔히 주제 분석을 단일한 레시피처럼 생각하기 쉽습니다. 하지만 저자들은 주제 분석이 하나의 '가족(Family)'과 같다고 말합니다.

"주제 분석은 질적 자료에서 주제를 개발하고 보고하는 데 초점을 맞춘 방법론적 계열(family of methods)로 개념화하는 것이 가장 적절합니다."

(Thematic analysis is best conceptualised as a family of methods that are focussed on developing and reporting themes from qualitative data.)

크게 두 가지로 나뉩니다:

  • 과학적으로 기술적인(Scientifically descriptive) 접근: 코딩의 신뢰성(Reliability)과 정확성을 중시 (일명 'Small q').
  • 예술적으로 해석적인(Artfully interpretative) 접근: 연구자의 주관성과 성찰성을 수용 (일명 'Big Q').

우리가 흔히 말하는 '성찰적 주제 분석(Reflexive Thematic Analysis)'은 후자인 'Big Q'에 해당해요. 이 둘을 섞어 쓰면 탈이 납니다! 🤢

2. '방법론적 비일관성'을 주의하세요! 🚫

논문에서 지적한 가장 큰 문제는 연구의 철학과 실제 수행 방식이 따로 노는 방법론적 비일관성(Methodological Incoherence)입니다. 예를 들어, "주관성을 중시하는 성찰적 주제 분석을 한다"고 해놓고, 실증주의적 개념인 '연구자 편향(Bias)'을 제거하려 하거나 '코더 간 일치도'를 구하는 것은 모순이라는 거죠.

"요소들이 (인정이나 논의 없이) 정렬되지 않을 때 비일관성(incoherence)이 드러납니다."

(Incoherence is evident when elements are misaligned (without acknowledgement or discussion).)

"우리의 입장은 종합과 합의를 통해 체크리스트를 개발하는 것은 무지한 상태에서 방법론적 비일관성을 초래하고 조장하는 품질 및 보고 표준을 낳을 수 있다는 것입니다."

(Our position is that developing checklists through synthesis and consensus can result in quality and reporting standards that unknowingly invite and encourage methodological incoherence.)

 

그래서 저자들은 기존의 COREQSRQR 같은 체크리스트가 성찰적 주제 분석과는 맞지 않을 수 있다고 경고합니다. 😲

3. 주제(Theme)는 '요약'이 아니라 '공유된 의미'입니다 💎

많은 연구자가 인터뷰 질문별로 답변을 요약해놓고 그걸 '주제'라고 부릅니다(예: '의사소통의 장벽'). 하지만 저자들은 이것을 화제 요약(Topic summaries)이라고 부르며, 진정한 주제가 아니라고 말합니다.

진정한 성찰적 주제 분석에서의 주제는 무엇일까요?

"주제는 중심 개념이나 아이디어를 중심으로 조직된 공유된 의미(shared meaning)의 패턴으로 개념화됩니다."

(Themes are conceptualised as patterns of shared meaning, organised around a central concept or idea.)

 

주제는 데이터 속에 숨겨진 다이아몬드처럼 '발견(Find)'되는 게 아니라, 연구자가 치열한 고민을 통해 '생성(Generate)'하고 만들어내는 것입니다. 🔨

4. 새로운 가이드라인: RTARG의 등장 🎉

그래서 연구진은 기존 체크리스트를 대체할 새로운 기준을 제시했습니다. 바로 성찰적 주제 분석 보고 지침(Reflexive Thematic Analysis Reporting Guidelines, RTARG)입니다! 이 지침은 엄격한 '숙제 검사표'가 아니라, 연구자가 자신의 연구 가치(Values)에 맞춰 일관성 있게 보고했는지 스스로 점검하게 도와주는 나침반입니다.

"RTARG는 체크리스트가 아니라 지침을 제공하는데, 모든 항목이 특정 연구/보고서에 관련되지는 않을 것이며 – RTARG 사용 주변에는 유연성이 필요하기 때문입니다."

(RTARG offers guidelines and not a checklist, as not every item will be relevant to a particular study/report – and there needs to be flexibility around the use of the RTARG.)


💡 마치며: 연구자의 '성찰'이 답이다

결국 중요한 것은 어떤 도구를 쓰느냐보다, 연구자인 '나'의 관점을 명확히 하고 그것을 끝까지 일관성 있게 밀고 나가는 '성찰적 개방성(Reflexive Openness)'입니다. 여러분의 연구가 단순한 '데이터 요약'을 넘어, 깊이 있는 통찰을 주는 '이야기'가 되기를 응원합니다! 🙌

만약 성찰적 주제 분석을 준비 중이라면, 더 이상 COREQ에 맞추려 애쓰지 말고 RTARG를 참고해 보세요!

 


주제에 대해 이미 알려진 사실은 무엇인가? (What is already known about the topic?)

 

  • 성찰적 주제 분석(Reflexive thematic analysis)은 보건 연구의 질적 자료(qualitative data)에서 주제를 도출하기 위해 널리 사용된다.
  • Braun과 Clarke는 출판된 주제 분석 연구 전반에서 나타나는 공통적인 문제점들을 확인했다. 여기에는 주제 분석을 방법론적 계열(family of methods)이 아닌 단일한 접근법으로 가정하는 것, 주제(theme)와 화제(topic)를 혼동하는 것, 그리고 분석 절차를 뒷받침하고 입증하는 이론적 토대 없이(또는 필요 없다고 여기며) 성찰적 주제 분석을 단순한 기법처럼 다루고 보고하는 것 등이 포함된다.1

 

이 논문이 더하는 가치는 무엇인가? (What this paper adds?)

 

  • 2014년부터 2022년 사이 Palliative Medicine에 출판되었으며 Braun과 Clarke를 인용한 20편의 논문에 대한 해석적 고찰(interpretative review).
  • 공통적인 문제점과 모범 사례(good practice) 영역의 확인.
  • 공통된 문제점을 두 가지 영역으로 분류:
    • (1) 보고에 있어서 명확성, 성찰적 개방성(reflexive openness), 그리고 세부 사항의 부족;
    • (2) 연구 가치, 방법론적 관행, 질적 기준, 개념 및 언어가 일치하지 않는 방법론적으로 비일관적인 보고(methodologically incoherent reporting).
  • 새로운 성찰적 주제 분석 보고 지침(Reflexive Thematic Analysis Reporting Guidelines, RTARG) 제안 – COREQ 및 SRQR과 관련하여 개발되었으나 성찰적 주제 분석의 가치에 기반을 두었으며, 방법론적 일관성과 성찰적 개방성을 갖춘 성찰적 주제 분석 보고를 위한 지침을 제공함.
  • 성찰적 주제 분석을 보고할 때 COREQ나 SRQR 대신 RTARG를 사용할 것을 권고함.

 

 

실무, 이론 또는 정책에 대한 시사점 (Implications for practice, theory or policy)

 

  • 질적 연구자들은 주제 분석이라는 방법론적 계열 내에 존재하는 이론적 가정(theoretical assumptions)과 절차적 관행의 다양성을 이해해야 한다.
  • 질적 연구자들은 자신의 연구 가치를 성찰하고, 이와 부합하는(coheres) 주제 분석 접근법을 선택해야 한다.
  • 질적 연구자들은 자신의 주제 분석 접근법과 부합하는 보고 체크리스트, 기준 또는 지침을 사용해야 한다 – 성찰적 주제 분석의 경우 RTARG.

 


배경 (Background)

 

보건 연구자들은 질적 자료를 분석하기 위한 수많은 기법에 접근할 수 있으며, 그중 주제 분석(thematic analysis)은 가장 널리 사용되는 방법 중 하나가 되었다. '주제 분석'이라는 용어는 단일한 방법을 연상시키지만, 주제 분석은 질적 자료에서 주제를 개발하고 보고하는 데 초점을 맞춘 방법론적 계열(family of methods)로 개념화하는 것이 가장 적절하다.

 

  • 이러한 방법들은 일반적으로 코딩 및 주제 개발 절차를 포함하며,
  • 자료에 기반한 귀납적 분석(inductive analyses)과 기존 이론에 의해 유도되는 연역적 분석(deductive analyses)을 모두 허용할 뿐만 아니라,
  • 의미론적(semantic, 표면적, 명백한, 명시적) 의미와 잠재적(latent, 기저에 깔린, 가정된, 암묵적) 의미를 위한 데이터 코딩 또한 가능하다.
  • 게다가 주제 분석은 대부분의 다른 질적 분석 접근법(예: 근거 이론(grounded theory), 해석학적 현상학적 분석(interpretative phenomenological analysis), 내러티브 분석(narrative analysis))과 같이 이론적으로 정보를 갖추고 경계가 정해진 방법론이라기보다는, 어느 정도의 이론적 및 설계적 유연성을 가진 기법(technique)에 가까운 것으로 통상 이해된다.

 

그러나 주제 분석의 다양한 버전들과 기저에 깔린 연구 가치들 사이에는 코딩 및 주제 개발 절차가 개념화되고 실행되는 방식에 있어 상당한 차이(significant divergences)가 있음을 인식하는 것이 중요하다. 이러한 다양성을 매핑하고 이해하는 데 유용한 구분은 Finlay가 제시한 '과학적으로 기술적인(scientifically descriptive)' 접근법과 '예술적으로 해석적인(artfully interpretative)' 접근법 사이의 경계 설정이다.2

 

과학적으로 기술적인(Scientifically descriptive) 접근법

 

  • ([후기]실증주의([post]positivist) 논리에 기반한) 과학적 연구 가치를 우선시하며, 이는 코딩의 신뢰성(reliability)이나 정확성을 보장하려는 관행을 통해 명백히 드러난다.
  • 이러한 관행에는 분석 과정의 초기 또는 이전에 개발된 코드북(code book)이나 코딩 프레임(coding frame)을 포함하는 구조화된 코딩 과정의 사용, 그리고 독립적으로 작업하는 다수의 코딩자가 이 코딩 프레임을 데이터에 적용하는 것이 포함된다.
  • 코딩자들은 코딩 프레임을 사용하여 데이터를 미리 결정된 '주제'에 할당한다. 그 후 코딩자 간의 '일치(agreement)' 수준이 통계적 테스트를 통해 계산되며, 높은 일치도는 코딩이 신뢰할 만하다는 것을 나타내는 것으로 간주된다.
  • 분석이 참여자의 경험을 정확하고 충실하게 표현했는지 참여자에게 확인을 요청하는 것(참여자 검증) 또한 신뢰성(trustworthiness)과 타당성(credibility)을 보장하기 위해 사용된다.

 

 

대조적으로, 예술적으로 해석적인(artfully interpretative) 접근법

 

  • (비실증주의 논리에 기반)은 코딩의 내재적 주관성(subjectivity)을 인정하고 수용(embrace)한다. 양질의 관행은 연구자가 데이터에 깊이 관여하고 성찰성(reflexivity)을 발휘함에 따라 반응하는 유기적이고 유연한 코딩 접근법을 통해 입증된다.
  • 이 접근법은 연구자가 자신의 가정과 위치성(positioning), 그리고 이것들이 어떻게 이해를 형성하고 제한할 수 있는지에 대해 질문할 가능성을 내포하며, 따라서 코딩은 과정 중에 진화할 수 있다.
  • 주제는 코딩으로부터 그리고 코딩을 통해 개발되므로, 연구자는 '주제를 찾기 위해 코딩(code for themes)'할 수 없다.
  • 참여자 검증(Participant validation)은 예술적으로 해석적인 주제 분석과 부합하지 않는데, 이는 분석의 '정확성'을 판단할 수 있는 외부적 참조점이 존재할 가능성을 가정하기 때문이다.3 더 적절한 것은 구성원 성찰(member reflections)4이라는 개념과 관행이며, 이는 상세한 설명과 추가적인 통찰을 위한 기회를 창출한다.

 

우리는 2006년에 처음으로 예술적으로 해석적인 주제 분석 접근법을 개발했는데, 이는 대부분의 주제 분석 접근법이 '소문자 q(small q)'였던 당시에 질적 연구자들에게 비실증주의적 또는 '대문자 Q(Big Q)' 대안을 제공하기 위함이었다. 소문자 q/대문자 Q의 구분은 Finlay의 과학적으로 기술적인 구분과 예술적으로 해석적인 구분과 대체로 일치한다.5

 

  • 대문자 Q 질적연구(Big Q Qualitative)는 뚜렷하게 질적 연구 가치 또는 패러다임(예: 구성주의적(constructivist)해석주의적(interpretative))에 의해 뒷받침되고 형성되는 질적 자료 생성 및 분석 기법의 사용을 포함하며, 이는 연구자의 주관성을 연구를 위한 자원으로 수용하고 지식을 상황적이고 부분적인 것으로 본다.6
  • 소문자 q 질적연구(Small q qualitative)는 질적 연구를 질적 자료의 수집과 분석으로 정의하며, 대개 암묵적일지라도 빈번하게 (후기)실증주의에 의해 인도된다.

 

돌이켜보면, 우리는 주제 분석에 대한 뚜렷한 대문자 Q 접근법을 제공하려는 목표를 더 명시적으로 설명하고, 우리의 접근법을 다른 접근법과 더 명확하게 구분했어야 했음을 깨닫는다. 이것이 바로 우리가 이제 우리의 접근법을 성찰적 주제 분석(reflexive thematic analysis)이라고 부르는 이유이다. 그렇게 하지 못한 것이 의심할 여지 없이 성찰적 주제 분석에 대한 오해와 오용에 기여했음을 인식하고, 질적 연구자들이 고품질의 (성찰적) 주제 분석을 수행하고 출판하도록 지원하려는 목표와 결합되어, 우리는 우리의 접근법에 대한 더 깊은 성찰과 정교화, 그리고 재천명을 하게 되었다.6 이 과정에서 우리는 일반적인 주제 분석 출판물에서의 공통적인 문제점들1 – 예를 들어 주제 분석을 방법론적 계열이 아닌 단일한 접근법으로 가정하는 것, 주제 분석을 마치 이론과 무관한 것처럼 다루고 보고하는 것, 주제와 화제(topics), 주제와 코드(codes)를 혼동하는 것 등 – 을 이해하기 위해 출판된 연구 '표본'들을 해석적으로 검토(interpretatively reviewed)했으며, 주제 분석이 건강 심리학6과 같은 특정 분야나 특정 저널7에서 어떻게 적용되었는지 탐구했다. 또한 우리는 리뷰어와 편집자, 그리고 저자들이 고품질의 주제 분석을 출판할 수 있도록 지원하는 지침을 개발했다.1,8

 

목적 (Purpose)

 

완화 치료 분야에서의 성찰적 주제 분석 연구 및 보고의 좋은 관행을 지원하기 위해,6,9 우리는 이러한 실천을 지속한다. 본 논문에서 우리는 Palliative Medicine에 출판되었으며 Braun과 Clarke를 인용한 20편의 논문에 대한 해석적 고찰을 제공하고, 새롭게 개발된 성찰적 주제 분석 보고 지침(Reflexive Thematic Analysis Reporting Guidelines, RTARG)을 제시한다. 이 지침은 성찰적 주제 분석을 보고하는 데 있어 좋은 관행을 지원하지 못하는 기존의 체크리스트들 – 예를 들어 COREQ10 및 SRQR11 – 을 대체하기 위한 것이다. 본 고찰의 목표는 해당 저널의 성찰적 주제 분석 보고에 대한 '최신 현황(state-of-the-art)'을 이해하고 고찰하며, 비실증주의자 또는 대문자 Q 질적 연구자로서의 우리의 입장에서 문제적인 관행과 좋은 관행의 패턴을 확인하는 것이었다.5

 

  • 우리는 저널 웹페이지의 검색 기능, 검색어 'thematic analysis', 기본 설정인 '관련성(relevance)'을 사용하여 논문을 식별했다. 우리는 Braun과 Clarke의 주제 분석 출처를 인용한 상위 20편의 논문을 선정했다 – 대부분은 우리가 처음 접근법을 개요한 2006년 논문9이었으나, 몇몇 더 최근에 출판된 논문들은 우리가 왜 우리의 접근법을 이제 성찰적(reflexive) 주제 분석이라고 지칭하는지 설명했던 Braun과 Clarke의 문헌12을 (또한) 인용했다. 우리는 Braun과 Clarke의 접근법을 '따른다(follow)'거나 '사용한다(use)'고 주장하는 것보다는 단순히 Braun과 Clarke를 인용하는 것을 기준으로 선택했다.
  • 이전의 검토들7,13은 인용이나 분석 접근법에 대한 설명만으로는 어떤 기존 접근법을 따랐는지(만약 따랐다면) 식별하기가 매우 어렵다는 것을 증명했으며, 또한 저자들이 Braun과 Clarke를 '따른다'고 주장하면서도 성찰적 주제 분석과는 거의 또는 전혀 닮지 않은 분석 접근법을 기술하는 것이 흔하다는 것을 보여주었다.
  • 이러한 모호함 때문에, 본 논문에서 우리는 때로는 일반적인 주제 분석을 지칭하고, 때로는 구체적으로 성찰적 주제 분석을 지칭한다. 20편의 논문은 2014년에서 2022년 사이에 출판되었다. 우리의 초점은 보고에서의 공통적인(common) 문제점을 이해하는 데 있으므로, 개별 저자들을 '지목하여 망신 주기(naming and shaming)'를 피하기 위해 검토에 포함된 논문들을 식별하지 않는다 – 다만 몇몇 구체적인 모범 사례는 식별한다.

 

우리의 해석적 고찰 과정은 각 논문을 읽고, 이전에 성찰적 주제 분석의 질적 보고에 중요하다고 확인했던 측면들에 대해 메모를 작성하는 것을 포함했다.1,13 여기에는 다음이 포함되었다(단 이에 국한되지는 않음): 이론적 가정과 성찰적 실천 및 위치성을 상술함으로써 연구자가 '자신의 관점을 소유하는 것(owning their perspectives)'13; 분석 과정에 대한 연구자의 설명; 그리고 주제의 개념화. 일부 측면의 경우, 우리는 단순히 해당 측면의 존재/부재(그리고 존재한다면 무엇이 포함되었는지)를 기록했다. 다른 측면들에 대해서는, 무언가가(예: 주제, 연역적 지향성) 어떻게 개념화되었는지(보고된 내용에 근거하여) 그리고/또는 보고의 질에 대해 위치지어진, 해석적인 판단(positioned, interpretative judgement)을 내렸다. 이러한 방식으로, 본 고찰은 상황적이고, 해석적이며 주관적인(situated, interpretative and subjective), 그러나 또한 엄밀한 관여의 과정으로 이해될 수 있다.

 

RTARG의 개발은 이번 검토와 다른 검토들,1,13 질적 보고의 품질과 대문자 Q에 관한 더 광범위한 학술 프로젝트,14,15 그리고 성찰적 주제 분석 방법론자이자 질적 연구자로서의 우리의 경험과 관점에 의해 정보를 얻었다. 우리의 목표는 RTARG가 COREQ 및 SRQR과 같은 체크리스트의 사용을 대체(replace)하는 것이므로, 우리는 기존 체크리스트의 개별 항목/요소들을 면밀히 검토(reasoned through)하여 그것들이 성찰적 주제 분석과 양립 가능한지, 따라서 양질의 보고를 지원하는지 혹은 저해하는지를 고려했다. 우리는 성찰적 주제 분석과 대체로 부합하는(cohered) 항목/요소들은 유지하거나 수정했다; 다른 것들은 거부하거나 교체했다. 우리는 또한 보고 체크리스트, 기준 및 지침, 그리고 비평들을 널리 읽었으며, 기존 지침에서 COREQ와 SRQR 항목을 우리가 수정한 것으로 이미 포착되지 않은 유용한 것들을 취했다. 저자들이 (자신도 모르게) 소문자 q, 과학적 기술적 성향의 리뷰어들과 씨름할 것이기 때문에, 우리는 또한 피해야 할(avoid) 개념과 관행, 즉 우리가 일반적이라고 주장하지만 잘못 가정된 그런 종류의 것들을 강조하는 것이 유용하다고 생각했다.

 

검토된 논문들에서 주제 분석은 어떻게 사용되었는가? (How thematic analysis was used in the reviewed papers?)

 

  • ‘표본’은 18건의 경험적 연구(empirical studies)와 2건의 체계적 문헌고찰(systematic reviews)로 구성되었다. 대부분의 경험적 연구는 독립적인 질적 연구(qualitative studies)였으며, 1건의 혼합 연구(mixed method study)와 더 큰 혼합 연구 설계/임상시험의 일부로 수행된 4건의 질적 연구가 포함되었다. 논문들은 대개 질적 연구에 대한 경험적 지향성(experiential orientation)을 보여주었는데, 이는 참여자의 체험된 경험(lived experiences)과 관점 또는 특정 현상에 영향을 미치는 요인들을 공감적으로 탐구(empathically exploring)하는 것이었다.6
  • 인터뷰와 포커스 그룹은 가장 일반적인 자료 생성 방법(data generation methods)(14건의 논문에서 사용됨)이었으나, 연구자들이 주제 분석의 설계 유연성을 활용함에 따라 어느 정도의 다양성도 존재했다.8 다른 자료 생성 방법으로는 관찰, 설문조사, 참여적 접근법(participatory approaches)이 포함되었다.
  • 사용된 분석 방법은 주제 분석, 주제 내용 분석(thematic content analysis), Braun과 Clarke의 주제 분석, 그리고 더 최근 논문들에서는 성찰적 주제 분석(reflexive thematic analysis) 등으로 다양하게 기술되었다. 주제 분석은 비록 명시적으로 레이블이 붙지 않았더라도 대체로 귀납적(inductively)으로 사용되어 분석이 데이터에 기반을 두었으나; 기존 이론이나 모델이 코딩을 위한/코딩을 안내하는 틀로 사용된 연역적 접근법(deductive approach)의 사례도 일부 있었다. 우리의 저작은 전형적으로 유일하게 인용된 분석 방법론적 출처였다.9,12 일부 논문에서는 기술된 분석 절차가 우리가 설명한 것과 완전히 달랐으며, 아무런 설명 없이 단계나 절차가 추가되거나 관여되지 않았다. 소수의 논문은 주제 분석, 근거 이론(grounded theory) 또는 질적 내용 분석(qualitative content analysis)에 대해 다른 출처를 인용했으며, 이러한 서로 다른 접근법들이 때로는 성찰적 주제 분석과 결합되어 분석을 안내했다. 몇몇 논문에서는 다수의 주제 분석 접근법이 인용되었으나, 어떤 하나의 접근법이 분석을 안내했는지, 또는 접근법들 간의 철학이나 절차의 불일치가 어떻게 해결되었는지는 명확하지 않았다.

 

실제로, 검토된 대부분의 논문에서 주제 분석 사용의 이론적 토대(theoretical grounding)와 더 넓은 의미에서의 연구에 대한 논의는 없었다. 명시되거나 암시된 이론적 틀(theoretical frameworks)해석학적 현상학(interpretative phenomenology) / 질적 연구, 실재론(realism)맥락주의(contextualism) – 은 분석에 대한 경험적 지향성과 일치했다.

 

  • 이론에 대한 명시적 논의의 예로는 Collins 등16이 그들의 해석학적 현상학적 틀을 기술한 것을 들 수 있다: '개별 참여자의 인식이나 경험에 대한 설명에 관심을 두며, 해석학적, 현상학적 틀이 설계, 표본 추출 결정, 인터뷰 기법 및 인터뷰 분석을 뒷받침했다' (p. 951).
  • Pino 등17은 실재론적 접근법을 기술했다: '우리는 사람들이 말하는 것을 그들의 견해와 관점을 반영하는 것으로 취급하며, 주제 분석을 '실재론적' 방법으로 광범위하게 채택했다. 그럼에도 불구하고, 우리는 또한 인터뷰어의 질문이 인터뷰 대상자의 응답을 형성하는 방식을 고려하려고 노력했다' (p. 710).
  • 두 가지 예 모두 분석을 뒷받침하는 이론적 가정(theoretical assumptions)을 간결하면서도 설득력 있게 기술할 가능성을 보여준다.

 

그러나 이러한 기술의 부재가 일반적이었다. 이론적 토대를 명시적으로 논의하지 않는 것은 문제가 되는데, 왜냐하면 주제 분석은 이론적으로 정보를 갖추고 경계가 정해진 방법론을 제공하지 않기 때문이다. 분석 절차뿐만 아니라, 안내하는 이론적 가정, 적합하거나 이상적인 연구 질문과 자료 생성 기법, 그리고 참여자 그룹/데이터셋의 적절한 구성을 명시하는 방법론적 '패키지(package)'가 없다면, 이론은 명시적으로 고려될 필요가 있다.

 

전반적으로, 저자들은 대문자 Q(Big Q) 연구 품질의 중요한 측면인 자신의 관점을 '소유하고(own)' 명료화하지 않는 경향이 있었다.13 검토된 논문들에서 연구자의 직업적 위치에 대한 짧은 언급 및/또는 소수의 논문에서 성찰적 일지를 작성했다는 것 외에는 연구자 성찰성(reflexivity)에 대한 논의가 거의 없었다.

 

  • 주목할 만한 예외로, Fusi-Schmidhauser 등18은 그들의 참여적 실행 연구(participatory action research) 내에서의 권력 역학(power dynamics)을 탐색하는 것에 대한 훌륭한 성찰을 포함했다: 계층적 관계를 가진 실무자 그룹 내에서 실행 연구를 수행하는 것은 도전적이다. 비대칭적 관계가 형성되어 모든 의견과 목소리를 진실되게 포착하는 것을 방해할 위험은 지속적으로 평가되어야 한다. CIG [협력적 탐구 그룹]는 이중의 권력 불균형을 나타냈다: 하나는 연구자와 비의료 전문가(간호사, 물리치료사) 사이, 두 번째는 연구자이자 완화 치료의 선임 컨설턴트인 그녀와 동료 의사들 사이였다.
  • 권력 관계와 불평등의 원천에 대한 지속적인 성찰(continuous reflexivity)과 진행 중인 토론은 잠재적인 연구의 한계를 다루는 데 도움이 되었다. 또한, 참여자들이 이름(first name)으로 소통하고, 모든 그룹 회의 일정을 잡기 위해 비공식적인 스마트폰 채팅 앱을 만들고, 회의에 사복(plainclothes)으로 참석하여 의사 그룹 내의 흰 가운(white coats)을 피하는 것과 같은 몇 가지 실천적 방법의 사용은 잠재적인 권력 불균형을 극복하는 데 도움이 되었다 (p. 1938).

 

검토된 논문 중 어느 것도 완전히 ‘문제’가 없는 것은 아니었다 – 이는 아마도 제한된 단어 수와, COREQ10 및 SRQR11과 같은 기존의 질적 보고 체크리스트가 방법론적 비일관성(methodological incoherence)(아래 참조)을 예시하고 조장하는 경향이 있을 때 보고 체크리스트를 사용해야 하는 요구 사항을 부분적으로 반영한 것일 수 있다 – 더 최근에 출판된 논문들, 특히 Reflecting on reflexive thematic analysis를 인용한 논문들이 종종 더 강력했다는 점은 주목할 만하다.

 

Palliative Medicine에 출판된 주제 분석에 대한 우리의 평가를 품질을 촉진하는 방식으로 미래의 저자들에게 가치 있게 만들기 위해, 우리는 우리가 확인한 대부분의 문제들을 분류한 두 가지 광범위한 영역을 강조한다:6,7

 

  • (1) 보고에서의 투명성(transparency) 또는 성찰적 개방성(reflexive openness),19 명확성 및 세부 사항의 부족; 그리고
  • (2) 보고된 내용 내의 방법론적 비일관성(methodological incoherence).4

 

우리는 더 널리 사용되는 용어인 투명성20 대신 성찰적 개방성(reflexive openness)이라는 용어를 대안으로 사용하는데, 왜냐하면 투명성이라는 개념은 '사물 그 자체(in themselves) 또는 사물이 실제로 존재하는 대로(as they really are) 접근하기 위해 꿰뚫어 보는(seeing through) 가능성을 암시하는 시각적 은유(ocular metaphor)에 기초하고 있기' (p. 181; 원문 강조)19 때문이며 – 이는 성찰적 주제 분석과 같은 비실증주의적 접근법과 부합하지 않는 은유이다.

 

성찰적 개방성, 명확성 및 세부 사항의 부족 (Lack of reflexive openness, clarity and detail)

 

우리는 첫 번째 영역, 즉 저자들의 분석 과정에 대한 제한된 세부 사항이나 주제 제시의 불일치와 같이 연구 보고에서 (적절한) 성찰적 개방성, 명확성 및 세부 사항이 부족한 점에 대해서는 간략하게만 다룬다. 예를 들어, 명확한 지도(maps)나 표는 전체 분석 구조를 명확하게 전달하는 데 정말 유용한 도구이지만(Jämterud와 Sandgren21 그리고 Johnson 등22 참조), 저자가 개발된 분석에서 다른 그리고/또는 추가적인 주제 이름/제목을 사용한다면 혼란이 야기된다. 데이터 발췌, 표 및 참고 문헌을 제외하고 최대 3000단어인 Palliative Medicine과 같이 엄격한 단어 제한이 있는 저널에 질적 연구를 보고하는 데는 분명한 어려움이 있다. 성찰적 주제 분석은 따라야 할 엄격한 방법 – ‘레시피(recipe)’를 제공하지 않으며, 상황적이고 성찰적인 연구자의 관여(situated and reflexive researcher engagement)를 요구한다. 이는 연구자들이 (이상적으로는) 일반적인 단계(generic phases)(검토된 논문들에서 종종 보고된 것)가 아니라, 접근법을 사용하는 데 있어 그들의 구체적인 관여, 과정 및 결정(specific engagement, process and decisions)을 보고해야 함을 의미하며 – 이는 단어(지면)를 필요로 한다.

 

  • Hanna 등23은 검토된 논문들 중에서 이에 대한 좋은 간략한(brief) 예를 제공했다 (심층적인 예시는 우리 웹사이트 www.thematicanalysis.net의 품질(Quality) 아래에 있는 학생 모범 사례(Student Examples of Good Practice) 참조):
    • 초기에, JRH [제1저자]는 각 전문가의 경험에 대한 감을 잡기 위해 녹취록을 읽고 또 읽었다.
    • JRH는 각 녹취록을 읽은 후 개별 이야기(story)에 대한 생각을 개요로 작성하며 서면 성찰을 생성했다.
    • 그 후, JRH는 전문가들의 내러티브에서 유사한 구절이나 단어를 표시함으로써 귀납적 기술 코드(inductive descriptive codes)를 상세히 하며 수동으로 데이터를 코딩했다.
    • 성찰적 주제 분석은 JRH가 데이터에 대해 성찰하고 관여할 수 있게 해주며 마인드 매핑 기법을 사용하여 코드에서 주제를 생성하는 데 유용한 접근법이었다. 서면 성찰은 주제를 구성하는 데 도움이 되었다 (p. 1251).

 

심리학과 관련하여, Levitt 등은 진실성(integrity) 있게 질적 연구를 보고하는 것은 더 많은 공간을 필요로 한다고 주장했다.24 그들은 연구 자료와 포괄적인 인구통계학적 정보를 포함한 더 상세한 방법론적 정보, 그리고 추가적인 데이터 발췌를 포함한 확장된 ‘결과(Results)’를 제공하기 위해 보충 자료(Supplemental Materials)를 사용할 것을 권장했다. 이러한 권장 사항은 Palliative Medicine과 같은 저널의 짧은 길이의 논문들이 더 큰 성찰적 개방성, 명확성 및 세부 사항을 제공할 수 있는 범위를 제공하며, 이는 또한 (유익하게도) 여기서 우리 논의의 주된 초점인 방법론적 비일관성(methodological incoherence)의 위험을 감소시킨다.

 

방법론적 비일관성 (Methodological incoherence)

 

방법론적 일관성(Methodological coherence)이라는 개념은 연구 질문과 목적, (명시적으로 진술되었든 암묵적으로 명백하든) 연구를 안내하는 이론적 가정(theoretical assumptions), 자료 생성 방법, 자료 분석 방법/방법론, 품질 관행 및 개념 등 연구의 다양한 요소들이 개념적으로 정렬(alignment)되어 있는 연구를 포착한다.24 요소들이 (인정이나 논의 없이) 정렬되지 않을 때 비일관성(incoherence)이 드러난다. 검토된 모든 논문은 어느 정도의 방법론적 비일관성을 입증했다(종종 겉보기에는 무지한 상태로 비실증주의적 연구 관행과 (후기)실증주의적 연구 관행 및 가치를 결합함). 여기서 우리는 검토된 논문들에서 방법론적 비일관성의 주요 원인이라고 생각되는 것들을 강조하고, 미래의 저자들이 비일관성을 피하기 위한 출발점으로서 명확한 설명을 제공한다.

 

  • 주제 분석이라는 방법론적 계열(family of methods) 내의 다양성과 이것의 개념적 중요성을 깨닫지 못하는 것이 명백히 드러난 방법론적 비일관성의 주요 원인일 가능성이 높았다. 이러한 차이는 중요하며, 우리는 과학적으로 기술적인(scientifically descriptive) 주제 분석과 예술적으로 해석적인(artfully interpretative) 주제 분석을 일관성 있게 결합하는 것은 불가능하다고 주장한다(다른 이들은 동의하지 않는다25) – 우리는 다른 곳에서 주제 분석 접근법들의 차이에 대한 더 완전한 논의를 제공한다.1,6
    • 방법론적 일관성을 위한 우리의 권고는 질적 연구자들이 자신의 연구 가치를 성찰하고, 이와 정렬되는 주제 분석 접근법을 선택하며, 그 후 정렬되고 일관된 방식으로 이 접근법을 사용하고 보고하려고 노력하는 것이다.
  • 주제(theme)에 대한 (서로 다른 개념화들의) 명확성 부족 검토된 논문들에서 방법론적 비일관성의 또 다른 원천이었다. 주제 분석 접근법 전반에 걸쳐, 우리는 두 가지 매우 다른 구성 개념을 확인했다: (a) 화제 요약(topic summaries); 그리고 (b) 공유된 의미 기반 주제(shared-meaning based themes). 과학적으로 기술적인 주제 분석에서, 주제는 화제(topic)의 요약으로 개념화되는 경향이 있다. '주제' 내의 관찰들과 예시적인 데이터 발췌들을 결합하는 것은 화제(예: '...에 대한 장벽', '...의 경험')이지만, 관찰들은 꽤 이질적인 장벽이나 경험을 포착할 수 있다. (그러한 주제들은 분석 과정 초기에 개발된다 – 그것들이 (광범위한) 화제 영역이나 이슈를 포착하기 때문에 정확히 초기에 개발될 수 있으며; 그것들은 분석 과정으로의 '투입물(inputs)'로 간주될 수 있다.
    • 검토된 논문들에서, 화제 요약 유형의 '주제들'은 흔했으며, 종종 각기 다른 화제의 요소 – 예를 들어, 다른 유형의 장벽 – 를 포착하는 여러 하위 주제들(sub-themes)과 함께 제시되었다. 서로 다른 장벽들을 일관된 주제적 진술(thematic statement)로 묶어주는 전반적인 이야기(story)는 드물었다.26 과학적으로 기술적인 접근법의 전형인 주제에 대한 또 다른 – 관련된 – 개념화는 주제를 '모래 속에 흩어진 다이아몬드(diamonds scattered in the sand)' (p. 740)로 보는 것이다.27 여기서, 주제는 종종 데이터 안에 존재하는 실제적인 것(real things)으로 암묵적으로 취급되며, 연구자는 이를 '식별(identifies)'하거나 '발견(discovers)'한다. 연구자들이 주제 개발과 관련하여 사용하는 언어는 의도치 않게 주제를 '다이아몬드'로 개념화한다는 신호를 보낼 수 있으며, 주제 개발에서의 그들의 역할을 '찾는 것(finding)'이라는 비교적 수동적인 것으로 위치시킬 수 있다(그들은 심지어 '주제가 창발했다(emerged)'고만 기록함으로써 그 과정에서 자신들의 존재를 지워버릴 수도 있다).
    • 예술적으로 해석적인(artfully interpretative) 주제 분석에서, 주제 중심 개념이나 아이디어를 중심으로 조직된 공유된 의미(shared meaning)의 패턴으로 개념화된다. 주제 내의 관찰들을 결합하는 것은 공유된 화제가 아니라, 데이터셋에서 나온 이 공유된 아이디어 또는 의미이다(아래 예시 참조). 그러한 주제들은 분석 과정의 종착점(endpoints)이자 산출물(outputs)로 간주될 수 있다. 앞서 언급했듯이, 주제는 코딩을 안내하기보다는 코딩으로부터 그리고 코딩을 통해 개발되며, 노동 집약적인 개방형 분석 과정을 통해 주제를 적극적으로 개발하고 생성하는 연구자들에 의해 정교하게 만들어진다(crafted).
    • 검토된 많은 논문들이 공유된 의미 기반 주제가 아니라 화제, 범주 또는 영역을 개발하고 보고하기 위해 성찰적 주제 분석을 (비일관적으로) 사용했다. 방법론적 일관성을 위해, 우리는 화제 요약을 보고하고자 하는 연구자들이 화제의 개발과 보고를 명시적인 목적(explicit purpose)으로 삼는 접근법 – 그리고 절차가 그 목적에 맞춰진 접근법(예: 프레임워크 분석(framework analysis)28과 같은) – 을 사용하는 것이 더 낫다고 생각한다. 우리에게는 '주제적 구조(thematic structure)'가 초기에 개발될 수 있었을 때(과학적으로 기술적인 주제 분석에서처럼), 성찰적 주제 분석의 노동 집약적인 절차는 거의 의미가 없다.

 

일부 논문들은 주제의 개념화 및 보고와 관련하여 성찰적 주제 분석을 일관성 있게 사용했다. 예를 들어,

 

  • Collins 등16은 생명을 위협하는 상태의 아이를 돌보는 부모의 경험을 포착하는 네 가지 주제를 보고했다. 그들의 환기적인(evocatively) 제목이 붙은 주제들은 다음과 같았다:
    • (1) 집 안에 갇힘(trapped inside the house) (이는 공동체로부터 부모의 신체적, 사회적 고립과 노동력으로부터의 배제, 그리고 이것이 그들의 웰빙에 미치는 부정적인 영향을 포착했다);
    • (2) 보호자(the protector) (이는 돌봄 역할의 막대함과 책임을 포착했다);
    • (3) 그림자와 함께 살기(living with the shadow) (이는 자녀의 죽음의 가능성 및 있었을 수도 있는 삶에 대한 슬픔과 함께 사는 것의 만연함을 묘사했다); 그리고
    • (4) 다른 경로를 여행하기(travelling a different pathway) (이는 부모가 간병인 역할로부터 의미와 목적을 도출하는 방식을 묘사했다).
  • 환자들에게 심각한 질병에 대한 대화를 식별하는 것에 대한 의료 전문가들의 결정에 영향을 미치는 요인을 이해하고자 했던 Jämterud와 Sandgren은 네 가지 주제를 보고했다:
    • (1) 적절한 환자(the right patient) (그 주된 특징은 신체적 악화였다);
    • (2) 적절한 시기(the right time) (환자가 자신이 죽을 것이라는 것을 알 때);
    • (3) 관계의 연속성 및 시간 경과에 따른 연속성(continuity in relations and continuity over time) (환자를 식별하고 대화를 나누기 위해서는 확립된 관계가 필요하다); 그리고
    • (4) 죽음과 희망의 관계(death and its relation to hope) (심각한 질병에 대한 대화는 희망을 앗아갈 위험이 있다).21
  • 이러한 예시들은 우리를 화제 너머로 데려가며, 심지어 주제 이름(names)만으로도 이야기가 전해지고 있다는 느낌을 준다. 그것들은 또한 성찰적 주제 분석이 다루기 위해 사용될 수 있는 두 가지 다른 유형의 연구 질문 – 체험된 경험(lived experience)과 영향 요인(influencing factors) – 을 훌륭하게 예시한다.6

 

비록 검토된 대부분의 논문이 이론에 대한 어떠한 명백한/의도적인(deliberative) 논의도 포함하지 않았지만, 이론은 또 다른 더 미묘한 형태의 비일관성을 제공했다 – 구체적으로, 언어와 품질 기준에서 표현된 (학문적으로 지배적인) (후기)실증주의적 가정들을 통해서이다. 우리는 다른 곳에서 이러한 의도적이지 않고, 알지 못하는 상태에서의 (후기)실증주의와의 얽힘을 '실증주의의 잠식(positivism creep)'이라고 언급한 바 있다.6 우리는 그러한 잠식이 예술적으로 해석적인 주제 분석에서조차 꽤 흔하다고 주장한다 – 왜냐하면 (후기)실증주의는 (일반적이라고 가정되는) 좋은(good) 관행에 대한 우리의 아이디어 중 많은 부분에 영향을 미쳤기(혹은 감염시켰기) 때문이다. 예를 들어, 검토된 논문들에서 저자들은 (후기)실증주의적 우려를 반영하는 개념, 우려 및 관행들을 언급했는데 – 이것들은 종종 학문적 맥락 내에서 완전히 정상화된 것들이다.29,30 예를 들어,

 

  • 일부는 '작은 표본'이나 (통계적) 일반화 가능성의 부족을 연구의 한계로 기술했다;
  • 일부는 포화(saturation)를 자료 생성을 멈추는 기준으로 기술했다 (놀랍지 않게도 포화는 COREQ와 SRQR 모두에서 널리 옹호되고 참조된다; 성찰적 주제 분석과 관련된 비평은 Braun and Clarke31 참조);
  • 일부는 연구자나 데이터 소스의 삼각검증(triangulation), 그리고/또는 '결과'에 대한 참여자 검증(participant validation)과 같은 품질 관행을 사용했다고 보고했다;
  • 일부는 연구자 '편향(bias)'에 대한 우려 표명하고, 연구자 편향을 관리하고 분석의 신뢰성과 정확성을 보장하기 위해 취한 조치를 보고했다.

 

(후기)실증주의에 기반을 둔 개념과 관행으로서, 이것들은 성찰적 주제 분석과 비일관적이다.1 Varpio 등29,30과 같은 질적 학자들은 의학 내에서 질적 연구가 초기 단계에 정당성을 얻게 해주었던 (후기)실증주의와의 얽힘이 이제는 비실증주의적 질적 연구의 방법론적 진실성(methodological integrity)을 저해하고 있다고 지적했다.

 

일부 검토된 논문들은 일관성 있는 품질 관행을 실제로 입증했다. 예를 들어

 

  • Mayland 등32은 주제 개발에 대해 합의(consensus)가 아닌 성찰적이고 협력적인(reflexive and collaborative) 접근법을 기술했다 – 분석을 주도한 두 저자가 어떻게 '정량적 데이터와 결합하여, 그리고 더 넓은 연구 팀과의 비판적 대화를 통해 주제를 협력적으로 검토하고 수정했는지' 언급했다 (p. 1482). 그리고
  • Olsman 등33은 그들의 해석적 검토에 '다른 방법과 인식론적 토대를 가진 연구들'을 포함한 것에 대해 성찰하고, 전이가능성(transferability)이라는 질적 개념을 참조했다: '우리의 관점에서는, 서로 다른 방법을 가진 연구들의 결과를 결합하는 것에 대해 다른 의견들이 있지만, 이러한 다양성은 결과의 전이가능성을 강화할 수 있다' (p. 67).

 

우리의 견해는 (성찰적) 주제 분석 보고에서의 방법론적 비일관성 문제가 COREQ10 및 SRQR11과 같은 보고 체크리스트의 사용으로 인해 도움을 받지 못한다는 것인데, 검토된 논문의 3분의 1이 조금 넘는 수가 이를 인용했다. 이것들이 일반적인(generic) 것으로 제시되지만, 대문자 Q 질적연구(Big Q Qualitative)나 예술적으로 해석적인/성찰적인 주제 분석과는 잘 정렬되지 않는다.14,15 더욱이, 그것들은 방법론적 비일관성을 보여준다. 예를 들어 COREQ는 '연구자 편향'이라는 소문자 q/(후기)실증주의적 개념(이상적으로 객관적인 지식의 왜곡을 암시함)과 '성찰성'이라는 대문자 Q/비실증주의적 개념(지식 생성은 내재적으로 주관적이며 연구자가 생산된 지식을 필연적으로 형성한다고 이해하며, 그들은 연구와 분리된 것이 아니라 연구의 일부임)을 모두 참조한다 – 이 개념들에 정보를 제공하는 서로 다른 가치들을 인정하거나 논의하지 않은 채로 말이다. 만약 무지한(unknowing) 연구자가 이러한 체크리스트를 따른다면, 그들은 꽤 다른 토대를 가진 관행을 고수함으로써 방법론적 비일관성의 위험에 처하게 된다.

 

성찰적 주제 분석 보고의 더 나은 관행 지원하기: 우리의 새로운 성찰적 주제 분석 보고 지침
(Reflexive Thematic Analysis Reporting Guidelines, RTARG) 소개

 

질적 방법론자로서, 우리의 목표는 대문자 Q 연구에 대한 지식, 이해, 그리고 (결과적으로) 고품질의 관행 – 및 보고 – 을 지원하는 것이다. 우리는 이 논문에서 우리가 모두 다른 지식 규범, 맥락, 경험 내에 위치해 있으며, 질적 여정의 다른 지점에 있다는 것을 강조하기 위해 '무지한(unknowing)' 연구자라는 아이디어를 사용했다. 우리의 주제 분석 여정이 소문자 q 접근법을 포함하든 대문자 Q 접근법을 포함하든, 우리는 연구자들이 (성찰적 개방성으로서의) 앎(knowingness)을 열망하도록 격려하고 지원하기를 희망한다. 이제 대문자 Q 접근법에 초점을 맞추어, 우리는 성찰적 주제 분석의 방법론적으로 일관된(methodologically coherent) 보고를 안내하는 새로운 도구를 소개하며 이 논문을 마무리한다.1,7,34 우리가 성찰적 주제 분석 보고 지침(Reflexive Thematic Analysis Reporting Guidelines, RTARG; 보충 자료 참조)이라고 부르는 이 도구는 우리가 성찰적 주제 분석의 품질을 위해, 그리고 더 넓게는 대문자 Q 질적연구를 위해 개발해 온 지침의 확장을 제공한다.1,15 우리는 성찰적 주제 분석을 보고하는 데 있어 RTARG가 COREQ10 및 SRQR11과 같이 널리 사용되는 기존 체크리스트를 대체(replaces)할 것을 제안한다. 주로 저자들이 사용하도록 의도되었지만, 이 지침은 또한 방법론적으로 일관된 검토(reviewing)를 위한 도구도 제공한다. 품질 평가와 보고 기대치는 질적 연구 내의 다양성을 인정하는 것과 '천편일률적인 방식(one size does not fit all)'은 통하지 않는다는 사실에 근거해야 한다.

 

COREQ와 SRQR은 모두 기존의 품질 및 보고 표준과 체크리스트의 종합(synthesis) 및/또는 '전문가 합의(expert consensus)'를 통해 개발되었는데 – 우리는 관행의 다양성 때문에 이것이 질적 연구에서 보고 및 품질 표준을 결정하는 데 문제가 있는 기초라고 믿는다.14,15 우리의 입장은 종합과 합의를 통해 체크리스트를 개발하는 것은 무지한 상태에서 방법론적 비일관성을 초래하고 조장하는 품질 및 보고 표준을 낳을 수 있다는 것이다. 성찰적 주제 분석 보고를 위한 우리의 지침은 가치에 기반(values based)을 둔다. 우리에게 있어, 품질을 위한 핵심 원칙으로서 방법론적 일관성 또는 진실성의 개념과 정렬할 때, 가치는 품질 및 보고 지침의 기초가 되어야 한다.24 RTARG는 성찰적 주제 분석의 대문자 Q/예술적으로 해석적인 가치들과 방법론적으로 일관된 보고를 촉진하기 위한 것이다. RTARG는 체크리스트가 아니라(not) 지침(guidelines)을 제공하는데, 모든 항목이 특정 연구/보고서에 관련되지는 않을 것이며 – RTARG 사용 주변에는 유연성이 필요하기 때문이다.35 RTARG에 대한 무비판적인(unthinking) 준수가 반드시 보고 품질을 향상시키지는 않을 것인데, 왜냐하면 아는(knowing) 관행이 핵심이기 때문이다.7 우리는 보고 표준과 체크리스트의 사용이 일반적인 보건 저널들에서, RTARG가 성찰적 주제 분석 논문들에 대한 개념적으로 그리고 방법론적으로 일관된 검토를 위해서도 사용될 수 있기를 희망한다.

 

결론 (Conclusion)

 

Palliative Medicine 및 다른 곳에서 Braun과 Clarke를 인용하고 '주제 분석'을 보고한 출판된 논문들을 검토하면서, 우리는 개념화와 보고된 관행 모두를 둘러싼 공통된(반복되는) 보고 문제들을 확인했다. 우리는 방법론적 비일관성을 (COREQ와 같은 체크리스트 등의) 평가 도구와 학자뿐만 아니라 리뷰어(및 편집자) 커뮤니티를 형성하는 학문적 규범 및 기대치를 포함한 다양한 원천에서 기인하는 것으로 이론화했다 – 우리는 이를 개별 논문을 형성하는 집단적인 힘으로 이해할 수 있다. 우리는 출판 과정에 관련된 모든 이를 지원하고 Palliative Medicine 및 더 넓은 분야에서 더 나은 품질의 주제 분석을 촉진하는 것을 목표로 한다. 그렇게 하기 위해, 우리는 몇 가지 간략한 모범 사례를 제공하고, 성찰적 개방성과 방법론적 일관성의 중요성을 강조했으며, 성찰적 주제 분석 보고의 품질 관행을 안내하기 위한 새로운 도구인 RTARG를 개발했다. 우리는 이 도구가 열망적(aspirational)이라는 것을 안다 – 많은 출판 제한(단어 수 등)이 최상의 관행에 반하여 작용한다는 것을. 그러나 우리는 변화에 대해 여전히 낙관적이다 – 적어도 이 검토를 제출하라는 초청과 RTARG의 출판은 다양성에 걸친 고품질 주제 분석의 출판을 이해하고, 탐구하며, 촉진하려는 열망을 시사하기 때문이다.

 

 

 

 

 

sj-pdf-1-pmj-10.1177_02692163241234800.pdf
0.66MB

Med Teach 2026 Jan 20:1-16. doi: 10.1080/0142159X.2026.2614604. Online ahead of print.

How to incorporate theory in qualitative research: AMEE Guide No. 183 

 

 

 

안녕하세요! 오늘은 의학교육(HPE) 연구자라면 누구나 한 번쯤 머리를 싸매고 고민해봤을 주제, 바로 '질적 연구에서 이론(Theory) 사용법'에 대한 아주 유용한 가이드를 소개해드리려고 합니다.

바로 AMEE Guide No. 183인데요, 이 논문은 연구자들이 이론을 어려워한다는 점을 아주 잘 짚어주면서, 이론을 어떻게 도구처럼 꺼내 쓸 수 있는지 친절하게 설명해주고 있습니다. 핵심 내용만 쏙쏙 뽑아 정리해 드릴게요! 📝


🧐 이론, 왜 이렇게 어렵게 느껴질까요? 

연구를 하다 보면 '방법론'이나 '데이터 분석' 같은 도구들은 익숙한데, 유독 '이론'이라는 도구는 낯설게 느껴지곤 하죠. 저자들은 이 상황을 아주 공감 가게 표현합니다.

"이론을 사용하는 과정은 많은 이들에게 벅차고 불투명한 것으로 인식됩니다."

"the process of using theory is perceived by many as daunting and opaque."

 

하지만 겁먹을 필요 없습니다. 이론은 결국 우리가 관심 있는 현상(Phenomenon)을 설명하기 위해 개념(Concepts)과 명제(Propositions)를 논리적으로 연결해 놓은 '추상적인 설명서'니까요.

💡 내 연구에 딱 맞는 '정답' 이론이 있을까요? 

많은 연구자가 "내 연구에 맞는 올바른(Right) 이론이 뭘까?"를 고민합니다. 하지만 이 가이드에서는 그 질문 자체가 별로 도움이 안 된다고 딱 잘라 말해요.

"HPE 연구자가 '내 연구에 올바른 이론은 무엇인가?'라고 묻는 것은 특별히 유용하지 않습니다. 현상을 연구하는 데 사용할 '올바른' 이론은 없습니다."

"This means that it is not particularly useful for the HPE researcher to ask: What is the right theory for my study? There is no “right” theory to use to study a phenomenon."

 

대신 이렇게 물어보라고 조언합니다.

  • 이 이론이 내 관심 현상을 다루고 있는가?
  • 이 이론은 현상에 대한 나의 이해를 어떻게 구조화(Structure)하는가?

마치 같은 풍경도 어떤 렌즈를 끼고 보느냐에 따라 다르게 보이듯, 이론은 우리가 현상을 바라보는 독특한 시각을 제공해 주는 것이죠. 👓

🔍 이론, 도대체 '언제' 써야 할까요? 

논문에서는 크게 두 가지 타이밍을 제시합니다.

  1. 연구 시작부터 함께하기 (Starting with theory) 연구 설계 단계부터 특정 이론을 딱 정해놓고 가는 방식입니다. 연구 질문, 참여자 선정, 데이터 수집 방법까지 모든 과정이 그 이론의 안경을 쓰고 진행되는 거죠. 이를 '완전히 이론에 입각한 귀납적 연구 설계(Fully theory-informed inductive study design)'라고 부릅니다.
  2. 데이터 분석 중에 꺼내 들기 (Using theory during data analysis) 처음엔 어떤 이론이 맞을지 확신이 없을 때 씁니다. 일단 데이터를 수집하고 분석하는 과정에서 "아, 이 현상은 저 이론으로 설명하면 딱이겠는데?" 하고 가져오는 식이죠. 이건 '이론이 정보를 제공하는 귀납적 데이터 분석(Theory-informing inductive data analysis)'이라고 해요.

🏗️ '이론적 틀(Theoretical Framework)' 만들기 

이론을 가져왔다고 끝이 아닙니다. 추상적인 이론을 내 구체적인 연구 현장에 맞게 다듬어야 하는데요, 이 과정을 통해 만들어지는 것이 바로 '이론적 틀'입니다. 저자들은 이것을 이렇게 정의합니다.

"이론적 틀은 (연구에 적용되기 위해 이론의 기초 요소와 구조를 변형하는) 과정이자 (연구의 성과 확산물에 이론과 그것이 연구 적용을 위해 어떻게 변형되었는지를 제시하는) 산출물입니다."

"A theoretical framework is a process (of transforming a theory’s foundational elements and structure... to be applied in a study) and a product (presenting the theory and how it was transformed for application in the study’s disseminations)."

 

즉, 이론을 책에서 본 그대로 베껴 쓰는 게 아니라, 내 연구 맥락에 맞게 '번역'하고 '적용'하는 과정이 필수적이라는 뜻입니다.

🏁 마치며: '쉬운 길'은 없다. 

마지막으로 연구진은 뼈 때리는 조언을 남깁니다. 연구에 이론을 쓰는 건 분명 힘든 일이지만, 그만큼 연구의 깊이와 영향력을 높여준다는 것이죠.

"이 가이드가 보여주듯이, 연구에 이론을 도입하는 데 '가벼운' 버전은 없습니다."

"As this Guide illustrates, there is no “light” version of bringing theory into a study."

 

질적 연구를 준비하고 계신다면, 오늘부터라도 나의 '연구자 도구 상자'에 어떤 이론을 채워 넣을지 고민해 보는 건 어떨까요? 이 포스팅이 여러분의 연구 여정에 작은 이정표가 되길 바랍니다! 🚀

 

 


서론 (Introduction) 

HPE(보건의료교육, Health Professions Education) 연구 관련 자료에서는 '연구자의 도구 상자(researcher’s toolbox)'라는 은유가 자주 사용됩니다. 이 도구 상자 속의 도구들은 일반적으로 방법론(methodologies) [1–3], 방법(methods) [4,5], 그리고 데이터 분석 접근법(approaches to data-analysis) [6,7]과 관련이 있습니다. 그러나 지금까지 이 풍경에서 중요한 도구 하나가 빠져 있었는데, 바로 이론(theory)입니다. 많은 학자가 HPE 연구에서 이론의 사용을 옹호해 왔지만 [8–12], 많은 이들이 이론을 사용하는 과정을 벅차고 불투명한(daunting and opaque) 것으로 인식하고 있습니다. 실제로 많은 HPE 연구자가 자신의 연구에 이론을 사용하고자 하지만, 그 목표를 '어떻게(how)' 달성해야 할지 확신하지 못하고 있습니다. 이 AMEE 가이드(AMEE Guide)는 이러한 격차를 해소하고자 합니다. 구체적으로, HPE 연구자들이 점차 질적 연구 방법론(qualitative research methodologies)으로 눈을 돌리고 있고 이러한 방법론 전반에 걸친 이론의 쓰임새가 다양하기 때문에, 이 AMEE 가이드는 '질적 연구에서 이론을 어떻게 사용할 것인가'에 초점을 맞춥니다 (Box 2에서는 양적 연구(quantitative research) 및 혼합 연구(mixed research)에서의 이론 사용에 대해 간략히 설명합니다). 이를 통해 우리는 HPE 연구자들이 질적 연구에서 이론을 하나의 도구(tool)로 활용할 수 있도록 돕고자 합니다.

 

우리는 먼저 몇 가지 기초적인 정보(foundational information)를 간략히 검토하는 것으로 시작합니다. 즉, 핵심 용어를 명확히 하고, HPE 연구에서 왜 이론이 사용되는지 검토하며, 연구자의 이론 선택을 안내할 몇 가지 고려 사항을 나열합니다. 이러한 기초를 다진 후, 우리는 질적 연구(qualitative research)에서 이론을 사용하는 방법에 집중합니다.

 

  • 첫째, 질적 연구에 이론이 일반적으로 '언제(when)' 통합되는지에 대한 두 가지 접근 방식을 설명합니다.
  • 둘째, 이론적 틀(theoretical framework)을 통해 연구에 이론을 '어떻게(how)' 적용하는지 설명합니다.
  • 셋째, 사례 예시에 두 가지 다른 이론을 적용해 봄으로써 이론이 어떻게 연구 문제(research problems)를 식별하는 데 도움을 줄 수 있는지 예시를 통해 보여줍니다.

 

우리의 주요 목표 (Our guiding aim)

우리는 초급에서 중급 수준(novice-to-intermediate level)의 HPE 연구자들이 질적 연구에서 이론을 사용할 수 있도록 돕기 위해 이 가이드를 집필했습니다. 결과적으로, 일부 고급 수준의 논의와 기법들(예: 특정 패러다임에 뿌리를 둔 이론을 다른 패러다임에서 사용할 수 있는가? [패러다임의 정의는 Box 1과 용어 사전 참조], 그리고 새로운 이론을 구축하거나 기존 이론을 정교화하려면 어떻게 해야 하는가?)은 이 가이드의 범위를 벗어납니다.

 

또한 우리의 목표는 현상(phenomenon)을 연구하는 동안의 이론 사용을 다루는 것으로 한정되었습니다. 우리는 이론이 연구자의 전체적인 연구 접근 방식을 어떻게 형성하는지(즉, 패러다임(paradigms)이 우리가 실재에 대해 생각하는 방식, 실재에 대해 알 수 있는 것, 그리고 실재에 대한 지식을 엄격하게 개발하는 방법을 어떻게 형성하는지)에 대해서는 깊이 파고들지 않습니다. 패러다임적 이해(Paradigmatic understanding)는 HPE 연구에 필수적입니다. 따라서 독자들이 먼저 HPE 연구에서 사용되는 다양한 패러다임에 대해 더 많이 배우고, 어떤 패러다임이 자신의 연구의 기초가 될지 결정할 것을 권장합니다. 그러한 작업을 도울 수 있는 많은 자료가 있습니다 [13–16]. HPE의 대부분의 질적 연구가 해석주의(interpretivist), 구성주의(constructionist), 구축주의(constructivist), 또는 비판적 지향(critical orientation)에서 수행된다는 점을 고려하여, 이 가이드는 이러한 패러다임에 뿌리를 둔 연구에서 연구자들이 이론을 사용할 수 있도록 돕는 것을 목표로 합니다.

 

  • 13. Rees CE, Monrouxe LV, O’Brien BC, Gordon LJ, Palermo C, editors. Foundations of health professions education research: principles, perspectives and practices. Hoboken, USA: Wiley Blackwell; 2023.
  • 14. Bergman E, de Feijter J, Frambach J, et al. AM last page: A guide to research paradigms relevant to medical education. Acad Med. 2012;87(4):545. doi:10.1097/ACM.0b013e31824fbc8a
  • 15. Bunniss S, Kelly DR. Research paradigms in medical education research. Med Educ. 2010;44(4):358–366. doi:10.1111/j.1365-2923.2009.03611.x 
  • 16. Varpio L, MacLeod A. Philosophy of science series: harnessing the multidisciplinary edge effect by exploring paradigms, ontologies, epistemologies, axiologies, and methodologies. Acad Med. 2020;95(5): 686–689. doi:10.1097/ACM.0000000000003142 

성찰성 진술 (Reflexivity statement)

이 가이드에 대한 아이디어는 초보 연구자들(주로 임상 또는 생의학 연구 훈련을 받은 이들)이 HPE 연구를 수행하도록 가르치고 지도했던 우리의 경험에서 비롯되었습니다. 제1저자인 RS는 교육학자(educational scientist)로서 훈련받았으며, 인지 심리학(cognitive psychology), 학습 이론, 교육 설계 및 관리, 그리고 양적 연구 방법론(quantitative research methodology)을 공부했습니다. 박사 과정 중에 그녀는 사회문화적 이론(socio-cultural theories)을 다루기 시작했고 질적 연구 방법론(qualitative research methodology)을 배웠습니다. 후자의 영역들은 점차 그녀의 연구 프로그램의 기초가 되었습니다. 패러다임 측면에서 RS는 실용주의(pragmatist)와 구성주의(constructionist) 패러다임을 오가며, 따라서 이러한 패러다임에 부합하는 이론들을 다룹니다. 제2저자인 LV는 영문학 박사 학위(부전공: 철학)를 소지하고 있으며, 이 학위 과정에는 질적 연구 훈련도 포함되었습니다. 그녀의 이론적 지향점은 수사학(rhetoric), 문학 이론(literary theory), 그리고 사회문화적 이론(socio-cultural theories)에 뿌리를 두고 있습니다. 패러다임적으로 LV는 절충주의(eclecticism)를 옹호하지만, 그녀 자신의 연구 프로그램은 일반적으로 구축주의(constructivism), 해석주의(interpretivism), 그리고 실용주의(pragmatism)에 중점을 둡니다. 이론적으로 그녀는 다양성을 포용합니다. 그녀는 경영학, 여성학, 기호학(semiotics) 등 모든 학문 분야의 이론을 사용합니다. 따라서 두 저자 모두 HPE에서 사용할 수 있는 광범위한 이론들과 질적 연구에서 이론이 수행할 수 있는 다양한 역할에 대해 민감하게 반응합니다.

이 AMEE 가이드의 로드맵 (Roadmap to this AMEE Guide) 

우리는 기초적인 이해를 확립하는 것으로 시작할 것입니다.

  • 이를 위해 우리는 이론을 정의(define theory)하고, HPE 연구에서 왜 이론을 사용하는지 설명하며, 이론을 선택하는 방법과 사용하는 시기를 탐구할 것입니다.
  • 그런 다음 이론을 사용하는 방법에 대해 논의하고, 이론 사용이 연구 문제(research problem)를 식별하는 데 어떻게 도움이 될 수 있는지에 대한 실제 예시(worked example)를 제공할 것입니다.
  • 이 AMEE 가이드의 내용을 잘 찾아볼 수 있도록, 각 섹션, 다루는 주제, 제공되는 보충 정보에 대한 개요를 제공합니다 (Figure 1 참조).

Figure 1. AMEE Guide 183 로드맵. 

 

1. 이론이란 무엇인가? (What is theory?) 

 

이론은 다양한 방식으로 정의되어 왔습니다. 이러한 다양성은 필수적입니다. 이론은 인지 심리학(cognitive psychology)(이론이 주로 개념과 변수로 표현되는 곳)에서 정의되는 것과 사회학(sociology)(이론적 설명이 책 한 권 분량의 논문이 될 수 있는 곳)에서 정의되는 것이 서로 다를 것이기 때문입니다. HPE가 학제 간 탐구 분야(interdisciplinary field of inquiry)라는 점(따라서 인지 심리학, 사회학 및 기타 여러 분야의 이론을 차용함)을 감안할 때, 하나의 정의를 선택하는 것은 문제가 있습니다. 다양하고 이질적인 학문 분야의 이론들을 포괄할 수 있는 정의는 무엇일까요? 이 질문에 답하기 전에, 우리는 이론의 정의에 일반적으로 포함되는 두 가지 요소, 즉 개념(concepts)과 명제(propositions)를 먼저 정의해야 합니다.

개념 (Concepts) 

  • 개념은 “사고의 구성 요소(building blocks of thoughts)”입니다 [17].
  • 개념은 우리가 생각하기 위해 사용하는 표상(representations)(주로 단어나 이미지)입니다.
  • 그것들은 우리의 (다양한) 정의와 의미를 담고 있습니다. 개념은 우리가 구분을 지을 수 있게 해줍니다.
  • 즉, 개념은 사물들을 서로 구별하는 데 도움을 주는 단어와 그 의미입니다 (예: '학생'이라는 개념은 우리가 그들을 '교육자'라는 개념과 구별하는 데 도움을 줍니다).

명제 (Propositions) 

  • 명제는 개념들이 서로 연결된 진술입니다.
    • 예: '의대생교육자에게 가르침을 받는다.' 이 명제에서 '학생'과 '교육자'라는 개념은 '가르침(teaching)'이라는 개념을 통해 논리적으로 연결(logically connected)됩니다.
  • 단일 명제는 보통 실재의 한 측면을 설명하기에 충분하지 않습니다 [18]. 예를 들어, 우리가 예로 든 명제는 HPE 교육자가 간호대 학생들을 '왜' 또는 '어떻게' 가르치는지, 혹은 학습자 집단이 전공의(medical residents)라면 그 교육이 어떻게 달라질지 이해하게 하는 데 충분하지 않습니다.

이론 (Theory) 

이러한 정의들을 바탕으로, 우리는 이론에 대한 정의를 제시할 수 있습니다. 우리는 Watsjold와 Varpio [19]가 개발한 다음의 이론 정의를 지지합니다.

이론현상에 대한 추상적인 설명(abstract description)을 표현하기 위해 논리적으로 연결된 일련의 명제(set of propositions)들의 집합이다.

 

이 정의에 명시된 것은 이론이 명제들로 구성되어 있다는 이해이며, 암시된 것은 명제들이 개념들로 구성되어 있다는 점입니다. 따라서, 다시 말하자면, 이론은

  • (a) 명제 속에서 연결된 개념(concepts)들로 이루어지고,
  • (b) 논리적으로 연결된 여러 명제(propositions)들로 이루어진,
  • 현상에 대한 추상적 설명으로 정의될 수 있습니다.

이 광범위한 정의 아래에는 다양한 유형의 이론이 존재합니다 (HPE 문헌에서 자주 사용되는 네 가지 반복적인 이론 유형과 그 정의 및 맥락은 Box 1을 참조하십시오). 이 AMEE 가이드에서 우리는 HPE 연구에서 공식적 이론(Formal Theory)을 사용하는 방법에 초점을 맞춥니다. 이는 여러 맥락에서 출판되고 입증된 이론들을 말합니다 [20,21].


Box 1 이론의 유형 (Types of theory)

  • 패러다임 (Paradigm) 패러다임은 과학적 연구에 대한 접근 방식을 기술하는 광범위한 범위(즉, 상위 수준)의 이론입니다. 패러다임은
    • 실재의 본질(존재론, ontology), 그 실재에 대해 알 수 있는 것(인식론, epistemology), 이 실재를 알 수 있는 방법(방법론, methodology), 그리고 이 실재 안에서 무엇이 가치 있는지(가치론, axiology)를 설명하는 명제들을 포함합니다.
    • 연구에 대한 서로 다른 접근 방식들(종종 서로 다른 학문 분야와 연관됨)은 서로 다른 패러다임 내에서 작동합니다. 또한, 서로 다른 공식적, 실질적, 개인적 이론들은 특정 패러다임 내에서 개발되고 존재합니다. 여러 HPE 출판물들이 패러다임과 그 특성에 대한 유용한 개요를 제공합니다 [14–16].
  • 공식적 이론 (Formal Theory)
    • 공식적 이론은 여러 맥락(contexts) 내에서 출판되고 입증된 이론을 말합니다 [20,21]. 각 분야는 자신만의 공식적 이론 라이브러리를 보유하고 있습니다. HPE 연구의 학제 간 성격은 우리 분야에 많은 다양한 이론을 가져왔습니다. 이러한 각 이론은 특정한 분석 단위(units of analysis)와 패러다임적 뿌리(paradigmatic roots)를 가지고 있습니다.
  • 실질적 이론 (Substantive Theory)
    • 실질적 이론은 현상에 대한 경험적 연구를 통해 개발된 이론으로 정의할 수 있습니다 [22]. 따라서 실질적 이론은 데이터에 근거(grounded)합니다. 다른 환경에서 여러 번 테스트 될 때, 실질적 이론은 결국 공식적 이론이 될 수 있습니다.
  • 개인적 이론 (Personal Theory)
    • 개인적 이론은 '사물이 어떻게 작동하는지 또는 왜 그런 일이 일어나는지를 이해하는 데 도움을 주는 신념 체계'입니다 [23,p.317]. 이러한 신념 체계는 우리의 행동을 지배하며 구어체로 이론이라고 명명됩니다 [24].

 

2. 우리는 왜 HPE 연구에서 이론을 사용하는가? (Why we use theory in HPE research?) 

정의(definitions)가 어느 정도 명확성을 제공하기는 하지만, 이론이 HPE 연구자들에게 어떻게 관련되는지는 설명해주지 않습니다. 우리는 아직 중요한 질문에 답하지 못했습니다: 왜 이론이 HPE 연구에서 유용한 도구(useful tool)인가?

 

이 질문에 답하기 위해, 우리는 현상(phenomenon)의 수준에서 시작하는 것이 도움이 된다고 생각합니다. HPE 연구는 종종 보건의료 전문가들의 교육에 관한 문제, 상황, 관찰 또는 호기심에서 시작됩니다. 다시 말해, HPE 연구는 세상에 존재하는 현상(phenomenon)에서 시작됩니다. 그 현상을 이해하기 위해, 우리는 그 현상에 대한 추상적 설명(abstract description)을 제공하는 이론에 의지할 수 있습니다; 이론은 현상을 이해하는 데 도움을 주는 개념(concepts)과 명제(propositions)로 그 현상을 분해합니다. HPE 연구자는 이론에서 표현된 개념, 명제, 또는 명제 간의 연결을 탐구하기 위한 연구를 설계하는 데 그 이론을 사용할 수 있습니다.

 

  • 이러한 효용성을 예시하기 위해, 전 세계 많은 HPE 교육자들이 직면한 문제의 예를 고려해 봅시다: 어떻게 하면 내 학습자들이 직종 간 보건의료 팀(interprofessional healthcare teams)의 일원이 되도록 가르칠 수 있을까?
  • 이 문제에서 관심 있는 현상(phenomenon)은 다음과 같습니다: 학습자들이 직종 간 보건의료 팀의 일원이 되도록 가르치는 것.
  • 이 현상을 이해하는 데 도움을 줄 수 있는 이론(theory)은 다음과 같습니다: 문화-역사적 활동 이론(Cultural-Historical Activity Theory, CHAT)

CHAT는 복잡하고 사회적으로 위치한(socially situated) 인간 활동에 초점을 맞춘 이론입니다.

 

  • 이 이론은 활동 체계(activity system)의 요소들 간 상호작용에 주목합니다. 활동 체계는
    • 주체(subject)(즉, 활동에 참여하는 사람);
    • 객체(object)(즉, 활동의 목적);
    • 활동을 매개(mediate)하는 도구(tools)(상징적 도구 [예: 언어] 및 물리적 도구 [예: 청진기]);
    • 규칙(rules)(즉, 활동을 안내하는 규범과 규정);
    • 공동체(community)(즉, 활동에 영향을 받는 집단); 그리고
    • 분업(division of labor)(즉, 공동체 구성원 간에 활동이 어떻게 나뉘는지)으로 구성됩니다 [25].

 

이 짧은 요약에서도 볼 수 있듯이, CHAT는 주체, 도구, 공동체와 같은 많은 개념(concepts)들로 구성되어 있습니다. 이론 내에서 이러한 개념들은 그 개념들이 어떻게 연결되는지를 명확히 하는 명제(propositions) 속에 존재합니다. 예를 들어, 이 이론의 한 명제는 다음과 같이 진술합니다:

인간은 집단적으로 행동하고, 행동을 통해 학습하며, 행동 안에서 그리고 행동을 통해 의사소통한다 [26].

 

이론(theory)은 우리가 현상을 이해하는 것을 돕기 위해 핵심 개념을 포함하는 여러 명제를 서로 관계(relation) 맺게 합니다. 예를 들어:

 

  • 명제 1 (Proposition 1): 인간은 집단적으로 행동하고, 행동을 통해 학습하며, 행동 안에서 그리고 행동을 통해 의사소통한다 [26].
  • 명제 2 (Proposition 2): 인간은 학습하고 의사소통하기 위해 도구를 만들고, 사용하고, 적응시킨다 [26].
  • 명제 3 (Proposition 3): 공동체는 의미를 만들고 해석하는 과정의 중심이다; 따라서 공동체의사소통, 학습, 행동의 중심이다 [26].

이 예시가 보여주듯이, CHAT는 우리가 관심 있는 현상을 이해하도록 돕습니다. 이론의 개념과 명제는 우리의 관심 현상을 이해할 수 있게 하는 렌즈(lens) 역할을 할 수 있습니다.

 

서로 다른 이론은 서로 다른 이해를 제공한다는 점을 기억하는 것이 중요합니다. 유사한 현상을 다루는 이론들은 아마도 몇 가지 공유된 개념을 가지고 있겠지만, 각 이론은 다른 이론에서는 사용되지 않는 개념들도 가지고 있을 것입니다. 게다가, 몇 가지 유사점이 있을지라도, 명제 내에서 개념들이 연결되는 방식은 각 이론마다 다를 것입니다. 또한, 명제들 간의 연결 또한 각 이론에서 고유할 것입니다. 따라서, 많은 이론이 동일한 현상을 다룰 수 있지만, 각 이론은 연구자가 그 현상을 고유한 방식으로 이해하도록 유도할 것입니다. 이는 HPE 연구자가 "내 연구에 올바른(right) 이론은 무엇인가?"라고 묻는 것이 특별히 유용하지 않음을 의미합니다. 현상을 연구하는 데 사용할 "올바른" 이론은 없습니다. 대신, 더 유용한 질문들은 다음과 같습니다:

  • 이 이론이 내 관심 현상을 다루는가?
  • 이 이론은 현상에 대한 나의 이해를 어떻게 구조화(structure)하는가?
  • 이러한 구조의 함의(implications)는 무엇인가?
  • 이 이론이 다루지 않는 현상의 측면은 무엇인가?

이를 설명하고 설명하기 위해 다수의 이론이 존재하는 현상의 직관적인 예는 학습(learning)입니다 [27]. 많은 서로 다른 학습 이론들이 존재하며, 각각은 무엇이 학습을 주도하는 중심적인 고려 사항인지, 바람직한 학습 성과는 무엇인지, 학습에 영향을 미치는 교수법은 무엇인지, 그리고 학습이 일어나는 조건은 무엇인지에 대해 서로 다른 강조점을 둡니다 [27]. 예를 들어,

  • 행동주의(Behaviorism)는 훈련생의 학습 과정에서 올바른 자극(stimuli), 반응(response), 그리고 반복(repetition)을 생성하는 것의 중요성을 강조합니다. 반면,
  • 사회적 구성주의(Social Constructivism)는 동료들과의 협력적인 방식으로 실제적 과제(authentic tasks)에 학습자가 능동적으로 참여하는 것을 강조할 것입니다.

 

3. 연구 현상과 관련된 이론을 어떻게 선택할 것인가?
(How to select a theory relevant to your phenomenon of study?
)

HPE 연구에서는 다양한 학문 분야의 서로 다른 많은 이론이 연구자들에 의해 사용됩니다. Box 3에서 우리는 HPE 연구에 사용될 수 있는 이론들을 나열하거나 설명하는 몇 가지 자원을 제시합니다. 이 자원들이 모든 것을 포괄하는 것은 아닙니다. 즉, 모든 학문 분야의 모든 이론을 나열하지는 않습니다. 대신, 이들은 HPE 연구자가 다양한 현상(phenomena)을 다루는 이론을 찾기 시작할 때 유용한 출발점(starting points)을 제공합니다. 이 자원들을 탐색하기 전에 미리 경고를 드립니다: 사용 가능한 이론의 엄청난 양과 다양성은 압도적일 수 있습니다. 우리의 경험상, 선택을 내리는 방법에 대해 베테랑 연구자의 조언을 구하는 것이 도움이 될 수 있습니다. 따라서 우리는 우리의 경력 동안 받은 조언들과 우리 자신의 경험(성공과 실패 모두)에서 얻은 교훈을 통합하여 이론 선택에 도움이 될 수 있는 일련의 고려 사항(considerations)으로 정리했습니다. 이것은 포괄적인 목록이 아닙니다. 그러한 편집물을 만들려면 그 자체로 책 한 권 분량의 원고가 필요할 것입니다. 대신, 우리는 성찰해 보기에 특히 중요하다고 생각되는 팁들을 선택했습니다. 우리는 이러한 고려 사항들을 여러분이 프로젝트를 위해 고려 중인 각 이론에 대해 물어봐야 할 질문(questions)의 형태로 구성했습니다.

 

Box 3 HPE 연구를 위한 이론을 나열하고/하거나 설명하는 자원 (Resources listing and/or describing theories for HPE research)

아래는 HPE 연구자들이 연구에 유용하다고 생각할 수 있는 이론들의 목록 및/또는 설명을 제공하는 책, 웹사이트 및 AI 도구(AI-tools)의 목록입니다. 이 자원들을 탐색하기 전에, 우리의 일부 동료들은 여러분의 관심 현상을 다루는 연구에 어떤 이론들이 사용되었는지 확인하기 위해 출판된 문헌을 검색하는 것이 유용하다고 생각했습니다. 이것들이 유용한 출발점이 될 수 있지만, 우리는 연구자들이 이를 다른(other) 어떤 이론이 유용할 수 있을지 고려하는 도약대(springboards)로 사용할 것을 권장합니다. 만약 연구자들이 현상을 연구하기 위해 지속적으로 같은 이론만 사용한다면, 그 현상에 대한 우리의 통찰력은 심각하게 제한될 것입니다 (즉, 만약 우리가 항상 나무를 땔감으로만 본다면, 우리는 그것을 토템 폴로 볼 기회를 결코 얻지 못할 것입니다).

책 (Books):
  • Cleland, J., & Durning, S. J. (Eds.). (2022). Researching medical education. John Wiley & Sons.
  • Dornan, T., Mann, K. V., Scherpbier, A. J., & Spencer, J. A. (2011). Medical education: theory and practice E-Book. Elsevier Health Sciences.
  • Norman, G. R., van der Vleuten, C. P., & Newble, D. I. (Eds.). (2012). International handbook of research in medical education (Vol. 7). Springer Science & Business Media.
  • Rees, C. E., Monrouxe, L. V., O’Brien, B. C., Gordon, L. J., & Palermo, C. (Eds.). (2023). Foundations of health professions education research: principles, perspectives and practices.
  • Swanwick, T., Forrest, K., & O’Brien, B.C. (2019) Understanding medical education. Evidence, theory and practice. (3rd ed) Wiley Blackwell
  • Varpio, L., O'Brien, B., Brown, M., Finn, G., Mordi, N., Cristancho, S., MacLeod, A. (Eds). 100+ Theories for Health Professions Education. Elsevier Ltd. (In Press).
웹사이트 (Website):
AI 도구 (AI-tools):

이 이론은 현상에 대한 나의 이해를 어떻게 구조화하는가? 그것은 구조 내에 무엇을 포함하고 (무엇을 포함하지) 않는가?
(How does this theory structure my understanding of the phenomenon? What does it (not) include in its structure?)

이론을 이해하기 위해서는 그 개념(concepts)과 명제(propositions)를 지도로 그려보는 것(map out)이 유용할 수 있습니다. 불행히도, 이론들이 독자들에게 그렇게 명시적이거나 명확하게 제시되는 경우는 드뭅니다. 따라서 우리는 보통 관심 있는 이론에 몰입(immerse)하고(즉, 이론에 대한 원전 및 2차 설명을 읽고), 이러한 매핑 활동(mapping activity)에 직접 참여하는 것이 필요하다고 생각합니다. 그러한 꼼꼼한 독해와 매핑 작업을 돕는 몇 가지 질문은 다음과 같습니다:

  • 이 이론을 뒷받침하는 중심 개념(concepts)은 무엇인가?
  • 개념들은 어떻게 명제(propositions)로 연결되는가?
  • 이론의 명제들은 어떻게 연결되고 상호 연결되는가?

이 질문들에 대한 답을 만들 때, 우리는 이러한 요소들이 여러분의 관심 현상(phenomenon of interest)에 대한 연구를 어떻게 구조화(structure)할지 성찰해 볼 것을 제안합니다. 예를 들어, 이론의 중심 개념은 연구의 초점을 지시할 것입니다.

 

  • 어떤 이론은 개인(individuals)(예: 훈련생, 교사, 환자), 집단(groups)(예: 학생 코호트, 보건의료 팀), 조직(organizations)(예: 병원, 대학), 네트워크(networks)(예: 병원 내 모든 수술 팀, 한 국가의 모든 교육 병원), 그리고/또는 사회(societies)(예: 전문 인증 학회, 한 국가의 문화적 규범)에 초점을 맞출 수 있습니다.
  • 이론의 개념은 유형적(tangible)(예: 의대생, 신경과 교수진)일 수도 있고 추상적(abstract)(예: 메타인지적 성찰, 또는 전문성)일 수도 있습니다.
  • 이론이 연구를 어떻게 구조화할지 이해하려면 이론의 개념과 명제가 관심 현상에 어떻게 주의를 집중시키는지 알아야 합니다. 반대로, 이는 연구자가 이론이 현상의 어떤 측면에 초점을 맞추지 않는지 고려할 것을 요구합니다.
  • 모든 이론은 현상의 일부 측면을 전경화(foreground)하고, 다른 측면은 배경에 남겨두거나(심지어 완전히 무시하거나) 합니다. 어떤 이론도 다면적인 현상의 완전한 복잡성을 포착할 수는 없습니다. 따라서 연구자는 이론에 무엇이 포착되고(captured) 무엇이 포착되지 않는지 인지해야 합니다.

 

이론의 초점이 내 연구의 목표와 일치하는가?
(Does the theory’s focus align with the aim of my study?
)

모든 이론은 현상의 일부(그리고 다른 것은 제외한) 측면에 주의를 기울이기 때문에, 연구자는 이론의 초점이 자신의 맥락이 허용하는 것 및 개인적인 관심사와 일치하는지 고려하는 것이 중요합니다. HPE 연구는 종종 목적(purpose)(예: 해결해야 할 문제 또는 다루어야 할 상황)에서 시작됩니다. 관심 있는 현상을 다루는 많은 이론이 있을 수 있지만, 모든 이론이 연구를 주도하는 배경 목적을 다루지는 않을 것입니다. 예를 들어, 사회적 요인이 전문직 정체성 형성(professional identity formation)에 미치는 영향을 이해하려는 관심에 의해 촉발된 연구라면, 연구자는 정체성에 대한 개인의 심리적 경험에만 초점을 맞춘 이론에 의존해서는 안 됩니다. 마찬가지로, 서로 다른 이론은 서로 다른 목적(예: 기술하기, 설명하기, 해방하기, 붕괴시키기, 또는 예측하기)을 내재하고 있습니다 [28].

Theories can be descriptive (i.e., naming and characterizing a phenomenon), explanatory (i.e., clarifying the relationships between phenomena), emancipatory (i.e., articulating the oppression of a people), disruptive (i.e., extending existing knowledge or refuting it), or predictive (i.e., predicting an outcome based on specific inputs).
  • 만약 연구를 주도하는 동기 부여 목적이 설명(explain)하는 것이라면, 붕괴(disrupt)를 목표로 하는 이론을 선택하는 것은 연구의 목표를 뒷받침하지 못할 것입니다.

여러분의 관심사와 이론의 초점 사이에 일치(alignment)가 있는지 판단하는 것은 프로젝트가 연구를 주도하는 목표를 충족하도록 보장하는 데 필수적입니다. 그러나 개인적인 관심사와 이론 사용이 더 나은 이론적 대안을 보지 못하게 만들 수도 있으므로, 이에 대해 성찰적(reflexive) 태도를 유지하는 것이 중요합니다 [29].

이론의 뿌리는 무엇인가? (What are the roots of the theory?) 

HPE 연구는 다양한 학문 분야의 이론을 활용하므로, 각 학문 분야와 그 분야 내의 다양한 학파들이 하나의 연구 전통(research tradition)(즉, 패러다임적 지향(paradigmatic orientation))에 뿌리를 두고 있음을 명심하는 것이 중요합니다.

 

  • 일부 패러다임은 연구가 실재에 대한 가장 객관적으로 정확한 설명을 위해 노력해야 한다는 가정에서 출발합니다(예: 후기 실증주의, post-positivism). 이러한 지향에서 이론은 "실재에 대한 가장 올바른 표상(representation)" [30,p.23]으로 취급되며, 따라서 연구자들은 변수 조작을 식별하거나, 인과 관계를 테스트하거나, 결과를 예측하거나, 경험적 사실이 다른 맥락에서 어느 정도 유지되는지 이해하기 위해 이론을 사용합니다. 이것은 종종 양적 연구(quantitative research)를 뒷받침하는 패러다임적 지향입니다 (Box 2에서 양적 및 혼합 연구에서의 이론 사용에 대한 간략한 설명을 참조하십시오). 대조적으로,
  • 질적 연구(qualitative research)는 해석주의(interpretivist), 구축주의(constructivist), 또는 구성주의(constructionist) 지향에서 작업하는 경향이 있습니다. 이러한 지향에서 연구자들은 실재에 대한 단 하나의 올바른 표상이 있다고 주장하지 않습니다. 대신 그들은 "많은 진실이 공존할 수 있다" [31,p.125]는 전제와 연구가 "여러분의 해석을 통해 이러한 진실들을 이해하는 것: 데이터 내의 특정 패턴을 식별하고 수집된 맥락 내에서 그 의미를 이해하려고 시도하는 것" [31,p.125]을 목표로 한다는 전제하에 작업합니다. 그렇다면 이론은 해석을 지원하는 도구(tool)로 사용됩니다 [30].

 

이러한 차이점을 고려할 때, HPE 연구에 사용을 고려 중인 이론의 패러다임적 지향(paradigmatic orientation)을 아는 것이 중요합니다. 만약 어떤 이론이 현상에 대한 가능한 여러 해석 중 하나를 명료화하기 위해 설계되었다면, 그것을 현상의 유일한 진실(the truth)을 표현하는 데 사용하는 것은 그 이론의 기초적인 지향과 양립할 수 없습니다(incommensurate). 우리는 한 패러다임의 이론이 다른 패러다임에서 수행되는 연구에 사용되도록 수정될 수 없다고 단언하고 싶지는 않습니다; 그렇게 하는 것이 가능할 수도 있습니다. 그러나, 이를 위해서는 수정을 정당화하고, 각 수정이 이론 내에서 부조화(incongruencies)를 일으키지 않는 방식으로 수행됨을 설명해야 합니다. 분명히, 그러한 수정은 이동의 대상이 되는 이론과 패러다임 모두에 대한 깊은 이해를 요구합니다.


Box 2 양적 연구 및 혼합 연구 방법에서의 이론 사용 (Theory use in Quantitative and Mixed-Methods Research)

후기 실증주의(Post-positivist)의 이론 정의는 변수(variables)와 그들 간의 관계를 강조합니다. 초점은 관찰 가능한 사실(observable facts)에 있습니다. 종종 이 패러다임의 이론들은 상호 연결된 일련의 가설(hypotheses)(즉, 만약-그러면[if-then] 진술)로 공식화되며, 때로는 독립 변수(independent), 매개 변수(mediating), 종속 변수(dependent) 및 그들 간의 관계를 나타내는 시각적 모델(visual model)로 제시되기도 합니다 [32]. 양적 연구(quantitative research) 내에서 목표는 주로 현상을 설명하거나 예측(explain or predict)(예: 인과 관계)하는 것입니다 [32]. 따라서 양적 연구에서의 이론 사용은 주로 연역적(deductive)입니다. 이론은 연구 시작 시점에 선택되며, 전체 연구 과정을 안내합니다. 이는 또한 일단 이론이 선택되면 변경할 수 없음을 의미합니다.

혼합 연구 방법(Mixed-methods, MM)은 일반적으로 연구 질문에 답하기 위해 양적 방법과 질적 방법을 결합합니다. 따라서 MM에서의 이론 사용은 양적 지향과 질적 지향 모두의 원칙에 의해 형성될 수 있습니다. MM 연구에서 이론이 어떻게 사용될 수 있는지 고려하는 한 가지 방법은 연구에서 양적 방법과 질적 방법이 적용되는 순서를 성찰해보는 것입니다. 만약 MM 연구가 양적으로 시작된다면, 이론 사용은 연역적(deductive)일 가능성이 높습니다. 만약 질적으로 시작한다면, 이론 사용은 귀납적(inductive)일 가능성이 높습니다. 질적 및 양적 방법이 동시에 사용된다면, 이는 아마도 귀납적 이론 사용과 연역적 이론 사용의 조합으로 이어질 것입니다 [33].

기타 고려 사항 및 두 가지 주의 사항 (Other considerations and two caveats) 

우리는 고려 중인 이론이 시간이 지남에 따라 어떻게 진화(evolved)해 왔는지, 누가 그것을 사용해 왔으며, 어떻게 사용했는지 고려하는 것도 중요하다고 제안합니다 [11]. 이론은 다양한 학자들이 자신의 조사와 해석을 바탕으로 수정함에 따라 항상 진화합니다. HPE 연구자들은 자신이 이론의 어떤 버전을 사용하고 있는지, 그리고 왜 그 버전을 사용하는지에 대해 명확히 하는 것이 좋습니다. 또 다른 고려 사항은 이론과 관련하여 제기된 잠재적인 비판(critiques)을 인식하는 것입니다. 시간이 지남에 따라 이론이 반증되었거나, 연구자들이 특정 이론을 사용하는 것의 오류(fallacies)를 지적했을 수도 있습니다. 이론의 진화에 대해 잘 아는 것은 연구자의 책임입니다. 추가적으로, 우리는 이론의 글로벌 기원(global origins)을 인지해야 합니다. 특정 글로벌 노스(Global North, 북반구 선진국) 이론은 글로벌 사우스(Global South, 남반구 개발도상국) 이론이 선호하지 않는 특정 개념을 선호할 수 있으며, 그 반대도 마찬가지입니다 [34]. 다시 말해, 모든 이론이 모든 맥락과 일치(congruent)하는 것은 아닙니다.

 

우리가 HPE 연구를 위한 이론 선택을 설명한 방식은 문제가 될 수 있는 두 가지 가정을 전달할 위험이 있습니다. 따라서 우리는 이러한 가정을 명시적으로 거부하고자 합니다.

  • 첫째, 우리의 설명은 이론이 연구자와 떨어져 존재하며, 우리가 이론을 "기성품처럼(off the shelf)" 선택한 다음 그것이 우리의 목적, 관심사 및 연구 지향과 일치하는지 고려한다고 암시합니다. 그러나 우리는 연구자가 우리가 사용하는 이론에서 분리되어 있지 않다고 주장합니다. 이론을 읽고 깊이 이해하는 과정에서 연구자는 변화합니다. 그들의 마음은 확장되고, 이전의 가정은 도전을 받으며, 성찰은 새로운 지평을 갖게 됩니다 [18]. 이것은 한탄할 상황이 아닙니다. 단순히 알고 있어야 할 상황일 뿐입니다. 왜냐하면 여러분이 읽는 이론은 향후 작업에서 다른 이론보다 특정 이론을 선호하도록 만들 것이기 때문입니다. 우리는 연구자들이 자신이 이미 알고 있는 이론과 일치하지 않는 이론을 포함하여, 편안하게 사용할 수 있는 이론의 레퍼토리(repertoire)를 지속적으로 추가할 것을 제안합니다.
  • 둘째, 우리의 설명은 연구자가 이론을 한 번 선택하면 그 선택을 변경할 필요가 없음을 암시합니다. 이것은 정확한 가정이 아닙니다. 해석주의(interpretivist), 구축주의(constructivist), 또는 구성주의(constructionist) 지향에서 작업하는 연구자들은 이론 선택을 변경해야 할 가능성에 대해 열린 자세를 유지해야 합니다. 예를 들어, 선택된 이론이 참여자들의 경험 설명과 일치하지 않을 수 있습니다. 또는 선택된 이론이 연구 데이터의 중요한 측면과 일치하지 않는 개념이나 명제에 초점을 맞추고 있을 수도 있습니다. 연구 과정 중에 연구자가 이론 선택을 변경해야 한다고 깨닫는 데에는 여러 가지 이유가 있을 수 있습니다. 이것은 잘못 수행된 조사의 징후가 아닙니다. 사실, 이는 연구자가 참여자가 제공한 설명, 연구 맥락을 형성하는 요인, 그리고 관심 현상에 대해 연구자가 갖게 된 이해의 성장 등 연구의 복잡성(complexities)에 주의 깊게 귀를 기울이고 있다는 표시입니다. 그러나 연구자가 최종적인 이론 선택이 어떻게 이루어졌는지, 그리고 이 결정에 어떤 요인이 작용했는지를 설명하는 것은 중요합니다. 이는 논문의 방법론 섹션 및/또는 고찰(discussion)에서 설명될 수 있습니다. 이러한 선택에 대해 투명(transparent)할 때만 연구의 엄격성(rigor)이 진정으로 평가될 수 있습니다.

 

4. 질적 연구에서 언제 이론을 사용할 것인가: 두 가지 접근법 
(When to use theory in qualitative research: Two approaches)
 

HPE 연구자가 자신의 질적 연구(qualitative study)에 어떤 이론을 사용할지 결정했다면, 또 다른 중요한 결정이 내려져야 합니다: 이론이 언제 연구 설계(study’s design)에 들어올 것인가? 다른 이들이 세운 전통에 따라 [12,28], 우리는 이 질문에 답하기 위해 연구 설계의 세 가지 시점과 일치하는 두 가지 접근법을 제안합니다.

이론으로 시작하기: 완전히 이론에 입각한 귀납적 연구 설계
(Starting with theory: Fully-theory informed inductive study design)
 

HPE 연구자는 연구를 개발하는 데 함께할, 그리고 연구를 통해 다룰 이론을 식별함으로써 조사를 시작할 수 있습니다. 연구가 이론과 함께 시작될 때, 이론은 연구의 초기(outset)부터 관심 현상(phenomenon of interest)이 어떻게 정의되고 이해될지를 지시합니다. 이론은 연구의 연구 질문(research question)과 연구 설계 및 수행의 모든 요소—연구 설계(예: 어떤 방법론을 사용할지)부터 데이터 수집 고려 사항(예: 누구를 참여자로 표집할지, 어떤 종류의 데이터를 수집할지), 해석(예: 어떤 데이터 분석 접근법을 사용할지)에 이르기까지—를 형성합니다. 이론이 연구의 모든 요소에 정보를 제공(inform)하기 위해 사용될 때, 이론의 개념과 명제는 연구자의 연구 설계 결정을 안내합니다. 예를 들어, 이 접근법에서 이론은 다음 사항들에 정보를 제공합니다:

  • 연구 질문 개발 (Research question development):
    • (예: 관심 현상에 대한 연구의 초점은 무엇이 될 것인가—개념, 명제, 또는 둘 이상의 명제 간의 관계인가?)
  • 표집 기준 (Sampling criteria):
    • (예: 이론의 개념과 명제는 어떻게 특정 인구집단(specific populations)에 주의를 집중시키는가?
    • 연구 환경에서, 어떤 인구집단이 관심 현상에 대한 관련 통찰력을 가지고 있겠는가?)
  • 연구 환경 선택 (Selection of study setting):
    • (예: 연구의 맥락에서, 이론의 개념 및 명제와 일치하는 방식으로 관심 현상을 연구할 수 있는 특정 환경은 어디인가?
    • 연구자가 이론에서 전경화(foregrounded)된 종류의 사람, 상황, 및/또는 활동에 쉽게 접근할 수 있는 맥락이 있는가?)
  • 데이터 수집 방법 (Data collection methods):
    • (예: 이론의 개념과 명제는 어떻게 관심 현상의 특정 측면에 대한 인식(awareness)을 유도하는가?
    • 그 현상의 측면에 대한 통찰력을 얻기 위해 연구 맥락에서 어떤 데이터 수집 방법을 사용할 수 있는가?
    • 그러한 방법들은 이론의 초점과 일치하도록 어떻게 설계되어야 하는가?)
  • 데이터 분석 접근법 (Data analysis approaches):
    • (예: 연구는 귀납적(inductive)일 것이지만, 이론을 분석적 렌즈(analytical lens)로 사용하는 일부 연역적 분석(deductive analysis)이 있을 것인가 [즉, 이론과 일치하지 않는 데이터만 귀납적으로 분석할 것인가]?
    • 이론이 민감성 개념(sensitizing concept)으로 사용되어 데이터 분석을 안내하되, 데이터에 엄격하게 사전 정의된 코딩 구조(rigid pre-defined coding structure)로 강요되지는 않을 것인가?)

이 예시들이 보여주듯이, 이 접근법에서 이론은 연구자의 주의를 현상으로 향하게 하고 현상을 조사하는 방법에 대한 결정을 안내합니다. 이론으로 시작하여 질적 연구를 구축하는 것을 완전히 이론에 입각한 귀납적 연구 설계(fully theory-informed inductive study design)라고 합니다 [28].

 

완전히 이론에 입각한 귀납적 연구 설계의 HPE 기반 예시를 보려면,

  • 형상화된 세계 이론(Figured Worlds theory)을 통해 의학 교육 분야를 조사한 McOwen의 박사 연구를 살펴보는 것을 제안합니다. 구체적으로, 그녀가 자신의 연구 결정을 알리기 위해 형상화된 세계 이론을 어떻게 사용했는지 자세히 설명한 원고 [35]와 해당 연구 설계를 통해 도출된 결과를 보고한 논문 [35]을 검토할 것을 권장합니다.
  • 또 다른 예시는 O’Leary와 동료들의 원고 [36]로, 이들은 이론이 데이터 수집 방법을 개발하는 데 어떻게 사용되었는지, 그리고 이론이 데이터 분석 접근법을 어떻게 형성했는지에 대한 예시를 제공합니다.

데이터 분석 과정 중에 이론 사용하기: 이론이 정보를 제공하는 귀납적 데이터 분석
(Using theory during data analysis processes: Theory-informing inductive data analysis)

때때로 HPE 연구자는 관심 현상을 조사하는 데 어떤 이론이 가장 관련성이 있을지 확신하지 못합니다. 때때로 연구자가 생각하기에 문제의 핵심에 있을 수도 있는 현상이 여러 가지일 수 있습니다. 때때로 연구자는 어떤 이론이 관련될지 감을 잡기 위해 먼저 데이터 수집을 시작해야 하므로 이론 선택을 미루어야(delay) 할 수도 있습니다. 이러한 상황에서 HPE 연구자는 데이터 분석 과정 중에 이론을 연구에 도입할 수 있습니다. 이 접근법을 이론이 정보를 제공하는 귀납적 데이터 분석(theory-informing inductive data analysis)이라고 부릅니다 [28].

 

이 접근법이 데이터 분석에 통합될 수 있는 시점은 두 번 있습니다.

  • 첫째, 이론은 데이터 수집 및 분석의 순환(cycles of data collection and analysis) 중에 도입되어 향후 순환에 정보를 제공할 수 있습니다.
    • 질적 연구 설계는 종종 데이터 수집과 분석의 반복적인 순환(iterative cycles)을 포함합니다. 한 순환에서, 소량의 데이터가 수집되고 연구자들에 의해 분석됩니다; 그 분석에서 얻은 통찰력은 데이터 수집 과정을 수정하는 데 사용되어, 추가적인 데이터 수집을 통해 해당 통찰력과 관련된 추가 정보를 수집할 수 있게 합니다. 다음 순환에서는 수정된 데이터 수집 과정이 또 다른 소량의 데이터를 수집하는 데 사용되며, 이 데이터는 다시 분석되고, 그 분석 결과는 다시 데이터 수집 과정을 정교화하는 데 사용됩니다.
    • 이론은 이러한 반복적인 순환 중에 도입되어 데이터 분석과 데이터 수집 과정의 수정을 돕는 정보를 제공할 수 있습니다. 이 상황에서, 연구자는 일반적으로 연구 초기부터 여러 다른 이론을 이러한 순환에 정보를 줄 수 있는 가능한 도구로 염두에 둡니다.
    • 분석 순환 동안, 연구자는 특정 이론과 데이터의 일치(alignment)를 식별할 수 있을 때까지 잠재적으로 관련성이 있다고 판단한 모든 이론을 고려합니다. 이론의 개념과 명제는 데이터 수집 도구의 수정을 돕고 진행 중인 데이터 분석을 형성하는 데 도움을 줄 수 있습니다. 이 접근법에서는 불일치 데이터(disconfirming data)—즉, 선택된 이론이 참여자의 경험과 부합하지 않음을 증명할 수 있는 데이터—를 의도적으로 찾아내는 것이 중요합니다.
    • 또한, 서로 다른 방법론적 접근법(예: 구축주의 근거 이론[constructivist grounded theory], 현상학[phenomenology], 사례 연구[case study] 등)은 데이터 수집 도구와 데이터 분석 방법에 이론을 통합하는 전략이 다를 수 있다는 점에 유의해야 합니다. 따라서 우리는 각 연구자가 자신이 선택한 방법론에 이론을 어떻게 통합할 수 있는지 탐구할 것을 조언합니다.
  • 둘째, 이론은 모든 데이터 수집이 수행된 후에 데이터 해석(data interpretations)에 정보를 제공하기 위해 연구에 도입될 수 있습니다.
    • 이 상황에서 연구자가 연구가 끝날 때까지 이론에 대한 어떠한 고려도 괄호 치고 배제(brackets off)하는 것은 아닙니다. 연구자는 이론 없는 태도(theory-free stance)를 취하지 않습니다. 대신, 연구자는 아마도 일반적인 지향(general orientation)(예: 전문직 정체성 형성에 관심이 있음; 젠더가 특정 상황에 영향을 미치고 있다고 생각함)을 가지고 있지만, 그 일반적인 지향의 넓은 우산 아래 있는 어떤 특정 이론이 참여자의 경험과 일치할지 확신하지 못하는 것입니다
      • (예: 전문직 정체성 형성에 대한 심리학적 초점의 이론이 관련될지 사회적 초점의 이론이 관련될지 불분명함;
      • 어떤 젠더 초점 이론이 연구 데이터에 적용될 수 있을지 불분명함).
    • 따라서 연구자는 관련될 수 있는 이론의 부류(class)에 대한 막연한 감각은 있지만, 그 부류 내의 어떤 이론이 선택될지는 모릅니다. 연구자는 특정 이론을 적용하지 않고 연구 데이터를 수집하고 (주로 기술적인) 분석을 수행합니다. 이론은 고찰(Discussion)에서 연구 결과의 해석에 정보를 제공하기 위해 연구에 들어옵니다. 이 접근법의 예시는 의학 교육 분야에서 정교수 직급 달성에 대한 개인들의 경험(즉, 승진 여정에 대한 이야기)을 다룬 연구에서 볼 수 있습니다 [28,37]. 해당 원고는 연구자가 연구에서 페미니스트 지향(feminist orientation)을 가지고 있었지만, 모든 데이터가 수집되고 주제 분석(thematic analysis)이 완료된 후에야 데이터 해석에 정보를 제공할 특정 페미니스트 이론을 선택했음을 설명합니다.

5. 질적 연구에서 이론을 사용하는 방법: 이론적 틀 구축하기
(How to use theory in a qualitative study: Constructing a theoretical framework)

HPE 연구자가 자신의 질적 연구에 '언제(when)' 이론을 도입할지 감을 잡았다면, 그 다음에는 그 목표를 '어떻게(how)' 실현할지 결정해야 합니다. 정의상 이론은 현상에 대한 추상적 설명(abstract descriptions)입니다. 이론은 현상이 발생할 다양한 맥락에 그 설명이 적용될 수 있도록 반드시 추상적이어야(must be abstract) 합니다. 이는 즉, 특정 맥락에서 수행되는 연구에 이론을 적용하기 위해서는 HPE 연구자가 연구 중인 현상의 구체성에 맞게 이론을 번역(translate)하거나 적용(apply)해야 함을 의미합니다. 연구의 현상에 이론을 적용한 산출물이 바로 이론적 틀(theoretical framework)로 간주되는 것입니다. 또는, Varpio와 Young이 설명한 바와 같이:

이론적 틀(theoretical framework)
(연구에 적용되기 위해 이론의 기초 요소(foundational elements)와 구조 [즉, 개념, 명제, 그리고/또는 명제 간의 연결]를 변형하는) 과정(process)이자
(연구의 성과 확산물(disseminations)에 이론과 그것이 연구 적용을 위해 어떻게 변형되었는지를 제시하는) 산출물(product)입니다.
연구자는 개념적 틀(conceptual framework)의 다른 요소들과의 일치를 보장하는 방식으로, 이론의 추상적 요소들을 이론을 연구에 적용하는 이론적 틀로 변형합니다 [38].

 

이론적 틀을 구축하는 데 단 하나의 "올바른(right)" 방법은 없다는 점에 유의하십시오 (개념적 틀(conceptual framework)과 이론적 틀(theoretical framework)의 차이점에 대한 간략한 설명은 Box 4를 참조하십시오). 대신, 연구자는 이론 내의 개념(concepts)과 명제(propositions), 그리고 이론 내에서 명제들이 연결되는 방식을 지도화(map out)해야 합니다. 그런 다음, 연구자는 그러한 요소들을 손에 쥐고, 그 개념, 명제, 그리고 명제 간의 관계가 자신의 연구에서 어떻게 조작화(operationalized)될 것인지에 대한 결정(decisions)(및 정당화(justifications))을 내려야 합니다.

 

이를 예시하기 위해, 앞서 제시했던 HPE 문제를 고려해 봅시다:

 

  • 어떻게 하면 내 학습자들이 직종 간 보건의료 팀(interprofessional healthcare teams)의 일원이 되도록 가르칠 수 있을까? 우리는 앞서 문화-역사적 활동 이론(CHAT)이 이 문제를 해결하는 데 도움이 될 수 있다고 제안했으며, 그 이론의 몇 가지 개념명제를 지도화했습니다. 우리의 관심 현상을 연구하기 위해 CHAT를 사용하는 것은, 예를 들어,
    • 직종 간 보건의료 팀이 어떻게 하나의 공동체(community)가 되는지, 그리고
    • 의대생(즉, 주체[subject])이 도구(tools)(예: 의학 용어[medical jargon] 및 청진기), 규칙(rules)(즉, 공식적 및 비공식적 규칙 모두), 그리고 팀을 구성하는 직종 간의 분업(division of labor)에 대한 사회적 기대에 의해 매개(mediated)되는 환자 진료 활동을 통해 어떻게 그 공동체에 합류하는 것을 배우는지를 고려하게 할 것입니다.
  • 연구자는 아침 회진(morning rounds)을 연구하기로 결정할 수 있는데, 왜냐하면 이러한 회의 중에는 보건의료 팀의 다양한 구성원과 여러 다른 도구를 관여시키는 (많은 목적을 포함한) 많은 활동이 일어나기 때문입니다. 의대생들은 어떤 활동이 자신을 포함하는지(그리고 포함하지 않는지)(즉, 어떤 활동이 자신의 분업 범위[division of labor purview] 내에 있는지) 배워야 합니다. 연구자는 연구를 촉발한 문제를 해결하는 가장 좋은 방법이 회진을 관찰(observations)하는 것이라고 결정할 수 있습니다.
  • 이 연구의 연구 질문(research questions)은 다음과 같을 수 있습니다:
    • 의대생들은 아침 회진 활동에서 직종 간 보건의료 팀의 구성원들과 어떻게 상호작용(engage)하는가?
    • 의대생들은 그러한 상호작용을 통해 어떤 전문직업적 기대(예: 규칙, 분업)를 배우는가?

 

그렇다면 이 연구의 이론적 틀(theoretical framework)

 

  • (a) 특정 맥락에서의 연구를 뒷받침하기 위해 CHAT의 추상적 개념과 명제를 변형하는 과정(process)이자,
  • (b) 성과 확산물(dissemination)(예: 연구 원고)에 제시(되고 정당화)될 그러한 변형의 산출물(product)입니다.

 

이 예시가 보여주듯이, 연구자는 이론적 틀을 구축하기 위해 많은 결정을 내립니다. 이러한 결정들은 "맞거나" "틀린" 것이 아닙니다; 대신, 그것들은 합리적으로 정당화 가능(reasonably justifiable)해야 합니다.

 

  • 따라서 이론적 틀은 연구들이 동일한 이론을 사용하더라도 각 연구마다 고유할 것입니다.
  • 게다가, 질적 연구에서 이론적 틀은 연구 과정 중에 변경되어야 할 수도 있습니다. 질적 연구는 일반적으로 연구 참여자와의 지식의 공동 구성(co-construction of knowledge)에 달려 있습니다. 완전히 이론에 입각한 귀납적 연구 설계(fully theory-informed inductive study design)를 수행할 때, 이론적 틀은 데이터 수집이 시작되기 전에 생성되므로, 연구자가 참여자와 작업하고 관심 현상에 대한 통찰력을 얻음에 따라 변경될 가능성이 높습니다.
    • 우리의 예시로 돌아가서, 연구자는 (데이터 수집 과정 초기에) 의대생들이 보건의료 팀의 비의사(non-physician) 구성원들과 직접 상호작용하는 경우가 거의 없다는 것을 깨달을 수 있습니다;
    • 대신, 지도 전문의(supervising physician)가 주로 학습자들에게 진료 팀의 다른 구성원들과 특정 방식으로 회진 활동에 참여하도록 지시합니다.
  • 그러면 연구자는 자신의 이론적 틀을 조정해야 합니다 (예: 의대생을 활동 체계의 주체[subject]로 설정하는 대신, 지도 전문의(attending physician)를 주체로 위치시킴). 이는 연구의 연구 질문을 다음과 같이 변경할 것입니다:
    • 지도 전문의들은 의대생들이 아침 회진 활동에서 직종 간 보건의료 팀의 구성원들과 상호작용하도록 어떻게 지시하는가?
    • 의대생들은 그러한 지시된 상호작용을 통해 어떤 전문직업적 기대(예: 규칙, 분업)를 배우는가?

요컨대, 이론을 통해 현상을 연구할 때, 여러분은 구축한 틀이 상황, 사람, 그리고/또는 관심 과정과 잘 맞지 않는다는 것을 깨달을 수 있습니다. 따라서 질적 연구자는 자신의 이론적 틀이 조정되어야 할(때로는 상당히) 가능성에 대해 열린 자세를 유지해야 합니다. 이는 성찰성(reflexivity)에 대한 헌신(즉, 연구자의 주관성[subjectivity]과 맥락이 연구에 어떤 영향을 미치는지 지속적이고 자의식적으로 평가하고 비판하는 것)을 요구합니다 [29,p.242].


Box 4. 개념적 틀 vs. 이론적 틀 (Conceptual vs. Theoretical Framework)

  • 개념적 틀(conceptual framework)은 연구를 형성하는 요소들을 식별하고 그러한 요인들을 논리적으로 연결하는 과정(process)입니다 [39]. 개념적 틀의 5가지 핵심 요소는 다음과 같습니다:
    • (1) 맥락적 고려 사항(contextual considerations) (예: 연구를 지원하는 데 가용한 자원; 연구를 주도하는 동기);
    • (2) 관련 기존 지식(relevant existing knowledge) (예: 현상에 대해 이미 알려진 것; 연구가 다룰 알려진 지식의 격차);
    • (3) 연구 지향(research orientations) (예: 연구의 설계와 과정을 정향하는 패러다임[paradigm]);
    • (4) 성과 확산/발표 고려 사항(dissemination considerations) (예: 연구자가 결과를 발표하기를 희망하는 저널에서 지지하는 연구 전통); 그리고
    • (5) 이론적 틀(theoretical framework) [38].

 

이론을 사용하여 연구 문제를 식별하기: 실제 예시
(Using theory to identify a research problem—a worked example
)

HPE(보건의료교육) 관련 현상을 이해하는 데 여러 이론이 사용될 수 있으므로, 이 섹션에서는 두 가지 서로 다른 이론이 동일한 상황을 연구하는 데 어떻게 적용될 수 있는지에 대한 예시를 제공합니다. 이러한 예시는 각 이론이 연구자의 주의를 이끄는 방식에 따라 동일한 사례의 서로 다른 측면이 어떻게 연구의 초점이 되는지를 보여줍니다. 먼저 사례(제목: 자리를 잡아가기 [Finding my feet])를 제시합니다. 그런 다음 두 가지 다른 이론인 자기조절학습(Self-Regulated Learning, SRL) [40]과 실천 공동체 및 실천 지형(Communities & Landscape of Practice, CoP&LoP) [41]이 이 사례를 바탕으로 어떻게 연구에 정보를 제공할 수 있는지에 대한 예시를 제시합니다. 우리는 이 이론들이 사례 내에서 뚜렷하게 다른 초점을 제공하기 때문에 선택했습니다.

  • SRL이 개인(individual)과 그들의 인지 과정(cognitive processes)에 초점을 맞추는 반면, CoP&LoP는 개인 간 또는 개인 집단 간의 상호작용(interactions)에 초점을 맞춥니다. 각 이론에 대해 우리는 이론에 대한 간략한 요약을 제공하고, 각 이론이 사례의 특정 측면을 어떻게 강조하는지 설명하며, 이론에 입각한 연구 질문과 연구 설계를 제안합니다.

상호 비교를 돕기 위해 Table 1에서 각 이론의 뿌리, 각 이론의 초점, 이론이 이론적 틀을 어떻게 형성하는지, 그리고 연구가 완전히 이론에 입각한 귀납적 연구 설계(fully theory-informed inductive study design) 또는 이론이 정보를 제공하는 귀납적 데이터 분석(theory-informing inductive data analysis) 설계를 사용할 때 각 이론이 연구 질문의 구성을 어떻게 지시하는지에 대한 개요를 제공합니다.

 

Table 1. 사례 ‘자리를 잡아가기’에 이론적 렌즈 적용하기; 이론이 연구자의 초점을 어떻게 지시하고 연구 질문 구성에 어떤 영향을 미치는지에 대한 설명.

특징 자기조절학습 (Self-Regulated Learning, SRL) 실천 공동체 및 실천 지형 (Communities & Landscape of Practice, CoP&LoP)
이론의 뿌리 (Roots of the theory) 사회인지 이론 (Social cognitive theory) 사회적 학습 이론 (Social learning theory)
초점 (Focal Point) 개인의 인지, 행동, 동기 (Individual cognition, behavior, motivation) 사회적 상호작용, 관계, 구조 (Social interactions, relationships, structures)
이론적 틀 (Theoretical Framework) 개인 내적 과정(intra-personal processes)으로서의 학습에 초점을 맞춤 개인 간 과정(inter-personal processes)으로서의 학습에 초점을 맞춤
연구 질문: 완전히 이론에 입각한 귀납적 연구 (Fully theory-informed inductive study) 학습자가 목표를 달성하기 위해 학습을 계획, 모니터링, 조절하는 과정(process)에 초점을 맞춤 학습자가 공동체 및 지형 내에서 타인과 상호작용하고 참여하는 방식(ways)에 초점을 맞춤
연구 질문: 이론이 정보를 제공하는 귀납적 데이터 분석 (Theory-informing inductive data analysis) 학습자가 학습을 최적화하기 위해 사용하는 전략(strategies)에 초점을 맞춤 학습을 형성하는 맥락적 요인(factors)과 관계에 초점을 맞춤

사례: 자리를 잡아가기 (The case: Finding my feet)

Alex는 일반 내과 2년 차 전공의(resident)입니다. 그녀는 매우 들떠있지만, 동시에 모든 것에 압도당하고 있습니다. 예를 들어, 전공의 프로그램과 보건의료 팀 동료들의 기대, 환자 및 임상 사건과의 상호작용, 임상 환경의 분주함 등이 그렇습니다. 최근 그녀는 신장내과(nephrology) 로테이션을 시작했습니다. 그녀는 뛰어나고 싶고 감독자(supervisors)들의 눈에 유능하게 보이고 싶어 합니다. 그러나 입원 병동의 일상 업무는 힘들고 Alex는 끊임없이 뒤쳐져 있다고 느낍니다. 매일 그녀는 늦은 밤 집에 돌아오면 병태생리학과 약리학을 공부하겠다고 다짐하는데, 왜냐하면 그 분야가 가장 부족하다고 느끼기 때문입니다. 또한, 그녀는 환자 관리(patient management)와 관련해서는 간호사들의 눈에 자신이 무엇 하나 제대로 하는 게 없다고 느낍니다. 간호사 외에도 Alex는 다른 보건 전문가들과 협력해야 하지만, 솔직히 말해서 그녀는 여전히 모든 사람의 역할과 책임이 무엇인지, 그리고 그들이 자신에게 무엇을 기대하는지 배우려고 노력 중입니다. 팀의 선임 의사들로부터 피드백을 받을 때면, 주로 임상 추론(clinical reasoning)과 환자 관리 기술에 초점이 맞춰져 있습니다. Alex는 해당 병동에서 15년 넘게 근무한 전문 간호사(Nurse Practitioner, NP)와 함께 일하는 것을 즐겼습니다. NP는 어떤 서식을 어디에 써야 하는지, 누구에게 전화해야 하는지, 심지어 선호되는 처방 약물이 무엇인지와 같은 실무적인 측면을 안내해 주었을 뿐만 아니라, 감독자들이 해주지 못하는 방식으로 복잡한 임상 추론과 환자 관리 결정을 이해하도록 도와주었습니다. Alex는 NP가 하루 종일 매일 병동에 있는 반면, 그녀의 감독자들은 회진을 위해 잠시 들렀다가 다시 떠난다는 점을 알아차렸습니다.


자기조절학습(SRL)이 사례에 적용되는 방식
(How self-regulated learning (SRL) can be applied to the case
)

SRL의 핵심 전제 (Central premise of SRL)

  • SRL은 학습을 개인적, 행동적, 환경적 요인 간의 역동적인 상호작용으로 설명하는 사회인지 이론(social cognitive theory)에 기반을 두고 있습니다 [40].
  • 또는 Pintrich (2000)가 정의한 바와 같이, “자기조절학습 또는 자기조절은 학습자가 자신의 학습 목표를 설정하고, 자신의 목표와 환경의 맥락적 특징에 의해 안내되고 제한받으며, 자신의 인지, 동기 및 행동을 모니터링, 조절 및 통제하려고 시도하는 능동적이고 구성적인 과정입니다” [42,p.453].
  • SRL은 학생들이 학습 목표를 달성하기 위해 자신의 인지, 행동, 동기를 어떻게 계획(plan), 모니터링(monitor), 통제(control)하는지를 설명합니다.

SRL의 주요 개념 (Key concepts of SRL)

다양한 SRL 모델이 존재하지만, 일반적으로 학습이 일어나는 세 가지 순환적 단계(cyclical phases)를 포함합니다:

  • 사고 전 단계(Forethought phase): 학생이 당면한 (학습) 과제를 분석하고 무엇을 어떻게 배울지에 대한 목표를 설정하는 단계.
  • 수행 단계(Performance phase): 학생이 현재의 학습과 학습 목표를 향해 얼마나 진전하고 있는지를 모니터링하고 통제하는 단계.
  • 성찰 단계(Reflection phase): 학생이 목표를 어느 정도 달성했는지 성찰하고 다음번을 위해 학습 전략을 수정해야 할지 결정하는 단계 [40].

학생들이 학습을 모니터링하고 조절하기 위해 사용하는 전략은 일반적으로 세 가지 범주로 나뉩니다:

  • 인지 전략(Cognitive strategies): 학생이 학습해야 할 내용을 선택 및 조직화하고 이를 사전 지식과 통합하기 위해 사용하는 전략.
  • 메타인지 전략(Metacognitive strategies): 학생이 자신의 학습과 이해를 모니터링하고 필요에 따라 인지 전략을 조정하기 위해 사용하는 전략.
  • 자원 관리 전략(Resource management strategies): 학생이 외부 자원(예: (학습) 환경 내)뿐만 아니라 내부 자원(예: 노력, 시간, 주의력)이 학습 목표 달성에 어떻게 도움이 될 수 있는지 방법을 찾는 데 사용하는 전략 [43].

추가적으로, SRL은 학습에 대한 학생의 동기(motivation), 더 구체적으로는 자기효능감(self-efficacy) 신념(즉, 과제를 완수하고 성공할 수 있는 능력에 대한 학습자의 자기 평가)도 다룹니다.

 

사례에 SRL 적용하기 (Applying SRL to the case)

  • SRL은 Alex가 유능한 보건의료 전문가가 되겠다는 목표를 가지고 자신의 (직장 내) 학습을 자기 조절하는 방식을 전경화(foregrounds)합니다. SRL은 우리의 시선을 여러 방향으로 이끌 수 있지만, 이 경우에는 자기 모니터링(self-monitoring), 자기효능감(self-efficacy), 그리고 자원 관리(resource management) 문제에 초점을 맞춰 보겠습니다.
  • SRL 렌즈를 통해 Alex 경험의 다양한 측면이 부각됩니다:
    • Alex는 뛰어나고 싶어 하며 매우 들떠 있습니다;
    • 자신의 지식(병태생리학, 약리학)에 대한 자기 평가;
    • 그녀가 학습을 위해 사용하는 전략;
    • 전공의 프로그램과 그녀가 속한 팀이 설정한 기대에 대한 그녀의 인식; 그리고
    • 자기효능감의 부족 등입니다.
  • 이러한 Alex 경험의 요소들은 함께 연구에 이론을 도입하는 특정 접근법과 일치하는 SRL에 입각한 연구 질문을 구성하기 위한 출발점을 제공합니다:

완전히 이론에 입각한 귀납적 연구 설계(fully theory-informed inductive study design)를 위한 SRL 기반 연구 질문:

  • ○ 내과 2년 차 전공의들은 직장 내 학습 중 학습을 자기 조절하기 위해 간호사와 전문 간호사의 피드백을 어떻게 사용하는가?
  • ○ 내과 2년 차 전공의들은 직장 내 학습 중 자신의 역량 개발을 모니터링하고 성찰하기 위해 어떤 피드백 단서(cues)를 사용하는가?

이론이 정보를 제공하는 귀납적 데이터 분석(theory-informing inductive data analysis) 설계를 위한 SRL 기반 연구 질문:

  • ○ 2년 차 전공의들은 직장 내 학습 중 자신의 임상 지식 발달을 어떻게 자기 모니터링하는가?

실천 공동체 및 실천 지형(CoP&LoP)이 사례에 적용되는 방식
(How communities and landscapes of practice (CoP&LoP) can be applied to the case
)

CoP & LoP의 핵심 전제 (Central premise of CoP & LoP)

  • CoP와 LoP는 학습과 정체성 형성을 공유된 목적, 관심 영역 및/또는 실천(practice)을 가진 집단이나 공동체 내에서의 상호작용, 관계, 경험의 산물사회적 과정(social processes)으로 봅니다.
  • 학습은 상황에 위치한(situated)(즉, 실제적 실천 안에 내재된) 것으로 간주됩니다.
  • 학습과 정체성 형성은 공동체 내에서의 개인의 능동적인 참여의 산물입니다.
  • 또한, LoP는 학습과 정체성 형성이 단일 공동체 내에서의 상호작용 결과일 뿐만 아니라, 실천이 상호 연결되어 있기 때문에 함께 모인 공동체들의 지형(landscape)을 탐색하고 상호작용하는 결과라고 가정합니다.

CoP & LoP의 주요 개념 (Key concepts CoP & LoP)

  • CoP는 초심자가 합법적 주변 참여(legitimate peripheral participation)라는 과정을 통해 어떻게 공동체의 완전하고 능동적인 구성원이 되는지를 설명합니다.
    • 합법적(Legitimate)이라는 말은 초심자가 입문 요건을 갖추고 있어 공동체의 잠재적 미래 구성원으로 인정받는 것을 의미합니다(예: 의대생은 결국 의사가 될 기본적인 역량을 갖추고 있기 때문에 실천 공동체의 초심자 구성원으로 간주됩니다).
    • 주변 참여(Peripheral participation)초심자의 역량 수준에서 닿을 수 있는 범위 내에서 공동체에 참여하고 과업을 수행하도록 허용되는 것을 말합니다.
  • 공동의 과업(joint enterprise)(예: 환자 진료), 공동체 내에서의 능동적이고 지속적인 상호작용 및 협력(즉, 상호 관여[mutual engagement]), 초심자는 완전하고 인정받는 공동체 구성원이 되기 위해 필요한 공유된 레퍼토리(shared repertoire)를 개발합니다. 이 과정 동안,
    • 초심자는 보건의료 팀의 의사가 되는 것이 어떤 것인지 상상(imagine)하고,
    • 공동체 내 및 공동체 간의 동료 구성원들의 실천과 자신의 실천을 정렬(align)하며,
    • 공동체들 및 지형 내의 모든 공동체와 상호작용(engage)하게 됩니다.
  • LoP의 인정받는 구성원이 되기 위해 초심자는 지식 가능성(knowledgeability)의 성장을 보여주어야 합니다. 즉, LoP 내의 실천, 역할, 역할 경계를 이해하고, 이것들이 자신의 실천과 갖는 관련성을 이해하며, 또한 자신의 실천이 타인에게 어떻게 관련되는지를 이해해야 합니다.

사례에 CoP & LoP 적용하기 (Applying CoP & LoP to the case)

  • CoP & LoP는 Alex를
    • 의사 실천 공동체(physician community of practice)의 구성원이 되는 궤적, 그리고
    • 보건의료 실천 지형(landscape of healthcare practice)의 구성원이 되는 궤적(즉, 그녀는 보건의료 팀 내의 의사 구성원이 되어가고 있음) 위에 있는 것으로 프레임화합니다.
  • 이 이론들은 Alex가 의사 감독자들뿐만 아니라 보건의료 팀의 다른 구성원들과 갖는 상호작용(interactions), 그리고 이러한 상호작용을 통해 그리고 상호작용으로부터 그녀가 무엇을 어떻게 배우고 있는지를 전경화합니다.
  • Alex는 보건의료 팀의 다른 구성원들의 역할과 책임에 대해 확신하지 못하고 있습니다. 이러한 Alex 경험의 요소들은 함께 연구에 이론을 도입하는 특정 접근법과 일치하는 CoP&LoP에 입각한 연구 질문을 구성하기 위한 출발점을 제공합니다:

완전히 이론에 입각한 귀납적 연구 설계(fully theory-informed inductive study design)를 위한 CoP&LoP 기반 연구 질문:

  • 보건의료 팀의 다른 구성원들과의 상호작용은 어떤 방식으로 전공의들이 신장내과 내에서 환자 진료를 위한 공유된 레퍼토리를 개발하도록 돕는가?
  • ○ 전공의들은 신장내과 내에 존재하는 다양한 실천 공동체들을 가로질러 협력하는 법을 어떻게 배우는가?

이론이 정보를 제공하는 귀납적 데이터 분석(theory-informing inductive data analysis) 설계를 위한 CoP&LoP 기반 연구 질문:

  • ○ 보건 관련 전문가(allied health professionals)들은 전공의의 직장 내 학습에서 어떤 역할을 하는가?
  • ○ 지도 전문의(attending physicians)들은 전공의의 직장 내 학습을 지도하기 위해 보건의료 팀의 나머지 구성원들과 어떻게, 그리고 어느 정도까지 협력하는가?

결론 (Conclusion)

HPE 연구는 종종(그리고 정당하게) 연구에 이론을 피상적으로만 도입한다는 비판을 받습니다 [44,45]. 이 가이드가 보여주듯이, 연구에 이론을 도입하는 데 "가벼운(light)" 버전은 없습니다. 연구에 정보를 제공하기 위해 이론을 사용하는 것은 이론이 무엇인지 깊이 이해하고, 각 이론의 뿌리를 인식하며, 연구 설계에서 언제 이론을 사용할지 알고, 이론적 틀(theoretical framework)을 통해 특정 맥락에 이론을 적용하며, 서로 다른 이론이 상황의 서로 다른 측면으로 연구의 주의를 어떻게 이끌지 이해하는 것을 요구합니다. 연구에 이론을 사용하는 것은 분명 상당한 노력을 필요로 하지만, 우리는 그러한 노력의 결과가 가치 있다고 제안합니다. 이론은 연구자들이 연구의 영향력(impact)과 전이 가능성(transferability)을 높일 수 있게 해줍니다 [46,47]. 이 AMEE 가이드를 통해 독자들이 자신의 연구자 도구 상자(researcher toolbox)에 있는 도구로서의 이론을 다루는 능력에 대해 더 자신감을 느끼게 되었기를 바랍니다.


용어 사전 (Glossary) 

  • 개념 (Concept): 사용자들에게 통일된 의미를 갖도록 의도된 정의로부터 구성된 이론의 기본 구성 요소.
  • 개념적 틀 (Conceptual Framework): 관심 현상을 연구하는 이유에 대한 설명. 문제(현상)의 식별, 격차(gap, 현상에 대해 알려진 것과 알려지지 않은 것), 그리고 훅(hook, 연구에 대한 정당성)을 포함함.
  • 연역적 분석 (Deductive analysis): 데이터 세트에서 선험적(a-priori) 코드나 주제를 사용하여 그것들을 찾아내는 유형의 데이터 분석 접근법.
  • 공식적 이론 (Formal Theory): 여러 맥락 내에서 출판되고 입증된 이론.
  • 귀납적 분석 (Inductive analysis): 데이터 세트로부터 코드와 주제를 생성하기 위해 꼼꼼한 독해(close reading)와 개방 코딩(open coding)을 사용하는 유형의 데이터 분석 접근법.
  • 방법 (Methods): 데이터를 수집하기 위한 도구.
  • 방법론 (Methodology): 연구 질문에 답하고 지식을 얻기 위한 전략적 접근 방식 (즉, 연구 설계).
  • 혼합 연구 방법 (Mixed Methods Research): 연구 질문을 해결하기 위해 양적 및 질적 연구 방법이 결합된 연구 방법론.
  • 패러다임 (Paradigm): 후기 실증주의(Post-positivist) vs. 해석주의(Interpretivist)
    • 존재론 (Ontology): 실재란 무엇인가?
      • 후기 실증주의: 실재는 단일하다 (하나의 보편적 실재가 존재함).
      • 해석주의: 실재는 다원적이다 (진실은 다수이며, 가치 함축적이고 끊임없이 변화함).
    • 인식론 (Epistemology): 실재에 대해 무엇을 알 수 있는가?
      • 후기 실증주의: 연구자가 결과에 영향을 미치지 않고 실재를 객관적으로 알 수 있다.
      • 해석주의: 실재는 주관적으로만 알 수 있으며 연구자의 관점과 가치에 의해 형성된다.
    • 가치론 (Axiology): 패러다임에 속한 가치 체계.
      • 후기 실증주의: 객관적이고 중립적인 관찰이 가치 있음.
      • 해석주의: 주관적이고 다원적인 관찰이 가치 있음.
  • 방법론 (Methodology): 데이터 수집에 대한 접근 방식. 질적 연구 방법론의 전형적인 예로는 근거 이론, 현상학, 사례 연구, 담화 분석, 문화기술지 등이 있음.
  • 명제 (Propositions): 개념 간의 관계를 설명하며 다양한 형태의 표현을 가질 수 있음.
  • 민감성 개념 (Sensitizing concepts): 연구자가 자신의 경험, 기존 연구 및/또는 이론을 통해 정보를 얻어 데이터 수집과 데이터 분석을 형성하는 데 사용할 개념을 선택하는 질적 연구 전략.
  • 실질적 이론 (Substantive Theory): 경험적 데이터 수집 과정을 통해 생성된 이론.
  • 이론 (Theory): 이론은 현상에 대한 추상적 설명을 표현하기 위해 논리적으로 연결된 일련의 명제(propositions)임.
  • 이론적 틀 (Theoretical Framework): 이론, 그 개념, 전제 및 명제를 연구 현상에 적용하는 것.
  • 이론적 관여를 통한 전이 가능성 (Transferability through theoretical engagement): 특정 현상에 대한 이해를 증진하기 위해 연구 프로젝트 전반에 걸쳐 이론 및/또는 이론적 개념을 탐구, 해석, 적용 및 논의하는 과정 [48].

 

 

 

 

 

 

 

 

표 1. 사례 ‘자리를 잡아가기(Finding my feet)’에 이론적 렌즈 적용하기 
: 이론이 연구자의 초점을 어떻게 유도하고 연구 질문 수립에 어떤 영향을 미치는지에 대한 설명


1. 자기조절학습 (Self-Regulated Learning, SRL) 

  • 이론적 뿌리/기원 분야: 인지 심리학 (Cognitive Psychology) - 사회인지 이론 (Social-Cognitive Theory)
  • 분석의 초점: 개인 (Individual)

[이론이 연구자의 초점을 유도하는 방식] 

  1. 직장 내 학습(Workplace learning)은 환자 진료를 둘러싼 업무 흐름에 의해 강하게 영향을 받습니다. 이는 전공의들이 학습하기 위해서는 자신의 직장 내 학습을 지속적으로 자기 조절(self-regulate)해야 함을 의미합니다. 여기에는 학습 목표 달성을 위해 자신의 인지, 행동, 동기를 계획하고, 모니터링하며, 통제하는 과정이 포함됩니다. 점점 더 많은 전공의 프로그램이 프로그램식 평가(programmatic assessment)를 사용하고 있으며, 종종 온라인 포트폴리오 시스템을 통해 지원받아 전공의들이 감독자(supervisors)로부터 역량 바탕 피드백(competency-based feedback)을 받게 합니다.
  2. 일을 통한 학습은 전공의들이 자신이 받는 피드백을 지속적으로 모니터링하고 성찰할 것을 요구합니다. 직장 내 학습의 특성상, 피드백은 환자, 보건의료 팀 구성원, 감독자로부터 직접 받는 피드백과 같이 다양한 과정에 존재할 수 있습니다. 그러나 피드백은 환자 기록에 남겨진 코멘트, 처방 행동에 대한 교정, 치료에 따른 환자 결과(outcomes)와 같은 간접적인 출처를 통해서도 올 수 있습니다.
  3. 의사가 되는 과정의 핵심적인 부분은 적절한 수준의 임상 지식 발달입니다. 전공의 수련은 주로 직장 내 학습의 맥락 안에 위치합니다. 직장 내 학습은 종종 비형식적 학습 과정(informal learning process)으로 묘사되어 왔습니다. 따라서 전공의들이 직장 내 학습 과정에서 자신의 임상 지식 발달을 자기 모니터링(self-monitor)하는 것은 매우 적절합니다.

[연구 질문: 완전히 이론에 입각한 연구 설계] 

  1. 내과 2년 차 전공의들은 직장 내 학습 중 학습을 자기 조절하기 위해 온라인 포트폴리오의 피드백을 어떻게 활용하는가?
  2. 내과 2년 차 전공의들은 자신의 역량 개발을 모니터링하고 성찰하기 위해 어떤 피드백 단서(feedback cues)를 사용하는가?

[연구 질문: 이론이 정보를 제공하는 귀납적 분석] 

  1. 2년 차 전공의들은 직장 내 학습 중 자신의 임상 지식 발달을 어떻게 자기 모니터링하는가?

2. 실천 공동체 및 실천 지형 (Communities and Landscapes of Practice, CoP/LoP) 

  • 이론적 뿌리/기원 분야: 인류학 (Anthropology) | 사회적 학습 이론 (Social learning theory) | 실천 이론 (Practice theory)
  • 분석의 초점: 집단 내 개인 간의 상호작용 (Interaction between individuals within groups)

[이론이 연구자의 초점을 유도하는 방식] 

  1. 직장 내 학습 동안, 전공의들은 보건의료 팀의 다양한 구성원들과 상호작용합니다. 모든 보건의료 팀 구성원이 '효과적인 환자 진료'라는 공유된 목적을 가지고 있지만, 개별 환자 케이스나 의료 환경에 따라 약물을 가장 잘 처방하는 방식, 환자와 소통하는 방식, 또는 논의에 어떤 의료 전문가를 포함할지에 대한 접근 방식은 조금씩 다를 수 있습니다. 전공의들이 이러한 실천의 변이(practice variations)를 배우는 것은 중요합니다.
  2. 신장내과(nephrology) 내에서는 신장 질환 환자를 돌보기 위해 많은 다양한 보건 전문직이 함께 모입니다. 구체적인 환자 케이스에 따라 의사, 간호사, 의사 보조(physician assistants), 영양사, 약리학자 및 기타 많은 사람이 관여할 수 있습니다. 신장내과 분야가 처음인 전공의들에게는 각 전문직과 협력하는 법을 배우는 것이 효과적인 환자 진료를 제공하는 법을 배우는 데 중요합니다.
  3. 직장 내 학습은 종종 전공의들이 일상적인 의료 실천에 참여함으로써 배우는 과정으로 묘사되어 왔습니다. 이러한 실천을 통해 그들은 다양한 보건 관련 전문가(allied health professionals)들에게 노출되고 상호작용합니다. 실천 공동체 및 실천 지형(CoP/LoP) 이론들은 학습이 타인과의 상호작용의 산물임을 시사합니다.
  4. 비록 전공의에 대한 지도는 종종 보건의료 팀의 더 선임인 의사 구성원들의 몫이지만, 보건의료 팀의 다른 구성원들(other members) 또한 직장에서 배우는 전공의들에게 지침(guidance)을 제공하는 데 있어 잠재적으로 가치 있는 역할을 합니다.

[연구 질문: 완전히 이론에 입각한 연구 설계] 

  1. 보건의료 팀의 다른 구성원들과의 상호작용은 어떤 방식으로 전공의들이 신장내과 내에서 환자 진료를 위한 공유된 레퍼토리(shared repertoire)를 개발하도록 돕는가?
  2. 전공의들은 신장내과 부서 내에 존재하는 다양한 실천 공동체(communities of practice)를 가로질러 협력하는 법을 어떻게 배우는가?

[연구 질문: 이론이 정보를 제공하는 귀납적 분석] 

  1. 보건 관련 전문가(allied health professionals)들은 전공의의 직장 내 학습에서 어떤 역할을 수행하는가?
  2. 지도 전문의(attending physicians)들은 전공의의 직장 내 학습을 지도하기 위해 보건의료 팀의 나머지 구성원들과 어떻게, 그리고 어느 정도까지 협력하는가?

 

We Reject the Use of Generative Artificial Intelligence for Reflexive Qualitative Research

 

 

우리는 32개국 419명의 숙련된 질적 연구자로서, 성찰적 주제 분석(reflexive thematic analysis)이나 다양한 현상학적 접근법(phenomenological approaches)과 같은 Big Q 질적 접근법(Big Q Qualitative approaches)(Kidder & Fine, 1987)에 생성형 인공지능(GenAI) 애플리케이션을 사용하는 것을 거부하기 위해(reject) 이 글을 씁니다. 성찰적 주제 분석은 인간 연구자(human researchers)가 의미의 패턴(주제)을 개발하고(developing), 해석하고(interpreting), 성찰함(reflecting on)으로써 질적 데이터를 분석하기 위해 수행하는 방법(method)입니다. 이 분석 과정(analytical process)은 매우 주관적이고(deeply subjective) 반복적이며(iterative) 권력 관계(power relations)를 염두에 둡니다(mindful) (Braun & Clarke, 2019). 현상학적(Phenomenological), 인류학적(anthropological), 민족지학적(ethnographic), 담론(discourse) 및 기타 성찰적 질적 접근법들도 유사하게 해석적이고(interpretive), 주관적이며(subjective), 주의 깊습니다(mindful) (Brewer, 2000; Fabian, 2014; Johnstone & Andrus, 2024; Moran, 2002). 우리의 GenAI 거부는 방법론적(methodological) 우려와 윤리적(ethical) 우려 모두에 근거하고 있습니다(grounded in). 우리는 질적 연구자들이 그러한 분석에 GenAI를 사용하는 것에 대해 비판적으로 생각하고(think critically about)—거부할 것(reject)—을 촉구합니다(urge). 우리가 그러한 거부를 위해 언급하는 주된 이유(primary reasons)는 다음과 같습니다:

  1. 시뮬레이션된 지능(simulated intelligence)으로서의 GenAI는 의미 만들기(meaning-making)가 불가능하다(incapable of);
  2. 질적 연구는 뚜렷하게(distinctly) 인간적인 관행(human practice)으로 남아야 한다(should remain);
  3. 확립된(established) GenAI의 다양한 해악(manifold harms), 특히 환경과 글로벌 사우스(Global South)의 노동자들에게 미치는 해악.

첫째, GenAI는 세상에 대한, 또는 분석되는 데이터를 구성하는(constitutes) 언어의 의미(meaning)에 대한, 혹은 질적 분석을 시뮬레이션할 때 생성되는 결과적 주제(resulting themes)의 의미에 대한 어떠한 이해(any understanding)도 없이, 통계적 예측 알고리즘(statistical predictive algorithms)에 기반한 시뮬레이션된 지능(simulated intelligence)일 뿐입니다. 인간이 개입된(with human involvement) GenAI가 (방법론적 과정의 시뮬레이션을 통해) 표면적으로는(superficially) 성찰적 질적 분석과 닮은(resembles) 무언가를 생산할 수 있을지는 몰라도, 그것은 성찰적(reflexive)일 수 없습니다. 왜냐하면 정의상(by definition), 성찰적 질적 분석은 본질적으로 의미 기반의 기술(inherently meaning-based technique)이기 때문입니다. 예를 들어, 성찰적 주제 분석의 의미 기반 요건(meaning-based requirement)이 그것을 내용 분석(content analysis)과 같은 단어 수 세기 기법(word-counting techniques)—이는 자동화될 수 있음(can be automated)—과 방법론적으로 구별 짓는(distinguishes) 것과 마찬가지로, GenAI가 언어로부터 진정으로 의미를 만들어내는 것(genuinely making meaning)이 근본적으로 불가능하다(fundamentally incapable)는 기초 위에서 GenAI 또한 배제해야만 합니다(must exclude) (Webster, 2025). GenAI의 이러한 한계를 인식하지 못하는 것(Failure to recognize these limitations)은 지배적인 패러다임(dominant paradigms)과 편향(biases)을 강화하는(reinforce) 분석을 초래할 위험이 있습니다(risks). 즉, GenAI가 작동하는 기반이 되는 알고리즘 패턴(algorithmic patterns)은 GenAI로 하여금 지배적인 언어와 패턴을 식별하고(identify), 복제하고(replicate), 강화하도록(reinforce) 성향을 부여하며(predisposes); 이는 비판적 학자들(critical scholars)의 목소리를 포함한 주변부의 목소리(marginal voices)와 관행들을 더욱 침묵시킬(further quieting) 위험이 있습니다. 삶의 도피처(maroons of life)에서 지식을 살고/호흡하고/느끼고/상상하고/구성하는 사람들의 목소리와 관행들은—그들의 놀랍고/기발하고/복잡하고/예측 불가능한 방식들과 함께—사라지거나(lost) 더 나쁘게는; 희생될(sacrificed) 수도 있습니다.

 

둘째, 성찰적 질적 연구는 뚜렷하게 인간적인 관행(distinctly human practice)으로, 인간에 의해(by humans), 인간과 함께 또는 인간에 대해(with or about humans) (예: 인터뷰, 포커스 그룹 또는 텍스트 데이터를 통해), 그리고 인간의 이익을 위해(for the benefit of humans) 수행됩니다. 사회과학 연구의 핵심 신조(central tenet)는 사람과 사회적 과정(social processes)을 더 깊이 이해하고, 의미 만들기(meaning-making)를 탐구하고 질문하는 것(explore and interrogate)입니다. 연구자들은 종종 사회적 타자(social others)와 연결하고(connecting with) 관찰함(observing)으로써 이를 수행합니다. 일부 연구자들은 분석적 "루프(loop)" 안에 인간이 포함되는 한(so long as) GenAI가 지원하는 질적 분석이 도움이 된다고 제안하지만, 그들은 또한 GenAI가 신뢰할 수 있기를(reliable) 바라는 우리의 욕망이 GenAI의 산출물(outputs)을 비판적으로 평가하는(critically appraise) 우리의 능력을 감소시킨다고 경고합니다 (Gamieldien et al., 2023; Lixandru, 2024; Törnberg, 2024; Xiao et al., 2023). 다른 이들은 GenAI의 무비판적 사용(uncritical use)이 질적 연구의 핵심인 해석적 의미 만들기(interpretive meaning-making core)에 인식론적 위험(epistemic risks)을 초래한다고(introduces) 강조합니다 (Nguyen & Welch, 2025). 우리는 오직 인간만이(only a human) 성찰적 질적 분석 작업을 수행할 수 있다는 입장을 견지하며, 따라서 초기 코딩(initial coding)을 포함한 성찰적 질적 분석의 모든 단계(all phases)에서 GenAI를 사용하는 것은 부적절하다(inappropriate)고 봅니다. 연구자들은 강력한 정신역동적 해석(psychodynamic interpretations)을 만드는 과정을 그들 자신의 인간성(humanity)에 고정시켜야(anchor) 합니다.

 

셋째, 우리는 거대 AI 기업들(big AI corporations)이 관여하는 우려스러운 착취적이고(exploitative), 식민주의적이며(colonialist), 추출주의적인(extractivist) 관행들에 당신의 주의를 환기합니다(draw your attention to). 이러한 관행들은 GenAI 확장을 서비스하기 위해 건설되는 데이터 센터들로 인해, 전자 폐기물(electronic waste)에 대한 노출, 물과 에너지 사용의 증가, 토지 개간(land clearing), 서식지 파괴(devastation of habits) 및 온실가스 배출(greenhouse gas emissions) 등을 통해 인간과 지구에 해로운 영향(harmful impacts)을 미칩니다. 우리는 이러한 심각한 윤리적 및 건강 문제들(ethical and health issues)에 대해 우려하고 있습니다. 사회 정의(social justice)에 관심을 갖고 해로움을 최소화할(minimize harm) 윤리적 의무(ethical obligations)에 구속되는 질적 연구자로서, 우리는 몇몇 저명한 연구자들이 GenAI 사용 증가가 우리의 환경과 동료 인간(fellow humans) 모두에게 미치는 부정적인 영향(negative impact)에 대해 우려를 제기해왔음을 주목합니다. 비평가들은 이윤을 추구하는(quest for profit) 거대 AI 기술기업(Big AI Tech)을 동기 부여하는 추출주의적, 인종차별적(racist), 제국주의적(imperialist), 그리고 착취적인 기풍(ethos)을 지적했으며(pointed to) (Brennan et al., 2025; Hanna & Bender, 2024; Mejias & Couldry, 2024; Tacheva & Ramasubramanian, 2023), 이는 고등 교육에서의 인식론적 주체성(epistemic agency)을 변형시키고 있습니다 (Lindebaum et al., 2025). 예를 들어, Galaz와 동료들은 AI가 농업, 임업, 양식업, 그리고—아이러니하게도—기후 변화를 포함한 여러 산업에서 급속하고 광범위한 채택(uptake)을 보이고 있음을 보여줍니다. 그러나 이러한 채택은 AI 편향으로 인한 불평등 증가(AI-bias-driven increased inequity) 및 식량 불안정(food insecurity), 연쇄적인 실패(cascading failures), 그리고 생태계에서의 AI 주도적 비가역적 변화(irreversible changes)와 같은 심각한 해악(significant harms)을 제기합니다 (Galaz et al., 2021). GenAI 붐은 데이터 센터와 해저 케이블(under-sea cabling)을 포함하여 이를 지원하기 위한 거대한 인프라 구성 요소(massive infrastructural components)의 확장과 동반됩니다 (Hogan, 2024; Wang et al., 2024). 이러한 인프라는 토지 개간, 심해 터널링(deep sea tunneling), 온실가스 배출, 그리고 물과 에너지 사용으로 인한 영향들로부터 발생하는 심각한 서식지 붕괴(habitat disruption)와 환경적 위험(environmental hazards)에 인간과 생태계의 다른 요소들을 노출시킵니다 (Hosseini et al., 2025; Lupton, 2025; Osmanlliu et al., 2025). GenAI가 인간의 건강에 상당한 해로움(considerable harm)을 제기하는 또 다른 방식은 디지털 데이터 콘텐츠를 훈련시키거나 중재하는(moderating) 작업을 하는 노동자들의 착취(exploitation)를 통해서입니다. 연구자들은 유해한 콘텐츠(toxic content)를 감지하고 필터링하기 위해 거대 언어 모델(large language models) 훈련을 돕는 임무를 맡은 다수 세계(Majority World: 주로 개발도상국을 의미)의 AI 데이터 노동자들에게 미치는 심리적 영향(psychological effects)을 확인했습니다 (Mejias & Couldry, 2024; Tacheva & Ramasubramanian, 2023).

 

이 세 번째 요점은 방법론적 우려(methodological concern)보다는 윤리적 반대(ethical objections)와 더 관련이 있지만, 우리는 이들을 상호 연결된 것(interconnected)으로 보며, 특히 1번과 2번 요점에 비추어 볼 때 우리의 선택이 타인에게 미치는 이러한 복잡하고 부정적인 영향들을 무시하는 것(ignoring)에 대해 경고합니다.

 

이러한 이유들로(For these reasons), 우리는 성찰적 주제 분석 및 기타 성찰적 질적 접근법을 위한 GenAI를 거부합니다.

 

서명(Signed),

Tanisha Jowsey, Virginia Braun, Victoria Clarke, Deborah Lupton, Michelle Fine; 및 지지자들(and endorsers)1: Gareth J. Treharne, Deborah L. Tolman, Cathy Banwell, Neera R. Jain, Megan E. L. Brown, Duc C. Nguyen, Elizabeth Sturgiss, Francesca A. Williamson, Patricia Thille, Gareth Terry, Catherine Welch, Joep Cornelissen, Martina Kelly, Robyn Woodward-Kron, Janine Wiles, Peter Adams, Nikki Hayfield, Tine Köhler, Antonia Lyons, Bill Harley, Ann L Cunliffe, Paul Hibbert, Leslie Swartz, Peter Hegarty, Catriona Ida Macleod, Lauren J. Breen, Christina Lee, Fiona Grattan, Irmgard Tischner, Caroline Jagoe, Jo Brooks, Myriam Pannard, Robbie Busch, Brett Scholz, Priscilla Boshoff, Julie Spray, Lorelle Dismore, Gareth Davey, Morten Skovdal, Liezille Jacobs, Mick Finlay, Chris Noone, Ryan L. McGrath, Maxine Woolhouse, Rahul Sambaraju, Muhamad Alif Bin Ibrahim, Joanna Semlyen, Gavin B. Sullivan, Carla Willig, Viola Sallay, Petra Boynton, Elizabeth Peel, Nicola Jearey-Graham, Lesley Storey, Kara Allen, Jenny Cole, Eman AlBedah, Dirk Lindebaum, Monika Stelzl, Sarah Seymour-Smith, József Rácz, Ruth Walker, Bachir Sirois-Moumni, Jehannine Austin, Ea Høg Utoft, Benjamin T. Sharpe, Garcia Ashdown-Franks, Stuart McClean, Sarah Kiden, Annelies Kleinherenbrink, Katerina Litsou, Nafis Mahmud Khan, Minja Axelsson, Sara E. Grummert, Aine Carroll, Luke Fletcher, Tasha Wainstein, Bethany Thomas, Andrea Whittle, Sarah Bell, Vee Copeland, Sarah Esegbona-Adeigbe, Sadie Rockliffe, Nessa Millet, Michelle Y. Martin Romero, Ariel Ducey, Sarah Kirby, Abigail Locke, Eileen Joy, Nikita Hayden, Rebecca A Szabo, Michele Jarldorn, Sibusiso Mkwananzi, Daniel Cezar Da Cruz, Tharin Phenwan, Francisco José Eiroá Orosa, Lenandlar Singh, Caroline L Roberts, Animesh Paul, Ayşegül Bakır, Randi Spiker, Serena Daalmans, Katrina McChesney, Samantha Thomas, Emma Tennent, Sara McClelland, Olivier Jutel, Valerie Cooper, Pieta Shakes, Ben Harris-Roxas, Jenna L Gillett, Georgia Pavlopoulou, Caroline Lenette, Rosemary Overell, Elif Lootens, Jade Le Grice, Katie B. Sullivan, Karena J. Burke, Peta Cook, Brett Nicholls, Rachel Thorpe, Ash Barnes, Grace Arnot, Amy Zile, Rachael Fox, Kathleen Flanagan, Romulo Nieva Jr., Sonja Ellis, Nina Higson-Sweeney, Tobias Blackwood, Sara James, Simone McCarthy, Catriona Hippman, Jenni Greig, Hannah Pitt, Shanee Barraclough, Sumaiya Noor Sanda, Emma Tumilty, Nicole Asquith, Nathan Harrison, Holly Thorpe, Richard Matthews, Laura Tarzia, Gianina-Ioana Postavaru, Mark D M Davis, Sreeparna Chattopadhyay, Michael S Daubs, Tina-Maree Newlan, Jaclyn M Szkwara, Karen Willis, Leon Salter, Java Grant, Caitlan McLean, Megan Lee, Charles Bilodeau, Naomi Smith, Debbie Massey, Dima Nasrawi, Shawna Campbell, Aron Harold G. Pamoso, Vicky Nagy, Madeleine Pownall, Sean Phelan, Charlotte Brownlow, Catherine Goetze, Alexa Alcser-Isais, Yuan Gong, Corinne Squire, Anthony K J Smith, Abul Kalam, Annabel Sandra Mueller-Stierlin, Clare Farmer, Elena Cama, Elly Quinlan, Cristina Quinones, Stefani Vasil, Toni Bruce, Sally Nathan, Shuvarthi Bhattacharjee, Zsuzsa Kaló, Julia Cook, Emer McGowan, Ovidiu Gavrilovici, Sylvester Okeke, Aysel Sultan, Sabrina Leal Garcia, Olivia Miller, Sarahanne M. Field, Farah Otaki, Rowena Hay, Moniq Muyargas, Daniel Walker, Rosamund Portus, Rosa Marvell, Kostas Hatzikiriakidis, Kaela Farrise Beauvoir, Maria Fernandes-Jesus, Martina Skrubbeltrang Mahnke, João Batalheiro Ferreira, Amanda D Webber, Tim Rhodes, Abbie Jordan, Keren MacLennan, Tammy Hoffmann, Tracey Feltham-King, Gavin R. Stewart, Hugh Gorick, Kate Swainston, Lauren McCarthy, Victoria Ruby-Granger, Allison Ruth Dunne, Michelle N Lafrance, Meg Mundell, Nicola Boydell, Rosemary Chigevenga, Peter Branney, Alison Torn, Christiaan Oostdijk, Javier Monforte, Suzanne Scott, Victoria J Palmer, Bethan Jones, Iain Thomas Killoughery, Emma Christensen, Candice Whitaker, Brandon Sabourin, Elaine Keane, Fiona Spotswood, Janne Tienari, Afrodita Marcu, Blessing Marandure, Caroline Huxley, Renée E. Stalmeijer, Chase Ledin, Marie Joachim, Priya Kumar, Samantha Flynn, Bregje de Kok, Paul Reilly, Carol A. Jasper, Helen Grace Concepcion Q. Fernandez, Philip Lew Chun Foong, Donne Jone Panizales Sodusta, Michael Larkin, Helen Clegg, Jenni Ward, Aliya Sarsenbayeva, Andrea Werner, Aidan A. Sunassee, Zaeem Ul Haq, Gloria Fraser, Coralie Mercerat, Emma Davies, Rea Daellenbach, Mirela Zaneva, William J. Robertson, Katrina Roen, Kathryn Hicks, Michelle Salmona, Loene Howes, Dean Pierides, Edward Maclin, Amanda Lee Savage, Renee Fiolet, Elisa Calvo, Sally Sargeant, Carla Treloar, Stephenie Pagoudis, Samantha Newell, Peta Callaghan, Kristi Urry, Marianne Clausen, Anna Klas, Matthew I. Mackay, Jessica L. Mackelprang, Alice-Viviana Bercean, Aaron Koay, Blake Quinney, Jayne Leonard, Calvin C. Fernandez, Mia Majstorovic, Madeline Heygers, Stephen Goulding, Maggie O’Neill, Kym M. McCormick, Stefanie Reissner, Will Day, Heather Sutherland, Christopher J Graham, Clair Hebron, Mark Warner, Dagmar Monett, Miriam Reynoldson, Sinéad Sheehan, Justine Anthony, Kathryn Conrad, Ismail Ahmad Shaikh, Donatella Di Marco, Paula Corcoran, Madeline Nase, Jane Healy, Amrit Chauhan, Lise Lafferty, Anshu Chaudhary, Alys Griffiths, Emily Allen Paine, Richard Longman, Thomas M. Leeder, Emily Arden-Close, Emily Arden-Close, Sophia Mavridi, Carlos Azevedo, Maria José Sá, Robyn Delbridge, Thomas Byers, Robbie Fordyce, Genia Bettencourt, Auzi Asfarian, Danielle Heinrichs Henry, Danielle Heinrichs Henry, Melissa J. Rogerson, Octavia Calder-Dawe, Lucy Sparrow, Emma Turley, Brian Law, Bridget Conor, Mahli-Ann Butt, Xavier Ho, Neil Munro, Hugh Davies, Bingyi Han, Amy Chandler, Sara Diogo, Ian Couper, Ola Demkowicz, Emma McLorie, Lindsey Pope, Andrew Whitworth, Annie O’Brien, Jo Hickman Dunne, Lucy Prodgers, Sergio A. Silverio, Suzanne Hamilton, Amy Grove, Amy M. Russell, Kathryn Almack, Jade Parnell, Myrofora Kakoulidou, Katherine Knighting, Stan Papoulias, Lauren E. Heywood, Rachel Rowan Olive, Rhulani Beji-Chauke, Arabella Scantlebury, Samantha K Brooks, John-Paul Bryne, Aisling Walsh, Nicola Power, Maria Pertl, Nicola Cornwall, Austin Fahy, Charlotte Woodcock, Rishita Nandagiri, Daian Huang, Nicolò Zarotti, Rachael Gribble, Ernestina Coast, Laura Chapman, Sabine Tötemeyer, Eunice T. Phillip, Lucy Bray, Danielle Lamb, Ashlyne O’Neil, Melanie Diggle, Karen Rodham, Benjamin Gardner, Mari Greenfield, Ruby Ilustrisimo, Jayati Das-Munshi, Stef Rozitis, Kiran Ghandi, Kristin Wicking, Alison Sheaves, Elisa Genovesi, Rachel Stocker, Kirstie McAllum, Shelley Walker, Jack Wallace, Luke Gahan, Nyanda McBride, Celina McEwen, Ans Vercammen, Tanya Jurado, Sue Lewis, Claire Fox, Claire Cameron, Siân Russell, Joanna Drugan, Áine Humble, Yanakan Logeswaran, Nadine van der Meulen, Claire Torrens, Irene Skovgaard-Smith, Tiffany Monique Quash, Sarah Biedka, Camilo Miguel Signorelli, Sarah MacQuarrie, Ada Achinanya, Rachel Hogg, Eva Hornecker, Jane Le, Duong Bao Gia Tue, Jane E. Hunt, and Margaret Wetherell.

 

 


출처: https://www.timeshighereducation.com/opinion/qualitative-researchers-ai-rejection-based-identity-not-reason

 

질적 연구자들의 AI 거부는 이성이 아닌 정체성에 기반한다 (Qualitative researchers’ AI rejection is based on identity, not reason)

AI가 의미를 만들 수 없다(can’t make meaning)는 주장은 연구자들이 이러한 도구들을 주의 깊고 비판적인 사용(careful, critical use)에 적용했을 때 발견하는 것과 모순된다(contradicts)고 James Goh는 말합니다.

2026년 1월 16일 게시 (Published on January 16, 2026)

최종 업데이트 2026년 1월 16일 (Last updated January 16, 2026)

 

 

그 서한(letter)은 동료에서 동료로 빠르게 전달되었으며(forwarded), 종종 찬성(approval) 혹은 불안(unease)의 메모가 동반되었습니다. 그것은 38개국의 질적 연구자들로부터 419명의 서명을 담은 공개 서한(open letter)이었습니다. 그 언어는 협상의 여지(room for negotiation)를 남기지 않았습니다: 생성형 인공지능(generative artificial intelligence)은 "성찰적 질적 분석(reflexive qualitative analysis)의 모든 단계에서 부적절하다(inappropriate in all phases)"는 것입니다. 가끔이 아닙니다(Not sometimes). 안전장치(safeguards)가 있어도 안 됩니다. 항상(Always) 그렇다는 것입니다.

 

그러한 절대주의(absolutism)는 중요합니다. 왜냐하면 질적 연구(qualitative research)는 어떤 인간의 경험(human experiences)이 중요한지(count)를 기관(institutions)들이 결정하는 방식이기 때문입니다. 이 수준에서 도구들을 차단해버리면(Shut off), 당신은 교육, 노동 및 국제 개발 분야에서 누구의 목소리가 들리게 될지(who gets heard)를 형성하게 됩니다.

 

Sage 저널인 Qualitative Inquiry에 게재된 그 편지의 주요 서명자들(lead signatories) 중에는 Virginia Braun과 Victoria Clarke가 있는데, 그들의 성찰적 주제 분석(reflexive thematic analysis)을 위한 프레임워크는 한 세대의 학자들이 해석(interpretation)에 대해 생각하는 방식을 형성해왔습니다. 그들의 기초가 되는 논문(foundational paper)은 거의 30만 번이나 인용되었습니다. 그들이 말할 때, 사람들은 귀를 기울입니다(listen). 그리고 그들이 지금 말하고 있는 것은 AI에 대한 대화는 끝났다는 것입니다.

 

그 편지는 세 가지 주장을 합니다(makes three claims). 첫째, AI는 이해(understanding)가 아니라 통계적 예측(statistical prediction)을 통해 작동하기 때문에 진정으로 의미를 만들 수 없다(cannot genuinely make meaning)는 것입니다. 둘째, 질적 연구는 근본적으로(fundamentally) 인간에 의해, 인간에 대해, 인간을 위해 수행되어야 하는 인간의 작업(human work)이라는 것입니다. 셋째, AI는 환경과 글로벌 사우스(Global South)의 착취당하는 노동자들 모두에게 심각한 윤리적 해악(ethical harms)을 가져온다는 것입니다.

 

세 번째 주장은 진지한 관심(serious attention)을 받을 가치가 있습니다. 거대 언어 모델(large language models)을 구동하는 데이터 센터들은 엄청난 양(staggering amounts)의 에너지를 소비합니다. 케냐, 필리핀 등지에서 이러한 시스템을 훈련시키고 중재하는(train and moderate) 노동자들은 종종 빈곤 임금(poverty wages)을 받으며 가혹한 조건(brutal conditions) 하에서 노동합니다. 책임감 있는 연구자라면 누구나 이러한 현실과 씨름해야 합니다(grapple with).

 

그러나 그 편지는 궁극적으로 환경 윤리나 노동 착취에 그 논거를 두지 않습니다(rest its case). 방법론적 주장(methodological arguments) 이면에는 더 깊은 무언가가 놓여 있습니다: 바로 무엇이 의미인지(what meaning is), 그리고 누가 그것을 만들 수 있는지(who can make it)에 대한 존재론적 주장(ontological claim)입니다. 성찰적 질적 분석은 의미 만들기(meaning-making)에 의존하며, 저자들은 이 활동이 독특하게 인간적인 것(uniquely human)이라고 주장합니다. 그리고 AI는 인간이 아니기 때문에, "언어로부터 진정으로 의미를 만들어내는 것이 근본적으로 불가능하며(fundamentally incapable)" 그러한 연구에서 정당한 역할(legitimate role)이 없다는 것입니다.

 

그러나 문제는, 이러한 입장이 연구자들이 이러한 도구들을 주의 깊고 비판적인 사용(careful, critical use)에 적용했을 때 실제로 발견하고 있는 것과 모순된다(contradicts)는 점입니다.

 

질적 연구를 위한 AI 플랫폼의 창립자로서, 지난 1년 동안 저는 공개 서한이 불가능하다고 선언한 바로 그 일, 즉 성찰적 연구에 AI를 사용하는 것(using AI in reflexive research)을 수행하고 있는 수천 명의 질적 연구자들과 함께 일해왔습니다. 이 연구자들은 거만하지 않습니다(not cavalier). 그들은 기술적 신기함(technological novelty)에 유혹당하지 않았습니다(not seduced). 그리고 그들은 확실히 AI가 그들을 대신해 의미를 만들어주기를 기대하고 있지 않습니다.

 

애리조나 주립대(Arizona State)와 펜실베이니아 주립대(Penn State) 연구자들의 최근 동료 검토 연구(peer-reviewed study)를 고려해 보십시오. 그들은 초등학생들의 소그룹 교실 토론 녹취록 371개를 분석하는 데 도움을 주기 위해 AI를 사용했습니다. 이것은 깨끗하거나 쉽게 코드화될(codified) 수 있는 데이터가 아니었으며, 질적 해석(qualitative interpretation)이 오랫동안 인간의 손길(human hand)을 필요로 한다고 여겨졌던 바로 그 영역이었습니다. 그랬음에도 불구하고, 이 토론 중 학생들의 추론(reasoning)을 식별하는 데 있어 AI는 전문 인간 분석가들과 96% 수준의 일치 정확도(agreement accuracy)에 도달했습니다.

 

그러나 그 연구의 중요성은 높은 일치 수준에 있는 것이 아니라, 인간과 AI 사이의 불일치의 순간들(moments of disagreement)에 있었습니다. 한 사례에서, 시스템은 학생의 개인적인 일화(anecdote)를 주장을 뒷받침하는 정당한 증거로 분류했는데, 이는 인간 분석가들이 잘못 기각했던(wrongly dismissed) 판단이었습니다. 이러한 차이(divergence)에 직면하여, 연구자들은 연구의 핵심에 있는 바로 그 해석적 가정들(interpretive assumptions)에 대한 성찰적 재검토(reflexive re-examination)에 참여하도록 강요받았습니다: 정확히 무엇이 추론으로 간주되는가(counts as reasoning)?

 

혹은 유니세프(Unicef), 유네스코(Unesco), 국제노동기구(International Labour Organization), 유엔인구기금(UN Population Fund)을 포함한 여러 유엔 기구들을 위해 수행된 메타 종합(meta-synthesis)을 고려해 보십시오. 이들은 일반적으로 방법론적 해이함(methodological laxity)이나 증거를 가볍게 다루는 것(casual engagement)으로 비난받는 기관들이 아닙니다. 교육과 고용 전반에 걸친 청소년 프로그램에 대한 298건의 보고서를 분석하기 위해 AI를 사용하여, 연구자들은 복잡한 주제 패턴(thematic patterns)을 식별하는 데 있어 전문 검토자들과 92%의 일치 정확도를 달성했습니다.

 

그러나, 다시 한번 더 드러나는 것은 마찰 지점들(points of friction)이었습니다. AI가 수백 개의 문서 전반에 걸쳐 핵심 용어들이 어떻게 사용되는지를 추적함(traced)에 따라, 그것은 반복적으로 중요한 문제들을 제기했습니다. 예를 들어, 실무에서 "누구도 소외되지 않게 한다(leave no one behind)"는 것은 정확히 무엇을 의미했는가? "성 반응적(gender-responsive)"은 "성 변혁적(gender-transformative)" 프로그래밍과 어떻게 다른가? 이 문구들은 수십 개의 UN 보고서에서 반복되었지만, 그 사용법은 일관성이 없고(inconsistent), 탄력적이며(elastic), 종종 정의되지 않았습니다(undefined). AI에 의해 이러한 개념적 명확성의 부재(lack of conceptual clarity)에 직면하게 되자, 연구자들은 그들 자신의 프레임워크와 그것을 뒷받침하는 가정들을 재질문(reinterrogate)해야만 했습니다.

 

이런 방식으로 보면, 성찰성(reflexivity)은 AI가 반드시 소유해야 하는(possess) 무언가가 아니라 AI가 자극할 수 있는(provoke) 무언가입니다. 비판적으로 사용될 때(Used critically), AI는 인간의 해석을 지름길로 가거나(shortcut) 전복시키기(subvert)보다는 도전하고 강화할 수 있습니다(challenge and strengthen). 그것은 연구자들이 프레임워크를 스트레스 테스트(stress-testing)하고, 물려받은 가정들에 도전하며, 데이터 전반의 불일치를 발견하고(uncovering inconsistencies), 분석적 결정들을 투명하고 논쟁 가능하게(transparent and contestable) 만드는 데 도움을 줍니다.

 

그렇다면 왜 그 편지는 이러한 증거 중 어느 것도 다루지 않을까요(engage none of this evidence)? 왜냐하면 방법론(methodology) 이상의 무언가가 방어되고 있기 때문입니다.

 

질적 연구는 지식을 셀 수 있고(counted), 복제 가능하며(replicated), 인간의 해석으로부터 독립적인(independent of) 것으로 정의했던 실증주의적, 양적 정통성(positivist, quantitative orthodoxy)에 맞서 등장했습니다. 이 전통의 연구자들은 인간의 해석이 중요하다는 인정을 받기 위해 힘들게 싸웠으며, 그들 기술(craft)의 엄격함(rigour)과 대체 불가능성(irreplaceability)을 주장함으로써 그 싸움에서 승리했습니다: 질적 데이터와 함께 몇 시간 동안 앉아, 읽고 또 읽으며, 사람들 말의 무게를 느끼는 느리고 고통스러운 노동(slow, painstaking labour) 말입니다. 시간이 흐르면서, 이러한 수동적 몰입(manual immersion)은 단순한 방법이 아니라 하나의 정체성(identity)이 되었습니다.

 

계산(computation), 자동화(automation), 규모(scale)라는 과거 양적 연구의 위협이 가진 표면적 특징들(surface features)을 지니고 있다는 이유로, AI는 질적 연구자들 사이에서 동일한 방어적 반사 작용(defensive reflex)을 유발합니다(triggers). 절대적인 금지(absolute ban)는 정체성을 보호하지만, 그것은 탐구(enquiry)를 확신(certainty)으로 대체함으로써 그렇게 합니다. 이는 바로 성찰성이 막고자 했던(guard against) 것입니다. 그리고 이러한 절대주의적 거부는 그 편지가 인정하지 않는(does not acknowledge) 결과들을 초래합니다.

 

애리조나 주립대 연구는 371개의 녹취록을 포함했으며, 저자들이 언급했듯이 AI 없이는 분석하는 데 "두 명의 연구 보조원이 학사 일정의 대부분(better part of an academic year)"을 필요로 했을 것이며, 그러면서도 "긴 질적 텍스트를 작업할 때의 피로(fatigue), 과부하(overload) 또는 선택적 주의(selective attention)와 같은 한계에 의해 영향을 받았을 것"입니다. 그러한 사치(luxury)를 누리는 연구팀은 거의 없습니다. 특히 자금이 부족한 기관(underfunded institutions), 글로벌 사우스, 그리고 엘리트 학술 네트워크 밖에서는 더욱 그렇습니다. 결과적으로, 환자, 노동자, 이주민 및 지역사회로부터 나오는 방대한 양의 생생한 경험(lived experience)은 보이지 않는 상태(invisible)로 남게 됩니다. 인간의 의미 만들기를 보호한다고 주장하는 편지는, 실제로는(in practice), 그 중 많은 부분이 결코 일어나지 않도록 보장하는 결과(ensuring that much of it never happens)를 낳습니다.

 

그 편지의 가장 큰 아이러니(irony)는 그것이 AI가 성찰성과 자신의 가정을 질문하는(questioning one's own assumptions) 학문의 기초적인 헌신에 미칠 위협을 경고하면서도, 정작 그 금지 자체는 동일한 정밀 조사(scrutiny)를 거치지 않은 채 무조건적인 금지(categorical ban)를 요구한다는 것입니다. 질적 연구가 상징하는(stands for) 것을 보호하려는 충동은 정당합니다(legitimate). 하지만 그것은 그것이 무엇인지에 대한 명석한 감각(clear-sighted sense)에 의해 뒷받침되어야(underwritten) 합니다.

 

 

Med Teach. 2026 Jan 8:1-10. doi: 10.1080/0142159X.2025.2610400. Online ahead of print.

Redefining social accountability for medical schools - beyond codes and contracts to measuring contributions 

 

 

🏥 의과대학은 정말 사회를 건강하게 만들고 있을까요? '사회적 책무성'을 다시 생각하다 

안녕하세요! 오늘은 의학 교육계에서 아주 핫하고 중요한 논문 하나를 소개해드리려고 해요.

우리는 흔히 '의과대학(Medical Schools)'이라고 하면, 훌륭한 의사를 길러내고, 어려운 환자를 치료하고, 새로운 치료법을 연구해서 사회에 기여해야 한다고 생각하죠. 이걸 전문 용어로 '사회적 책무성(Social Accountability)'이라고 합니다.

그런데 1995년 WHO가 이 개념을 정의한 지 30년이 지났는데도, 여전히 많은 의대가 사회의 기대에 미치지 못한다는 비판이 있어요. 도대체 왜 그럴까요? 🤔

오늘 소개할 논문은 "우리가 그동안 '사회적 책무성'을 너무 좁게, 그리고 딱딱하게 생각했던 건 아닐까?"라는 질문을 던지며, 새로운 관점인 '기여(Contributions)'를 제안합니다.


📜 1. 역사: '이타적 규범'에서 '계약'으로 

옛날(1900년대 초반) 미국의 의학 교육 개혁가 플렉스너(Flexner) 시절에는 의과대학이 사회에 봉사하는 것을 일종의 이타적인 '규범(Code)'으로 여겼어요. "우리는 전문직이니까 당연히 사회를 위해 좋은 일을 해야지" 같은 느낌이었죠.

하지만 시간이 흐르며 WHO는 1995년에 이것을 사회와의 '계약(Contract)'으로 재정의합니다.

"납세자가 돈을 냈으니, 의대는 그만큼 사회가 필요로 하는 결과물(의사, 연구 등)을 내놓아라!"

 

마치 비즈니스 계약처럼 '투자에 대한 수익(Return on Investment)'을 따지게 된 거죠.


🚧 2. 왜 진전이 없을까요? (4가지 오해) 

연구진은 우리가 '사회적 책무성'을 이야기할 때, 암묵적인 4가지 가정(Implicit Assumptions) 때문에 발목이 잡혀있다고 지적해요.

1️⃣ 말장난 같은 용어 (Semantic) 

'Accountability'라는 단어는 언어마다 느낌이 달라요. 어디선 '처벌을 피하는 것' 같고, 어디선 '책임감'과 헷갈리죠.

"용어에 의존하는 규범적 논쟁에서 벗어나, 개인, 기관, 대중에게 의미 있는 측정에 집중해야 합니다."
"Move away from normative debates that depend on terminology to focus on measurements that have meaning to individuals, institutions, and the public."

2️⃣ 모호한 지역의 경계 (Geographic) 

의대가 봉사해야 할 '지역사회'는 어디까지일까요? 학교 바로 옆 동네? 아니면 국가 전체? 아니면 전 세계? 요즘처럼 의사들이 국경을 넘어 이동하는 시대에, 딱 잘라 말하기 어렵다는 거죠.

3️⃣ 다 다른 돈주머니 사정 (Socioeconomic) 

모든 의대가 세금(공적 자금)으로 운영되는 건 아니에요. 어떤 학교는 사립이고, 어떤 학교는 외국인 학생 유치로 국가 경제에 이바지하기도 해요. 그런데 똑같은 잣대로 "세금 냈으니 토해내라"고 할 순 없겠죠?

4️⃣ 졸업하면 끝? (School Outcomes) 

의대는 학생을 뽑고 가르치지만, 졸업생이 나중에 어디서 개업할지, 어떤 진료를 할지 강제로 시킬 순 없어요. 즉, 학교가 통제할 수 없는 결과까지 책임지라는 건 무리라는 겁니다.


🌍 3. 해결책: '계약'을 넘어 '기여'로

이 논문의 하이라이트입니다! ✨ 연구진은 모든 의과대학을 하나의 잣대(Monolith)로 평가하지 말고, 각 학교가 처한 상황과 강점에 맞춰 사회에 어떤 '기여(Contributions)'를 하는지 봐야 한다고 주장해요.

어떤 학교는 시골 마을 주치의를 많이 배출해서 기여하고(예: 캐나다 NOSM), 어떤 학교는 엄청난 연구로 난치병을 고쳐서 전 세계에 기여할 수 있죠(예: 존스 홉킨스).

연구진은 의과대학의 본질에 대해 아주 강력한 의견을 제시합니다.

"핵심적으로, 의과대학의 사회적 책무성에 대한 담론은 좋은 의과대학이란 무엇이며 무엇을 하는가를 정의하는 것에 관한 것입니다; 이는 근본적으로 윤리적인 문제입니다."
"At its core, the discourse on social accountability of medical schools is about defining what a good medical school is and does; this is a fundamentally ethical issue."

 

그리고 무엇보다, 의과대학이 이것저것 다 하려다 본질을 놓치지 말라고 조언해요.

"우리는 의과대학이 반드시 해야 하는 일은 개인을 의사가 되도록 교육하는 것이라고 주장합니다."
"We contend that what a medical school must do is educate individuals to become physicians."

학교가 병원을 소유하지 않아도, 거창한 연구를 안 해도, 제대로 된 의사를 길러내는 것(Education)만으로도 충분히 사회적 기여가 될 수 있다는 거죠!


🚀 4. 결론: 투명하게 보여주고 선택하게 하라 

결국 중요한 건, 각 학교가 자신들이 사회에 미치는 영향(사회적, 경제적, 환경적 영향)을 투명하게 공개하고, 학생이나 정부, 지역사회가 그 데이터를 보고 판단하게 하는 것입니다.

마지막으로 연구진의 결론을 인용하며 마칠게요.

"사회와 의학 교육 양쪽의 증가하는 복잡성은 의학 교육 시스템을 사회적 필요와 더 잘 일치시키기 위해, 현지에서 전 세계로 이어지는 스펙트럼을 따라 다양한 관점에서 의과대학 활동의 '기여'를 인식하는 새로운 접근 방식을 정당화합니다."
"The growing complexities of both societies and medical education warrant a new approach that recognizes the ‘contributions’ of medical school activities from a variety of perspectives, along a local to global spectrum in order to better align medical education systems with societal needs."


📝 요약하자면: 이제 의과대학에 무조건적인 '책임(계약)'을 묻기보다, 각 학교가 잘하는 방식으로 사회에 어떻게 '기여'하고 있는지를 다양하고 유연하게 바라보자는 것이죠!

의학 교육, 혹은 대학의 사회적 역할에 관심 있는 분들께 신선한 충격이 되는 논문이었습니다. 여러분의 생각은 어떠신가요? 💡

 


전 세계적으로(Throughout the world), 보건 시스템(health systems)은 의료 인력의 안녕(well-being of health workers)을 지원하면서 동시에 인구 집단의 필요(needs of populations)를 충족시키기 위해 고군분투해왔습니다. 의과대학(Medical schools)은 보건 시스템의 성과(health system performance)에 있어 필수적입니다. 의과대학은 의사를 교육하고(educate physicians), 임상 진료를 지원하며(support clinical services), 연구 및 기타 학술적 노력(research and other scholarly endeavors)을 옹호합니다(champion). 이 모든 활동은 사회의 건강(health of societies)에 이익이 될 수 있으며, 결과적으로 '사회적 책무성(social accountability)'을 입증(demonstrate)하게 됩니다.

 

사회적 책무성을 향한 현대적인 움직임(The contemporary movement for social accountability)은 일반적으로 1995년 세계보건기구(WHO)의 간행물인 '의과대학의 사회적 책무성 정의 및 측정(Defining and measuring the social accountability of medical schools)' [1]으로 그 기원을 거슬러 올라갑니다(traces itself to). 이 문헌은 의과대학의 사회적 책무성을 다음과 같이 정의했습니다:

 

  • 교육, 연구 및 봉사 활동(education, research, and service activities)을 그들이 봉사할 권한(mandate)을 위임받은 지역사회, 지역 및/또는 국가의 우선순위 건강 문제(priority health concerns)를 해결하는 방향으로 이끌어야 할 의무(obligation).

 

그 이후로 이 주제에 대한 문헌이 풍부함(abundance of literature)에도 불구하고 [2], 많은 이들은 의과대학이 사회적 기대(societal expectations)를 충족시키지 못하고 있다고 여전히 우려하고 있습니다.

 

  • 더 많은 진전이 이루어지지 않은 이유를 이해하기 위해, 이 글에서 우리는 먼저 1995년 WHO의 정의 이전에 의과대학과 사회가 맺었던 관계를 기술하고, 1995년 WHO의 사회적 책무성 요청(call for social accountability)에 선행했던 의과대학의 이타적인 '규범(code)'에 주목할 것입니다.
  • 우리는 변화하는 사회경제적 역학(socioeconomic dynamics)이 어떻게 WHO로 하여금 의과대학과 사회의 관계를 사회적 '계약(contract)'으로 프레임화(frame)하도록 만들었는지 설명합니다.
  • 우리는 WHO 정의 이후 30년 동안의 주목할 만한 사건들과 진행 중인 과제(ongoing challenges)를 요약하며, 의과대학과 사회가 국제적으로 더욱 복잡해짐(become more complex)에 따라 의과대학 기여(contributions)의 가치는 다양한 관점(variety of perspectives)에서, 그리고 현지에서 전 세계에 이르는 스펙트럼(local to global spectrum) 상에서 이해되어야 함을 제안합니다.

 

우리는 최근에 리뷰 논문들 [2, 3]이 작성되었고 이 주제에 관한 책 [4]이 출판되었기에, 상당히 실질적이지만 포괄적이지는 않은 개요(substantial but not exhaustive overview)를 제시합니다. 우리는 의학 교육(medical education)에 있어 폭넓은 국제적 경험(broad international experience)을 가지고 있으며, 이 글의 아이디어들은 본 원고를 작성하기 전 일련의 토론을 통해 발전되었습니다. 하지만 우리는 모든 의학 교육 시스템 모델(model of medical education system)을 다룰 수는 없었습니다. 우리의 의도는 비판과 추가적인 대화(critique and further dialogue)를 장려하는 것입니다. 우리는 우리가 제기한 문제들에 대해 하나의 확정적인 '해결책(solution)'이 아닌, 앞으로 나아갈 잠재적인 방법(potential ways forward)들을 제안하며 결론을 맺습니다. 가능한 많은 해결책은 다양한 관점(diverse perspectives)을 통합하는 참여적 접근 방식(participatory approaches)을 통해 도출되어야 할 것입니다.

의과대학을 위한 3대 임무의 기원 (Origins of a tripartite mission for medical schools) 

WHO 정의에 있는 '교육, 연구 및 봉사 활동(education, research, and service activities)'이라는 문구는 이들 활동—'3대 임무(tripartite mission)'를 구성하는—이 의과대학에 필수적임을 암시합니다. 그러나 의과대학이 항상 이 모든 활동에 관여했던(engaged in) 것은 아닙니다.

 

시간이 흐름에 따라 소수의 의학 교육 센터(centers for medical education)가 있었지만 [5], 유럽에서 제도화된 의학 교육(institutionalized medical education)은 중세(middle ages) 살레르노(Salerno)의 의과대학과 함께 시작되었습니다 [6, 7].

 

  • 그곳의 졸업생들과 의학 서적(medical texts)의 확산은 유럽에 새로운 의과대학 설립으로 이어졌고, 많은 학교가 궁극적으로 법학, 신학, 철학 학교(schools of law, theology, and philosophy)와 함께 대학(universities)에 통합되었습니다(incorporated into) [7].
  • 일찍이 1600년대와 1700년대에 의대생들을 포함하는 전용 임상 교육 병동(dedicated clinical teaching wards)이 있었으며 [8], 임상 진료(clinical services)는 프랑스 혁명 이후(post-revolutionary France) 병원과 의과대학이 중앙 집권적인 국가 통제(centralized state control) 하에 놓이게 되면서 처음으로 의학 교육과 통합되었습니다.
  • 연구(Research)는 1800년대 독일 대학(German universities) 내 의과대학의 핵심 활동이 되었습니다 [9]. 독일 모델(German model)은 1876년 설립된 미국의 첫 번째 연구 중심 대학(research university)인 존스 홉킨스 대학(Johns Hopkins University)과, 교육, 연구 및 임상 진료를 결합하도록 설계되어 1893년에 설립된 존스 홉킨스 의과대학(JHUSOM)의 기초가 되었습니다.

 

미국 및 캐나다 의학 교육에서의 3대 임무 표준화 (Standardizing the tripartite mission in U.S. and Canadian medical education) 

19세기 후반은 의학에 있어 역동적인 시기였는데, 세균설(germ theory), 신약 개발(예: 아스피린), 무균 수술 기법(antiseptic surgical techniques)과 같은 과학적 진보(scientific advances)가 공중 보건과 의학적 치료를 더욱 효과적으로 만들었고, 그 결과 환자와 대중에게 의학 교육을 더욱 중요하게(salient) 만들었기 때문입니다.

 

미국에서는 교육에 대한 연방 차원의 감독 시스템(federal system of oversight)이 없었으며, 이는 매우 다양한 의과대학 구조와 철학(wide variety of medical school structures and philosophies)을 초래했습니다 [10].

 

  • 1900년대 초반, 미국 의사 협회(AMA)는 주 면허 위원회(state licensing boards)에 의과대학을 규제할 것을 로비하고 있었으며, 카네기 교육 진흥 재단(Carnegie Foundation for the Advancement of Teaching)에 AMA 의학 교육 위원회(Council on Medical Education)가 1906년에 시작한 조사(inspections)를 기반으로 연구를 수행해 줄 것을 요청했습니다 [11].
  • 카네기 재단은 존스 홉킨스 대학 졸업생인 아브라함 플렉스너(Abraham Flexner)에게 미국과 캐나다의 모든 의과대학을 평가하도록 의뢰했습니다. 1910년 그의 발견을 보고하면서, 플렉스너는 JHUSOM을 '골드 스탠다드(gold standard, 판단의 기준)'로 극찬하고 그의 권고안에서 교육, 연구 및 임상 진료라는 3대 임무(tripartite mission)를 채택했습니다(embraced).
  • 1900년에서 1920년 사이 미국의 의과대학 중 절반이 문을 닫았으며, 남은 학교들은 대체로 플렉스너의 모델(Flexner’s model)에 부합했습니다(aligned with) [11, 12].

 

미국 의학 교육의 표준화(standardization)와 함께 의과대학이, 플렉스너가 칭한 대로, '공공 서비스 기업(public service corporations)'이 되어야 한다는 암묵적인 이해(implicit understanding)가 생겨났습니다 [13]. 플렉스너 자신은 그가 선호하는 모델을 지원하기 위해 자선 기금(philanthropic funds)을 유치하는 데 중요한 역할을 했습니다. 그는 특히 영리 목적의 의과대학(proprietary medical schools)을 주도하는 상업주의(commercialism)에 대해 우려를 가지고 있었는데 [14], 이는 그가 글을 쓰던 시기가 미국의 진보주의 시대(progressive era)였고, 당시 미국 산업가들이 노동자를 희생시켜(at the expense of workers) 부를 축적하고 있다는 광범위한 우려가 있었기 때문입니다 [12]. 플렉스너의 보고서 이후, 의과대학이 사회에 봉사해야 할 필요성(need for medical schools to serve society)은 미국과 캐나다 의학 교육 문헌에서 공통된 주제(common theme)로 남아 있습니다 [15, 16].

의학 교육의 세계화와 인권으로서의 건강 (Globalization of medical education and health as a human right) 

의학 교육의 국제적 교류(international exchange)에는 오랜 역사가 있지만 [17], 제2차 세계 대전의 종식은 지속적인 글로벌 기관들(enduring global institutions)의 창설로 이어졌습니다. 1945년에 작성된 유엔(UN) 세계인권선언(Universal Declaration of Human Rights)은 모든 개인에 대한 동등하고 공정한 대우(equal and fair treatment)라는 새로운 글로벌 표준(new global standard)을 발표했습니다 [18]. 1946년 세계보건기구(WHO) 헌장(Constitution)은 '도달 가능한 최고 수준의 건강을 누리는 것(enjoyment of the highest attainable standard of health)'을 '기본권(fundamental right)'으로 포함했습니다. 또한 WHO 헌장은 그 기능 중 하나로 '보건, 의료 및 관련 전문직의 교육 및 훈련(teaching and training) 수준 향상을 촉진(promote)할 것'을 명시했습니다 [19].

보건 시스템의 변화와 플렉스너의 '규범'에서 WHO의 '계약'으로의 이동
(Health system changes and moving from Flexner's code to WHO’s contract)

1960년대에 이르러, 지식의 생산(production of knowledge)과 보건 서비스의 감독(supervision of health services)을 통해 20세기 전반부에 확립되었던 의사들의 직업적 지배력(professional dominance)이 도전을 받게 되었습니다(being challenged) [20]. 이는 다양한 요인들 [20, 21]에 기인했지만, 아마도 가장 중요한 것은 전 세계적으로 연구 및 보건 서비스(research and health services)에 투입되는 자금이 증가함(increasing funding)에 따라, 사회적 기대(societal expectations)와 감독(oversight)이 커졌기 때문일 것입니다.

 

1978년 WHO의 알마아타 선언(Declaration of Alma Ata)은 '사회 정의(social justice)'를 달성하기 위해 일차 보건 의료(primary health care)에 기반을 둔 국가 보건 시스템(national health systems anchored in primary health care)을 장려함으로써 글로벌 보건 사고(global health thinking)의 전환점(shift)을 마련했습니다. 건강을 의사가 제공하는 의학적이고 절차적인 치료(medical and procedural treatments)가 아닌, 사회적 및 구조적 결정 요인(social and structural determinants)의 결과로 프레임화(framing)한 것은 의료 전문직의 지배력에 더욱 도전이 되었습니다 [22]. 1981년 WHO 사무총장은 '서기 2000년 만인을 위한 건강(Health for All by the Year 2000)' 글로벌 전략을 소개하면서, 그 업무를 이끌 '사회적 계약(social contract)'을 요청했습니다 [23]. 의학 저널들 또한 의학계 전반(medicine broadly) [24]과 특히 학술 의학(academic medicine) [25]이 일반적으로 이해되는 사회적 계약을 위반했다고 주장하는 논문들을 싣기 시작했습니다.

 

한편 의학 교육은 더 큰 외부적 책무성(external accountability)을 제공함으로써 이러한 변화하는 상황(changing circumstances)에 적응했습니다. 역량 중심 의학 교육(Competency-based medical education) 프로그램들이 1970년대에 시작되었으며 [26], 성취의 표준 수준(standard level of achievement)에 대한 성과(outcomes)를 측정하는 것을 강조했습니다. WHO는 1978년 '의학 교육에서의 역량 중심 교육과정 개발(competency-based curriculum development in medical education)'을 발간하여, 교육과정(curricula)이 의료 서비스 및 건강 필요(health needs)와 일치해야 할 필요성을 강조했습니다 [27]. 1990년대에 이르러서는 일부 국가에서 역량 프레임워크(competency frameworks)가 국가 프로그램 규제(national program regulation)를 주도하고 있었습니다 [26].

 

의과대학들 또한 조사(scrutiny)를 받게 되었습니다. 1995년 WHO 정의의 저자인 찰스 보엘런(Charles Boelen)은 1992년에 다음과 같이 썼습니다. '품질 관리(Quality control)가 벨기에의 초콜릿 제조업자와 프랑스의 치즈 제조업자에게는 규칙인데, 왜 의과대학은 그들의 생산물(products)에 대해 책임을 지지 않아야 합니까...?' [28] 이러한 소비자주의적 성향(consumerist orientation)은 1995년 WHO 문서에서도 발견되는데, 여기서는 '보건 의료에 대한 투자 증가로부터 더 나은 투자 수익(return on investments)'을 제공하고 '납세자의 지원을 받을 자격(merit taxpayer support)'을 갖춰야 할 필요성을 언급했습니다.

 

약 50년 전, 의료 윤리학자(medical ethicist) 윌리엄 메이(William May)는 자기 이익(self-interest)의 현실을 무시했기 때문에 비실용적(impractical)일 수 있는 전문직 '규범(codes)'과, 의사-환자 관계에 법률적(legalistic)이고 도구주의적 성향(instrumentalist orientation)을 가져올 수 있는 전문직 '계약(contracts)'의 문제점을 특성 지었습니다(characterized) [29].

 

  • 1900년대 초 미국에서 등장한 의과대학-사회 관계는 의과대학이 사회에 이타적으로(altruistically) 봉사할 것으로 기대되었던 '규범(code)'으로 볼 수 있습니다 [14]. 대조적으로,
  • WHO의 정의는 의과대학이 소비자가 요구하는 생산물(products)을 제공하고 가성비(value for money)를 입증함으로써 비즈니스적 필수 요건(business imperatives)을 충족할 것으로 기대되는 '계약(contract)'을 닮았습니다 [30].

의과대학의 사회적 책무성에 대한 글로벌 합의와 사회적 책무성 측정
(Global consensus for social accountability of medical schools and measuring social accountability)

WHO는 2000년'건강을 위한 통합(Towards Unity for Health)' 회의를 시작했고, 2002년에는 이를 1979년에 시작된 학계-지역사회 파트너십(academic-community partnerships)을 가진 학교들의 연합체(consortium)인 '네트워크: 혁신적인 교육, 봉사 및 연구를 통한 건강을 위한 지역사회 파트너십(The Network: Community Partnerships for Health through Innovative Education, Service, and Research)'과 합병했습니다. 이는 사회적 책무성의 굳건한 지지자(steadfast proponent)로 남아 있는 '네트워크: 건강을 위한 통합(TUFH)'을 탄생시켰습니다 [31].

 

그 외에는 WHO의 사회적 책무성 요청에 대한 반응(responses)은 더디게 형성되었습니다(slow to form).

 

  • 캐나다 의과대학 협회(AFMC)의 2001년 백서(white paper)인 '사회적 책무성: 캐나다 의과대학을 위한 비전(Social Accountability: A Vision for Canadian Medical Schools)'은 사회적으로 책무성 있는 의학 교육을 위한 최초의 국가 계획(national plan)이었습니다 [32].
  • 캐나다 이외의 지역에서 2010년 이전에는, 사회적 책무성과 명시적으로 연계된 활동(activities explicitly linked to social accountability)은 특정 학교들의 이니셔티브(initiatives)로 제한되었습니다. 예를 들어, 자선 기금 지원(philanthropy-supported)을 받은 '보건 형평성 네트워크 훈련(Training for Health Equity Network, THEnet)'은 건강 필요(health needs)를 해결하기 위해 의사를 훈련시키는 데 공동의 관심(shared interest)을 표명한 자원이 부족한 환경(resource-constrained settings)에 있는 7개 학교의 모임이었습니다 [33].

 

2010년에는 전 세계 130명의 개인 및 단체가 포함된 3단계 델파이 기법(Delphi process)을 기반으로 '의과대학의 사회적 책무성에 대한 글로벌 합의(Global Consensus for Social Accountability of Medical Schools)'가 발표되었습니다 [34]. 그 10가지 '주제 영역(thematic areas)'은 의도적으로 의과대학이 건강 필요에 미치는 영향(impact)을 평가하는 데 초점을 맞추었습니다. 이는 플렉스너 보고서 100주년(centennial)을 맞이하여 영향력 있는 개혁 요구(influential calls for reform)들과 시기적으로 일치했으며 [35, 36], 사회적 책무성에 대한 활기찬 관심(invigorated interest)이 그 뒤를 이었습니다.

 

의과대학의 사회적 책무성을 측정하기 위한 프레임워크(frameworks)가 글로벌 합의(Global Consensus) 이전에 발표되기는 했지만 [37, 38], 학교들이 우선순위 건강 필요(priority health needs)를 얼마나 잘 해결했는지를 기반으로 한 최초의 학교 등급 평가(rating)는 평판(reputation)과 연구 지표(research measures)에 기반한 인기 있는 순위(popular rankings)와 대조를 이루기 위해 2010년 '사회적 사명 순위(social mission rankings)'로 발표되었습니다 [39]. 이후 사회적 책무성을 평가하기 위한 더 많은 이니셔티브가 뒤따랐는데, 여기에는 2012년 사회적 책무성에 대한 AMEE ASPIRE의 상(awards program) [40], THEnet 학교들에서의 사회적 책무성 측정치(measures)에 대한 시범 테스트(pilot testing) [41, 42], 발표된 사회적 책무성 측정치들을 종합한(synthesized) 제안된 프로그램 평가 프레임워크 [43], 사회적 사명 연합(Social Mission Alliance)의 사회적 사명 지표(metrics) [44], 국제 의대생 연합(International Federation of Medical Students Association)이 개발한 등급 평가 도구(rating instrument) [45], 그리고 기관의 자가 평가(institutional self-assessment) 및 개발을 안내하기 위해 TUFH가 발표한 사회적 책무성 지표 도구(Indicators for Social Accountability Tool) [46] 등이 포함됩니다.

 

의과대학의 사회적 책무성에 대한 지속적인 과제들
(Ongoing challenges to social accountability of medical schools)

학교들이 더욱 사회적으로 책무성을 갖추고(become more socially accountable) [47], 사회적 책무성을 교육과정에 통합하며(integrate social accountability into curricula) [48], 사회적 책무성을 위한 리더십을 개발하고(develop leadership for social accountability) [49], 건강 필요 평가 및 성과 모니터링(health needs assessments and outcomes monitoring)을 수행하도록 [50] 돕는 이러한 프레임워크와 추가적인 지침(guides)의 개발에도 불구하고, 최근 문헌 고찰은 진전이 제한적이었다(progress has been limited)고 시사합니다 [3]. 변화에 대한 어느 정도의 저항(resistance to change)은 불가피하지만, 진전을 어렵게 만드는(challenged progress) 사회적 책무성 특유의 적어도 네 가지 암묵적인 가정(implicit assumptions)이 존재합니다(Table 1).

 

표 1. 사회적 책무성의 진전을 어렵게 하는 네 가지 암묵적 가정 요약 (Table 1. Summary of four implicit assumptions challenging progress in social accountability.)


표 1. 사회적 책무성의 진전을 어렵게 하는 네 가지 암묵적 가정 요약
(Table 1. Summary of four implicit assumptions challenging progress in social accountability)

1. 의미론적 (Semantic)

  • 가정 (Assumption): '사회적 책무성(Social accountability)'은 전 세계적으로 명확히 이해되고 있다.
  • 왜 문제가 되는가 (Why it is problematic):
    • '책무성(accountability)'의 의미는 다른 언어로 번역될 때 달라진다.
    • 영어권 지역(English-speaking areas)에서도 다른 용어를 선호할 수 있다.
    • '사회적 책무성'은 동료 심사 문헌(peer-reviewed literature)에서 비일관적으로(inconsistently) 사용된다.
  • 해결책 (Remedy):
    • 용어에 의존하는 규범적 논쟁(normative debates)에서 벗어나, 개인, 기관, 대중에게 의미 있는 측정(measurements)에 집중하라.

2. 지리적 (Geographic)

  • 가정 (Assumption): 학교는 잘 정의된 '지역사회, 지역 및/또는 국가(community, region, and/or nation)'에 봉사한다.
  • 왜 문제가 되는가 (Why it is problematic):
    • 명확한 경계(clear boundaries)를 설정하는 것은 필연적으로 일부 지역사회를 배제하게 된다.
    • 학교는 전문화될 수 있으며 글로벌 중요성(global importance)을 가진 문제에 우선순위를 둘 수 있다.
  • 해결책 (Remedy):
    • 모든 학교의 영향을 현지에서 전 세계에 이르는 스펙트럼(local to global spectrum) 상에서 고려하라.

3. 사회경제적 (Socioeconomic)

  • 가정 (Assumption): 학교는 교육, 연구, 임상 진료를 위해 납세자의 자금(taxpayer funds)을 사용한다.
  • 왜 문제가 되는가 (Why it is problematic):
    • 학교 재정 모델(School financing models)은 매우 다양하다(highly variable).
    • 주최국(host country)에 대한 학교의 주요 가치는 경제적인 것(economic)일 수 있다.
  • 해결책 (Remedy):
    • 경제적 가치는 관점(perspective)에 따라 달라지며 그에 따라 평가되어야 한다.

4. 학교 성과 (School outcomes)

  • 가정 (Assumption): 학교는 그들의 성과(outcomes)에 대해 책무를 져야 한다.
  • 왜 문제가 되는가 (Why it is problematic):
    • 학교는 졸업생(graduates)에 대한 통제권이 없다.
    • 학교들은 서로 다른 성과를 내도록 설계되었다.
    • 학교 성과의 적절성(appropriateness)은 다른 학교들과의 조화(fit)에 달려 있다.
  • 해결책 (Remedy):
    • 학교를 지역, 국가, 국제 의학 교육 시스템(systems)의 일부로 이해하라.

그러한 가정 중 하나는 의미론적인 것(semantic)입니다.

 

  • 즉, '책무성(accountability)'이 모든 언어에서 동일한 의미를 가질 것이라는 가정입니다.
    • 아랍어에서 이 번역은 처벌을 피하기 위해 취해야 할 조치(actions that need to be taken to avoid punishment)를 지칭합니다.
    • 프랑스어와 스페인어에서 가장 가까운 용어는 '책임(responsibility)'과 밀접하게 관련되는데, 이는 특히 골치 아픈 문제입니다(troublesome). 왜냐하면 WHO의 원래 정의에서 '사회적 책무성(social accountability)'은 '사회적 책임(social responsibility)'과 직접적으로 대조되었으며(directly contrasted with) (그리고 더 우월한 것으로 명시되었기) 때문입니다 [1]. 게다가 '책무성'과 '책임'은 모두 의과대학을 위한 '사회적 의무 척도(social obligation scale)'에서 '반응성(responsiveness)'과 대조되기도 했습니다 [47, 51].
  • 언어가 장벽이 되지 않을 때조차 용어에 대한 선호(preferences for terms)는 환경에 따라 다를 수 있습니다.
    • 예를 들어 미국에서는 '사회적 책무성'이 흔한 문구가 아니며, 학교의 '사회적 사명(social mission)' [39, 52, 53] 또는 '사회적 계약(social contract)'을 지키는 것 [54]이 더 쉽게 이해될 수 있습니다. 여러 상충하는 프레임워크(multiple competing frameworks)와 출판된 문헌 분석을 통해 반영된 바와 같이, 더욱 까다로운 의미론적 이슈(challenging semantic issue)는 '사회적 책무성'이라는 정확한 용어가 일관성 없이(inconsistently) 혹은 심지어 앞뒤가 맞지 않게(incoherently) 사용되어 왔다는 점입니다 [55, 56].

두 번째 문제가 되는 가정(problematic assumption)은 의과대학이 '봉사할 권한(mandate)을 위임받은 지리적 지역사회, 지역 및/또는 국가'를 명확히 정의할 수 있을 것이라는 점입니다.

 

  • 이 문구의 '및/또는(and/or)'은 근본적인 개념적 모호성(conceptual ambiguity)을 야기합니다.
    • '및(And)'은 학교가 지역사회뿐만 아니라 국가적 필요(national needs)도 충족시킬 것을 요구할 수 있는 반면,
    • '또는(Or)'은 학교가 다른 곳에 집중하기 위해 지역사회, 지역, 또는 국가적 필요를 무시하는 것을 허용할 수도 있습니다.
  • 1995년 WHO 문서는 학교가 '지역사회, 국가, 그리고 국제 사회(international community)에 혜택을 주는 보건 의료 시스템 구축에 기여해야 한다'고 명시하고 있습니다. 대부분의 문헌이 사회적 책무성을 지역사회 참여 및 봉사(local community engagement and service)와 동일시하는(equate) 것으로 보이지만 [57], 일부 저자들은 학교의 의무를 국제적인 지역(international regions)의 일부로서 국경을 넘어서는 것 [58, 59] 혹은 '글로벌 사회적 책무성(global social accountability)'을 보여주는 것으로 고려하기도 했습니다 [60]. 국경 내에서조차 하나의 학교가 사회의 모든 필요(all of society’s needs)를 충족시킬 가능성이 낮다는 점을 고려할 때, 학교가 어떻게 국제 및 글로벌 사회에 대해 책무성을 보일 수 있겠습니까?

세 번째 가정은 사회경제적인 것(socioeconomic)입니다.

 

  • 즉, 모든 학교가 '납세자의 지원(taxpayer support)'을 받으므로 이에 대해 공공 투자에 대한 수익(return on public investment)을 입증할 수 있다는 것입니다.
  • 이 가정은 찰스 보엘런(Charles Boelen)이 활동했던 프랑스와, 사회적 책무성의 선도적인 옹호자(leading advocate)였던 캐나다와 같이 의학 교육이 상당한 공공 재정 지원(substantial public financing)을 받는 많은 국가에서 유효합니다(holds). 그러나 졸업 후 그리고 실제 진료(eventual practice)에 임하기 전 국제적으로 이주(migrate internationally)할 것을 기대하며 주최국 외부에서 학생을 모집하고자 하는 '국제 의대 프로그램(international medical programs)' [61]의 수가 증가하고 있습니다.
  • 그러한 학교들은 보건 의료를 개선함으로써가 아니라, 외국 학생들이 그 지역에 거주하고 공부하는 동안 지역 사업체에 활기(activity)를 불어넣음으로써 경제적으로 지역 납세자에게 혜택을 줄 수 있습니다. 만약 학교가 이미 충분한 의사 인력(physician workforce)을 보유한 국가에 있다면 그들의 해외 이주(outmigration) 또한 지역 인구에게 해롭지 않을 것입니다. 의과대학 재정(financing)은 상황에 따라 극적으로 다르며, 재정 조달 방식에 따라 학교가 다양한 지역사회와 대중에게 갖는 의무(duties)는 여전히 해결되지 않은 상태(unsettled)입니다.

네 번째 가정은 의과대학이 학생들의 성과(outcomes of its students)를 결정할 수 있다는 것입니다.

 

  • 의과대학은 의료 전문직을 위한 문지기(gatekeepers)이며, 환자와 인구 집단의 필요를 해결해 나갈 자격을 잘 갖춘 개인(well-qualified individuals)을 입학시키는 데 중요한 역할을 합니다. 학교는 또한 조직 구조와 교육과정 내에서 사회적 선(social good)을 증진할 수 있습니다. 그러나 의과대학은 졸업생이 떠난 후에는 그들이 어디서 개업(practice)할지 혹은 임상 진료를 제공할지 선택하는 여부 등 그들에 대한 통제권(no control)이 없습니다.
  • 의무 복무 요건(compulsory service requirements)과 가혹한 재정적 불이익(harsh financial penalties)이 있는 국가들조차 졸업 후 누군가에게 진료를 강제할 수는 없습니다. 이 가정은 또한 학교들이 서로 고립되어(isolation) 기능하지 않는다는 사실을 간과합니다. 학교들은 종종 상호 보완적인 네트워크와 시스템(complementary networks and systems)을 형성할 수 있는 특정 강점(specific strengths)을 개발하는 데 초점을 맞추며 [62], 의과대학의 가치와 성과는 그 강점이 의학 교육 시스템 내 다른 학교들의 강점과 어떻게 조화를 이루는지에 따라 적절하게 달라질 수 있습니다.

 

사회적 책무성의 복잡성 – 북미 대륙의 3가지 사례
(Complexities of social accountability – 3 examples from the North American continent)

이러한 가정들이 사회적 책무성을 정의하고 측정하는 데 있어 어떻게 어려움을 야기하는지 설명하기 위해(illustrate), 우리는 북미 맥락(North American context)에서 3가지 사례를 제시합니다. 우리는 이 학교들이 4년제 학사 학위 소지자 입학 의학 박사 학위 수여 프로그램(4-year graduate-entry M.D.-granting programs)을 운영하며 미국과 캐나다 의대 지원자라는 유사한 풀(pool)에서 모집할 수 있기 때문에 이들을 대조하기로(contrast) 선택했습니다; 또한 이들은 역사, 사명(missions), 그리고 재정 모델(financing models)에서 차이가 있습니다.

 

  • 노던 온타리오 의과대학(Northern Ontario School of Medicine, NOSM University)은 2002년에 노던 온타리오 지역사회의 필요에 반응하고(responsive to the needs) 졸업생들이 의료 소외 지역(underserved areas)에서 진료하도록 보장하기 위해 공립 대학(public university)으로 설립되었습니다 [63]. NOSM은 교육, 연구 및 임상 활동 전반에 걸쳐 지역사회에 참여(community-engaged)하고 있으며 2013년 사회적 책무성 부문 AMEE ASPIRE 상의 첫 수상 그룹에 속했습니다. 이 학교는 종종 사회적 책무성의 모범 사례(exemplar)로 인용됩니다. NOSM은 의심할 여지 없이 노던 온타리오 거주민들의 건강을 개선하는 데 크게 기여하고 있습니다 [64].
  • 미국의 사립 비영리 의과대학인 존스 홉킨스 의과대학(JHUSOM)은 많은 일차 진료 의사(primary care doctors)를 배출하지 않았기 때문에 2010년 사회적 사명 순위(social mission rankings)에서 하위 20위 안에 랭크되었습니다. 그러나 JHUSOM은 세계에서 의학 연구(medical research)를 가장 많이 생산하는 기관 중 하나이며, 이는 대개 연간 8억 달러(USD)가 넘는 미국 납세자 자금 지원 연구비(U.S. taxpayer-funded grants)로 지원됩니다. JHUSOM은 이러한 자금을 받기 위해 연구 활동을 공공의 이익(public interests)과 일치시켜야 하며, 연방 기관과 대중에 대한 광범위한 보고 요건(extensive reporting requirements)을 통해 자금 사용처에 대해 책무를 져야 합니다. 임상 진료에 있어 JHUSOM은 고도의 전문적인 치료(highly specialized care)가 필요한 질환 치료를 위한 국내 및 국제적 의뢰 센터(referral center)이며, 이는 주변 이웃을 넘어서는 사회적 선(social good)이지만, 모든 사람이 접근할 수 있는 것은 아닙니다(not accessible to all).
  • 세인트 조지 의과대학(St. George’s University School of Medicine, SGUSOM)은 인구 11만 명이 조금 넘는 카리브해의 주권 국가(sovereign country) 그레나다(Grenada)에 있는 영리 의과대학(for-profit medical school)입니다. SGUSOM은 1977년 그레나다 총리의 지원으로 설립되었으며, SGUSOM이 그레나다 GDP의 최대 5분의 1을 차지하는 것으로 추정됩니다 [65]. SGUSOM은 연구에 초점을 맞추지 않으며, 임상 훈련은 주로 그레나다 외부 지역에서 이루어집니다. SGUSOM은 그레나다 인구에게 필요한 것보다 훨씬 더 많은 의사를 배출합니다; 사실, 전 세계 어느 의과대학보다 SGUSOM 출신 졸업생이 미국에서 진료하는 경우가 더 많습니다 [66]. SGUSOM은 입학하는 모든 그레나다 시민에게 파격적으로 할인된 등록금(steeply discounted tuition)을 제공하지만, 높은 중도 탈락률(attrition rates)과 미국 학교의 대략 두 배에 달하는 졸업 부채(graduating debt) 수준을 보입니다. SGUSOM의 거의 모든 수익이 학생 등록금에서 나오기 때문에, 학생 부채는 학교를 소유한 사모펀드(private equity ownership)의 이익(profit)으로 돌아갑니다.

이 3개의 학교는 사회적으로 책무성이 있습니까?

  • SGUSOM은 그레나다 경제에 필수적이며(vital), 불균형적으로(disproportionately) 일차 진료를 제공하고 필요가 높은 지역(areas of high need)에서 진료하는 상당한 비율의 미국 의사들을 공급합니다; 그러나 학생 등록금과 부채에 대한 의존은 학교가 사회적 선보다 이익을 우선시하는지(prioritizes profits over social good)에 대한 의문을 제기합니다.
  • 수 세대에 걸쳐 수백만 명에게 영향을 미칠 수 있는 과학적 획기적 발전(scientific breakthroughs)을 만들어냄에도 불구하고, JHUSOM 연구자들은 지역사회와 얼룩진 과거(checkered past)를 가지고 있으며, 기관은 여전히 이를 시정(redress)하려고 노력 중입니다.
  • NOSM은 주변 지역사회를 위해 많은 일을 하지만 캐나다의 모든 사람에게 진료 접근성을 제공할 장비를 갖추고 있지 않으며(not equipped), 이는 학교가 어떻게 국가적 또는 국제적 '봉사할 권한(mandate to serve)'을 충족시킬 수 있을지에 한계를 줍니다.

계약에서 기여로; 단일체에서 다원체로
(From contracts to contributions; from monolith to multiplicity)
 

헬스케어 수요(Healthcare demand)는 계속 증가하는 반면 진료 접근성(access to care)은 여전히 불평등합니다(inequitable). 의과대학은 다양한 활동을 통해 이러한 불평등을 해결하고 사회의 건강을 개선하는 데 도움을 줄 수 있습니다. 인구통계학(demographics), 역학(epidemiology), 기후, 정치, 경제, 기술의 변화—이 모든 것은 의과대학이 기민하고 사회적 필요에 적응할 것(agile and adaptive to social needs)을 계속해서 요구할 것입니다. 그럼에도 불구하고, 그리고 이러한 변화와 복잡성(complexities) 때문에, 의과대학이 어떤 활동에 참여해야(engage in) 하는지, 그리고 그 활동들의 상대적 이익과 해악(relative benefits and harms)은 무엇인지 끊임없이 질문하는 것이 중요합니다. 예를 들면:

  • 의과대학이 단지 개원의(practicing physicians)를 교육하는 것만으로 허용되는가(permissible), 아니면 연구에 기여하고(contribute to research) 자체적인 임상 진료 시스템(systems of clinical services)을 갖추어야만 하는가?
  • 자원이 부족한 환경(lower resourced settings)에서 의료 접근성을 개선하기 위해 설립된 의과대학이, 희귀 질환(rare conditions) 환자를 돌볼 세부 전문의(subspecialists) 양성에 초점을 맞춘 학교보다 더 중요한 필요(more important needs)를 충족시키고 있는가?
  • 의과대학은 자금 제공자(funders)에게 어떤 의무(obligations)를 지니는가? 주로 공적 자금(public funds)으로 운영되는 학교는 반드시 공공재(public good)를 생산하도록 보장해야 하는가? 최소한의 공적 자금을 받는 민영 학교(privately operated schools)의 경우, 영리 모델(for-profit model)이 중요한 사회적 가치(social value)를 창출할(yield) 수 있는가?

이러한 질문들을 해결하기 위해, 우리는 단일 의과대학이 단일한 획일적 사회(monolithic society)에 대해 책무를 질 수 있다는 생각의과대학과 사회 양쪽의 복잡성을 인정하지 못하는 것임을 인식해야 합니다. 대부분의 국가는 다수의 의과대학을 보유하고 있으며, 이들은 일반적으로 인구 집단의 필요(population needs)를 충족시키기 위한 시스템으로 기능하도록 의도되었습니다. 그러나 일부 국가는 필요보다 더 많은 의과대학을 의도적으로 설립하며; 이 경우 의과대학은 주로 외국인 투자(foreign investment)를 유치하기 위해 기능할 수 있습니다. 심지어 해당 국가의 유일한 의과대학일지라도, 이주하는 글로벌 노동력(migratory global workforce)의 일부가 되는 의사를 배출하는 글로벌 의과대학 시스템의 일부가 될 것입니다. 이 모든 학교는 기후 변화와 같이 모든 사람에게 영향을 미치는 일부 문제에 대해 우려를 공유하는 글로벌 사회(global society)에 속해(embedded in) 있습니다. 따라서 의과대학의 사회에 대한 기여(contributions)는 의학 교육 및 보건 시스템의 맥락에서, 그리고 현지에서 전 세계로 이어지는 연속선상(local to global continuum)에서 이해될 필요가 있습니다.

 

의학 교육은 서로 충돌할 수 있는 인정받지 못한 이데올로기(unacknowledged ideologies)를 가지고 있는 것으로 알려져 있습니다 [67]. 사회적 사명(social missions), 계약(contracts), 책임(responsibilities), 그리고 책무성(accountability)에 대한 대화들 역시 경제학, 교육학, 과학 및 기타 패러다임의 논리(logics)를 뒤섞어 놓았으며, 의미론적 혼란(semantic confusion)개념적 모호성(conceptual obfuscation)을 야기했습니다. 그러나 그 핵심에서, 의과대학의 사회적 책무성에 대한 담론은 좋은 의과대학이란 무엇이며 무엇을 하는가(what a good medical school is and does)를 정의하는 것에 관한 것입니다; 이는 근본적으로 윤리적인 문제(ethical issue)입니다. 특정 개인이나 집단에 대한 학교의 특별한 의무(special obligations)와 모든 사람에 대한 일반적인 의무(general obligations) 사이에는 중요한 윤리적 긴장(ethical tension)이 존재합니다. 윤리학자들은 이 문제를 일반적인 사안으로서 어떻게 가장 잘 해결할지에 대해 아직 합의에 도달하지 못했습니다. 그러나 대부분의 윤리적 관점은 모든 인류에게 봉사하려고 하면서 이웃을 돌보지 않는 것이 도덕적으로 용납될 수 없는 것과 마찬가지로, 다른 모든 사람을 희생시키면서(at the expense of everyone else) 소수의 집단에게만 봉사하는 것 또한 도덕적으로 용납될 수 없다(morally unacceptable)는 생각에 수렴할 것입니다. 마찬가지로, 환자 진료의 질(quality of patient care)에 미칠 파급 효과(downstream effects)를 고려하지 않고 등록금을 내는 학생들의 비위만 맞추는 의과대학(예: 학위 공장(diploma mills))은, 생의학 과학(biomedical sciences)을 발전시키기 위해 주변 지역사회를 착취하는 것(exploiting)과 같은 이유로 용납될 수 없을 것입니다. 그러나 이러한 극단적인 경우들을 제외하고, 우리는 용인 불가, 용인 가능, 좋음, 모범적임(unacceptable, acceptable, good, and exemplary) 사이의 경계(boundaries)를 어디에 그을지에 대해 모두가 동의할 것이라고 생각하지 않습니다(doubt).

 

우리는 의과대학이 반드시 해야 하는 일은 개인을 의사가 되도록 교육하는 것(educate individuals to become physicians)이라고 주장합니다(contend). 이는 학교가 자체적인 임상 진료를 소유하거나 연구에 투자하지 않고도 달성될 수 있습니다. 그러나 교육을 최우선 순위(top priority)로 삼는 헌신적인 교직원(dedicated faculty and staff) 없이는 달성될 수 없습니다. 임상 진료와 연구를 교육적 사명(educational mission)과 통합하는 것은 분명 도움이 될 수 있으며, 특히 이것이 교육 비용을 상쇄(offset)하는 자금을 창출할 수 있기 때문입니다. 하지만, 임상 의사 겸 교육자(clinician-educators)들은 때때로 교육 활동에 헌신하는 시간을 희생하여 임상 수입(clinical revenue)을 창출하도록 내몰려 왔습니다. 연구 결과를 출판해야 한다는 명령(imperative to publish) 또한 교육자의 안녕(well-being)을 훼손하고, 영리 목적의 수십억 달러 규모 출판 산업(for-profit, multi-billion-dollar publishing industry)에 먹잇감을 주면서(feeding into) 읽히지 않는 출판물(un-read publications)에 노력을 낭비하게 하는 의도치 않은 결과(unintended consequences)를 가져왔습니다. 우리는 학교가 교육에 집중하는 것이 용인 가능하다고(acceptable) 믿으며, 사실 더 많은 학교가 교육을 그들의 핵심 사명으로 다시 중심에 두는 것(re-center education as their core mission)이 더 나을 수 있습니다.

향후 방향 (Future directions) 

사회 내 의과대학의 역할에 대한 지속적인 대화를 이끌 증거를 생성하는 것(Generating evidence)은 필수적입니다(imperative). 앞서 기술한 바와 같이, 사회적 책무성을 위해 개발된 기존의 측정치(measures)들이 이미 존재합니다 [40–46].

  • 이것들은 연구 중심 지표(research-focused measures) [68]나 미국 의과대학 협회(AAMC)가 벤치마킹 목적(benchmarking purposes)으로 만든 미션 관리 도구(Mission Management Tool) [69]와 같은 학교 품질을 측정하려는 다른 시도들에 비추어 고려될 수 있습니다.
  • 기업(corporations)이나 복잡한 조직으로서의 의과대학은 기업의 사회적 책임(corporate social responsibility) 지표 [70], 또는 이익과 사회적 선의 균형(balance profit with social good)을 추구하며 지배구조(governance structures)투명성(transparency)에 대한 요건을 갖춘 베네핏 코퍼레이션(Benefits Corporations, B Corps) 인증에 사용되는 것과 같은 비즈니스 프레임워크에 대조하여 분석될 수도 있습니다.
  • 측정치들은 전통적인 핵심 활동(traditional core activities)별로 차별화된 의과대학의 기여를 포착하고, 성과(outcomes)를 건강 너머로 확장하여 비즈니스 문헌에서 흔히 고려되는 사회적, 경제적, 환경적 영향(social, economic, and environmental impacts)을 포함할 수 있습니다.

수집하고 보고할 구체적인 측정치의 선정은 학생, 학교 직원, 보건 시스템 파트너, 지역사회 구성원의 관점을 포함하기 위해 다양한 이해관계자(variety of stakeholders)와의 파트너십과 대화(partnership and dialogue)를 통해 이루어져야 하며 [71], 국가, 지역 및 글로벌 의학 교육 시스템 내에서 학교의 역할에 민감해야(sensitive to the role) 합니다. 이러한 협력은 학교 주도 네트워크(school-led networks), 자선 단체, 직능 단체(professional associations) 및 정부를 통해 촉진될 수 있습니다. 이는 대면 회의, 공식 설문조사, 대중 의견 수렴을 위한 온라인 옵션 등 다양한 방법을 통해 달성될 수 있습니다.

 

아마도 가장 중요한 것은, 학교 품질 측정 시도(attempts to measure school quality)의 결과가 널리 이용 가능해야(widely available) 잠재적으로 영향을 받는 개인이나 집단이 해당 학교가 그들의 기대(expectations)를 충족하고 있는지에 대해 스스로 판단(make their own determinations)할 수 있다는 점입니다. 이해관계자가 자신의 관심사(interests)에 따라 학교를 쉽게 평가할 수 있게 해주는 도구는 현재의 온라인 옵션으로 실현 가능합니다(feasible) [72]. 그러한 데이터는 투명성(transparency)을 제공하고 학생, 정부, 자선가 및 투자자가 자신의 가치(values)에 부합하도록(in alignment with) 자원을 할당(allocate)할 수 있게 할 것입니다.

 

규제 기관(Regulators)은 데이터 수집 및 보고를 지원하기에 좋은 위치에 있습니다 [73].

  • CACMS는 2017년부터 학부 의학 프로그램(undergraduate medical programs)을 위한 사회적 책무성 표준을 통합했으며 [74], 캐나다의 모든 의과대학은 이 표준을 충족한다는 증거를 제출하도록 요구받아 왔습니다. 터키의 인증기관(accreditor)인
  • TEPDAD는 의과대학을 안내하기 위한 사회적 책무성 프레임워크를 개발했으며 [75], 2025년부터 인도네시아의 인증기관(IAAHEH/LAM-PTKes)은 사회적 책무성을 그 절차에 통합하고 있습니다.
  • 의과대학 인증기관에 대한 기준을 가지고 있는 세계의학교육연합(World Federation for Medical Education, WFME)은 사회적 책무성 개념을 채택했으며 [76], 다양한 맥락 전반에서 의미 있는 측정치(meaningful measures)의 선정과 수집을 모두 지원할 수 있습니다. WFME는 세계 회의(World Conferences)를 부활시키고 있는데, 이는 전 세계적으로 균일하게(uniformly) 수집할 측정치에 대한 글로벌 합의(global consensus)를 도출하는 포럼 역할을 할 수 있으며, WFME는 대중이 이용할 수 있는 세계 의과대학 목록(World Directory of Medical Schools)에 새로운 지표(metrics)를 포함시키고 연구자들을 위해 확장된 데이터베이스를 제공할 수 있습니다.

요약 (Summary) 

사회 내 의과대학의 역할은 고정되어 있지 않습니다(not static). 우리는 플렉스너식 이타주의 '규범(code)'에서 WHO의 책무성 '계약(contract)'으로 의과대학에 대한 기대가 진화해온 과정을 기술했습니다. 사회와 의학 교육 양쪽의 증가하는 복잡성(growing complexities)은 의학 교육 시스템을 사회적 필요(societal needs)와 더 잘 일치시키기(align) 위해, 현지에서 전 세계로 이어지는 스펙트럼(local to global spectrum)을 따라 다양한 관점에서 의과대학 활동의 '기여(contributions)'를 인식하는 새로운 접근 방식을 정당화합니다(warrant).

 

 

N Engl J Med. 2025 Dec 4;393(22):2268-2270. doi: 10.1056/NEJMclde2506914.

Simplify or Stratify? The Debate over Medical School Grading Systems

 

 

성적 평가 방식을 검토하는 의과대학 (A Medical School Evaluating the Grading System)

Harleen Marwah, M.D.

 

귀하는 최근 귀하의 의과대학의 임상 전 교육과정(preclinical curriculum)을 담당하는 학장(dean)으로 임명되었습니다(named). 학교의 교수진(faculty)과 학생들 사이에는 임상 전 학년(preclinical years)의 성적 평가 방식(approach to grading)에 관해 논쟁(debate)이 있습니다. 현재의 정책(current policy)은 5단계 등급제(five-tier grading system) (A, B, C, D, F)이지만, 합격/불합격 제도(pass/fail system)로 변경하자는 요구(calls)가 있습니다. 각 접근 방식(approach)에 대해 잠재적인 이점들(potential benefits)이 제기되었으며(raised), 귀하는 학교의 임상 전 학년(preclinical years)에 대해 합격/불합격 제도(pass/fail system)를 도입할지(implement) 아니면 5단계 등급제(five-tier grading system)의 사용을 계속할지(continue) 결정해야 합니다(decide).

 

선택지 (Options)

 

다음의 접근 방식(approaches) 중 어떤 것을 선택하시겠습니까(choose)? 문헌(literature), 귀하의 경험(experience), 출판된 지침(published guidelines), 그리고 기타 정보(other information)에 근거하여(base your choice on) 선택하십시오.

  1. 합격/불합격 제도(pass/fail system)를 도입한다(Implement).
  2. 5단계 등급제(five-tier grading system)를 유지한다(Continue).

귀하의 의사 결정(decision making)을 돕기(aid) 위해, 우리는 해당 분야의 전문가(experts in the field) 두 명에게 편집자들이 배정한(assigned) 접근 방식(approaches)을 지지하는(in favor of) 증거(evidence)를 요약해 달라고(summarize) 요청했습니다. 이 문제(issue)에 대한 귀하의 지식(knowledge)과 전문가들이 제시한 요점(points made by the experts)을 고려할 때(Given), 어떤 접근 방식(approach)을 선택하시겠습니까(choose)?


선택지 1 (Option 1) 합격/불합격 제도 도입 (Implement a Pass/Fail System)

Abhinav Suri, M.P.H. Clarence H. Braddock III, M.D., M.P.H.

 

의과대학 임상 전 학년(preclinical years)의 등급제 성적(Tiered grades)은 합격/불합격 성적 평가 제도(pass/fail grading system)로 대체되어야 합니다(replaced). 등급제 평가(Tiered grading)는 이점(benefit)에 대한 증거(evidence)는 거의 보여주지 않는 반면 해로움(harm)에 대한 증거는 많이 보여줍니다. 합격/불합격 성적 평가 제도(pass/fail grading system)는 개인의 웰빙(personal well-being)을 향상시키는 동시에(while improving), 긍정적인 학업 성취(academic progress)와 레지던트 선발(residency selection)에 대한 경쟁력(competitiveness)을 유지합니다(sustains).

 

합격/불합격 제도(pass/fail system)로 전환하는(converting) 것이 임상 실습(clinical rotations) 및 레지던트 과정(residency)에 대한 준비도(readiness)를 측정하는 데(measure) 널리 사용되는 미국 의사 면허 시험(U.S. Medical Licensing Examinations, USMLE)에서의 학생 성적(performance)을 악화시킬 것(worsen)이라는 우려(concern)가 있습니다. 그러나 합격/불합격 성적 평가 제도(pass/fail grading system)는 USMLE Step 1(임상 실습 전 교육과정(preclerkship curriculum) 완료 시 치르는 시험)에서의 낮은 성적(lower performance)과 상관관계가 없습니다(correlate). 학생들의 의과대학 입학 시험(Medical College Admission Test, MCAT) 점수를 통제한(controlled for) 미국 96개 의과대학에 대한 분석(analysis)에서, 합격/불합격 임상 전 평가(pass/fail preclinical grading)를 사용하는 학교들의 Step 1 시험 합격률(pass rate)은 등급제 평가(tiered grading)를 사용하는 학교들의 합격률에 비해 열등하지 않았습니다(noninferior).1 한 미국 의과대학의 Step 1 점수에 대한 평가(assessment)에서는 3단계 등급제(three-tiered system)에서 합격/불합격 제도(pass/fail system)로 변경한 후 점수 감소(decrease in scores)가 나타나지 않았습니다.2

 

USMLE Step 1 시험은 학생들이 임상 수련(clinical training)에 들어가기 전 지식 역량(knowledge competency)을 보장하는 것을 목표로 하는(aims to ensure), 표준화되고(standardized) 심리측정학적으로 타당한(psychometrically sound) 평가 체계로서 중요한 역할(important role)을 수행합니다(serve). 이 국가적인 시스템(national system)은 임상 수련 단계(clinical phase of training)에서의 성공에 대한 예측 변수(predictor of success)로서 개별 학교의 임상 전 과정 평가(preclinical course assessments)보다 더 광범위한 타당성(validity)과 신뢰성(reliability)을 제공할 수 있습니다(offer).

 

등급제 평가 시스템(tiered grading system)의 지지자들(Proponents)은 이 시스템이 레지던트 프로그램 책임자들(residency program directors)이 지원자들(candidates)을 평가하는(assess) 데 도움이 된다고 주장할 수 있습니다(argue). 하지만, 증거(evidence)에 따르면 레지던트 프로그램들은 선발(selections)을 할 때 임상 전 학업 성적(preclinical academic performance)에 큰 비중을 두지 않는(do not heavily weigh) 것으로 나타났습니다. 1000개 이상의 레지던트 프로그램을 대상으로 한 2024년 설문조사(survey)에 따르면, 임상 전 성적(preclinical grades)은 프로그램 책임자들이 의존하는(rely on) 가장 중요한 10가지 요소(top 10 most important factors)에도 포함되지 않았습니다. 사실(Indeed), 이 성적들은 22개 변수(variables) 중 최하위(last)를 기록했습니다.3 또 다른 연구(study)에서는 학생들이 매칭된(matched) 레지던트 프로그램의 질(quality) (전문의 자격 시험 합격률(specialty board examination pass rates)로 판단됨)이 등급제 평가 시스템(tiered grading system)과 비교했을 때 합격/불합격 제도(pass/fail system)에서 차이가 없음(no different)을 보여주었습니다.4

 

게다가(Furthermore), 등급제 평가 시스템(tiered grading systems)은 부정적인 영향(negative effects)을 미칩니다. 한 의과대학의 의대생들은 합격/불합격 평가(pass/fail grading)로 변경하기 전 임상 전 교육과정(preclinical curriculum)에서 웰빙 평가(assessment of well-being) (124점 만점의 Dupuy General Well-Being Schedule) 점수가 더 낮았습니다(lower scores).4 다른 기관(institution)에서는, 5단계 등급(five-tier scale)에서 합격/불합격 평가(pass/fail grading)로 이동함에 따라 전체적인 성적(overall performance)은 유지하면서도(sustained), 대부분의 과목별 시험(subject-specific examinations) (임상 전 및 임상 학년 모두에서)과 USMLE Step 시험 전반에 걸쳐 의학계 소수 집단 학생들(students who are underrepresented in medicine)과 그렇지 않은 학생들 간의 격차(gap)를 좁혔습니다(narrowing).5

 

이러한 설득력 있는 이유들(compelling reasons)로 인해, 우리 기관(institution)은 몇 년 전 합격/불합격 제도(pass/fail system)로 전환했습니다(switched). 우리의 경험(experience)에 따르면 이 교육과정의 유연성(flexibility)은 우리 학생들이 개인적인 관심사(individual interests)를 개발하고 다양한 전문 분야(specialties)를 탐색할(explore) 수 있게 해주었습니다(enabled). 우리 학생들은 임상 전 학년(preclinical year) 동안 연구 프로젝트(research projects) 주도, 학생 운영 클리닉(student-run clinics) 관리, 의과대학 초기에 임상 경험(clinical experiences) 참여 등을 포함한 광범위한 활동(wide range of activities)에 참여할(engage in) 수 있습니다. 이 모든 것은 필기시험(written examinations)과 임상 실습 평가(clinical rotation evaluations)로 평가되는(assessed) 학업 성취(academic performance)를 희생하지 않고도(without sacrificing) 가능합니다.

 

합격/불합격 임상 전 교육과정(pass/fail preclinical curriculum)은 평가 기반의 학업 성공 지표(assessment-based markers of academic success)에서 결손(deficits)을 초래하지 않으면서(without resulting in), 학생 웰빙(student well-being)을 강화하고(bolstering), 의학교육 만족도(satisfaction with medical education)를 개선하며(improving), 학업 격차(academic disparities)를 해소하는(bridging) 데 있어 실질적인 이점(substantial benefits)을 제공합니다. 삽화(vignette) 속의 학장(dean)에게, 우리는 합격/불합격 임상 전 교육과정(pass/fail preclinical curriculum)의 도입(implementation)을 강력히 권장합니다(highly recommend).

 

선택지 2 (Option 2) 5단계 등급제 유지 (Continue the Five-Tier Grading System)

Dawn E. DeWitt, M.D. Rhett Oellrich, B.S.

 

대부분의 미국 의과대학들은 등급제 평가(tiered grading)가 학생 스트레스(student stress)를 유발하고, 협력(collaboration)보다는 학급 내 경쟁(in-class competition)을 조장하며, 배움(learning)보다 성과(performance)를 중시하게 만든다(fosters)는 우려(concerns) 때문에 임상 실습 전 과정(preclerkship courses)에서 합격/불합격 평가(pass/fail grading)를 사용합니다. 불행히도(Unfortunately), 경쟁적인 레지던트 선발(competitive residency selection) 분위기(climate) 속에서, 의과대학의 임상 실습 전 합격/불합격 평가(preclerkship pass/fail grading)는 지원자들(applicants)과 레지던트 프로그램들(residency programs)에게 의도하지 않은 난관들(unintended challenges)을 제시하고 있습니다(presenting).

 

임상 실습 전 과정(preclerkship courses)의 등급제 성적(Tiered grades)은 학습자들(learners)에게 성과(performance)에 대한 더 빠르고(earlier), 더 구체적인 피드백(more specific feedback)을 제공할 수 있으며, 이는 공부 습관(study habits)을 안내할(guide) 수 있습니다. 게다가(Furthermore), 예비 의사들(future physicians)이 최소 기준(minimum standards)을 충족하는 것(meeting) 그 이상을 목표로 하도록(aim beyond) 돕는 지표들(metrics)은 단언컨대 유익합니다(arguably helpful). 예를 들어, USMLE Step 1이 합격/불합격 제도(pass/fail system)로 전환된(transitioned) 이후, Step 1 합격률(pass rates)은 떨어진 반면, (임상 실습(clerkships) 중에 치르는) Step 2 시험 점수는 상승했는데(risen), 이는 Step 2 시험 점수의 더 커진 인식된 중요성(greater perceived importance)과 평행을 이룹니다(paralleling).6 이러한 추세들(trends)은 수치화되거나 등급화된 결과(numerical or tiered results)와 외적 동기(extrinsic motivation)가 공부 행동(study behavior)을 유도할 수 있다(drive)는 주장을 뒷받침합니다(support) — 특히 현재의 레지던트 매칭 환경(residency match environment)에서는 더욱 그렇습니다.

 

레지던트 선발(Residency selection)은 여전히 매우 경쟁적이며(remains highly competitive), 임상 실습 전 과정(preclerkship courses)과 면허 시험(licensing examinations)에서의 합격/불합격 평가(pass/fail grading)는 스트레스를 줄이는 것이 아니라(may not decrease stress) 단지 학생 스트레스의 초점(focus)을 옮기는 것일 수 있습니다(merely shift).7 레지던트 프로그램 책임자들(residency program directors)이 이용할 수 있는(available) 유일한 표준화된 지표(standardized metric)가 Step 2 점수이기 때문에, 임상 실습 전 합격/불합격 평가(preclerkship pass/fail grading)의 부상(rise)은 교실 내에서의 조기 피드백(early feedback)과 외적 동기(extrinsic motivation)의 잠재적인 이점들(potential benefits)을 희생시켰으며(sacrificed), 이전에(previously) 초기 평가척도들(earlier measures)과 연관되었던(associated with) 스트레스를 의과대학 생활의 후반부(later)로 방향을 돌렸습니다(redirected).6 이제 학생들은 이미 엄격하고(rigid), 혹독한 일정(rigorous schedules)을 가지고 있는 임상 실습(clerkships)과 Step 2 기간 동안 고조된 스트레스(heightened stress)에 직면합니다(face). 이러한 타이밍(timing)은 학생들이 임상적 수월성(clinical excellence)에 집중하는 것을 더욱 방해할(distract) 수 있습니다.8

 

합격/불합격 평가(pass/fail grading)의 정보 공백(information vacuum) 속에서, 학생들이 레지던트 지원서(residency applications)를 최적화하기(optimize) 위해 교과 과정(coursework)보다 연구(research)나 다른 과외 활동(extracurricular activities)을 우선시하는(prioritize) "그림자 경제(shadow economy)"가 등장했습니다(emerged).9 등급제 평가 구조(tiered grading structure)는 "그림자 경제"보다 학생들을 더 공평한 경쟁의 장(more even playing field)에 놓을 수 있습니다. 대부분의 학교가 모든 학생에게 표준 학습 자료(standard study resources)를 제공하고(make available), 임상 실습 전 등급제 성적(preclerkship tiered grades)이 미래의 의사 수행 능력(physician performance)에 대한 예측 타당도(predictive validity)를 가지기 때문에,10 높은 성적(high grades)을 성취할 기회(opportunity)는 비전형적인 학생들(nontraditional students) (예: 의학계 소수 집단 출신 학생들, 비 STEM [과학, 기술, 공학, 수학] 배경을 가진 학생들, 군대 배경이 있는 학생들, 또는 만학도들(mature students))이 스스로를 돋보이게 하는 데(distinguish themselves) 도움이 될 수 있습니다. 게다가(In addition), 이는 인맥(connections)과 재정적 자원(financial resources)이 명망 있는 과외 활동 기회(prestigious extracurricular opportunities)의 가용성(availability)을 용이하게 할(facilitate) 수도 있는 "그림자 경제"에서 나타날 수 있는 불평등(inequities)과 싸울(combat) 수 있습니다.

 

임상 실습 전 등급제 성적(Preclerkship tiered grades)은 또한 더 빠르고(earlier) 더 목표 지향적인(more targeted) 레지던트 계획(residency planning)을 용이하게 할(facilitate) 수 있습니다. 특정 레지던트 지원(specific residency applications)에 대한 예상 경쟁력(likely competitiveness)을 나타내는 데(indicate) 도움이 되는 지표들(metrics)이 없다면, 학생들은 의도치 않게(inadvertently) 특정 전문 분야(particular specialty)에 상당한 시간과 노력(substantial time and effort)을 투자하고도, 나중에야 자신들이 이용 가능한 자리(available slots)를 두고 경쟁하기에(compete) 좋은 위치가 아님(not well positioned)을 발견하게 될(discover) 수 있습니다. 일부 학생들은 경쟁력을 높이기(increase their competitiveness) 위한 활동에 참여하기(engage in) 위해 1년짜리 휴학(yearlong leaves of absence)을 해야 한다는 압박감(pressured)을 느낄 수 있으며, 이는 의학 수련(medical training)을 연장하고(prolonging) 부채(debt)를 증가시킵니다. 더욱이, 휴학(leaves of absence)은 수련을 지연시키고(delay) 중단시킬(disrupt) 수 있습니다.

 

임상 실습 전 등급제 평가(Preclerkship tiered grading)와 추가적인 지표들(additional metrics) (교과 성적(course grades) 등)은 커져가는 "그림자 경제"를 단계적으로 축소하고(de-escalate), 비용이 많이 드는 휴학(costly leaves of absence)을 줄이며(decrease), 전반적인(overall) 학생 스트레스를 증가시키지 않으면서(without increasing) 기술 개발(skill development)과 진로 계획(career planning)을 위한 더 빠르고 구체적인 피드백(earlier and more specific feedback)을 제공할 수 있습니다. 등급제 평가(tiered grading)를 통한 조기 피드백(Early feedback)은 궁극적으로 학생들을 핵심 지식(core knowledge)과 임상 기술(clinical skills)의 수월성(excellence)에 다시 집중하게 하면서(refocusing) 학생들의 이익(interests)에 더 잘 부합합니다(better serves).

 

 

 

Med Teach. 2025 Dec 30:1-12. doi: 10.1080/0142159X.2025.2607513. Online ahead of print.

When and how to disclose AI use in academic publishing: AMEE Guide No.192

 

 

논문 쓸 때 ChatGPT 썼다면? 이렇게 밝히세요! (AMEE 가이드 192호 핵심 요약)

안녕하세요! 연구자 여러분, 그리고 논문을 쓰고 계신 대학원생 여러분. 👋 요즘 연구실이나 학회 가면 온통 인공지능(AI) 이야기뿐이죠? 특히 챗GPT(ChatGPT) 같은 생성형 AI(GenAI)가 등장하면서 "이거 논문에 써도 되나?", "쓴다면 어디까지 밝혀야 하지?" 고민하는 분들 많으실 거예요.

최근 의학 교육 분야의 권위 있는 AMEE(Association for Medical Education in Europe)에서 아주 시의적절한 가이드(Guide No.192)를 내놓았습니다. 제목부터 "학술 출판에서 AI 사용을 언제, 어떻게 공개할 것인가"인데요.

저자들이 제안하는 핵심 내용을 쉽고 명확하게 정리해 드릴게요. 📝


1. AI는 '저자'가 아니라 '도구'입니다. 책임은 인간에게! 🧑‍💻

가장 먼저 짚고 넘어가야 할 대원칙입니다. AI가 아무리 똑똑하게 글을 써줘도, AI는 저자(Author)가 될 수 없어요. 저자됨(Authorship)은 책임질 수 있는 인간만의 영역이거든요.

연구진은 이 점을 아주 분명하게 강조합니다.

"인간 저자들은 원고가 AI의 도움을 받아 작성되었든 그렇지 않든 상관없이, 모든 저널 제출물의 정확성, 독창성, 그리고 진실성/무결성에 대해 완전히 책임져야 한다." 

"Human authors remain fully responsible for the accuracy, originality, and integrity of all journal submissions regardless of whether GenAI was used."

 

즉, AI가 내놓은 결과물이 '환각(Hallucination)'을 일으켜 엉터리 참고문헌을 만들거나 편향된 내용을 써도, 그 검증 책임(Verification and responsibility)은 오롯이 저자인 여러분에게 있다는 뜻입니다. AI 결과물은 '완성된 학문'이 아니라 '검증되지 않은 메모'로 취급해야 해요!


2. 언제 공개해야 할까요? (단순 교정 vs 실질적 기여) 🤔

"그럼 문법 검사만 한 것도 다 써야 하나요?"라고 물으신다면, 대답은 NO입니다. 단순한 문법 교정이나 철자 확인 같은 일상적인 지원(Routine assistance)은 굳이 밝힐 필요가 없습니다. 하지만, AI가 연구나 원고의 내용을 실질적으로 형성(Materially shapes)했다면 반드시 공개해야 합니다. 예를 들어 아이디어를 생성하거나, 텍스트를 초안 작성하거나, 데이터를 분석했을 때가 그렇죠.

 

연구진은 애매할 때를 대비해 이런 팁을 줍니다.

"저널 정책은 다양하고 진화하고 있으므로, '의심스러울 때는 공개하라'는 접근 방식이 권장된다." 

"Because journal policies vary and are evolving, a ‘disclose-when-in-doubt’ approach is recommended."


3. 어떻게 공개해야 할까요? (고백하지 말고, 보고하세요!) 📢

많은 분들이 AI 사용을 밝히는 걸 마치 '부정행위 자백'처럼 부끄러워하거나 방어적으로 씁니다. ("죄송하지만 썼습니다..." 😭) 하지만 연구진은 AI 사용 공개를 고백(Confession)이 아니라 방법론적 보고(Methodological reporting)로 여기라고 조언해요. 우리가 SPSS나 엑셀을 썼다고 사과하지 않는 것처럼요! 

"공개를 고백이 아닌, 일상적인 방법론적 보고로 취급하라." 

"Treat disclosure as routine methodological reporting, not confession."

 

💡 좋은 공개의 예시 (AIHPERD 프레임워크) 이 논문에서는 구체적으로 아래 내용을 포함하라고 제안합니다.

  1. 도구 명시: ChatGPT 4.0인지, Claude 3인지 정확한 이름과 버전.
  2. 구체적 활동: "글쓰기 보조"처럼 뭉뚱그리지 말고, "초록 요약", "Python 코드 생성", "문헌 검색" 등 구체적으로!
  3. 검증 방법: AI가 쓴 내용을 내가 어떻게 확인했는지(예: 원문 대조 확인).
  4. 책임 명시: 최종 책임은 나에게 있음을 한 번 더 언급.

4. 공동 연구자에게도 솔직해지세요 🤝

마지막으로 중요한 점! 저널에 내기 전, 공동 연구자(Collaborators)들과 먼저 상의해야 합니다. 나중에 "어? 이거 AI가 쓴 거였어?" 하고 동료가 당황하면 곤란하잖아요.

"연구 팀은 연구 절차 및 원고 개발 중에 GenAI가 어떻게, 언제, 그리고 어느 정도까지 사용될 것인지에 대해 초기에 명시적인 논의를 가져야 한다."

"Research teams should have early, explicit discussions about how, when, and to what extent GenAI will be used during research procedures and manuscript development..."

 


1. Introduction (서론)

어디를 가든 (Everywhere you go), 참석하는 모든 컨퍼런스마다 (every conference you attend), 그리고 읽는 모든 저널마다 (every journal you read), 점점 더 디지털화되는 직장 환경 (increasingly digitalised workplaces)에서 일할 수 있도록 학습자들을 준비시키는 것 (preparing learners)을 목표로 (with the aim of), 교육과 훈련을 최적화하기 위해 (to optimize education and training) 인공지능(AI)을 어떻게 사용할지에 대한 콘텐츠를 포함하고 있다. 이와 병행하여 (In parallel), 생성형 인공지능(Generative Artificial Intelligence, GenAI)의 출현 (emergence)이 연구 (research), 학술적 글쓰기 (academic writing), 그리고 출판 관행 (publishing practices)을 어떻게 재편하고 있는지 (reshaping)에 대한 논의가 학계 전반에 걸쳐 진행 중이다 (discussions are underway across all academia) (예: [1–3], 및 Box 1 참조).

Box 1. Defining GenAI (GenAI의 정의)

생성형 인공지능(Generative Artificial Intelligence, GenAI)은 대규모 언어 모델(large language model, LLM)을 사용하는 ChatGPT와 같은 전형적인 예시들 (exemplars) 덕분에 상당한 주목을 받게 된(gained considerable prominence) 인공지능(AI)의 하위 범주 (sub-category)이다.
GenAI는 복잡하고 다양한 언어적 입력 (linguistic inputs), 지시 (instructions), 또는 질문 (inquiries)에 반응하여 (in response to) 이미지나 단어와 같은 인간과 유사한 콘텐츠(human-like content)를 생성하기 위해 (to generate) 훈련 데이터로부터의 딥 러닝 (deep learning from training data)과 ‘트랜스포머’ 기술 (‘transformer’ technology)을 활용하여 작동한다 (operates by leveraging) [4], [5,6].
요약하자면 (In short), GenAI는 인간 사용자의 프롬프트 (prompt)나 지시 (instruction)를 따르며 창의적인 텍스트, 이미지, 또는 기타 콘텐츠를 자동으로 생성할 수 있는(able to automatically produce) 모든 도구(예: ChatGPT, Perplexity AI)의 사용을 지칭한다 (refers to)
.

 

의학 교육 (medical education)에서의 AI 사용이 몇 년간 논의되어 왔지만 (had been discussed for some years) [7], 대규모 언어 모델(LLM)을 사용한 ChatGPT 3.5의 대중 공개(public release)는 2022년에 모든 것을 바꾸어 놓았다(changed everything). 이는 주로 AI의 위력 (power of AI)이 비전문가들(non-technical people)에게 훨씬 더 접근하기 쉬워졌기 (became far more accessible) 때문이다.

 

  • 불과 5개월 후 (Just five months later), 유네스코(UNESCO, 2023)는 ‘고등교육에서의 ChatGPT와 인공지능(ChatGPT and Artificial Intelligence in Higher Education)’이라는 제목의 퀵 스타트 가이드(Quick Start Guide)를 발간했다 [8]. 이 가이드는 연구 설계 (design research), 데이터 수집 (collect data), 데이터 분석 (analyse data), 그리고 연구 논문 작성 (write up research)에 있어 ChatGPT의 가능한 용도 (possible uses)를 기술했다.
  • 더 최근에는 (More recently), 학술적 글쓰기와 연구의 맥락 (context of academic writing and research)에서, 5,000명 이상의 저자들을 대상으로 한 글로벌 설문조사 (global survey) 결과, 90%가 연구 논문을 교정(edit)하는 데 AI를 사용하는 것이 적절하다고 보고했으며, 65%는 초안 작성(drafting) 시 AI 사용을 지지한 것으로 나타났다 [9]. 이러한 결과들 (These findings)은 AI가 이미 글쓰기 과정 (writing process)에서 흔하지만, 종종 침묵하는 협력자 (common, if often silent, collaborator)로서 많은 저자들 곁에 자리 잡고 있음을 시사한다 (suggest) [10].

 

GenAI는 연구에 있어 혁신적인 잠재력(transformative potential)과 중대한 도전 과제들(significant challenges)을 동시에 제공한다 [11].

 

  • GenAI 도구들은 연구 및 글쓰기 과정의 핵심 요소들 (core elements)을 효율화(streamline)하여, 생산성(productivity)과 학술적 성과(academic output)를 증대시킬 수 있다 (enabling increased) [12].
  • 그러나 (However), GenAI가 연구와 학술적 글쓰기에 유익할 수 있는 반면 (can be beneficial), 특히 저자들이 비판적이지 않고 (uncritically) 비윤리적으로 (unethically) 접근할 경우 오용될 수도 있다(can also be misused). 연구자들의 GenAI 사용은 원고에서 종종 보고되지 않은 채 넘어간다(often goes unreported).
  • 이는 불완전한 방법론 공개 (incomplete methodology disclosure)의도치 않은 기만 (inadvertent deception)과 같은 의심스러운 관행(questionable practices)을 통해 연구 진실성(research integrity)을 훼손할 가능성이 있으며 [13], 따라서 저자됨 (authorship), 투명성 (transparency), 그리고 윤리적 연구 관행 (ethical research practices)에 대한 중요한 의문들(critical questions)을 제기한다 [14,15].

 

2. Who are we? (우리는 누구인가?) 

저자로서 (As authors), 우리는 다양하고 교차하는 입장들(intersecting positions)에서 이 가이드에 접근한다.

 

  • 우리 모두는 보건 전문직 교육 연구(health professions education research, HPER) 분야의 지식 생산자들(knowledge producers)이다. 따라서 우리는 GenAI의 이점 (benefits)과 한계 (limitations)를 어떻게 탐색할지 (navigate), 그리고 우리 자신의 연구에서 이를 어떻게 투명하고 책임감 있게(transparently and responsibly) 사용할지에 대한 지침을 구한다 (seek guidance).
  • 우리는 또한 AI 사용자들(AI users) 이다. 따라서 우리는 윤리적이고 적절한 AI 사용을 위한 공유된 기준(shared standards)을 우리 분야에서 공동 구축(co-construction)하는 데 기여하고 있음을 인식하고 있다 (appreciate) [16].
  • 우리는 지식 사용자들(knowledge users)이다. 따라서 우리는 다른 이들의 출판된 연구물 (published work)을 참고하며 (draw on), 그것이 AI가 조작한 데이터(AI-fabricated data)나 AI가 지어낸 생각(AI-concocted thinking)의 결과물이 아니라는 확신 (confidence)을 필요로 한다.
  • 마지막으로, 여러 주요 HPER 저널의 편집자로서, 우리는 지식 큐레이터들(knowledge curators)이다. 따라서 우리는 우리 커뮤니티가 연구에서의 GenAI 사용 및 공개 (disclosure)에 대한 모범 사례(best practices)를 명확히 하도록 (articulate) 도울 책임 (responsibility)을 느낀다.

 

이 가이드의 저자 5명 중 4명은 원어민(native English speakers)이며, 우리 모두는 영문학 및 언어 (English language and literature) 측면에서 정규 교육 (formal training)을 받았고, 이는 우리의 연구 및 글쓰기 접근 방식에 정보/영향을 준다 (inform). 이 원고를 계획 (planning)하고 초안을 작성할 때 (drafting), 우리는 우리 중 다수가 학술적 글쓰기 과정 (process of academic writing)과 우리만의 고유한 표현 (unique expression)을 만들어내는 기회를 즐긴다는 것을 발견했다. 이러한 즐거움은 적어도 부분적으로는 (at least in part), 과학 및 교육 문헌의 지배적인 언어(predominant language)인 영어로 글을 쓰는 것에 대한 우리의 편안함(comfort)에서 기인할 수 있다 [17]. 동시에 (At the same time), 우리는 연구 관심사 (research interests)와 초점 (foci)이 다르며, 따라서 인식론적 관점(epistemological perspectives)에서도 차이가 있다. 이러한 차이는 지식 발전 (knowledge development)에 대한 우리의 입장과 GenAI 도구의 기저에 있는 원칙 (principles underlying GenAI tools)에까지 확장된다.

 

우리는 GenAI를 각기 다르게 사용하는데 (use GenAI differently), 예를 들어

 

  • 발표 계획하기 (plan presentations), 글과 영어 다듬기 (polish writing and English), 반대 주장 브레인스토밍하기 (brainstorm counterarguments), 또는 떠오르는 아이디어 테스트하기 (test emerging ideas) 등에 사용한다.

 

우리는 AI가 기술적 자원 (technical resource)일 뿐만 아니라 영어가 모국어가 아닌 (English is not their first language) 연구자들에게 ‘더 공정한 입지(fairer footing)’를 확보하는 수단 (means)이라고 믿으며, 따라서 우리 분야의 지식 기반을 다양화(diversify our field’s knowledge base)할 잠재력이 있다고 본다 [18,19], [20].

 

마지막으로, 우리는 이 AMEE 가이드(AMEE Guide)에서 제공하는 지침이 HPER 커뮤니티가 GenAI를 채택할 준비가 되었음(readiness)을 보여주는 데 중요한 역할(crucial role)을 할 수 있음을 인식하고 있다 (aware). 이는 우리가 주요 커뮤니티 구성원들의 역할과 책임 (roles and responsibilities)에 대한 논의를 시작할 것이기 때문이다 [21].

 

이 AMEE 가이드의 목표 (aim)는 연구자들에게 글쓰기에서 AI 사용을 언제, 그리고 어떻게 공개(disclose)할지에 대한 실용적인 지침(practical guidance)을 제공하는 것이다.

 

  • 구체적으로 (Specifically), 우리는 HPER 분야에서 AI의 윤리적 사용(ethical use)과 보고 관행(reporting practices)을 증진하기 위한 명확한 프레임워크(clear framework)를 제안한다.
  • 우리는 출판에서의 책임감 있는 AI 사용(responsible AI use)의 핵심 측면들에 대한 간략한 탐구 (brief exploration)로 시작하여, AI 도구 사용을 언제, 그리고 어떻게 공개할지 개괄하는 (outline) 두 개의 섹션으로 이어진다.
  • 이 가이드를 작성하는 시점(2025년 11월)에, 출판을 위한 AI 사용 및 공개와 관련하여 여전히 많은 의문이 남아 있다(many questions remain)는 점을 감안하여 (Given that), 우리는 미래의 발전 (future developments)과 연구 방향 (directions for research)에 대한 고찰 (reflections)로 결론을 맺는다.

3. What is responsible use of AI in publishing? (출판에서 AI의 책임감 있는 사용이란 무엇인가?) 

우리는 학자들의 AI 사용에 찬성하거나 반대하는 것(arguing for or against)이 아니며, AI의 적절한 사용법(appropriate usage)에 대해 논쟁하려는 것도 아니다 [22]. 대신, 우리는 GenAI 사용이 초안 작성(drafting), 교정(editing), 그리고 아이디어 생성(idea generation) 속도를 높일 수는 있지만, 학문적 책무성(scholarly accountability)근본(fundamentals)을 바꾸지는 않는다고 제안한다. 인간 저자들은 원고가 AI의 도움을 받아 작성되었든 그렇지 않든 상관없이, 모든 저널 제출물의 정확성(accuracy), 독창성(originality), 그리고 진실성/무결성(integrity)에 대해 완전히 책임져야 한다(remain fully responsible). Eva가 주장하듯이, 출판에서 AI의 책임감 있는 사용에 대한 논의는 인간의 감독(human oversight)에 대한 필요성으로 ‘귀결된다(boils down)’ [23]. 이는 저자됨(authorship), 자료의 검증(verification of materials), 그리고 저널을 선택하고 투고하는 과정에 참여하는 방식에 시사점을 준다. 이러한 복잡성들(complexities)이 AI 사용에 대한 우리의 권고 사항(recommendations)에 정보를 제공한다.

3.1. Authorship (저자됨) 

출판사들이 이 주제에 대한 정책을 수립하기 전에는, 학술 논문에서 AI 시스템을 저자로 인정할지에 대한 문제가 뜨겁게 논쟁 되었다(hotly debated) [24,25]. 그러나 이 논쟁은 기술적 능력(technical ability)에 관한 것이 아니라, 학술 저자의 전문적, 사회적, 그리고 철학적 지위와 위치(professional, social, and philosophical status and position)에 관한 것이다. 결과적으로, AI 시스템은 책임을 질 수 없고(cannot accept responsibility), 원고를 승인하거나(approve a manuscript), 이해 상충(conflicts of interest)을 관리할 수 없기 때문에, 이 가이드를 작성하는 시점에 출판윤리위원회(COPE)와 국제의학학술지편집인위원회(ICMJE)의 국제적 지침은 AI가 저자로 등재되어서는 안 된다(AI shall not be listed as an author)는 점을 명확히 하고 있다 [26,27]. 비록 이에 대한 반론이 제기되기도 했지만(예: 20, 28, 29), 보건 전문직 교육 분야를 포함한 많은 저널이 현재 저자 지침(author instructions)에 이러한 기준을 반영하고 있다. 예를 들어, 이 저널의 출판사인 Taylor and Francis는 다음과 같이 언급한다: ‘생성형 AI 도구는 저자로 등재되어서는 안 된다’ [30].

3.2. Verification and responsibility (검증과 책임) 

저자들은 모든 AI 보조 콘텐츠(AI-assisted content)를 독립적으로 검증하고(independently verify) 이에 대한 책임을 져야 한다(take responsibility). 예를 들어, MedEdPORTAL에 출판하고자 하는 저자들은 다음과 같은 지침을 받는다:

  • ‘저자는 제출된 모든 콘텐츠를 포함하여 자신의 작업물의 품질(quality), 진실성(integrity), 독창성(originality)에 대해 완전히 책임을 져야 한다(remain fully accountable)’ [31].

본질적으로(In essence), AI가 사용되었다면, 저자들은 그 결과물을 완성된 학문적 성과(finished scholarship)가 아니라 검증되지 않은 메모(unverified notes)로 취급해야 한다.

  • 따라서 저자들은 사실(facts), 인용(quotations), 참고문헌(references)을 1차 자료(primary sources)와 대조하여 확인해야 한다. 연구들이 LLM(예: ChatGPT, Gemini)이 인용을 생성할 때 신뢰할 수 없을 수 있음(can be unreliable)을 반복적으로 보여주고 있기 때문에 [22,32], 저자들은 조작되거나(fabricated) ‘환각을 일으킨(hallucinated - 거짓으로 지어낸)’ 참고문헌에 대해 각별히 주의해야 한다(especially vigilant).
  • 또한 저자들은 정확성을 검증하기 위해 AI가 수행한 모든 통계 분석(statistical analyses), 코드(code), 또는 계산(calculations)을 다시 실행해 보아야 한다(rerun) [33,34].
  • 마지막으로, 저자들은 숨겨진 저작권 위험(hidden copyright risks)을 모니터링하고 완화하기 위해 AI가 생성한 이미지, 도표, 또는 텍스트에 대한 권리와 허가(rights and permissions)를 검증해야 한다. 이는 부분적으로 국가마다 저작권법이 다르기 때문에 간단하지 않다.
    • 그러나 저자는 구글 이미지 역검색(reverse Google search)을 통해 이미지/도표가 이전에 출판된 적이 있는지 확인할 수 있다.
    • 텍스트의 경우, 표절 탐지 도구(plagiarism detection tools)를 사용하여 기존 출판물과의 유사성을 확인할 수 있다.
    • 또한 저자들은 메타데이터 태깅 옵션(metadata tagging options)을 사용하여 이미지/도표가 언제 생성되었는지, 어떤 도구가 사용되었는지, 그리고 해당 이미지/도표가 AI로 생성되었으며 타인의 저작권을 침해할 의도가 없었음을 증명하는 데 도움이 될 기타 관련 정보를 기록(document)할 수 있다.

3.2.1. Practice point (실무 포인트) 

이 AMEE 가이드를 작성하는 시점에, AI 도구는 저자로 등재될 수 없으며(cannot be listed as authors) 학술 논문의 콘텐츠에 대해 책임을 질 수 없다. 인간 저자들은 GenAI 사용 여부와 관계없이 모든 저널 제출물의 정확성, 독창성, 진실성에 대해 완전히 책임져야 한다(remain fully responsible).

 

3.3. Plagiarism and bias (표절과 편향) 

원고는 자기 표절(self-plagiarism)과 의도치 않은 텍스트 재사용(inadvertent text reuse)을 포함하여, 표절(일명: ‘Aigiarism’ [35])을 탐지하기 위해 스크리닝 되어야 한다. 이는 AI가 학문적 출처 표시 규범(academic attribution norms)을 따르지 않기 때문이다 [36]. 게다가, AI 모델은 과거 데이터(historic data)로부터 학습하기 때문에, 저자들은 AI가 생성한 텍스트에 잠재적 편향(potential bias)이 있는지, 또는 불평등(inequalities)을 영속화하거나 소외 계층(marginalized groups)에게 해를 끼칠 수 있는 예시가 의도치 않게 포함되어 있는지 면밀히 조사해야 한다(scrutinize) [37].

  • 예를 들어, 한 연구자 그룹이 AI 텍스트-이미지 생성기인 DALL-E3에게 호주 의대생의 이미지를 생성하도록 지시했을 때, 그들은 생성된 이미지의 92%가 밝은 피부색을 가진 개인(individuals with light skin)이고 58.8%가 남성(male)이라는 것을 발견했다. 이는 호주 의대생 모집단(population)을 잘못 나타내는 것이며 성별 및 인종 편향(gender and race bias)을 영속화한다 [38].

3.3.1. Practice point (실무 포인트) 

저자는 모든 AI 보조 또는 AI 생성 콘텐츠의 정확성(accuracy)을 검증해야 하며, 편향(bias), 표절(plagiarism), 또는 저작권 침해(copyright infringements)가 없음을 보장해야 한다.

3.4. Data privacy and confidentiality (데이터 프라이버시와 기밀성) 

AI가 생성하는 텍스트는 기관, 환자, 또는 연구 참여자에 대한 민감하고, 개인적이며, 기밀인 정보(sensitive, personal, or confidential information)를 포함할 수 있다. 마찬가지로, 저자들은 GenAI에 업로드하는 모든 데이터의 프라이버시와 기밀성을 고려해야 하는데, 이는 일부 도구들이 향후 훈련(future training)을 위해 이 데이터를 저장하거나 사용할 수 있기 때문이다.

  • 연구 데이터(예: 인터뷰 녹취록, 설문 응답), 특히 식별 가능한(identifiable) 임상 또는 기관 정보를 입력하기 전에, 저자들은 그러한 사용이 소속 기관의 정책(institution’s policies) 하에 허용되는지 확인해야 한다.
  • 인간 대상 데이터(human subject data)를 다룰 때, 이는 기관 윤리 위원회(institutional ethics committee)에 확인하여 AI 도구에 데이터를 업로드하는 것이 승인된 프로토콜(approved protocols)과 일치하는지, 그리고 기밀 유지 계약(confidentiality agreements), 데이터 사용 제한(data-use restrictions), 또는 참여자의 동의(participants’ consent)를 위반하지 않는지 확인하는 것을 포함한다.

3.5. Journal requirements (저널 요구사항) 

저널 요구사항을 논의하기 전에, AI 사용의 차이점을 고려하는 것이 유용하다. 꽤 일반적인 구분은 AI 보조 콘텐츠(AI-assisted content)AI 생성 콘텐츠(AI-generated content) 간의 구분이다 [39,40]. 추가 설명은 Box 2를 참조하라.

어떤 종류의 AI 사용이 허용되는지에 대해 저널들의 입장은 다양하다(vary).

  • 일부 저널은 언어 다듬기(language polishing)(즉, AI 보조 콘텐츠)를 위한 AI 사용은 허용하지만 독창적인 텍스트 생성(generating original text)(즉, AI 생성 콘텐츠)은 금지한다.
  • 어떤 곳은 방법(Methods) 섹션에 공개할 것을 요구하고, 다른 곳은 감사의 글(Acknowledgments)에 요구하며, 소수(점점 줄어들고 있지만)는 AI 사용을 전면 금지한다.

그러므로 원고 초안을 작성하기 전에, 저자들은 대상 저널의 저자 지침(author instructions)과 관련 출판사 가이드라인을 참조해야 한다. (저널 요구사항에 대한 자세한 내용은 Section 5: 언제 공개가 요구되는가?를 참조). 저널과 출판사의 AI 사용 정책은 예고 없이(without warning) 자주 변경되므로, 가장 최신의 가이드라인을 확인하는 것이 중요하다는 점을 유의하라.

Box 2. What counts as AI use in publishing? (출판에서 무엇이 AI 사용으로 간주되는가?) 


AI 보조 콘텐츠(AI-assisted content)는 개인이 처음 작성했으나 AI 도구의 도움으로 개선된 작업물을 지칭한다. 예를 들어, 저자는 초안의 철자나 문법을 확인하거나 명료성(clarity)을 높이기 위해 AI를 사용할 수 있다. 이 시나리오에서 저자는 통제권(control)을 확고히 쥐고 있으며, AI는 최종 결과물을 다듬는(polish) 유용한 도구로서 기능한다. 이는 때로 AI 보조 원고 교정(AI-assisted copy editing)이라고 불린다 [41].

AI 생성 콘텐츠(AI-generated content)는 저자가 제공한 프롬프트(prompt)에 반응하여 AI가 처음 생성한 텍스트이다. 텍스트의 상당 부분(significant portions)이나 전체 섹션이 될 수도 있는 이 콘텐츠는, 저자에 의해 최소한의 편집(minimal editing)이나 수정만 거칠 수도 있고, 혹은 상당히 수정될 수도 있지만, 초기 초안(initial draft)은 AI에 의해 생성된 것이다. 유사성(resemblance)이 클수록, 그리고 AI가 기여한 아이디어가 실질적일수록(more substantive), 그 기여를 명확히 공로로 인정/명시(credit)하는 것이 더욱 중요하다 [29].

물론, 실제로는(in practice), AI 보조 콘텐츠와 AI 생성 콘텐츠 사이의 경계가 모호하다(blurred). 예를 들어, 저자가 AI(예: ChatGPT)에게 콘텐츠 생성을 요청하고, 이후 시간이 지나며 생성된 콘텐츠와 거의 알아볼 수 없을 정도로(almost unrecognisable) 상당히 수정할 수 있다. 이 경우, 비록 AI가 초기 콘텐츠를 생성했더라도 최종 결과물에 AI 텍스트의 ‘연속성(continuity)’은 거의 없다 [29]. 그리고 변경 내용 추적(tracked changes) 기능을 활용하며 작업하는 것은 초기 텍스트와 최종 텍스트 간의 차이를 기록하고 평가하는 유용한 방법이다. 또는 저자가 자신의(저자가 생성한) 자료 일부를 ChatGPT에 업로드한 다음, 다시 자신의 작업에 기반한 일련의 매우 구체적이고 점진적인 프롬프트(specific and incremental prompts)를 사용하여 AI가 자신의 아이디어를 특정 텍스트 형태로 작성하도록 돕게 하거나, 논문의 위치 설정(positioning a paper)에 대한 제안을 얻는 상황을 고려해 보자. 이것은 AI 생성 콘텐츠인가, AI 보조인가? 비록 우리가 이 가이드의 마지막에 있는 프레임워크(Framework)에서 어느 정도 명확성을 제공하고는 있지만, 우리에게도 간단한 답은 없다. 이것과 AI 사용과 관련된 다른 윤리적 딜레마 및 도전 과제들에 대한 논의는 시간이 지남에 따라 진화할 것이다(evolve over time).

위의 요점을 반복하자면(Reiterating), 우리의 조언은 글쓰기 과정을 시작하기 전에(in advance of) 대상 저널을 선택하고, 해당 저널의 AI 사용 가이드라인을 확인하며, 이 지침 내에서 작업하고 있음을 확실히 하고, 적절하게 공개하라는 것이다.

4. Why disclose AI use? (왜 AI 사용을 공개해야 하는가?) 

연구 생산(research production)에서 GenAI 사용을 공개하는 것이 왜 중요한가? 근본적으로(Fundamentally), 이는 투명성(transparency), 진실성(integrity), 그리고 책무성(accountability)으로 귀결된다. 이는 AI 도구가 사용되었는지 여부에 초점을 맞추기보다는, AI 도구가 얼마나 많은 도움(how much assistance)을 제공했는지, 즉 Jenkins와 Lin [29]이 말하는 최종 결과물 내 AI 텍스트의 ‘연속성(continuity)’에 초점을 맞춰야 함을 시사한다.

  • 공개(disclosure)가 학술 콘텐츠 생산에 있어 GenAI 도구의 역할(그리고 반대로 인간의 투입)을 포착할 때, 이는 다른 연구자들이 원고와 그 구체적인 주장들(specific claims)을 비판적으로 평가(critically evaluate)할 수 있게 돕고 [42], 편집자들이 제출된 원고가 편집 정책(editorial policies)을 충족하는지 판단할 수 있게 한다 [43].
  • 반면에(On the other hand), 우리가 이런 방식으로 공개하지 못할 경우, 앞서 논의한 바와 같이 표절, 사실적 오류(예: 부적절한 출처 표시, 참고문헌의 환각), 편향, 그리고 출판 윤리와의 불일치(misalignment) 위험을 감수하게 된다.

5. When must you disclose to journals? (저널에 언제 공개해야 하는가?) 

외부 공개(External disclosure, 즉 저널과 독자에게 공개하는 것)는 현재 AI 사용 보고(AI-use reporting)에 있어 가장 가시적이고 규제되는 요소(most visible and regulated element)이다. 원고에서, 공개는 AI 도구가 연구나 원고를 실질적으로 형성할 때(materially shapes)마다 요구된다(warranted). 저자들은 ‘실질적으로 형성한다’는 기준(threshold)을 단지 기술적인 것(not merely technical)이 아니라 또한 인식론적인 것(epistemic)으로 접근해야 한다. 이는 AI가 지식의 창조, 검증, 그리고 변형(creation, validation and transformation of knowledge)에 있어 능동적인 역할(active role)을 한다는 것을 의미한다. 즉, 새로운 사실이 어떻게 발견되는지, 새로운 연구가 어떻게 수행되는지, 그리고 모든 종류의 정보가 검색 엔진(search engines)을 통해, 소셜 미디어 환경(social media environments)에서, 전자 기기(electronic devices)의 사용을 통해 등등 사회 전반에 어떻게 퍼지는지에 관한 것이다. 다시 말해(In other words), AI는 비인간(non-human)임에도 불구하고, 비록 기술 그 자체가 인간과 같은 주체성(human-like agency)을 가지고 있지 않더라도 우리 믿음과 그 내용의 창시자(originator)로서 기능할 수 있다 [44,45].

 

이를 감안할 때(Given this), 독자들은 타당성(validity)과 책무성(accountability)을 평가할 수 있도록, GenAI가 언제 그리고 어떻게 연구자의 사고(thinking)에 영향을 미쳤으며, 이것이 결과적으로 그들의 질문, 방법, 주장, 또는 발표에 영향을 주었는지 알 필요가 있다. 여기에는 다음이 포함된다:

  • 산문 작성 또는 다시 쓰기(drafting or rewriting prose),
  • 문헌 요약(summarizing literature),
  • 논증 구조화(structuring arguments) [46],
  • 통계 지원(assisting with statistics) [33,34] 또는
  • 이미지 분석, 도표 생성 또는 변형(generating or transforming figures), 또는
  • 해석 지원(aiding interpretation) (즉, AI 생성 콘텐츠).

그러나(However), 저자와 편집자들은 종종 AI 공개에 대해 불안해한다(feel unsettled). 최근의 경험적(empirical) 및 개념적 연구(conceptual work)는 왜 이런 경우가 생기는지에 대한 통찰(insight)을 제공한다. 예를 들어, Lingard와 동료들은 [16] 편집자들과의 인터뷰를 바탕으로, 공개의 필요성(necessity)과 충분성(sufficiency)(얼마나 상세한 것이 충분한가)을 둘러싼 모호하고 변화하는 경계(blurred and shifting boundary)를 특성으로 묘사한다. 이 모호한 경계는 급격한 기술 변화(rapid technological change), 공개 기준에 대한 해당 분야의 유기적 구축(organic construction), 그리고 재현성(reproducibility)과 같은 전통적인 엄격성 원칙(rigor principles)과 LLM 행동 간의 불완전한 적합성(imperfect fit)에 의해 형성된다. 그들의 분석은 HPER 저자들을 위한 실용적인 규칙(pragmatic rule)을 지지한다: 사소한 문법 수정(trivial grammar fixes)을 넘어설 때는 언제나 공개하라. 그리고 불확실할 때는 공개하라(when uncertain, disclose). Nature 저널의 편집 정책(editorial policies)은 이러한 입장을 반영한다(reflect this stance):

‘AI 보조 원고 교정(AI assisted copy editing)’ 목적을 위한 LLM(또는 기타 AI 도구)의 사용은 신고할 필요가 없다(not need to be declared). 이 맥락에서, 우리는 ‘AI 보조 원고 교정’이라는 용어를 가독성(readability)과 스타일(style)을 위해, 그리고 텍스트에 문법, 철자, 구두점 및 어조(tone)의 오류가 없도록 보장하기 위해 인간이 생성한 텍스트를 AI의 도움으로 개선하는 것(AI-assisted improvements)으로 정의한다. 이러한 AI 보조 개선 사항은 텍스트에 대한 어휘(wording) 및 서식 변경(formatting changes)을 포함할 수 있지만, 생성적 편집 작업(generative editorial work)과 자율적 콘텐츠 생성(autonomous content creation)은 포함하지 않는다 [41].

5.1. Practice point (실무 포인트) 

  • 문법 교정, 문장 다듬기(sentence refinement), 또는 문헌 검색 지원과 같은 일상적인 지원(Routine assistance)은 정상적인 학술 관행(normal scholarly practice)으로 간주될 수 있으며 공개를 요구하지 않는다.
  • 반면에(On the other hand), 텍스트 생성, 코드 수정, 표나 도표 생성, 단어 수 줄이기, 또는 분석 확인(checking on analyses)과 같은 실질적인 GenAI 사용(substantive GenAI use)은 대상 저널의 가이드라인에 따라(예: 방법 섹션, 선언문, 또는 감사의 글에) 공개되어야 한다.

마지막으로, 정책이 출판사마다 다르며(differ across publishers) (심지어 한 출판사 사이트 내에서도 시간이 지남에 따라 변하므로), 저자들은 원고 제출 시점(time of manuscript submission)에 저널별 구체적인 지침(journal-specific instructions)을 확인해야 한다.

  • 예를 들어, JAMA 최근 편집 업데이트는 원고나 연구에 영향을 미치는 AI 사용의 투명한 보고(transparent reporting)를 요구하며 기본적인 문법/철자 확인에 대해서만 좁은 예외를 두는(carves out a narrow exception) 반면,
  • Springer Nature는 출판물 내 GenAI 이미지를 금지한다 [47]. 정책이 움직이는 표적(moving target)이라는 점을 감안할 때, 우리는 HPER 분야에서 ‘의심스러울 때는 공개하라(disclose-when-in-doubt)’는 접근 방식을 권장한다.

또한(Additionally), 저자들이 대상 저널을 확신하지 못하는 경우, 가장 엄격할 것으로 예상되는 정책(strictest likely policy)을 충족하는 보수적인 공개 성명서(conservative disclosure statement)를 선제적으로 작성(pre-emptively draft)한 다음, 필요에 따라 제출하려는 저널에 맞게 조정(tailor)할 수 있다. 마지막으로, 원고가 거절되어(rejected) 2순위 또는 3순위 저널에 제출할 경우, 저자들은 그 새로운 저널의 정책을 확인하고 이에 맞춰 공개 내용과 원고를 업데이트해야 한다.

5.2. Practice point (실무 포인트) 

저널 정책은 다양하고 진화하고 있으므로(evolving), ‘의심스러울 때는 공개하라(disclose-when-in-doubt)’는 접근 방식이 권장된다.

6. What about disclosing to your collaborators? (공동 연구자들에게 공개하는 것은 어떠한가?) 

주목할 점은(Notably), AI 사용 공개에 대한 기존 문헌은 주로 원고 제출 시점에 저널에 공개하는 것에 초점을 맞춰왔다는 것이다. 그러나 공개 관행(disclosure practices)은 연구 팀이 연구를 계획할 때, 더 일찍 시작되어야 한다. 연구 절차(research procedures) 및 원고 개발(manuscript development) 중에 AI 도구가 어떻게, 언제, 그리고 어느 정도까지 사용될 것인지(그리고 사용되었는지)에 대한 대화는 공동 연구자들 간의 투명성(transparency), 신뢰(trust), 그리고 공유된 이해(shared understanding)를 구축하는 데 매우 중요하다(crucial). 초기 문헌은 그러한 논의가 아직 일반적인 관행(common practice)이 아님을 시사한다 [48]. 일부 저자들은 수치심(shame), 판단에 대한 두려움(fear of judgment), 또는 공개가 어떻게 받아들여질지에 대한 불확실성(uncertainty) 때문에 공동 저자들에게 AI 사용을 공개하기를 주저할 수 있다 [49,50]. 다른 이들은 AI 사용을 밝히는 것이 동료들로 하여금 그들 작업의 정당성(legitimacy), 창의성(creativity), 또는 지적 기여(intellectual contribution)를 의심하게 만들 수 있다는 ‘공개 페널티(disclosure penalty)’에 대해 걱정할 수 있다 [51].

 

이러한 과제들을 해결하기 위해, 연구 및 저자 팀은 GenAI 사용과 관련된 공개 관행을 표준화(normalize)하고 구조화하기 위해 의도적인 조치(deliberate steps)를 취할 수 있다.

  • 초기에 명시적인 대화(explicit conversations)를 확립하는 것은 기대치를 명확히 하고(clarify expectations), 윤리적 및 저널 요구사항에 대한 상호 이해(mutual understanding)를 보장하며, AI 보조 작업과 관련된 낙인(stigma)을 줄이는 데 도움이 될 수 있다.
  • 팀들은 주요 프로젝트 마일스톤(key project milestones)마다 간단하고 반복적인 점검(recurring check-in)을 도입하여 AI 도구가 어떻게 활용되고 있는지, 어떤 기능(functions)을 수행하는지, 그리고 그 사용이 학문 분야 및 저널 가이드라인과 일치하는지 문의할 수 있다.
  • 이러한 논의를 기록(Documenting)하는 것은 정확한 저자 기여 성명서(authorship contribution statements)를 뒷받침하고 개방성(openness)과 공유된 책임(shared responsibility)의 문화를 조성할 수 있다.
  • 공개를 팀의 진실성 및 품질 보증 과정(integrity and quality assurance process)의 일부로 프레이밍(framing)함으로써, 팀들은 학습(learning), 성찰(reflection), 그리고 GenAI가 계속 진화함에 따른 유연성(flexibility)을 위한 잠재력을 위한 공간을 마련할 수 있다.

이러한 관행들은 저자됨 논의(authorship discussions)에 관한 지침과 유사하다(parallel) [52]. 저자됨에 대한 논의는 이상적으로 프로젝트의 시작(outset) 단계인 초기 계획 단계(initial planning stages)에서 시작되어야 하며, 작업이 진행됨에 따라 정기적으로 재검토(revisited regularly)되어야 한다. 이러한 선제적이고 지속적인 의사소통(proactive and ongoing communication)은 미래의 오해와 분쟁(disputes)을 예방하는 데 도움이 된다. 이는 연구가 석사 또는 박사 과정(master’s or PhD program)의 일부일 때 특히 중요하다. 학생들에게 있어 저자됨에 대한 대화를 시작하는 것은 어려울 수 있다(challenging). 따라서 지도교수들(supervisors)은 이러한 대화를 이끌고 지원할 책임(responsibility)이 있다 [53].

6.1. Practice point (실무 포인트) 

연구 팀은 연구 절차 및 원고 개발 중GenAI가 어떻게, 언제, 그리고 어느 정도까지 사용될 것인지에 대해 초기에 명시적인 논의(early, explicit discussions)를 가져야 한다. 이는 기대치를 명확히 하고, 윤리적 및 저널 요구사항을 충족하며, AI 보조 또는 AI 생성 학문(AI-generated scholarship)과 관련된 낙인(stigma)을 줄이기 위함이다.

 

7. How to disclose? (어떻게 공개할 것인가?) 

표 1(Table 1)은 어떻게 공개할지에 대한 예시를 제공하지만, 먼저 몇 가지 지침 원칙(guiding principles)을 고려하는 것이 중요하다.

Table 1. AIHPERD Framework of good practice for writing AI disclosures. (표 1. AI 공개 작성을 위한 모범 사례의 AIHPERD 프레임워크.) 

 

 

표 1. AI 공개 작성을 위한 모범 사례의 AIHPERD 프레임워크 (AIHPERD Framework of good practice for writing AI disclosures) 

번호 (N) 실천 사항 (Practice) 예시 (Examples)
1 사용된 모델을 명시하라(Specify the model used). 로컬 모델/버전이 사용된 경우, 이를 명시하고 모델의 이름과 버전을 포함하라. 저자들은 ChatGPT 5.1 Thinking (OpenAI) / Gemini Pro (Google DeepMind) / Perplexity / Claude (Anthropic) / NoteBook LM / 맞춤형 GPT (a custom GPT) (http://...) / X 대학에서 개발한 ChatGPT 버전...을 사용했다.
2 AI 시스템이 사용된 구체적인 활동을 언급하도록 보장하라(Ensure that you refer to the specific activities). 정밀하게 기술하라. (참고: '코딩(coding)'이라는 단어는 질적 데이터 분석이나 프로그래밍 모두를 지칭할 수 있으므로, 선언 시 구체적으로 명시하라.) ... 세 가지 개요(outlines)를 생성하기 위해, 그리고 저자들은 그중에서 ...을 도출했다

... 초기 문헌 검색(initial literature search)을 수행하기 위해 ...

... 논문들을 분석(analyse)하기 위해 ...

... 방법론(Methodology)을 평가하기 위해 ...

... 탐색적 군집 모델링(exploratory cluster modelling)을 위해. AI 도구는 데이터 내 잠재적 그룹화를 제안했으며..., 저자들은 이를 수동으로 검증하고 재시험했다.

... 중심 주장에 대한 대안적 프레임(틀)을 제안(propose alternative framings)하기 위해 ...

... 밀도 높은 분석적 묘사를 바꾸어 표현하고(rephrase), 데이터 수집 및 분석의 반복적 단계가 어떻게 진행되었으며 표본 추출 접근법에 영향을 미쳤는지 더 잘 설명(articulate)하기 위해...

... 언어와 문법을 교정하고 수정(proofread and correct)하며, 단어 수 요건을 충족하기 위해 논문 초록을 줄이기 위해 ...

... 데이터 분석을 위한 파이썬(Python) 스크립트, 그림 3 생성을 위한 R 코드, 그리고 MS-Excel 매크로 작성을 위해.

... 영어로의 1차 번역(first translation)을 제공하기 위해 ...

... 참고문헌 서식 지정(reference formatting)을 돕기 위해 ...

... 제출 전 초기 검토(initial review)를 제공하기 위해 ...
3 학습자, 환자, 또는 기타 참여자 데이터를 AI에 제출한 경우 동의를 얻었음을 선언하라(Declare that consent was obtained). 참여자들은 분석을 지원하기 위해 자신의 익명화된 데이터(anonymized data)가 AI 시스템에 업로드되는 것에 동의했다.
4 학습자, 환자, 또는 기타 참여자 데이터를 공공 모델(public model)에 제출한 경우 업로드된 데이터를 보호하기 위해 취한 조치를 명시하라(Indicate the steps taken to protect uploaded data). 우리는 데이터가 비공개 채팅 내에 유지되도록 보장하기 위해 ChatGPT에서 '모두를 위한 모델 개선(Improve the model for everyone)' 설정을 껐다.

... API를 통해 ChatGPT에 접속함으로써 사용자 데이터가 훈련 데이터로 사용되지 않도록 보장했다.
5 AI 도구가 사용되었을 것이라고 예상할 만한 타당한 이유가 있지만 실제로는 사용되지 않은 경우, 이를 명시적으로 밝히는 것을 고려하라(Consider explicitly stating when you did not use an AI tool). 모델은 데이터를 코딩하거나 해석을 생성하는 데 사용되지 않았다.

AI 시스템은 어떠한 이미지 생성에도 사용되지 않았다.

AI가 생성한 모든 제안은 저자들에 의해 논의되었으며, 작성된 모든 자료는 저자들에 의해 수정되었다. 저자들은 논의에 참여할 다양한 방향 중 어느 것을 선택할지와 최종 논증 라인(final line of argument)을 결정했다.

... 이는 저자들에 의해 수동으로 검증되고 재시험되었다.

연구 팀이 모든 분석적 결정과 해석을 내렸다.

모든 텍스트는 정확성(accuracy)과 어조(tone)를 위해 저자들에 의해 검토되고 수정되었다.
6 헬싱키 선언 준수, PRISMA 사용, 또는 기타 지침을 선언하는 것과 마찬가지로, GenAI에 관한 저널, 출판사, 또는 저자 소속 기관의 정책을 언급하여(Refer to the ... policy) 해당 정책을 읽었으며 그 정책 범위 내에서 AI를 사용했음을 인정하고 있음을 보여주라. ... 대학의 AI 정책(http:// ...)에 부합하여

... 저널의 AI 가이드라인(http:// ...)에 부합하여
7 저널 정책이 명시적으로 요구하지 않더라도, 책임에 대한 최종 성명(statement of responsibility)을 작성하라. 저자들은 이 출판물에 제시된 과학적 콘텐츠의 정확성과 진실성(integrity)에 대해 전적인 책임을 진다(assume full responsibility).
8 편집자가 요청할 경우를 대비하여 가능한 경우 프롬프트의 기록을 보관하라(Keep a record of the prompt/s). 데이터와 마찬가지로, 합리적인 요청이 있을 시 독자들에게 이를 공개하는 것을 고려하라. 프롬프트는 / 전체 상호작용은 / 합리적인 요청 시 교신 저자로부터 받을 수 있음 / 부록 A에 제공됨.

참고(NOTE): ChatGPT에서는 '공유(Share)' 기능을 사용하거나, 브라우저 확장 프로그램 'Save as PDF' (https://addons.mozilla.org/en-US/firefox/addon/save-as-pdf/)를를) 사용하라.

 

유용한 출발점(useful starting point)은 공개를 고백(confession)이 아닌, 일상적인 방법론적 보고(routine methodological reporting)로 취급하는 것이다. AI 사용 보고를 생각하는 도움이 되는 방식(helpful way)은 우리가 이미 소프트웨어를 기록하는 방식(document software)을 모방하는 것(mirror)이다:

 

  • ‘분석은 SPSS v27에서 수행되었다(Analyses were conducted in SPSS v27)’ 또는
  • ‘질적 코딩은 NVivo 14를 사용했다(Qualitative coding used NVivo 14)’.

 

이 논리(logic)를 따라, 좋은 AI 공개는 다음을 포함해야 한다:

 

  • AI 도구 및 버전 명시(name the AI tool and version),
  • 사용 방법 기술(예: 글쓰기(writing), 교정(editing), 데이터 처리(data processing), 도표 생성(figure generation), 문헌 요약(literature summarizing)),
  • 사용의 범위(extent) 또는 중요성(significance) 표시 (예: 사소한 언어 교정(minor language editing) 대 실질적인 초안 작성(substantive drafting) 또는 분석적 기여(analytic contribution)), 그리고
  • 모든 콘텐츠에 대한 책임을 확언(affirming responsibility)하면서 저자들이 결과물(outputs)을 어떻게 검증(verified)했는지 설명해야 한다.

 

 

JAMA의 정책은 이를 구체화한다(operationalizes):

 

  • 제출 중(during submission), 저자들은 텍스트, 표, 또는 도표를 생성(create)하기 위해 AI가 사용되었는지 질문받는다.
  • 만약 그렇다면, 그들은 도구, 버전, 그리고 용법(usage)을 명시해야 하며(specify), 방법(Methods) 또는 감사의 글(Acknowledgments) 섹션에 해당 성명서(corresponding statement)를 포함해야 한다.
  • 방법 섹션이 없는 관점(perspectives)이나 에세이(essays)의 경우, 감사의 글 또는 간략한 ‘AI 사용 선언(Declaration of AI Use)’을 사용하라 [54].

 

HPER 논문의 경우, AI가 연구 수행(research conduct)을 지원했을 때 방법 섹션이 이상적(ideal)이다. 그러나 저자들은 책임 증명(responsibility attestation)이 간과되지 않도록(does not get overlooked) 보장해야 한다 [10].

 

포함할 세부 사항의 수준(level of detail)에 관해서는, 관행들이 진화하고 있다(practices are evolving). 현재, HPER 출판물들은 최소한의 공개 스타일(minimalist disclosure style)을 지향하는 경향이 있다 [10].

 

  • 그러나 독자들이 AI 사용의 본질(nature of AI use)과 그것이 학문에 미친 영향(impact on the scholarship)을 평가할 수 있도록 공개가 충분한 정보(sufficient information)를 제공하기 위해서는, 간결성(brevity)과 투명성(transparency)이 균형을 이루어야 한다(need to be in balance). 예를 들어(For instance), 저자가 자신만의 맞춤형 GPT(custom GPT)를 생성했을 때와 같이, 사용된 AI 모델이 독자들에게 덜 익숙할 때(less familiar) 더 많은 세부 사항이 요구될 수 있다.
  • 저자들은 또한 AI 사용의 한계(limits of their use)를 나타내기를 원할 수 있는데, 특히 그 사용이 논쟁 중인(under debate) 학술적 맥락(scholarly contexts)에서 그러하다 [55]. 예를 들어, 질적 연구자들(qualitative researchers)은 대규모 인터뷰 데이터셋(large interview dataset)의 인간 코딩과 LLM 코딩을 비교하기 위해 AI가 사용되었으나, 분석의 해석적 단계(interpretive phases)에는 사용되지 않았음을 공개할 수 있다.
  • 이러한 ‘부정적 공개(negative disclosures - 사용하지 않았음을 밝히는 것)’가 HPE 문헌에 등장하고 있지만 [10], 우리는 저자들이 그들의 동기(motivation)와 영향(impacts)을 고려할 것을 권장한다. 왜냐하면 이 전략이 투명성과 신뢰성(credibility)에 어떤 영향을 미치는지 아직 명확하지 않기 때문이다.

 

 

저자들은 유익한 정보가 있는(informative) 공개를 목표로 해야 한다(should aim for) [56]. 2025년 상반기 동안 의학 교육 저널들의 AI 사용 공개에 대한 최근의 계량서지학 연구(bibliometric study)는 그것들이 용어 면에서 피상적인(superficial) 경향이 있음을 발견했는데, 이는 AI가 정확히 어떻게 사용되었고 그 결과물이 어떻게 검증되었는지에 대해 제한된 정보(limited information)만을 제공했다 [10]. 그러한 일반적이거나(generic) ‘안전한(safe)’ AI 면책 조항들(disclaimers)은 이해할 만하다(understandable): 그것들은 저자들이 AI 사용 공개에 수반되는 위험(risks involved)을 헤쳐 나가는 데 도움을 준다 [51]. 그러나 공개가 연구자들이 학술적 관행에서 AI와 어떻게 관여했는지(engaged with)에 대해 의미 있고 구체적인 정보(meaningful concrete information)를 거의 전달하지 못할 때, 그것들은 학술적 신뢰성의 상징(symbols of scholarly credibility)이라기보다는 미덕 과시(virtue-signalling)로서 기능한다.

 

  • Weaver 인공지능 공개 ‘AID’ 프레임워크(Weaver Artificial Intelligence Disclosure ‘AID’ Framework)는 공개를 형식적인 것(performative)이 아닌 구체적인 것(specific)으로 만들기 위한 실용적인 발판(practical scaffold)을 제공한다 [57].
    • 이는 연구 원고에 대한 AI 관여(AI involvement)의 누가/무엇을/왜/얼마나를 묘사하기 위해 익숙한 저자 기여(author contribution)의 언어를 사용한다.
    • 이를 통해 저자들이 일반적인 상용구(generic boilerplate)(예: ‘명료성을 개선하기 위해 AI가 사용되었다’)를 피하도록 돕고, 독자들이 연구자와 AI 모델 간의 학술적 상호작용(scholarly interaction)을 통해 모델 결과물을 생산하고 검증하는 과정을 볼 수 있게 한다.
  • 유사하게, Lingard와 동료들은 저자들에게 검증을 ‘약속(promise)이 아닌 과정(process)으로 취급하라: 어떻게 검증했는지에 대해 투명해져라’라고 조언한다 [16,p.17]. 예를 들어,
    • ‘우리는 자체적인 PubMed 검색(conducting our own PubMed search)을 수행하고, AI가 인용한 모든 자료가 정확한지 확인하는 것을 포함하여 주요 출처(key sources)를 검토함으로써 AI가 생성한 텍스트의 정확성을 검증했다. 오류(errors)나 지나친 단순화(oversimplifications)를 발견한 곳에서는 필요에 따라 AI 텍스트를 수정했다(edited).’

 

위에 인용된 문헌과 Kousha의 선언문 데이터베이스(database of declarations) [19]를 바탕으로, 우리는 공개 예시(Table 1)를 포함하여 HPER에서의 AI 선언(AIHPERD) 모범 사례 프레임워크(AI in HPER Declaration (AIHPERD) framework of good practice)를 만들었다.

 

또한, 다음을 해서는 안 된다(should not):

  • 모호하고(vague) 지나치게 일반적인(overly general) 공개를 작성하는 것.
    • 예: ‘우리는 이 기사를 연구하고 작성하는 데 ChatGPT를 사용했다’와 같은 진술(Statements). 독자가 텍스트에 미친 AI의 영향(AI impact)을 판단하기에 불충분한 정보(insufficient detail)를 제공한다.
  • 사과하거나(Apologize) 지나치게 방어적으로 공개(disclose over-defensively)하는 것.
    • 예: ‘우리는 이 연구에서 GenAI를 사용했지만, 오직 ...로만 제한했다’. 당신은 ‘우리는 엑셀을 사용했지만, 오직 차트 구성을 위해서만...’이라고 쓰지 않을 것이다. SPSS로 통계 분석을 수행한 것에 대해 사과하지 않는 것처럼, 마찬가지로 AI를 사용한 것에 대해 사과할 필요(no need to apologise)는 없다.

요약하자면(In summary), 우리는 저자들이 공개를 고백(confessing)보다는 보고(reporting)로 접근할 것을 권장한다. AI 사용은 부끄러워해야 할 것(something to be ashamed of)이 아니다: 그것은 당신이 사려 깊게(thoughtfully) 그리고 적절하게(appropriately) 사용한 도구이다. 공개의 목표(aim of the disclosure)는 독자들이 모델이 연구와 글쓰기를 어떻게 형성했는지(shaped) 이해할 수 있도록 하는 연구자와 AI 간의 관여에 대한 솔직한 묘사(candid description)여야 한다. 명료성과 투명성을 달성하지 못한 채 공개 박스에 체크만 하는(checks the disclosure box) 안전한 묘사가 되어서는 안 된다.

7.1. Practice point (실무 포인트) 

공개를 고백이 아닌, 일상적인 방법론적 보고(routine methodological reporting)로 취급하라.

 

8. What about the use and disclosure of GenAI in peer review? (동료 심사에서의 GenAI 사용과 공개는 어떠한가?) 

비록 이 가이드가 저자들의 GenAI 사용 공개에 초점을 맞추고 있지만, 우리는 또한 동료 심사(peer-review)에서의 GenAI 사용도 고려할 필요가 있다. 리뷰어들(Reviewers)은 저자들과 마찬가지로, 그들이 생산하는 콘텐츠에 대해 책임이 있다(accountable). 따라서 동료 심사를 준비하는 데 있어 GenAI의 어떠한 사용도 심각한 주의(serious attention)를 요한다(warrants).

 

비록 일부 저널과 출판사들이 동료 심사를 지원하기 위해(to support peer-review) AI 사용을 탐색하고 있지만 [58,59], 인간 동료 심사자들(human peer-reviewers)에 의한 AI 사용은 몇 가지 이유로 권장되지 않는다(discouraged):

8.1. Publishers’/journals’ policies (출판사/저널의 정책들) 

리뷰어들은 그들의 동료 심사가 저널의 전문적(professional)이고 윤리적인 기준(ethical standards)을 충족하도록 보장해야 한다. 핵심적인 우려(key concern)는 기밀성(confidentiality)이다. 심사 중인 원고(manuscripts under review)는 특권적인 문서(privileged documents)이며 기밀성에 대한 위험 때문에 전체든 부분이든 AI 도구에 업로드되어서는 안 된다 [60,61]. 예를 들어, Academic MedicineMedEdPORTAL은 동료 심사자에 의한 AI 사용을 포함하도록 AI 사용 지침(AI-use guidance)을 업데이트했다. 이 정책은 리뷰어들이 저널과 저자 사이의 기밀 유지 계약(confidentiality agreement)을 위반할 수 있는 AI 도구에 기밀 원고를 업로드하는 것을 금지한다(prohibits) [31,62].

8.2. Expertise and real-world experience (전문성과 실제 세계 경험) 

논문 심사 요청(invitation to review)은 도메인(domain) 및/또는 방법론적 전문성(methodological expertise)에 대한 인정(acknowledgement)이자, 비판적 판단(critical judgment)에 대한 요청이다. 예를 들어,

  • 방법론적 선택(methodological choice)이 진정으로 적절한지, 혁신적인지, 또는 잠재적으로 문제가 있는지 판단하는 것은 현재의 AI 시스템이 완전히 복제할 수 없는(cannot fully replicate) 깊은 도메인 지식(deep domain knowledge)과 비판적 사고(critical thinking)를 필요로 한다.
  • GenAI는 또한 연구가 진정으로 참신한지(novel) 또는 윤리적인지, 혹은 그것이 더 넓은 학술적 논쟁(broader scholarly debates)에 어떻게 부합하는지 판단하는 데 필요한 산 경험(lived experience), 세상 지식(world knowledge), 그리고 도메인 특화 관점(domain-specific perspective)이 결여되어 있다(lacks).
  • 게다가(Moreover), GenAI는 ‘블랙박스(black box)’로서, 권고(recommendation)에 어떻게 도달했는지에 대한 정보를 제공하지 않으므로, 편집자와 저자들에게 도움이 되지 않는다(unhelpful).

이러한 이유들 외에도, 저널들이 AI가 쓴 것에 대해 윤리적(ethically) 및 도덕적으로 책임(morally responsible)질 수 없기 때문에 저자가 될 수 없다고 주장하면서(insisting), 동시에(simultaneously) 논문 심사에 AI 도구를 사용하는 것에는 무언가 의문스러운 점(questionable)이 있다. ‘남에게는 엄격하지만 나에게는 관대한 규칙(Rules for thee, but not for me - 내로남불)’은 적절한 격언(adage)일지 모르나 적절한 태도(stance)는 아니다.

 

그러나, 리뷰어들이 저널의 기밀 유지 정책을 위반하지 않는 방식(manner that does not violate)으로 AI 도구를 사용한다면, 그들은 이 사용을 공개해야 한다. 최소한(At a minimum), 그들은 도구의 이름과 사용 방법(usage method)을 식별해야 하며 (예: ‘나는 이 심사를 [제품명, 버전, 회사, 이름, 연도]의 도움을 받아 수행했다’고 명시), 그것이 심사를 어떻게 지원했는지 정확하게 묘사(describe precisely)해야 한다. 이 정보는 편집자와 저자 모두가 볼 수 있도록 저자에게 보내는 기밀 코멘트(Confidential Comments to the Author)에 두는 것이 가장 좋을 수 있다. 편집자들은 도구의 영향력의 범위(extent of the tool’s influence)를 완전히 이해하기 위해, 사용된 프롬프트(prompts used)나 AI가 생성한 텍스트와 같은 추가 세부 사항(additional detail)을 요청할 수 있다.

 

본질적으로(At heart), 동료 심사는 판단(judgment)과 책무성(accountability)에 관한 것이다. GenAI는 기계적인 작업(rote tasks) (예: 저널 요구사항 준수 확인 [63]) 측면에서는 도움이 될 수 있지만, 영향력(impact)과 중요성(significance), 참신성(novelty), 그리고 관련성(relevance)을 평가하기 위해서는 인간의 전문성(human expertise)이 필요하다 [58,59].

심사에서의 AI의 역할은 Medical Teacher 이번 호에 실린 Masters와 Cleland의 사설(editorial) [64]에서 더 논의된다.

8.2.1. Practice point (실무 포인트) 

AI 도구는 생각을 정리하거나(organising thoughts) 심사 작업을 관리하는 데(managing review tasks) 유용하지만, 인간의 판단이나 비판적 평가(critical evaluation)를 대체할 수는 없다(cannot replace).

 

9. What will the future hold for AI disclosure? (AI 공개의 미래는 어떻게 될 것인가?)  

AI 공개의 미래를 고려하기 위해(To consider the future), 우리는 과거를 반추해야 한다(must reflect on the past). 역사적으로(Historically), 교육에 새로운 기술의 도입(introduction of new technologies)은 파괴적이었으며(disruptive) 정책 변화(policy change)를 요구했다. 전자 계산기(electronic calculator), 그리고 이후 워드 프로세서(word processors), 스프레드시트(spreadsheets), 통계 패키지(statistical packages)의 채택(adoption)은 모두 적응 기간(adjustment periods)을 필요로 했다. 오늘날, 아무도 워드 프로세서 사용을 ‘선언(declare)’할 것으로 예상되지 않으며, 엑셀이나 SPSS 사용을 ‘선언’하는 것은 방법론적 보고(methodological reporting)의 일상적인 부분(routine part)이다. 그러나 새로운 교육 도구들(New educational tools)은 그 사용이 표준화(normalised)되기 전에 수용 기간(period of acceptance)을 필요로 한다. GenAI 도구들은 그러한 시기(such a period)에 있다. 그러한 이유로(For that reason), 출판사, 저널, 그리고 교육 기관들은 그 사용의 공개(disclosure)를 요구한다. 시간이 지남에 따라(Over time), 이것은 변할 것이다: 결국 공개는 최소화되거나(minimised) (SPSS나 질적 데이터 관리 소프트웨어 패키지 사용처럼) 일상적인 것(routine)이 되거나, (맞춤법 검사기처럼) 전혀 행해지지 않게(not done at all) 될 것이다. 그동안(Meanwhile), 학술 커뮤니티(scholarly community)는 명확성(clarity)과 투명성(transparency)을 제공하는 표준(standards)을 만들어야 하며, 동시에 이러한 표준들이 진화할 것이고(will evolve), 빠르게 변할 수도 있음(may do so quickly)을 인정해야 한다(acknowledging). 그러나 핵심 원칙들(take-home principles)은 그대로 남는다(remain). 그리고 우리 각자는 변화하는(shifting) 출판사, 저널, 기관 정책들에 대해 최신 정보를 유지해야 할(stay abreast of) 필요가 있다.

10. Call for research (연구 요청) 

AI 사용에 대한 연구는 급격히 성장했으나(grown rapidly), AI 공개에 대한 경험적 연구(empirical work)는 여전히 제한적이다(remains limited). 현재까지(To date), 이 학문의 대부분은 [10,65]에서의 AI 공개 비율(rates)을 기록하거나(documenting) 편집 정책(editorial policies)을 목록화하는 것(cataloguing)에 초점을 맞춰왔다 [16,39]. 빠져 있는 것은(Missing) 기술(description)을 넘어 실제(in practice) AI 공개가 어떻게 작동하는지, 어떤 기능(function)을 수행하는지, 그리고 그것이 연구 진실성(research integrity), 저자 팀 규범(author team norms), 그리고 형평성(equity)을 어떻게 지원할 수 있는지 탐구하는 응집력 있는 탐구 프로그램(cohesive program of inquiry)이다.

 

기초적인 다음 단계(foundational next step)는 현재의 공개 행동(disclosure behaviour)을 이해하는 것일 수 있다.

  • 연구자들은
    • 저자들이 언제 그리고 왜 공개하기로(또는 안 하기로) 선택하는지,
    • 어떤 세부 사항(details)을 포함할지 어떻게 결정하는지, 그리고
    • 그들의 공개가 AI가 워크플로우(workflow)에 어떻게 관여했는지(factored into) 정확하게 묘사하는지를 기록할 수 있다.
  • 그러한 연구들은 낙인에 대한 두려움(fear of stigma), 판단에 대한 우려(concerns about judgment), 또는 편집자와 동료 심사자 기대(expectations)에 대한 불확실성과 같이 공개에 영향을 미치는 사회적 및 문화적 역학(social and cultural dynamics)을 조사할 수 있다.
  • 병행 분석(Parallel analyses)은 출판된 공개들의 완전성(completeness)과 명확성(clarity)을 조사하고, 독자, 편집자, 리뷰어들이 원고 평가(appraisal) 시 이 진술들을 쉽게 해석(readily interpret)하고 사용할 수 있는지 평가할 수 있다.

 

또한 학술적 의사소통(scholarly communication)의 인식(perception)에 미치는 공개의 효과를 조사할 필요가 있다. 예를 들어,

  • 연구자들은 다양한 형태의 공개(different forms of disclosure)가 원고의 신뢰성(credibility), 엄격성(rigour), 독창성(originality)에 대한 이해관계자들의 인식(stakeholders’ perceptions)에 어떤 영향을 미치는지 탐구할 수 있다.
  • 게다가(Additionally), 연구자들은 다양한 공개 형식(예: 서술적 공개(narrative disclosures) 대 구조화된 템플릿 공개(structured, templated disclosures)) 또는 위치(예: 방법 섹션 대 감사의 글)가 인식에 영향을 미치는지 조사할 수 있다.

 

또 다른 탐구 영역(area of inquiry)은 새롭게 등장하는 AI 특화 보고 지침(emerging AI-specific reporting guidelines)의 유용성(usefulness)과 영향력(impact)을 평가하는 것일 수 있다.

  • GAMER [66]와 같은 AI 특화 표준들과 기존 가이드라인의 확장판(예: CONSORT-AI [67] 및 PRISMA-AI [68])이 인기를 얻음에 따라(gain popularity), 연구자들은 이러한 가이드라인들이 AI 도구가 연구 설계(study designs), 데이터 처리(data handling), 원고 준비(manuscript preparation)에 어떻게 통합되었는지를 묘사함에 있어 일관성(consistency), 명확성(clarity), 완전성(completeness), 투명성(transparency)을 지원하는지 평가할 수 있다.

미래 연구를 위한 핵심 우선순위(key priority)는 특히 HPER 맥락에서 공개의 형평성 시사점(equity implications)을 이해하는 것이다.

  • 최근 한 연구는 HPER에서 AI 도구를 공개하는 저자의 상당한 비율(substantial proportion)이 글로벌 사우스(Global South) 국가 출신임을 발견했다. 이는 AI가 종종 제도적 지원(institutional supports)이 적고, 전문 교정 서비스(professional editing services)에 대한 접근성이 낮으며, 시간과 자원이 더 제한된 환경에서 일하는 연구자들에 의해 채택되고 있음을 강조한다 [10]. 따라서 공개 정책들은 다국어 학자들(multilingual scholars), 초기 경력 연구자들(early-career researchers), 그리고 정식 AI 훈련이나 인프라가 없는 기관의 연구자들에게 불균형적으로 부담(disproportionately burden)을 줄 잠재력이 있는지 검토되어야 한다.
  • 연구들은 엄격하거나 모호한(strict or ambiguous) 공개 기대치가 AI에 더 능숙하거나(more AI-fluent) 자원이 풍부한 환경(well-resourced environments)에 기반을 둔 저자들에게 특권을 줌으로써(privileging) 기존의 불평등(inequities)을 악화시킬(exacerbating) 위험이 있는지 탐구해야 한다. 이러한 역학을 이해하는 것은 학술 출판에서 구조적 격차(structural disparities)를 영속화하지 않으면서(without perpetuating) 투명성을 증진하는 공개 규범(disclosure norms)을 개발하는 데 중요할 것이다(crucial).

10.1. Practice point (실무 포인트) 

기술(description)을 넘어 실제 AI 공개가 어떻게 작동하는지, 어떤 기능(function)을 수행하는지, 그리고 그것이 연구 진실성, 저자 팀 규범, 형평성을 어떻게 지원할 수 있는지 탐구하는 응집력 있는 탐구 프로그램(cohesive program of inquiry)이 필요하다.

11. Conclusion (결론) 

요약하자면(In summary), GenAI는 의심할 여지 없이 학술적 글쓰기 과정을 향상시킬 수 있지만(enhance), 그 사용과 공개는 주의 깊게(with care) 접근되어야 한다. 저자, 리뷰어, 편집자들이 특히 AI가 관련되었을 때 학문적 진실성(academic integrity)을 유지하는 데 있어 경계를 늦추지 않는 것(remain vigilant)이 필수적이다(essential). 저자들은 AI 생성 콘텐츠의 정확성(accuracy)과 적절성(appropriateness)을 검증하여, 그것이 자신의 작업의 독창성(originality)이나 타당성(validity)을 훼손하지 않도록(does not compromise) 보장해야 한다.

 

종합적으로(Collectively), 우리는 투명성, 책무성, 윤리적 연구 관행을 증진하는 공통 표준(common standards)을 확립하는 것이 중요하다고 믿는다. 이를 통해 지식 생산(knowledge production)을 책임감 있고 엄격하게(responsibly and rigorously) 발전시키는 방식으로 기술 혁신(technological innovation)에 대한 우리 분야의 대응(response)을 형성해야 한다. 이러한 표준과 가이드라인들은 실용적이고(practical), 저자들이 이행하기 쉬워야 하며(easy for authors to implement), 준수(compliance), 완전한 공개(full disclosure), 그리고 진실성(truthfulness)을 장려하도록 설계되어야 한다. 마지막으로, 각 연구자와 연구 팀은 과학적 진실성(scientific integrity)을 옹호하는(uphold) 방식으로 사용과 공개를 보장하면서, 보급(dissemination)과 동료 심사를 포함한 연구 과정에 GenAI를 가장 잘 통합(integrate)할 방법을 고려해야 한다.

 

 

Med Teach. 2025 Nov 16:1-12. doi: 10.1080/0142159X.2025.2581163. Online ahead of print.

The role of artificial intelligence in co-creation of health professions education: Integrating innovation into collaboration: AMEE Guide No. 190

 

 

🤖 의대생과 교수님이 함께 수업을 만든다고? AI와 함께하는 '공동 창작' 완전 정복!

여러분, '공동 창작(Co-creation)'이라는 말 들어보셨나요? 학생과 교직원이 서로를 파트너로 존중하며 교육 과정을 함께 설계하고 만드는 것을 말해요. 이게 말은 좋은데, 막상 하려니 현실적인 어려움(시간 부족, 소통의 어려움 등)이 만만치 않죠. 그래서 최근 연구에서는 AI를 활용해 이 과정을 훨씬 효율적이고 포용적으로 만드는 방법을 제안하고 있습니다.

연구진은 AI의 역할에 대해 이렇게 강조해요.

"여기서 AI는 복잡한 과업을 관리하는 데 능숙하면서도 창의성 및 감성 지능과 같은 필수적인 인간적 자질을 향상시키는 귀중한 파트너가 될 수 있습니다."

"AI can be a valuable partner here, adept at managing complex tasks while also enhancing essential human qualities, such as creativity and emotional intelligence."

 

단순히 일을 대신해 주는 기계가 아니라, 우리의 인간적인 면모를 더 빛나게 해주는 파트너라는 거죠! 💡

자, 그럼 AI를 공동 창작의 3단계(준비, 실행, 후속 조치)에 어떻게 써먹을 수 있는지 구체적으로 알아볼까요?


1️⃣ 준비 단계 (Preparation Phase): 시작이 반이다!

공동 창작을 하려면 먼저 누구랑 할지, 무엇을 할지 정해야겠죠?

  • 똑똑한 모집 (Recruitment): 누가 이 프로젝트에 딱 맞을까요? AI가 설문조사 응답이나 지원자의 목표를 분석해서 프로젝트와 딱 맞는 참여자(Participants)를 추천해 줄 수 있어요.
  • 맞춤형 오리엔테이션: 참여자들의 배경지식이 다 다르잖아요? 적응형 학습 모듈(Adaptive learning modules)이나 지능형 챗봇(Intelligent chatbots)이 각자에게 딱 맞는 사전 학습 자료를 제공해서 모두가 준비된 상태로 만날 수 있게 도와줍니다.
  • 안건 짜기 (Agenda Design): 맨땅에 헤딩은 NO! AI가 학생들의 피드백이나 게시판 글을 분석해서, 진짜 학생들이 관심 있어 하는 주제로 회의 안건을 잡아줍니다.

2️⃣ 실행 단계 (Conduction Phase): 진짜 협업은 지금부터!

이제 모여서 아이디어를 낼 차례입니다. 여기서 AI는 '인지적 협력자(Cognitive collaborators)'가 됩니다.

  • 브레인스토밍 도우미: 아이디어가 안 떠오르나요? 생성형 AI(Generative AI)에게 질문을 던져보세요. 새로운 관점을 제시해 줍니다.
  • 모두가 평등하게: 교수님 앞에서 의견 내기 어려워하는 학생들 있죠? 😅 AI를 통해 익명 기여(Anonymous contributions)를 하면, 권력 관계나 눈치 볼 필요 없이 자유롭게 아이디어를 낼 수 있어요. 연구진은 이 부분을 특히 중요하게 봤어요.

"위계적 장벽은 동등한 참여를 저해하고, 열린 의사소통과 창의성을 억압하며, 사고의 다양성을 줄이고, 공동 창작 결과물에 대한 집단적 주인의식을 약화시킬 수 있습니다."

"Hierarchical barriers... might inhibit equal participation, suppress open communication and creativity, reduce diversity of thoughts, and weaken collective ownership of co-creation outcomes."

  • 실시간 기록: 회의 내용을 받아 적느라 바쁠 필요 없어요. AI 전사 서비스(Transcription services)가 대화 내용을 기록하고 요약까지 척척 해줍니다. 우리는 눈을 맞추고 대화에만 집중하면 돼요!

3️⃣ 후속 조치 단계 (Follow-up Phase): 끝날 때까지 끝난 게 아니다

공동 창작이 끝나고 나면, 잘 됐는지 확인하고 널리 알려야겠죠?

  • 피드백 분석: 참여자들의 소감이나 토론 내용을 자연어 처리(NLP) 도구가 분석해서 감정 상태나 핵심 주제를 뽑아줍니다. 우리가 놓친 과소대표된 목소리(Underrepresented voices)는 없었는지도 체크해 줘요.
  • 결과물 확산 (Dissemination): 힘들게 만든 결과물, 널리 알려야죠! AI가 뉴스레터, SNS용 요약, 카드 뉴스, 심지어 팟캐스트 대본까지 뚝딱 만들어줍니다.
  • 교육과정 통합: 우리가 만든 게 실제 수업 목표랑 잘 맞을까요? AI가 기존 커리큘럼과 비교해서 수정이 필요한 부분을 짚어줍니다.

🧠 이론적으로 탄탄하게 접근하기 (SAMR & TOE)

그냥 막 쓰는 게 아니라, 이론적인 틀을 가지고 접근하면 더 좋아요. 논문에서는 두 가지 프레임워크를 소개합니다.

  1. SAMR 모델:
    • 대체(Substitution): 사람이 하던 걸 AI가 대신함 (예: 받아쓰기).
    • 증강(Augmentation): 기능을 더 좋게 만듦 (예: 실시간 번역).
    • 변형(Modification): 과정을 확 바꿈 (예: 맞춤형 자료 추천).
    • 재정의(Redefinition): 예전엔 상상도 못 했던 일을 함 (예: 실시간 시뮬레이션).
    • 팁: 무조건 높은 단계가 좋은 게 아니에요. 상황에 맞는 도구를 쓰는 게 중요합니다!
  2. TOE 프레임워크 (Technology-Organization-Environment):
    • 기술만 좋으면 될까요? 아니죠. 조직의 준비도(Organizational readiness)와 외부 환경(External environment)도 고려해야 성공할 수 있습니다.

⚠️ 주의할 점: AI는 만능키가 아니다!

AI가 좋긴 하지만, 조심해야 할 점도 분명히 있습니다.

  • 편향(Bias) 문제: AI가 학습한 데이터가 한쪽으로 치우쳐 있다면, 소수의 의견을 무시할 수도 있어요.
  • 인간미 상실: 너무 기술에 의존하면 사람 간의 진짜 소통이 줄어들 수 있죠.
  • 보안과 윤리: 민감한 대화 내용이 유출되지 않도록 조심해야 합니다.

연구진은 마지막으로 이렇게 당부합니다.

"공동 창작의 품질을 보존하기 위해, 기술적 입력과 대면 대화의 균형을 맞추고, 데이터 해석에 있어 인간의 감독을 보장하며, AI 역량과 한계에 대한 훈련을 제공하는 것이 중요합니다."

"To preserve the quality of co-creation, it is vital to balance technological input with face-to-face dialogue, ensure human oversight in data interpretation, and provide training on AI capabilities and limitations."

 


서론 (Introduction)

 

보건의료 전문가 교육(Health professions education, HPE)은 전통적인 개인 중심 학습(person-centered learning)에서 협력적 지식 통합(collaborative knowledge synthesis)으로 이동하며(shifting) 중대한 변화(significant transformation)를 겪고 있습니다. 이러한 변화는 고등교육(higher education) 전반의 더 넓은 변화를 반영하는 것으로(reflects a broader change), 학생들은 더 이상 정보의 수동적 수용자(passive recipients)가 아니라 자신의 학습에 대한 능동적 기여자(active contributors)로 간주됩니다. 기술의 발전(Advances in technology), 정보에 대한 접근성(access to information), 그리고 의료의 증가하는 복잡성(growing complexity of healthcare)은 미래의 전문가들이 비판적으로 사고하고(think critically), 협력적으로 문제를 해결하며(solve problems collaboratively), 급변하는 지식 환경(rapidly evolving knowledge landscapes)에 적응하도록 준비시키는 더 역동적이고 참여적인 학습 환경(dynamic and participatory learning environments)의 필요성을 촉진했습니다(catalyzed) [1]. 상호혜택(reciprocity), 포용성(inclusivity), 권한 부여(empowerment), 신뢰(trust)와 같은 가치 위에 구축된(Built on values) [2], 공동 창작(co-creation)은 학생들을 교육 형성의 능동적 파트너(active partners)로 위치시키고 교육을 민주화하며(democratize) 적절성(relevance)을 높이는 수단으로서 혁신적인 전략(transformative strategy)으로 부상했습니다 [3]. 향상된 동기부여(enhanced motivation), 개선된 비판적 사고(improved critical thinking), 더 나은 학습 성과(better learning outcomes)와 같이 잘 입증된 이점(well-documented advantages)에도 불구하고 [4], 공동 창작의 실행은 HPE 맥락 내에서 여전히 활용도가 낮고(underutilized) 일관성 없이 적용되고 있습니다(inconsistently applied) [5]. 이는 그 폭넓은 구현(broader implementation)을 촉진할 수 있는 혁신적인 도구와 전략의 필요성(necessity)을 강조합니다(underscores). 최근, 인공지능(Artificial Intelligence, AI)은 교육 분야에서 혁신적 요소(transformative element)로 등장하여, 개인화를 강화하고(enhancing personalization), 실시간 협업을 촉진하며(fostering real-time collaboration), 행정적 부담을 경감함(alleviating administrative burdens)으로써 공동 창작을 촉진할(promote co-creation) 독특한 기회를 제시하고 있습니다 [6].

 

실천 요점 (Practice points)

  • AI는 적응형 도구(adaptive tools)를 활용하여 광범위한 참여자를 식별 및 모집하고(identify and recruit) 공평한 대표성(equitable representation)을 장려함으로써, 공동 창작에 있어 포용적이고 다양한 이해관계자 참여(inclusive and diverse stakeholder engagement)를 촉진할 수 있습니다(facilitate).
  • AI 도구는 토론을 전사하고(transcribing discussions), 핵심 아이디어를 추출 및 주제별로 분류하며(extracting and thematically clustering), 이를 시각적 대시보드(visual dashboards)와 간결한 요약(concise summaries)을 통해 제시함으로써 의사결정(decision-making), 투명성(transparency), 연속성(continuity)을 향상시켜 공동 창작을 지원할 수 있습니다.
  • 참여 지표(participation metrics)를 모니터링하고 감성 분석(sentiment analysis)을 수행함으로써, AI는 공동 창작 과정의 개선을 알리고(inform improvements) 기관 내 공동 창작 관행의 채택(adoption)을 장려하는 실행 가능한 통찰력(actionable insights)을 제공할 수 있습니다.
  • 신뢰성 보장(ensuring reliability), 편향 및 형평성 문제 해결(addressing bias and equity), 기술과 인간 상호작용의 균형(balancing technology with human interaction)과 같은 AI를 공동 창작에 통합하는 데 있어 주요 과제(key challenges)를 고려하는 것이 필수적입니다.

공동 창작은 더 나은 학생 참여(better student engagement), 만족도 증가(increased satisfaction), 더 깊은 학습 경험(deeper learning experiences), 그리고 전문 역량 개발(development of professional competencies)을 포함한 광범위한 교육적 혜택(range of educational benefits)관련이 있습니다(associated with) [3, 4]. 학생들을 학습 환경에 대한 능동적 기여자(active contributors)로 위치시킴으로써, 공동 창작은 주인의식(sense of ownership), 권한 부여(empowerment), 상호 존중(mutual respect)을 함양합니다(cultivates) [7]. 또한, 이는 학생들의 자신감(confidence), 동기(motivation), 웰빙(well-being)을 증진시킬 수 있으며(boost) [7, 8], 동시에 교수진이 자신의 교육 관점을 변화시키도록(transform) 영감을 줄 수도 있습니다 [9, 10]. 적절하게 수행될 경우(When done properly), 이러한 협력적 이니셔티브(collaborative initiatives)에 학생과 교수진을 참여시키는 것은 심리적으로 안전하고(psychologically safe) 협력적인 기관 환경을 조성할 수 있습니다(foster) [11, 12].

 

그럼에도 불구하고(Nonetheless), 실제 현장에서의 공동 창작 실행(implementation of co-creation in practice)은 몇 가지 난관들로 가득 차 있습니다(fraught with some challenges).

  • 과정-성과 모델(Process-Outcome Model) [13]은 많은 공동 창작 이니셔티브가 최종 성과(final outcomes) (예: 교육과정 변경)에만 초점을 맞추는 반면, 공동 창작 과정 자체를 형성하는 미묘한(nuanced) 대인 관계 및 제도적 역학(interpersonal and institutional dynamics)은 소홀히 한다고(neglecting) 설명합니다.
    • 예를 들어(For instance), 교수진은 통제권을 포기하는 데(relinquishing control) 불편함(discomfort)을 겪을 수 있는 반면,
    • 학생들은 전문성과 자원의 부족(lack of expertise and resources)으로 인해 교육과정 설계 및 의사결정 과정에 의미 있게 참여하는 데(engage meaningfully) 준비되지 않았거나(unprepared) 주저한다고(hesitant) 느낄 수 있습니다 [9, 14].
  • 최근의 주제 범위 문헌 고찰(scoping review)은 학생들이 종종 진정한 설계 파트너(genuine design partners)가 아닌 데이터 소스(data sources)로만 위치지어지며, 이는 포용(inclusion), 권한 부여, 상호 학습의 목표를 약화시키는(undermine) 유사 파트너십(pseudo-partnerships)을 초래한다고 강조합니다(highlights) [8].
  • 게다가(Furthermore), 시간 제약(time constraints), 모호한 기대(ambiguous expectations), 파트너십 방법론에 대한 제한된 훈련(limited training)과 같은 장애물(obstacles)은 공동 창작 이니셔티브의 깊이와 지속 가능성(depth and sustainability)을 저해할 수 있습니다(hinder) [3].
  • 더욱이(Moreover), 공동 창작은 종종 시간, 세심한 계획(meticulous planning), 그리고 물류적 지원(logistical support)에 대한 상당한 투자(significant investment)를 필요로 합니다.
  • 공동 창작된 콘텐츠의 유용성(utility)은 그것이 얼마나 효과적으로 평가되고(evaluated), 보급되며(disseminated), 교육과정에 통합되는지(integrated)에 달려 있으며(hinges on); 이러한 과정들은 까다롭고(demanding) 시간이 많이 걸립니다(time-consuming). 종합적으로(Collectively), 이러한 과제들은 공동 창작 과정의 품질뿐만 아니라 그 결과물의 적절성(relevance)까지 훼손할 수 있습니다(compromise).

AI는 교육 이해관계자 간의 교육 공동 창작에 있어 과정 및 성과와 관련된 과제(process- and outcome-related challenges)를 모두 해결하는 데(addressing) 중요한 역할(significant role)을 할 수 있습니다. AI는 공동 창작 이니셔티브 동안 의견을 제공하는(providing input) 별개의 파트너(distinct partner)가 될 잠재력을 가질 수 있지만; 이 가이드(guide)는 인간 간의 공동 창작을 촉진하는(facilitating co-creation between humans) 역할에 초점을 맞춥니다. 여기서 AI는 복잡한 과업을 관리하는 데(managing complex tasks) 능숙하면서도(adept at) 창의성(creativity) 및 감성 지능(emotional intelligence)과 같은 필수적인 인간적 자질(essential human qualities)을 향상시키는 귀중한 파트너(valuable partner)가 될 수 있습니다 [15, 16]. 포용적인 접근 방식을 조성하고(fostering an inclusive approach), 인간의 촉진을 장려하며(encouraging human facilitation), 데이터 기반 관행을 활용함으로써(leveraging data-informed practices), AI는 교육 환경 내에서 공동 창작의 활용과 보급(utilization and dissemination)을 개선할 수 있습니다. 그럼에도 불구하고(Nevertheless), AI의 통합은 중요한 우려(important concerns)를 제기할 수 있으며, 이는 기술적 도구가 진정한 파트너십(authentic partnerships)의 기본 요소(foundational elements)를 대체하는 것이 아니라(not supplant) 보완하도록(complement) 보장하기 위한 사려 깊은 접근(thoughtful approach)의 필요성을 강조합니다. 이 가이드는 공동 창작 노력을 강화하는 데 있어 AI의 잠재적 유용성(potential utility)을 탐구하고(explores), 조직 내 교육 관행의 협력적 개발(collaborative development)에 AI를 활용하고자 하는(seeking to leverage) 교육자 및 기관 리더를 위한 실용적인 권장 사항(practical recommendations)을 제공합니다. 더 나아가, 이는 AI를 공동 창작 과정에 효과적으로 통합하기 위한 중요한 고려 사항(crucial considerations)을 논의합니다.

 

공동 창작에서 AI 활용하기 (Leveraging AI in co-creation)

 

최근 출판된(recently published) 우리의 'Twelve Tips' 논문(article)에서, 우리는 HPE에서의 공동 창작에 대한 구조적이고 실용적인 접근 방식(structured and practical approach)을 개략적으로 설명했으며(outlined), 이는 준비(preparation), 실행(conduction), 후속 조치(follow-up)의 세 가지 핵심 단계(key phases)로 구성되어 있습니다(organized across) [17]. 다음 섹션에서는(In the following section) 공동 창작의 과정과 성과(processes and outcomes) 모두를 향상시키기 위해(enhance) AI가 이 세 가지 단계 각각에 어떻게 실질적으로 통합될 수 있는지(practically integrated) 탐구합니다(explore). HPE에서 공동 창작의 다양한 단계를 촉진하는 데(facilitating) 있어 AI의 포괄적인 역할(overarching role)은 관련 예시(relevant examples)와 함께 그림 1(Figure 1)에 묘사되어 있습니다(illustrated).

 

그림 1. 공동 창작의 세 단계(준비, 실행, 후속 조치) 전반에 걸친 AI의 촉진 역할(facilitating roles)을 위한 팁과 뒷받침하는 예시들(supporting examples). 전체 크기 표시(Display full size)

 

[상단 프로세스 바]

  • 공동 창작 과정 (Co-creation Process)
  • 공동 창작 성과 (Co-creation Outcomes)

1. 준비 단계 (Preparation Phase)

[1-1] 모집 및 오리엔테이션 강화 (Enhancing recruitment & orientation)

  • 참여자 입력으로부터 안건 생성 (Generate agendas from participant input).
  • 토론을 위한 가이드 질문 초안 작성 (Draft guiding questions for discussion).
  • 실제적 시나리오 생성 (Generate authentic scenarios).

[1-2] 공동 창작 안건 설계 및 계획 지원 (Supporting co-creation agenda design & planning)

  • 설문조사 생성 및 분석 촉진 (Facilitate creating & analyzing surveys).
  • 분석을 통한 팀 구성 최적화 (Optimize team composition through analytics).
  • 사용자 요구에 맞춘 맞춤형 콘텐츠 초안 작성 (Draft customized content to the users needs).

[1-3] 공동 창작 계획의 시범 운영 및 정제 (Piloting and refining co-creation plans)

  • 초안 자료에 대한 반응 시뮬레이션 (Simulate responses to draft materials).
  • 시범 운영 중 행동 데이터 수집 및 분석 (Collect and analyze behavioral data during pilots).

2. 실행 단계 (Conduction Phase)

[2-1] 브레인스토밍 및 아이디어 생성 촉진 (Facilitating brainstorming & idea generation)

  • 심리적 안전감 조성 (Foster psychological safety).
  • 인지적 협력자로 활동 (Act as a cognitive collaborator).
  • 익명 아이디어 기여 가능화 (Enable anonymous idea contributions).
  • 공동 창작에서 주도적 참여자로 활동 (Act as proactive participant in co-creation).

[2-2] 권력 역학 문제 해결 및 자신감 구축 (Addressing power dynamics & building confidence)

  • 익명성을 통한 위계 완화 (Reduce hierarchies through anonymity).
  • 안전한 아이디어 표현 촉진 (Facilitate safe expression of ideas).

[2-3] 공유된 의사결정 지원 (Supporting shared decision-making)

  • 의사결정을 안내하기 위해 그룹 입력 종합 (Synthesize group input to guide decisions).
  • 합의 조성을 위해 트레이드오프 시각화 (Visualize trade-offs to foster consensus).

[2-4] 공동 창작된 콘텐츠의 기록 지원 (Supporting documentation of co-created content)

  • 이야기 전사 및 포착 (Transcribe and capture narratives).
  • 핵심 통찰력을 강조하기 위해 토론 요약 (Summarize discussions to highlight key insights).
  • 협력적 기여를 구조화하고 태그 지정 (Structure and tag collaborative contributions).

3. 후속 조치 단계 (Follow-up Phase)

[3-1] 공동 창작 과정 및 성과 평가 지원 (Supporting evaluation of co-creation processes & outcomes)

  • 파트너십 내 감정과 역학 분석 (Analyze emotions and dynamics in partnerships).
  • 디브리핑 중 성찰적 피드백 유도 (Prompt reflective feedback during debriefings).
  • 공동 창작 성과 요약 및 시각화 (Summarize and visualize co-creation outcomes).

[3-2] 공동 창작 성과 보급 증강 (Augmenting dissemination of co-creation outcomes)

  • 다양한 플랫폼을 사용하여 맞춤형 콘텐츠 생성 (Generate tailored content using diverse platforms).
  • 대상 청중에게 메시지 조정 (Adapt messaging to target audiences).
  • 전략을 알리기 위해 참여도 추적 (Track engagement to inform strategy).

[3-3] 공동 창작 성과의 통합 지원 (Supporting integration of co-creation outcomes)

  • 교육과정 및 표준과의 공동 창작 성과 일치성 평가 (Assess alignment of co-creation outcomes with curriculum and standards).
  • 진화하는 학습자 요구를 위해 교육과정 정제 (Refine curriculum for evolving learner needs).

그림 1 캡션 (Figure 1 Caption): 그림 1. 공동 창작의 세 단계(준비, 실행, 후속 조치) 전반에 걸친 AI의 촉진 역할(facilitating roles)을 위한 팁과 뒷받침하는 예시들(supporting examples).

 

 

준비 단계에서의 AI 사용 (Use of AI in the preparation phase)

 

모집 및 오리엔테이션 강화 (Enhancing recruitment and orientation)

  • 다양하고 적합한 참여자(diverse and suitable participants)를 모집하는 것은 성공적인 공동 창작 활동에 필수적입니다(essential). 모집 과정은 참여를 극대화하기 위해(maximize participation) 자발적이어야 하며(voluntary), 이는 잠재적 공동 창작자(potential co-creators)와 촉진자(facilitators)의 의향을 파악하기 위한(gauge the willingness) 간단한 온라인 설문조사(brief online survey)를 통해 달성될 수 있습니다 [17].
  • AI 도구들(AI 도구 용어집은 Box 1 참조)은 이 과정을 다양한 방식으로 간소화할 수 있습니다(simplify). 예를 들어(For example), 이들은 모집 설문조사나 양식(forms)의 작성을 촉진하고(facilitate) 자연어 처리(natural language processing, NLP) 도구를 사용하여 응답 분석(analysis of responses)자동화할 수 있습니다(automate).
  • 이러한 시스템은 또한 개방형(open) 또는 폐쇄형 질문(closed-ended questions)을 통해 접수된 응답을 분석하고 지원자의 목표(applicants’ goals)와 프로젝트의 목표(project’s objectives) 간의 일치성(alignment)을 식별할 수 있습니다(identify) [18]. 공동 창작 이니셔티브가 이전에 수행된 경우(In cases where... previously conducted), 기계 학습 모델(machine learning models)은 과거의 참여 데이터(historical participation data) (예: 참여 수준(engagement levels), 기여 품질(contribution quality))를 분석하여 참여자와 촉진자 모두에 대한 증거 기반 모집(evidence-informed recruitment)을 지원할 수 있습니다 [19].
  • 참여자를 선발한 후(Upon selecting participants), 적응형 학습 모듈(adaptive learning modules) 및 지능형 챗봇(intelligent chatbots)과 같은 AI 기반 오리엔테이션 도구(AI-powered orientation tools)맞춤형 온보딩 경험(customized onboarding experiences)을 제공할 수 있습니다(deliver). 이러한 기술들은 사용자의 사전 지식(prior knowledge), 역할(roles), 그리고 학습 선호도(learning preferences)를 평가하여(evaluate) 공동 창작된 콘텐츠를 동적으로 조정합니다(dynamically tailor).
  • 게다가(Furthermore), 이들은 효과적인 협업을 위한 공유된 기반(shared foundation)을 구축하기 위해(establish) 실시간(real-time), 대화형 안내(interactive guidance)를 제공합니다 [20]. 참여자와 촉진자의 사전 지식 수준과 선호도에 적응함으로써(adapting to), 이러한 AI 도구들은 모든 참여 이해관계자(participating stakeholders)를 위한 포용적인 온보딩 경험(inclusive onboarding experience)을 만드는 데 도움을 줄 수 있습니다 [21].

 

공동 창작 안건 설계 및 계획 지원 (Supporting co-creation agenda design and planning)

  • 상세하고 현실적인 안건(detailed and realistic agenda)을 작성하는 것은 효과적인 공동 창작 활동에 필수적인데, 왜냐하면 즉흥적인 임기응변(spontaneous improvisations)은 어려울 수 있기 때문입니다. 구조화된 계획(structured plan)은 촉진자가 시간을 관리하고(manage time), 역할을 배정하며(assign roles), 그룹 간의 일치성을 유지하고(maintain alignment), 의미 있는 토론을 이끄는 데(guide meaningful discussions) 도움이 됩니다.
  • 맞춤 설계된 AI 봇(Custom-designed AI bots)은 온라인 설문조사(예: 학생 평가(student evaluations), 피드백, 또는 성찰(reflections))나 AI 통합 학습 관리 시스템(AI-integrated LMS)을 통한 포럼 토론 게시판(forum discussion boards)의 사전 입력 정보(preliminary inputs)를 분석함으로써 촉진자가 포용적이고 적절한 안건(inclusive and relevant agendas)을 준비하도록 도울 수 있습니다. 이 과정은 안건이 참여자의 관심사(interests)와 우려사항(concerns)에 기반하도록(grounded in) 보장합니다(ensures) [22].
  • 생성형 AI 도구(Generative AI tools)는 또한 가이드 질문(guiding questions), 성찰 프롬프트(reflection prompts)의 초안을 작성하거나 토론을 자극하는 데(stimulate) 도움이 되는 문서를 준비하는 것을 보조할 수 있습니다(assist). AI 지원을 구현할 계획인 촉진자들은 더 나은 AI 피드백을 촉진하기 위해 아이디어 구상(ideation)정제(refinement) 단계를 위한 별도의 프롬프트(separate prompts)와 인터페이스를 활용할 수 있습니다(utilize) [23].
  • AI는 추가적으로(additionally) 현실적인 사례 연구(realistic case studies), 시나리오 기반 프롬프트(scenario-based prompts), 그리고 시청각 보조 자료(audiovisual aids)를 생성함으로써 협력적 활동(collaborative activities)을 설계하는 데 기여할 수 있습니다. 이것들은 대면(face-to-face) 공동 창작 세션에서 사용되거나 가상(virtual) 또는 하이브리드 대화형 도구(hybrid interactive tools)에 삽입되어(embedded), 다양한 양식(modalities)에 걸쳐 참여(engagement)를 보장할 수 있습니다 [24].

공동 창작 계획의 시범 운영 및 정제 (Piloting and refining co-creation plans)

  • 공동 창작 세션을 시범 운영하는 것(Piloting)은 본 활동(main activity) 전에 잠재적인 물류적(logistical), 기술적(technical), 또는 참여 관련 문제(engagement-related issues)를 식별하고 해결하는 데(identifying and addressing) 있어 필수적인 단계(vital step)입니다 [17]. 이는 촉진자가 세션 안건을 정제하고(refine), 디지털 도구를 테스트하며, 지침을 명확히 할 수 있게 하여(clarify instructions), 결과적으로 원활하고 생산적인(smooth and productive) 공동 창작 과정의 가능성을 높여줍니다(increasing the likelihood).
  • AI는 초안 자료(draft materials)에 대한 참여자 반응을 시뮬레이션(simulating)하여 이 단계를 지원할 수 있으며, 모호함(ambiguities)과 낮은 참여가 예상되는 영역(areas of low engagement)을 감지하는 데 도움을 줄 수 있습니다.
  • 대면 파일럿 환경(in-person pilot settings)에서, AI 강화 도구(AI-enhanced tools) (예: 웨어러블 센서(wearable sensors) 또는 모바일 추적 앱)는 과제 수행 시간(time-on-task), 발언 순서 빈도(turn-taking frequency), 또는 발화 역학(speech dynamics)과 같은 관찰 데이터(observational data)를 수집할 수 있습니다.
  • 가상 환경(virtual environments)에서는, AI 주도 분석(AI-driven analytics) (예: 클릭스트림 데이터(clickstream data), 참여 히트맵(engagement heatmaps), 그리고 감성 분석(sentiment analysis))이 사용자 행동(user behaviour)과 상호작용 품질(interaction quality)에 대한 통찰력(insights)을 제공할 수 있습니다. 이러한 데이터 기반 통찰력(data-driven insights)은 안건, 자료, 촉진 전략의 반복적인 정제(iterative refinement)를 지원하며, 궁극적으로 더 매끄럽고 영향력 있는(seamless and impactful) 공동 창작 경험으로 이어집니다.

 

실행 단계에서의 AI 사용 (Use of AI in the conduction phase)

 

브레인스토밍 및 아이디어 생성 촉진 (Facilitating brainstorming and idea generation)

  • 자유로운 아이디어 생성(Free idea generation)은 공동 창작에서 필수적이며(vital), 심리적 안전감을 조성하는 것(fostering psychological safety)은 참여자들이 판단에 대한 두려움 없이(without fear of judgment) 다양하고 창의적인 기여(diverse and creative contributions)를 공유하도록 장려합니다(encourages). 이러한 개방성(openness)은 산출물의 질(quality of outputs)을 풍부하게 할 뿐만 아니라 참여자들의 자신감(confidence)과 동기(motivation)를 증진시켜(boosts), 그들이 가치 있게 여겨지고(feel valued) 공동 창작 과정에 몰입되어 있다고(invested) 느끼게 합니다 [25].
  • 공동 창작 세션에서, AI 도구는 인지적 협력자(cognitive collaborators)로 작용할 수 있습니다. 예를 들어(For instance), 아이디어 생성 플랫폼(idea generation platforms), 개념 매핑 도구(concept mapping tools), 그리고 AI 기반 작문 도우미(AI-powered writing assistants)는 참여자들이 생각을 정리하고(organize thoughts) 떠오르는 주제(emerging themes)를 시각화하는 데(visualize) 도움을 줄 수 있습니다 [6]. 이러한 도구들은 대면 환경(face-to-face setting)에서 스크린에 투사되거나(screen-projected) 인쇄될 수 있으며, 또는 온라인 플랫폼에 통합될 수 있습니다(integrated into).
  • 게다가(Moreover), 익명 기여(anonymous contributions)를 가능하게 함으로써(enabling), AI는 가상 및 대면 환경 모두에서의 브레인스토밍 세션 동안 학생들 사이의 포용성(inclusivity)과 동기(motivation)를 향상시키는 데 도움을 줄 수 있습니다. 예를 들어, 학생들은 소리 내어 말하는 것(speaking aloud)의 대안으로(alternative) 모바일 앱이나 온라인 양식을 통해 아이디어를 제출하도록 선택할 수 있으며, 이는 이후 AI를 사용하여 귀속 없이(without attribution) 군집화되고(clustered), 종합되며(synthesized), 제시될 수 있습니다.
  • 더 나아가(Furthermore), AI 기반 대화 시스템(AI-based dialogue systems)은 공동 창작 과정의 품질을 실시간으로(in real-time) 모니터링하고 평가하여 가치 있는 피드백(valuable feedback)을 제공하는 분석 기능(analytics features)으로 강화될 수 있습니다 [26,27].

권력 역학 문제 해결 및 자신감 구축 (Addressing power dynamics and building confidence)

  • 종종 고착된 권력 역학(entrenched power dynamics), 문화적 규범(cultural norms), 또는 인지된 전문성의 차이(perceived differences in expertise)에서 비롯되는(stemming from) 위계적 장벽(Hierarchical barriers)은 공동 창작에 있어 위협적일 수 있습니다(daunting). 그것들은
    • 동등한 참여(equal participation)를 저해하고(inhibit),
    • 열린 의사소통과 창의성을 억압하며(suppress),
    • 사고의 다양성(diversity of thoughts)을 줄이고,
    • 공동 창작 결과물에 대한 집단적 주인의식(collective ownership)을 약화시킬 수 있습니다(weaken) [7,28,29].
  • Healey와 Harrington [2]에 따르면, 파트너십과 학생 참여(student engagement)에 관한 학술 문헌(scholarly literature) 및 관행(practice)에서의 핵심 가치(key values)는 상호혜택(reciprocity), 신뢰(trust), 그리고 권한 부여(empowerment)를 포함합니다. 학제 간 팀(interdisciplinary teams) 내에서 다양한 입력(diverse input)을 촉진함으로써(fostering), AI는 협력에 대한 장벽(barriers to collaboration)을 완화하는 데(mitigate) 도움을 줄 잠재력을 가지고 있습니다. 예를 들어,
    • 대면 환경에서 익명 디지털 투표 도구(anonymous digital polling tools)는 학생들이 판단에 대한 두려움 없이 의견을 공유하도록 허용합니다.
    • 온라인 환경에서, AI 챗봇은 학생들이 사적으로(privately) 자신의 기여를 리허설(rehearse)하거나, 아이디어를 정제하고(refine), 또는 판단 없이 명확한 설명(clarification)을 구하도록 안전한 공간(safe space)을 제공합니다 [30].
    • 게다가, 기여를 익명화하고(anonymizing contributions) 참여할 수 있는 공평한 방법(equitable ways)을 제공함으로써, AI는 모든 형식(formats)에 걸쳐 심리적 안전감과 권한 부여를 촉진할 수 있습니다(promote).
    • 추가적으로(Additionally), 다국어 챗봇(multilingual chatbots) 및 실시간 언어 처리(real-time language processing)와 같은 도구들은 교차 언어 협업(cross-linguistic collaboration)을 촉진할 수 있습니다 [31].
    • 음성 인식(speech recognition), 텍스트 음성 변환(text-to-speech), 그리고 적응형 인터페이스(adaptive interfaces)를 포함한 보조 기술(Assistive technologies)은 과소대표된(under-represented) 학생들과 장애 학생들을 위한 접근성(accessibility)을 향상시킬 수 있습니다 [32].

공유된 의사결정 지원 (Supporting shared decision-making) 

  • 공유된 의사결정(Shared decision-making)은 공동 창작 과정의 모든 참여자 사이에서 주인의식(sense of ownership), 신뢰, 그리고 상호 존중(mutual respect)을 함양하기 때문에 공동 창작에 필수적입니다. 의사결정이 협력적으로 이루어질 때(made collaboratively), 기여자는 더 많이 참여하고(engaged) 동기부여되며, 이는 적절하고(relevant), 포용적이며(inclusive), 다양한 관점을 반영하는(reflective of diverse perspectives) 결과물(outcomes)로 이어집니다 [33].
  • AI는 그룹의 입력을 종합하고(synthesizing) 합의(consensus) 또는 의견 차이(divergence)를 식별함으로써 협력적 의사결정을 지원할 수 있습니다.
  • 대면 토론의 녹취록(transcripts)을 분석하든 온라인 플랫폼의 채팅 스레드(chat threads)를 분석하든, 감성 분석(sentiment analysis) 및 요약 도구(summarization tools)는 촉진자에게 참여자 관점에 대한 실시간 통찰력(real-time insights)을 제공합니다 [34].
  • 더욱이, 의사결정 지원 대시보드(decision-support dashboards)와 같은 AI 기반 시각적 도구는 트레이드오프(trade-offs)를 시각적으로 매핑하고, 해결되지 않은 질문(unresolved questions)을 강조하며(highlight), 증거를 제시하여(present evidence) 참여자들 간의 토론과 합의 형성(consensus building)을 자극할 수 있습니다(stimulate).
  • 공동 창작 양식(modality)에 따라, 이러한 시각 보조 자료(visual aids)는 물리적 보드디지털 스크린에 공유될 수 있습니다.
  • 생성형 AI 도구는 효율성(efficiency)과 확장성(scalability)을 제공하지만, 특히 문화적 감수성(cultural sensitivity)을 필요로 하거나 소외된 집단(marginalized groups)을 포함하는 맥락에서, 공동 창작에서 발생하는 복잡한 결정과 토론을 의도치 않게 지나치게 단순화(inadvertently oversimplify)할 수 있습니다. 그러한 경우, 인간의 감독(human oversight)을 통한 미묘한 이해(nuanced understanding)가 여전히 없어서는 안 됩니다(indispensable). 따라서, 풍부함(richness)과 다양성을 보장하기 위해 효과적인 인간-AI 협업(human–AI collaboration)을 촉진하는 것이 필수적입니다 [35].

공동 창작된 콘텐츠의 기록 지원 (Supporting documentation of co-created content) 

  • 아이디어와 관점(viewpoints)을 교육 설계(educational design)에 통합하는 것은 토론 중에 참여자의 이야기(narratives)가 얼마나 포괄적으로 포착되고 기록되는지(captured and documented)에 크게 의존합니다(heavily dependent upon). 교육 혁신(educational innovations)에 대한 정확하고 포괄적인 기록(documentation)은 투명성(transparency), 반복적 개발(iterative development), 그리고 지식 전달(knowledge transfer)을 위해 필수적입니다 [17].
  • 그러나 실시간으로 여러 토론 스레드(discussion threads), 결정 사항, 그리고 근거(rationales)를 추적하는 것(keeping track of)은 압도적일 수 있습니다(overwhelming). AI 도구는 공동 창작 과정 동안 이러한 부담(burden)을 상당히 완화할 수 있습니다(significantly ease). 예를 들어(For instance),
    • AI 기반 전사 서비스(AI-powered transcription services)는 공동 창작 세션의 오디오 및/또는 비디오 녹화본과 현장/서기 노트(field/scribe notes)의 녹취록을 자동으로 생성할 수 있으며(automatically generate transcripts), 이는 나중에 대규모 언어 모델(large language models, LLM)을 사용하여 요약되어 주요 결정 사항, 떠오르는 주제, 그리고 해결되지 않은 문제들을 강조할 수 있습니다 [23].
    • NLP 도구는 실행 항목(action items)을 추출하거나 결정을 설계 요소(design elements)에 매핑하여, 설계 과정의 구조화된 기록(structured recording)을 도울 수 있습니다(aiding).
    • 더 나아가, AI 통합 플랫폼은 협력적으로 개발된 아이디어에 대한 노트를 태그하고(tag), 정리하며(organize), 저장하여, 아이디어의 진화(evolution of ideas)를 추적 가능하게(traceable) 만들 수 있습니다. 수동 작업량(manual workload)을 줄임으로써, AI는 촉진자가 행정적 과업(administrative tasks)보다는 참여(engagement)에 더 집중할 수 있게 하는 동시에(enables), 공동 창작 과정이 철저하고(thoroughly) 정확하게 포착되도록 보장합니다 [36].

 

후속 조치 단계에서의 AI 사용 (Use of AI in the follow-up phase)

 

공동 창작 과정 및 성과 평가 지원 (Supporting evaluation of co-creation processes and outcomes) 

  • 학생-교직원 파트너십 과정(student–staff partnership processes)에 대한 협력적 성찰(Collaborative reflection)은 공동 창작의 성공에 있어 중요합니다(crucial) [13]. 이는 참여자들이 새로운 역할에 적응하고(adjust to new roles), 신뢰를 구축하며(build trust), 서로의 관점(perspectives)에 대한 더 깊은 이해를 발전시키는 데(develop a deeper understanding) 도움을 줍니다 [37,38].
  • 촉진자의 현장 노트(field notes)나 토론 녹취록(discussion transcripts)을 통해 포착된(captured) 파트너십 역학(partnership dynamics)의 주요 특징들(key features) (즉, 감정(emotions), 친밀도(familiarity), 아이디어에 대한 반응(responses to ideas))은 이 성찰을 향상시키기 위해 NLP 도구에 의해 분석될 수 있습니다(analysed).
  • 우리는 이전에 투명성(transparency), 정확성(accuracy), 형평성(equity)을 보장하기 위해 공동 창작 세션 직후 이해관계자들을 디브리핑(debriefing)할 것을 권장했습니다(recommended) (참조 Tip 11 in [17]). AI는 중요한 순간(key moments)에 미세 성찰(micro-reflections)을 유도하고(prompting), 명확성(clarity), 참여도(engagement), 또는 만족도(satisfaction)에 대한 참여자 평가를 자동으로 요약함으로써(automatically summarizing) 이러한 디브리핑을 증강할 수 있습니다(augment).
  • 이러한 적시 분석(just-in-time analytics)은 시의적절한 평가(timely evaluation)와 조정(adjustment)을 지원하며, 지속적인 개선 문화(culture of continuous improvement)를 강화합니다(reinforcing).
  • 추가적으로(Additionally), AI는 상호작용 패턴 분석(interaction pattern analysis) (예: 발언 시간(speaking time), 어조(tone), 또는 발언 순서 교대(turn-taking))을 통해 과소대표된 목소리(underrepresented voices)를 감지하고(detect) 실시간으로 촉진자에게 알릴 수 있습니다(alert).
  • AI는 또한 질적 데이터(qualitative data)로부터 핵심 주제(key themes), 감성(sentiments), 그리고 합의점(consensus points)을 추출함으로써(extracting) 공동 창작 성과(co-creation outcomes)의 평가를 지원하는 데 중요한 역할(significant role)을 할 수 있습니다. 그런 다음 AI 기반 시각화 플랫폼(AI-powered visualization platforms)은 대화형 대시보드(interactive dashboards)나 요약 보고서(summary reports)를 통해 결과를 생성하고 제시하는 데(generate and present findings) 사용될 수 있습니다.

공동 창작 성과 보급 증강 (Augmenting dissemination of co-creation outcomes) 

  • 공동 창작 과정의 완료(completion) 후, 다음 단계는 성과를 보급하는 것(disseminate)입니다. 공동 창작된 성과(예: 코스(courses), 학습 자원(learning resources), 평가(assessments), 정책(policies))의 보급은 정보 공유(information sharing)만을 목적으로 하는 것이 아니라(not only aimed at), 공동 창작의 가치를 받아들이기를(embrace) 꺼리는(reluctant) 이해관계자들 사이의 태도 변화(attitudinal change)를 불러일으키는 것을 목표로 하며, 이를 통해 더 지속 가능하고(sustainable) 오래 지속되는 시스템적 변화(long-lasting systemic change)를 촉진합니다(fostering) [7,9,39].
  • AI는 다양한 공식 플랫폼(formal platforms) (즉, 대학 소식지(university newsletters), 학회 기고(conference contributions), 대학/학교 웹사이트) 및 비공식 플랫폼(informal platforms) (즉, WhatsApp, Twitter, LinkedIn, Facebook, 팟캐스트)에 적합한 맞춤형 요약(tailored summaries), 시각적 초록(visual abstracts), 또는 멀티미디어 콘텐츠(multimedia content) (예: 짧은 비디오, 인포그래픽, 팟캐스트 대본)를 자동으로 생성함으로써 공동 창작 성과의 보급을 지원할 수 있습니다.
  • 자연어 생성 도구(Natural language generation tools)는 다양한 청중(audiences) (학생, 교수진, 또는 행정가와 같은)에 맞춰 메시지를 조정함으로써(adapting messaging) 도달 범위와 영향력(reach and impact)을 더욱 넓힐 수 있습니다(broaden). AI 기반 분석(AI-powered analytics)은 또한 플랫폼 전반에 걸친 참여(engagement)를 추적하고(track) 어떤 형식(formats)이나 채널(channels)이 공동 창작 성과에 대한 정보의 이해와 수용(uptake)을 촉진하는 데 가장 효과적인지 식별할 수 있습니다(identify).

공동 창작 성과의 통합 지원 (Supporting integration of co-creation outcomes) 

  • 공동 창작된 아이디어를 교육과정에 성공적으로 통합(Successful integration)하는 것은 학생과 교수진의 협력적 노력(collaborative efforts)이 의미 있는 교육적 변화(meaningful educational change)로 전환되도록(translate into) 보장하는 데 필수적입니다. 실행(implementation) 없이는, 공동 창작은 교육 개선의 원동력(driver)이라기보다는 상징적인 활동(symbolic exercise)이 될 위험이 있습니다(risks becoming).
  • 공동 창작 성과의 통합은 종종 제한적인 교수진의 지지(limited faculty buy-in), 실행을 지원할 자원의 부족(lack of resources), 또는 기관 목표와의 불일치(misalignment)와 같은 과제들(challenges)에 직면합니다(encounters) [11]. AI는 공동 창작된 콘텐츠미리 정의된 교육과정 목표(predefined curricular goals)일치성(alignment)을 평가하고(assessing) 이를 지역적 또는 글로벌 표준(local or global standards)과 비교함으로써 이 통합 과정을 지원할 수 있습니다 [40].
  • 예를 들어, AI 분석은 공동 창작된 콘텐츠를 검토하여(review) 기존 교육과정 프레임워크(existing curriculum frameworks)와의 중복(overlaps), 격차(gaps), 또는 불일치(misalignments)를 식별하고, 미리 정의된 목표나 요구사항(requirements)과 더 잘 일치하도록 수정(revisions)을 제안할 수 있습니다(suggest). 이러한 AI 분석 접근 방식은 또한 학생들의 변화하는 요구(evolving needs)에 대한 교육과정 일치성의 지속적인 모니터링(continuous monitoring)을 위해 사용될 수 있습니다. 이러한 데이터 기반 접근 방식(data-driven approach)은 수동 작업량(manual workload)을 상당히 줄이면서도(significantly reducing) 증거 기반 의사결정(evidence-based decision-making), 적응성(adaptability), 그리고 지속 가능성(sustainability)을 위한 견고한 기반(solid foundation)을 제공합니다 [41].

요약하자면(In summary), AI는 공동 창작 이니셔티브의 세 단계(준비, 실행, 후속 조치) 각각에 효과적으로 통합될 수 있으며(effectively integrated), 따라서 공동 창작 과정과 그 결과물 모두를 향상시킵니다(enhancing). 이 각 단계에서 사용될 수 있는 다양한 도구들(array of tools)이 존재합니다. 표 1(Table 1)에서, 우리는 세 단계 전반에 걸친 AI 도구의 몇 가지 예시와 그 적용(applications)을 언급합니다. 독자들이 이러한 예시들이 도움이 된다고(helpful) 느낄 수 있지만, 우리는 시간이 지남에 따라 AI 도구의 빠른 진화와 확장(rapid evolution and expansion)을 예상하며(anticipate), 이는 제공된 예시들을 가까운 미래에 쓸모없게 만들 수도 있습니다(render... obsolete).

 

표 1. 공동 창작의 단계 전반에 걸친 AI 도구의 개요(Overview) 및 가능한 적용(possible applications).

 

표 1. 공동 창작 단계 전반에 걸친 AI 도구 및 가능한 적용 개요 (Overview of AI tools and their possible applications across the phases of co-creation)

AI 도구 (AI tools) 준비 단계 (Preparation phase) 실행 단계 (Conduction phase) 후속 조치 단계 (Follow-up phase)
자연어 처리 (NLP) 도구

(Natural language processing tools)

(예: Qualtrics Text iQ, MonkeyLearn, Google NLP, OpenAI GPT)
• 목표를 프로젝트 목적과 일치시키기 위해 설문조사 응답을 분석함 (Analyse survey responses to align goals with project objectives)

• 안건에 정보를 제공하기 위해 포럼 입력을 처리함 (Process forum inputs to inform the agenda)
 토론의 감성 분석 (Sentiment analysis of discussions)

 공유된 의사결정을 위해 기여를 분류함 (Classify contributions for shared decision-making)
• 감정과 관점을 파악하기 위해 녹취록/현장 노트를 분석함 (Analyse transcripts/field notes for emotions and perspectives)

 성찰 요약 (Summarize reflections)

 주제 및 감성 추출 (Extract themes and sentiments)
기계 학습 모델

(Machine learning models)

(예: XGBoost, NVivo, MAXQDA, MonkeyLearn, OpenAI GPT)
• 적합한 참여자와 촉진자를 예측하기 위해 과거 데이터를 분석함 (Analyse historical data to predict suitable participants and facilitators)  과소대표된 목소리와 상호작용 패턴을 식별함 (Identify underrepresented voices and interaction patterns); 질적 데이터에서 주제를 감지함 (detect themes from qualitative data)
적응형 학습 모듈/지능형 챗봇

(Adaptive learning modules/intelligent chatbots)

(예: Knewton Alta, LearnWorlds, Custom GPT Bots)
• 지식 수준과 선호도에 맞춰 온보딩 콘텐츠를 맞춤화함 (Customize onboarding content to knowledge levels and preferences) • 참여자에게 안전한 리허설 공간과 익명 지원을 제공함 (Offer safe rehearsal spaces and anonymous support to participants)  미세 성찰을 유도함 (Prompt micro-reflections)

 세션 후 디브리핑을 지원함 (Support post-session debriefings)
생성형 AI

(Generative AI)

(예: ChatGPT, Claude)
 가이드 질문, 사례 연구, 성찰 프롬프트 초안 작성 (Draft guiding questions, case studies, and reflection prompts)

• 안건 계획을 위한 시청각 보조 자료 설계 (Design audiovisual aids for agenda planning)

• 안건 계획에 정보를 제공하기 위해 사전 입력 정보를 분석함 (Analyse preliminary inputs to inform agenda planning)
• 브레인스토밍 및 토론에서 대화형 공동 창작자 또는 시뮬레이션된 이해관계자로 활동함 (Act as dialogic co-creators or simulated stakeholders in brainstorming and discussions) • 보급을 위한 맞춤형 요약, 시각적 초록, 콘텐츠 생성 (Generate tailored summaries, visual abstracts, and content for dissemination)
AI 통합 학습 관리 시스템 설문조사 플랫폼

(AI-integrated learning management system survey platforms)

(예: Canvas, Blackboard, Brightspace)
• 안건 계획에 정보를 제공하기 위해 사전 입력 정보를 분석함 (Analyse preliminary inputs to inform agenda planning)  익명 브레인스토밍 입력을 수집하고 종합함 (Collect and synthesize anonymous brainstorming input)  참여도 및 보급의 형식 효능을 추적함 (Track engagement and the format efficacy of dissemination)
AI 기반 작문 도우미/개념 매핑 도구

(AI-powered writing assistants/concept mapping tools)

(예: OpenAI GPT, Miro, Notion, MindMeister)
• 참여자들이 아이디어를 정리하고, 콘텐츠를 생성하며, 주제를 시각화하도록 도움 (Help participants organize ideas, generate content, and visualize themes)
AI 기반 시뮬레이터/분석 대시보드

(AI-powered simulators/analytics dashboards)

(예: Tableau, QualtricsXM, IntelliBoard)
• 시범 테스트에서 모호함이나 참여 문제를 식별하기 위해 응답을 시뮬레이션함 (Simulate responses to identify ambiguities or engagement issues in pilot testing)  실시간 피드백을 제공하고 토론의 질을 분류함 (Provide real-time feedback and classify the quality of the discussion)  평가 결과를 시각화함 (Visualize evaluation findings)

 대화형 요약을 제시함 (Present interactive summaries)
AI 주도 전사 서비스

(AI-driven transcription services)

(예: Otter.ai, MS Teams, Zoom AI)
• 실시간으로 토론 내용을 기록함 (Document discussion content in real time) • 성찰 및 보고를 위한 녹취록 생성 (Create transcripts for reflection and reporting)

 핵심 시사점 추출 (Extract key takeaways)
AI 기반 시각적 분석 도구

(AI-based visual analytics tools)

(예: Tableau, Altmetric, PlumX)
• 트레이드오프와 합의를 보여주기 위해 의사결정 지원 대시보드를 표시함 (Display decision-support dashboards to show trade-offs and consensus)  보급 지표 및 참여 대시보드를 제시함 (Present dissemination metrics and engagement dashboards)

 

 

공동 창작에서의 AI에 대한 이론적 프레임워크 (Theoretical frameworks of AI in co-creation)

 

이 섹션에서는(In this section), 앞서 설명한 공동 창작에서의 AI 활용을 위한 실용적인 접근 방식(practical approaches)에 대한 이해를 지원할 수 있는 두 가지 교육적 프레임워크(educational frameworks)를 개략적으로 설명합니다:

 

  • (1) 대체, 증강, 변형 및 재정의(Substitution, Augmentation, Modification, and Redefinition, SAMR) 모델, 그리고
  • (2) 기술-조직-환경(Technology-Organization-Environment, TOE) 프레임워크.

 

이 두 이론적 프레임워크는 함께(Together), 이전에 논의된 실용적 전략들에 개념적 명확성(conceptual clarity)과 지지를 제공합니다. 이 프레임워크들은 또한 공동 창작에서의 AI 통합이 특정 맥락에 민감해야 하며(sensitive to the specific context) 건전한 이론적 원칙(sound theoretical principles)에 기반해야 함(grounded in)을 보여줍니다(illustrate).

 

SAMR 모델 (The SAMR model) 

 

SAMR 모델은 공동 창작 과정에 AI를 통합하기 위한 실용적이고 과업 중심적인 렌즈(practical, task-focused lens)를 제공합니다. 원래 교육에서의 기술 활용을 평가하기 위해 개발된(Originally developed to evaluate) SAMR은 기술 통합의 네 가지 점진적 단계(four progressive levels)를 설명합니다: 대체(Substitution), 증강(Augmentation), 변형(Modification), 재정의(Redefinition) [42]. 이 단계들은 학습 활동의 기본적인 향상(basic enhancement)에서부터 완전한 변화(complete transformation)로의 이동(shift)을 반영합니다. 아래에서, 우리는 SAMR 모델의 각 단계를 간략히 설명하고 공동 창작 과정을 지원하고 변화시키기 위해 AI 도구가 그에 따라 어떻게 적용될 수 있는지 예시를 듭니다(illustrate).

 

대체(Substitution) 단계에서,

 

  • 기술은 과업 자체를 변경하지 않고(without altering the task itself) 전통적인 도구에 대한 직접적인 대체물(direct replacement)로 기능합니다.
  • 공동 창작의 맥락에서, AI는 활동이 수행되는 방식을 근본적으로 바꾸지 않으며(does not fundamentally change); 단지 인간의 기능을 자동화된 것(automated one)으로 대체할 뿐입니다. 예를 들어(For instance),
    • 실행 단계(conduction phase) 동안, AI는 토론을 전사함으로써(transcribing) 서기(note-taker) 역할을 할 수 있습니다.
    • 유사하게(Similarly), 후속 조치 단계(follow-up phase)에서, AI 기반 전사 도구(AI-driven transcription tools)는 공동 창작 세션을 기록하는(document) 수동 노력을 대체하여, 속도와 효율성(speed and efficiency) 면에서 상당한 이득(significant gains)을 제공할 수 있습니다.
  • 이러한 예시들은 AI가 공동 창작 활동에서 인간의 노동(human labor)을 어떻게 대체할 수 있는지 보여주며, 이는 원래의 과업 구조(original task structure)를 유지하면서도 실질적인 시간 절약(substantial time savings)을 가져옵니다.

 

 

증강(Augmentation) 단계에서,

 

  • 기술은 기능적 개선(functional improvements)을 제공합니다. 이는 공동 창작에서 AI를 사용하는 것이 참여자들이 AI 없이는 할 수 있었던 것보다 과업을 더 효과적으로 수행할 수 있게 함을 의미합니다 [43].
  • AI는 학생과 교수진이 협력적으로 브레인스토밍하고, 방대한 양의 입력(large volumes of input)을 종합하며, 초기 초안(early drafts)을 정제하도록 가능하게 함으로써 아이디어 생성 및 정제(idea generation and refinement)를 지원할 수 있습니다. 이는 공동 창작 과정을 간소화할(streamlines) 뿐만 아니라 콘텐츠 개발과 관련된 인지적 및 언어적 장벽(cognitive and linguistic barriers)을 줄임으로써 과정을 더 포용적(inclusive)으로 만듭니다.
  • 또한(In addition), AI는 공동 창작된 자료의 명확성(clarity), 어조(tone), 논리적 일관성(logical consistency)과 같은 측면에 대해 실시간 피드백(real-time feedback)을 촉진하여(facilitates), 참여자들이 추가적인 개입(additional intervention) 없이도 더 빠르고 자신감 있게 반복 수행(iterate)할 수 있도록 합니다.
  • 마지막으로, AI는 자동 번역(automated translation), 음성-텍스트 변환(speech-to-text conversion), 콘텐츠 단순화(content simplification)와 같은 도구를 제공함으로써 공동 창작에서의 접근성과 형평성(accessibility and equity)을 증강합니다. 이러한 기능들은 언어 장벽이나 학습의 어려움(learning difficulties)을 가진 사람들을 포함한 다양한 이해관계자들의 더 폭넓은 참여(broader participation)를 가능하게 하며, 이를 통해 더 공평하고 대표성 있는 협력(equitable and representative collaboration)을 지원합니다.

 

 

변형(Modification) 단계에서,

  • AI는 공동 창작 과정의 상당한 재설계(significant redesign)를 지원하여, 사용자가 통상적으로는 어렵거나 비실용적인 목표를 달성할 수 있게 합니다(enabling users to achieve objectives).
  • 예를 들어, 오리엔테이션 세션 동안, AI는 공동 창작자가 자신의 사전 지식(prior knowledge), 관심사, 또는 의도된 기여(intended contributions)와 일치하는 개인화된 읽기 자료(personalized reading materials)를 식별하도록 도울 수 있습니다 [42,43]. 이러한 목표 지향적 지원(targeted support)은 준비 과정(preparation process)을 변화시키고 콘텐츠에 대한 참여(engagement)를 향상시킵니다. 이러한 목표 지향적 비계(targeted scaffolding)는 참여자의 준비도(readiness)를 높이고 참여를 심화시킵니다(deepens).
  • 실행 단계 동안, 실시간 군집화 및 종합 알고리즘(real-time clustering and synthesis algorithms)은 브레인스토밍 세션 중 참여자의 입력을 처리하고 정리할 수 있어, 촉진자가 떠오르는 주제(emergent themes)에 기반하여 토론의 방향을 조정(adapt)할 수 있게 합니다.
  • 추가적으로(Additionally), AI 기반 담화 분석(AI-driven discourse analytics)은 참여 패턴(patterns of engagement)을 식별하고, 잠재적인 권력 불균형(power imbalances)을 감지하며, 과소대표된 관점(underrepresented perspectives)을 강조함으로써, 더 공평한 관행(more equitable practices)을 알릴 수 있습니다. 이러한 방식으로, AI는 상호작용성(interactivity), 포용성, 그리고 교육학적 적절성(pedagogical relevance)을 향상시키는 공동 창작 과정의 재구성(reconfiguration)을 가능하게 합니다.

 

재정의(Redefinition) 단계에서,

  • AI는 시간이나 전문성의 제약(time or expertise constraints)으로 인해 종종 상상할 수 없거나 비실용적이었던 완전히 새로운 교육적 관행(entirely new pedagogical practices) 및 협력적 과업의 창조를 가능하게 합니다.
  • 예를 들어, 실행 단계 동안, 생성형 AI 도구(generative AI tools)는 실시간으로 새로운 관점(novel perspectives)이나 유추(analogies)를 도입하여, 공동 창작 대화의 깊이와 창의성(depth and creativity)을 풍부하게 할 수 있습니다. 역동적이고 맥락을 인식하는 기여(dynamic, context-aware contributions)를 지원함으로써, AI는 입력의 범위를 확장할 뿐만 아니라 참여의 본질(nature of engagement)을 재형성(reshape)하여, 공동 창작 과정을 더 적응적이고 포용적(adaptive and inclusive)으로 만들 수 있습니다 [42].

비록 재정의 단계에 도달하기 위해 '사다리를 오르는 것(climb the ladder)'이 유혹적일 수 있지만, 공동 창작자들은 주어진 기술이 의미 있는 교육학적 목적(meaningful pedagogical purpose)에 부합하는지 신중하게 평가해야 합니다(carefully evaluate). SAMR 모델은 종종 위계(hierarchy)로 제시되지만, 학자들은 이것이 대신 유연한 도구 상자(flexible toolbox)로 간주되어야 하며, 각 단계는 맥락에 따라 가치가 있다고 주장해 왔습니다 [44]. 모든 단계에서 기술을 구현하거나 '더 높은' 단계가 항상 더 낫다고 가정할 필요는 없습니다. 오히려, 이 모델은 특정 기술이 공동 창작 과정의 별개의 단계(distinct phases)를 어떻게 향상시킬 수 있는지에 대한 사려 깊은 결정(thoughtful decisions)을 안내해야 합니다.

더욱이(Moreover), SAMR 모델은 공동 창작에서의 AI 채택에 영향을 미치는 조직적 및 맥락적 요인(organizational and contextual factors)을 설명하지 않습니다. 따라서, 추가적인 이론적 렌즈(즉, TOE 프레임워크)를 통합하는 것은 공동 창작 맥락에서의 AI 구현에 대한 더 포괄적인 이해(comprehensive understanding)를 제공할 수 있습니다.

 

TOE 프레임워크 (The TOE framework) 

 

  • 기술-조직-환경(Technology-Organization-Environment, TOE) 프레임워크는 공동 창작 이니셔티브 내에서 AI와 같은 신기술(emerging technologies)의 채택 및 통합에 영향을 미치는 다면적인 요인들(multifaceted factors)을 분석하기 위한 렌즈를 제공합니다. 이 프레임워크는 기술의 성공적인 구현(successful implementation)이 세 가지 주요 맥락 간의 역동적인 상호작용(dynamic interplay)에 달려 있다고(contingent upon) 주장합니다:
    • 혁신의 기술적 특성(technological characteristics);
    • 조직적 준비도 및 구조적 속성(organizational readiness and structural attributes); 그리고
    • 조직이 기능하는 더 넓은 외부 환경(external environment) [45,46].
  • 기술적 타당성(technical feasibility), 신뢰성(reliability), 적응성(adaptability)을 포함한 AI 도구의 기술적 특성(technological characteristics)은 공동 창작 과정의 목표와 밀접하게 일치해야 합니다(align closely).
    • 예를 들어, 브레인스토밍을 지원하는 생성형 AI 시스템이나 개인화된 피드백을 제공하는 적응형 플랫폼은 공동 창작 활동을 동적으로 지원하기 위해 복잡한 교육 데이터를 실시간으로 처리할 수 있어야 합니다(capable of processing).
    • 이는 앞서 실행 단계에서 논의된 개념 매핑 소프트웨어(concept mapping software) 및 개인화된 피드백 시스템과 같은 AI 기반 브레인스토밍 도구 및 적응형 플랫폼의 사용과 직접적으로 일치합니다.
    • 더욱이, 기존의 기관 인프라(institutional infrastructure) 및 워크플로(workflows)와의 호환성(compatibility)은 최대의 효율성을 보장하기 위해 결정적입니다(crucial).
  • 조직적 요인(Organizational factors)은 AI 채택에 있어 중요한 역할을 합니다.
    • 자금(funding) 및 기술 지원(technical support)과 같은 자원을 포괄하는 기관의 준비도(Institutional readiness)는 공동 창작 활동에서의 AI 통합에 상당한 영향을 미칩니다(significantly impacts). 리더십의 헌신(Leadership commitment)과 AI에 대한 태도 [47]는 공동 창작 노력을 촉진하거나 저해할(facilitate or hinder) 수 있습니다.
    • 게다가(Furthermore), 외부 환경(external environment) 또한 공동 창작에서의 AI 채택에 영향을 미칩니다 [48]. 데이터 보호(data protection), 투명성(transparency), 그리고 관련 기관 정책 준수(adherence to relevant institutional policies)와 같은 규제적 및 윤리적 고려 사항(Regulatory and ethical considerations)은 AI의 안전하고 공평한 통합을 보장합니다. 이러한 요인들은 효과적인 협력에 필수적인 심리적 안전감과 신뢰(psychological safety and trust)를 증진합니다 [49].
  • 마지막으로, 인증 기관(accrediting bodies) 및 전문 기구(professional organizations)를 포함한 외부 이해관계자(external stakeholders)와의 파트너십은 AI 솔루션이 실제 교육적 필요(real-world educational needs)에 반응하고 윤리적이고, 신중하며, 책임감 있게(ethically, judiciously, and responsibly) 사용되도록 보장하는 데 도움을 줍니다. 따라서, 공동 창작을 지원하기 위해 AI를 채택할 때, 공동 창작에서의 적용이 효과적이고 현실적이도록(effective and realistic) 보장하기 위해 AI 기술의 특성, 기관 환경, 그리고 외부 요인을 신중하게 고려하는 것(carefully consider)이 중요합니다.

 

이론적 관점에서 공동 창작에 AI를 통합하는 것의 도전과 기회 (Challenges and opportunities in integrating AI into co-creation from theoretical perspectives) 

 

공동 창작 이니셔티브에 AI를 통합하는 것(Integrating AI into co-creation initiatives)은 기회와 도전(opportunities and challenges)을 모두 제공합니다.

 

  • SAMR 모델은 AI가 단순한 대체(substitution)에서 혁신적인 재정의(redefinition)로 이동함에 따라 윤리적 및 실무적 복잡성(ethical and practical complexities)이 어떻게 증가하는지 개념화하는 데(conceptualize) 도움을 줍니다.
  • TOE 프레임워크는 성공적인 AI 통합(successful AI integration)이 기술 자체(technology itself)뿐만 아니라 조직적 준비도(organizational readiness)와 더 넓은 환경(broader environment)에 달려 있음을 우리에게 상기시켜 줍니다(reminds).

AI가 기본적인 과업을 자동화하는 것(automating basic tasks)에서 협업을 근본적으로 재형성하는 것(fundamentally reshaping collaboration)으로 변화함에 따라(shifts), 공동 창작자들은 더 큰 실행 과제(greater implementation challenges)와 잠재적 혼란(potential disruptions)을 예상해야 합니다(anticipate).

 

 

대체 단계: 신뢰성과 보안 (Substitution phase: Reliability and security) 

  • 대체 수준(substitution level)에서, AI는 전사(transcription)와 같은 수동 작업(manual tasks)을 대체할 수 있습니다. 이는 효율성을 높이지만(boosts efficiency), 억양(accents)이나 기술 용어(technical language)와 관련된 오류와 같은 신뢰성(reliability), 그리고 특히 민감한 토론(sensitive discussions)이 제3자 플랫폼(third-party platforms)에 의해 처리될 때의 데이터 보안(data security)에 대한 우려를 제기합니다(raises concerns) [50].
  • TOE 프레임워크가 강조하듯이(highlights), 보안 인프라(secure infrastructure) 및 명확한 정책(clear policies)과 같은 조직적 요인(organizational factors)은 프라이버시를 보호하고(safeguarding privacy) 신뢰를 보장하는 데(ensuring trust) 필수적입니다 [6,49,51].

증강 단계: 편향과 형평성 (Augmentation phase: Bias and equity) 

  • AI 도구가 더 발전함에 따라(become more advanced) (즉, 번역 향상(enhancing translation), 아이디어 생성(generating ideas), 합의 형성(consensus building)), 알고리즘 편향(algorithmic bias), 데이터 투명성(data transparency), 그리고 공평한 참여(equitable participation)의 문제가 더 두드러지게 됩니다(become more pronounced) [52–54].
    • AI 시스템은 의도치 않게 소수의 목소리(minority voices)소외시키거나(marginalize), 특히 훈련 데이터(training data)에 다양성이 부족한 경우(lack diversity) 문화적 편향(cultural biases)을 반영할 수 있습니다 [55].
  • TOE 프레임워크는 조직들이 AI 도구가 맥락적으로 적절하고(contextually relevant) 윤리적으로 배포되도록(deployed ethically) 보장하며, 강력한 감독(robust oversight)과 명확한 동의 절차(clear consent processes)를 갖추도록 장려합니다.
  • 공동 창작자들은 AI 산출물(AI outputs)을 비판적으로 평가하고(critically evaluate) 지역적 필요(local needs)에 맞게 맥락화하여(contextualize), 공정성(fairness)과 포용성(inclusivity)을 유지해야 합니다.

변형 및 재정의: 기술과 인간 상호작용의 균형 (Modification and redefinition: Balancing technology and human interaction) 

  • 더 높은 SAMR 수준(higher SAMR levels)에서, AI는 새로운 작업 방식(new ways of working) (즉, 실시간 다국어 협업(real-time multilingual collaboration) 및 AI 주도 아이디어 구상(AI-driven ideation))을 가능하게 하지만, 대인 상호작용(interpersonal interaction)을 줄이고 권력 불균형(power imbalances)을 악화시킬(exacerbating) 위험도 있습니다.
  • TOE 프레임워크는 책임감 있는 AI 사용(responsible AI use)을 조성하는 데 있어 조직 문화(organizational culture), 리더십(leadership), 그리고 외부 규제(external regulations)의 중요성(significance)을 강조합니다. 공동 창작의 품질을 보존하기 위해(preserve),
    • 기술적 입력(technological input)대면 대화(face-to-face dialogue)균형을 맞추고(balance),
    • 데이터 해석(data interpretation)에 있어 인간의 감독(human oversight)을 보장하며,
    • AI 역량과 한계(capabilities and limitations)에 대한 훈련을 제공하는 것이 중요합니다(vital) [56].
  • 명확한 가이드라인(Clear guidelines), 공유된 기대(shared expectations), 우려를 표명할 기회(opportunities to voice concerns)는 심리적 안전감(psychological safety)과 신뢰를 조성하여(foster), 공동 창작 그룹이 고급 AI 통합(advanced AI integration)의 윤리적 및 관계적 복잡성(ethical and relational complexities)을 헤쳐나가는 데 도움을 줍니다. 또한 AI가 행동을 잘못 해석하여(misinterpret behaviors), 잠재적으로 고정관념을 고착화하고(perpetuating stereotypes) 프라이버시를 침해할(infringing on privacy) 수 있음을 인정하는 것(acknowledge)이 필수적입니다 [57].
  • 이러한 문제들은 특히 공동 창작과 같은 민감한 맥락(sensitive contexts)에서의 감시(surveillance) 및 프라이버시 위험과 관련하여 중대한 윤리적 우려(significant ethical concerns)를 제기합니다. 이러한 관점은 정확성(accuracy)과 사전 동의(informed consent)에 대한 우려로 인해 교육 환경에서의 감정 인식(emotion recognition)을 제한하는 EU AI 법(EU AI Act)의 비판과 일치합니다(aligns with) [58,59].

결론 (Conclusion) 

 

교육 이니셔티브의 공동 창작에 AI를 통합하는 것은 기술적(technological), 조직적(organizational), 사회적 차원(social dimensions)을 다루는 전략적 접근(strategic approach)을 필요로 합니다(necessitates). AI는 공동 창작 과정과 성과 모두를 향상시키기 위해 공동 창작의 세 단계—준비(preparation), 실행(conduction), 후속 조치(follow-up)—각각에 효과적으로 통합될 수 있습니다. 공동 창작 이니셔티브의 기획자(Planners)는 협업을 개선하고(improve collaboration), 정보에 입각한 의사결정(informed decision-making)을 촉진하며, 더 포용적이고 효과적인 공동 창작 경험을 조성하기 위해 AI의 역량을 충분히 활용할 수 있습니다(fully leverage). 이는 SAMR 모델(대체, 증강, 변형, 재정의) 및 기술-조직-환경(TOE) 프레임워크와 같은 프레임워크를 활용함으로써 달성될 수 있습니다. 그럼에도 불구하고(Nonetheless), AI 활용과 관련된 잠재적 편향(potential biases)과 윤리적 도전(ethical challenges)을 예상하고 완화하여(anticipate and mitigate), 그 실행이 효과적이면서도 책임감 있게(effective and responsible) 이루어지도록 보장하는 것이 필수적입니다(imperative).

 

 

 

 

 

Box 1. AI 도구 용어집 (Glossary of AI tools)

AI 도구 (AI tools) 정의 (Definitions)
자연어 처리 (NLP) 도구

(Natural language processing (NLP) tools)
기계가 인간의 언어를 의미 있고 유용한(meaningful and useful) 방식으로 읽고(read), 이해하며(understand), 해석하고(interpret), 생성하며(generate), 반응하도록(respond to) 하여 다양한 영역에서(various domains) 인간-컴퓨터 상호작용을 촉진하는(facilitating human–computer interaction) 소프트웨어 시스템 또는 애플리케이션(Software systems or applications).
기계 학습 모델

(Machine learning model)
특정 작업에 대해 명시적으로 프로그래밍되지 않고도(without being explicitly programmed) 패턴을 식별하거나(identify patterns) 예측 또는 결정을 내리기 위해(make predictions or decisions) 데이터로 훈련되는(trained on data) 수학적 또는 계산적 구조(mathematical or computational structure).
적응형 학습 모듈

(Adaptive learning modules)
기계 학습(machine learning)과 실시간 분석(real-time analytics)을 사용하여 개별 학습자의 특성(individual learner characteristics) (예: 지식 수준(knowledge level), 학습 선호도(learning preferences), 성과(performance))에 맞춰 교육 콘텐츠, 활동, 그리고 속도(pacing)를 동적으로 조정하는(dynamically tailor) 교수 시스템(Instructional systems).
지능형 챗봇

(Intelligent chatbots)
인간 대화 파트너(human conversation partner)를 시뮬레이션하여 대화를 자동화하도록 설계된(designed to automate conversations) 자연어 기반 시스템(Natural-language-driven systems)으로, 질문에 답하고(answering questions), 설명을 제공하며(offering explanations), 추가 자원을 제공함으로써 즉각적인 지원(immediate support)을 제공함.
생성형 AI

(Generative AI)
입력 데이터(input data)의 패턴과 구조를 학습하여(learn the patterns and structure) 인간과 유사한 창의성(human-like creativity) 및 적응성(adaptability)을 가지고 유사한 특성(similar characteristics)을 지닌 새로운 데이터(generate new data) (즉, 텍스트, 이미지, 및/또는 미디어)를 생성하는 AI 알고리즘 및 모델의 그룹(A group of AI algorithms and models).

 

 

J Dent Educ. 2022 Mar;86(3):288-297. doi: 10.1002/jdd.12810. Epub 2021 Oct 26.

Professional identity formation: The key contributors and dental students' concerns

 

예비 치과의사는 어떻게 만들어지는가? - 전문직 정체성 형성의 5가지 열쇠

치과 대학의 목표는 단순히 지식을 전달하는 것을 넘어, 학생들이 올바른 가치관을 지닌 '전문 직업인(Professional)'으로 성장하도록 돕는 것입니다. 하지만 "전문직업성(Professionalism)"을 가르치는 것만으로는 충분하지 않다는 목소리가 높습니다.

최근 치의학 교육의 화두는 '무엇을 하는가(Doing)'에서 '어떤 사람이 되는가(Being)', 즉 전문직 정체성 형성(Professional Identity Formation, PIF)으로 옮겨가고 있습니다.

 

오늘 소개할 논문은 브리티시 컬럼비아 대학교(UBC) 연구진이 발표한 연구로, 치과 대학생들이 4년의 과정을 거치며 어떻게 자신을 치과의사로 인식하게 되는지, 그 과정에 영향을 미치는 핵심 요인은 무엇인지를 심층 인터뷰를 통해 밝혀냈습니다.

💡 핵심 발견: 전문직 정체성을 만드는 5가지 기둥

이 연구는 학생들의 인터뷰를 분석하여 전문직 정체성 형성(PIF)에 기여하는 5가지 핵심 요소를 도출했습니다.

  1. 영역 특이적 자기효능감 (Domain-specific self-efficacy): 치과 진료를 능숙하게 해낼 수 있다는 자신감
  2. 롤 모델링과 멘토링 (Role modeling and mentoring): 교수의 태도와 지도 방식
  3. 동료와의 전문직 사회화 (Professional socialization with peers): 동기들과의 유대감 및 네트워킹
  4. 학습 환경 (Learning environment): 임상 실습실 분위기, 교육과정 등
  5. 성찰 (Reflection): 자신의 성장 과정을 되돌아보는 것

🔍 가장 흥미로운 발견: "손기술이 좋아야 진짜 치과의사?"

이 논문에서 가장 눈에 띄는 발견은 '치과적 자기효능감'의 중요성입니다.

학생들은 이상적으로는 "환자를 배려하고 공감하는(Soft skills)" 치과의사가 되기를 꿈꿉니다. 하지만 현실적인 고민과 스트레스는 대부분 "임상 술기를 얼마나 능숙하게 해내는가(Hard skills)"에 집중되어 있었습니다.

  • 학생들의 속마음: "아무리 공부를 많이 해도 손으로 결과를 못 만들어내면 소용없어요. 지금 못하면 평생 못 할까 봐 불안해요."

즉, 학생들은 임상적인 '능숙함(Proficiency)'을 갖췄을 때 비로소 "내가 진짜 치과의사가 되었구나"라는 정체성을 확립하게 된다는 것입니다. 이는 치과 교육에서 충분한 실습 시간과 건설적인 피드백이 왜 정체성 형성에 필수적인지를 보여줍니다.

🌱 좋은 멘토와 환경의 중요성

학생들은 교수가 보여주는 태도를 그대로 흡수합니다. 긍정적이고 지지적인 멘토링은 학생에게 큰 동기부여가 되지만, 학생을 질책하거나 적대적인 학습 환경은 오히려 정체성 형성을 저해할 수 있습니다.

  • 긍정적 사례: "실수를 처벌하지 않고 배움의 기회로 만들어 주시는 교수님"
  • 부정적 사례: "환자 앞에서 학생을 모욕하거나 숨 막히게 감시하는 교수님"

📝 결론: 치과 교육이 나아가야 할 길

이 연구는 치과 대학이 단순히 기술만 가르치는 곳이 되어서는 안 된다고 강조합니다.

학생들이 건강한 전문직 정체성을 형성하기 위해서는:

  • 학생들이 술기에 대한 자신감(자기효능감)을 키울 수 있도록 돕고,
  • 교수진이 훌륭한 롤 모델이 되어주며,
  • 동료들과 긍정적인 관계를 맺을 수 있는 지지적인 학습 환경을 제공해야 합니다.

진정한 치과의사는 면허증을 받는 순간 완성되는 것이 아니라, 이러한 요인들이 복합적으로 상호작용하는 과정을 통해 서서히 '되어가는(Becoming)' 것입니다.

 


 

1. 서론 (INTRODUCTION)

전문직업성(Professionalism)은 "한 직업이나 전문직 종사자를 특징짓는 행위, 목표 또는 자질"로 정의됩니다. 보건 의료 분야에서 이는 "의료 도덕성(medical morality)"으로 묘사되기도 하며 , 임상적 역량, 명확한 의사소통 능력, 윤리적 및 법적 이해, 수월성(excellence)에 대한 헌신, 인본주의, 책무성, 이타심 등 전문직의 필수적인 특징들을 포괄합니다. 보건 의료 전문가는 환자의 요구를 고려하고 그에 반응하며, 건강의 사회적 결정요인과 자신의 사회적, 직업적 책임을 인지해야 합니다. 치의학 교육에서 교육자들의 궁극적인 목표는 학생들이 전문직업성을 갖춘 유능한 임상가가 되도록 준비시키는 것입니다.

 

따라서 전문직업성은 치과 대학 프로그램의 필수적인 부분이 되었습니다. 캐나다와 미국의 인증 평가 기구들 또한 그 중요성과 치과 대학 교육과정에 이를 포함해야 할 필요성을 인정하고 있습니다. 의학 교육 역시 학생들의 전문직업성 함양에 대해 동일한 헌신을 하고 있습니다. 그러나 의학 교육에서 전문직업성을 연구하는 학자들은, 만약 이것이 교육되고 있다 하더라도, 종종 학생들이 깊이 있는 사고와 헌신 없이 만들어낼 수 있는 바람직한 가치와 행동의 나열에 그치는 등 피상적으로 교육되고 있다고 비판해 왔습니다. 게다가 시장의 힘(market forces)과 이전에 비해 "타인 중심적"이기보다 "자기중심적" 성향이 강한 입학 지원자들의 세대적 변화를 고려할 때, 과거의 교육 방식은 불충분할 수 있습니다. 따라서 교육 연구자들은 "무엇을 하는가(DOES)"보다는 "어떤 존재인가(IS)"에 기반을 둔 무언가가 더 필요하다고 주장했습니다. Jarvis-Selinger와 동료들에 따르면, 전문직업성을 가르치는 내재적 목적은 학생들이 자신의 전문직 정체성(professional identity)을 갖도록 돕는 것입니다. 따라서 교육 목표는 전문직 정체성 형성(Professional Identity Formation, PIF)으로 확장되고 초점을 맞춰야 합니다.

 

전문직 정체성(PI)은 "우리가 직업적 맥락 안에서 우리 자신을 어떻게 인식하고 이를 타인에게 어떻게 소통하는지를 설명하는 개념"으로 이해할 수 있습니다. 이는 "한 직업 내에서의 자신, 혹은 그 직업의 집단적 정체성에 대한 개인의 인식"입니다. PIF는 "학습자가 시간이 지남에 따라 단계적으로 성취하며 자신에게 의미를 부여하는 정신적 과정으로, 그 직업의 규범, 속성, 가치를 내면화하여 결과적으로 그 직업의 구성원처럼 생각하고, 행동하고, 느끼게 되는 것"으로 묘사할 수 있습니다.

 

전문직 정체성(PI)은 태어날 때부터 시작된 기존의 정체성 위에 중첩되어 발달하며, 성별, 인종, 종교, 국적, 계급의 영향을 받을 수 있습니다. 전환의 시기에 개인들은 임상 및 비임상 경험의 영향을 받으며 실천 공동체(community of practice)로 사회화되는 과정에서 PI를 형성하기 위해 일련의 변형 과정을 점진적으로 거치게 됩니다. 전문직 양성 프로그램은 학생들이 선택한 직업에 문화적으로 적응(acculturate)하도록 도움으로써 학생들의 PIF에 중요한 역할을 합니다. 그러나 PI의 발달은 학생들이 프로그램을 마친다고 해서 끝나는 것이 아닙니다. PIF는 유동적이고 역동적이며 지속적인 과정입니다.

 

만약 PI를 발달시키는 것이 전문직업성을 성취하는 데 중요하다면, 치과 대학생들의 준비 기간(재학 기간) 동안 PIF에 기여하는 요인들을 이해하는 것이 필요합니다. 본 연구의 목표는 다음과 같습니다:

  1. 치과 대학생의 전문직 정체성과 관련된 구성 요소를 조사하고 분석한다.
  2. 자신의 PIF에 대한 학생들의 우려(concerns)를 탐색한다.

2. 연구 방법 (METHODOLOGY)

본 연구는 인터뷰 데이터를 포함한 질적 연구입니다. 이 논문에 사용된 데이터는 브리티시 컬럼비아 대학교(UBC) 윤리위원회의 승인(# H16-00957)을 받은 더 큰 규모의 연구의 일부입니다.

2.1 연구 맥락 (Context)

과거 브리티시 컬럼비아 대학교(UBC)의 치의학 박사(DMD) 과정 학생들은 의학 박사(MD) 과정 학생들과 함께 생의학(biomedical) 통합 교육과정을 수강했었습니다. 그러나 이 교육과정은 주로 MD 학생들에게 맞춰져 있었습니다. 수년에 걸쳐 DMD 교수진과 학생들은 치의학 전문직에 특화된 학습 필요성을 점차 강조했습니다. 2010년부터 교수진은 광범위한 재평가를 시작하여 DMD 프로그램을 개정했습니다.

 

2015년 가을 학기부터 학생들의 피드백과 경험을 바탕으로 한 교육과정 변경 사항들이 매년 한 학년씩(1 year at a time) 적용되었고, 이를 통해 새롭게 개정된 DMD 교육과정으로의 원활한 전환을 도모했습니다. 변경된 내용에는 상호작용 방식의 학습, 치의학과 관련된 증례 기반 학습(case-based learning), 그리고 성취도 평가(progress testing) 프로그램 등이 포함되었습니다. 성취도 평가를 통해 학생들은 모든 UBC 치대생에게 연 2회 시행되는 200문항의 온라인 객관식 시험을 치르며 치의학 지식 습득 과정을 모니터링할 수 있었습니다.

 

2019년까지, 새롭게 개정된 교육과정의 4년을 모두 경험한 DMD 학생들이 본 연구에 초청되어 프로그램을 통한 자신의 성장 과정을 성찰하고 시행된 교육과정을 검토했습니다. 각 인터뷰 참가자는 감사의 표시로 30달러 상당의 전자 상품권(e-giftcard)을 받았습니다. 초청된 46명의 졸업 예정 DMD 학생 중 18명이 1시간 분량의 개별 반구조화 인터뷰(semi-structured interview)에 자원했습니다. 인터뷰 내용은 녹음되었으며, 이후 연구 보조원에 의해 전사(transcribed) 및 교정 과정을 거쳐 전사의 정확성을 확보했습니다.

2.2 자료 분석 (Data Analysis)

인터뷰 데이터는 QSR International의 NVivo (Version 12)로 가져왔으며, Strauss와 Corbin의 자료 분석 접근법이 적용되었습니다.

  1. 개방 코딩(Open coding): 먼저 범주화 및 주제 코딩(thematic coding)을 사용하여 6개의 대주제, 23개의 하위 주제, 35개의 주요 개념을 식별했습니다. 더 이상 새로운 하위 주제나 개념이 나오지 않을 때까지 데이터를 범주화하기 위해 개방 코딩이 사용되었습니다.
  2. 축 코딩(Axial coding): PIF에 영향을 미치는 요인(influencers)과 관련하여 주제와 개념들을 연결하기 위해 축 코딩이 수행되었습니다.
  3. 선택 코딩(Selective coding): 모든 참가자의 인터뷰 녹취록에 걸쳐 결과를 비교한 후, 관련 하위 주제와 개념을 추출하고 통합하여 PIF에 관여하는 가능한 구성 요소들을 도출하기 위해 선택 코딩이 사용되었습니다.

데이터 분석의 과정은 그림 1(Figure 1)에 묘사되어 있습니다.

 

 

3. 결과 및 고찰 (RESULTS AND DISCUSSION)

개방 코딩(open coding)을 통해 연구자들은 데이터를 분석하여 다음과 같은 6가지 주요 주제로 범주화했습니다:

  • (1) 교과목에 대한 코멘트,
  • (2) 치과의사의 바람직한 자질,
  • (3) 치대 지원 동기,
  • (4) 학습 경험,
  • (5) 1학년부터 4학년까지의 성장에 대한 성찰,
  • (6) 학생들의 기대.

이 일반 주제들로부터 하위 주제와 주요 개념들이 식별되었습니다(표 1).

 

식별된 일반 주제와 개념들을 바탕으로, 연구자들은 축 코딩(axial coding)과 선택 코딩(selective coding)을 사용하여 전문직 정체성 형성(PIF)에 영향을 미치는 5가지 핵심 구성 요소를 추출했습니다:

  • (1) 영역 특이적 자기효능감(domain-specific self-efficacy),
  • (2) 롤 모델링과 멘토링(role modeling and mentoring),
  • (3) 동료와의 전문직 사회화(professional socialization with peers),
  • (4) 학습 환경(LE),
  • (5) 성찰(reflection) (표 2).
 

치의학 교육은 임상 지식과 역량의 숙달을 가르치고 보여주는 것 그 이상입니다. 궁극적인 목표는 전문직이 정한 가치를 드러낼 수 있는 치과 전문직업인이 되는 것입니다. 보건 과학 교육 문헌에서 묘사되듯, 전문직업성(professionalism)과 전문직 정체성(professional identity)은 긴밀하게 결합되어 있으므로 PIF는 치의학 교육의 중심 초점이 되어야 합니다. PIF를 프로그램의 목표로 권장함으로써, 학생들이 전문직 정체성의 개념을 이해하고, 이것이 전문직업성과 어떻게 연결되는지 배우며, 잠재적으로 자신의 성장 과정에 참여하여 자신의 전문직 정체성 발달의 능동적인 참여자가 되도록 도울 수 있습니다.

 

전문직 학교에서 PIF를 강조하려는 움직임은 부분적으로 개인의 도덕성 발달을 연구한 심리학자들에게서 유래했습니다. 그들은 "아는 것(knowing)과 행하는 것(doing)"의 차이를 조사하면서, 전문직이 정한 가치에 따라 행동해야 한다는 강한 믿음만으로는 그것이 정체성에 깊이 뿌리내리지 않는다면 행동을 유발하기에 충분하지 않을 수 있다고 지적했습니다. 만약 우리가 PIF를 치의학 교육의 근본적인 목표로 받아들인다면, 먼저 그 과정에 무엇이 기여하는지 이해해야 합니다. 이 연구는 그 5가지 관련 기여 요인인 영역 특이적 자기효능감, 롤 모델링과 멘토링, 동료와의 전문직 사회화, 학습 환경(LE), 성찰을 조명합니다. 이 고찰에서 우리는 치의학 분야에서의 우리 전문적 경험과 PIF 분야의 문헌에 비추어 연구 결과를 설명합니다.

3.1 기여 요인 1: 영역 특이적 자기효능감 (Domain-specific self-efficacy)

참가자들은 인터뷰에서 "프로그램에 처음 입학했을 때 어떤 치과의사가 되기를 꿈꿨습니까?" 그리고 "학습 경험이 졸업 즈음 그 목표에 도달하는 데 얼마나 도움이 되었습니까?" 라는 질문을 받고 성찰하도록 요청받았습니다. 표 1의 두 번째 범주인 "치과의사의 바람직한 자질"에 정리된 학생들의 답변에 따르면, 치의학 박사(DMD) 과정 학생들은 소프트 스킬(인성적 기술)과 하드 스킬(기술적 능력) 모두를 동등하게 가치 있게 여깁니다. 그들은 좋은 치과의사란 환자를 배려하면서도 자신의 직무에 유능한 사람이라고 인식합니다.

 

이러한 견해와 대조적으로, 표 1의 마지막 범주인 "학생들의 기대"에 제시된 내용은 DMD 학생들의 주된 학습 초점이 환자에 대해 더 연민을 가지는 것보다는 치과 시술에 기술적으로 능숙해지는 것에 맞춰져 있음을 보여줍니다. 간단히 말해, 학생들의 관점에서는 치과의사가 된다는 것의 무게 중심이 치과 시술을 능숙하게 수행하는 데 더 쏠려 있습니다.

학생 1: "저는 능숙해지고 싶습니다. 치과 시술을 하는 법, 환자를 관리하는 법, 모든 치과 재료와 모든 지식에 익숙해지는 것..."

 

또한, 일반 주제 범주 4 "학습 경험" 하에 있는 개념 4-2-4 "충분히 잘하지 못할 것이라는 스트레스"에 대한 코멘트들을 통해 학생들의 관점이 드러납니다.

학생 9: "수복(restorative) 실습의 경우, 아무리 공부를 많이 하거나 연습을 많이 해도 그 결과를 정말로 통제할 수는 없습니다. 저는 스트레스와 압박감을 많이 느꼈던 것 같아요... 왜냐하면 항상 걱정하거든요. '아, 지금 못하면 나중에도 절대 못 할 거야'라고요."

 

자신의 수행 능력에 대한 학생들의 우려와 학습 환경(LE)에 대해 개선하고 싶은 점들에 대한 제안을 보면, 일정 수준의 치의학 관련 자기효능감을 성취하는 것이 치대생들의 PIF에 필수적인 요소인 것으로 보입니다(그림 2).

 


 

Figure 2 번역: 전문직 정체성 형성의 요인으로서의 영역 특이적 자기효능감

이 그림은 크게 세 부분(좌측, 우측, 중앙)이 상단으로 수렴하는 구조를 가지고 있습니다.

1. 상단 박스 (결과)

  • Domain-specific self-efficacy
    • 번역: 영역 특이적 자기효능감 (치과적 자기효능감)

2. 중앙 박스 (매개 요인)

  • "Proficiency, competence"
    • 번역: "능숙함, 유능함(역량)"
    • 설명: 좌측과 우측의 요소가 공통적으로 지향하는 지점입니다.

3. 좌측 박스 (학생들의 이상향)

  • Students' perception of a good dentist (Who they want to become)
    • 번역: 좋은 치과의사에 대한 학생들의 인식 (그들이 되고자 하는 존재)
  • "Competent and proficient at what they do, yet caring and compassionate" (Soft skills + hard skills)
    • 번역: "자신의 직무에 유능하고 능숙하면서도, 배려심 있고 연민을 가진 사람" (소프트 스킬 + 하드 스킬)

4. 우측 박스 (학생들의 현실적 고민)

  • Student expectation / Preclinical + clinical learning concerns (Mainly linked to the technical aspect)
    • 번역: 학생들의 기대 / 전임상 및 임상 학습에 대한 우려 (주로 기술적 측면과 연결됨)
  • Underlying motive = to be competent at what they do
    • 번역: 기저 동기 = 자신의 직무에 유능해지는 것

Figure 2 상세 설명

이 도표는 연구 결과(3.1절)를 요약한 것으로, 치과 대학생들의 전문직 정체성 형성(PIF) 과정에서 '기술적 능숙함'이 얼마나 중요한 위치를 차지하는지를 설명합니다.

  1. 이상과 현실의 괴리, 그러나 공통된 목표:
    • 학생들은 이상적으로 '실력도 좋고 마음도 따뜻한 치과의사(Soft skills + Hard skills)'를 꿈꿉니다(좌측 박스).
    • 하지만 현실적으로 학교생활에서 느끼는 불안과 우려(성적, 실습 결과 등)는 대부분 '기술적인 부분(Technical aspect)'에 집중되어 있습니다(우측 박스).
    • 즉, 학생들의 이상향과 현실적 불안감 모두 "능숙함과 유능함(Proficiency, competence)"이라는 하나의 키워드로 귀결됩니다(중앙 화살표).
  2. 자기효능감의 형성:
    • 학생들은 임상적 술기를 능숙하게 해낼 때 비로소 자신이 치과의사로서 기능할 수 있다고 느낍니다.
    • 이러한 '능숙함(Proficiency)'을 성취하는 것이 곧 '영역 특이적 자기효능감(Domain-specific self-efficacy)'을 높이는 핵심 요인이 됩니다(중앙에서 상단으로 향하는 화살표).
  3. 결론적 의미:
    • 이 모델은 치과 교육에서 학생들이 왜 그토록 임상 실습 시간과 기술적 숙달에 집착하는지를 설명해 줍니다. 학생들에게 있어 '손기술의 숙달'은 단순한 기술 습득을 넘어, "나는 치과의사다"라는 정체성(Identity)을 형성하는 가장 기초적인 전제 조건이기 때문입니다.

 

3.2 기여 요인 2: 롤 모델링과 멘토링 (Role modeling and mentoring)

롤 모델링과 멘토링은 전문직 사회화(professional socialization)와 밀접하게 관련되어 있습니다. 우리는 롤 모델링과 동료와의 사회화를 별도의 범주로 나누었는데, 내용과 학생들의 언급 빈도를 볼 때 교육자가 중요한 역할을 하며 학생들의 PIF에 더 중대한 영향을 미칠 수 있음을 보여주기 때문입니다.

 

좋은 롤 모델을 갖는 것은 다음 세대의 좋은 롤 모델을 길러내는 데 매우 중요하며, 진로 선택에도 영향을 미칩니다. 의학 교육 문헌에서는 학생들이 전문 분야 자체에 대한 진정한 흥미보다는 롤 모델(그 사람)이 좋아서 특정 전공을 선택한다고 자주 보고됩니다. 우리 연구에서도 일부 학생들의 코멘트는 그들이 프로그램에 지원하게 된 동기가 평소 다니던 치과 의사에 대한 긍정적인 인식에 기반했음을 시사했습니다.

학생 6: "...제가 다니던 치과 의사 선생님을 쉐도잉(참관)했을 때, 그분이 '아, 너는 원하면 뭐든지 할 수 있어. 치과의사가 되는 건 어때?'라고 하셨어요. 네, 알겠습니다 했죠. 저는 그 병원이 얼마나 깨끗하고 원활하게 돌아가는지, 그리고 모든 사람이 그분을 보며 행복해 보이는지가 좋았어요... 그래서 저는 '나도 이런 일을 하는 내 모습이 그려진다'라고 생각했죠..."

 

학생들은 다가가기 쉽고(approachable), 시간을 내주거나(available), 실제 개원가(real-world practice)에 매우 적용 가능하다고 느껴지는 치의학 지식을 가르쳐주는 강사들에 대해 호의적인 견해를 가졌습니다.

학생 7: "우리에게는 가서 이야기할 수 있는 임상 지도 교수님이 계십니다..."

학생 12: "...그 교수님은 그것을 긍정적인 학습 경험으로 만들어 주셨어요. 어떤 것에 대해서도 벌을 주지 않으셨죠. 항상 시간을 내주셨고요..."

학생 10: "그것은 실제 세상에 매우 적용 가능합니다. 실제 치과계가 어떻게 돌아가는지에 대한 소개를 받는 것 같아요."

 

교육자는 학생들의 동기, 생산성, 역량, 만족도, 전문적 성장에 긍정적인 영향을 미칠 수 있는 반면, 반대로 학생들에게 부정적인 영향을 줄 수도 있습니다. 만약 롤 모델이나 멘토가 지지적이지 않고, 그들과의 경험이 긍정적으로 해석되지 않는다면, 이는 전문직업적 행동에 깊은 영향을 미치고 아마도 PIF를 저해할 수 있습니다.

학생 3: "그 교수는 무자비했어요... 환자들이 보는 앞에서 학생들을 질책했죠... 그분은 이 모듈의 목적이 무엇인지 요점을 완전히 놓치고 있었어요."

3.3 기여 요인 3: 동료와의 전문직 사회화 (Professional socialization with peers)

동료들과의 관계 형성은 전문직 실천 공동체(community of practice)에 대한 소속감을 제공하기 때문에 PIF(전문직 정체성 형성)에 필수적인 기여 요인으로 작용할 수 있습니다. 소그룹 학습은 교육학적 접근 방식으로서 UBC 치과대학에서 핵심적으로 강조해 온 것 중 하나입니다. 이러한 접근 방식은 의도적으로 협력하는 습관을 기르고 공동체의 확립을 촉진합니다.

학생 12: "저는 동기들과 함께 나눈 동료애(camaraderie)가 정말 좋았습니다. 치과대학 4년을 서로 함께 경험할 수 있어서 정말 좋았습니다."

학생 4: "...여기서는 의사소통 기술을 배우고 사회적 네트워크를 구축하는 것이 정말 컸습니다... 우리는 BC주(브리티시 컬럼비아주)라는 꽤 작은 치과의사 사회에 속해 있기 때문에, 앞으로 나아갈 때 의지할 수 있는 사람들과 이러한 연결고리를 갖는다는 것이 좋게 느껴집니다."

3.4 기여 요인 4: 학습 환경 (Learning environment)

학습 환경(LE)은 "학습자의 경험, 인식, 그리고 학습을 둘러싸고 형성하는 사회적 상호작용, 조직 문화와 구조, 그리고 물리적 및 가상적 공간"으로 정의됩니다. 이 정의는 학생 대 강사 비율, 학생에 대한 강사의 태도나 행동에 이르기까지 임상 환경을 포함하며, 이 모든 것이 특정한 학습 분위기를 조성하는 데 기여합니다.

 

위협적이고 적대적인 임상 환경과 교육과정에 대한 좌절감은 학생들에게 불필요한 스트레스를 줄 수 있으며, 그들의 PIF에 부정적인 영향을 미칠 수 있습니다.

학생 13: "...그냥 기분이 끔찍했던 기억이 납니다. 어떤 코스에서는 제가 무언가를 모르면, 그들은 '가서 책 읽고 다시 와'라고 했죠. 네, 알겠습니다... 그래서 정말 적대적인 환경이었습니다... 저는 강사들이 즉각적으로 친절하거나 친근하게, 혹은 더 도움이 되게 대해줄 것이라고 신뢰하지 않았습니다..."

학생 11: "....우리가 문제 중심 학습(PBL)에 많은 중점을 두고 있다는 건 알지만, 저는 정말 강의가 먼저여야 한다고 생각합니다. 이런 내용을 우리 스스로 배우게 해서는 안 됩니다. 우리 스스로 가르치고 나서 금요일에 와서야 특정 주제에 대해 깨우치게 되는 식이어선 안 되죠... 반대 순서로 하는 건 말이 안 됩니다..."

학생 14: "... 치과 진료 입문(Intro to dental practice) 수업에서 우리는 모든 진료대를 닦고 감염 관리를 하는 법을 배우는데... 저는 그게 너무 과하다고 느꼈습니다... 장비 낭비였죠..."

3.5 기여 요인 5: 성찰 (Reflection)

성찰은 정체성 형성에 중요한 역할을 합니다. 듀이(Dewey)는 성찰적 사고가 문제를 해결하는 데 사용될 수 있다고 주장했습니다. 숀(Schön)은 듀이의 의견에 동의하며 "행위 중 성찰(reflection-in-action)""행위 후 성찰(reflection-on-action)"이라는 개념을 도입하여 이해를 더욱 확장했습니다. 성찰이 "행위 중(in action)"에 이루어질 때는 개인이 문제에 직면했을 때 지속적인 내적 대화가 일어납니다.

 

성찰이 "행위 후(on action)"에 이루어질 때, 개인들은 의미와 설명을 구성하고 수정하면서 이전의 경험을 되돌아봅니다. 이렇게 관련 경험을 지속적으로 재해석하는 것은, 가치와 신념의 관점에서 자신의 전문직 자아(professional self)를 이해하는 것으로부터 관련 경험의 지속적인 서사(narrative)를 통해 발달하는 PIF와 유사합니다.

 

성취도 평가(progress testing) 프로그램은 정기적인 벤치마킹 리포트를 통해 학생들이 자신의 학습을 비판적으로 성찰하도록 돕기 위해 고안되었습니다. 해마다 자신의 점수를 비교하고 학급 중앙값(median)과 자신을 측정함으로써, 학생들은 추가적인 학습 필요성을 도출해 낼 수 있습니다(성찰적 학습). 궁극적으로 교육자들은 학생들이 교실에서의 학습과 임상 실습을 연결하기를 기대합니다(성찰적 실천). 임상 수행 능력의 향상은 자기 평가와 자신감에 긍정적인 변화를 가져옵니다.

학생 3: "만약 학급 전체와 비교했을 때 제가 부족한 부분이 있다면, 그 부분들이 개인적으로 시간을 좀 더 투자해야 할 영역일 것입니다."

학생 5: "처음에는 그것(성취도 평가)이 그다지 유용하다고 생각하지 않았어요... 사실 그 분야에서 제가 무엇을 알고 무엇을 모르는지 확인하기 위해 제 지식을 테스트하는 방법이었죠. 그래서 저에게는 도움이 되었습니다. 가장 마지막에 본 성취도 평가가 가장 효과적이었다고 느꼈습니다."

학생 12: "그것(성취도 평가)은 제가 어디가 부족한지, 예를 들어 어떤 과목에서 조금 뒤처져 있는지를 깨닫게 해주었습니다. 특히 올해, 국가고시(board exam)가 다가오면서 그런 측면에서 도움이 되었습니다. 이건 시험 전의 좋은 리허설(run-through) 같은 거죠. '이 부분들이 내가 돌아가서 더 읽어보거나 문제를 풀어봐야 할 곳들이구나, 아니면 그냥 예전 노트를 다시 봐야겠구나' 하게 되죠..."

 

위의 결과와 논의를 결론짓자면, 우리 연구에서 강조되어야 할 하나의 중요한 발견은 영역 특이적 자기효능감(domain-specific self-efficacy), 즉 우리의 경우 치과적 자기효능감(dental self-efficacy)입니다. 이 요인은 이전에 널리 논의되거나 치의학 교육에서 PIF의 기여 요인으로 명시적으로 확인되지 않았습니다. 이전의 의학 및 치의학 교육 문헌에서는 롤 모델과 멘토, 임상/비임상 경험, 정규 교육 및 평가, 동료, 그리고 성찰이 PIF에 영향을 미치는 요소로서 많은 주목을 받았습니다. 치과적 자기효능감이 PIF에 기여한다는 개념은 치과 전문직업인이 된다는 것이 무엇을 의미하는지에 대한 학생들의 관점과 밀접하게 연결되어 있습니다.

 

치과 대학 교육과정 연구들을 검토해 보면, 임상 실습 시간(clinic time)이 자주 거론되어 왔습니다. 마찬가지로, 임상 시간 부족과 관련된 불안감은 인터뷰에 참여한 모든 학생들의 공통된 불만 사항이었습니다. 치대생들의 관점에서 볼 때, 그들의 전문직 정체성이 능숙한 기술적 기술(competent technical skills)을 개발하는 데 큰 비중을 두고 있다면, 임상 기술을 향상시키려는 욕구는 지극히 자연스러운 것입니다. 성공적인 치과 전문직업인에게 정신운동 기술(psychomotor skills)의 습득은 중요합니다. 왜냐하면 그들의 전형적인 일상은 다양한 수준의 정신운동 기술을 요하는 광범위한 시술을 포함하기 때문입니다. 이러한 기술을 개발하는 데는 충분한 양의 시간과 연습이 필요합니다.

 

더 많은 임상 시간이 필요하다는 학생들의 언급은 치과의사가 된다는 것이 그들에게 어떤 의미인지에 대한 그들의 관점을 증명합니다. 전문직 자기효능감은 전문직 업무를 수행할 수 있는 자아에 대한 인식으로 정의됩니다. 치대생들에게 임상에서의 수행 능력(performance)은 자신의 치과적 자기효능감을 평가하는 데 도움을 줍니다. 반복적으로 임상 기준을 충족하거나 초과하는 것은 긍정적인 치과적 자기효능감을 길러주는 반면, 잦은 부정적인 피드백이나 기준 이하의 수행 능력은 이를 저하시킵니다. 시기적절하고 건설적인 피드백은 학생들의 자기효능감 발달에 매우 중요합니다. 학생들의 치과적 자기효능감이 증가할 때, 다시 말해 그들이 만족할 만큼 시술을 해낼 수 있을 때, 그들은 자신이 더 치과의사답다고 느낄 수 있습니다.

3.6 교육자를 위한 시사점 (Implication for educators)

이 연구의 목적 중 하나는 치의학 교육자들을 위한 제언을 제공하는 것입니다. 그림 3(Figure 3)은 치대생들의 질적 데이터를 바탕으로 치대생들의 PIF에 기여하는 5가지 요인을 설명하려는 우리의 시도입니다.

 


 

Figure 3 번역: 치대생들의 전문직 정체성 형성에 기여하는 5가지 요인

그림은 가장 바깥쪽의 '치과대학(Dental School)'이라는 환경적 울타리 안에서, 5가지 요소가 중앙의 '전문직 정체성 형성(Professional Identity Formation)'을 향해 화살표로 영향을 주는 구조를 하고 있습니다.

1. 전체 배경 (Environment)

  • Dental School: 치과대학

2. 중앙 핵심 과정 (Core Process)

  • Professional Identity Formation: 전문직 정체성 형성

3. 5가지 기여 요인 (5 Contributors)

  • Learning environment: 학습 환경
  • Professional socialization with peers: 동료와의 전문직 사회화
  • Role modeling & mentoring: 롤 모델링과 멘토링
  • Domain-specific self-efficacy: 영역 특이적 자기효능감 (치과적 자기효능감)
  • Reflection: 성찰

Figure 3 상세 설명

이 도표는 연구를 통해 밝혀낸 전문직 정체성 형성(PIF)의 메커니즘을 시각적으로 요약하고 있습니다.

  1. 치과대학이라는 생태계:
    • 가장 큰 타원으로 표시된 '치과대학(Dental School)'은 학생들의 정체성이 형성되는 물리적, 사회적 경계를 의미합니다. 학생들은 이 환경 안에서 4년 동안 생활하며 정체성을 만들어갑니다.
  2. 다차원적인 영향 요인:
    • 연구진은 단순히 지식을 습득하는 것을 넘어, 다음 5가지 요소가 복합적으로 작용하여 학생이 '치과 의사'라는 정체성을 갖게 된다고 설명합니다.
      • 영역 특이적 자기효능감: "나는 치과 술기를 잘 해낼 수 있다"는 자신감이 정체성 형성의 핵심 동력이 됩니다.
      • 롤 모델링 & 멘토링: 교수나 선배들의 행동을 보고 배우거나(혹은 반면교사로 삼거나) 멘토링을 받으며 전문가의 모습을 내면화합니다.
      • 동료와의 사회화: 동기들과의 유대감, 네트워킹을 통해 '치과 의사 집단'의 일원이라는 소속감을 느낍니다.
      • 학습 환경: 임상 실습실의 분위기, 교육과정의 구조, 학생-교수 비율 등 조직적 환경이 학생들의 심리에 영향을 미칩니다.
      • 성찰: 자신의 성장 과정을 되돌아보고 부족한 점을 파악하는 내적 활동을 통해 정체성을 다듬어갑니다.
  3. 결론적 의미:
    • 이 그림은 PIF가 어느 한 가지 요소(예: 수업)만으로 이루어지는 것이 아니라, 개인적(성찰, 자기효능감), 사회적(동료, 롤 모델), 환경적(학습 환경) 요인들이 상호작용하며 학생을 '전문 직업인'으로 성장시킨다는 연구의 결론을 함축하고 있습니다.

 

치대생들은 대중에게 봉사할 구강 보건 전문가가 되어가는 과정에 있습니다. 그들이 전문직 정체성과 여타 정체성들을 어떻게 형성하느냐는 그들의 현재 안녕(well-being)과 미래에 동료 및 환자들과 형성할 관계에 중요한 함의를 갖습니다. 이 연구를 통해 확인된 바와 같이, 교육자는 롤 모델이나 멘토가 될 수 있으며 학생들의 PIF에 중요한 역할을 합니다. 정체성은 공식적 및 비공식적 환경 모두에서의 모든 종류의 상호작용 중에 생성됩니다. 교육자들은 조직화된 환경에서 전문직에 걸맞은 적절한 행동을 보여줌으로써 학생들에게 긍정적인 영향을 미칠 수 있습니다. 학생들은 자신에게 성공적인 것으로 보이는 행동과 특성을 채택합니다. 만약 환경이 적대적이고 배타적이거나, 비전문적인 행동을 모델링하는 개인들이 많다면 학생들이 부정적인 영향을 받을 위험도 존재합니다. 학습 환경(LE)이 학생들의 PIF를 지원할 수 있도록 이러한 요인들은 다루어져야 합니다. 따라서 교육 기관은 학생들의 행동에 영향을 줄 수 있는 규범과 관습을 성찰해야 합니다.

 

교육자의 태도와 피드백 또한 학생들에게 상당한 영향을 미칩니다. 우리 연구 참가자들은 일부 임상 실습에서의 저조한 수행 능력과 강사들이 자신을 어떻게 생각할지에 대한 믿음 때문에 생기는 "너는 좋은 치과의사가 되지 못할 거야"라는 낙인(stigma) 가능성에 괴로워했다고 언급했습니다. 교육자들은 정신운동 기술을 개발하고 치의학 지식을 충분히 실행하는 데 학습 곡선(learning curve)이 존재함을 이해하고 있지만, 학생들에게 피드백이 전달되는 방식은 이러한 이해를 반영하지 못할 수도 있습니다. 학생들이 피드백을 어떻게 인식하고 해석하느냐는 형성 평가(formative assessment)의 효과에 결정적이며, 여기에는 감정 상태와 개인적 성향이 모두 관여합니다.

 

최근의 여러 연구가 시사하듯이, 오늘날 의대 및 치대 지원자들은 더 큰 기대, 더 높은 수준의 나르시시즘과 특권 의식(entitlement), 그리고 더 많은 불안과 정신적 문제를 갖는 경향이 있습니다. 따라서 이러한 세대적 변화를 고려하면서 피드백을 제공하는 것이 필수적입니다.

 

학생들이 평가받는 항목, 즉 주로 인간적 기술(human skills)이 아닌 술기적 기술(procedural skills)에 자연스럽게 집중한다는 점을 주목하는 것이 중요합니다. 치대생들은 프로그램의 어떤 측면이 긍정적인 보상을 가져다주는지 매우 빠르게 파악합니다. 그럼에도 불구하고, 교육자들은 이러한 거대한 장애물에도 불구하고 학생들이 PI(전문직 정체성)와 도덕적 추론을 발달시켜 유능하고 이타적인 치과 전문직업인이 될 수 있도록 이끌어야 하는 중요하면서도 도전적인 임무를 가지고 있습니다.

3.7 한계점 (Limitations)

더 큰 표본 크기는 데이터에 더 풍부한 관점을 더할 수 있었을 것입니다. 온라인 설문조사를 이용했다면 더 많은 참가자를 확보할 수 있었겠지만, 우리는 개정된 프로그램과 치과의사가 되어가는 여정에 대한 그들의 솔직하고 개방적인 성찰을 듣고 싶었기 때문에 개별 인터뷰를 선택했습니다.


4. 결론 (CONCLUSION)

PIF는 이 연구에서 확인된 바와 같이 개인적, 사회적, 환경적 측면의 영향을 받습니다. 이 세 가지 주요 측면 아래에서, 영역 특이적 자기효능감, 롤 모델링과 멘토링, 동료와의 전문직 사회화, 학습 환경(LE), 그리고 성찰이 학생들의 PIF에 기여하는 것으로 밝혀졌습니다. 학생들의 이야기를 듣고 녹취록을 읽어본 결과, 우리는 각 측면이 학생들의 성향과 배경에 따라 PIF에 서로 다른 중요도의 무게를 지닌다는 것을 발견했습니다.

 

잠재적 교육과정(hidden curriculum)은 학생들의 PIF에 기회와 위협을 모두 제공할 수 있습니다. PIF의 기여 요인들을 이해하는 것은 교육자들이 전문직 양성 프로그램에서 전문직업성을 함양할 수 있는 계획을 고안하는 데 큰 도움이 될 수 있습니다. 또한, 임상과 교실 모두에서 학습 환경(LE)을 개선하는 것은 학생들이 전문직 정체성을 형성하고 전문직업성으로 나아가는 데 결정적인 것으로 밝혀졌습니다.

 

 

표 1. 개방 코딩에서 식별된 주제와 개념

일반 주제 (General themes) 하위 주제 (Sub-theme) 주요 개념 (Main concept) 참조 수 (No. of ref.)
1. 교과목에 대한 코멘트 1-1 윤리 수업 (Ethics course) 1-1-1 내용이 유용하지 않음

1-1-2 내용이 중복됨

1-1-3 "윤리는 가르칠 수 없는 것임"

1-1-4 상식적인 내용임
20
  1-2 치과 진료 입문 (Introduction to dental practice) 1-2-1 내용이 적절하게 설명되지 않음

1-2-2 "감염 관리에 관한 것임"
17
2. 치과의사의 바람직한 자질 2-1 인본주의적 (Humanistic) 2-1-1 환자에 대해 연민과 공감을 가짐

2-1-2 환자와 유대감을 형성하고 편안하게 해줌

2-1-3 윤리적 진료

2-1-4 환자에게 친절하고 존경을 받음

2-1-5 환자 중심
5
  2-2 기술적 (Technical) 2-2-1 새로운 재료에 익숙함

2-2-2 환자 관리를 잘함

2-2-3 능숙함 (숙달됨)

2-2-4 문제 해결 능력
5
3. 치대 지원 동기 3-1 어릴 때부터 치과의사가 되기를 열망함   2
  3-2 내 사업을 함 (Being my own boss)   1
  3-3 호기심과 흥미   10
  3-4 타인을 돕고 싶은 욕구   1
  3-5 다른 치과의사에게 영감을 받음   1
  3-6 주어진 상황에 순응함 (Just take whatever comes) 3-6-1 의대 입학이 너무 어려워서 치대에 지원함

3-6-2 입학 전에는 직업에 대한 지식이 부족했음
4
  3-7 손으로 하는 일을 좋아함   2
  3-8 일과 삶의 균형 (Work-life balance)   2
4. 학습 경험 4-1 긍정적 학습 경험 4-1-1 현실 세계(실제 임상)에 적용 가능함

4-1-2 임상 강사와의 원활한 의사소통

4-1-3 강사가 학생들을 위해 시간을 내줌

4-1-4 동료들과의 네트워킹
6
  4-2 부정적 학습 경험 4-2-1 나쁜 롤 모델

4-2-2 환자 치료에 대해 임상 강사와 의견이 일치하지 않음

4-2-3 학습 환경이 불안하고, 위협적이며, 불편함

4-2-4 자신이 충분히 잘하지 못할 것이라는 스트레스를 받음
17
5. 성찰 5-1 성취도 조사(progress surveys)를 통해 1학년부터 4학년까지의 성장 과정을 성찰함   23
6. 학생들의 기대 6-1 효율적인 학습을 위해 교육과정을 변경함   18
  6-2 내용을 더 관련성 있게(유의미하게) 만듦   7
  6-3 수행해야 할 항목의 체크리스트를 제공함 6-3-1 학생들은 잘하고 싶어 한다는 점을 이해해야 함. 기대되는 바에 대한 체크리스트가 없으면 학생들은 길을 잃음 1
  6-4 임상 실습 시간이 더 많았으면 함 6-4-1 학생들은 능숙해지기를 원함 11
  6-5 더 나은 학생 대 강사 비율 6-5-1 학생들은 잘하고 싶어 하지만 지도해 줄 강사가 충분하지 않음 6
  6-6 UBC의 교육 내용은 국가고시에서 기대되는 내용과 약간 다름   1
  6-7 효율성과 관련성을 위해 교과목을 재구성함 6-7-1 윤리에 시간을 쏟기보다 실제 진료와 관련된 정보에 더 집중하기를 원함

6-7-2 병원 관리(practice management) 수업을 재구성해야 함(같은 내용이 나중에 다시 교육됨)
6
  6-8 문제 중심 학습 (Problem-based learning) 6-8-1 초기에 PBL은 의학에 맞춰져 있었음

6-8-2 PBL 토론을 하기 전에 정규 강의를 먼저 가르쳐야 함

6-8-3 일부 학생들은 PBL을 좋아함
4

 

 

표 2. 전문직 정체성의 구성 요소

구성 요소 (Components) 하위 구성 요소 (Sub-component) 예시 코멘트 (Example comments)
1. 영역 특이적 자기효능감

(Domain-specific self-efficacy)
유능해지고 싶은 욕구

(Desire to become competent)
"…모든 것을 완전히 파악하고 있어야 합니다. 좋은 치과의사가 되고 싶다면 새로운 재료, 새로운 기술을 알아야만 하죠..." 1

"저는 능숙해지고 싶습니다. 치과 시술을 하는 법, 환자를 관리하는 법, 모든 치과 재료와 모든 지식에 익숙해지는 것..." 2

"저는 자신이 하는 일에 매우 능숙하고, 자신의 기술(skill set)에 편안함을 느끼는 치과의사가 되고 싶습니다..." 3
 
"문제를 해결할 수 있고, 환자에게 친절하며, 환자들에게 존경받는 유능한 치과의사요..." 4
2. 롤 모델링과 멘토링

(Role modeling and mentoring)
긍정적 (Positive) "그녀는 그것을 학습 경험으로 만들어 주었습니다. 다시 말해, 긍정적인 학습 경험으로요. 그녀는 항상 시간을 내주었습니다. 정말 투명하고 상세한 이메일을 직접 타이핑해서 보내주는 식으로요..." 5
 
"우리에게는 가서 이야기할 수 있는 임상 지도 교수님이 계십니다..." 6
  부정적 (Negative) "그녀는 환자들 앞에서 학생들을 질책했습니다... 내내 학생 주위를 맴돌며 숨통을 조여왔고, 마치 얼굴의 주근깨 하나하나까지 재는 것 같았습니다..." 7

"...때로는 말이 안 될 때도 있었고, 온갖 바보 같은 이유로 전문직업성(professionalism) 점수를 낙제시키는 사건들도 있었습니다..." 8
3. 동료와의 전문직 사회화

(Professional socialization with peers)
동료와의 네트워킹

(Networking with peers)
"...여기서는 의사소통 기술을 배우고 사회적 네트워크를 구축하는 것이 정말 컸습니다..." 9

"저는 동기들과 함께 나눈 동료애가 정말 즐거웠습니다..." 10

"우리는 BC주라는 꽤 작은 치과의사 사회에 속해 있기 때문에, 앞으로 나아갈 때 의지할 수 있는 사람들과 연결고리를 갖는다는 것이 좋게 느껴집니다..." 11
4. 학습 환경

(Learning environment)
조직적 변화 (예: 임상, 학생-교사 비율, 교실, 교육과정)

(Organizational changes)
"...그게 제가 골드 클럽(gold club)에 가입한 이유입니다. 거기는 강사 비율이 2 대 1이거든요... 그분들은 대신 해주지 않아요. 정말 학생을 가르칠 시간이 있기 때문에 아주 좋죠. 하지만 원내생 진료실(clinic)에서는 제 담당 강사님이 전부 다 해버리셨어요. 학생이 너무 많아서 시간이 뒤처지니까요..." 12

"왜 우리가 치위생과와 더 좋은 관계를 맺지 못하는지, 왜 치위생과에 위임하지 않는지 정말 이해가 안 갑니다... 우리는 치주 환자를 다 볼 시간이 없어요. 그건 우리 치주 환자들에게도 사실 불공평하다고 생각해요..." 13

"죄송하지만, 저는 노인치과학(geriatrics) 같은 몇몇 과목은 그냥 시간 채우기용(fillers) 같다고 느꼈습니다." 14

"윤리 원칙은 좋았지만, 제 치의학 지식이나 열정에 어떤 식으로든 많이 기여했다고 생각하지 않습니다. 이미 알고 있는 내용이라 시간 낭비처럼 느껴질 정도였어요..." 15

"병원 관리(practice management) 수업은 훨씬 더 유용한 코스로 재구성될 수 있을 것 같습니다." 16

"...우리가 PBL(문제 중심 학습)에 많은 비중을 두는 건 알지만, 저는 정말 강의가 먼저여야 한다고 생각합니다. 이런 내용을 우리 스스로 배우게 해서는 안 됩니다. 스스로 가르치고 나서 금요일에 와서야 특정 주제에 대해 깨우치게 되는 식이어선 안 되죠... 반대 순서로 하는 건 말이 안 됩니다..." 17
5. 성찰

(Reflection)
성취도 조사를 통해 1학년부터 4학년까지의 성장 과정을 성찰함

(Reflection on their progress)
"대부분의 성취도 조사(progress surveys)에서 제가 항상 부족하다고 느끼는 과목이 하나씩 있다는 걸 확실히 알아차립니다..." 18
 

"...그것은 제 결점이 어디인지, 제가 어떤 과목에서 조금 소홀했는지 깨닫게 해주었습니다... 돌아가서 그것에 대한 치의학적 사실들을 더 읽어보거나, 질문에 답해보거나, 아니면 그냥 예전 노트를 다시 볼 것입니다..." 19
 

"...만약 학급 전체와 비교했을 때 부족했다면, 그 부분들이 개인적으로 시간을 좀 더 투자하고 싶은 영역일 것입니다..." 20
 

"저는 개인적으로 그게 딱 저를 위한 것이라고 느낍니다. 자신의 성장 과정을 보는 것이 흥미롭기 때문에 유용한 보조 수단이라고 생각합니다. 음, 하지만 저와 제 성격을 알기에, 저는 아마 (성취도 조사가 없었어도) 문제은행(question bank)이나 덴탈 덱(dental decks)을 보는 똑같은 방식을 취했을 겁니다." 21

 

 

J Dent Educ. 2024 Oct;88(10):1347-1357. doi: 10.1002/jdd.13587. Epub 2024 May 25.

Experiences of junior dental faculty transitioning from clinician to educator

 

 

🦷 치과의사에서 교수님으로: 신임 치과대학 교원들의 리얼한 적응기

안녕하세요! 오늘은 치과의사(임상가)에서 대학 강단에 서는 교육자로 변신한 분들의 이야기를 담은 흥미로운 논문을 소개해 드리려고 합니다.

많은 치과대학 교수님들이 개원가나 병원에서 환자를 진료하다가 학교로 오시게 되는데요. 과연 이 '전환(Transition)' 과정은 순탄하기만 할까요? 최근 Journal of Dental Education에 실린 "Experiences of junior dental faculty transitioning from clinician to educator"라는 논문을 통해 그 속사정을 들여다보았습니다.

1. "치료는 베테랑이지만, 가르치는 건 초보?" (지도와 멘토링의 부재)

연구에 참여한 신임 교수님들이 가장 많이 호소한 어려움은 바로 '가르치는 법'을 배운 적이 없다는 것이었습니다.

  • 준비 부족: 임상 실력은 출중하지만, 학생들을 어떻게 지도하고 평가해야 하는지, 수업은 어떻게 구성해야 하는지에 대한 공식적인 교육(Pedagogy)을 받지 못한 채 강단에 서게 됩니다.
  • 맨땅에 헤딩: 공식적인 멘토가 없는 경우가 많아, 알음알음 동료에게 물어보거나 자신의 학창 시절 기억을 더듬어 '내가 배웠던 방식 그대로' 가르치게 되는 경우가 많다고 합니다.
  • 필요한 것: 교수님들은 "신임 교원 핸드북"이나 체계적인 "멘토링 프로그램"이 절실하다고 입을 모았습니다.

2. "왜 학교로 오셨나요?" (의외의 동기: 신체적 부상)

이 논문에서 발견한 아주 독특하고 현실적인 동기가 있습니다. 바로 '신체적 부상(Physical Injury)'입니다.

  • 치과 진료 특성상 목, 허리, 어깨 등에 고질적인 통증을 앓는 분들이 많은데, 더 이상 장시간 임상 진료를 지속하기 어려워 학교라는 새로운 진로를 선택한 경우가 꽤 많았습니다.
  • 물론, 존경하던 은사님의 영향이나 교육자 집안의 내력 덕분에 교육에 뜻을 품고 오신 분들도 많았고요.

3. "힘들지만, 학생들 덕분에 웃습니다" (직무 만족도)

행정 업무는 생각보다 많고, 수업 준비는 막막하지만, 그럼에도 불구하고 교수님들의 직무 만족도는 꽤 높았습니다.

  • 보람의 원천: 가장 큰 이유는 역시 '학생들'이었습니다. 모르던 것을 깨우치는 학생들의 눈빛(lightbulb moments)을 볼 때, 그리고 제자들과 멘토링 관계를 맺어갈 때 임상에서는 느끼지 못했던 큰 기쁨을 느낀다고 합니다.

📝 요약 및 시사점

이 연구는 치과대학이 훌륭한 임상가를 뽑는 것에서 그치지 않고, 그들을 '훌륭한 교육자'로 길러내는 시스템을 갖춰야 함을 시사합니다. 임상가에서 교육자로의 변신은 저절로 이루어지는 것이 아닙니다. 신임 교수님들이 교육 현장에서 헤매지 않고 안착할 수 있도록 공식적인 교육(Onboarding)과 따뜻한 멘토링이 뒷받침될 때, 학생들도 더 양질의 교육을 받을 수 있지 않을까요?

 


1. 서론 (INTRODUCTION)

신임 치과대학 교원의 절반 이상이 개원가나 민간 부문 출신이며, 종종 교육에 대한 정식 훈련을 전혀 받지 않은 상태로 임용됩니다. 이러한 교수 학습 이론에 대한 지식 부족은 교원들이 자신이 배운 방식 그대로 가르치도록 영향을 미칩니다. 최근 수십 년 동안 치의학을 포함한 고등교육에서는 교사 중심에서 학생 중심 접근법으로 변화해야 한다는 요구가 있었습니다. 이 접근법에서는 학생이 어떻게 배우는지에 초점을 맞추며, 교사는 학생들이 자신의 학습을 위한 자원을 찾도록 돕는 안내자 역할을 합니다. 수업 활동 또한 강의식 스타일에서 학생들의 참여를 유도하는 보다 능동적인 학습 스타일로 변화합니다.

 

Bassir 등의 체계적 문헌 고찰에 따르면, 문제 중심 학습(PBL)은 1990년대 후반부터 널리 도입되어 연구되어 왔습니다. 저자들은 PBL이 학생들의 임상 상황 지식 적용 능력을 향상시키며, 학생들이 느끼는 준비도를 높인다고 주장합니다. 이러한 변화들로 인해 치과대학 교원들은 익숙하지 않은 방식으로 가르칠 것을 요구받고 있으며, 이는 교원과 학생 모두에게 좌절감을 줄 수 있습니다. 이 문제를 해결하기 위해 교원들은 강의실 및 임상 교육 모두에서 학생 중심 교수법에 대한 훈련을 받아야 합니다.

 

치과대학 교원들은 이러한 교수 학습 스타일에 대해 배우기 위해 스스로 자원을 찾거나 소속 기관이 개발한 교수개발 프로그램에 의존해야 합니다. 많은 교수개발 프로그램이 개발되었지만, 문헌상에서 해당 프로그램이 어떻게 개발되었는지 보고하는 경우는 드뭅니다. 따라서 초임 교육자들의 구체적인 요구가 강조되지 않았을 수 있습니다. 이 연구는 사회인지진로이론(Social Cognitive Career Theory, SCCT)의 렌즈를 통해 임상가에서 교육자로 전환하는 치과대학 신임 교원의 경험을 기술합니다.

1.1 사회인지진로이론 (Social cognitive career theory)

Lent 등이 개발한 진로 발달에 대한 사회인지적 접근, 즉 훗날 SCCT로 알려진 이론이 연구 설계 및 데이터 분석의 프레임워크로 사용되었습니다. SCCT는 Bandura의 일반 사회인지이론에 근거를 두고 있으며, 개인적 속성, 외부 환경적 요인, 외적 행동이 상호작용하는 구성요소로서 서로에게 영향을 미친다는 삼원 상호인과 모델(triadic reciprocal model of causality)을 채택합니다. 개인이 경력을 개발함에 있어 자기효능감(self-efficacy) 신념, 결과 기대(outcome expectations), 개인적 목표(personal goals)의 상호작용적인 역할은 개인의 직업적 흥미, 진로 목표 및 결정에 영향을 미칩니다.

 

SCCT는 사람들이 자신의 진로 선택에 있어 어느 정도의 자기주도권을 행사할 수 있다고 가정하지만, 그 선택은 환경적 지지나 장벽과 같은 다른 변수들과 연결되어 있습니다. 이 이론은 특정 진로 선택으로 이끄는 요인뿐만 아니라 개인이 해당 진로 내에서 어떻게 성공과 안녕(well-being)을 경험하는지도 포괄합니다. SCCT는 흥미(interest), 선택(choice), 수행(performance), 만족(satisfaction), 자기관리(self-management)라는 5가지의 중첩된 모델로 구성됩니다. 자기효능감, 결과 기대, 목표라는 세 가지 기본 원칙은 5가지 모델 각각에서 나타나며, 성별, 인종, 민족, 환경, 학습 경험과 같은 다른 측면들과 함께 작용하여 개인의 학문적 및 진로 발달을 형성하고 안내합니다. 연구 질문(Research questions)은 SCCT의 5가지 중첩 모델 각각을 목표로 개발되었으며 그림 1에 제시되어 있습니다.

 

(그림 1에 대한 설명: 연구 질문들이 사회인지진로이론의 렌즈를 통해 제시됨)

  • 흥미(Interests) & 선택(Choice): 왜 치과 개원의들은 교육자가 되기를 선택하는가?
  • 수행(Performance): 임상가들은 임상가에서 교육자로 전환하기 위해 스스로를 어떻게 준비하는가?
  • 만족(Satisfaction): 신임 치과대학 교원들은 임상가에서 교육자로 전환하는 경험을 어떻게 묘사하는가?
  • 자기관리(Career Self-management): 신임 치과대학 교원들은 새로운 역할에 진입한 후 교수 기술을 지속적으로 개발하기 위해 어떻게 하는가?



 

Figure 1은 이 연구의 이론적 기반인 사회인지진로이론(Social Cognitive Career Theory, SCCT)을 프레임워크로 사용하여, 연구 질문(Research Questions)들이 이론의 어떤 구성 요소와 연결되는지를 도식화한 개념도입니다. 이 그림은 크게 핵심 기제(Core Mechanisms)와 이를 둘러싼 5가지 모델(SCCT Models), 그리고 이에 대응하는 연구 질문으로 구성되어 있습니다. 상세한 설명은 다음과 같습니다.

1. 핵심 3요소 (The Core Triad)

그림의 가장 상단 원 안에 있는 세 가지 요소는 SCCT의 핵심 동력으로, 서로 상호작용하며 진로 발달에 영향을 미칩니다.

  • Self-Efficacy (자기효능감): 특정 과업을 수행할 수 있다는 자신의 능력에 대한 신념.
  • Outcome Expectations (결과 기대): 특정 행동을 했을 때 발생할 결과에 대한 예상.
  • Goals (목표): 특정 결과를 달성하려는 의도나 결심.

2. SCCT의 5가지 모델과 연구 질문의 연결

이 핵심 요소들은 아래의 5가지 모델로 확장되어 구체적인 연구 질문과 1:1로 매핑됩니다.

 

A. 흥미(Interests) 및 선택(Choice) 모델

  • 이 두 모델은 개인이 진로에 흥미를 느끼고 실제로 그 진로를 선택하는 과정을 설명합니다.
  • 연결된 연구 질문: "왜 치과 개원의들은 교육자가 되기를 선택하는가?" (Why do dental practitioners choose to become educators?) .
  • 의미: 임상 현장에 있던 치과의사들이 왜 학계로 진로를 변경했는지 동기를 탐구합니다.

B. 수행(Performance) 모델

  • 개인이 선택한 진로에서 실제로 업무를 수행하고 성취하는 수준을 다룹니다.
  • 연결된 연구 질문: "임상가들은 임상가에서 교육자로 전환하기 위해 스스로를 어떻게 준비하는가?" (How do clinicians prepare themselves to transition from clinician to educator?) .
  • 의미: 교육자로서의 '수행'을 위해 어떤 사전 준비나 훈련 과정을 거쳤는지 묻습니다.

C. 만족(Satisfaction) 모델

  • 직업 환경에서의 만족도와 전반적인 안녕감(well-being)을 다룹니다.
  • 연결된 연구 질문: "신임 치과대학 교원들은 임상가에서 교육자로 전환하는 경험을 어떻게 묘사하는가?" (How do junior dental faculty describe their experiences transitioning from clinician to educator?) .
  • 의미: 실제 전환 과정에서 겪는 긍정적(만족) 또는 부정적 경험을 탐색합니다.

D. 경력 자기관리(Career Self-management) 모델

  • 변화하는 환경 속에서 자신의 경력을 지속적으로 관리하고 적응해 나가는 과정을 설명합니다.
  • 연결된 연구 질문: "신임 치과대학 교원들은 새로운 역할에 진입한 후, 교수 기술을 지속적으로 개발하기 위해 어떻게 하는가?" (How do junior dental faculty continue to develop their teaching skills once they enter their new role?) .
  • 의미: 교육자가 된 이후에도 어떻게 역량을 개발하고 경력을 관리하는지 묻습니다.

요약

즉, Figure 1은 연구자가 단순히 무작위로 인터뷰 질문을 던진 것이 아니라, '진로 선택의 동기(흥미/선택) -> 준비 과정(수행) -> 실제 경험(만족) -> 지속적인 개발(자기관리)'이라는 이론적 흐름에 따라 체계적으로 연구를 설계했음을 보여주는 로드맵입니다.



2. 연구 재료 및 방법 (MATERIALS AND METHODS)

이 연구는 유타 대학교(University of Utah, IRB 00169492)와 A.T. Still University(DW20232901-001)의 임상연구심의위원회(IRB)에 의해 전체 위원회 심의 면제(exempt from full board review)로 결정되었습니다.

2.1 연구 설계 (Study design)

임상가에서 교육자로 전환하는 치과대학 신임 교원의 경험을 조사하기 위해 질적 다중 사례 연구(qualitative multiple case study) 설계를 사용했습니다.

2.2 표본 (Sample)

모집단은 전임(full-time) 신임 치과 교육자로, 이는 5년 이하의 교육 경력을 가지고 있으며 임상 및 강의실 환경에서 가르친 경험이 있는 자로 정의했습니다. 참여자들은 미국 마운틴 웨스트(Mountain West) 지역에 위치한 중규모 치과대학 한 곳에서 유의 표집(purposive sampling) 전략을 사용하여 모집했습니다. 이 연구 프로젝트의 목표 표본 크기는 15~25회의 인터뷰 또는 자료 포화(data saturation)에 도달할 때까지였습니다.

2.3 참여자 모집 (Participant recruitment)

연구 장소의 교무처(Office of Faculty Affairs)에서 제공하고 학장의 승인을 받은 목록에서 자격이 있는 모든 참여자에게 모집 이메일을 발송했습니다. 모집 이메일에는 참여 의사를 표시할 수 있는 링크와 함께 연구의 목적이 기술되어 있었습니다. 참여자가 관심을 표명하면 DocuSign을 통해 동의서를 발송했으며, 여기에는 인터뷰 일정을 잡을 수 있는 링크가 포함되었습니다. 초기 모집 이메일에 응답이 없는 경우, 1주일 후 독려 메일(reminder)을 발송했습니다. 잠재적 참여자가 관심이 없다고 표시한 경우 더 이상의 연락은 취하지 않았습니다. 인터뷰가 예약되면 참여자는 Zoom 링크와 인터뷰 지침이 포함된 확인 이메일을 받았습니다.

2.4 데이터 수집 (Data collection)

연구자는 SCCT를 프레임워크로 사용하여 인터뷰 가이드(그림 2 참조)를 개발했습니다. 가이드는 인터뷰 중에 사용할 개방형 질문, 후속 질문, 프롬프트로 구성되었습니다. 도구의 타당성을 확보하기 위해 독립적이고 경험이 풍부한 치과 교육 연구자 3명이 인터뷰 가이드를 검토했습니다. 또한 본 연구에 참여하지 않은 2명의 참여자를 대상으로 도구의 파일럿 테스트를 진행하였으며, 가이드에 두 가지 질문이 추가되었습니다.

 

모든 인터뷰는 시간 및 비용 제약으로 인해 저자가 직접 수행했으며 Zoom 화상 회의 소프트웨어를 사용하여 녹음되었습니다. 참여자의 비밀 보장을 위해 각 참여자에게는 고유 식별 번호(ID number)가 부여되었습니다. 인터뷰 진행 중 연구자는 인터뷰 가이드를 따랐으며 참여자가 묘사한 주제를 탐구하기 위해 후속 질문을 던졌습니다. 인터뷰가 끝날 무렵, 연구자는 참여자의 진술을 요약하여 이해한 내용을 확인하고 명확하지 않은 부분에 대한 설명을 구했습니다(member checking). 필요한 경우 이메일을 통해 참여자에게 후속 연락을 취했습니다. 녹취록은 있는 그대로(verbatim) 전사되었으며 전사 직후 분석되었고, 연구자가 더 이상 새로운 정보를 듣지 못한다고 판단했을 때 자료 포화(data saturation)가 충족된 것으로 간주하여 추가 인터뷰는 진행하지 않았습니다.

2.5 데이터 분석 (Data analysis)

모든 참여자에게 인구통계학적 질문을 하였으며, 답변은 NVivo 14 (Lumivero)에 속성(attributes)으로 기록되었습니다. 수집된 인구통계학적 데이터에는 연령, 성별 정체성, 개인 병원 임상 경력(년), 교육 경력(년), 치과 전문 분야가 포함되었습니다. 전사 과정의 오류를 수정하기 위해 데이터 클리닝을 수행했습니다. 모든 개인적인 언급은 참여자의 ID 번호로 대체되었으며, 동료나 기관에 대한 언급은 일반적인 묘사로 대체되었습니다.

 

데이터 분석은 단어 빈도 쿼리와 연역적 코딩(deductive coding)을 사용한 탐색적 분석으로 시작되었습니다. 연구자는 코딩 매트릭스를 사용하여 코드를 검토하고 데이터를 잠재적으로 더 넓은 주제로 분류할 수 있도록 했습니다. 분석은 귀납적 코딩(inductive coding)으로 이어졌으며, 이후 주제 분석(thematic analysis)을 통해 데이터에서 두드러진 주제(salient themes)를 개발했습니다.

3. 결과 (RESULTS)

이 연구는 초기에 모집된 15명 중 12명의 참여자가 포함되었습니다. 한 참여자는 임상 및 강의(didactic) 환경 양쪽의 책무를 가지고 있지 않아 제외되었고, 다른 두 명은 참여하지 않기로 결정했습니다. 참여자의 속성은 표 1에서 확인할 수 있습니다. 데이터 분석 결과 지도(Guidance), 직무 만족도(Job satisfaction), 동기 요인(Motivating factors)이라는 세 가지 두드러진 주제가 밝혀졌습니다.

3.1 주제 1: 지도 (Guidance)

주제로서의 '지도'는 멘토링, 준비, 동료를 포함하여 참여자들이 제시한 다양한 하위 주제를 포괄합니다. 이는 그림 3의 개념도에서 시각화할 수 있습니다. 연구 결과에 따르면, 5년 이하의 임상 경력을 가진 참여자들은 지도와 지원에 대한 더 큰 필요성을 표현했습니다. 표 2는 이러한 참여자들의 직접 인용문을 제시하며, 지도라는 주제에 대한 그들의 관점을 강조합니다. 반면, 16년 이상의 임상 진료 경력을 가진 참여자들은 자신의 직업 경험이 임상 강사 역할에 대해 충분히 준비시켜 주었으며 많은 지도가 필요하지 않다고 믿었습니다.

 




Figure 3은 본 연구에서 도출된 첫 번째이자 가장 두드러진 주제인 '지도(Guidance)'의 구성 요소를 시각화한 개념도(Concept Map)입니다. 이 그림은 신임 교원들이 학계에 적응하는 과정에서 필요로 하거나 경험한 '지도'가 단순히 하나의 요소가 아니라, 크게 멘토링(Mentorship)준비(Preparation), 동료(Colleagues)라는 세 가지 핵심 축으로 이루어져 있음을 보여줍니다.

 

그림의 세부 구성 요소는 다음과 같습니다:

 

1. 멘토링 (Mentorship)

  • 경력 발전 (Career Progression): 멘토링은 단순한 업무 지시를 넘어 장기적인 경력 개발과 목표 설정을 위해 필수적인 요소로 연결됩니다. 연구 참여자들은 일상 업무뿐만 아니라 '경력 계획'을 위한 공식적인 멘토링을 강력히 원했습니다.

2. 준비 (Preparation)

  • 공식적 (Formal): 신임 교원으로서의 역할 수행을 위한 학교 차원의 공식적인 훈련이나 오리엔테이션을 의미합니다.
  • 미래 훈련 (Future Training): 일회성에 그치지 않고 지속적인 교수 기술 개발을 위한 훈련이 포함됩니다.
  • 학회 (Conferences): 외부 학회 참석 등을 통한 배움의 기회도 준비 과정의 일부로 연결되어 있습니다.

3. 동료 (Colleagues)

 

참여자들이 공식적인 준비나 멘토링이 부족할 때 가장 많이 의존했던 대상이 바로 동료입니다. 동료는 다음과 같은 다양한 기능을 제공하는 원천으로 묘사됩니다.

  • 협업 (Collaboration): 교육 및 업무 협력.
  • 네트워킹 (Networking): 학계 내 관계 형성.
  • 역할 모델 (Role Model): 보고 배울 수 있는 선임 교수나 동료.
  • 자원 (Resources): 필요한 자료나 정보를 얻는 출처.
  • 캘리브레이션 (Calibration): 평가 기준 등을 동료와 맞추는 과정.

요약

즉, Figure 3은 신임 교원들이 '지도(Guidance)'를 받을 때, 공식적인 멘토링과 체계적인 준비(훈련)가 부족할 경우 동료들에게 의존하여 자원, 협업, 역할 모델 등을 찾게 되는 구조를 한눈에 보여주는 그림입니다.


예를 들어, 새로운 역할에 대한 준비를 했느냐는 질문에 참여자 13은 "아니요, 34년의 개원가 생활, 그게 다입니다 [웃음]."라고 답했습니다. 마찬가지로 참여자 2는 "평생 임상가로 살았고, 임상 감독으로 들어가는데, 특히 군대 배경이 있어서 우리는 어쨌든 임상 감독을 했었습니다... 그래서 저는 그 부분에 대해서는 어떤 지도도 필요하지 않다고 생각했습니다. 같은 맥락에 있었으니까요."라고 말했습니다.

 

관점의 차이에도 불구하고, 모든 참여자는 새로운 역할을 시작할 때 더 많은 공식적인 준비와 멘토링에 대한 열망을 표현했습니다. 참여자들은 일상적인 업무와 관련해서, 그리고 가장 중요하게는 경력 계획(career planning)을 위해 더 많은 공식적인 멘토링이 필요함을 강조했습니다. 멘토링 필요성에 대한 참여자들의 직접 인용문은 표 2에서 볼 수 있습니다. Haden 등도 멘토링과 관련하여 유사한 불만족을 보고했습니다. 저자들은 참여자의 42%만이 대학에서 받은 멘토링에 매우 만족하거나 만족한 반면, 25%는 불만족하거나 매우 불만족했고, 12%는 '해당 없음(N/A)'으로 응답했는데 이는 멘토링이 없었거나 참여자가 질문에 답하지 않았음을 의미할 수 있다고 진술했습니다.

 

대다수의 참여자는 공식적인 준비가 부족했기 때문에 스스로 자원을 찾거나, 시행착오에 의존하거나, 자신의 학생 시절 경험을 사용하여 교수 스타일을 잡았다고 언급했습니다. 동료들 또한 지원, 네트워킹, 협업, 기술 개발 및 역할 모델을 위한 귀중한 자원으로 확인되었습니다. 많은 참여자가 공통적으로 요청한 것은 신임 교원을 위한 종합적인 핸드북이었습니다. 이 핸드북에는 교수 학습 자료, 임상 절차, 진료실에서 사용하는 재료, 조직 구조, 위원회 및 연락처 정보가 포함되어야 한다고 제안되었습니다.

 


표 2. 지도(Guidance)라는 주제에 대한 참여자들의 직접 인용문

 

 

주제 (Topic) 인용문 (Quote)
멘토링 (Mentorship) "제 생각에는 그 부분에 대해 더 많은 멘토링이나 지도가 필요합니다. 왜냐하면 우리는 연구를 하는 교수진과는 다르기 때문입니다. 그들은 이전에 멘토가 있었고, 자신의 경력에서 역할 모델을 찾을 수 있었습니다. 하지만 개원의로서, 치과의사로서 있다가 이제 막 교육으로 들어온 우리에게는 (멘토를 찾는 것이) 조금 어렵다고 생각합니다."
공식적인 준비 (Formal preparation) "초기에, 특히 제가 가졌던 그 모든 질문들을 고려할 때, 그런 식의 좀 더 구조화된 회의가 있었더라면 좋았을 것이라고 생각합니다."

"이곳의 신임 교원으로서, 저는 우리가 앞으로 자신을 개발하는 방법과 향상시키는 방법에 대해 더 많은 자원이나 지도를 받을 수 있기를 정말로 희망합니다. 그리고 결국에는 학교와 학생들을 위해 더 나아질 수 있기를 바랍니다."

"구체적으로 의지할 수 있는 누군가가 있다면 도움이 될 것입니다. 이 직업은 특히 행정부와 감독하는 분들이 학생과 교원을 위해 문을 열어두고 언제든 대화할 의향이 있다는 점이 좋습니다. 하지만 첫 한두 달 동안만이라도 전담해 줄 누군가가 있다면 확실히 유익할 것이라고 생각합니다."

"미래에 좀 더 체계적인 교육이나 훈련이 있다면 정말 좋을 것이라고 말씀드리고 싶습니다. 왜냐하면 저는 학교에서 치과의사가 되도록 훈련받았지, 가르치는 일은 해본 적이 없기 때문입니다. 우리는 훌륭한 강사가 되는 법을 들어본 적이 없습니다. 그래서 그 측면에서 더 많은 정보나 지도를 받을 수 있다면 정말 좋을 것입니다."
기술 개발 (Skills development) "공식적인 교육 환경 밖에서 학생과 교원 사이의 상호작용이나 관계를 어떻게 이끌어갈지, (단순히) 사교적인 것이나 외부적인 것이 아니라, 그들이 최고가 될 수 있도록 멘토링하거나 돕는 방법을 (배우고 싶습니다)."

"그게 바로 제가 찾고 있는 것입니다. 여기서 오래 일할수록 더 필요하다고 느끼기 때문입니다. 저는 학생들을 가르치는 방법과 제 교수 기술을 향상시키는 방법에 대한 특별한 훈련이 필요합니다."

"저는 때때로 궁금한 점이 있어도 누구에게 도움을 청해야 할지, 누가 제 질문에 답해줄 수 있을지 모르겠다고 분명히 느낍니다. 제 동료들을 보면 다들 10년이나 20년 이상의 개원 경력이 있지만 저는 그렇지 않거든요. 저도 정말 그들만큼 잘하고 싶습니다."

"다가오는 해의 목표는 그것에 참석해서 더 협력적인 교수법과 무엇이 효과적이고 무엇이 그렇지 않은지를 배우는 것입니다. 외부에 다른 프로그램들이 있는지, 혹은 우리가 일을 어떻게 처리할 수 있는지 (알고 싶습니다)."

"저는 또한 전문성 개발에 대한 교육이나 지도를 받을 수 있었으면 합니다. '자, 이것들이 효과적인 교원이 갖춰야 할 기술들이고, 이렇게 하면 도달할 수 있다'라고 알려주거나, '그래, 나는 지금 이 위치에 있고 교원이지만, 시간이 지나면서 이렇게 발전해 나갈 것이다'라는 지침을 얻고 싶습니다. 저는 그런 미래에 대한 비전이 없습니다."
네트워킹 (Networking) "저는 동료들과 이야기합니다. 저는 [전문 분야] 연례 학술대회 기간 동안 열리는 학부 및 치과 교육 워크숍의 [전문 분야] 모임에서 많은 것을 얻습니다. 그곳에서, 그리고 동료들과의 대화에서 많은 것을 얻습니다."

 

3.2 주제 2: 직무 만족도 (Job satisfaction)

인터뷰 중 참여자들이 공유한 견해는 학계의 세계와 교육 경력의 다면적인 성격을 엿볼 수 있게 해줍니다. 직업에 따르는 도전과 성공에도 불구하고, 대부분의 참여자는 전문직에 대한 애정을 표현했습니다. 참여자들은 직업과 관련된 도전과 성공이 직업 자체의 성격과 그들이 가르치는 학생들 모두에게 기인할 수 있다고 밝혔습니다.

 

표 3은 참여자들의 경력에서 마주친 성공과 도전에 대한 통찰을 제공하는 직접 인용문을 포함합니다. 참여자들이 언급한 한 가지 중요한 도전 과제는 최신 정보를 유지하고 혁신적이고 흥미로운 방식으로 가르치는 것이었습니다. 또한, 몇몇 참여자는 강의식 수업(didactic teaching)과 학습의 기초에 대한 어려움을 공유했습니다. 반면, 많은 참여자는 해마다 학생들의 성장을 목격하는 것과 학생-교사 관계가 그들 직업의 중요한 측면이라는 점을 성공 사례로 보고했습니다.

 


표 3. 주제 2: 직무 만족도에 대한 참여자들의 직접 인용문 1

주제 (Topic) 인용문 (Quote)
직무 만족도 (Job satisfaction) "놀랍기도 하지만, 사실 놀라지 말았어야 했다고 생각합니다. 왜냐하면 그게 제가 가장 기대했던 것 중 하나였으니까요. 바로 임상 지도에서 얻는 기쁨, 의미, 그리고 가치입니다. 스스로에 대한 확신이 없던 학생들이 처음으로 무언가에 성공하는 모습을 보는 것은 정말 멋진 일입니다... 제 직업의 가장 좋은 점이 무엇인지 이야기할 때 바로 그것을 꼽게 된다는 점이 (스스로도) 놀랍습니다." 2
  "다릅니다. 좋기는 하지만, 그 모든 행정 업무는 예상하지 못했습니다. 저는 환자를 보는 게 스트레스라고 생각했거든요. 환자를 그렇게 많이 보지 않는다면, 다른 어떤 일이 환자를 보는 것만큼 스트레스를 줄 수 있겠느냐고 생각했었죠. 그 점이 저에게는 좀 달랐습니다(예상 밖이었습니다)." 3
  "학생들이 자신의 교육에 대해 과도한 통제권을 쥐고 있는 것처럼 느껴집니다. 제 생각에 우리는 학생들에게 '어떻게 배우는 것이 가장 좋은지'를 너무 자주 묻고, 이는 결국 그들의 성공에 대한 책임을 우리에게 전가시킵니다. 그래서 학생들이 성공하지 못하면, 그건 교수가 제대로 가르치지 않았기 때문이 되어버립니다. 그보다는, (학생이) 이 과정을 잘 수행하기 위해 반드시 달성해야 할 기준(benchmarks)들이 존재해야 합니다." 4
  "교육 현장에서 학생과 부정적인 상호작용이 있었더라도, 이후에 '제 의도는 이런 것이었습니다'라고 설명하는 대화를 나누고, 그것이 학생과의 매우 헌신적이고 의미 있는 멘토 관계로 발전하게 되는 것... 그것이 저에게는 가장 큰 성공 중 하나였습니다." 5
  "그래서 그건, 적어도 저에게는 엄청난 성공담입니다. 본과 3학년(D3) 중반쯤 학생들의 머릿속에 서서히 깨달음의 불이 켜지는 것을 보고, 본과 4학년(D4)이 되었을 때 그들이 성장해서 마치 잘 굴러가는 기계처럼 능숙해져 있는 모습을 보는 것 말입니다." 6

 

3.3 주제 3: 동기 요인 (Motivating factors)

마지막 주제는 치과 전문인들이 학계로 이동하게 된 배경 동기에 관한 것입니다. 몇몇 참여자는 신체적 부상이 경력 변경을 고려하게 된 계기라고 언급했습니다. 이들은 등과 목 부상으로 고통받았으며, 이는 임상 진료를 축소시키고 대안적인 고용 옵션을 필요하게 만들었습니다. 또한, 16년 이상의 임상 경력을 가진 5명의 참여자 중 3명에게 영향을 미친 예상치 못한 상황은 건물주의 변경이나 진료실 공간을 임대한 건물의 철거였습니다. 참여자 7은 다음과 같이 공유했습니다:

"저는 28년 동안 같은 공간에 있었습니다. 공간을 임대하고 있었는데 건물주가 바뀌었죠. 병원을 옮기거나 리모델링해야 했는데... 병원 이전과 관련된 모든 요소와 비용을 따져봤을 때, 그것은 '퍼펙트 스톰(총체적 난국)'이었습니다."

 

참여자들이 공유한 긍정적인 동기 요인 중 하나는 학계에 종사하는 가족 구성원의 영향이었습니다. 많은 참여자가 가족 구성원들이 어린 시절부터 교육에 대한 사랑을 심어주었다고 공유했습니다. 참여자 2는 "저는 교육자 집안 출신입니다. 어머니와 아버지가 모두 교사셨죠. 친할아버지, 친할머니 두 분 다 대학 교수셨습니다."라고 말했습니다.

 

대다수의 참여자는 치과대학에서의 이전 노출이나 경험으로 인해 치과 교육자가 되고자 하는 동기를 부여받았습니다. 이러한 경험의 영향은 긍정적이기도 하고 부정적이기도 했습니다. 예를 들어, 일부 참여자는 치과 교육자들이 늙고 은퇴했으며 실제 세상에서는 일할 수 없고 군대식 교육 스타일을 가지고 있다는 오해를 가지고 있었습니다. 그러나 일부 참여자는 치과 교육자들과 긍정적인 경험을 했으며, 이는 그들 자신이 교육자가 되도록 동기를 부여했습니다. 참여자 3은 "저는 그들이 가르치는 방식에서 배웠고, 다른 하나는 학생으로서의 제 경험에 바탕을 두고 있습니다. 저는 좋은 선생님이 어떠해야 하는지에 대한 그림을 가지고 있고, 그것이 제가 하려고 노력하는 것입니다."라고 공유했습니다. 궁극적으로, 치과 교육자들과의 이전 경험은 참여자들이 좋은 교육자의 기존 행동을 모델링하도록 하는 촉매제 역할을 했습니다.

4. 논의 (DISCUSSION)

지도(Guidance)멘토링, 준비, 동료라는 세 가지 하위 주제로 구성된 가장 두드러진 주제로 밝혀졌습니다. 이 주제는 사회인지진로이론(SCCT)의 수행(performance) 모델과 밀접한 관련이 있습니다. 신임 교원에게 공식적인 멘토와 준비 과정을 제공하면 교원의 자기효능감이 향상되어, 결과 기대를 개선하고 새로운 직업적 목표를 장려할 수 있습니다.

 

이 연구의 참여자 대부분은 학계 생활을 시작할 때 지정된 멘토가 없었습니다. 대신, 스스로 멘토를 찾거나 관찰과 같은 비공식적인 상호작용에 의존하여 교육자로서의 발달을 이끌어야 했습니다. 이러한 경향은 미국의 여러 치과대학에서도 관찰됩니다. 예를 들어, Al-Jewair 등의 최근 연구에 따르면 미국 7개 치과대학 중 58%가 멘토링 프로그램이 없었고, 32%는 비공식적인 멘토링만 있었으며, 단 9.7%만이 공식적인 멘토링 프로그램을 갖추고 있었습니다. 이러한 멘토링의 부재는 신임 교원들이 자신의 진로에 대해 길을 잃고 불확실함을 느끼게 만들 수 있습니다.

 

학문적 치의학 분야에서 신임 교원들은 새로운 환경에 직면하며, 승진과 정년 보장(tenure)에 필요한 요건을 충족하면서 동시에 교육자로서의 새로운 역할을 수행해야 합니다. 멘토의 적절한 지도 없이는 이러한 개인들이 학문적 경력을 시작하면서 압도당하고 단절감을 느낄 수 있습니다. 공식적인 멘토를 두는 것은 전문적인 목표를 설정하고 이를 달성하기 위한 명확한 경로를 개발하는 데 도움을 줄 수 있으므로 신임 교원에게 특히 도움이 될 수 있습니다.

 

해당 주제의 전문가가 되는 것만으로 효과적인 교육자가 되기에 충분하다는 것은 흔한 오해입니다. 그러나 치과 교육자들은 교육학에 대한 필수적인 정식 훈련이 부족한 경우가 많아 자신의 역할에 준비되지 않은 상태로 남겨지곤 합니다. 이 연구의 참여자들은 자신의 역할, 특히 교수 기술(teaching skills)에 대해 공식적인 준비를 거의 또는 전혀 받지 못했다고 밝혔습니다. 치과 교원을 대상으로 실시된 여러 요구도 조사에서 신임 교원들은 교수 기술, 성인 학습, 학생 평가 및 피드백, 혁신적인 교수 전략, 갈등 관리와 같은 영역에서의 준비 필요성을 지속적으로 보고했습니다.

 

본 연구는 많은 참여자가 기술 개발에 필요한 자원을 찾을 수 없었으며, 이것이 좌절감을 더욱 가중시켰다는 독특한 발견을 강조합니다. 그들은 종종 자신의 교육 철학을 개발하기 위해 학생 시절의 이전 경험에 의존했습니다. 마찬가지로, 초임 임상 간호 겸임 교수들도 학계로의 전환에 준비되지 않은 것으로 나타났으며, 주로 학생으로서의 이전 경험에 의존하여 교육자로서의 새로운 역할을 수행했습니다.

 

연구 결과에 따르면 동료지원, 네트워킹, 협업, 기술 개발 및 역할 모델을 위한 귀중한 자원임이 밝혀졌습니다. 가장 의존하는 자원에 대해 질문했을 때, 참여자들은 흔히 다른 동료선임 교원을 꼽았습니다. 그러나 많은 동료와 선임 교원이 정식 교육 훈련을 받지 않았기 때문에 비공식적인 멘토링은 구시대적인 교육 전략을 강화할 가능성이 있다는 점에 유의해야 합니다. 간호 및 물리치료 교수진에서도 유사한 결과가 관찰되었는데, 이들은 종종 경험이 더 많은 동료에게 조언을 구하고 그들을 역할 모델로 관찰합니다.

 

분석에서 도출된 두 번째 주제는 직무 만족도(Job satisfaction)였으며, (a) 도전 과제, (b) 성공, (c) 학생들과 함께 일하기라는 세 가지 하위 주제를 가졌습니다. 이 주제는 SCCT의 만족(satisfaction) 모델과 일치합니다. 흥미롭게도, 학문적 경력에 대해 가장 놀라웠던 점을 질문했을 때 대다수의 참여자는 그들이 이 직업을 얼마나 즐기는지를 표현했습니다. 구체적으로, 참여자들은 학생들과 함께 일하는 것을 직업의 가장 보람 있는 측면으로 꼽았습니다. 그들은 학생들의 성장을 목격하는 것, 동료 간의 동지애, 학문적 경력이 주는 일과 삶의 균형을 즐겼습니다. 이러한 정서는 치의학, 치위생학, 간호학에서 수행된 유사한 연구들과 일치합니다.

 

학문적 위치는 보람될 수 있지만, 그 나름의 도전 과제들도 따릅니다. SCCT에 따르면, 이러한 도전에 어떻게 대처하는지는 경력 자기관리(career self-management) 모델에 해당합니다. 참여자들은 행정적 책임, 학생들의 부정적인 피드백, 명확한 역할 기대의 부재, 경력 발전의 불확실성을 학문적 경력의 가장 벅찬 도전 과제로 꼽았습니다. 참여자들은 가르치는 일 외에도 대학 및 치과대학 위원회 참여나 학술 활동과 같이 상당한 양의 "기타" 업무가 요구된다는 사실에 놀라워했습니다. 이 결과는 치의학 및 간호학 분야의 이전 연구와 일치합니다.

 

연구 참여자들이 개인 진료를 그만두고 학문적 경력을 추구하도록 이끈 동기 요인(Motivating factors)은 다양했으나, 몇 가지 반복되는 주제가 나타났습니다. 상당수의 참여자가 교사인 가족 구성원을 두고 있었으며, 이들이 긍정적인 영향을 미쳤습니다. 이 가족 구성원들은 참여자가 학계에 진입한 후에도 소중한 멘토 역할을 했습니다. 참여자들에게 동기를 부여한 다른 요인으로는 개인 진료를 지속할 수 없게 만든 신체적 부상, 이전의 교육 경험, 대학이나 치과대학 시절 전문직에 대한 노출, 개인 진료와 관련된 스트레스, 예상치 못한 상황 등이 있었습니다. 이러한 주제들은 SCCT의 흥미(interest) 및 선택(choice) 모델 모두에 해당합니다.

 

여러 저자들이 치과의사가 학계 경력을 추구하도록 동기를 부여하는 요인을 탐구해 왔으며 유사한 응답들을 확인했습니다. 그러나 이 저자들은 본 연구의 참여자들이 언급하지 않은 몇 가지 동기 요인도 강조했습니다. 예를 들어, Trotman 등은 연구 기회가 교수들에게 유리하게 작용한다고 관찰했지만, 본 연구의 참여자 중 누구도 연구를 동기 요인으로 언급하지 않았습니다. 사실, 그들 중 다수는 치과 교육자로서의 새로운 역할에서 학술 활동의 필요성에 대해 인식하지 못했습니다.

 

본 연구는 신체적 부상(Physical injury)이 개인이 학계 경력을 추구하게 만드는 독특한 동기 요인으로 작용함을 밝혔습니다. 참여자들은 반복적인 치과 진료가 신경, 근육, 인대, 힘줄에 스트레스를 주어 임상 진료를 떠나야 할 필요성을 초래했다고 보고했습니다. 이 이유는 이전 연구들의 설문 조사 옵션에서 누락되어 간과되었을 수 있습니다. 본 연구에서 질적 연구 방법을 사용함으로써 개인의 동기에 대한 보다 포괄적인 이해가 가능해졌으며, 설문 기반 연구의 한계를 극복하고 개인이 학계를 추구하도록 이끄는 요인에 대한 새로운 통찰을 제공했습니다.

4.1 제한점 (Limitations)

이 연구의 제한점으로는 표본, 잠재적인 사회적 바람직성 편향(social desirability bias), 전이 가능성(transferability), 그리고 저자가 참여 기관의 교원임에 따른 연구자 편향 가능성이 포함됩니다. 표집 전략은 특정 교원 그룹을 선택하기 위해 유의 표집(purposive sampling)을 사용했지만, 치과대학의 선정은 저자의 소속 대학이라는 편의성에 기반했습니다. 그러나 신임 교원(junior faculty member)에 대한 정의는 치과 교육 기관들 사이에서 보편적이며, 설문 결과에 기반한 치의학 학계로 진입하는 신임 교원의 경험과 관련된 다른 연구들과 유사한 결과가 나타났습니다.

 

언급할 가치가 있는 또 다른 제한점은 저자가 참여 교원들의 동료였으며 5년이 조금 넘는 교육 경력을 가지고 있었다는 점입니다. 이는 결과 해석에 있어 연구자 편향을 야기할 수 있습니다. 그러나 저자는 이러한 가능성을 인지하고 있었으며, 객관성을 유지하고 사회적 바람직성 편향을 완화하기 위해 여러 조치를 취했습니다. 여기에는 3명의 전문 치과 교육자에 의한 인터뷰 가이드 평가, 중립적이고 개방적인 질문 사용, 유도 질문이나 코멘트가 없었는지 평가하기 위한 매 인터뷰 후의 성찰적 실천(reflectivity practice), 그리고 결과 분석 및 해석 중의 동료 검토가 포함되었습니다.

 

또한, 참여자들은 인터뷰 녹음을 하지 않을 선택권이 있었으며, 이는 사회적 바람직성 편향의 가능성을 줄이는 데 도움이 될 수 있으나 완전히 무시할 수는 없습니다. 마지막으로, 이 연구는 전임(full-time) 교원만을 포함했다는 점에 유의해야 합니다. 전임 교원은 강의 및 임상 교육 모두에 책임을 맡을 가능성이 높아 선정되었지만, 이러한 배제는 단일 치과대학 연구 환경이라는 점과 함께 결과의 전이 가능성을 제한할 수 있습니다. 파트타임 및 겸임(adjunct) 교원의 경험은 전임 교원과 다를 수 있으며, 다른 치과대학들은 다른 교원 경험을 가지고 있을 가능성이 있습니다.

4.2 제언 (Recommendations)

이 연구는 개원가에서 학계로 전환하는 신임 교원들에게 공식적인 훈련 프로그램이 유익할 수 있음을 시사합니다. 치과대학의 위치와 관계없이, 신임 치과 교원을 학계에 대비시키기 위한 표준화된 프로그램이 도움이 될 수 있습니다. 향후 연구에서는 훈련 프로그램을 이수한 신임 교원과 그렇지 않은 교원을 대상으로 준비도, 교육 효과성, 학생 학습 성과 측면에서 프로그램의 효과를 비교할 수 있을 것입니다.

 

또한, 연구의 많은 참여자는 신임 교원이 가질 수 있는 공통적인 질문에 답해줄 수 있는 핸드북 제작을 제안했습니다. 핸드북에는 역할과 책임, 학교 조직도, 위원회 및 구성원, 임상 재료, 장비, 교육 자원, 주요 인사 연락처에 대한 정보가 포함될 것입니다.

 

이 연구는 또한 신임 교원, 특히 학계 경력을 추구하고자 하는 이들 사이에서의 멘토링 필요성을 강조합니다. 이 문제를 해결하기 위해, 치과대학은 구조화된 멘토링 프로그램을 수립하고 생산적인 멘토-멘티 관계를 촉진하기 위해 멘토 훈련을 제공해야 합니다.

 

흥미롭게도, 이 연구는 목, 등, 어깨 등의 신체적 부상이 많은 참여자가 학계 경력을 추구하게 된 요인임을 발견했습니다. 향후 연구에서는 임상 현장 참여의 잠재적 제한 사항들과 현직 치과의사들 사이에서 이러한 부상을 예방하는 방법을 탐구할 수 있을 것입니다.

5. 결론 (CONCLUSION)

이 질적 연구는 치과 교육 기관들에 신임 교원뿐만 아니라 모든 교원의 지원과 안녕(well-being)을 우선시해야 한다는 중요한 경종을 울립니다. 임상가들이 개원가를 떠나는 다양한 동기 요인, 신임 교원들의 교육 역할에 대한 준비 부족, 그리고 구조화된 멘토링의 필요성에 대한 통찰을 바탕으로, 이 연구는 교원의 성공과 근속(retention)을 향상시키려는 기관들에 필수적인 지침을 제공합니다. 행동하지 않을 경우 높은 이직률, 교원 소진(burnout), 차선의 학생 학습 성과로 이어질 수 있으며, 궁극적으로는 환자 치료 성과를 저해할 수 있습니다.

 

 

 

Acad Med. 2024 Mar 1;99(3):261-265. doi: 10.1097/ACM.0000000000005448. Epub 2023 Aug 30.

Beware False Growth Mindset: Building Growth Mindset in Medical Education Is Essential but Complicated

 

혹시 우리가 알던 '성장 마인드셋'은 가짜일 수도 있다? 🚨

안녕하세요! 오늘은 의학교육, 그리고 교육 전반에서 정말 핫한 키워드인 '성장 마인드셋(Growth Mindset)'에 대한 흥미로운 논문을 하나 소개해 드리려고 해요.

스탠포드 대학의 캐롤 드웩(Carol Dweck) 교수가 주창한 이 이론, 다들 한 번쯤 들어보셨죠? "능력은 변할 수 있다"는 믿음을 가지면 더 성장할 수 있다는 희망적인 메시지 덕분에 많은 교육 현장에 도입되었는데요.

하지만 오늘 소개할 논문은 뼈아픈 지적을 합니다. 우리가 이 이론을 '제대로' 이해하고 있는 게 맞을까요? 혹시 '거짓 성장 마인드셋(False Growth Mindset)'에 빠져 있는 건 아닐까요? 🤔


1. 성장 마인드셋 vs 고정 마인드셋, 진짜 차이는?

우선 개념부터 확실히 짚고 넘어갈게요.

  • 고정 마인드셋(Fixed Mindset): 지능이나 재능은 타고난 것이라 변하지 않는다고 믿는 것. 실패를 두려워하고 도전을 피하죠.
  • 성장 마인드셋(Growth Mindset): 노력과 학습을 통해 능력을 개발할 수 있다고 믿는 것. 도전을 배움의 기회로 여깁니다.

의학교육 현장은 성적, 등수, 경쟁이 치열해서 학생들이 '고정 마인드셋'에 빠지기 쉬운 환경이에요. 그래서 '성장 마인드셋' 도입이 더욱 절실하죠. 그런데 문제는, 이 이론이 종종 오해를 받고 있다는 점입니다.


2. 우리가 빠지기 쉬운 5가지 '거짓 성장 마인드셋' 함정 🕳️

연구진은 우리가 흔히 저지르는 5가지 오해를 콕 집어 설명합니다. 뜨끔할 준비 하세요! 😅

① "성격이 좋으면 성장 마인드셋?" (NO!)

유연함(Flexibility)이나 개방적인 성격(Open-mindedness)을 성장 마인드셋과 혼동하곤 합니다. 하지만 성장 마인드셋은 성격이 아니라 '학습과 능력에 대한 믿음'에 관한 것입니다. 단순히 성격 좋은 학생을 보고 "재는 성장 마인드셋이네"라고 단정 지으면 안 된다는 거죠.

② "너는 고정, 나는 성장?" (NO!)

사람을 딱 잘라 "너는 고정 마인드셋이야"라고 라벨링(Labeling)하는 건 위험해요. 드웩 교수는 이렇게 말합니다.

"모든 사람은 고정 마인드셋과 성장 마인드셋의 혼합체이며... 당신이 어떤 영역에서는 지배적인 성장 마인드셋을 가질 수 있지만 당신을 고정 마인드셋 특성으로 촉발하는 것들이 여전히 있을 수 있다."

“Everyone is a mixture of fixed and growth mindsets … you could have a predominant growth mindset in an area but there can still be things that trigger you into a fixed mindset trait.”

즉, 공부는 성장 마인드셋으로 하더라도, 대인관계에서는 고정 마인드셋일 수 있다는 거죠. 상황에 따라 다르다는 점을 인정해야 합니다.

③ "노력했으니 잘했어!" 무조건적인 노력 칭찬? (NO!) 🙅

가장 흔한 오해입니다. 결과가 안 좋은데 "노력했으니 됐어"라고만 하면, 학생은 비효율적인 공부법을 고치지 못하고 번아웃(Burnout)에 빠질 수 있어요.

"과정은 노력 그 이상을 포함한다. 정직한 피드백과 지도를 구하는 것은 학습에서 노력만큼이나 중요하며, 향상은 종종 학습자 측의 자기 성찰과 전략적 조정을 필요로 한다."

“Process includes more than effort alone. Seeking honest feedback and guidance is every bit as important in learning as is effort, and improvement often requires self-reflection and strategic adjustment on the part of the learner.”

 

단순한 노력이 아니라, 전략(Strategy)과정(Process)을 칭찬하고 피드백을 줘야 합니다.

④ "넌 무엇이든 될 수 있어!" 비현실적 희망 고문? (NO!)

학생들에게 자신감을 주는 건 좋지만, "넌 무조건 원하는 전공의(Residency) 과에 갈 수 있어" 같은 비현실적인 기대(Unrealistic expectations)는 오히려 독이 됩니다. 실패했을 때 학생이 겪을 좌절감이 더 크기 때문이죠. 현실적인 조언과 지원이 필요합니다.

⑤ "마인드셋이 문제야" 학생 탓하기? (NO!)

시스템이나 환경의 문제(예: 불공정한 평가, 차별 등)는 무시하고, 성과가 안 나오면 "네 마인드셋이 고정되어 있어서 그래"라고 학생 탓(Blaming the victim)을 하는 경우입니다.

"교육자가 고정 마인드셋 문화의 영향력을 인정하지 못한다면, 그들은 긍정적인 결과의 부재에 대해 개별 학습자를 비난하게 되는 반면, 성장 마인드셋 환경을 조성하고 시스템적 불평등을 무시한 교육자와 기관의 책임은 면제하게 될 수 있다."

“If educators fail to acknowledge the influence of fixed mindset cultures, they can end up blaming the individual learner for lack of positive results while absolving educators and institutions of responsibility for creating growth mindset environments and ignoring systemic inequities.”


3. 그렇다면 어떻게 해야 할까요? 🚀

논문의 저자들은 다음과 같은 해결책을 제안합니다.

  1. 교수진 교육 (Faculty Development): 교수님들부터 먼저 '진짜' 성장 마인드셋이 무엇인지, 어떻게 피드백을 줘야 하는지 배워야 합니다.
  2. 실패담 공유하기 (Storytelling): 교수님들이 자신의 실패와 극복 경험을 이야기해 주세요. "실패해도 괜찮아, 과정일 뿐이야"라는 메시지를 줍니다.
  3. 평가 방식의 변화 (Rethink Assessment): 점수만 매기기보다 '아직 아님(Not Yet)'과 같은 용어를 사용하고, 성장의 과정을 평가해 주세요.
  4. 성장 문화 만들기 (Culture): 가장 중요합니다! 환경이 바뀌지 않으면 개인의 노력은 한계가 있어요.

"마인드셋 개입은 환경이 고정적이라면 효과적일 가능성이 훨씬 낮지만, 환경이 성장 마인드셋을 지원할 때는 의미 있고 오래 지속되는 효과를 가질 수 있다."

“Mindset interventions are far less likely to be effective if the environment is fixed but can have meaningful long-lasting effects when the environment supports growth mindsets.”


📝 요약하며

성장 마인드셋은 단순히 "긍정적으로 생각해!"가 아닙니다. 전략적인 노력, 피드백 수용, 그리고 실패를 배움의 과정으로 받아들이는 태도입니다. 그리고 무엇보다 교육자와 조직이 그런 문화를 먼저 만들어주는 것이 선행되어야 한다는 점, 꼭 기억해야겠습니다. ✨

 


마인드셋 이론의 적용 (Applications of Mindset Theory)

 

1980년대 이후로 지능(intelligence)에 대한 믿음(beliefs)이 행동(behaviors), 동기(motivation), 그리고 학습(learning)에 미치는 영향을 탐구한(exploring) 캐롤 드웩(Carol Dweck)의 연구는 교육 문헌(education literature)에 스며들어 왔습니다(has been permeating).1,2 마인드셋 이론(Mindset theory)은 이러한 연구들을 기반으로 하는 일련의 연구 결과물(body of work)입니다. 이 이론은 성장 마인드셋(growth mindset)—인간의 능력(human capacities)은 시간이 지남에 따라 개발될 수 있다(can be developed)는 믿음—과 고정 마인드셋(fixed mindset)—인간의 능력은 타고난 것이며 불변하다(inherent and unchangeable)는 믿음—을 구별합니다(distinguishes).3

  • 고정 마인드셋(fixed mindset)을 가진 개인들은
    • 자신의 능력(ability)이 정적(static)이거나 타고난 것(inherent)이라고 믿는 경향이 있으며(tend to believe),
    • 종종 학습 목표(learning goals)보다는 수행 목표(performance goals)에 초점을 맞춥니다(focus on).
    • 도전(challenge)에 직면했을 때(presented with), 고정 마인드셋을 가진 개인들은 끈기 있게 지속할 가능성이 낮으며(less likely to persist),
    • 때로는 무기력한 행동(helpless behavior)과 회피(avoidance)로 반응하고,
    • 심지어 실패를 피하기 위해(to avoid failure) 부정행위를 하거나 요령을 피우는(cheat or cut corners) 선택을 하기도 합니다.
    • 그들은 종종 자신이 탁월할 것(excel)으로 예상되고 긍정적인 평가(positive judgment)를 받을 수 있는 과제(tasks)를 완수하려고 하며, 실패가 위험요소(risk)가 되는 상황은 피하려고(avoid) 합니다.
  • 대조적으로(In contrast), 성장 마인드셋(growth mindset)을 가진 개인들은
    • 지능과 능력이 가변적(malleable)이라고 믿습니다.
    • 그들은 단지 수행(performance alone)보다는 학습 목표(learning goals)와 향상되는 과정(process of improving)에 초점을 맞추는 경향이 있습니다.
    • 성장 마인드셋을 가진 개인들은 역량(competence)을 개발하기 위해 노력하며(strive to),
    • 어려운 과제(difficult tasks)를 학습 기회(learning opportunities)로 여기고,
    • 건설적인 피드백(constructive feedback)을 구하며(seek out),
    • 도전과 좌절(challenges and setbacks)에도 불구하고 끈기 있게 지속하는(persist) 경향이 있습니다.
  • 드웩(Dweck)4은 마인드셋이 연속선상(continuum)에 존재하며 모든 개인은 이 두 가지 마인드셋의 혼합체(blend)라고 언급합니다; 핵심은 둘 중 하나를 촉발하는(trigger) 사건이나 상황을 발견하는 것(discovering)입니다.

 

마인드셋 이론에서 도출된(derived from) 개입(Interventions)들은 마인드셋의 작은 변화가 광범위한 환경(wide range of settings) 전반에 걸쳐 수행(performance)과 성공(success)에 있어 의미 있는 차이(meaningful differences)로 이어질 수 있음(translate into)을 입증합니다(demonstrate).5 성장 마인드셋은 최근 의학교육(medical education) 내에서 상당한 호응(considerable traction)을 얻었으며, 개념적 이론(conceptual theory)으로서 뿐만 아니라 학업 성공(academic success)을 향상시키기 위한 실질적 개입(practical intervention)의 기회로서도 상당한 가능성(considerable promise)을 제공하고 있습니다. 보건 전문직 교육(health professions education)에서의 성장 마인드셋에 관한 2021년 주제 범위 고찰(scoping review)은 지난 7년 동안 보건 전문직 교육에 마인드셋 모델의 적용(application)이 증가했음을 확인했습니다(identified).6

 

그러나 마인드셋 이론은 종종 의학교육으로의 성공적인 통합(successful integration)을 저해할 수 있는(hinder) 방식으로 오해받기도 합니다(misunderstood). 이 논문에서, 우리는 의학교육 내 마인드셋 이론의 현재 적용(current application)을 탐구하고(explore), 적절한 적용과 수용(uptake)을 방해할 수 있는(interfere with) 성장 마인드셋에 대한 일반적인 오해(common misunderstandings)를 강조(highlight)하고자 합니다. 우리는 학습자(learners), 교육자(educators), 환자(patients), 그리고 조직(organizations)의 이익(benefit)을 위해 마인드셋 이론을 의학 훈련(medical training)에 미래에 성공적으로 포함시킬(incorporation) 수 있는 몇 가지 기회(opportunities)를 개략적으로 설명합니다(outline).

 

마인드셋 이론의 적용 (Applications of Mindset Theory)

 

수십 년간의 연구(Decades of research)는 성장 마인드셋을 증진하는(promote) 교육(instruction)과 활동(activities)이 실험실(laboratory) 및 실제 환경(real-world settings)에서 일관되게(consistently) 상당한 변화(significant change)를 가져왔음(delivered)을 입증합니다.5,7

  • 짧은 성찰적 글쓰기 과제(brief, reflective writing assignment)와 같은 작은 개입(Small interventions)들이 학습에 대한 학생들의 믿음(beliefs about learning), 좌절에 대한 반응(reactions to setbacks), 학업 성취도(academic performance), 그리고 학문 분야에서의 끈기(persistence)에 장기적인 효과(long-term effects)를 보여주었습니다.8
  • 중요하게도(Significantly), 마인드셋 연구는 학습자의 가면 증후군(imposter syndrome) 경험과, 어려움을 겪고 있는(struggling) 학습자, 소수 집단(minoritized groups), 그리고 과학 분야의 여성(women in scientific fields)에 대한 스트레스 요인 완화(mitigating stressors)에 긍정적인 영향(positive impact)을 미치는 것으로 나타났습니다.3,8–11

보건 전문직 교육자들은 학습자를 위한 마인드셋 이론 개입의 필요성(need)을 점점 더 인식하고 있습니다(increasingly recognizing).12 의과대학생들은 고정 마인드셋을 강화할 수 있는(reinforce) 많은 시스템적 요인(systemic factors)에 노출되어 있습니다(exposed to). 여기에는

  • 성적(grades), 등수(rankings), 표준화 시험에서의 성적(performance on standardized examinations)에 대한 강조, 고군분투나 실패에 대해 인지된 높은 대가(perceived high cost of struggle or failure), 그리고 고부담 학습 환경(high-stakes learning environments)에서의 동료들과의 지속적인 규범적 비교(continuous normative comparisons)가 포함됩니다.13

최근의 근본 원인 분석(root cause analysis)은 학습자의 좌절(setback)"성장(growth)이나 회복탄력성(resilience)의 증거를 찾는 대신 숨겨야 할 실패(failures to be hidden)"로 보는 의학 교육자들의 인식(perception)이, 의과대학에서 전공의 수련(residency training)으로 이어지는 학습자의 개방적이고 성공적인 전환(transition)에 지속적인 장벽(ongoing barrier)이 되고 있음을 강조했습니다(highlighted).14 의대생들이 이러한 외부 요인(external factors)을 내면화(internalize)할 때, 그들은 더 결과 지향적(results oriented)이 되기 쉽고(prone to), 주로 성취(achievement)에 초점을 맞추며, 고군분투나 실패를 두려워하게(fearful of) 됩니다. 이는 그들을 고정 마인드셋 사고(fixed mindset thinking)에 빠지기 쉽게 만들고(prone to), 의학 훈련의 스트레스에 더 취약하게(vulnerable) 만듭니다.

 

같은 맥락에서(By the same token), 마인드셋 개입은 보건 전문직 교육에서 향상된 수행능력, 더 큰 회복탄력성(resiliency), 더 나은 정신 건강(mental health), 심지어 의료 오류(medical errors)에 대한 자가 보고(self-reporting) 증가를 포함한 다수의 바람직한 결과(desired outcomes)에 긍정적인 효과를 보여주었습니다.15–17

  • 의대생들을 대상으로 한 연구에서 성장 마인드셋은 적응적 학습 목표(adaptive learning goals), 더 적은 심리적 고통(psychological distress), 그리고 평생 학습(lifelong learning)에 대한 더 큰 헌신(commitment)과 관련이 있음(associated with)이 밝혀졌습니다.18
  • 피드백 문화(culture of feedback)를 정상화(normalize)하고 고정된 사고(fixed thinking)에서 비롯되는 편향(biases)과 고정관념(stereotypes)을 식별하려는 노력들은 학습 환경(learning environment)에 이점(benefits)을 보여주었습니다.19,20
  • 다른 연구들은 학습자의 전문직 정체성 형성(professional identity formation), 자기주도 학습(self-directed learning), 전문적 성장(professional growth), 그리고 회복탄력성을 증진하기(promote) 위한 종단적 코칭 프로그램(longitudinal coaching programs)과 개별화된 학습 계획(individualized learning plans)의 잠재력(potential)을 확인했습니다.21–25
  • 학습자들이 성적보다는 향상(improvement)에 집중하도록 돕기 위한 합격/불합격 평가 시스템(pass/fail grading systems)의 도입(institution)은, 마인드셋 이론의 기저에 깔린 원칙(principles underlying mindset theory)과 더 자연스러운 정렬(natural alignment)을 제공할 수 있는 역량 바탕 평가(competency-based assessments)의 잠재력에 대한 더 큰 관심과 함께(in conjunction with), 최근 몇 년간 힘을 얻고 있습니다(gained traction).26–28

 

거짓 성장 마인드셋 (False Growth Mindset)

 

성장 마인드셋이 무엇인지 이해하는 것만큼이나, 그것이 무엇이 아닌지(what it is not)를 이해하는 것도 똑같이 중요합니다. 마인드셋 이론(mindset theory)이 의학교육에서 지지자들을 얻고(gaining adherents) 실질적인 이니셔티브(substantive initiatives)를 이끌어감에 따라,6 우리는 번아웃을 무심코 지속시키고(inadvertently perpetuate) 회복탄력성을 약화시키는(erode resilience) 흔한 함정들(common pitfalls)을 피하기 위해 이론에 대한 오해(misinterpretations)와 비판(criticisms)을 성찰하는 것(reflect upon)이 현명할 것입니다. 드웩(Dweck)4은 자신의 획기적인 연구(seminal work)가 출판된 이후 마주친(come across) 자신의 연구에 대한 가장 흔한 오해들(misunderstandings)이나 오용들(misapplications) 중 일부를 지칭하기 위해(to refer to) 최근 거짓 성장 마인드셋(false growth mindset)이라는 용어를 만들었습니다(coined). 한 인터뷰에서, 그녀는 "그것을 꽤 정확하지 않은(not quite accurate) 무언가로 추출해내거나(distilled it down), 그들이 이미 알고 있던 무언가로 동화시킨(assimilated) … 사람들이 많았다"고 설명합니다.29 그녀는 자신의 이론에 대한 몇 가지 흔한 오해들을 확인했는데(identified), 이들 모두는 의학교육의 맥락(context) 내에서 적용될 수 있습니다(Table 1).4

 

Table 1 - 거짓 성장 마인드셋 믿음, 그 결과, 그리고 의학 교육자를 위한 권장 조치

거짓 성장 마인드셋 믿음(False growth mindset beliefs)4 마인드셋 이론이 말하는 것(What mindset theory says) 거짓 성장 마인드셋 믿음의 결과(Consequences of false growth mindset beliefs) 교육자를 위한 권장 조치(Recommended actions for educators)
광범위한 바람직한 특성들(desirable traits, 예: 유연성, 개방성)이 성장 마인드셋의 증거이다. 성장 마인드셋은 좁게 정의되며(narrowly defined), 사람들이 도전(challenges)에 직면하여 배우고 성장할 수 있는 자신의 잠재력(potential)을 어떻게 보는지와 구체적으로 연관되어 있다. 교육자가 성장 마인드셋을 단순히 "모든 좋은 특성(all good traits)"을 의미하는 것으로 오해한다면, 그들은 초점을 희석시키고(dilute the focus) 성장 마인드셋이 진정 무엇인지—학습, 능력, 지능에 대한 학습자의 믿음—에 주의를 돌릴(direct attention) 기회를 놓치게 된다. 성장 마인드셋의 정의와 마인드셋 이론의 적용에 대해 명확히 하라(Be clear).


다른 훌륭한 특성을 가진 학습자가 성장 마인드셋을 가지고 있다고 가정하는 것을 피하라(Avoid assuming).
학습자는 성장 마인드셋이나 고정 마인드셋 둘 중 하나를 가지고 있다. 마인드셋은 맥락 특이적(context specific)이며 일반화할 수 없다(not generalizable), 심지어 동일한 개인 내에서도 그렇다. 만약 교육자가 동일한 사람이 한 영역(domain)에서는 고정 마인드셋을, 다른 영역에서는 성장 마인드셋을 가질 수 있다는 것을 인식하지 못한다면, 그들은 필요한 지원을 과대평가하거나 과소평가할 수 있다(overestimate or underestimate).


만약 교육자가 마인드셋이 가변적(malleable)이라는 것을 인식하지 못한다면, 고정된 경향(fixed tendencies)을 보이는 학습자를 조기에 포기할(give up prematurely) 수 있다.
개별 학습자에게 성장 또는 고정 마인드셋 중 하나를 가지고 있다고 라벨링하는 것(labeling)을 피하라.


개별 학습자가 어떤 맥락에서는 고정 마인드셋을, 다른 맥락에서는 성장 마인드셋을 가질 수 있음을 이해하도록 도와라.
학습자의 성장 마인드셋을 개발하기 위해, 교육자는 노력(effort)만 칭찬해야 한다. 과정(Process)과 성장은 노력을 필요로 하지만, 자기 성찰(self-reflection), 피드백, 그리고 학습 전략의 조정(adjustment) 또한 필요로 한다.


불평등한 시스템(systems of inequity) 때문에, 모든 노력이 성공으로 이어지는 것은 아니며, 모든 성공이 노력에서 기인하는(stem from) 것도 아니다.
교육자가 노력만을 강조한다면(emphasize effort alone), 학습자는 비효율적인 전략(ineffective strategies)에 시간과 에너지를 낭비할 수 있다. 노력을 칭찬하되, 구체적이고(specific), 실행 가능한 피드백(actionable feedback) 또한 제공하라.


성찰을 위한 기회를 제공하라.


학습자가 더 나은 성장 전략을 개발하도록 도와라.
성장 마인드셋을 개발하기 위해, 교육자는 학습자에게 그들이 무엇이든 성취할 수 있다(accomplish anything)고 말해야 한다. 개인이 놀라운 일들을 성취할 수 있다는 것은 사실이다; 하지만 비현실적인 기대(unrealistic expectations)를 조장하는 것은 학습자에게 도움이 되지 않는다(does no favors).


적절한 지원(adequate support) 없는 높은 기대는 학습자가 실패하게 만들 수 있다(set learners up to fail).
비현실적인 기대와 능력에 대한 정확한 피드백의 부재는 학습자를 자기 기만(self-delusion)으로 이끌고 잘못된 진로(wrong career path)에 가둘 수 있다.


비현실적인 기대를 가진 학습자는 잘못된 길로 밀고 나가다가(push forward), 결국 소진되고(burning out), 과도하게 야심 찬 목표(overly ambitious goals)를 달성하지 못했을 때 어쩌면 자신을 비난할 수도 있다.
학습자에게 동정심을 가지되 직설적으로(compassionate but direct) 대하고, 때로는 교육자가 뼈아픈 피드백(hard feedback)을 주어야 할 필요가 있음을 받아들여라.


모든 학습자의 잠재력을 인식하되 비현실적인 기대를 강화하거나(reinforce) 헛된 약속(empty promises)을 하지 마라.


전문적인 실패와 좌절에 대한 개인적인 이야기를 공유함으로써 성공적인 경력으로 가는 길이 무엇을 수반하는지에 대한 더 현실적인 감각(realistic sense)을 학습자가 개발하도록 도와라.
고정 마인드셋을 교정하는 책임(onus)은 학습자에게 있다. 개인의 마인드셋은 교육 환경(educational environments), 제도적 문화(institutional cultures), 그리고 고정 마인드셋 불평등 시스템(fixed mindset systems of inequity, 예: 인종차별, 성차별, 장애인 차별)을 포함한 더 넓은 사회에 의해 심오하게 형성된다(shaped profoundly). 교육자가 고정 마인드셋 문화의 영향력을 인정하지 못한다면(fail to acknowledge), 그들은 긍정적인 결과의 부재에 대해 개별 학습자를 비난하게 되는 반면(blaming the individual learner), 성장 마인드셋 환경을 조성하고 시스템적 불평등(systemic inequities)을 무시한 교육자와 기관의 책임은 면제하게(absolving) 될 수 있다.


교육자가 고정 마인드셋 문화 속에서 개별 학습자가 성장 마인드셋 행동을 드러낼 것(manifest)이라고 기대한다면, 그들은 무심코 학습자를 위험에 빠뜨릴 수 있다.
성장 마인드셋 언어를 채택함으로써 성장 마인드셋 문화를 육성하라(Foster).


형성적 피드백(formative feedback)을 강조하고 고군분투를 용인 가능한(acceptable) (심지어 예상되는) 것으로 정상화(normalize)하기 위해 평가 구조(evaluation structures)를 변경하라.


반인종주의(antiracism) 및 기타 형평성 이니셔티브(equity initiatives)를 통해 기울어진 운동장(unevenness of the playing field)을 인정하고 이를 시정하기 위해 노력하라(work to redress).

 

한 가지 흔한 오해(common misconception)는 개인이 (예를 들어, 개방성이나 유연성 같은) 다른 점에서는 바람직한 특성들(desirable characteristics)의 범위를 성장 마인드셋이라고 지칭하는 것과 관련이 있습니다. 드웩4은 긍정적인 개인적 특성(personal traits)을 드러내는 것마인드셋 이론이 개략적으로 설명한(outlined) 방식대로 재능을 키우는 데 헌신하는 것(dedicating to growing talent) 사이에는 차이가 있다고 경고합니다(cautions). 이러한 특성들이 겹친다고 잘못 귀인함으로써(misattributing), 교육자들은 또한 마인드셋이 사람 전체(whole of the person)에 적용된다는 점에서 다른 일반적인 특성들과 유사하다고 가정할지도 모릅니다. 교육자는 유연하고 정기적으로 피드백을 요청하는 학습자를 성장 마인드셋을 보여주는(exhibiting) 것으로 무심코 간주할 수 있지만, 당면한 과제(challenge at hand)에 대한 믿음과 반응에 대한 통찰력(insight)을 얻기 위해서는 교육자의 추가적인 자극(prodding)과 학습자의 성찰이 필요하다는 것을 인식하지 못할 수 있습니다. 드웩29은 더 나아가 "모든 사람은 고정 마인드셋과 성장 마인드셋의 혼합체(mixture)이며 … 당신이 어떤 영역에서는 지배적인(predominant) 성장 마인드셋을 가질 수 있지만 당신을 고정 마인드셋 특성으로 촉발하는(trigger) 것들이 여전히 있을 수 있다"고 지적합니다. 예를 들어, 의대생은 공부하는 동안 지식 결핍(knowledge deficit)에 직면했을 때는 성장 마인드셋을 보일 수 있지만, 동료나 환자와의 의사소통 과제(communications challenge)에 직면했을 때는 고정 마인드셋을 보일 수 있습니다. 마인드셋은 영역 특이적(domain specific)이며 시간이 지남에 따라 그리고 다른 상황(circumstances) 하에서 변할 수 있습니다. 의학 교육자들은 성장 마인드셋이 모든 영역으로 똑같은 방식으로 전이되지(translate) 않을 수 있음을 인식해야 하며, 관찰된 다른 성격 특성(personality characteristics)과는 별도로 사정되고 평가되어야(assessed and evaluated) 함을 인식해야 합니다.

 

두 번째 오해는 교육자들이 성장 마인드셋이 오로지 노력(effort alone), 특히 노력을 칭찬하는 것(praising effort)에 관한 것이라고 믿을 때 명백해집니다(becomes apparent).4 교육자들은 최고의 선의(best of intentions)를 가지고, 더 많은 노력을 장려함으로써(encouraging) 성장 마인드셋이 촉진된다고 믿으며, 고전하는 학습자들에게 더 열심히 공부하고 "절대 그만두지 말라(never quit)"고 제안할 수 있습니다. 이 조언을 받아들이는 의대생은 정보를 더 잘 통합하기(integrate) 위해 전략적으로 접근하기보다는 기초 자료(foundational materials)를 다시 읽는 데 시간을 보내는 등, 비효율적인 전략(ineffective strategies)에 더욱 몰입할(double down) 수 있습니다. 잘못된 노력(misguided effort)이 성취로 이어지지 않을 때, 그것은 환멸(disillusionment)과 번아웃으로 이어질 수 있습니다. 물론 노력은 중요하지만(critical),30 드웩4은 과정(process)이 노력 그 이상을 포함한다고 지적합니다. 정직한 피드백과 지도(guidance)를 구하는 것은 학습에서 노력만큼이나 중요하며(every bit as important), 향상은 종종 학습자 측의 자기 성찰(self-reflection)과 전략적 조정(strategic adjustment)을 필요로 합니다.

 

또 다른 오해는 교육자가 학습자들에게 그들이 "무엇이든 성취할 수 있다"고 말하는 것을 포함하는데—이는 때때로 불행한 결과(unfortunate consequences)를 초래하는 선의의 행동입니다.4 예를 들어, 좋은 의도(well-meaning)를 가진 교육자는 의대생에게 그들이 선택한 어떤 분야로든 전공의 수련(residency training)을 매칭 받을 수 있다고 말할지도 모릅니다. 학습자들은 격려받아야 하지만(should be encouraged), 성공이 필연적(inevitable)이라는 메시지를 보내는 것은 학습자가 궁극적으로 목표를 달성하지 못할 경우 해로울 수 있습니다. 우리는 사람들이 도전에 직면하여 많은 것을 성취할 수 있다는 점을 인정할 수 있지만, 현실적(realistic)이 되는 것 또한 중요합니다.

 

이것은 또 다른 흔한 오해와 밀접하게 연결되어(closely tied to) 있는데, 이는 고정 마인드셋을 교정할 책임(onus)이 학생 혼자에게(on the student alone) 있다는 믿음과 관련이 있습니다. 우리는 성공에 영향을 미치는 많은 구조적 요인(structural factors)을 인식해야(aware of) 하며, 성공에 영향을 주는 학습자의 통제 밖의 역학(dynamics outside of a learner’s control)(예를 들어, 인종차별, 장애인 차별, 빈곤)이 존재함을 인정해야 합니다. 이를 인식하지 못하는 것은 "피해자 비난하기(blaming the victim)"로 이어질 수 있으며, 교육자와 기관에게 고정 마인드셋뿐만 아니라 기관 문화 내의 불평등(inequities)을 해결해야 할 책임을 면제해 줄(absolve) 수 있습니다. 전공의 지원자(residency applicant)의 경우, 성공적인 전공의 매칭에 장벽(barrier)을 형성할 수 있는 많은 구조적 요인들이 있습니다. 교육자들은 사실 학습자가 목표를 달성하도록 돕기 위한 전략, 지도, 자원을 위해 교육자와 조직적 지원(organizational supports)에 의존하고 있음에도 불구하고, 불충분한 성취(inadequate achievement)를 학습자의 마인드셋 탓으로 돌려 설명하지 않도록 유의해야(mindful) 합니다.

 

인지 및 발달 심리학자들(cognitive and developmental psychologists)의 비판에 대한 부분적인 대응으로, 마인드셋 연구자들은 이제 교육적 맥락(educational context)과 학습자 마인드셋 및 마인드셋 개입의 성공을 형성하는 데 있어서의 그 역할에 더 면밀한 주의를 기울이고(paying closer attention) 있습니다.31,32 예를 들어, 그들은 마인드셋 개입이 고정 마인드셋을 구현하는(embody) 조직 내에서 시행될 때, 성장 마인드셋을 증진하기 위한 작고 개인 수준의 개입은 압도당할(outmuscled) 수 있다는 점에 주목했습니다.31 그들은 또한 교육자의 마인드셋이 중요하다(the mindset of the educator matters)는 것을 관찰했습니다. 예를 들어,

  • 교육자가 학습자의 과정 대신 지능(intelligence)을 칭찬할 때, 학습자는 과정에 대해 칭찬받은 학습자들보다 더 적은 과제 지속성(task persistence), 더 적은 과제 즐거움, 그리고 더 나쁜 과제 수행(task performance)을 보입니다.33 반면,
  • 교육자가 노력에 대한 긍정적인 관점을 전달하고 과정 칭찬(process praise)을 할 때, 이는 학생들, 특히 소외되거나(underserved) 낙인찍힌 배경(stigmatized backgrounds)을 가진 학생들의 수행에 긍정적인 영향을 미칩니다.34

다시 말해, 마인드셋 개입은 환경이 고정적이라면 효과적일 가능성이 훨씬 낮지만(far less likely to be effective), 환경이 성장 마인드셋을 지원할 때는 의미 있고 오래 지속되는 효과(meaningful long-lasting effects)를 가질 수 있습니다. 성장 마인드셋 문화를 구축하는 것이 개별 학습자에게 성장 마인드셋을 함양하기(cultivating) 위한 필수적인 선행 조건(necessary precursor)이기 때문에, 이는 의학 교육자들이 유념해야 할 중요한 사항입니다.

 

앞으로의 방향 (Looking Forward)

 

우리는 의학 교육자들에게 거짓 성장 마인드셋(false growth mindset)의 교훈(lessons)을 통합하여(incorporate) 의학교육에서 마인드셋 개입(mindset interventions)을 더 효과적으로 적용하고(apply) 연구할(study) 것을 요청합니다(call upon). 의학교육에서 마인드셋 이론의 나아갈 길(path forward)을 고려할 때, 우리는 성장 마인드셋을 증진하는(promote) 문화(cultures)를 개발하는 데 도움이 될 중요한 기여들(important contributions)을 인정하고자(acknowledge) 합니다. 특히, 우리는 역량 바탕 의학교육(competency-based medical education)으로의 진행 중인 전환(ongoing transition) 속에서 최적화될 수 있는(optimized) 개인, 관계, 및 시스템 수준(individual, relational, and systems levels)에서의 기존 권고안들(existing recommendations),13 의학교육 내 반인종주의(antiracism)를 육성하기(foster) 위해 성장 마인드셋 프레임워크를 적용하려는 노력들,35 그리고 학습자 평가 시스템(learner assessment systems)에 성장 마인드셋을 공식적으로 통합하라는(formally incorporate) 권고안들을36 강조하고 싶습니다. 우리는 의학 교육자들이 거짓 성장 마인드셋의 함정(pitfalls)을 피하고 마인드셋 이론에 대한 비판(critiques)에서 수집된(gleaned) 교훈을 적용하도록 도울 수 있는 구체적인 전략(specific strategies)을 강조함으로써 이러한 노력들을 기반으로 발전시켰습니다(built upon) (Table 1).

 

교수진에게 마인드셋 이론 훈련 제공 (Provide mindset theory training for faculty)

 

교수개발(Faculty development)은 의학 교육자들이 거짓 성장 마인드셋의 함정을 피하도록 돕는 데 필수적입니다(essential). 교수진은

  • 마인드셋과 다른 학습자 특성(learner characteristics) 간의 주요 차이점(key differences)을 주목하며(noting),
  • 마인드셋의 영역 특이적(domain-specific)이고 시간이 지남에 따라 변동하는(fluctuating) 본질(nature)에 주의를 기울여,
  • 마인드셋 이론을 정의하고 의학교육에 적용하는 세션(sessions)으로부터 혜택을 받을 것입니다(benefit from).
  • 교육자들은 유도된 학습자 성찰(guided-learner reflection)을 통해 학습자들이 단지 수행 목표(performance-only goals)보다는 과정 기반 목표(process-based goals)를 더 잘 식별하도록(identify) 돕는 훈련을 받을 수 있습니다.
  • 교수진은 추가적으로 도전(challenges)에 직면했을 때의 전략적 노력(strategic effort)과 끈기(persistence)를 칭찬하는(commending) 것을 포함하여 성장 지향적 언어(growth-oriented language)를 통합하는 것에 대한 교육(instruction)으로부터 혜택을 받을 수 있으며, 이때 헛된 칭찬(empty praise)이나 노력만으로 충분하다는 것을 시사하는 언어는 피해야 합니다.

 

개인적인 스토리텔링 장려 (Encourage personal storytelling)

 

교수진은 실패와 좌절(setbacks)이 매우 성취한 사람들(very accomplished people)에게조차 정상적(normal)이라는 사실을 강조하기 위해 실패와 그에 따른 성장(subsequent growth)에 대한 개인적인 이야기(personal stories)를 공유하도록 장려되어야 합니다. 교육자나 동료에 가까운 선배들(near-peers)이 그들 자신의 실패 이야기를 공유할 수 있는 공간(space)을 제공함으로써 완벽함(perfection)과 좌절 회피(avoidance of setbacks)에 대한 초점으로부터 벗어나는 것(Shifting away from)은, 성공이 자동적(automatic)이지도 선형적(linear)이지도 않다는 메시지를 학습자들에게 보내는 데 도움을 줄 수 있습니다.

 

평가의 재고 (Rethink assessment)

 

현재 개념화된(conceptualized) 대로의 결과 지향적 서술형 평가(Outcome-oriented narrative evaluations)는 학습자들에게 고정 마인드셋을 지속시킬(perpetuate) 수 있습니다. 만약 마인드셋 이론을 중심으로 재개념화된다면(reconceptualized), 평가자들은 학습 성과(learning outcomes) 뿐만 아니라 학습자들이 고군분투(struggles)에 어떻게 반응했거나 이를 관리했는지(managed)에 대해서도 언급하도록(comment) 장려될 수 있습니다. 만약 교육 리더들이 학습자들이 받는 의미 있고(meaningful), 저부담 피드백(low-stakes feedback)의 양을 늘릴 수 있다면, 교육자들은 학습자가 향상되도록(improve) 돕는 데 집중할 수 있고, 반면 학생들은 성적(grade)을 위해 "수행하는 것(performing)"을 넘어설 수 있습니다(move past). 과정(Course) 및 임상실습(clerkship) 리더십은 또한 성장 잠재력(growth potential)을 우선시하는 언어 사용을 고려할 수 있습니다; 예를 들어, 실패(fail) 대신 드웩 자신이 선호하는 용어인 아직 아님(not yet) (역량 있는, 능숙한 등)의 수정된 버전을 사용하는 것입니다.3 그러나 이러한 변화의 성공은 보건 전문직 교육자들이 고군분투와 성장을 위험 신호(red flags)라기보다는 학습 과정의 자연스러운 부분(natural parts)으로 보느냐에 달려 있을 것입니다(depend on).

 

성장 마인드셋 문화 육성 (Foster growth mindset cultures)

 

변화에 대한 책임(onus for change)을 학습자에게만 지우는 것을 피하기 위해(In order to avoid), 교육자와 기관은 성장 마인드셋이 번성할(flourish) 수 있는 환경(environments)을 조성하도록 노력해야 합니다. 우리는 의학 교육자들이 전임상 교육(preclinical education)에서의 진급 시험(progress testing)과 다양한 환경(예: 객관구조화진료시험(objective structured clinical examinations) 또는 임상 실습(clinical clerkships))에서의 비성적 관찰 및 피드백 기회(nongraded observation and feedback opportunities)를 포함하여, 형성적 학습 기회(formative learning opportunities)의 실행(implementation) 확대를 고려할 것을 제안합니다. 비평가적 역할(nonevaluative roles)을 맡은 교육자가 참여하는 종단적 코칭 프로그램(Longitudinal coaching programs)은 성장 마인드셋을 더 잘 증진할 수 있습니다.

 

우리는 이러한 권고안 중 다수가 교수 집약적(faculty intensive)이며 성공하기 위해서는 상당한 기관의 지원(institutional support)이 필요하다는 현실(reality)을 인정합니다(acknowledge). 기관의 리더들은 이러한 변화에 의미 있게 투자할(invest meaningfully) 의지가 있어야 합니다(must be willing to). 마인드셋 개입은 역사적으로 고정 마인드셋 문화였던 것을 변화시키고(transforming), 더 참여적이고(engaged), 회복탄력적이며(resilient), 성장 마인드셋 지향적인(growth-mindset–oriented) 학습자를 창출함으로써, 의학교육 문화를 더 나은 방향으로 현저하게(markedly) 변화시킬 잠재력(potential)을 가지고 있습니다. 의학교육 문화는 시간이 지남에 따라 실패에 대한 두려움(fear of failure)이 도움 요청(help seeking)을 대체하는(supersedes) 문화에서, 능동적인 자기 성찰(active self-reflection)이 더 효율적이고(efficient) 성장 지향적인 학습(growth-oriented learning)과 피드백을 낳는 문화로 변화할 수 있습니다. 그러나 이는 거짓 성장 마인드셋의 함정을 피하기 위한 마인드셋 이론의 지식에 기반하고(knowledgeable) 사려 깊은 통합(thoughtful incorporation)과, 의학교육 내에서 성장 문화를 더 잘 증진하는 의미 있는 변화를 도입함(instituting)으로써만 달성될 수 있습니다(accomplished).

 

 

 

 

 

 

 

 

Adv Health Sci Educ Theory Pract. 2025 Oct 28. doi: 10.1007/s10459-025-10484-x. Online ahead of print.

A clinical mentoring framework for health professionals

[논문 리뷰] 보건 의료 전문가를 위한 '진짜' 임상 멘토링 가이드

안녕하세요! 오늘은 보건 의료 분야(Health professionals)에 종사하시는 분들이라면 누구나 고민해 보셨을 주제, 바로 '임상 멘토링(Clinical Mentoring)'에 관한 흥미로운 논문을 소개해 드리려고 합니다.

평생 공부해야 하는 우리 의료인들에게 지속적 전문성 개발(CPD)은 필수죠. 그중에서도 선배가 후배를 이끌어주는 '멘토링'은 아주 효과적인 방법으로 알려져 있습니다. 하지만 막상 멘토링을 하려고 하면 "도대체 어떻게, 어떤 절차로 해야 하지?" 막막할 때가 많지 않으셨나요?

오늘 소개할 논문 <A clinical mentoring framework for health professionals>는 바로 그 막막함을 해소해 줄 명확한 프레임워크(Framework)를 제시하고 있습니다.


💡 왜 새로운 틀이 필요했을까요?

기존에도 멘토링에 대한 정의는 있었지만, 실제로 현장에서 어떻게 가르치고 배워야 하는지에 대한 구체적인 방법론은 부족했습니다. 연구진은 이렇게 지적합니다.

"출판된 임상 멘토링 지침들은 멘토링이 어떻게 수행되어야 하는지, 그리고 임상 멘토링이 학습 및 멘토링 이론과 연구에 의해 어떻게 정보를 얻는지에 대해 제한적인 정보만을 제공합니다."

"While this definition is useful, published clinical mentoring guidelines provide limited information about how mentoring should be conducted and how clinical mentoring is informed by learning and mentoring theory and research."

 

그래서 연구진은 물리치료 및 보건 의료 교육 이론을 바탕으로, 실무 전문성을 키울 수 있는 4가지 핵심 요소4단계 과정을 정립했습니다.


🔑 성공적인 임상 멘토링을 위한 4가지 핵심 요소 (The 4 Elements)

이 논문에서 가장 중요한 부분입니다. 효과적인 학습을 위해서는 다음 4가지 요소가 반드시 필요합니다.

1. 연결 (Connection) 🤝

단순히 아는 사이가 되는 게 아닙니다. 멘티가 안전함을 느끼고, 질문하고, 자신의 부족함을 드러낼 수 있는 신뢰 관계를 의미합니다.

"연결은 멘티가 학습하기 위해 필요합니다... 연결 요소의 중요한 측면은 협력적으로 설정된 학습 목표를 해결하기 위해 멘토와 함께 적극적으로 일하는 멘티입니다."

"Connection is required for mentees to learn... An important aspect of the connection element is the mentee actively working together with the mentor to address collaboratively set learning goals."

2. 안락 방해 (Comfort Disruption) 🚧

조금 낯선 용어죠? 쉽게 말해 '안락지대(Comfort zone) 벗어나기'입니다. 발전하려면 익숙하고 편안한 상태를 깨고 나와야 합니다. 하지만 너무 불안하면 학습이 안 되니, 멘토는 멘티가 '안전하게 위험을 감수할 수 있도록' 도와야 합니다.

"임상 멘토링 틀 내에서는, 멘티들이 임상 멘토링 중에 불편함을 경험할 수 있다는 인식이 있어야 합니다."

"In the clinical mentoring framework, there must be an awareness that mentees may experience discomfort during clinical mentoring."

3. 관점 공유 (Perspective Sharing) 🗣️

멘토가 정답만 주입하는 것이 아닙니다(No Knowledge Transmission!). 멘토는 자신의 임상적 관점을 공유하고, 멘티도 자신의 생각을 이야기하며 서로 배우는 구성주의(Constructivism)적 접근이 필요합니다.

"멘토와 멘티는 서로에게서 배울 수 있도록 관점을 공유합니다."

"In this element, mentors and mentees share perspectives so that they may learn from each other."

4. 우선순위화된 시간 (Prioritised Time) ⏰

가장 현실적인 조언입니다. 아무리 좋은 프로그램도 시간이 없으면 무용지물입니다. 멘토와 멘티 모두 서로를 위해 시간을 내기로 '약속'해야 합니다.

"멘토와 멘티의 시간 할애 없이는, 다른 요소들로부터의 학습은 불가능합니다."

"Without the mentors and mentees time commitment, learning from the other elements is not possible."


📈 임상 멘토링의 4단계 (The 4 Phases)

이 4가지 요소는 시간의 흐름에 따라 다음 4단계로 적용됩니다.

  1. 준비 단계 (Preparation): 서로 시간을 내기로 약속하고, 멘토링이 '안전하지만 도전적인' 공간임을 이해하는 단계입니다.
  2. 사전 멘토링 단계 (Pre-mentoring): 구체적인 일정을 잡고, 멘티는 사례 연구(Case study)나 자기 평가를 준비하며 '안락 방해'를 대비합니다.
  3. 멘토링 단계 (Mentoring): 본격적인 활동입니다. 사례 발표, 실제 수행 관찰, 피드백 주고받기가 일어납니다. 이때 그룹 멘토링이나 1:1 멘토링이 진행됩니다.
  4. 사후 멘토링 단계 (Post-mentoring): 공식적인 관계는 끝나지만, 멘티가 스스로 학습을 지속할 수 있는 능력을 갖추게 되는 단계입니다.

📝 마무리하며

이 논문은 물리치료 분야를 중심으로 개발되었지만, 의사, 간호사 등 모든 보건 의료 전문가들에게 적용될 수 있는 매우 실용적인 틀(Framework)입니다.

연구진은 이 틀의 목적을 이렇게 강조합니다.

"제시된 새로운 임상 멘토링 틀은... 임상 실무 개발에 초점을 맞춘 다수의 보건 의료 전문 분야 및 환경에 걸쳐 적용 가능성이 있습니다."

"The novel clinical mentoring framework presented is versatile, with potential applicability across multiple health professional disciplines and settings... that is focused on clinical practice development."

 

후배나 제자를 가르쳐야 하는 위치에 계신가요? 혹은 자신의 임상 실력을 키우고 싶은가요? 그렇다면 단순히 "열심히 해보자"는 다짐 대신, 이 4가지 요소(연결, 안락 방해, 관점 공유, 시간 우선순위)를 갖춘 체계적인 멘토링을 시작해 보는 건 어떨까요?


서론 (Introduction)

보건 의료 전문가들(Health professionals)은 평생 학습(life-long learning)을 가치 있게 여기며, 이는 많은 국가에서 실무자들(practitioners)이 등록(registration)이나 면허(licence to practice)를 유지하기(maintain) 위해 지속적 전문성 개발(continuing professional development [CPD])에 참여(engage in)해야 한다는 요구조건(requirement)에 의해 입증됩니다(evidenced by) (AHPRA & National Boards, 2024; Allied Health Professions Council, 2025; College of Physiotherapists of Alberta, 2023; Depaigne-Loth et al., 2022; Health and Care Professionals Council, 2017; Mlambo et al., 2021; Sherman et al., 2024).

 

많은 전문 분야(professional fields)에서 경력 개발(career development)을 지원하기(support) 위해 사용되어 왔으며, 최근 보건 의료 직종(health professions), 특히 물리치료 학문 분야(discipline of physiotherapy) 내에서 연구의 주제(subject of research)가 되고 있는 CPD 활동은 바로 멘토링(mentoring)입니다 (Ambrosetti et al., 2014; Burgess et al., 2018; Forbes et al., 2021; Geraci & Thigpen, 2017; Hoover et al., 2020; Kram, 1983; Lao et al., 2022; Leahy et al., 2025; Peiser et al., 2018; Westervelt et al., 2018; Williams et al., 2019). 보건 의료 직종에서, 멘토링은 소진(burnout)과 채용(recruitment)에 긍정적인 영향(positive impacts)을 미치는 것으로 보고됩니다 (Cavanaugh et al., 2022; Couch et al., 2021; Harlan et al., 2024).

 

게다가, 멘토링은 물리치료사, 족부 전문의(podiatrists) 및 간호사들의 상급 임상 실무(advanced clinical practice) 개발을 지원하기 위해 점점 더 많이 사용되고 있습니다(increasingly used) (Couch et al., 2018; Ó Mír et al., 2025; Vlerick et al., 2024). 전문직 후속 물리치료 맥락(post-professional physiotherapy context)에서 사용되는 멘토링의 한 형태(form)는 ‘임상 멘토링(clinical mentoring)’이며, 이는 ‘멘토 지도 하의 임상 실무(mentored clinical practice)’라고도 불립니다 (International Federation of Orthopaedic Manipulative Physical Therapists, 2016; Leahy et al., 2022; Westervelt et al., 2018; Williams et al., 2014). 임상 멘토링은 멘티(mentee)의 임상 실무를 향상시키는 것(enhancing mentee clinical practice)이라는 목표가 분명한 목적(targeted purpose)을 가지고 있어서, 더 광범위한 경력 개발 목표(broader career development goals)를 가진 멘토링과는 다릅니다(different to). 이러한 목표가 분명한 목적은 국제 정형 도수 물리치료 연합(International Federation of Orthopaedic Manipulative Physical Therapists [IFOMPT])에 의해 명확히 개요가 서술되었으며(clearly outlined), 그들은 임상 멘토링을 다음과 같이 정의했습니다:

임상 기술(clinical skills)을 학습하고 향상시키는(learning and improving) 구체적인 목표(specific goal)를 가지고 임상 멘토(clinical mentor)의 직접적인 감독(direct supervision) 하에 임상 실무(clinical practice)를 수행(undertaking)하는 것. 학습은 멘토에 의한 학생의 임상 실무에 대한 건설적인 평가(constructive evaluation)와 학생의 실무에 대한 관찰 및 토론(observation and discussion)으로 이루어질 수 있다(result from). 이 과정은 일반적으로 임상 추론(clinical reasoning) 및 수기 기술(manual skills)에 관해 멘토로부터의 지속적인 피드백(ongoing feedback)을 포함하는(involving) 실질적이고 정기적인 토론(substantial and regular discussion)을 수반한다(involves) (International Federation of Orthopaedic Manipulative Physical Therapists, 2016, p. 32)

 

이 정의가 유용하기는 하지만(While this definition is useful), 출판된 임상 멘토링 지침(guidelines)들은 멘토링이 어떻게 수행되어야 하는지(how mentoring should be conducted), 그리고 임상 멘토링이 학습 및 멘토링 이론(learning and mentoring theory)과 연구에 의해 어떻게 정보를 얻는지(informed by)에 대해 제한적인 정보(limited information)만을 제공합니다 (American Physical Therapy Association, 2014; International Federation of Orthopaedic Manipulative Physical Therapists, 2016).

 

실제로(Indeed), 임상 멘토링의 영향을 탐구한 이전 연구(previous research)들은 권장되는(recommended) 임상 멘토링 접근법을 뒷받침하는(underpinning) 실행(implementation)이나 이론적 틀(theoretical framework)에 관한 정보를 제공하지 않았습니다 (Stewart & Carpenter, 2009; Westervelt et al., 2018; Williams et al., 2019).

 

현재의 임상 멘토링 지침들은 전문직 후속 물리치료 교육(post-professional physiotherapy education)과 임상 멘토링을 탐구하는 초기 연구(early research)에 정보를 제공함으로써 물리치료 전문직의 발전(advancement)에 중요한 기여(important contribution)를 했습니다. 그러나, 이제는 학습 이론에 기반을 두고(grounded in learning theory) 물리치료사 특화 학습 연구(physiotherapist specific learning research)의 최신 결과(recent findings)들로 정보를 얻은 업데이트된 지침(updated guidelines)이 필요합니다(need for). 물리치료사의 학습을 지원하기 위해(support the learning) 임상 멘토링의 이론적 아이디어와 정의를 실용적으로 스캐폴딩(pragmatic scaffolding) 할 수 있게 해주는(enables) 틀(framework)이 필요하며, 이는 다른 보건 의료 전문가들에게도 적용 가능성(likely applicability)이 있습니다. 이 논문의 목적(purpose of this paper)은 임상가(clinicians), 관리자(managers), 교육자(educators)들이 이 CPD 활동을 성공적으로 실행(implement successfully)하도록 지원하는, 새롭고(novel) 근거에 기반한(evidence-informed) 임상 멘토링 틀(clinical mentoring framework)을 제시함으로써 이러한 필요를 해결하는 것(address this need)입니다. 제안된(proposed) 임상 멘토링 틀은 임상 멘토링의 설계(design), 전달(delivery), 평가(evaluation)에 있어 향후 방향(future directions)을 위한 구조(structure)를 제공하며, 이를 통해 임상가와 환자 모두에 대한 영향(impact)을 결정하기 위한 향후 연구를 뒷받침합니다(underpinning).

다른 분야의 멘토링 틀과 단계 (Mentoring frameworks and phases from other fields)

널리 채택된(widely adopted) 하나의 멘토링 틀은, 초기에 관리 경영 맥락(managerial business context)에서의 사용을 위해 Kram (1983)에 의해 제안되었는데, 멘토링의 4단계(four phases)를 기술합니다: 개시(initiation), 배양(cultivation), 분리(separation), 재정의(redefinition). 잘 묘사된 일련의 단계들을 통해, Kram은 성공적인 멘토-멘티 관계(mentor-mentee relationship)의 형성(formulation)을 위한 방향(direction)을 제시했습니다.

  • 개시 단계(initiation phase)는 초기 상호작용(early interactions)과 관계가 시작되는(commences) 곳입니다.
  • 배양 단계(cultivation phase) 동안에는, 관계의 경력 및 심리사회적 지원 기능(career and psychosocial support functions)이 성장합니다(grow).
  • 분리 단계(separation phase)에서는, 참여자(participants) 내의 직장(workplace) 혹은 심리적 변화(psychological changes)에 의해 관계가 중단되고(disrupted) 변경됩니다(altered).
  • 마지막 재정의 단계(redefinition phase)는 멘토링이 끝나거나(ends) 새로운 유형의 관계(new type of relationship)로 발전하는(evolves into) 때입니다 (Kram, 1983).

이 단계들은 기간이 동일하지 않으며(not equal in duration), 멘토와 멘티의 요구(needs)를 충족시키는 속도로(at a rate that meets), 그리고 상황적 요인(contextual factors)에 영향을 받으며 장기간에 걸쳐(over an extended period of time) 전개됩니다(evolve).

 

Kram의 틀은 일대일(one-to-one) 멘토-멘티 관계를 위해 특별히 개발되었으며, 이는 멘토링이 수년에 걸쳐(over many years) 일어나는 경력 발전(career progression)을 지원하기 위함이었습니다 (Dominguez & Hager, 2013; Kram, 1983; Schunk & Mullen, 2013). Kram의 지도 원칙(guiding principles)이 멘토링을 구조화하는 데 가치가 있기는 하지만(valuable), 원래의 맥락(original context)은 물리치료 지침과 이전 임상 멘토링 연구에서 묘사된 임상 멘토링의 맥락과는 매우 다릅니다(very different) (International Federation of Orthopaedic Manipulative Physical Therapists, 2016; Westervelt et al., 2018; Williams et al., 2019). 이러한 맥락적 차이(contextual differences)에는 시간의 길이(length of time), 참여자, 목적, 그리고 환경(setting)이 포함됩니다 (표 1 참조).

 

표 1. 비즈니스 멘토링과 물리치료 임상 멘토링 간의 맥락적 차이 (Contextual differences between business mentoring and physiotherapy clinical mentoring)

 

비즈니스 멘토링(Business mentoring)ᵃ 물리치료 임상 멘토링(Physiotherapy clinical mentoring)ᵇ
수개월에서 수년에 걸쳐 수행됨 (Conducted over months to years) 수주에서 수개월에 걸쳐 수행됨 (Conducted over weeks to months)
일대일 멘토-멘티 관계 (One-to-one mentor-mentee relationship) 일대일 멘토-멘티 관계 (One-to-one mentor-mentee relationship)

또는

그룹 관계(한 명의 멘토와 다수의 멘티[multiple mentees])
경력 개발을 촉진하고 지원하는 목적 (Purpose to facilitate and support career development) 환자 진료(patient care)를 향상시키기 위한 학습을 촉진하는 목적 (Purpose to facilitate learning to enhance)
비즈니스 환경 (Business setting) 보건 의료 환경 (Health-care setting)
임원 맥락(executive context) 내에서의 경력 개발에 특화된 연구에 의해 정보를 얻음 보건 의료 전문가 학습(health professional learning)에 특화된 연구에 의해 정보를 얻음

ᵃ Kram (1983)에서 요약됨(Summarised from)

ᵇ International Federation of Orthopaedic Manipulative Physical Therapists (2016), Westervelt et al. (2018) 및 Williams et al. (2014)에서 요약됨

단계의 진화 (Evolution of the phases)

Kram (1983)에 의해 개발된 4단계 멘토링(four phases of mentoring)은 Ambrosetti et al. (2014)에 의해 예비 교사 멘토링 맥락(preservice teaching mentoring context)에서 사용하기 위해 수정되었습니다(modified). 여기서, 멘토링은 교실에서 가르치는 학생 교사들의 능력(student teachers’ abilities to teach)을 개발하려는 구체적인 목적(specific purpose)을 가지고 수주에서 수개월의 더 짧은 기간(shorter period)에 걸쳐 수행되었습니다(conducted) (Ambrosetti et al., 2014). 전문적 전문성(professional expertise)을 향상시키는 구체적인 목적은 멘토링 문헌(mentoring literature)에서 종종 기술되는 광범위한 경력 개발 목적(broader career development purpose)보다 더 좁은 초점(narrower focus)입니다 (Ezzat & Maly, 2012; Forbes et al., 2021; Kram, 1983; Landreville et al., 2019; Mullen & Klimaitis, 2021; Sachdeva, 2016; Snowdon et al., 2020). 따라서, 예비 교사 멘토링 틀(pre-service mentoring framework)은 교육 맥락(education context)에서 교수 역량(teaching competency)의 실질적인 개발(practical development)을 위한 멘토링 과정(mentoring process)에 구조(structure)를 제공하는 소수의 틀 중 하나로 인정받아 왔습니다(acknowledged) (Hairon et al., 2020). 실제로(Indeed), 이 틀은 호주 예비 교사들의 학습과 개발(learning and development)을 위해 19개의 대학-학교 파트너십(University-School partnerships)에서 성공적으로 실행되었습니다(successfully implemented) (Tanti et al., 2023).

 

예비 교사 멘토링 틀멘토링 모델(mentoring model)실행 지침(implementation guidelines)을 기술합니다. 멘토링 모델은 멘토링에 대한 이론적 기반(theoretical underpinnings)을 제공한 학문 분야별 연구(discipline-specific research)에 의해 정보를 얻었으며,

  • 예비 교사 멘토링에 필수적인 것으로 간주되는 관계적(relational), 발달적(developmental), 그리고 맥락적 구성요소(contextual components)로 구성됩니다(consists of).
  • 이 틀의 실행 지침은 멘토링의 4단계인 멘토링 준비(preparation for mentoring), 사전 멘토링(pre-mentoring), 멘토링(mentoring), 그리고 사후 멘토링(post-mentoring)을 기술합니다 (Ambrosetti et al., 2014).

예비 교사 멘토링 단계와 Kram (1983)에 의해 기술된 단계 간의 주요 차이점(key difference)은 관계 내 참여자들의 기대(expectations)와 역할(roles)이 명확히 정의되고 합의되는(clearly defined and agreed upon) 초기 단계의 명시적인 스캐폴딩(explicit scaffolding)입니다.

  • Kram의 개시 단계(initiation phase)에서, 멘티는 지원(support)과 지도(guidance)를 위해 멘토에게 의존하는(looks to) 반면, 멘토는 발달적 기회(developmental opportunities)를 제공하기 시작합니다 (Kram, 1983). 대조적으로(In contrast),
  • Ambrosetti의 멘토링 준비 및 사전 멘토링 단계는 두 참여자 모두에게 제공되는 멘토링 전략(mentoring strategies) 훈련과, 기대, 역할, 목표, 그리고 회의 일정(meeting schedules)이 논의되는 초기 회의(initial meeting)가 조직되어 있어 더 구조화되어 있습니다(more structured).

물리치료 맥락에서의 단계 (Phases in the physiotherapy context)

Ambrosetti et al. (2014)에 의해 예비 교사 멘토링에서 명시된(articulated) 단계들과 구조화된 접근법(structured approach)은 물리치료 및 기타 보건 의료 전문 분야(health professional disciplines)의 임상 멘토링과 맥락적 유사성(contextual similarities)을 가집니다. 이는 수주에서 수개월의 유사한 기간(similar timeframes)에 걸쳐 수행되며, 전문성 개발(development of expertise)과 관련된 목표가 분명한 목적(targeted purpose)을 가지기 때문입니다. 예비 교사들에게 전문성은 교실 수업(classroom teaching)과 관련이 있는 반면, 물리치료사와 같은 보건 의료 전문가들에게 전문성은 환자의 평가 및 관리(assessment and management of patients)와 관련이 있습니다. 이러한 이유로, 예비 교사 멘토링 틀은 이 논문에서 제시된 임상 멘토링 틀의 개발에 정보를 제공하기 위해(inform the development) 사용되었습니다.

 

단계의 명시(articulation of phases)만으로는 효과적인 전문성 개발 활동(effective professional development activity)에 요구되는 멘티와 멘토의 행동(behaviours)에 대한 근거에 기반한 지침(evidence informed guidance)을 위한 충분한 세부 사항(sufficient detail)을 제공하지 않습니다. 여기서, 물리치료사를 위한 전문성 개발 접근법의 효과성(effectiveness)을 탐구한 최근의 체계적 문헌고찰 근거(recent systematic review evidence)가 지침을 제공합니다 (Leahy et al., 2020a, b). 이 연구의 결과들은 물리치료사 및 헬스케어 맥락에서 효과적인 임상 멘토링 관계(effective clinical mentoring relationship)를 위해 요구된다고 생각되는 제안된 4가지 핵심 원칙(four key principles)에 영감을 주었습니다. 이어지는 섹션들은 먼저 성공적인 멘토링-멘티 경험을 위한 원칙들을 탐구합니다. 임상 멘토링의 요소(elements of clinical mentoring)라고 불리는 이 원칙들은, 그 후 Ambrosetti et al. (2014)에 의해 제안된 대로 임상 멘토링 경험 전반에 걸친 실용적인 단계(pragmatic phases)로 확장됩니다(expanded into).

임상 멘토링 요소 (The clinical mentoring elements)

우리는 이용 가능한 최상의 근거(best available evidence)에 의해 정보를 얻은 전문성 개발 경험을 촉진하기 위해(facilitate) 임상 멘토링 동안 고려를 필요로 하는(require consideration) 4가지 요소를 제안합니다 (그림 1; 표 2). 이 4가지 요소는 연결(connection), 안락 방해(comfort disruption), 관점 공유(perspective sharing), 그리고 우선순위화된 시간(prioritised time)입니다. 이 요소들은 가치 있는 학습(worthwhile learning)이 일어나기 위해 필요한 것으로 생각되며, 전문직 후속 물리치료사(post-professional physiotherapists)들의 학습을 탐구한 41개 질적 연구(qualitative research studies)의 이전 주제 합성(previous thematic synthesis)으로부터 도출되었습니다(derived from) (Leahy et al., 2020b).

 

이 4가지 요소는 상호 관련되어 있으며(inter-related) 어느 한 요소가 다른 것보다 더 중요한 것으로 식별되지는 않습니다. 각 요소는 물리치료사 학습 연구(physiotherapist learning research)뿐만 아니라 보건 및 교육 분야(health and education sectors)의 다른 뒷받침하는 학습 연구 및 이론(supporting learning research and theory)을 참조하여 이 섹션에서 기술될 것입니다.

 

요소 1: 연결 (Element 1: connection)

기술 (Description)

연결(Connection)은 멘티가 학습하기 위해 필요합니다. 여기서 연결은 동일한 수준에서 활동하는(operating) 동료들(peers)과의 상호작용뿐만 아니라, 자신보다 더 많은 전문성과 경험(more expertise and experience)을 가진 보건 의료 전문가들과의 상호작용을 의미합니다.

  • 연결은 멘티들이 질문하고(ask questions), 자신의 추론을 명시하고(articulate their reasoning), 생각을 공유하며(share their thoughts), 외부 피드백(external feedback)을 위해 타인에게 그들의 임상 실무를 노출할(expose) 기회를 제공합니다.
  • 그룹 환경(group setting)에서 타인과 연결하는 것은 자신의 임상 실무를 향상시키기 위해 노력하는(striving to improve) 다른 동기 부여된 멘티들을 관찰하는 것을 통해 역할 모델링(role modelling)을 촉진합니다.
  • 멘토 또한 전문적인 임상 실무(expert clinical practice)와 존중하는 관계(respectful relationships) 및 지속적 학습(ongoing learning)에 대한 헌신(commitment)을 역할 모델링합니다.

연결 요소의 중요한 측면은 협력적으로 설정된 학습 목표(collaboratively set learning goals)를 해결하기 위해 멘토와 함께 적극적으로 일하는(actively working together) 멘티입니다.

뒷받침하는 근거 및 이론 (Supporting evidence and theory)

41개 연구(n = 719)에 대한 최근의 체계적 문헌고찰은 물리치료사들이 가치 있는 학습이 다른 물리치료사들과의 연결(connection with other physiotherapists), 특히 자신보다 더 뛰어난 전문성을 가진 이들과의 연결을 필요로 한다고 인식했음을 보고했습니다 (Leahy et al., 2020b). 이러한 상호작용은 물리치료사들에 의해 임상 성찰(clinical reflection), 학습 책무성(learning accountability), 임상 실무 격차에 대한 자각(self-awareness of clinical practice gaps), 그리고 학습 업무량의 감소(reductions in learning workload)를 촉진하는 것으로 보고되었습니다 (Leahy et al., 2020b). 물리치료사들은 타인과 연결하는 것이 영감을 주고(inspiring), 그들에게 자신감(confidence)과 동기(motivation)를 준다고 믿었습니다 (Leahy et al., 2020b). 동기 부여된 개인을 관찰하는 것을 통한 역할 모델링 또한 학습의 중요한 측면으로 간주되었습니다. 체계적 문헌고찰의 양적 연구 결과(quantitative findings)는 상호작용적 구성요소(interactive components)를 가진 학습 활동이 물리치료사의 행동과 그들 환자의 결과(outcomes of their patients)를 향상시키는 데 효과적이었다는 점에서 이 주제와 일치했습니다(consistent with this theme) (Leahy et al., 2020a). 효과적인 학습 활동에는 성과에 대한 피드백(feedback on performance)과 학습 목표를 달성하기 위한 전략에 대한 토론도 포함되었으며, 이 둘 다 타인과의 상호작용을 필요로 합니다.

 

연결 요소에 포함된 상호작용과 역할 모델링은 멘토링에 정보를 제공하기 위해 사용된 이전 이론들(previous theories)에서도 중요한 것으로 식별되었습니다. Dominguez와 Hager (2013)에 의한 멘토링에 정보를 제공하는 데 사용된 15개 이론에 대한 비판적 고찰(critical review)에서, 5가지 사회 이론(five social theories)이 식별되었습니다. 이 사회 이론들에서, 멘티는 공통의 목적(common purpose)을 향해 일하고 관계의 목표 설정(setting goals of the relationship)에 적극적으로 기여함으로써 멘토와 상호작용하는 능동적 참여자(active participants)로 여겨졌습니다. 사회 이론들은 멘티를 실행하고 존재하는 방식(ways of practicing and being)이 서로 다른 다양한 역할 모델(variety of role models)에 노출시키는 다중 관계(multiple relationships)의 잠재적 이점을 강조합니다 (Dominguez & Hager, 2013). 이 사회 이론들에서 묘사된 바와 같이, 멘티의 발달에 있어서 사회적 상호작용과 역할 모델링의 중요성은 이 틀의 연결 요소에 대한 필요성(need for the connection element)을 설명해 줍니다(illustrates).

 

연결 요소는 또한 보건 의료 전문가들이 임상 환경(clinical setting)과 시뮬레이션(simulation) 중에 어떻게 학습하는지를 설명하기 위해 사용되어 온 사회 학습 이론(social learning theory)과 일치합니다 (Horsburgh & Ippolito, 2018; O’Regan et al., 2016). 사회 학습 이론은 학습이 다른 사람의 행동 관찰(observation of another person’s behaviour)과 그 행동의 결과(consequences of that behaviour)를 통해 습득된다고 제안합니다 (Bandura, 1971). 이 이론에 따른 학습은 주의(attention), 파지(retention), 재생(reproduction), 그리고 동기(motivation)의 단계를 포함합니다 (Bandura, 1971). 이 사회 학습 이론 렌즈(social learning theory lens)를 통해 연결 요소를 바라보는 것은 임상 멘토링에서 학습이 어떻게 일어날 수 있는지를 설명합니다. 예를 들어, 임상 멘토링 상호작용 중에 동료 멘티와 멘토의 내러티브(narratives)에 주의를 기울임(attending to)으로써, 멘티들은 전달된 정보를 내재화(internalise)하고 기억합니다(retain). 그 후 멘티들은 그들이 학습한 것을 자신의 임상 실무에서 재생산(reproduce)하며 미래에 이 새로운 학습을 계속 사용하는 데 동기를 부여받습니다. 사회 학습의 잠재력은 관찰자 역할(observer role)을 수행한 보건 의료 학생들로부터 향상된 학습 결과가 도출되었던 5개 시뮬레이션 교육 연구에 대한 최근의 체계적 문헌고찰에서 설명됩니다 (O’Regan et al., 2016). 여기서, 학습은 사회 학습 이론에서 제안된 바와 같이 다른 사람의 경험을 관찰하는 것을 통해 대리적으로(vicariously) 일어나는 것처럼 보였습니다.

 

사회 학습 이론이 연결을 뒷받침하지만, 연구 근거는 상호작용의 질(quality of the interactions)이 낮다면(poor) 관계만으로는 학습에 영향을 미치기에 불충분할 수 있음을 나타냅니다. 양질의 상호작용을 지원하기 위해, 직장 내 학습(workplace learning)을 최적화하기 위한 교육적 동맹(educational alliance)이라는 이론적 개념이 Telio et al. (2015)에 의해 개발되었습니다. 교육적 동맹은

  • (1) 공유된 목표(shared goals) 혹은 목적,
  • (2) 이 목표들을 달성하는 방법에 대한 합의(agreement), 그리고
  • (3) 학습자와 교육자 간의 유대(bond), 혹은 상호 신뢰와 존중(mutual trust and respect)에 대한 학습자의 인식(perception)을 말합니다 (Telio et al., 2015).

이 이론은 학습자들이 피드백을 제공하는 사람과 강한 관계(strong relationship)를 인식했을 때 피드백을 더 잘 수용했다(more receptive to feedback)는 것을 보여준 Telio et al. (2015)에 의해 식별된 5개 연구에 의해 정보를 얻었습니다 (Bing-You et al., 1997; Eva et al., 2012; Sargeant et al., 2008, 2010; Watling et al., 2012). 이러한 관찰은 후속 연구들에서 반복되었습니다 (Johnson et al., 2019; Telio et al., 2016). 예를 들어, Telio et al. (2016)은 36명의 정신과 전공의(psychiatry residents)들을 대상으로 반구조화된 인터뷰(semi-structured interviews)를 완료했으며, 빈약한 교육자 신뢰성(poor educator credibility)에 대한 인식으로 인한 약한 교육적 동맹은 학습자들이 피드백을 무시하고 관여하지 않는 결과(dismissing and disengaging)를 초래했다고 보고했습니다. 반면, 35개의 공식적인 피드백 에피소드(formal feedback episodes)에 대한 관찰 연구는 학습자가 심리적 안전(psychological safety)을 인식하는 강한 교육적 동맹더 많은 학습자 피드백 추구(greater learner feedback seeking) 및 관점 공유(perspective sharing)와 연관되어 있음을 밝혔습니다 (Johnson et al., 2019).

 

전반적으로, 이 연구는 멘토가 단순히 멘티와 연결되는 것만으로는 충분하지 않다(not enough)는 것을 시사합니다. 연결이 가치 있기는 하지만, 중요한 것은 연결의 실제적인 질(actual quality of this connection)입니다. 연결은 멘티가 경험과 멘토의 의견(opinion of the mentor)을 가치 있게 여기는 것에 달려 있습니다. 만약 멘티들이 멘토가 보건 의료 전문가로서 그들의 발전에 대해 신경 쓴다(cares about their development)고 인식한다면, 그들은 자신의 관점을 공유하고 피드백 대화(feedback conversations)에 적극적으로 참여할 준비가 될 것입니다.

요소 2: 안락 방해 (Element 2: comfort disruption)

기술 (Description)

임상 멘토링 틀(clinical mentoring framework) 내에서는, 멘티들이 임상 멘토링 중에 불편함(discomfort)을 경험할 수 있다는 인식(awareness)이 있어야 합니다. 이러한 불편함은 타인에게 임상 결정(clinical decisions)을 발표할 때(presenting) 느끼는 취약함(feeling vulnerable), 환자 상담(patient consultations) 중에 관찰당하는 것(being observed), 그리고 성과에 대한 피드백(feedback on performance)에 참여하는 것에서 기인할 수 있습니다(stem from). 이러한 활동들은 불안을 유발하고(anxiety provoking) 잠재적으로 학습에 해로울(detrimental) 수 있으므로, 이 틀에서는 점진적 노출 접근법(graduated exposure approach)이 권장됩니다(encouraged). 예를 들어, 처음에는 멘티들이 동료 그룹(group of peers)에게 환자 사례 연구(patient case study)를 발표하여, 다른 이들이 자신이라면 비슷하게 혹은 다르게 행동했을 것에 대한 관점(perspectives)을 공유할 수 있게 합니다. 이것은 이후 멘티의 성과(mentee performance)를 관찰하고, 임상 멘토와 개별적인 피드백 토론(individual feedback discussions)을 하는 것으로 발전될(progressed to) 수 있습니다. 여기서, 멘티의 성과는 평가되며(evaluated) 향후 임상 실무를 향상시키는 것(improving future clinical practice)을 목표로(with the aim of) 피드백 토론의 기초(basis)로 사용됩니다. 불편함에 대한 점진적 노출(graduated exposure to discomfort) 외에도, 멘토는 멘티들과 연결하는 데(connecting with mentees) 숙련되어야(skilled) 하며, 그래야 멘티들이 학습에서 위험을 감수(take risks)하고 사례 연구 발표나 타인이 자신의 임상 실무를 관찰하고 비평(critique)하도록 허용하는 것과 같은 이러한 안락 방해 활동(comfort disruption activities)을 완수할 만큼 충분히 안전하다고 느끼게(feel safe enough) 됩니다.

뒷받침하는 근거 및 이론 (Supporting evidence and theory)

안락 방해 요소는 물리치료사들이 자신의 안락지대(one’s comfort zone)에서 벗어나는 것(being taken out of)이 가치 있는 학습(worthwhile learning)이 일어나는 데 중요하다고 인식했음을 보여준 체계적 문헌고찰에서 식별된 ‘안락지대 밖으로(out of comfort zone)’라는 주제(theme)에서 영감을 받았습니다 (Leahy et al., 2020b). 물리치료사들이 가치 있다고 여긴 핵심적인 ‘안락지대 밖으로’ 활동 중 하나는 관찰된 역할극(observed role play)이나 실제 임상 만남(actual clinical encounter) 후에 피드백을 받는 것(receiving feedback)이었습니다 (Maas et al., 2015, 2017; Petty et al., 2011). 이것은 물리치료사들이 그들의 관찰된 성과(observed performance)에 대해 피드백을 받았을 때 행동의 개선(improvements in behaviour)이 일어났음을 발견한 양적 연구들(quantitative studies)과 일치합니다(aligns with) (Leahy et al., 2020a).

 

안락 방해 요소에서의 임상 성과에 대한 피드백(feedback on clinical performance)은 피드백이 학습을 향상시킨다는 것(enhances learning)을 입증하는 다른 체계적 문헌고찰들에 의해서도 뒷받침됩니다 (Castro et al., 2021; Ivers et al., 2012; Johnson et al., 2020; Wisniewski et al., 2020). 임상 멘토링과 가장 관련성(greatest relevance)이 높은 것은 Johnson et al. (2020)에 의해 수행된 8건의 무작위 대조군 연구(RCTs)에 대한 메타분석(meta-analysis)입니다. 이 메타분석은 보건 의료 학생(health professional students)과 자격을 갖춘 의사들(qualified medical practitioners)의 임상 과업 성과(clinical task performance)에 대한 구두 피드백(verbal feedback)의 중등도 효과(moderate effects) (SMD 0.7, 95%CI 0.37–1.03)를 보고했습니다. 이러한 결과는 의과 대학생들이 성과에 대한 피드백으로부터 학습하는 것을 조사한 13건의 RCT에 대한 메타분석에서도 반영되었으며(mirrored), 해당 연구는 수술 기술(surgical skills) 및 의사소통(communication)에 대한 피드백 중재(feedback interventions)의 중등도 효과를 보고했습니다 (SMD 0.53, 95%CI 0.26–0.79; SMD 0.67, 95%CI 0.10–1.24) (Castro et al., 2021).

 

이러한 방대한 연구(body of research)가 임상 멘토링에서 관찰된 성과에 대한 피드백 사용을 지지하지만, 안락 방해 요소를 실행할(implementing) 때 학습이 악화되지 않고(not worsened) 향상되도록 보장하기 위해 고려되어야 할 잠재적인 부정적 효과(potential negative effects)도 존재합니다. Kluger와 DeNisi (1996)에 의한 메타분석은 포함된 연구의 3분의 1 이상에서 피드백 중재가 학습자의 성과를 감소시켰다(reduced learner performance)고 보고했습니다. 이는 피드백 중재가 포함된 연구의 21%에서 동기부여 결과(motivational outcomes)에 부정적인 영향(negative effect)을 미쳤다고 보고한 Wisniewski et al. (2020)에 의해 수행된 더 최근의 메타분석과 일치합니다(consistent with). 잘못 실행된 피드백(poorly implemented feedback)으로 인한 이러한 잠재적인 학습 감소를 해결하기 위해(address), 피드백을 학습자가 대화(dialogue)에 참여하도록 촉진되고, 더 큰 주체성(greater agency)을 가지며, 피드백으로부터의 자신의 학습에 대해 책임(responsibility)을 지는 과정(process)으로 재구성(reframe)하기 위해 교육적 동맹 이론(educational alliance theory)이 개발되었습니다 (Telio et al., 2015).

 

연결 요소(connection element)에서 앞서 기술된 교육적 동맹 이론 효과적인 피드백이 멘티-멘토 관계의 질(quality of a mentee-mentor relationship)에 달려 있다고(dependent on) 제안합니다 (Telio et al., 2015). 이 이론은 앞서 기술된 Telio et al. (2016)의 연구 결과에 의해 뒷받침됩니다. 이 연구의 결과는 만약 학습자가 피드백을 제공하는 교육자가 보건 의료 전문가로서 자신의 발전에 투자하고 있다(invested in their development)고 믿는다면, 그들이 이 피드백을 수용하고 관여할(accept and engage with) 의지가 더 크다는 것을 시사합니다 (Telio et al., 2016). 교육적 동맹 이론에 따르면, 학습자와 교육자가 시간을 내어(taking the time) 협력적 학습 목표(collaborative learning goals)를 개발하고 그러한 목표를 달성하기 위해 노력하는 전략에 합의하는(agreeing on strategies) 것은 이러한 동맹을 육성하는 데(fostering this alliance) 도움이 된다고 여겨집니다.

 

교육적 동맹 이론이 보건 의료 전문가들을 위한 CPD 지원에 미치는 영향을 입증하는 실증적 연구(empirical research)는 제한적이지만(limited), 이 이론이 임상 멘토링을 지도하는 데(guiding) 관련성을 지닌다는(carries relevance) 것을 입증한 하나의 중요한 연구(critical study)가 있습니다. Noble et al. (2020)에 의한 이 연구에서, 27명의 보건 의료 학생들이 임상 실습(clinical placements)을 완료하기 전에 피드백 리터러시 교육 프로그램(feedback literacy education program)을 이수했습니다(completed). 이 피드백 리터러시 프로그램은 교육적 동맹 이론을 포함한 3가지 피드백 접근법(three feedback approaches)에 기초했습니다. 실습 후 인터뷰(Post-placement interviews)는 학생들이 실습 전 피드백 교육(preplacement feedback education)을 이수했을 때 피드백에 대한 접근 방식(approach to feedback)을 변화시켰음을 드러냈습니다. 이러한 변화에는 피드백을 받는 수동적 접근(passive approach)에서 벗어나, 피드백 대화를 시작하고(initiating feedback conversations), 피드백 대화(feedback dialogue)에 참여하는 것으로의 이동이 포함되었습니다. 학생들은 또한 이 접근법을 사용할 때 자신의 성과를 향상시키는 방법에 대해 유용한 전략적 토론(useful strategic discussions)을 했다고 보고했습니다. 이러한 긍정적인 결과에도 불구하고, 교육에서 일반적인 피드백(usual feedback)과 비교하여 이 이론에 의해 정보를 얻은 피드백의 상대적 효과성(relative effectiveness)은 아직 다양한 학습 집단(diverse learning groups)에 걸쳐 혼합 연구 방법(mixed methods)을 사용하여 검증되어야 합니다(yet to be tested). 전반적으로, 연구와 교육 이론은 관찰된 성과에 대한 피드백(feedback on observed performance)을 가치 있는 학습을 위해 요구되는 안락 방해 요소의 핵심적인 측면(key aspect)으로서 지지합니다. 연구는 또한 부정적인 감정(negative emotions)이 피드백으로부터의 잠재적 학습 이점(potential learning benefits)을 가로채는(hijacking) 가능성을 최소화하기 위해 멘토가 교육적 동맹이 형성되도록 보장하는 조치를 취하는 것(taking steps)을 지지합니다.

요소 3: 관점 공유 (Element 3: perspective sharing)

기술 (Description)

이 요소에서, 멘토와 멘티는 서로에게서 배울 수 있도록(learn from each other) 관점(perspectives)을 공유합니다. 이것은 멘티 동료들(mentee peers) 간의 관점 공유의 형태일 수도 있고, 멘토가 멘티와 관점을 공유하는 형태일 수도 있습니다. 멘토가 관점을 공유하는 것은 오직 멘티의 성과를 관찰한 후(after observing), 혹은 멘티의 질문에 대한 응답(in response to a mentee’s question)으로만 일어납니다. 이러한 방식으로, 멘토는 임상적 관점을 공유하고 멘티가 멘토링 세션 밖에서도(outside the mentoring sessions) 학습을 지속할 수 있도록 멘티를 추가적인 신뢰할 수 있는 자원(trustworthy resources)으로 안내하는(directs) 초기의 접근 가능한 자원(initial accessible resource)이 됩니다.

뒷받침하는 근거 및 이론 (Supporting evidence and theory)

관점 공유 요소에 대한 필요성(need for)은 물리치료사들이 가치 있는 학습이 접근 가능하고 신뢰할 수 있는 자원(accessible, trustworthy resources)을 필요로 한다고 느꼈음을 발견한 물리치료사를 위한 CPD에 관한 체계적 문헌고찰의 질적 주제 합성(qualitative thematic synthesis)에 기초합니다 (Leahy et al., 2020b). 체계적 문헌고찰에서, 이러한 접근 가능하고 신뢰할 수 있는 자원은 실천 공동체(communities of practice)나 전문가들(experts)에 의해 편집된 서면 문서(written documents)로 식별되었습니다 (Leahy et al., 2020b). 우리는 멘토가 멘티와 자신의 관점을 공유함으로써 접근 가능하고 신뢰할 수 있는 자원으로서의 역할(act as)을 할 수 있다고 주장합니다(contend). 게다가, 멘티 동료들도 그룹 멘토링 동안 마찬가지로 자신의 관점을 공유함으로써 접근 가능한 자원으로서 역할을 할 수 있습니다.

 

멘토가 자신의 관점을 공유하는 것에 대한 잠재적인 비판(potential criticism)은, 그들이 멘토링에 대해 전달 관점(transmission perspective)을 채택할 수도 있다는 것입니다. 전달 관점은 Pratt (2002)이 250명의 교사들에 대한 관찰 연구에 기초하여 기술한 5가지 교수 관점(five teaching perspectives) 중 하나입니다 (Collins & Pratt, 2011). 전달 관점에서는, 지식(knowledge)이 학습자의 외부(outside the learner) 그리고 교사의 내부(within the teacher)에 존재하는 것으로 여겨집니다 (Pratt, 2002). 교사는 이 지식을 효율적이고 효과적으로(efficiently and effectively) 학습자에게 전달(pass on)해야 합니다. 이 관점의 위험(danger)은 학습자가 지식으로 채워져야 할 용기(container)로 생각될 수 있다는 것입니다 (Pratt, 2002). 이 관점을 채택하는 것은 지식을 전파하는 것(disseminating knowledge)에 주된 초점을 두는 것으로 이어질 수 있으며, 이는 102건의 시험(trials)에 대한 체계적 문헌고찰에서 보건 의료 전문가들의 실무를 향상시키는 데 효과적이지 않다(ineffective)고 밝혀졌습니다 (Oxman et al., 1995). CPD 효과성을 평가한 31개 연구의 메타분석에서 Mansouri와 Lockyer (2007)는 학술대회(conferences)나 강의(lectures) (SMD 0.06, 95%CI 0.02, 0.09) 그리고 우편 발송 전략(mail out strategies) (SMD 0.01, 95%CI -0.01, 0.04)과 같은 지식 전파 활동에 대해 의사 성과(physician performance)에 미치는 유사한 결과를 발견했습니다. 다행히도, 유능한 멘토(capable mentors)와 함께라면, 지식 전달 관점을 채택한다는 이러한 비판은 임상 멘토링 틀에서 타당하지 않은데(not valid), 왜냐하면 멘토는 멘티의 질문이나 피드백 요청(request for feedback)에 대한 응답(in response)으로 자신의 관점을 공유하기 때문입니다. 즉, 학습자가 초기에 자기 평가(self-evaluated)를 하고, 지식 격차(knowledge gap)를 식별했으며, 그 후 도움을 요청한 것입니다. 이러한 방식으로, 멘티는 자신의 지식을 구성하려는 시도(attempts to construct their own knowledge)를 하고 있으며, 이는 학습에 대한 구성주의(constructivism) 접근법과 일치합니다 (Dennick, 2016).

 

멘티가 멘토에게 질문하도록 장려하는 것(Encouraging mentees to ask questions)은 학습을 촉진하기 위해 구성주의를 사용할 추가적인 기회를 제공합니다. 구성주의의 핵심 원칙(key principle)은 학습이 구축 과정(building process)이며, 여기서 이전 지식(previous knowledge)이 새로운 지식을 이해하는 데 도움을 준다는 것입니다 (Dennick, 2016). 이 원칙을 사용하여, 멘토는 질문에 답하기 전에 멘티가 그들 자신의 관점과 이해(understandings)를 공유하도록 장려할 수 있습니다. 이러한 방식으로, 멘티는 이전 지식을 활성화하고(activates) 현재의 이해를 공유합니다. 이것은 멘토가 멘티가 이미 무엇을 알고 있는지 이해하도록 도와서(assists), 그들의 현재 지식에 덧붙일(add to) 수 있게 합니다. 이러한 이해 없이는, 멘토는 멘티의 진정한 지식 격차가 어디에 있는지에 대한 통찰(insight)이 없을 수 있기 때문에 멘티가 이미 알고 있는 것을 단순히 반복할지도 모릅니다.

 

사회 학습 이론(Social learning theory) 또한 관점 공유 요소에 정보를 제공하는 데 사용될 수 있습니다. 만약 멘토가 질문에 대한 응답으로 다른 멘티들이 자신의 관점을 공유하도록 장려한다면, 이것은 사회 학습 및 구성주의 이론과 일치하게 사회적 상호작용(social interactions)과 역할 모델링을 통한 학습을 장려하는 것입니다 (Bandura, 1971; Dennick, 2016). 동료를 역할 모델로 사용하는 것의 잠재적 이점은 고립된 임상 문제(isolated clinical problem)를 해결하는 것에 국한되지 않으며, 열정(enthusiasm), 동기(motivation), 다른 관점을 공유하려는 준비(preparedness), 그리고 전문직업성(professionalism)을 포함할 수 있습니다.

 

요약하자면(In summary), 관점 공유 요소는 구성주의 및 사회 학습 이론과 일치할 수 있습니다. 하지만, 이것은 멘토가 순수한 지식 전달 관점(pure knowledge transmission perspective)보다는 구성주의적 접근(constructivist approach)을 취하는 것에 달려 있습니다.

 

요소 4: 우선순위화된 시간 (Element 4: prioritised time)

기술 (Description)

이 틀(framework) 내에서, 임상 멘토링 회의(clinical mentoring meetings)와 연관된 학습 활동(associated learning activities)을 완료하기 위해 멘토와 멘티 모두로부터의 시간 할애(time commitment)가 기대됩니다. 이러한 활동에는 사례 연구 준비하기(preparing case studies), 임상 성찰 활동(clinical reflection activities) 완료하기, 목표 설정하기(setting of goals), 그리고 목표를 달성하기 위한 전략 실행하기(implementing strategies)가 포함됩니다. 멘토와 멘티의 시간 할애 없이는(Without the mentors and mentees time commitment), 다른 요소들로부터의 학습은 불가능합니다(not possible).

뒷받침하는 근거 및 이론 (Supporting evidence and theory)

물리치료사 학습을 탐구한 41개 질적 연구에 대한 최근의 주제 합성(thematic synthesis)은 물리치료사들이 가치 있는 학습이 일어나기 위해서는 학습 활동을 완료할 시간이 필요하다(need time)고 인식했음을 발견했습니다 (Leahy et al., 2020b). 여기에는 멘토링, 감독 하의 실습(practicing under supervision), 그리고 다른 물리치료사들과 협력하는(collaborating) 시간이 포함되었습니다. 이러한 결과는 보건 의료 전문가들이 CPD와 멘토링에 참여하는 것(engaging with)에 관심이 있지만, 참여에 대한 장벽(barrier to participation)으로 시간 부족(lack of time)을 꼽는다(identify)고 보고한 다른 연구들과 일치합니다(consistent with) (Barrett et al., 2017; Dirks, 2021; Haywood et al., 2013; Merga et al., 2020; Vlieland et al., 2016; Wilson & Taylor, 2019). 임상 멘토링이 관계를 형성하고(forming a relationship), 다른 요소들이 나타나도록(emerge) 허용하며, 학습이 강화되도록(reinforced) 성공하기 위해서는, 시간을 우선순위화하는 것(prioritising time)이 필수적인 요소(essential element)입니다.

 

임상 멘토링 틀: 요소와 단계의 통합 (Clinical mentoring framework: integrating elements with phases)

실무 전문성(practice expertise)을 향상시키기 위한 목적(purpose)으로 임상 멘토링 요소를 실용적으로 적용(pragmatic application)함에 있어, 이 요소들은 시간이 지남에 따라 식별 가능한 핵심 단계(key identifiable phases)들과 교차합니다(intersect with). 이것은 임상 멘토링의 멘토-멘티 관계를 Kram (1983)에 의해 기술된 광범위한 경력 개발 멘토-멘티 관계와 구별 짓습니다(distinguishes). 준비 단계(preparation phase), 사전 멘토링 단계(pre-mentoring phase), 멘토링 단계(mentoring phase), 그리고 사후 멘토링 단계(post-mentoring phase)라는 4가지의 뚜렷한 단계(four distinct phases)가 있습니다. 요소들은 각 단계에서 명백하게 드러나지만(evident), 멘토와 멘티가 그 요소들을 표현하는 방식(how... express)은 각 단계에 걸쳐 다릅니다 (표 2). 요소들의 표현에 있어서 이러한 미묘하지만 중요한 차이(subtle yet important differences)는 실무 전문성의 맥락에서 학습을 위한 스캐폴드(scaffold)를 제공합니다. 또한 이러한 표현은 개별(individual) 대 그룹(group) 임상 멘토링 경험 간에, 그리고 특히 멘토링 단계에서의 온라인 대 대면(online versus in person) 맥락 간에도 다릅니다.

요소를 통합한 준비 단계 (Preparation phase incorporating elements)

준비 단계 동안, 멘티와 멘토는 임상 멘토링 과정(clinical mentoring process)을 소개받습니다. 멘티와 멘토 모두 예정된 멘토링 세션(scheduled mentoring sessions)과 세션 밖에서 완료되는 과업(tasks) 모두를 위해 이 과정에 시간을 우선순위화(prioritise time)할 것이 기대됩니다. 멘티와 멘토의 임상 멘토링 관여(Engagement)는 임상 멘토링 요소와 관련된 역할 기대(relevant role expectations)에 대한 교육을 제공함으로써 지원받습니다. 이 교육은 멘티들이 안락 방해(comfort disruption)와 관점 공유(perspective sharing)에 참여하기에 안전하다고 느끼는 비판단적인 학습 환경(non-judgmental, learning environment)을 조성하는 것의 중요성을 강조해야 합니다(should emphasize).

요소를 통합한 사전 멘토링 단계 (Pre-mentoring phase incorporating elements)

임상 멘토링을 위한 일정(schedule)은 사전 멘토링 단계 동안 합의되어야 합니다(needs to be agreed on). 임상 멘토링 세션은 수주에서 수개월에 걸쳐 간격을 두어야(spaced over) 하며, 이는 델파이 연구(Delphi study)에서 양질의 피드백 대화(quality feedback conversations)를 위해 요구되는 것으로 식별된 반복적인 과정(iterative process)을 가능하게 합니다 (Johnson et al., 2016). 멘티들은 멘토링 단계 동안 안락 방해 및 관점 공유 활동을 할 준비가 되었음을 보장하기 위해 준비 작업(preparatory work)을 완료해야 합니다. 여기에는 토론을 위한 사례 연구 준비(preparation of case studies), 환자-멘티 상호작용 비디오 녹화(video-recording), 자기 평가(self-evaluations) 완료, 그리고 피드백 대화의 시작을 위한 계획 수립이 포함될 수 있습니다. 자기 평가에 기초한 초기 학습 목표(Initial learning goals)는 멘토와 만나기 전에 멘티에 의해 초안이 작성되어야(drafted) 합니다. 이러한 초기 학습 목표들은 임상 멘토링 관계 동안 멘티의 학습에 대한 원함(wants)과 필요(needs)에 대한 추가적인 이해가 나타남에 따라 반복적으로 검토되어야(reviewed iteratively) 합니다.

요소를 통합한 멘토링 단계 (Mentoring phase incorporating elements)

필수적인 것은 아니지만(While not essential), 멘토링 단계는 안락 방해(comfort disruption)가 덜한(less) 곳에서 관계가 발전할 수 있도록 멘티의 사례 발표(case presentations)를 통한 그룹 기반 멘토링(group-based mentoring)으로 시작하는 것을 고려해야 합니다. 멘티에 대한 직접적인 피드백(direct feedback)보다는 사례에 대한 그룹 기반 토론(Group-based discussion)이 더 초점이 맞춰지고 개인적인 성찰(more focused and personal reflection)이 시도되기 전에 신뢰(trust)와 연결(connection)이 발전하도록 허용합니다. 이 접근법은 인지적 및 회복탄력성 요구(cognitive and resilience demand)를 증가시키며 멘토링의 스캐폴딩(scaffolding)을 촉진합니다. 그룹 및 개별 멘토링 모두 가치 있는 학습을 위해 연결, 안락 방해, 관점 공유라는 세 가지 요소를 포함해야 합니다(need to incorporate).

  • 그룹 멘토링 (Group mentoring)
    • 그룹 멘토링에서는, 한 명의 멘토가 다수의 멘티에게 배정됩니다(allocated). 그룹 멘토링의 장점은 시간 효율성(time efficiency)과 동료 학습(peer learning)입니다 (Boud et al., 1999; Tai et al., 2016). 멘티들은 자신의 임상 실무에서 가져온 환자의 사례 연구를 그룹에 발표합니다. 이런 방식으로, 그들은 자신의 임상 실무와 관련하여 역할 모델(role model)로서 행동하고 있으며, 다른 물리치료사들과 자신의 임상 결정의 정당성(clinical decision justifications)을 공유함으로써 스스로를 ‘안락함 밖으로(out of comfort)’ 내보냅니다. 멘토는 그룹에 자신의 관점과 피드백을 공유하기 전에, 모든 멘티가 그 사례에 관한 관점을 공유함으로써 기여하도록 장려하여 구성주의적 접근(constructivist approach) (Dennick, 2016)을 사용하여 연결을 촉진합니다(facilitates).
  • 개별 멘토링 (Individual mentoring)
    • 개별 멘토링은 멘토와 한 명의 멘티 간의 일대일 세션(one-on-one sessions)을 포함합니다. 멘토링 세션은 멘토에 의해 관찰되는 환자-멘티 상담(patient-mentee consultations)에 기초합니다. 멘티가 자신의 임상 추론(clinical reasoning), 자기 평가, 그리고 성찰을 논의할 것으로 기대되므로, 안락 방해 요소는 개별 멘토링 세션에서 더 많이 특징지어집니다(features more). 그들은 또한 자신이 불확실하다고 느끼는 성과(performance)의 측면에 대해 피드백을 요청할 것으로 기대되며, 이를 통해 자신의 지식 격차(knowledge gaps)를 공개적으로 공유합니다. 멘토는 개선을 필요로 하는 영역(areas requiring improvement)을 결정하기 위해 멘티의 성과를 평가하고, 학습을 위한 개별화된 피드백(personalized feedback)과 목표 설정에 집중할 것이며, 이는 경험에 또 다른 안락 방해 구성요소를 추가합니다.

멘토링 단계가 완료되면(On completion of), 멘티는 다른 환자들과의 임상 실무에 초점을 맞춘 추가적인 멘토링 세션을 준비하기 위해 사전 멘토링 단계로 돌아갈 수 있습니다 (그림 1). 이런 방식으로, 멘티는 임상 멘토링 과정 내내 사전 멘토링과 멘토링 단계를 순환합니다(cycles through). 순환되는 사전 멘토링 및 멘토링 단계의 횟수는 개별 멘티의 학습 목표와 각 참여자가 관계에 헌신할 준비가 된 시간의 양(amount of time)에 달려 있습니다.

요소를 통합한 사후 멘토링 단계 (Post-mentoring phase incorporating elements)

사후 멘토링 단계는 멘티가 남은 경력 기간 동안(throughout the rest of their career) 가치 있는 학습을 지속할 수 있는 능력을 소유한 채로, 임상 멘토링 관계의 합의된 종료(agreed cessation)를 포함합니다. 임상 멘토링을 통해, 멘티들은 성찰하고, 자기 평가하며, 피드백 토론을 시작하고, 학습 목표를 생성하며, 그러한 학습 목표를 해결하기 위한 전략을 실행하는 능력을 향상시켰어야 합니다(should have enhanced). Cutrer et al. (2017)은 이러한 기술들이 현대 보건 의료 전문가의 경력 전반에 걸친 학습(career long learning)에 중요하다고 주장했습니다. 멘티의 지속적인 임상 발전(ongoing clinical development)은 미래의 관점 공유, 연결, 그리고 안락 방해 경험을 가능하게 하기 위해 그들이 시간 우선순위화를 스스로 시작할 것(self-initiate prioritising time)을 요구할 것입니다. 이것은 임상 멘토링의 목적이 단지 멘티의 임상 실무를 향상시키는 것뿐만 아니라, 관계가 끝난 후에도 오랫동안 그들이 자신의 실무를 계속해서 향상시킬 수 있도록(continue improving) 하는 것임을 강조합니다.

실무에 대한 시사점 (Implications for practice)

이 틀은 다양한 맥락(variety of contexts)에서 임상 멘토링의 설계(design), 전달(delivery), 그리고 평가(evaluation)에 정보를 제공한다는 관점에서 개발되었습니다. 물리치료 학문 분야를 위해 개발되기는 했지만, 이 틀은 다른 보건 의료 전문 분야(health professional disciplines)에 의해서도 사용될 수 있습니다. 의도(intent)는 전달 방법(예: 대면 또는 온라인; 개별 또는 그룹), 임상 환경(예: 개인 병원[private practice] 또는 병원 또는 대학 또는 전문직 단체), 환자 집단(예: 근골격계[musculoskeletal] 또는 심흉부[cardiothoracic] 또는 신경계[neurological] 또는 소아과[paediatrics]), 혹은 멘티의 임상 경험(예: 초심자[novice] 또는 숙련자[experienced])에 상관없이 이 틀이 임상 멘토링을 안내하는 것입니다. 특정 맥락을 위해 틀의 실행에 대한 조정(Adaptations)이 요구될 수 있지만, 핵심 요소와 단계로부터의 변형(variations)은 권장되지 않습니다(discouraged). 예를 들어, 온라인 환경에서의 임상 멘토링의 경우, 관찰된 성과에 대한 피드백은 대면 성과 관찰보다는 비디오로 녹화된 환자-물리치료사 만남(video-recorded patient-physiotherapist encounter)을 사용하여 완료될 수 있습니다.

 

효과적인 임상 멘토링을 위해 요구되는 총 시간(total time required)과 각 단계의 타이밍(timing)은 알려져 있지 않으며, 따라서 현 단계에서는 실행의 세부사항(specifics of implementation)에 대한 명확한 권고를 할 수 없습니다. 정의되지 않은 임상 멘토링 틀(undefined clinical mentoring framework)을 사용하여, Cleland et al. (2009)은 2일간의 CPD 코스 및 사례 기반 그룹 토론과 결합되었을 때 단 1시간의 세션(as little as a one-hour session)만으로도 멘토링 받은 물리치료사의 환자 결과(patient outcomes) 개선을 관찰했습니다 (Cleland et al., 2009). 대조적으로(In contrast), Williams et al. (2019)은 역시 정의되지 않은 틀을 사용하여 150시간(150 h)의 임상 멘토링이 환자 결과의 개선을 가져왔다고 보고했습니다. 이 광범위한 시간 기간(broad ranging time durations)은 서로 다른 시간 길이를 비교하는 추가 연구가 필요함을 시사합니다. 요구되는 시간은 또한 맥락 의존적(context dependent)일 수 있으며 향후 연구로 탐구할 가치가 있습니다(worthy of exploring).

요약 및 향후 방향 (Summary and future directions)

이 논문은 전문직 후속 물리치료사 학습(post-professional physiotherapist learning), 임상 교육(clinical education), 감독(supervision), 그리고 멘토링 분야의 이론적 통찰(theoretical insights)과 연구에 의해 정보를 얻은 임상 멘토링 틀의 개발을 기술했습니다. 이 틀은 가치 있는 학습을 위해 요구된다고 생각되는 4가지 핵심 요소(연결, 안락 방해, 관점 공유, 그리고 우선순위화된 시간)를 권장되는 4가지 단계(준비, 사전 멘토링, 멘토링, 그리고 사후 멘토링)와 결합합니다. 이 틀은 실무 전문성 향상을 목표로 하는 임상 멘토링의 실행을 위한 스캐폴딩된 접근법(scaffolded approach)을 제공하는 동시에, 이 영역의 향후 연구를 위한 이론적 토대(theoretical foundation)를 마련합니다.

 

제시된 새로운 임상 멘토링 틀은 다용도이며(versatile), 공식적인 CPD 행사, 직장 내 멘토링(workplace mentoring), 그리고 임상 실무 개발에 초점을 맞춘 전문직 후속 자격 인증 교육(post-professional credentialled education)을 포함한 다수의 보건 의료 전문 분야 및 환경에 걸쳐 적용 가능성(potential applicability)이 있습니다. 이 틀은 개별 또는 그룹 기반 경험 모두에서 임상 멘토링의 대면 및 온라인 전달을 수용하도록(accommodate) 설계되었으며, 최근 팬데믹 기간 동안 강조되었던 온라인 학습 기회에 대한 필요를 지원하는 유연성(flexibility)을 허용합니다. 다음 단계는 향후 연구가 효과적인 실행을 위한 매개변수(parameters)를 제공하기 위해, 다양한 환경에서, 다양한 전달 방법과 기간을 사용하여, 다양한 지표(range of metrics)에 걸쳐 다수의 보건 의료 직종에서 이 틀을 사용한 임상 멘토링의 효과성(effectiveness)을 확립하는 것입니다.

 

표 2. 임상 멘토링 틀: 요소들이 단계 전반에 걸쳐 어떻게 구현되는가 (Table 2. Clinical mentoring framework: how the elements are lived across the phases)

1. 준비 단계 (Preparation)

  • 우선순위화된 시간 (Prioritised time):
    • 임상 멘토링에 대한 시간 할애(commitment of time) 동의.
    • 직장 내 보호된 시간(protected time) 탐색.
  • 연결 (Connection):
    • 연결(connecting)에 참여하는(engaging with) 것에 대한 기대 설명.
  • 안락 방해 (Comfort disruption):
    • 불편함(discomfort)에 참여하고 이를 수용하는(embracing) 것에 대한 기대 설명.
    • 학습을 위한 안전하고 비판단적인 공간(safe, non-judgmental space) 설명.
  • 관점 공유 (Perspective sharing):
    • 관점 공유(perspective sharing)에 참여하는 것에 대한 기대 설명.

2. 사전 멘토링 단계 (Pre-mentoring)

  • 우선순위화된 시간 (Prioritised time):
    • 일정 기간에 걸쳐 간격을 둔(spaced over time) 일정(schedule)에 합의.
  • 연결 (Connection):
    • 사례 연구(Case study) 준비.
    • 협력적 목표(collaborative goals)의 관점에서 개별 임상 멘토링 관계(individual clinical mentoring relationship) 정의.
  • 안락 방해 (Comfort disruption):
    • 사례 연구(Case study) 준비.
    • 자기 평가(Self-evaluation).
    • 멘티가 대화(dialogue)를 시작할(initiate) 준비를 함.
  • 관점 공유 (Perspective sharing):
    • 타인(멘토 포함)이 동의하지 않을 수 있다고(disagree) 믿더라도 생각을 공유(sharing thoughts)하는 것에 대한 기대 설명.
    • 사례 연구(Case study) 준비.

3. 멘토링 단계 (Mentoring)

  • 우선순위화된 시간 (Prioritised time):
    • 합의된 일정 내에 멘토링 과업(tasks)세션(sessions) 완료.
  • 연결 (Connection):
    • 그룹 내 멘티들 간의 상호작용(Interaction).
    • 멘토와 멘티 간의 상호작용.
    • 목표 설정을 위한 협력(Collaborating) 및 목표 달성 전략(strategies)에 대한 토론.
  • 안락 방해 (Comfort disruption):
    • 타인에게 사례 연구(case study) 발표.
    • 임상 성과(clinical performance) 관찰.
    • 임상 결정(clinical decisions)에 대한 정당성(justification) 설명.
    • 자기 평가(self-evaluations) 공유.
    • 실무의 특정 영역에 대한 피드백 요청(Request for feedback).
    • 관찰된 성과 및 임상 결정/정당성에 대한 피드백(Feedback).
  • 관점 공유 (Perspective sharing):
    • 사례 연구(case studies) 발표.
    • 임상 성찰 양식(clinical reflection forms) 완료 및 이에 대한 대화(talking through).
    • 멘티가 자신의 생각과 관점을 명시한(articulating) 후에 이어지는 멘티의 질문(Mentee questions).

4. 사후 멘토링 단계 (Post-mentoring)

  • 우선순위화된 시간 (Prioritised time):
    • 관계를 종료(cease)하기로 결정.
    • 멘토링 중에 합의된 목표/전략에 대해 계속 작업하기 위한 시간 할애(Commitment of time).
  • 연결 (Connection):
    • 동료 및 더 뛰어난 전문성(greater expertise)을 가진 이들과 계속 연결(connecting)하겠다는 헌신/약속.
    • 임상 멘토링 관계를 넘어서(beyond) 계속 향상하기 위한 전략(strategies) 토론.
  • 안락 방해 (Comfort disruption):
    • 자기 평가(self-evaluation)외부 피드백(external feedback) 시작/구하기(seeking)를 계속하겠다는 헌신/약속.
  • 관점 공유 (Perspective sharing):
    • 관점(perspectives)을 공유하고 타인의 관점을 경청하는 것(listening to)을 계속하겠다는 헌신/약속.

 

 

 


Med Educ. 2021 Sep;55(9):995-1010. doi: 10.1111/medu.14528. Epub 2021 May 3.

Optimising the delivery of remediation programmes for doctors: A realist review

 

의사 재교육, 성공을 위한 3가지 열쇠: 통찰, 동기, 그리고 변화

의사가 진료 역량이 부족하거나 전문직업성(Professionalism)에 문제가 생겼을 때, 이를 바로잡는 재교육(Remediation)은 환자의 안전을 위해서도 필수적입니다. 하지만 재교육은 단순히 지식을 더 가르친다고 해결되는 문제가 아닙니다. 대상자는 이미 현직 의사이고, 자존심도 강하고, 교육 환경이 아닌 진료 현장에 있기 때문이죠.

이 논문의 저자들은 방대한 문헌 고찰을 통해 재교육이 성공하기 위한 필수 요소를 세 가지 단계로 정리했습니다.

1. 통찰(Insight): "내게 문제가 있구나"를 깨닫게 하라 💡

재교육의 시작은 본인에게 문제가 있다는 것을 인정하는 것입니다. 하지만 의사들은 종종 방어기제를 보이죠. 연구진은 여기서 '안전한 공간(Safe Space)''피드백 방식'이 결정적이라고 말합니다.

먼저, 재교육 대상자가 비난받는다는 느낌 없이 솔직하게 이야기할 수 있는 신뢰 관계가 필요합니다. 특히 평가 권한이 없는 옹호자(Advocate)의 존재가 중요합니다.

"재교육 대상 의사가 총괄 평가에 관여하지 않는 옹호자의 지원을 받을 때, 재교육 과정에 대한 신뢰를 개발할 가능성이 더 높다."

"When a remediating doctor has the support of an advocate, who has no role in summative judgements, they are more likely to develop trust in the remediation process."

 

또한, 피드백을 줄 때는 단순히 "너 이거 못했어"가 아니라, 그 의사가 평소 생각하는 '좋은 의사'의 모습(가치)과 현재의 행동을 비교(Juxtapose)해 주는 것이 효과적입니다. 그래야 부정(Denial)하지 않고, 마음의 불편함(부조화, Dissonance)을 느껴 변화의 필요성을 받아들입니다.

2. 동기(Motivation): "변하고 싶다"는 마음을 심어라 🔥

문제를 알았다고 해서 다 변하는 건 아니죠. 내재적 동기(Intrinsic Motivation)가 필요합니다. 연구진은 여기서 자율성(Autonomy)을 강조합니다. 재교육 계획을 짤 때 대상자를 배제하지 말고, 그들이 직접 계획에 참여하게 해야 합니다. 그래야 이 과정에 대한 주인의식(Buy-in)이 생기거든요.

"재교육 대상 의사가 개별화된 재교육 프로그램의 설계에 투입을 한다면, 프로그램에 대한 참여 동의를 가질 가능성이 더 높고 참여하도록 더 동기부여될 것이다."

"If a remediating doctor has input into the design of an individualised remediation programme, they are more likely to have buy-in to the programme and will be more motivated to engage."

 

또한, 재교육을 '처벌'이 아닌 '전문성 개발'로 프레임화하여 낙인(Stigma)을 없애는 것도 매우 중요합니다.

3. 행동 변화(Behaviour Change): "실제 진료가 바뀌어야 한다" 🔄

마지막 단계는 실제 행동의 변화입니다. 여기서는 연습(Practice)성찰(Reflection)의 반복이 핵심입니다.

새로운 기술이나 행동을 시뮬레이션 환경에서 연습해보고, 멘토나 코치와 함께 그 결과에 대해 깊이 있게 이야기 나누는 '지도된 성찰(Guided Reflection)'이 필요합니다. 혼자 생각하게 두는 것보다 누군가 가이드해줄 때 훨씬 효과적이라는 것이죠.

"수행이나 행동의 변화가 반드시 재교육의 종점인 것은 아니다; 재교육은 아마도 순환적인 과정일 것이며, 변화된 행동이 다른 문제나 영역에 대한 추가적인 통찰을 낳을 수 있다."

"The change in performance or behaviour is not necessarily the endpoint of remediation; remediation may well be a cyclical process, whereby changed behaviours may engender further insight into other issues or areas."


📝 요약 및 결론

이 논문은 의사 재교육이 단순히 '부족한 지식 채우기'가 아니라고 말합니다. 그것은 심리적 안전감(Psychological Safety)을 바탕으로 자존감을 건드리지 않으면서 통찰을 이끌어내고, 스스로 계획에 참여시켜 동기를 부여하며, 지속적인 코칭을 통해 행동을 교정하는 고도로 정교한 과정이어야 합니다.

 

연구진은 마지막으로 조직적인 차원의 고려도 놓치지 말 것을 당부합니다. 때로는 개인의 문제가 아니라 근무 환경(Workplace Environment)이 문제의 원인일 수 있으니까요.

"우리는 재교육을 고려할 때 더 광범위한 조직적 문제를 고려할 필요가 결정적이라고 결론지었다."

"We conclude that the need to consider wider organisational issues when considering remediation is critical."

 

재교육에는 '만병통치약(Magic Bullet)'이 없습니다. 하지만 이 논문이 제시한 통찰-동기-변화의 프레임워크를 적용한다면, 길 잃은 동료 의사들을 다시 훌륭한 전문가로 복귀시키는 데 큰 도움이 될 것입니다.

"재교육은 분명 ‘만병통치약’이 없는 복잡한 문제이다. ... 이 방법론적 렌즈를 사용하는 것은 논의와 행동을 단순한 해결책에서 재교육의 복잡성을 명시적으로 인식하는 것으로 전환시키며, 이는 미래에 더 생산적인 개입으로 이어질 수 있다."

"Remediation is clearly a complex issue for which there is no ‘magic bullet’. ... Using this methodological lens shifts discussions and action from simple solutions to explicitly recognising the complexity of remediation, which may lead to more productive interventions in the future."

 

 


1 서론 (1 INTRODUCTION)

팀 내에서 효율적으로 활동하는(operating efficiently within teams) 유능한 의사(Competent doctors)들은 환자들에게 고품질의 안전한 진료(high-quality and safe care)를 제공하는 데 결정적(critical)이다. 만약 의사가 성과가 저조하다면(underperforming), 환자들은 위험에 처할 수 있다(may be at risk).1 재교육(Remediation)은 ‘한계 기준(threshold standards)에 대한 평가(assessment)에 대응하여 요구되는 개입(intervention), 또는 일련의 개입들(suite of interventions)’로 정의되며,2: p. 366 그 목적은 성과 부진(underperformance)을 교정(remedying)하여 의사가 안전한 진료(safe practice)로 복귀할 수 있도록 하는 것이다.3

 

재교육(Remediation)은 전 세계 의료 시스템(health care systems globally)에서 사용된다. 의사 규제(regulation of doctors)와 의료 인력 내 의사 유지(retention of doctors in the workforce)에 있어 그 중요성에도 불구하고, 이 분야에는 양질의 연구(good quality research)가 부족하다.4, 5 의학 교육 전 과정(continuum of medical education)에 걸친 재교육에 대해 세 건의 체계적 문헌 고찰(systematic reviews)과 한 건의 주제별 고찰(thematic review)이 수행되었다.4, 6-8 네 건의 고찰 모두 재교육 개입(remediation interventions)을 뒷받침(underpin)할 견고한 이론적 기반(firm theoretical base)을 제공하는 연구가 부족함을 강조한다. 또한 이 고찰들은 왜 특정 개입이 어떤 의사에게는 효과가 있고(work) 다른 의사에게는 그렇지 않은지를 규명(identify)하지 못했다. Cleland 등이 언급한 바와 같이: ‘우리는 의대생과 의사를 위한 재교육 개입에서 무엇이 효과가 있고, 왜 그런지를 정확하게 설명(delineate precisely)할 수 없다’.4: p. 247

 

하지만, 재교육을 연구하는 것은 까다롭다(challenging).5, 9

  • 의료 수행능력(Medical performance)은 동료의 자질과 기술(attributes and skills of colleagues), 시스템 자원(system resources), 조직 문화(organisational culture)를 포함한 다양한 맥락적 요인(contextual factors)에 의해 형성된다(shaped by).
  • 따라서, 재교육은 의사 경력(doctor's career)의 다양한 단계(different stages)와 다양한 환경(range of settings)에 걸쳐 발생하는 광범위한 개입(broad array of interventions)을 포괄한다(covers).
  • 재교육을 교육적 개입(educational intervention)으로만 보는 전통적인 초점(traditional focus)은 의료 수행능력의 복잡성(complexity of medical performance)과 개입이 지속적인 수행 변화(sustained performance change)를 만들어내는 과정을 간과한다(ignores).
  • 재교육을 통해 해결해야 할 문제(issues being addressed)들은 지식이나 기술보다는 전문직업성(professionalism) 및 태도(behaviour)와 관련된 경우가 많아 그 범위가 넓을 수 있다.
  • 게다가, 의대생과 달리 현직 의사(practising doctors)를 위한 재교육은 정규 교육 환경(formal educational settings) 밖에서 일어나는 경우가 많다.

본 연구에서 ‘현직 의사(practising doctor)’는 의과대학을 성공적으로 마치고 의료 행위를 하고 있는 모든 의사로 정의되며, 여기에는 수련 단계(training grades)에 있는 의사와 전문의(consultant) 또는 지도 전문의(attending physicians)가 포함된다. 우리는 연구의 초점을 현직 의사에 맞추기로 선택했는데, 이는 이 집단에 있어 실패의 대가(stakes of failure)가 특히 높고, 연구가 부족한 분야(under-researched area)이며, 의학교육계가 오랫동안 씨름해 온(struggled for many years) 문제이기 때문이다.5

 

이러한 복잡성을 고려할 때(Given this complexity), 최근 몇 년 동안 재교육의 개념화(conceptualisation of remediation)에 있어 ‘기술과 지식의 격차를 해소하는 것(redressing gaps in skills and knowledge)’보다는 ‘진료 변화를 지원하는 것(supporting practice change)’으로 중요한 변화(important shift)가 있었다.5, 10 이는 재교육을 행동 변화 과정(behaviour change process)으로 재정립(repositions)하는데, 이는 특정 맥락(particular context)에 있는 특정 의사에게 지속적인 수행 향상(lasting performance improvement)을 산출하기 위해 무엇이 필요한지에 대한 이해를 요한다.5, 10 이러한 재개념화(reconceptualisation) 안에서, 재교육은 개입이 진료의 변화를 촉진(facilitate)하기 위해 맥락의 양상(aspects of the context)을 변화시킬 수 있을 때 효과가 있다(works).

 

우리의 목표는 재교육이 어떻게 작동해야 하는지(how remediation is supposed to work), 누구를 위해(for whom), 그리고 어떤 맥락(contexts)이 다른 결과(outcomes)로 이어지는지에 대한 이론을 개발함으로써 현직 의사를 위한 재교육의 복잡성을 다루는 것이었다. 이론 주도형 연구(Theory-led research)는 중요한데, 왜냐하면 재교육 개입을 계획하고 제공하는 사람들에게 적절할(relevant) 만큼 실제 진료(actual practice)와 가까우면서도, 다양한 개입에 전이 가능(transferable)할 정도의 추상화 수준(level of abstraction)에서 연구 결과를 도출(deliver findings)할 수 있기 때문이다.11

2 연구 방법 (2 METHODS)

현실주의적 고찰(Realist review)은 정책과 실무(policy and practice)에 정보를 제공하기 위해(inform) 설계된 실용적인 방법론적 접근(practical methodological approach)이다. 이는 질적(qualitative), 양적(quantitative), 혼합 연구 방법(mixed-methods research)의 문헌을 결합하며, 해석적(interpretive)이고 이론 주도적(theory-driven)이라는 점에서 다른 유형의 문헌 고찰과 구별된다.12 이 접근법의 주요 강점은 맥락(context)이 어떻게 그리고 왜 결과(outcomes)에 영향을 미칠 수 있는지를 설명하는 전이 가능한 결과(transferable findings)를 생산한다는 점이다.12 이는 개입이 어떻게, 왜, 어떤 맥락에서, 누구를 위해, 그리고 어느 정도까지 ‘작동(work)’하는지를 설명하는 것을 목표로 하는 프로그램 이론(programme theories)을 개발함으로써 달성된다.13

 

이 고찰은 이전에 출판된 상세한 프로토콜(detailed protocol)을 따랐다.14 조사 계획은 Pawson의 현실주의적 고찰을 위한 5단계 반복 과정(five iterative stages)(후술함)15에 기초하며 아래에 간략히(in brief) 제시되어 있다. 고찰 과정은 RAMESES (Realist And Meta-narrative Evidence Syntheses: Evolving Standards) 품질 및 출판 표준과 현실주의적 고찰을 위한 훈련 자료(training materials)의 지침을 따랐다.16 이 고찰은 10명으로 구성된 검토팀(review team)에 의해 수행되었으며, 여기에는 6명의 현역 의학 교육 연구자, 1명의 현실주의 방법론 전문가, 1명의 정보 전문가, 환자 수행 및 자문 서비스(구 국가 임상 평가 서비스)의 전직 수석 개입 및 평가 자문관, 그리고 1명의 환자 및 대중 대표가 포함되었다. 검토팀 중 3명은 1차 진료(primary care)와 2차 진료(secondary care)를 아우르는 현직 임상의(practising clinicians)였다. 검토팀은 연구 기간 내내 매달 회의를 가졌으며 프로그램 이론 개발의 모든 단계에서 중요한 역할(instrumental)을 했다.

 

2.1 이해관계자 그룹 (2.1 Stakeholder group)

 

이해관계자(Stakeholders)는 이러한 유형의 고찰 과정에서 필수적인 부분(essential part)이다. 다양한 이해관계자 그룹(n = 12)이 프로그램 이론 정교화(programme theory refinement)를 위한 주제 지식(subject knowledge)을 제공하고, 전파 계획(dissemination plans)의 최적화(optimisation)를 위해, 그리고 실현 가능하고 실용적인 권고안(feasible and practical recommendations)의 생성을 돕기 위해 모집되었다. 총 12명이 고찰 전반에 걸쳐 자문(consulted)에 참여했으며, 여기에는 재교육 프로그램을 거친 의사, 성과 저조 의사를 식별하고(identify) 재교육 프로그램 참여를 개시하는(initiate) 담당자, 재교육 프로그램 제공(delivery)에 관여하는 담당자, 선임 의사(senior doctors), 재교육 코치, 재교육 연구자, 환자 및 대중 대표, 그리고 관련 의료 단체 회원들이 포함되었다. 이해관계자들은 검토팀 구성원에 의해 목적에 맞게 선정(purposively selected)되고 접촉되었다. 이해관계자 그룹 구성원들과의 협의는 프로젝트 전반에 걸쳐 정기적인 간격으로 2시간짜리 회의(n = 4)를 통해 이루어졌다. 각 이해관계자 회의에서, 우리는 연구 결과의 양상(aspects of our findings)을 이해관계자들에게 발표하고 토론 내용을 광범위하게 메모했다. 이 메모들은 회의에 참석하지 못한 사람들도 기여할 수 있고 내용을 추가할 수 있도록 모든 이해관계자에게 이메일로 발송되었다. 우리는 또한 개별 전화 통화와 이메일 교환을 통해 일부 이해관계자들과 접촉했다. 부록 S1(Appendix S1)은 이해관계자 회의 참석 현황과 논의된 주제에 대한 정보를 제공한다.

 

이 연구는 참여한 이해관계자들로부터 데이터를 수집하는 것을 포함하지 않았기 때문에(did not involve the collection of data), 플리머스 대학교(University of Plymouth) 보건 및 인문과학 학부 윤리 위원회는 윤리적 승인(ethical approval)이 필요하지 않다고 결정했다.

 

2.1.1 1단계: 기존 이론 찾기 (2.1.1 Step 1: Locate existing theories)

 

프로그램 이론(programme theory)개입의 주요 활동(key activities), 의도된 결과(intended outcomes), 그리고 특정 결과에 기여하는 기전(mechanisms)을 개략적으로 보여주는(outlines), 일반적으로 다이어그램을 포함하는 추상화된 설명(abstracted description)이다.17 JA, TP, NB는 문헌에 대한 지식을 바탕으로 초기 프로그램 이론(initial programme theory)을 고안했다(부록 S2 참조). 이는 검토팀 및 이해관계자들과의 논의, 그리고 비공식적인 검색(informal searching)을 통해 정교화되었으며, 검증할 프로그램 이론(programme theory to test)이 마련될 때까지 계속되었다.18

 

2.1.2 2단계: 검색 전략 (2.1.2 Step 2: Search strategy)

 

2단계는 프로그램 이론을 더욱 발전시키고 정교화하기 위해 관련 문헌 자료(body of relevant literature)를 식별(identifies)한다. 검색은 AW에 의해 설계, 시범 운영(piloted) 및 수행되었으며, 결과의 민감도(sensitivity)와 특이도(specificity)의 균형(balance)을 달성하기 위해 검색어를 추가, 제거 및 정교화하는 반복적인 과정(iterative process)을 사용했다. 검색 전략은 보충 파일 1(Supplementary File 1)에서 확인할 수 있다.

 

다음 데이터베이스들이 2018년 6월에 검색되었다: MEDLINE (via Ovid), EMBASE (via Ovid), PsycINFO (via Ovid), Health Management Information Consortium (HMIC) (via Ovid), CINAHL (via EBSCO), ERIC (via EBSCO), ASSIA (via ProQuest) 그리고 DARE (via CRD). 검색 구문(search syntax)과 색인 용어(indexing terms)는 이러한 데이터베이스에서 사용하기 위해 원래의 MEDLINE 검색에서 필요한 경우 수정되었다 (검색 전략의 전체 내역은 부록 S3 참조). 이해관계자 토론에 이어, 2019년 6월에 회색 문헌(grey literature)을 식별하기 위해 다음 데이터베이스를 사용하여 추가 검색을 수행했다: Google Scholar, OpenGrey, NHS England, North Grey Literature Collection, NICE Evidence, Ethos, Health Systems Evidence 및 Trip Database. 인용 검색(Citation searching)은 ‘인용된(cited by)’ 검색과 관련 문서의 참고 문헌 목록에 있는 인용 검색을 포함하여 수행되었다. 포함 및 제외 기준(inclusion and exclusion criteria)은 양적, 질적 및 혼합 방법 논문을 찾기 위해 의도적으로 광범위하게(deliberately broad) 설정되었다 (표 1 참조). 검색 결과는 EndNote X7 (Clarivate Analytics, Philadelphia, PA, USA)으로 내보내졌고 ‘중복 찾기(find duplicates)’ 기능을 사용하여 중복을 제거(deduplicated)했다. 우리는 또한 프로그램 이론의 특정 측면, 예를 들어 통찰(insight), 부조화(dissonance), 심리적 안전감(psychological safety) 및 행동 변화(behaviour change) 등을 검색하기 위해 Google Scholar를 사용하여 목적 지향적 보충 검색(purposive supplementary searches)을 수행했다. 이러한 개념들은 주요 검색에 포함된 문헌이나 이해관계자 그룹 토론에서 도출되어 프로그램 이론 개발에 잠재적으로 유용한 것으로 식별되었다. 이러한 타겟 검색(targeted searches)을 통해 식별된 문헌은 원래의 포함 기준을 충족할 필요는 없었는데, 이는 우리가 재교육에 대한 추가 문헌을 구체적으로 찾는 것이 아니라 이러한 새로 부상하는 주요 개념(emergent key concepts)에 대한 이해를 확장하고자 했기 때문이다. 이러한 개념에 대한 추가 정보는 우리 프로그램 이론에서 기전(mechanisms)이 어떻게 그리고 왜 작용하는지에 대한 설명을 강화하는 데 도움이 되었다. 토론과 추가 타겟 검색 사이를 오가는 이러한 반복적인 분석 과정(iterative process of analysis)은 현실주의적 고찰 방법론의 중요한 요소이다.

 

표 1. 공식 검색을 위한 포함 기준 (TABLE 1. Inclusion criteria for formal search)

  • 재교육의 측면(Aspect of remediation): 현직 의사의 재교육에 초점을 맞춘 모든 문서. 우리는 재교육을 ‘한계 기준(threshold standards)에 대한 평가에 대응하여 요구되는 개입, 또는 일련의 개입들’로 정의했다.105: p. 366
  • 연구 설계(Study design): 모든 연구 설계.
  • 설정 유형(Types of setting): 1차 또는 2차 진료 환경에 관한 모든 문서.
  • 참가자 유형(Types of participant): 모든 현직 의사(All practising doctors). 현직 의사는 의과대학을 졸업하고 의료 행위를 하고 있는 면허가 있는 의사(licensed doctor)로 정의될 수 있다. 의대생에 관한 연구는 제외되었다.
  • 결과 지표(Outcome measures): 모든 재교육 관련 결과 지표.
  • 언어(Language): 영어로 출판된 연구.
  • 출판 날짜(Publication date): 2018년 6월까지 출판된 모든 연구.

 

2.1.3 3단계: 논문 선정 (2.1.3 Step 3: Article selection)

 

포함 기준은 표 1에 제시되어 있다. 우리는 현직 의사의 재교육에 관한 모든 영어 연구, 모든 연구 설계, 모든 의료 환경 및 모든 결과 지표를 포함했다. 건강 문제(health concerns)만을 해결하기 위한 개입은 포함하지 않았다. 문헌들은 관련성(relevance), 즉 데이터가 이론 개발 및 정교화(theory development and refinement)에 기여할 수 있는지 여부에 근거하여 선택되었다.19 이는 이론적 논문(theoretical papers)과 논평(commentaries)을 포함한 다양한 문헌을 포함한다는 것을 의미하며, 이들 모두가 프로그램 이론에 기여할 수 있기 때문이다. 엄격성(rigour) 평가는 포함된 데이터 수준(필요한 경우)과 프로그램 이론 수준에서 수행되었다.20 모든 선별 작업(screening)은 Rayyan (https://rayyan.qcri.org/)에서에서) 수행되었다. 일관된 선정 결정을 보장하기 위해 초기 무작위 표본 10%를 TP와 NB가 평가하고 논의했다. 식별된 매우 적은 불일치는 토론을 통해 해결되었다. 그 후 TP가 나머지 모든 제목과 초록을 선별했다.

 

2.1.4 4단계: 데이터 추출 및 정리 (2.1.4 Step 4: Extracting and organising data)

 

논문들은 NVivo 12 (QSR International, Warrington, UK) 질적 데이터 분석 소프트웨어로 가져와(imported) 알파벳 순서로 코딩되었다. 초기 코딩은 개념적 수준(conceptual level)에 초점을 맞추었으며, 재교육에 대한 장벽(barriers)과 촉진 요인(facilitators), 재교육 프로그램이 사용하는 전략(strategies), 변화를 일으키는 과정(processes engendering change)을 포함했다. 코딩은 문헌을 분석하여 코드를 식별하는 귀납적(inductive) 방식과, 초기 프로그램 이론, 이해관계자 그룹 토론 및 탐색적 문헌 검색에 의해 생성된 코드가 정보를 얻는 연역적(deductive) 방식이 모두 사용되었다. TP와 NB가 초기 코딩 프레임워크를 개발했고, TP가 코딩을 수행했다. 코딩 프레임워크는 검토팀 회의에서 정기적으로 검토되었다. 연구 특성과 결과에 대한 데이터도 표로 추출되었다(부록 S4 참조). MB와 TP가 데이터 추출의 이 부분을 수행했으며, NB가 정확성을 보장하기 위해 10%를 확인했다. 보다 최근의 현실주의적 고찰 지침의 발전에 따라, 그리고 Pawson의 원래 5단계 접근 방식에서 벗어나, 우리는 포함된 연구에 대해 질 평가(quality appraise)를 수행하지 않았다.20 이는 질 평가 도구가 논문들이 프로그램 이론에 기여하는 다양한 방식을 포착할 수 없기 때문이다.

 

개념적 코딩이 완료된 후, 전체 검토팀이 함께 작업하며 범주(또는 그 안의 하위 범주)가 맥락(contexts), 기전(mechanisms), 결과(outcomes)로 식별될 수 있는 데이터를 포함하고 있는지 고려했다.

 

2.1.5 5단계: 증거 합성 및 결론 도출 (2.1.5 Step 5: Synthesising evidence and drawing conclusions)

 

프로그램 이론을 개발, 정교화 및 검증(test)하기 위해, 우리는 현실주의적 분석 논리(realist logic of analysis)를 사용했다. 간단히 말해, 이는 맥락-기전-결과 구성(context–mechanism–outcome configurations, CMOcs)의 형태로 결과에 대한 현실주의적 인과 설명(realist causal explanations)을 개발하고자 했다. CMOc의 목적은 기전(mechanism)에 의해 결과(outcome)가 어떻게, 왜, 누구를 위해, 그리고 어떤 맥락(context(s))에서 발생하게 되는지를 포착하고 설명(capture and explain)하는 것이다. 우리는 (NVivo와 Word 문서에 추출 및 코딩된) 데이터와 검토팀 및 이해관계자 그룹이 제공한 분석, 조언, 피드백 사이를 오갔다.21 프로그램 이론을 개발하기 위해, 우리는 이 단계와 2단계에서 설명한 보충 검색 사이를 앞뒤로 이동했다. 우리는 이러한 개입들이 재교육에 고유한 장벽(barriers that are unique to remediation)을 극복할 기회와 자원을 창출할 수 있을 때 ‘효과가 있다(work)’는 관점에서, 재교육 개입의 독특한 점(what was unique about remediation interventions)에 초점을 맞추었다.

 

3 결과 (3 RESULTS)

공식 검색(formal search)에서 반환된 4,554편의 논문 중, 114편이 포함 기준(inclusion criteria)을 충족하여 연구에 포함되었다. 추가 검색(additional searches)을 통해 27편의 논문이 더 반환되었다. 이 27편 중 10편이 포함 기준을 충족했다 (5편은 인용 검색(citation searching)에서, 2편은 회색 문헌(grey literature) 검색에서, 3편은 이해관계자 또는 검토팀 구성원의 추천으로 선정됨). 나머지 17편의 논문은 프로그램 이론(programme theory)의 측면을 개발할 목적으로 수행된 목적 지향적 보충 검색(targeted supplementary searches)에서 나온 것이다 (PRISMA 다이어그램은 Figure 1 참조).

 

그림 1 (FIGURE 1) PRISMA 흐름도 (PRISMA flow diagram)

 

대다수(The vast majority, 64%)는 북미(North America)의 연구 또는 재교육 프로그램과 관련이 있었다. 14%는 영국(UK)과 관련이 있었다. 72%는 2008년에서 2018년 사이에 출판되었다. 논평(Commentaries)이 논문의 33%를 구성했으며, 30%는 연구 논문(research papers), 25%는 사례 연구(case studies)였다. 연구 논문 중 64%는 양적 연구(quantitative), 19%는 문헌 고찰(literature reviews), 14%는 질적 연구(qualitative)였다. 반환된 논문의 40%는 초급 의사(junior doctors) 또는 레지던트(residents)에 초점을 맞추었고, 31%는 현직 의사(practising physicians)에 초점을 맞추었으며, 17%는 둘 다 혼합된 형태였다 (일부는 의대생 포함). 연구의 거의 절반(40%)은 의학 지식(medical knowledge), 임상 기술(clinical skills), 전문직업성(professionalism)을 포함한 임상 진료(clinical practice)의 모든 영역을 재교육하는 데 초점을 맞추었다. 27%는 전문직업성(professionalism)에만 초점을 맞추었고, 19%는 지식, 임상 기술 또는 둘 다에 초점을 맞추었다. 32%는 기존 재교육 개입(existing remediation interventions)에 대한 설명이었고, 16%는 재교육 프로그램 설계를 위한 전략(strategies)을 개략적으로 설명했으며, 11%는 재교육 프로그램 모델의 기초가 되는 모델을 설명했다. 부록 S3(Appendix S3)은 포함된 연구의 특성에 대한 더 심층적인 개요(in-depth overview)를 제공한다.

 

29개의 상황-기전-결과 구성(CMOcs)이 식별되었으며(표 2 참조), 이들을 종합하면 현직 의사를 위한 재교육이 어떻게 작동하는지에 대한 우리의 프로그램 이론(programme theory)을 구성한다(Figure 2 참조). 아래에 프로그램 이론의 주요 단계(통찰력 개발(developing insight), 동기부여 개발(developing motivation), 수행 또는 행동 개선(performance or behaviour improves))에 대한 간략한 설명과 함께 해당되는 CMOc 번호를 괄호 안에 표시하여 제공했다.

표 2. CMOc 요약 (TABLE 2. Summary of CMOcs)

 

통찰 (Insight)

 

신뢰를 형성하기 위해 안전한 공간 제공 및 옹호 활용 (Providing safe spaces and using advocacy to develop trust in the remediation process)

  • CMOc 1 재교육 대상 의사(remediating doctor)가 재교육의 결과(consequences of remediation)를 두려워하거나 재교육 과정(remediation process)을 신뢰하지 않을 때(C), 그들이 심리적으로 안전하다고 느끼지 못하기 때문에(M) 신뢰하는 환경(environment of trust)이 조성되지 않을 것이다(O). 이러한 맥락(context)을 변화시키기 위해 사용될 수 있는 개입 전략(intervention strategy)은 문제를 비밀리에 논의할 수 있는 안전한 공간(safe space)의 제공이다. 10, 38, 46, 59
  • CMOc 2 재교육 대상 의사가 자신의 논의가 비밀이 보장된다(confidential)고 느끼고 자신이 느끼는 부정적인 감정(negative emotions)을 표현할 수 있을 때(C), 그들은 심리적으로 안전하다고 느낄 가능성이 더 높으며(M), 이는 신뢰하는 환경(O)과 자신의 수행에 대한 인식을 탐색할 준비(readiness to explore perceptions)로 이어진다(O). 10, 22-41
  • CMOc 3 재교육 대상 의사가 공감(empathy)과 긍정적 존중(positive regard)을 경험할 때(C), 심리적 안전감(psychological safety)이 유발되며(M), 이는 신뢰 관계(trusting relationship, O)와 자신의 수행에 대한 인식을 탐색할 준비(O)로 이어진다. 옹호(Advocacy)는 개입 전략으로서 재교육 대상 의사가 공감과 긍정적 존중을 경험할 기회를 제공하는 데 사용될 수 있다. 10, 22-34, 37, 39, 42-56
  • CMOc 4 만약 재교육 대상 의사가 자신의 동기(motivations)를 인정받는다면(validated, C), 이는 심리적 안전감을 유발할 수 있으며(M), 신뢰하는 환경(O)과 자신의 수행에 대한 타인의 인식을 탐색할 준비(O)로 이어진다. 인정(validation)을 제공하기 위해 사용될 수 있는 개입 전략은 옹호(advocacy)를 통한 것이며, 여기서 옹호자(advocate)는 재교육 대상 의사의 동기와 그들의 헌신(dedication)을 인정해 줄 수 있다. 옹호자의 역할은 그 옹호자가 재교육 대상 의사에 대한 총괄 평가(summative judgements)에 관여하지 않을 때 가장 효과적일 수 있다. 10, 55, 56

피드백 프레이밍 1: 병치/대조 (Framing feedback 1: Juxtaposition)

  • CMOc 5 재교육 대상 의사가 인식하는 좋은 진료(good practice)나 행동이 그들의 실제 진료(actual practice)나 행동에 대한 데이터와 병치(juxtaposed)될 때(C), 이는 불편한 직업적 부조화(uncomfortable professional dissonance)로 이어질 수 있으며(M), 이는 결국 변화의 필요성에 대한 수용(acceptance of the need to change)을 유발한다(O). 10, 44, 60-62

피드백 프레이밍 2: 다른 출처로부터의 구체적 데이터 (Framing feedback 2: Specific data from different sources)

  • CMOc 6 피드백이 구체적인 수행 데이터(specific performance data) 및/또는 보고된 행동(reported behaviours)의 명확한 예시를 포함하고, 다수의 서로 다른 출처(different sources)에서 도출되었을 때(C), 재교육 대상 의사에 의해 타당한 것으로 인정될(validated) 가능성이 더 높으며(M), 이는 인식된 수행/행동과 실제 수행/행동 간의 불일치에 대한 인식(awareness of the discrepancy)으로 이어진다(O). 30, 31, 47, 49, 51, 53, 59, 62-64, 70, 81, 90, 106, 107
  • CMOc 7 재교육 대상 의사가 자신의 수행이나 행동에 대한 인식이 실제 수행이나 행동과 같지 않다는 것을 받아들일 때(C), 부조화(dissonance, M)는 변화의 필요성에 대한 수용(O)으로 이어진다. 44, 60-62
  • CMOc 8 피드백이 개별 의사에 대한 일반화된 판단(generalised judgement)으로 인식될 때, 재교육 대상 의사는 방어적(defensive)이 될 가능성이 더 높으며(C) 따라서 부정(denial)의 상태로 들어가게 되고(M), 이는 피드백의 거부(rejection of the feedback, O) 및/또는 해당 피드백과 관련된 기준(standards)의 거부(O)로 이어진다. 31, 67, 68

피드백 프레이밍 3: 긍정, 규범적 프레임워크 및 피드백-기준 불일치 (Framing feedback 3: affirmation, normative frameworks and feedback standard discrepancy)

  • CMOc 9 재교육 대상 의사가 재교육을 자신의 경력(career)이나 전문직 정체성(professional identity)에 대한 위협(threat)으로 인식할 때(C), 그들은 피드백 자체의 진실성(veracity)이나 그들에게 적용되는 기준(standard)을 부인할 수 있으며(M), 이는 프로그램에 대한 비참여(non-engagement, O)나 피상적인 참여(superficial engagement, O)로 이어진다. 33, 35, 69, 108
  • CMOc 10 코치나 멘토가 재교육 대상 의사의 강점(strengths)을 긍정(affirm)하고 관점(perspective)을 제시할 수 있다면(C), 그 의사는 직업적 긍정(professional affirmation)을 받았기 때문에(M) 부정적인 피드백을 받아들일 가능성이 더 높다(O). 24, 29, 56
  • CMOc 11 피드백 데이터가 문제가 감당할 수 있는(manageable) 것처럼 보이게 하는 방식으로 제시된다면(C), 부조화(M)는 재교육 대상 의사가 수행이나 행동을 변화시켜야 할 필요성을 받아들이는 것(O)으로 이어질 수 있다. 문제를 감당할 수 있는 것으로 보이게 만드는 개입 전략에는 이전의 성취를 긍정하는 것, 문제를 관리 가능한 덩어리(manageable chunks)로 쪼개는 것, 그리고 현실적인 목표를 설정하는 것이 포함된다. 33, 38, 51, 66, 70, 82, 90, 91
  • CMOc 12 피드백이 재교육 대상 의사의 직업적 가치(professional values)의 관점에서 프레임화된다면(C), 규범적 유인(normative enticement)이라는 기전(M)이 변화의 필요성을 받아들이는 것(O)으로 이끌 수 있다. 38, 46, 73, 74, 109
  • CMOc 13 수행에 문제가 있음을 받아들이지만 자신의 직업적 동기에 대한 인정(validation)이나 무조건적인 긍정적 존중, 또는 직업적 정체성에 대한 긍정을 받지 못하는 재교육 대상 의사의 맥락에서(C), 정체성 부조화(identity dissonance, M)는 의료 전문직 정체성의 거부(rejection of medical professional identity, O)로 이어질 수 있다. 38, 46, 73, 74, 109

동기부여 (Motivation)

재교육 계획에 재교육 대상 의사 참여시키기 (Involving the remediating doctor in remediation planning)

  • CMOc 14 재교육 대상 의사가 재교육 과정의 계획 단계에서 역할(role in planning)을 한다면(C), 그들은 과정에 대해 어느 정도 통제권이 있다고 인식할 수 있으며(인지된 주체성, perceived agency) (M), 변화하려는 내재적 동기(intrinsically motivated)를 갖게 될 것이다(O). 24, 29, 31, 33, 35, 69-72
  • CMOc 15 재교육 대상 의사가 전문직 정체성의 위기(crisis of professional identity)를 경험할 때(C), 그들은 규범적 거부(normative rejection, M) 때문에 변화하려는 동기가 부족할 수 있다(O). 전문직 정체성의 상실을 완화(mitigate)할 수 있는 개입 전략에는 재교육 프로그램에서 재교육 대상 의사를 위한 일정 수준의 자율성(degree of autonomy)을 유지하는 것이 포함된다. 38, 46, 73, 74, 109

인과 귀인 수정하기 (Correcting causal attribution)

  • CMOc 16 재교육 대상 의사가 자신의 수행이나 행동 중 문제를 일으킨 부분, 즉 자신이 변화시킬 수 있는 부분을 식별할 수 있을 때(C), 그들은 과정에 대해 더 많은 인지된 통제권(perceived control)을 가지게 되며(M), 이는 참여하려는 더 큰 동기(greater motivation to engage, O)로 이어진다. 65, 77, 81
  • CMOc 17 재교육 대상 의사에게 학습이나 행동을 위한 구체적인 전략(specific strategies)이 주어질 때(C), 향상된 자기 효능감(improved self-efficacy, M) 덕분에 그들은 더 큰 동기(O)를 갖게 된다. 10, 62, 64, 65, 70, 77, 81-83
  • CMOc 18 재교육 대상 의사가 자신의 감정적 유발 요인(emotional triggers)을 탐색할 때(C), 그들은 자기 인식(self-aware, M)이 되어 있기 때문에 이러한 유발 요인에 반응할 가능성이 줄어든다(O). 77, 81

목표 설정 (Goal setting)

  • CMOc 19 재교육 대상 의사가 명확한 목표(clear goal)와 목표가 달성 가능하다는 현실적인 감각(realistic sense)을 가지고 있을 때(C), 그들은 이 목표를 달성할 수 있다는 자신의 능력에 대해 더 큰 믿음(자기 효능감, self-efficacy)을 가질 수 있으며(M), 이는 변화하려는 더 큰 동기(O)로 이어질 수 있다. 이러한 맥락을 조성할 수 있는 개입에는 SMART 목표 설정 전략이 포함된다. 33, 38, 51, 66, 70, 82, 90, 91

재교육의 낙인 없애기 (Destigmatising remediation)

  • CMOc 20 재교육 과정이 보다 긍정적인 관점(more positive light)으로 재구성(reframed)될 때(C), 재교육 대상 의사는 심리적으로 더 안전하다고 느끼며(M), 이는 프로그램에 참여하려는 더 큰 동기(O)로 이어진다. 3, 5, 79, 80
  • CMOc 21 재교육이 처벌(punishment)로 프레임화될 때(C) 및/또는 실천 공동체(community of practice)가 재교육을 받아야 하는 사람들을 낙인찍을 때(stigmatises, C), 재교육 대상 의사는 동료들로부터 소외감(alienated)을 느낄 수 있으며(M), 이는 고립감(sense of isolation, O)으로 이어진다. 3, 25, 70, 76-78
  • CMOc 22 의사가 동료들로부터 고립되었다고 느낄 때(C), 규범적 거부(normative rejection, M)는 변화하려는 동기의 결여(O)로 이어질 수 있다. 그룹으로 재교육을 받거나(Remediating in groups), 재교육을 받고 있는 동료들과 네트워킹(networking)하는 것은 고립감을 줄여줄 수 있다. 53, 110-112

결과의 명확성 (Clarity of consequence)

  • CMOc 23 재교육 대상 의사가 자신의 행동을 바꾸지 않거나 수행을 개선하지 않았을 때의 결과(consequences)를 이해할 때(C), 그들은 변화의 비용과 이득(costs and benefits)을 평가할 수 있으며(M), 재교육에 참여하려는 동기(O)를 갖거나 자신의 목표를 변경하려는 동기(O)를 갖게 될 수 있다. 25, 31, 36, 45, 49, 51, 56, 58, 70, 88, 92, 113

진료 변화 촉진 (Facilitating practice change)

새로운 행동이나 기술 연습하기 (Practising new behaviours or skills)

  • CMOc 24 올바른 행동이나 기술을 반복적으로 수행(repeated performance)할 때(C), 반복(즉, 연습)(repetition (ie practice), M)으로 인해 수행이나 행동이 개선된다(O). 이러한 연습은 적절한 경우 현장(in situ)에서 이루어질 수 있지만, 필요한 경우 시뮬레이션(simulated)될 수도 있다. 37, 44, 50, 56, 59, 95
  • CMOc 25 이러한 반복적인 수행이 적절한 피드백(appropriate feedback) 및 지도된 성찰(guided reflection)과 동반될 때(C), 재교육 대상 의사가 새로운 지식과 경험을 자신의 학습에 통합(integrate)할 수 있기 때문에(M) 긍정적인 개선이 이루어질 가능성이 더 높다(O). 37, 44, 50, 56, 59, 95

지도된 성찰 (Guided reflection)

  • CMOc 26 재교육 대상 의사가 피드백이 무엇을 의미하는지에 대해 지도(guided)를 받을 때(C), 피드백이 그들에게 납득이 가기(makes sense to them) 때문에(M) 피드백에 관여(engage)할 가능성이 더 높다(O). 이것을 이끌어내는 데 도움이 될 수 있는 개입 전략에는 정기적인 대면 회의와 훈련된 코치로부터의 개방형 성찰 질문(open reflective questioning)이 포함된다. 34, 42, 44, 66, 90, 93, 94
  • CMOc 27 피드백이 재교육 대상 의사에게 납득이 갈 때(makes sense, C), 부조화(dissonance)가 유발될 가능성이 더 높으며(M), 이는 재교육 대상 의사가 자신의 수행이나 행동에 대한 추가적인 통찰(further insight)을 얻는 것(O)으로 이어진다. 34, 42, 44, 66, 90, 93, 94
  • CMOc 28 성찰의 과정이 재교육 대상 의사의 즉각적인 근무 환경 외부(outside of the immediate working environment)의 누군가에 의해 지도될 때(C), 피드백은 덜 위협적인(less threatening) 것으로 인식되며(M), 이는 더 의미 있는 성찰(O)로 이어진다. 32, 56
  • CMOc 29 재교육 대상 의사가 자신에게 의미 있는 성찰 일지(reflective log)를 작성하고 유지하도록 허용될 때(C), 그들은 자신의 새로운 학습과 경험을 통합할 기회를 갖게 되며(M), 이는 자신의 진전에 대한 통찰(insight into their own progress, O)과 수행 또는 행동의 지속적인 변화(sustained changes, O)로 이어진다. 이는 성찰 일지가 평가되지는 않지만(not assessed) 그 작성이 확인(verified)될 때 가장 효과적일 수 있다. 30, 51, 59

그림 2 (FIGURE 2) 재교육의 프로그램 이론 (Programme theory of remediation)


 

3.1 통찰력 개발 (3.1 Develops insight)

성공적인 재교육(successful remediation)을 위한 통찰(insight)의 중요성은 문헌에서 자주 인용된다.10, 31 우리는 통찰을 자신의 행동이나 수행(performance)에 대한 타인의 인식을 탐색(explore others’ perceptions)하고 그러한 인식을 검증(validate)하려는 준비(readiness), 그리고 자신의 수행이나 행동이 수용된 기준(accepted standards)과 다르다는(divergent) 것을 수용(acceptance)하는 것으로 구성된다고 정의했다.22, 23 신뢰 관계(trusting relationships)를 형성하는 것은 문제를 탐색하려는 준비를 촉진하는 데 도움이 될 수 있으며, 재교육이 필요한 것으로 식별됨(identified as needing remediation)으로써 유발될 수 있는 분노(anger)나 수치심(shame)과 같은 부정적인 감정(negative emotions) 때문에 중요하다.24, 41 신뢰를 형성하기 위해, 재교육 전략은 제재(sanction)나 판단(judgement)에 대한 두려움(fear) 없이 비밀리에 논의(confidential discussion)가 이루어질 수 있는 ‘안전한 공간(safe space)’을 조성하려고 할 수 있다.30, 41 안전한 공간은 재교육 대상 의사들이 대개 재교육이 필요한 것으로 식별되는 것의 결과를 두려워하기(fear the consequences) 때문에 중요하다 (프로그램 이론의 이러한 양상은 CMOc 1-2와 관련이 있다).

 

신뢰는 또한 재교육 과정 동안 개인적인 관계(personal relationships)를 구축함으로써 형성될 수 있다. 때때로 그러한 관계는 코칭 모델(coaching model)32-34, 46로 묘사되기도 하고, 다른 곳에서는 멘토링 프로그램(mentoring programme)24, 55이라는 용어로 묘사되기도 한다. 사용된 용어와 관계없이(Regardless of the term used), 문헌의 핵심 초점(key focus)은 재교육 프로그램 내의 누군가가 재교육 대상 의사를 위한 옹호자(advocate)로서의 역할을 맡는다는 것이다. ‘무조건적인 긍정적 존중(unconditional positive regard)’,56 공감(empathy) 및 인정(validation)55의 제공은 ‘치료적 관계(therapeutic relationship)’57라고 묘사된 것을 발전시키는 데 핵심일 수 있다. 이러한 옹호 역할(advocacy role)을 수행하는 사람은 선임 의사(senior doctor)56이거나 동료(peer)33, 51일 수 있으며, 코치, 멘토 또는 기타 다른 명칭으로 묘사된다. 옹호는 관련된 개인이 재교육 대상 의사에 대한 총괄 평가(summative evaluation)나 과정의 최종 결과(final outcome)에 아무런 역할도 하지 않을 때 가장 효과적일 수 있다.32, 34, 56 옹호자는 반드시 재교육 프로그램의 제공(delivery)에 깊이 관여할(intimately involved) 필요는 없지만, 그 사례(case)에 대해서는 잘 알고 있어야 한다(should be familiar with) (CMOc 3-4).58

 

피드백이 자신의 수행이나 행동에 대한 의사의 인식에 도전할 때(challenges), 이는 부조화(dissonance)의 감각을 유발할 수 있으며, 이는 변화의 필요성에 대한 수용(acceptance of the need for change)으로 이어질 수 있다. 그러나, 의사들은 재교육을 받는 것과 관련된 민감성(sensitivity) 때문에 자신에게 주어진 피드백을 거부(reject)하는 경향이 있을 수 있다.30, 59 부정(denial)보다는 부조화가 유발되려면, 재교육 대상 의사가 생각하는 좋은 의사의 조건이 무엇인지 도출(elicited)된 다음, 그들 자신의 행동이나 수행이 이 기준과 비교(compared to this standard)되어야 한다.60, 61 이러한 가치(values)는 외부 출처(external source)가 아닌 재교육 대상 의사 본인에게서 나온 것이기 때문에, 더 진정성 있고(authentic) 덜 도전적인(less challengeable) 것으로 인식될 수 있다 (CMOc 5). 신뢰하는 동료들로부터의 피드백 또한 부조화를 유발할 수 있다 (CMOc 5, 7).62

 

다양한 피드백 출처(variety of feedback sources)로부터의 구체적인 데이터(specific data)가 있을 때 피드백을 부인하기가 더 어려울 수 있다.22, 27, 36, 38, 62 피드백은 모호하지 않고(unambiguous) 객관적인(objective) 방식으로 명료하게 표현되어야 한다 (CMOc 6, 8).2, 66 피드백이 프레임화되는 방식(way feedback is framed)에 대한 민감성은 더 선임 의사(more senior doctors)들에게서 더 두드러질 수 있는데, 이는 그들이 진료에 대한 피드백이 일상적으로 일어나는 교육 환경(educational environment)으로부터 아마도 더 멀리 떨어져 있을 것이기 때문이다.

 

재교육 대상 의사의 강점을 긍정(Affirming strengths)하는 것은 그에 상응하는 부정적 피드백이 타당한 것으로 인정될(validated) 가능성을 높일 수 있다.31, 67, 68 게다가, 피드백이 비판적이거나(judgemental) 비하하는(demeaning) 방식으로 전달되지 않도록 주의를 기울여야 한다 (CMOc 10-11).31 의사의 전문직 정체성(professional identity)을 훼손하는(undermines) 피드백은 그 피드백의 거부(rejection)를 초래할 수 있다 (CMOc 9). 또한 환자 안전(patient safety)38, 46과 같이 의사가 공감할 수 있고(relate to) 그들의 전문직 정체성과 일치하는(congruent with) 규범(norms)에 따라 피드백을 프레임화하는 것이 중요할 수 있다 (CMOc 12-13).

 

3.2 동기부여 개발 (3.2 Develops motivation)

동기 부족(lack of motivation)은 재교육에서 흔한데, 부분적으로는 재교육이 직업적 자율성(professional autonomy)의 상실을 수반한다는 사실 때문이다 (CMOc 15). 재교육 대상 의사가 어느 정도의 직업적 자율성을 유지하도록 촉진하는 것은 긍정적인 동기부여 결과(positive motivational consequences)를 가져올 수 있는데, 이는 그것이 전문직 정체성을 보호하고 주체성(sense of agency)을 낳기 때문이다. 이는 재교육 프로그램의 계획(planning)에 재교육 대상 의사를 참여시킴으로써 달성될 수 있다 (CMOc 14). 문헌에서 이는 종종 프로그램에 대한 ‘참여 유도(buy-in)’를 개발하는 관점에서 프레임화되며, 프로그램 설계(design of the programme)에 의사를 참여시키는 것이 그들에게 더 많은 정서적 투자(emotional investment)를 부여할 수 있음을 시사한다.24, 29, 31, 33, 35, 69-72

 

자율성(Autonomy)은 전문직 정체성의 핵심 요소(key component)이며, 특히 수련을 마치고 전문의(consultant doctor 또는 ‘attending physician’)가 된 의사들에게 더욱 그렇다.5 의사들에게 재교육 계획에 대한 투입(input) 기회를 주는 것은 의사가 과정에 대해 어느 정도 통제권(control)을 유지하게 하므로 전문직 정체성에 대한 도전(challenge to professional identity)을 완화(mitigate)할 수 있다. 이는 동기부여에 도움이 될 수 있는데, 개인은 특정 행동이나 관행이 자신의 직업적 가치(professional values)와 연관될 때 그러한 행동을 채택하도록 내재적으로 동기부여(intrinsically motivated)될 수 있기 때문이다.35 다시 말해, 재교육 대상 의사들은 ‘내집단(in group)’의 일원이 되고 싶거나, 일원으로 남고 싶어 하기 때문에 동기를 부여받을 수 있다 (CMOc 12, 15).73, 74

 

의료계(medical community)는 재교육 대상 의사에 대해 모호한 견해(ambiguous views)를 가질 수 있으며,75 일부 의료 시스템에서 책무성(accountability) 강화를 둘러싼 정책 발전은 의사 수행(doctor performance)에 대해 도움이 되지 않는 공포 분위기(climate of fear)를 조성했을 수 있다.3 따라서 재교육을 둘러싼 낙인(stigma)을 제거하려고 노력하는 것은 전문직 정체성을 보호하고 재교육 참여를 동기부여하는 데 도움이 될 수 있다 (CMOc 20-22).3, 25, 70, 76-80

 

(동기 부족의) 또 다른 기여 요인(contributing factor)은 재교육 대상 의사가 자신의 수행이나 행동을 개선할 수 있다고 믿지 않을 때이다. 이는 그들이 문제를 학습 기술(study techniques)과 같이 자신이 통제할 수 있는 것(control)이 아니라, 능력(ability)과 같이 통제할 수 없는 것(cannot control)에 귀인(attribute)할 때 발생할 가능성이 높다.65 따라서 인과 귀인을 수정하는 것(Correcting causal attribution)은 동기부여적 결과를 가져올 수 있다 (CMOc 16-17). 마찬가지로, 재교육 대상 의사가 나쁜 행동에 대한 특정 유발 요인(particular triggers)을 인식할 수 있다면, 그들은 왜 자신이 그런 식으로 행동하는지, 그리고 어떻게 변화를 모색할 수 있는지에 대해 더 잘 알게 될 수 있다 (CMOc 18).77, 81 문제를 적절하게 탐색하는 것은 식별된 수행이나 행동 문제뿐만 아니라 잠재적인 건강 문제(health problems)를 포함한 가능한 원인(possible causes)까지 조사하는 공식화된 의뢰 후 평가 전략(formalised post-referral assessment strategies)을 포함할 수 있다.10, 62, 64, 65, 70, 77, 81-83 정확한 인과 귀인(Accurate causal attribution)은 또한 수많은 재교육 프로그램의 특징인 개별화되고 표적화된 재교육 계획(individualised and targeted remediation plans)의 개발을 가능하게 할 것이다.6, 89

 

일부 개입들은 재교육 프로그램에 명확하고 달성 가능한 목표(clear and achievable goals)를 설정하는 것의 중요성을 언급한다.33, 38, 51, 66, 70, 82, 90, 91 명확성(clarity)은 목표 자체에 관한 것일 뿐만 아니라, 의사가 이러한 목표들이 어떻게 평가되는지(how these goals are being assessed) 이해하도록 보장하는 것이다 (CMOc 19).82 또한 목표가 충족되지 않을 경우의 결과(consequences)조치 과정(courses of action)에 대해 명확히 하는 것도 중요할 것이다 (CMOc 23).36, 51, 56, 58, 88, 92

 

3.3 행동 또는 수행의 지속적인 개선 (3.3 Sustained improvements to behaviour or performance)

피드백은 실무자가 그 피드백이 무엇을 의미하는지 성찰(reflects on what that feedback means)할 때 수행을 향상시키는 작용을 하며 (CMOc 26-27),34, 44, 66, 90, 93, 94 이것은 지도된 과정(guided process)일 때 가장 효과적이다; 성찰은 피드백 후에 자동적으로 뒤따르지 않지만, 코치나 멘토의 지도(guidance)가 있다면 성찰적 실천(reflective practice)은 행동 변화를 돕고34, 90 수행을 향상시킬 수 있다. 이는 전문직업성(professionalism)뿐만 아니라 임상 기술 및 지식 문제 모두에 대해 언급된다.42, 66, 90 이러한 멘토링 과정은 재교육 대상 의사의 즉각적인 근무 환경 외부(outside of the immediate working environment)에 있는 누군가에 의해 더 효과적으로 촉진될 수 있다 (CMOc 28).32, 56 작성된 성찰 일지(Written reflective logs) 또한 성찰을 도울 수 있으며,30, 59 특히 공식적으로 평가되지 않을 때(not formally assessed) 더욱 그러하다 (CMOc 29).51

 

연습(practice), 성찰, 그리고 통찰의 추가적 개발이라는 반복적인 과정(iterative process)의 일부로서 새로운 기술과 행동을 연습할 기회(opportunity to practice new skills and behaviours)가 있다면 수행이나 행동의 지속적인 개선이 촉진될 것이다 (CMOc 24-25).50, 95 다시 말하지만, 이 과정에 대한 민감성은 더 선임 의사들(more senior doctors)에게서 더 두드러질 수 있는데, 이는 그들이 피드백을 받고 성찰하는 데 덜 익숙하며, 일부는 성찰 기술(reflection skills)을 개발하는 것이 의학 교육의 일부가 아니었던 시절에 수련을 마쳤을 수도 있기 때문이다.

 

4 고찰 (4 DISCUSSION)

4.1 주요 연구 결과 (4.1 Main findings)

 

이 현실주의적 고찰(realist review)에서, 우리는 의사 재교육이 어떻게 작동해야 하는지, 누구를 위해, 그리고 어떤 맥락이 다른 결과로 이어지는지에 대한 이론을 개발하고자 했다. 우리의 연구 결과는 재교육의 성공에 근본적인(fundamental) 세 가지 핵심 측면(key facets)을 나타내는데, 그것은 통찰(insight), 동기(motivation), 그리고 행동 변화(behaviour change)이다.

  • 재교육은 참가자가 통찰을 개발하도록 도울 때 효과가 있다(works).
    • 통찰을 생성하는 데 도움이 되는 재교육 개입 전략(intervention strategies)은 조성된 환경(environment created) 및 피드백의 프레임화(framing of feedback)와 관련이 있다.
    • 비밀이 보장된 토론(confidential discussions)옹호(advocacy) 및 정서적 지원(emotional support)을 제공하는 누군가가 있는 지지적인 환경(supportive environment)은 심리적 안전감(psychological safety)을 유발하는 데 도움이 되며, 이는 신뢰(trust)로 이어지고 결과적으로 피드백을 탐색할 준비(readiness to explore feedback)가 되게 할 수 있다.
    • 만약 피드백이 지지적이고 효과적인 방식(병치(juxtaposition), 다수의 출처로부터의 구체적 데이터, 긍정(affirmation), 공감할 수 있는 규범적 프레임워크)으로 프레임화된다면, 긍정(affirmation) 또는 부조화(dissonance) 또는 규범적 유인(normative enticement)이라는 추가적인 기전이 촉발될 수 있으며, 이는 재교육 대상 의사가 받은 피드백을 타당한 것으로 인정(validating)하게 만들 수 있다.
  • 재교육 대상 의사는 과정에 참여(engage)하도록 동기부여(motivated)되어야 한다.
    • 내재적 동기(intrinsic motivation)를 개발하는 것을 목표로 하는 전략에는
      • 재교육 계획에 의사를 참여시키는 것, 인과 귀인(causal attribution)을 수정하는 것, 효과적인 목표 설정, 그리고 재교육의 낙인을 없애는 것(destigmatising remediation)이 포함된다.
      • 이러한 전략들이 사용될 때, 통제감(perceptions of control), 자기 효능감(self-efficacy), 자기 인식(self-awareness)은 내재적 동기를 유발하는 기전으로 작용할 수 있다. 이와 함께, 과정의 잠재적 결과(potential outcomes) 측면에서의 명확성(clarity)은 비용과 이득에 대한 평가(evaluation of costs and benefits)를 촉발할 수 있다.
  • 지도된 성찰(Guided reflection)은 재교육 프로그램의 모든 단계에서 중요할 가능성이 높다. 시뮬레이션 환경(simulated environments)에서 새로운 기술이나 행동을 연습하는 것은 재교육 프로그램의 중요한 측면일 수 있다. 의사는 연습해야 할 특정 행동을 과제로 받을 수 있으며, 코칭 과정(coaching process)을 통해 코치와 만날 때 이러한 과정의 성공 여부 등을 성찰할 수 있다. 수행이나 행동의 변화가 반드시 재교육의 종점(endpoint)인 것은 아니다; 재교육은 아마도 순환적인 과정(cyclical process)일 것이며, 변화된 행동이 다른 문제나 영역에 대한 추가적인 통찰(further insight)을 낳을 수 있다.

 

4.2 기존 문헌과의 비교 (4.2 Comparison with previous literature)

 

재교육을 위한 모델을 개발한 마지막 체계적 문헌 고찰은 2009년 Hauer와 동료들에 의해 수행되었다.6 그들의 모델은 대체로 평가(assessment), 진단(diagnosis), 개입(intervention), 추적 관찰(follow-up)이라는 치료의 의학적 모델(medical model of treatment)과 유사했다. 우리의 연구 결과는 성공적인 프로그램에서 이러한 과정 중 일부가 어떤 모습일지에 대해 훨씬 더 큰 세부 사항(considerably greater detail)을 추가한다. 예를 들어, 정확한 진단과 우려 사항에 대한 이해를 돕기 위해 Hauer 등이 강조한 다양한 양식의 평가(multimodal forms of assessment) 사용은 문헌에서 널리 지지받고 있다.28, 41, 84, 93, 94, 96-98 그러나, 우리의 연구 결과는 다중 양식 평가가 재교육 대상 의사에 의해 타당한 것으로 인정될 가능성이 더 높은 구체적이고 직접적인 피드백(specific and direct feedback)을 수집하는 데에도 사용되어야 함을 시사한다. 우리는 조직적 문제(organisational issues)가 재교육 대상 의사가 특정 근무 환경(work setting)에서 어떻게 반응하는지에 적절하다(pertinent)는 것을 확인했으며,99-101 더 효과적인 재교육 환경을 촉진하기 위한 조직적 변화의 필요성을 시사할 수 있다. 작업장 환경(workplace environment)을 조사하는 것은 현재 재교육 평가 과정에서 흔하지 않지만(예외는 102 참조), 수행이나 행동 문제에 중요한 기여 요인(contributing factor)이 될 수 있다.103 우리는 재교육을 고려할 때 더 광범위한 조직적 문제를 고려할 필요가 결정적(critical)이라고 결론지었다.

 

Hauer 등 모델의 다음 단계인 결핍 진단(Diagnosing a deficiency)은 재교육의 중심이다. 우리의 연구는 드러난 문제(manifest problem) 자체를 식별하는 것이 문제의 원인(cause of the problem)을 식별하는 것과는 약간 다른 노력일 수 있음을 시사한다. 원인을 식별하는 것은 재교육 대상 의사가 자기 인식과 통제감(sense of control)을 개발할 수 있게 해주며, 이는 지도된 성찰이 통찰과 자기 효능감을 낳는 데 도움을 줄 수 있음을 의미한다. 우리는 개별화된 재교육 계획(individualised remediation plan)을 개발하는 것은 재교육 대상 의사가 그 과정에 투입(inputting)할 수 있는 최대의 기회를 제공하기 위해 그 의사와 함께 수행되는 활동이어야 한다고 제안한다.

 

우리는 코칭과 멘토링이 재교육 과정에서 중요한 역할을 한다는 Hauer 등의 의견에 동의한다. 이 현실주의적 고찰을 통해 우리가 추가한 것은 코치와 멘토가 재교육 과정의 필수적인 부분(integral part)으로서 '어떻게(how)' 작용하는가이다. 코치나 멘토가 피드백을 프레임화하는 방식, 그리고 그들이 재교육 대상 의사가 안전함을 느끼고 자신의 생각과 감정에 대해 솔직해질 수 있는(candid) 환경을 조성하는지 여부는, 피드백이 수용될지 거부될지, 그리고 그 피드백이 의사가 재교육 프로그램을 완료하도록 동기부여하는 데 필요한 자기 효능감과 통제감을 낳을지 여부의 중심(central)에 있다. 이는 Telio 등이 설명한 것과 같은 피드백 모델을 지지하는데, 여기서는 코치와 피코치(coachee) 간의 ‘교육적 동맹(educational alliance)’을 개발하기 위해 지지적인 환경이 사용된다.104

 

재교육은 종종 교육적 모델(educational model)의 관점에서 보이며,4, 5 여기서 우리의 초점은 학습이 일어나기 위해 필요한 변화의 더 행동적인 측면(more behavioural aspects)에 있었다. 재교육이 이런 방식으로 이해되어야 한다고 주장하는 것은 우리가 처음은 아니지만,10 우리는 효과를 산출하기 위해 재교육 프로그램 전반에 걸쳐 발생하는 과정에 대한 더 상세한 이론(more detailed theory)을 구축하기 위해 이 동일한 개념화(conceptualisation)를 사용했다.

 

4.3 본 연구의 강점과 약점 (4.3 Strengths and weaknesses of this study)

 

우리가 아는 한, 이것은 의학 교육에서의 재교육에 관한 출판된 문헌과 회색 문헌에 대한 최초의 현실주의적 고찰(first realist review)이다. 우리는 현실주의적 합성을 위한 RAMESES 품질 표준을 따르며 견고하고 철저한 현실주의적 분석(robust and thorough realist analysis)을 수행했다.17 CMOc를 개발하는 과정은 수많은 확인 작업과, 직접 재교육을 경험한 의사를 포함한 광범위한 이해관계자(wide range of stakeholders)의 투입으로 강화되었다. 우리의 상세한 현실주의적 분석은 포함된 문서의 데이터를 우리의 권고안과 명확하게 연결할 수 있게 해주었으며, 이를 통해 재교육의 바람직한 결과가 발생하기 위해 갖추어져야 할 맥락과, 이러한 맥락을 조성하기 위해 필요한 개입 전략(interventional strategies)을 식별할 수 있게 해주었다. 따라서, 우리는 재교육 실무를 개선하고자 하는 사람들을 위한 명확한 지침 세트를 생산했다 (표 3 참조).

 

 

표 3. 실무를 위한 권고안 (TABLE 3. Recommendations for practice)

 

RESTORE: 재교육 프로그램 제공을 위해 일하는 사람들과 관련된 연구 결과 및 권고안

연구 결과 (Findings) 권고안 (Recommendations)
재교육 프로그램은 통찰(insight)을 개발할 때 효과가 있다  
비밀이 보장된 토론을 위한 안전한 공간(Safe spaces)은 재교육 대상 의사가 자신의 수행이나 행동과 관련된 문제를 탐색할 준비가 되도록 돕는다. 재교육 대상 의사는 지지적인 역할(supportive role)을 하는 사람비밀이 보장된 토론을 할 기회를 가져야 한다.
재교육 대상 의사 자신의 가치(own values)와 실제 행동(actual behaviours)을 병치(Juxtaposing)하는 것은 의사가 변화의 필요성을 받아들이도록 돕는다. 태도/품행(conduct)과 관련된 문제를 위한 재교육 프로그램은 재교육 대상 의사가 자신의 직업적 가치를 성찰하고 이를 자신의 행동에 대해 받은 피드백과 대조(contrast)해 볼 기회를 포함해야 한다.
재교육 대상 의사가 총괄 평가(summative judgements)에 관여하지 않는 옹호자(advocate)의 지원을 받을 때, 재교육 과정에 대한 신뢰를 개발할 가능성이 더 높다. 재교육 대상 의사는 옹호자 역할을 하는 사람의 지원을 받아야 한다. 이 개인은 코치나 멘토일 수 있으며, 재교육 프로그램 전반에 걸쳐 총괄 평가를 내리는 역할을 해서는 안 된다.
수행이나 행동에 대한 피드백이 구체적(specific)이고 다수의 출처(multiple sources)에서 나올 때, 재교육 대상 의사에 의해 타당한 것으로 인정될(validated) 가능성이 더 높다. 재교육 대상 의사에게는 성과 부진이나 나쁜 품행의 이유와 예시를 상세히 기술한 구체적인 피드백이 제공되어야 한다. 피드백이 행동과 관련된 경우, 날짜와 시간을 포함한 구체적인 사건을 상세히 기술해야 한다.

이 피드백은 이상적으로는 두 곳 이상의 출처에서 나와야 하며 가능한 경우 환자로부터의 피드백을 포함해야 한다.

피드백은 시작 단계뿐만 아니라 재교육 과정 전반에 걸쳐 필요할 것이다. 진전을 결정하기 위한 적절한 피드백과 그것이 전달되는 방식은 재교육 계획 단계에서 확인(ascertained)되어야 한다.
피드백이 의사의 전문직 정체성(professional identity)에 민감한 방식으로 프레임화될 때, 의사가 그 피드백을 거부할 가능성은 낮아지고 자신의 직업적 가치에 부합하도록 수행이나 행동을 변화시켜야 할 필요성을 받아들일 수 있다. 피드백은 대면(in person)으로 할 때 더 효과적일 수 있으며, 피드백 전달 훈련을 받은 사람에 의해 지도(guided)되어야 한다. 피드백은 의사의 직업적 가치와 관련되도록 프레임화되어야 하고, 감당할 수 있는(manageable) 것처럼 보이는 방식으로 제시되어야 하며, 확인된 강점을 긍정(affirm)해야 한다.
평가는 ‘문제’에 대한 가능한 원인의 전체 범위(full range of possible causes)를 탐색하고 식별하는 데 사용될 때 재교육이 성공할 가능성이 더 높다. 확인된 문제가 지식과 기술에 관련된 것처럼 보일 때조차도, 행동적 문제를 포함한 잠재적 문제의 전체 범위를 탐색하기 위해 다중 양식 평가(Multimodal assessment)가 사용되어야 한다.

평가는 또한 저조한 성과나 행동에 기여할 수 있는 조직적 문제(organisational issues)를 결정하는 데에도 사용되어야 한다. 이는 근무 환경이 기여 요인인지, 그리고 이 환경이 재교육 활동을 수행하기에 적합할지를 결정하는 데 도움이 될 것이다. 근무 환경에 문제가 있다면, 재교육은 다른 곳에서 수행되어야 할 수도 있다.
재교육 대상 의사가 저조한 성과나 비전문적인 행동의 유발 요인(triggers)을 식별하고 성찰하도록 촉진될 때, 그들은 미래에 이러한 반응을 피할 수 있을 것이다. 재교육 프로그램은 재교육 대상 의사가 자신의 의뢰(referral) 이유를 성찰하고 성과 부진이나 나쁜 품행의 유발 요인을 식별할 기회를 제공해야 한다.
재교육 프로그램은 실무자가 변화하도록 동기부여(motivate)할 때 효과가 있다  
재교육 대상 의사가 개별화된 재교육 프로그램의 설계에 투입(input)을 한다면, 프로그램에 대한 참여 동의(buy-in)를 가질 가능성이 더 높고 참여하도록 더 동기부여될 것이다. 가능한 경우, 재교육 대상 의사는 개별화된 재교육 계획의 설계에 협력(collaborate)하고 그것을 형성하는 데 도움을 주어야 한다. 계획 단계는 진전을 평가하고 이 진전의 평가를 위해 어떤 종류의 피드백이 적절할지 결정하는 예정된 시점(scheduled points)을 설정하는 것을 포함해야 한다.
재교육 계획 과정의 일부가 현실적이고 달성 가능한 목표(realistic and achievable goals)를 설정하는 것을 포함할 때, 재교육 대상 의사는 자신이 이 목표들을 달성할 능력이 더 있다고 느낄 수 있다. 재교육 대상 의사는 목표 설정 과정에 협력해야 하며, 설정된 목표는 달성 가능하고 측정 가능해야 한다.
재교육 대상 의사가 목표가 달성되거나 달성되지 않았을 때 어떤 일이 일어나는지에 대해 명확할(clear) 때, 재교육 프로그램에 참여하기로 선택할 가능성이 더 높다. 재교육 프로그램은 마일스톤, 진전 검토 시점, 그리고 목표 달성 또는 미달성의 결과(consequences)를 명시하는 개별화된 계획을 포함해야 한다.
가능한 모든 곳에서 재교육의 낙인을 없애기(destigmatise) 위한 노력이 이루어진다면, 재교육 대상 의사는 과정에 관여할 가능성이 더 높고 더 동기부여될 것인데, 이는 그들의 전문직 정체성에 대한 위협이 적기 때문이다. 재교육 프로그램은 재교육을 받는 과정의 낙인을 없애고, 가능한 한 이를 긍정적인 전문직 개발(positive professional development)의 관점에서 프레임화하도록 노력해야 한다.

관련이 있다면, 재교육 프로그램은 이름을 *재교육(remediation)*에서 전문적 지원(professional support) 또는 유사한 것으로 변경하는 것을 고려할 수 있다. 긍정적 프레이밍은 지원과 개발을 나타내는 용어를 포함하도록 재교육 지침을 둘러싼 언어를 변경하는 것도 포함할 수 있다.
재교육 프로그램은 진료의 변화(changes to practice)가 촉진될 때 효과가 있다  
재교육 대상 의사가 새로운 수행이나 행동을 연습(practise)할 기회가 있을 때, 이러한 새로운 수행이나 행동은 그들의 진료에 통합될 가능성이 더 높다. 적절한 경우, 재교육 프로그램은 재교육 대상 의사가 개발한 새로운 기술이나 행동을 연습할 기회를 제공해야 한다. 여기에는 시뮬레이션 환경(simulated settings)에서 새로운 행동을 리허설하는 것이 포함될 수 있다. 이것이 불가능할 경우, 지도된 성찰(guided reflection)은 현장(in situ) 진료를 성찰할 기회를 제공할 수 있다.
지도된 성찰을 위한 예정된 시점이 있을 때, 재교육 대상 의사는 새로운 지식과 기술을 통합하고 추가적인 통찰을 개발할 기회를 더 많이 갖게 된다. 재교육 프로그램은 재교육 대상 의사와 함께 진전을 검토하기 위한 예정된 시점을 가져야 한다. 재교육 대상 의사는 이 검토 과정에 참여해야 하며, 성찰은 재교육 대상 의사가 자신의 진전에 대해 지속적으로 통찰을 얻을 수 있도록 지도(guided)되어야 한다.
재교육 대상 의사가 피드백을 성찰하는 데 능동적인 역할(active role)을 할 때, 피드백은 수용되고 수행의 변화를 낳을 가능성이 더 높다. 성찰은 재교육 프로그램에 내장(built into)되어야 하고 지도되어야 하지만, 진전에 대한 최종 판단(final judgement)의 일부를 구성해서는 안 된다. 성찰은 피드백에 대한 일대일 토론이나 성찰 일지(reflective logs)의 항목에 대한 토론을 포함할 수 있다. 성찰의 목적은 새로운 지식과 행동을 내재화(embed)하고 추가적인 통찰을 낳기 위해 흥미롭고 의미 있는 대화를 나누는 것이다.

최근의 의료 법적 사건들은 성찰 일지의 비밀 보장에 불확실성을 주었을 수 있다. 작성된 성찰의 정확한 법적 지위(legal status)는 사전에 확립되어야 한다.

 

4.4 연구, 정책 및 실무에 대한 시사점 (4.4 Implications for research, policy and practice)

 

우리의 결과는 정책과 실무에 있어 다수의 중요한 시사점을 갖는다. 전체 권고안 세트는 표 3에 제공된다. 요약하자면, 우리는 재교육 개입을 통찰(insight) 개발에 집중하는 것이 결정적이라고 상정한다(posit). 통찰력 있는 진료를 이끌어내는 것은 재교육 프로그램이 피드백이 프레임화되는 방식성찰적 실천(reflective practice)을 위해 조성된 환경에 상당한 주의를 기울일 것을 요구할 수 있다. 이것이 중요한 이유는 현직 의사들이 실수를 하고 그 실수로부터 배우는 것이 과정의 필수적인 부분인 교육적 환경(educational environment) 내에서 기능하는 경우가 드물기 때문이다. 오히려 의사들은 (수련 단계 및/또는 역할에 따라 정도의 차이는 있지만) 더 교육적인 환경으로 돌아가는 것이 자율성(autonomy)의 상실을 수반하고 부정적인 반응(adverse reaction)을 유발할 가능성이 높은 환경에서 기능한다. 이는 재교육에서의 역할이 어떻게 구조화되어야 하는지, 그리고 재교육 프로그램이 피드백이 수용될 수 있도록 어떻게 촉진적 환경(facilitative environments)을 조성할 수 있는지에 대한 신중한 고려를 집중 조명한다.

 

재교육 프로그램 내에서 기능하는 중요한 과정들이 행동 변화(behavioural change)와 관련이 있다면, 정말 중요한 전환적 학습(transformative learning)은 측정하기 가장 어려울 수 있다는 점을 인정하는 것이 중요하다. 재교육 과정에 필수적이며 통찰 및 동기와 관련된 중간 결과(Intermediate outcomes)는 식별하고, 반응하고, 피드백을 프레임화하고, (지지적인 방식으로) 도전하고, 성찰이 전략적 노력이 아니라 진정한(genuine) 것일 때를 알아볼 수 있는 훈련된 개인들의 질적 판단(qualitative judgements)을 통해 평가될 수 있다. 만약 프로그램들이 측정 가능한 결과(measurable outcomes)에만 초점을 맞춘다면, 지속 가능한 진료 변화를 산출하지 못할 수도 있다.

 

미래의 연구는 우리의 증거 기반 권고안을 사용하여 기존의 재교육 개입을 평가 및 개선하거나, 새로운 개입 전략을 설계, 실행 및 평가해야 한다. 우리는 현실주의적 평가(realist evaluation) 접근법을 사용할 것을 제안하는데, 이는 재교육 프로그램이 우리가 이 보고서에서 식별한 근접 결과(proximal outcomes)를 생성하는지 여부를 조사할 수 있게 해주기 때문이다. 미래 연구를 위한 또 다른 길은 확장된 현실주의적 고찰 접근법을 사용하여 다른 의료 직종(other health care professions)과 관련된 재교육 주제를 조사하는 것이다.

5 결론 (5 CONCLUSION)

재교육은 분명 ‘만병통치약(magic bullet)’이 없는 복잡한 문제이다. 그러나 현실주의적 고찰 접근법을 사용함으로써 우리는 재교육을 새로운 시각(fresh eyes)으로 바라볼 수 있었다. 이 방법론적 렌즈를 사용하는 것은 논의와 행동을 단순한 해결책에서 재교육의 복잡성을 명시적으로 인식(explicitly recognising the complexity)하는 것으로 전환시키며, 이는 미래에 더 생산적인 개입으로 이어질 수 있다.

 

 

 

 

 

Adv Health Sci Educ Theory Pract. 2025 Jun;30(3):815-830. doi: 10.1007/s10459-024-10382-8. Epub 2024 Oct 16.

The stigma of underperformance in assessment and remediation

 

🩺 전공의가 '일 못한다'고 찍히면 벌어지는 일: 성과 부진과 낙인

안녕하세요! 오늘은 의학교육 현장에서 늘 고민이 되는 주제, 바로 '성과 부진(Underperformance)'과 이를 둘러싼 미묘한 분위기에 대한 흥미로운 논문을 소개해 드리려고 해요.

 

우리는 흔히 수련생이 잘 못하면 "더 가르쳐서 잘하게 만들면 되지(Remediation)"라고 생각하지만, 실제 현장에서는 그 과정이 생각보다 훨씬 복잡하고 감정적입니다. 오늘 소개할 논문은 호주와 뉴질랜드의 마취과 수련 과정을 배경으로, 감독관(Supervisor)들이 성과가 저조한 전공의를 어떻게 바라보고 대하는지를 '낙인(Stigma)' 이론으로 풀어냈습니다.

 

원문 제목은 <The stigma of underperformance in assessment and remediation> 입니다. 함께 내용을 살펴볼까요?

1. 완벽주의가 만들어낸 낙인: 망가짐 (Spoiling)

의료계에는 '완벽해야 한다'는 암묵적인 룰이 있죠. 이 논문에서는 성과 부진이 바로 이 '규범적 기대'를 깨뜨리기 때문에 낙인이 된다고 봅니다. Goffman의 이론을 빌려 이를 '손상된 정체성(Spoiled identity)'이라고 표현해요.

감독관들은 전공의들이 당연히 최소 시간 내에 순조롭게 수련을 마칠 것이라고 기대합니다. 그런데 누군가 뒤처지면? 단순히 "도와줘야지"가 아니라, 뭔가 "있어서는 안 될 일이 일어났다"는 반응을 보입니다.

"대부분의 전공의들은 높은 성취를 이룬 사람들이라 일관되게 높은 점수를 받는 데 익숙합니다. 비록 그 케이스에서 낮은 점수를 받는 것이 적절하더라도, 전공의들은 그것을 힘들어하고, 따라서 감독관들도 점수를 주는 것을 힘들어합니다. 왜냐하면 그들은, 알다시피, 그것이 '으레 그래야 하는 방식'이 아니라고 느끼기 때문입니다."

"Because most trainees are high achievers and so they are used to getting consistently high marks and even if it’s appropriate for them with that case to have a lower mark, then the trainees struggle with that and therefore the supervisors struggle to give it because they, you know, they feel that that’s not the way it should be."

2. 불편하니까 피하고 숨긴다: 회피와 은폐 (Avoiding & Concealing)

성과 부진이 확인되면, 감독관들도 괴로워합니다. "어려운 대화(Difficult conversation)"를 하기 싫어서 평가를 미루거나, 혹은 그 전공의를 보호해주겠다며 공식 기록을 남기지 않고 '비밀 노트'를 만들기도 하죠.

이건 언뜻 배려 같지만, 연구진은 이것이 오히려 "성과 부진은 숨겨야 하는 부끄러운 일"이라는 인식을 강화한다고 지적합니다.

"컨설턴트(전문의)들은 어떤 전공의도 낙제시키고 싶어 하지 않습니다. 그들은 그런 어려운 대화를 나누고 싶어 하지 않아요."

"Consultants don’t want to fail any of the trainees. They don’t want to have those difficult conversations."

심지어 전공의의 미래에 해가 될까 봐 공식 기록에는 아주 '순화된 버전(Sanitised version)'만 남기기도 합니다. 결국 성과 부진은 '알려지면 큰일 나는 비밀'이 되어버리는 거죠. 🤫

3. 무서운 라벨링: "통찰력이 없다" (Lacking Insight)

이 논문에서 가장 뼈 때리는(?) 부분입니다. 우리가 흔히 전공의 평가할 때 "저 친구는 인사이트(Insight)가 없어"라는 말을 자주 쓰잖아요?

연구진은 이 '통찰력 부족'이라는 라벨이 일종의 고정관념화(Stereotyping)라고 지적합니다. 감독관 입장에서 '통찰력이 있다'는 건, 결국 "내가 너를 문제라고 보는 시각에 동의하고, 내가 시키는 대로 해"라는 뜻일 때가 많다는 거죠. 이에 동의하지 않으면 '방어적이다', '통찰력이 없다'고 낙인찍히게 됩니다.

"그들이 통찰력이 있다면 제 일이 항상 더 쉬워집니다. 설령 그들이 매우, 알다시피, 꽤 감정적이 되고 꽤 눈물을 흘리더라도, 만약 통찰력이 있다면, 저는 그들이 진정될 것이라고 항상 꽤 확신합니다."

"It always makes my job easier when they have insight, and even if they get very, you know, quite sentimental about it and quite teary, if they have got insight, I’m always pretty sure that they will settle down."

4. 특별 대우? 아니면 분리? (Treating Differently)

성과 부진 전공의에게는 더 많은 감독, 더 잦은 면담, 근무표 변경 같은 조치가 취해집니다. 교육적 목적이지만, 결과적으로 이들은 동료들로부터 분리(Separation)되고 '특별 관리 대상'이 됩니다.

근무표에서 특정 교수님을 빼거나, 당직에서 제외하는 등의 조치는 전공의에게 "나는 남들과 다르다(결함이 있다)"는 메시지를 강하게 줄 수 있습니다.

📝 결론: 우리는 어떻게 해야 할까요?

이 논문은 감독관들이 나쁜 의도를 가졌다고 비난하는 게 아닙니다. 오히려 우리 안의 완벽주의 문화구조적 문제가 어떻게 선한 의도조차 낙인으로 변질시키는지 보여줍니다.

연구진은 '교정(Remediation)'이라는 용어 대신 '개발(Development)'이라는 용어를 쓰자고 제안합니다. 누구나 수련 과정에서 뒤처질 수 있고, 그것이 숨겨야 할 비밀이나 부끄러운 일이 아니라는 문화를 만들어야 한다는 것이죠.

마지막으로 연구진의 제언을 인용하며 마칩니다.

"감독관이 성과 부진이 낙인을 유발하지 않기를 바란다면, 마치 그것이 낙인을 찍는 것이 아닌 것처럼 행동하기 시작할 필요가 있을 수 있습니다."

"Supervisors who wish underperformance not to induce stigma may need to start acting as if they believe it is not stigmatising."

 


서론 (Introduction)

임상 진료 현장(clinical practice)의 감독관(Supervisors)들은 성과 부진(underperformance)이라는 ‘문제(problem)’를 고려하고 이를 피하는 데(avoiding) 상당한 시간과 에너지(considerable time and energy)를 쏟습니다 (Bearman et al., 2013; Yepes-Rios et al., 2016). 그러나 그들이 실패(failure)를 인지하게 되면서(recognise), 그들은 화를 내게 되고(become angry) “거칠고 명백한 언어(harsh, unequivocal language)”를 사용하게 됩니다 (Gingerich et al., 2022, p5). Gingerich 등이 묘사한 바와 같이, 감독관들은 양가적인 태도(being ambivalent)에서 낙인을 찍는 언어(stigmatising language)를 사용하는 상태로 전환되는(switch) 일종의 임계점(tipping point)에 도달하게 됩니다 (예: “그는 재앙이야(he’s a disaster)”, “내가 그를 6개월 동안 지도해야 했다면 아마 내 정맥을 그었을 거야(opened a vein)”). 심각한 성과 부진(serious underperformance)과 관련된 낙인(Stigma)은 전공의(trainees)가 교정 교육(remediation)을 받는 데 있어 방해물(impediment)로 인식되어 왔습니다 (Chou et al., 2019; Price et al., 2021). 실제로 낙인은 의료(healthcare)와 같이 교육 이외의 분야에서도 낙인찍힌 개인(stigmatised individuals)의 결과(outcomes)에 영향을 미칩니다 (Addison, 2023). 우리는 낙인을 찍는 언어와 행동(stigmatising language and behaviours), 특히 회피(avoidance)가 무능한 의료인(incompetent practitioners)이나 트라우마를 겪는 전공의(traumatised trainees)를 양산할 잠재력(potential to result in)이 있음을 제안합니다.

 

이 논문은 전공의 마취과 수련(postgraduate anaesthesia training)이라는 맥락(context)에서, 감독관들이 성과 부진을 판단(judging)하고 교정(remediating)하는 방식을 이해하는 데 낙인(stigma)이라는 개념이 어떻게 도움이 되는지를 탐구합니다. 이러한 수련 프로그램의 근간(fundamental)은 전공의의 수행 능력이 다음 학습 단계(next stage of learning)로 나아가기에 만족스러운지(satisfactory)를 결정하는 것입니다. 낙인은 본질적으로(at heart) 사회문화적 현상(sociocultural phenomenon)이기 때문에, 우리는 학습을 실천 공동체(community of practitioners)로 들어가는 궤적(trajectory)으로 개념화할 수 있는 사회문화적 관점(sociocultural perspective)을 취합니다 (Lave & Wenger, 1991). 초심자(novice)에서 완전한 참여자(full participant)로 가는 전공의들의 경로는 획일적이지도 않고 선형적이지도 않습니다(neither uniform nor linear). 전공의들은 저마다의 역사와 상황(histories and circumstances)을 가지고 있으며, 그들의 맥락이 제공하는 행동 유도성(affordances)에 대한 반응이 그들의 학습 궤적(learning trajectory)을 결정합니다 (Billett, 2009). 그러나 모든 경로가 원하는 목적지(desired destination)로 이어지는 것은 아닙니다; 교육자들은 전공의의 개별적인 경로가 ‘수용 가능성의 넓은 회랑(broad corridors of acceptability)’ (Ellaway, 2023, p4)에서 벗어나(deviates) 실패할 위험(risk of failure)이 있을 때를 묘사(delineate)해 줄 필요가 있습니다. 수행 문제(performance issues)가 해결되어 전공의가 ‘정상적인 진료(normal practice)’로 복귀하거나, 혹은 업무상의 결함(deficiencies)이 교정 불가능하다고 판단되어(judged irremediable) 수련을 계속할 수 없게 되거나 둘 중 하나입니다 (Ellaway, 2023). 문헌들은 교정 교육(remediation)을 정상화(normalise)해야 한다는 열망 섞인 필요성(aspirational need)을 반복적으로 강조하지만 (Kalet et al., 2017; Kuehl & Gisondi, 2015), 이는 실제로 행하기에는 어렵습니다(difficult to do in practice) (Mills, 2023).

 

낙인(Stigma)은 1963년 Goffman이 이를 조명한 이래로 사회과학(social sciences)에서 두드러진 개념(prominent concept)이었습니다 (Goffman, 1963). 낙인은 사회적 구성물(social construct)로서, 인지된 차이(perceived difference)가 개인에 대한 라벨링(labelling)과 고정관념(stereotyping)을 초래하는 사회문화적 환경(sociocultural environment)에서 발생하는 과정들을 묘사합니다. 이러한 낙인을 찍는 차이(stigmatising difference)는 ‘특정 유형의 개인이 어떠해야 하는지에 대한 우리의 고정관념과 조화되지 않는 것(incongruous with our stereotype)’입니다 (Goffman, 1963, p2). 낙인에 의해 유발된(provoked) 과정들은 차별(discrimination)을 조장하고, 사회적 정체성(social identity)을 위협하며, 지위 상실(status loss)과 궁극적으로는 사회적 배제(social exclusion)를 낳을 수 있습니다 (Goffman, 1963; Link & Phelan, 2001; Yang et al., 2007).

 

낙인의 영향(impact of stigma)은 그 징후가 되는 차이(signifying difference)가 알려져 있는지 혹은 알려져 있지 않은지(known or unknown)에 따라 매개됩니다. Goffman은

  • 눈에 띄거나 공개된 차이(noticeable or disclosed differences)를 가진 사람들은 ‘결함이 드러난/낙인이 찍힌(discredited)’ 상태(예: 신체적 장애)인 반면,
  • 숨겨지거나 공개되지 않은 차이(concealed or undisclosed differences)를 가진 사람들은 ‘결함이 드러날 수 있는/낙인이 찍힐 수 있는(discreditable)’ 상태(예: 정신 건강 장애)라고 지적했습니다 (Goffman, 1963).

낙인을 찍는 차이가 눈에 보이지 않는 경우(not visible), 정보에 대한 통제(control of the information)와 잠재적 공개(potential disclosure), 즉 Goffman이 명명한 ‘알려짐(known-about-ness)’이 중요해집니다 (Goffman, 1963, p49).

 

낙인을 찍는 차이는 우리의 기저에 있는 믿음이나 기대(underlying belief or expectation)를 방해합니다(disrupts). 우리는 낙인찍힌 사람으로부터 등을 돌리거나(turning away) 우리 자신을 분리함(separating ourselves)으로써 반응하며, 종종 우리의 행동을 설명하기 위해 그들의 낮은 지위(lesser status)에 대한 ‘낙인 이론(stigma theory)’을 적용합니다(invoking) (Goffman, 1963). 동일한 과정이 낙인찍힌 사람들에게도 작용하며, 그들은 편견 어린 시선(prejudiced views)을 내면화(internalise)하거나 타인의 정상적인 행동(normal actions)을 낙인을 찍는 행위로 해석하는, 이른바 자기 낙인(self-stigma)이라는 개념을 겪을 수 있습니다 (Goffman, 1963; Krug et al., 2019). 개인이 이를 실행(enact)하기는 하지만, 낙인은 기저에 깔린 신념, 정책, 구조(underlying beliefs, policies and structures)에서 기인합니다 (Charmaz, 2019). 따라서 낙인은 관계적/대인관계적 요소(relational/interpersonal element)와 문화적 또는 구조적 요소(cultural or structural element)를 모두 가집니다. 낙인과 싸우는 것(Combatting stigma)은 고착된 태도와 신념(entrenched attitudes and beliefs)을 인식하고 변화시켜야 하기 때문에 도전적인 일입니다 (Phelan et al., 2014). 성과 부진에 대한 낙인이 어떻게 발생하고(arises) 그것이 교정 교육에서 어떤 역할(role it plays)을 하는지를 명확히 하는 것은 우리가 낙인과 싸우고 성과 개선 과정(performance improvement process)을 정상화하는 데 도움이 될 수 있습니다.

 

이 논문에서 우리는 감독관들의 ‘성과 부진 전공의(underperforming trainees)’ (참고: 그렇게 판단된 경우)에 대한 행동이 어떻게 낙인을 반영하거나 유발하는지(reflects or induces)를 조명하는 것을 목표(aim to illuminate)로 합니다. 우리의 연구 질문(research question)은 다음과 같습니다: 감독관들이 성과 부진을 다루는 방식에 대한 설명(descriptions)에서, 언어를 포함한 낙인을 찍는 행동(stigmatising actions)은 어떻게 나타나는가(feature)?

연구 방법 (Methods)

이 연구의 맥락(context)은 호주와 뉴질랜드의 마취과 전공의 교육(postgraduate anaesthesia education)이며, 이는 양국 통합 대학(binational college)에 의해 관장됩니다(governed). 우리는 이 논문을 작성하기 위해 인터뷰 데이터의 이차 분석(secondary analysis)을 수행했습니다. 인터뷰 대상자들은 이전에 기술된 바와 같이 (Castanelli et al., 2019, 2020), 의도적 최대 변이 표집(purposive maximal variation sampling)을 사용하여 모집된 수련 감독관(Supervisors of Training)들이었습니다 (Patton, 2015). 이하 ‘감독관(Supervisors)’으로 지칭되는 수련 감독관들은 해당 부서 내의 수련을 책임지는 마취과 전문의(specialist anaesthetists)들입니다. 그들은 각 전공의의 임상 수행 능력(clinical performance)을 감독하고(oversee), 정기적인 임상 배치 검토(clinical placement reviews)를 수행하며, 전공의의 진척도(progress)가 만족스러운지 판단하고, 필요시 교정 교육을 관리(manage remediation)합니다. 역량 위원회(competence committees)가 없기 때문에, 감독관들은 직장 내에서 총괄 평가 결정(summative assessment decisions)에 대해 개별적으로 책임(individually responsible)을 집니다.

 

이 연구는 모나쉬 대학교(Monash University, 참조: 2016000919)와 오클랜드 대학교(University of Auckland, 참조: 017408)로부터 윤리 승인(ethics approval)을 받았습니다.

 

우리는 이 연구가 포함된 연구 프로젝트를 특정 세계관(particular worldview)에서 구상했습니다(conceived). 사회적 영역(social sphere)에서 개인은 공유된 이해(shared understandings)를 가진 공동체 내에서 타인과의 상호작용(interaction)을 통해 자신만의 현실 해석(interpretation of reality)을 창조합니다 (Crotty, 1998; Tavakol & Sandars, 2014). 우리는 우리의 인터뷰 데이터가 발생한 일에 대한 어떤 ‘진실된(true)’ 기록이라기보다는, 참여자들의 경험에서 가져온 사회적으로 구성된 의미(socially constructed meaning)를 반영한다는 점을 인식합니다(recognise). 우리는 감독관들의 자질이 부족하다거나(poor quality) 그들의 행동이 배려가 없다고(uncaring) 제안하는 것이 아닙니다; 대신, 우리는 공유된 신념과 관행(shared beliefs and practices)이라는 더 넓은 문화가 감독 과정에서 어떻게 펼쳐지는지(plays out) 이해하고자 합니다.

 

감독관들이 자신의 역할을 어떻게 이해하고(understood their role) 실제 현장에서 어떻게 진척도 결정(progress decisions)을 내리는지를 탐구한 19건의 인터뷰가 있었습니다. 원래의 분석(original analyses)에서 우리는 Braun과 Clark가 기술한 주제 분석(thematic analysis) 방법을 사용했습니다 (Braun & Clarke, 2006; Braun et al., 2015). 결과가 이미 출판된(previously published) 이러한 귀납적 분석(inductive analyses)을 통해 (Castanelli et al., 2019, 2020), 우리는 데이터에 친숙해졌으며(gained familiarity) 성과 부진을 관리하는 데 있어 낙인의 잠재적 역할(potential role of stigma)에 대해 주의를 기울이게 되었습니다(were alerted).

 

우리는 그 후 이론 지향적 주제 분석(theory-directed thematic analysis)을 사용하여 데이터로 돌아갔습니다 (Braun & Clarke, 2022). 이러한 주제 분석의 적용에서 목표는 데이터 내에서 ‘이론이나 개념이 어떻게 입증되는지(evidenced)’를 탐구하는 것입니다 (Braun & Clarke, 2022, p267). 우리는 위에서 기술한 낙인의 특징(characteristics of stigma)에 의해 유도된(guided by) 연역적 코딩(coding deductively)을 시작했습니다 (Braun et al., 2015; Goffman, 1963). 특히, 우리는 성과 부진과 관련하여 ‘라벨링(labelling)’, ‘고정관념(stereotyping)’, ‘분리(separation)’, ‘지위 상실(status loss)’이 감독관들의 설명(accounts) 속에 어떻게 나타나는지(appeared) 살펴보았고 (Link & Phelan, 2001), 낙인에 대한 반응(response to stigma)을 시사할 수 있는 전공의의 행동에 대한 이야기들에 주목했습니다(noted). 우리는 또한 감독관들의 신념(beliefs)과 낙인을 지지할 수도 있는(might support) 문화적 혹은 구조적 요인(cultural or structural factors)을 반영하는 언급들(comments)에도 주의를 기울였습니다(attended to) (Charmaz, 2019). 우리는 이러한 코드들 안팎(within and between)에 있는 데이터의 미묘한 차이(nuances)를 포착하기 위해 이러한 연역적 코딩을 귀납적 코딩(inductive coding)으로 보완했습니다(supplemented). 코딩은 NVivo 소프트웨어(version 12, QSR International Pty Ltd, Melbourne, Vic., Australia)를 사용하여 용이하게 진행되었습니다(facilitated). 코딩이 완료된 후, DC가 코드로부터 잠정적인 주제(provisional themes)와 주제 구조(thematic structure)를 생성하는 잠정적 분석(provisional analysis)을 수행했고, 이는 이후 연구팀에 의해 검토되었습니다 (Braun & Clarke, 2022). 검토 과정에서 추가적인 정제(refinement)를 거쳐 주제 구조와 주제들이 확정되었습니다(finalised).

 

연구자로서, 우리는 분석에 우리 자신의 개인적 관점(personal perspectives)을 가져옵니다. 저자 중 한 명(DC)은 현직 마취과 의사(practicing anaesthesiologist)이자 참여자들과 같은 감독관입니다. 따라서 그는 자신의 경험에 기반한 통찰력(insights)을 제공했으며, 그의 역할이 바로 우리가 이 시스템을 연구하게 된 이유입니다. MB와 EM은 각각 컴퓨터 과학(computer science)과 물리치료(physiotherapy) 배경을 가지고 있으며, 세 저자 모두 보건 전문직 교육 연구(health professions education research)와 질적 연구 방법(qualitative research methods)에 광범위한 경험(extensive experience)을 가진 박사 학위 소지 연구자(PhD-qualified researchers)들입니다.

 

이론 지향적 주제 분석 과정은 우리가 함께 수행했던 다른 연구들보다 더 많은 성찰성(reflexivity)을 요구했습니다. 우리는 분석적 선택과 해석적 선택(analytic and interpretative choices)을 조화시키는 데(reconciling) 있어 여러 우려를 가졌습니다. 우리는 분석 초기 단계의 연역적 성격(deductive nature) 때문에, 미리 구상된 부분적인 이야기(pre-conceived and partial story)에 맞추기 위해 데이터를 ‘강요(forcing)’함으로써 우리의 해석을 제한(restricting)하고 있는 것은 아닌지 걱정했습니다. 그러한 접근법은 우리의 해석주의적 연구 프레임(interpretivist research framing)과 일치하지 않습니다(inconsistent). 대신, 우리는 우리가 연구하고 있는 관행(practices) 속에 많은 요인들이 작용하고 있음을 인정하며(acknowledging), 개방적이고 호기심 어린 태도(open and curious)를 유지하고자 노력했습니다. 우리는 데이터가 해석될 수 있는 방법은 많으며 어떤 현상에 대한 설명(account of a phenomenon)이라도 항상 부분적(partial)일 수밖에 없음을 스스로 상기했습니다. 우리는 특정한 분석적 움직임(analytical moves)을 강조했습니다. 데이터를 볼 때, 우리는 예외(exceptions)를 찾았습니다; 참여자의 말을 해석할 때 그 의미가 Goffman의 이론과 일치하면, 우리는 반대 사례(counter-case)를 고려했습니다. 또한 우리는 참여자들이 구체적으로 명시(specifically articulated)하지 않는 한, 그들이 왜(why) 특정한 접근 방식을 취했는지 확신할 수 없음을 스스로 상기했습니다. 다시 말해(That is to say), 감독관들이 낙인을 찍는 행동을 했을 수는 있지만, 이것이 반드시 낙인을 찍는 차이(stigmatising difference)를 인지했기(perception) 때문만은 아닐 수도 있습니다.

연구 결과 (Findings)

우리는 Goffman의 낙인 개념(conception of stigma)을 중심으로 분석의 틀을 잡았으며(framed), 따라서 그의 이론화(theorising)와 관련하여 연구 결과를 제시합니다.

  • 우리의 첫 번째 주제인 손상(Spoiling)은 성과 부진(underperformance)의 낙인 기저에 깔려 있는(underlying) 신념과 기대(beliefs and expectations)를 제시합니다. 이어지는 주제들은 성과 판단(performance judgements)을 내리고 교정 교육을 관리(managing remediation)하는 참여자들의 이야기 속에 낙인을 찍는 언어와 행동(stigmatising language and actions)이 어떻게 스며들어 있는지(permeated)를 반영합니다.
  • 회피(Avoiding)에서는 성과 부진에 대해 논의하기를 꺼리는 마음(reluctance)이 있었으며, 이는 그것의 결함을 드러내는 본질(discrediting nature)을 반영하거나 강조하는 것일 수 있습니다.
  • 은폐(Concealing)에서는 비밀 유지(secrecy)와 공개 제한(limiting disclosure)에 대한 필요성이 있었습니다. 여기에는 교정 개입(remedial interventions)을 방해하고(hamper) 다른 전공의들의 반감(antagonise)을 살 수 있는 공식 기록(official records)을 남기기를 꺼리는 것이 포함되었습니다.
  • 우리는 교정 노력(remedial efforts)이 네 번째 주제인 고정관념화(Stereotyping)로 이어진다는 점에 주목했으며, 이는 전공의를 ‘통찰력이 부족함(lacking insight)’으로 라벨링하는 것과 같이 잠재적으로 더 심각한 결과(more severe consequences)를 신호하는 것이었습니다.
  • 마지막으로, 전공의를 성과 부진자로 라벨링하는 것은 차별적 대우(differential treatment), 즉 다르게 대우하기(Treating differently)로 귀결되었습니다. 이러한 특별 대우(special treatment)는 더 많은 지시(more direction), 더 많은 감독(more oversight), 그리고 업무 재배정(re-allocation of work) (가장 흔하게는 근무 및 발전을 위한 중요한 과업(important tasks)에 대한 접근을 제한하는 것)으로 나타났으며(manifested), 이는 전공의를 다른 부서원들로부터 분리(separation)시키는 것을 유발했습니다(provoked).

손상 (Spoiling)

우리의 ‘규범적 기대(normative expectations)’를 방해하는(disrupting) ‘조화되지 않는 차이(incongruous difference)’ (Goffman, 1963, p2)는 낙인을 만들어냅니다. 다시 말해(In other words), 낙인은 Goffman이 손상된 정체성(spoiled identity)’이라고 부르는 것입니다. 만약 성과 부진이 낙인을 찍는 것이라면, 그것은 어떤 정체성을 방해합니까? 우리는 성과 부진에 의해 방해받을 수 있는 두 가지 기저 신념(underlying beliefs)을 발견했습니다.

 

첫째로, 성과 부진은 의료계의 지배적인 완벽주의 문화(prevailing culture of perfectionism)에 도전할 수 있습니다. 직장 기반 평가(workplace-based assessments)의 결함(deficiencies)을 논의할 때, 감독관들은 전문의들과 전공의들에게 학습을 위한 평가(assessment for learning)를 받아들이고(embrace) 위임 척도(entrustment scale)의 낮은 범위를 사용하도록 설득하는 데 직면한 어려움(difficulty)을 언급했습니다. 다른 감독관의 인용문이 그 이유를 설명합니다:

"대부분의 전공의들은 높은 성취를 이룬 사람들(high achievers)이라 일관되게 높은 점수를 받는 데 익숙합니다. 비록 그 케이스에서 낮은 점수를 받는 것이 적절하더라도, 전공의들은 그것을 힘들어하고(struggle), 따라서 감독관들도 점수를 주는 것을 힘들어합니다. 왜냐하면 그들은, 알다시피, 그것이 '으레 그래야 하는 방식(the way it should be)'이 아니라고 느끼기 때문입니다." (#10).

 

감독관들은 턴 종료 평가(end of term assessments)를 논의할 때 스스로도 비슷한 어려움에 직면했습니다. ‘으레 그래야 하는 방식’은 그들이 제공하는 성과 피드백(performance feedback)으로까지 확장되었으며, 한 감독관은 다음과 같이 설명했습니다:

"매우 긍정적인 말(very positive things)을 해주지 않으면, 자연스럽게 우리가 데리고 있는 예민한 전공의들(highly-strung trainees)은 그것에 대해 매우 우려하게 됩니다." (#4).

 

둘째로, 성과 부진은 전공의들이 최소 허용 시간(minimal allowed time) 내에 순조롭게(smoothly) 수련을 진행할 것이라는 기대에 도전할 수 있습니다. 이러한 기저 신념은 한 감독관이 진척도 결정(progress decisions)을 내리는 방식을 논의할 때 분명했습니다(apparent):

"기본값은 '예(yes)'입니다. 왜냐하면 우리 전공의들의 절대다수(vast majority)는 훌륭한 전공의이고, 좋은 사람들이며, 훌륭한 의사들이기 때문에, 저는 그들을 낙제(fail)시킬 것이라고 예상하지 않습니다. 그래서 누군가에게 낙제를 주는 것은 꽤 큰 일(quite big deal)입니다." (#17).

 

전공의들이 가장 빠른 기회(earliest opportunity)에 진급할 것이라는 감독관들의 기대는 그들이 전공의가 수련 프로그램에서 어느 수준(level)에 도달했는지를 나타내고자 할 때도 분명했습니다(evident). 그들은 전공의의 현재 수련 단계(stage of training)를 언급하기보다는, 전공의의 수련 연차(year of training)를 일상적으로(routinely) 사용했습니다. 예: “1년차” 또는 “4년차”. 전공의가 진급할 준비가 되지 않았을 때의 결과(consequences)를 논의할 때, 감독관들은 전공의가 어떻게 “추가 수련(Extended Training)에 들어가게 되는지”를 묘사했습니다 (#9). 이는 수련 프로그램이 전공의들에게 각 수련 단계의 요건(requirements)을 완료하는 데 있어 불이익(penalty)이나 허가(permission) 없이 최소 시간의 두 배를 허용했기 때문입니다. 그러나 최소 시간을 초과하는(beyond the minimum) 수련 시간은 공식적으로 ‘추가 수련(Extended Training)’이라고 라벨링됩니다.

 

전공의의 완벽주의(trainee perfectionism)최소 시간 내의 순조로운 진행(smooth progression)이라는 이러한 기저 신념들은, 성과 부진이 이를 방해함으로써 낙인을 시작하게 하는(initiate stigma) 규범적 기대(normative expectations)인 것으로 보입니다.

회피 (Avoiding)

참여자들의 보고는 전공의, 감독관, 그리고 그들의 동료들이 성과 부진을 논의하기를 꺼려함(reluctance)을 반영했습니다. 성과 부진이라는 진단(diagnosis)이 전달되기 전까지, 전공의는 Goffman이 말하는 ‘정상인(normals)’의 세계에 거주합니다(inhabits); 그러나 일단 성과 부진으로 진단받으면, 그들은 이후로 ‘깊이 결함이 있는(deeply discrediting)’ 속성(attribute)이라고 불릴 수 있는 것으로 라벨링됩니다 (Goffman, 1963). 그러한 회피적 행동(avoidant behaviour)은 낙인을 시사하는 행동, 낙인이 찍히는 상태(stigmatising state)에 대한 회피와 일치합니다(consistent).

 

우리는 감독관들이 일반적으로 회피적 행동성과 부진과 연관 짓는다(associated)는 점에 주목했습니다. 이것이 낙인을 찍는 차이(stigmatising difference)에 대한 반응인지 아니면 다른 이유로 인한 회피인지는 불분명했습니다(unclear). 어느 쪽이든, 이는 성과 부진이 ‘결함이 드러나는(discrediting)’ 차이임을 신호하는(signal) 것처럼 보였습니다. 예를 들어, 감독관들은 일부 전공의들이 자신에게 관심이 집중되는 것을 피했다(avoided drawing attention)고 언급했으며, 그들의 가정(assumption)은 이것이 성과 부진의 문제라는 것이었습니다. 예를 들어, 전공의가 직장 기반 평가자로 “비둘기(doves)” (#16, 역주: 평가를 후하게 주는 사람을 의미)를 선택하거나 평가 가능한 과업(assessable tasks)을 아예 멀리한다면(steered away) 말입니다:

"전체 텀(term) 동안 직장 기반 평가를 딱 하나만 수행한 전공의가 있다면... 그건 보통 그들이 잘하고 있지 못하다는 표시(indication)입니다." (#8).

 

성과 부진에 대한 논의를 회피하는 것(Avoiding discussion) 또한 반복적으로 언급되었습니다: 감독관들은 그들의 전문의 동료들이 전공의와 성과 부진에 대해 논의하거나 자신들의 견해를 서면으로 기록하는 것(record their views in writing)을 과묵해한다(reticent)고 보고했습니다. 예를 들어:

"컨설턴트(Consultants, 전문의)들은 어떤 전공의도 낙제시키고 싶어 하지 않습니다. 그들은 그런 어려운 대화(difficult conversations)를 나누고 싶어 하지 않아요." (#10).

전공의가 낙제를 받을 만한지(worthy of failure) 여부는 여기서 중요하지 않으며(immaterial), “어려운 대화”를 나누기를 꺼리는 것은 성과 부진이라는 ‘결함이 드러나는’ 차이를 신호할 수 있습니다. 이러한 꺼림(reluctance)은 성과 부진 진단을 전달하는 것(delivering the diagnosis)을 “끔찍한 과정(dreadful process)”이라고 묘사하는 감독관들의 설명에 의해 강화됩니다 (#10):

"저는 그게 정말 어렵다고 생각해요. 별로 기대되지 않았죠(wasn’t looking forward)... 저는 휴지를 확실히 챙기고(make sure I have tissues)... 그들에게 공감하려고 해요(be empathic)... 그들이 이게 단지 처벌 시간(punishment session)이라고 느끼지 않도록요." (#14).

 

성과 부진 진단을 전달하는(relaying) 감독관의 설명에 암시된(implied) 전공의의 트라우마는 Goffman이 말하는, 뒤따라올 일에 대한 전공의의 지식(knowledge of what follows)에서 비롯되는 “갑작스러운 낙인의 고통(painfulness… of sudden stigmatization)”과 평행을 이룹니다(parallels) (Goffman, 1963, p 132) – 이는 감독관이 언급한 “처벌(punishment)”을 의미합니다. 실제로, 진단을 내리고 소통하기를 꺼리는 감독관들의 태도, 그리고 발견(detection)을 돕기를 꺼리는 전공의와 감독관들의 태도는 성과 부진에 부여된 일반적인 낙인(general stigma)을 반영하는 것일 수도 있고, 혹은 동등하게(equally) 이 차이의 결함을 드러내는 본질을 확립(establish)하고, 그렇게 함으로써 낙인을 창조(create stigma)하는 것일 수도 있습니다.

 

감독관들이 성과 부진 전공의들이 그러하다고 보고하는 것처럼, 낙인을 찍는 차이로 라벨링되는 것에 대한 두려움(Fear of being labelled)은 다른 낙인 속성(stigmatising attributes)을 가진 이들로 하여금 공개를 피하고(avoid disclosure) 도움을 받는 데 실패(fail to access help)하게 만듭니다 (Young et al., 2019). 낙인 이론(stigma theory)을 적용하면, 라벨링은 전공의를 공동체가 성과 부진에 대해 가지고 있는 “공유된 문화적 신념(shared cultural beliefs)”에 노출시키고(expose), 그들과 나머지 공동체 사이에 분리(separation)를 조성하여, 지위 하락(diminished status)사회적 고립(social isolation)의 위험을 초래할 수 있습니다 (Phelan et al., 2014).

 

이어지는 주제들에서, 우리는 그러한 두려움이 감독관들의 설명에 반영되어 있는지 살펴볼 것입니다.

 

은폐 (Concealing)

만약 성과 부진(underperformance)이 낙인을 찍는 것(stigmatising)이라면, 이는 Goffman에 따르면 공개의 딜레마(dilemma of disclosure)를 발생시키는 보이지 않는 차이(invisible difference)를 나타냅니다. 그가 말하듯이, 낙인찍힌 사람(stigmatised person)은 딜레마에 직면합니다: '말할 것인가 말 것인가(to tell or not to tell); 드러낼 것인가 드러내지 않을 것인가(to let on or not to let on); 거짓말할 것인가 하지 않을 것인가(to lie or not to lie); 그리고 각 경우에 대해, 누구에게, 어떻게, 언제, 어디서 할 것인가' (Goffman, 1963, p42). 징후가 되는 차이(signifying difference)가 공개되지 않은 채로 남아있는 한(remains undisclosed), 그 사람은 수반되는 낙인(attendant stigma)의 영향(impact) 중 일부를 피할 수 있습니다(avoid). 우리는 데이터에서 성과 부진의 공개를 은폐하거나 관리하는 것(concealing or managing the disclosure)이 감독관들의 교정 관행(remediation practice)의 중요한 측면(important aspect)임을 보았습니다.

 

감독관들은 교정 교육에서 공개를 최소화하는 것(minimising disclosure)을 우선순위로 두었다고 보고했습니다:

"우리는 그 익명성(anonymity)을 유지했고, 이것이 공정하고 사적이며(fair and private), 분명히 기밀이 유지되는 과정(confidential process)이라는 점을 밀어붙였습니다." (#16).

 

그럼에도 불구하고, 전공의가 교정 교육 내에서 지원을 받으려면(supported) 완벽한 비밀 유지(absolute secrecy)는 불가능했습니다; 대신, 전공의의 곤경(predicament)에 대한 지식은 가능한 한 소수의 그룹에게만 유지되었습니다:

"기밀성(confidentiality)을 유지하는 데 있어 큰 도전 과제 중 하나는... 하지만 네, 일을 안전하게 유지하는 것(keeping things safe)이죠. 그래서 알아야 할 필요가 있는 사람들만 알도록(only those who need to know, know) 하는 겁니다." (#10).

 

사실상 감독관들은, Goffman이 말한 바와 같이, 내용을 알고 있으며 낙인찍힌 개인(stigmatised individual)이 의지할 수 있는 사람들로 구성된 ‘보호망(protective circle)’ (Goffman, 1963, p97)을 형성하는 데 기여합니다. 한 감독관은 비밀 유지(secrecy)가 해당 전공의를 다른 전공의들과 다르게 대우하는 것(treating... differently)을 설명하기 어렵게 만들 수 있다는 점을 인정했습니다. 마찬가지로, 보호망 밖에서(outside the protective circle) 해당 전공의를 감독하는 다른 마취과 의사들은 그 사실을 모르는 상태(left unaware)일 수 있으며, 이는 어떤 추가적인 지원(extra support)도 불가능하게 만들지만(precluded), 전공의를 성과 부진자로 라벨링하는 것이 미래의 상호작용에 편견을 줄 수 있다(prejudice future interactions)는 우려를 피하게 해줍니다:

"추가적인 피드백과 감독(extra feedback and supervision)을 요청하는 것, 사람들은, 알다시피... 누군가를 주목받게 하는 것(putting someone in the spotlight)은 그들의 수행 능력에 부정적인 영향을 미칠 수 있습니다(adversely affect)... 왜냐하면 저는 그것이 기정사실(foregone conclusion)이 되기를 원하지 않기 때문입니다, 알다시피요. 만약 누군가가, 알다시피, 진척이 없거나(not progressing) 문제를 겪고 있는 사람으로 표시(flagged)된다면, 종종 그것은 당신이 얻게 될 피드백을 왜곡할(colour the feedback) 수 있다고 생각합니다." (#10).

 

따라서, 우리는 은폐(concealing)가 낙인을 찍는 행동(stigmatising behaviour)으로 작용함을 알 수 있습니다. 이러한 믿음은 우리가 낙인을 찍는 상태(stigmatising conditions)에 대해 알고 있는 바와 일치하는데, 여기서 낙인은 역량에 대한 낮은 기대(lower expectations of competence)와 낮은 성과 판단(lower performance judgements)으로 이어집니다 (Phelan et al., 2014). 이 감독관이 개요를 설명한 바와 같이, 이러한 낮은 기대는 낙인찍힌 당사자에 의해서도 무의식적으로 공유(unconsciously shared)될 수 있으며, 이는 그들의 수행 능력에 영향을 미치고(impacting) 더 저조한 성과 판단(poorer performance judgements)에 기여할 수 있습니다.

 

은폐하려는 노력(effort to conceal)은 상당했습니다(considerable): 일부 감독관들은 자신만의 사적인 노트(private notes)를 유지했던 교정 교육의 초기 단계(initial stage)를 묘사했습니다. 한 감독관은 다음과 같이 언급했습니다: 만약 "그것을 기록(record)에 입력하면, 전공의를 놀라게 할(alarm) 뿐만 아니라, 다음번 수련 감독관도 놀라게 할 것입니다" (#4). 따라서, 성공적인 교정 교육에서 공식적인 수련 기록(formal training record)은 “사건의 순화된 버전(sanitised version of events)” (#1)을 담고 있거나, 기록이 전혀 없을 수도 있습니다.

 

감독관들이 전공의가 성과 부진을 겪었다는 사실(knowledge)을 관리하는 방식은 Goffman이 묘사한 결함이 드러날 수 있는 사람(discreditable person)의 ‘가장(masquerade)’과 일치합니다. 여기서 그는 ‘자신의 위험(risk)을 다룸에 있어 세상을 아무것도 말하지 않는 큰 그룹(large group to whom he tells nothing)과 모든 것을 말하는 작은 그룹(small group to whom he tells all)으로 나눔으로써’ 대처합니다 (Goffman, 1963, p95). 감독관들이 성과 부진에 부착된(attached to) 낙인에 대한 반응으로 성과 부진을 은폐하든 공개하든 상관없이, 그들의 행동은 성과 부진이 숨겨져야 하고 논의되지 말아야 할 차이(difference that ought to be hidden and not discussed)라는 인식을 형성하는 데 기여하며, 따라서 낙인에 대한 인식(perception of stigma)에 기여합니다.

고정관념화 (Stereotyping)

라벨링(labelling)과 함께, 낙인과 관련된 신념들은 그 사람에게 부착(attached)되는데, Goffman은 이 과정을 고정관념화(stereotyping)라고 묘사했습니다 (Goffman, 1963). 따라서 다른 사람들은 낙인찍힌 사람이 어떤 문제(problems)에 직면해 있고 그들이 그 문제에 어떻게 대처해야 하는지(how they should face them)를 자신들이 이미 알고 있다고 믿습니다: ‘그의 다른 문제들에 더해, 그는 자신이 무엇이고 무엇이 아닌지, 그리고 이 모든 것이 짐짓 자신의 이익(own interests)을 위한 것이라고 말하는 전문가(professionals)들에 의해 동시에 여러 방향으로 떠밀리는(simultaneously pushed in several directions) 문제를 추가해야만 한다’ (Goffman, 1963, p124). 교정 교육을 계획하는 전공의와의 대화에 대한 보고에서, 감독관들은 전공의에게 그들이 인지한 성과 부진(perceived underperformance)을 설명하거나 교정 계획을 돕도록 할 기회를 거의 제공하지 않았습니다(afforded... little opportunity). 감독관들은 전공의를 만나기 전에 이미 문제점과 그것을 가장 잘 해결할 방법(best address it)을 모두 결정해 놓았습니다(already decided). 예를 들어, 한 감독관은 스스로에게 다음과 같이 확신(assuring themselves)한 후에만 전공의를 만날 약속을 잡았다고 말했습니다:

"나에게 이에 대한 해결책(solution)이 있는가? 그리고 이 해결책이, 이 전공의에 의해 실행될 수 있는가(can it be implemented)?" (#18).

 

감독관들은 전공의의 관점(trainee’s view)을 탐색하기보다는, 전공의의 수행 ‘상태(state)’에 대한 자신들의 이야기(narrative)와 그것을 해결하기 위해 전공의가 취해야 할 조치들을 전공의가 받아들이기를(accept) 원했습니다. 한 감독관은 이를 간결하게 요약하여(summarised this succinctly) 전공의에게 다음과 같이 말했습니다:

"이것이 우리가 당신의 문제라고 인지하는 것(perceive as your issues)이고, 이것이 당신이 그것을 개선하기 위해 할 수 있는 일입니다." (#17).

 

‘통찰력의 부족(Lack of insight)’은 성과 부진에서 흔히 볼 수 있는 고정관념화의 구체적인 예시(particular example)를 제공합니다 (Bearman et al., 2018). 우리의 인터뷰에서, 감독관들은 전공의의 통찰력(insight)을 자신의 성과 부진, 그것이 발생한 경위, 그리고 이에 대해 무엇을 해야 하는지에 대한 감독관의 견해(supervisor’s view)를 수용하는 것(accepting)과 동일시했습니다(equate). 통찰력이 있다고 판단되는 것(judged to have insight), 즉 어떻게 행동해야 하는지에 대한 감독관의 견해에 순응하는 것(conforming)은 성공적인 교정 교육의 좋은 징조(augured well)였습니다:

"그들이 통찰력이 있다면 제 일이 항상 더 쉬워집니다(makes my job easier). 설령 그들이 매우, 알다시피, 꽤 감정적이 되고(sentimental) 꽤 눈물을 흘리더라도(teary), 만약 통찰력이 있다면, 저는 그들이 진정될 것(settle down)이라고 항상 꽤 확신합니다." (#18).

 

일부 감독관의 보고에서, 통찰력은 전공의가 소유하고 있거나 그렇지 않은(possessed or didn’t) 어떤 것이었지만, 다른 경우에는 감독관이 전공의를 설득할 수만 있다면(convince) 주입될 수 있는(instilled)이기도 했습니다:

"저는 전공의에게 통찰력이 제공될 수 있도록(provided with insight) 모든 증거(evidence)를 갖추고 있어야 합니다... 그것의 많은 부분은 문제가 있다는 증거(proof)를 가지고 있고, 이용 가능한 과정과 해결책을 가지고 있는 것입니다." (#4).

 

한 사례에서, 감독관은 처음에는 통찰력이 부족했던(initially lacked insight) 전공의가 나중에 그것을 얻었다(gained it)고 보고했습니다:

"그는 내 말을 끊기 시작했습니다(started interrupting me)... 내가 명확히 진술했던 많은 것들에 대해 그는 모르는 척(feign ignorance) 했습니다... [얼마 후] 그 전공의는 말했습니다, "제가 정말 문제가 있나 봅니다. 왜냐하면 6개월마다 한 번씩 제가 [감독관의] 사무실로 불려 가는 것 같아서요", 그래서... 그 메시지가 전달되었습니다(message got through)." (#16).

 

감독관들은 통찰력이 부족한 전공의들이 교정하기 가장 어렵다(most difficult to remediate)는 데 동의했습니다. 만약 전공의가 통찰력이 부족하다고 라벨링된다면, 이는 그들이 자신이 성과 부진이라는 것을 받아들이지 않거나 처방된 교정 교육(prescribed remediation)에 협조하지 않는다는 것을 의미했습니다(implied). 한 감독관은 상세한 예시를 제공했습니다:

"몇 가지 문제들이 전공의에게 주의가 환기되었고(brought to... attention), 그 후에는 전공의를 참여(engage)시키는 것이 매우, 매우 어려웠습니다... 그것은... 다양한 직업적 및 임상적 우려에 대한 피드백의 쇄도(avalanche of feedback)로 정점에 달했고(culminated in)... 조기에 개입하고 지원과 도움을 제공하려는 [감독관으로서의] 꽤 조직적인 노력(concerted effort)이 있었지만... 전공의로부터는 완벽한 통찰력과 참여의 결여(complete lack of insight and engagement), 부정직하고 조작적인 행위(act of dishonesty and manipulation)가 있었습니다... 자신을 돕기 위해 고안된 어떤 과정에도 참여하고 싶어 하지 않고 적극적으로 피하는(actively avoids) 사람을 다루는 것은 매우 어려운 상황입니다... 그것은 믿을 수 없을 정도로 스트레스가 많았습니다(incredibly stressful). 왜냐하면 그 전공의는 진심으로(genuinely) 통찰력이 없었고 계속해서 절대적으로 통찰력이 없었으며, 그것과 더불어 매우 부정직했기 때문입니다." (#13).

 

통찰력이 부족한 사람들에 대한 우리 감독관들의 견해는 ‘규범을 준수하지 못하는(fail to adhere to the code)’ 낙인찍힌 사람들에 대한 Goffman의 견해와 일치합니다(concur) (Goffman, 1963, p111). 어떻게 행동해야 하는지에 대한 감독관의 견해와 조언을 받아들이지 않음으로써(failing to accept), 전공의들은 스스로를 ‘손상된 사람(impaired person), 융통성 없고(rigid), 방어적이며(defensive), 부적절한 내적 자원(inadequate inner resources)을 가진 사람’으로 보이게 만듭니다 (Goffman, 1963, p115). 한 감독관은 자신이 통찰력이 부족하다고 판단한 전공의를 묘사하면서 “화가 난(angry)”, “방어적인”, “공격적인(aggressive)” (#15)과 같은 단어를 사용했습니다. 불행히도 이 경우, 감독관의 관점에서 볼 때 지속적인 통찰력의 결여(persistent lack of insight)는 실패한 교정 교육(unsuccessful remediation)으로 귀결되었습니다:

"글쎄요, 그는 사실 그 후에 무너졌습니다(unravelled)... 그는 다시 야간 당직(night shift)으로 돌아오지 못했고 여전히 예전과 같은 방식으로 계속 행동했습니다... 그리고 그는 결국 징계 절차(disciplinary process)를 밟게 되었습니다... 우리는 그를 수련에서 내보내려고(exit him) 했지만, 그는 사실 그냥 그만두었습니다(just quit)." (#15).

 

전공의가 무너지는 것(unravelling)과 감독관의 기대(expectations)를 충족시키기 위해 변화하지 못하는 능력(inability to change)은 낙인찍힌 사람을 융통성 없거나 손상된 사람으로 보는 Goffman의 성격 묘사(characterisation)를 반영합니다(echoes).

다르게 대우하기 (Treating differently)

Goffman에 따르면, 낙인을 찍는 차이로 라벨링됨으로써 유발된 분리(separation)는 타인들이 낙인찍힌 개인을 다르게 대우(treat... differently)하도록 이끕니다 (Goffman, 1963). 따라서 성과 부진 전공의에 대한 차별적 대우(Differential treatment)는 성과 부진이 낙인을 찍는 것임을 암시합니다(implies). 차별적 대우를 초래한 교정 교육의 한 측면은 감독관의 관심 증가(increased attention)였습니다. 감독관들은 추가적인 평가(additional assessments), 전문의로부터의 피드백, 그리고 수행 능력을 논의하기 위한 회의를 조직했습니다. 예를 들어, 한 감독관은 자신이 다음과 같았다고 말했습니다:

"더 경계하고(More vigilant) 구체적인 피드백을 얻는 데 더 주도적(more proactive)이었습니다. 그리고 네, 저는 그 개인과의 상호작용과 회의를 늘렸습니다." (#19).

 

증가된 관심은 근무표를 조작함(manipulating rostering)으로써 더 직접적일 수도 있었는데, 다른 감독관은 "우리의 직접적인 경험(first-hand experience)을 늘리기 위해... 가능한 한 그 전공의를 감독관들과 함께 근무하도록 배정(roster)할 것" (#14)이라고 말했습니다.

 

이러한 차별적 대우가 전공의를 돕고 추가로 평가하려는 욕구(desire to both help and further assess)에서 비롯된 것으로 보이지만, 낙인의 표식(marker of stigmatisation)과 동조함(aligning)으로써, 그것은 성과 부진을 낙인을 찍는 차이로 인식하도록 부추깁니다(encourages).

 

근무표를 수정하고 그에 따라 전공의의 임상 노출(clinical exposure)을 수정하는 것은, 감독관들이 개입하여 "그들을 특정 [전문의]에게서 빼내어 다른 사람과 짝지어 줄 때" (#17) 더욱 확장되었습니다. 임상 기회에 대한 접근(access to clinical opportunity)을 조작하는 것은 전공의를 시간 외 근무표(after-hours roster)에서 배제(excluding)하는 것으로까지 확장될 수 있었습니다. 한 사례에서는, 이것이 부서에 혼란을 주고(disrupt) 다른 전공의들에게 불편(inconvenience)을 끼쳐, 해당 전공의에 대한 반감(ill-feeling)을 조성하고 동료들로부터 더 큰 분리(further separation)를 초래한다고 보고되었습니다. 왜냐하면 전공의의 기밀(confidentiality)을 보호하기 위해 기저에 있는 이유(underlying reason)가 공개되지 않았기 때문입니다. 이러한 경우들에서, 감독관의 행동은 전공의의 학습 기회(learning opportunities)를 유형적으로 축소(tangibly curtailed)시켰습니다. 감독관들은 그러한 결정이 환자와 전공의의 안전(safety)에 대한 우려를 반영한다고 보고했지만, 그 효과는 낙인과 관련된 감소된 ‘삶의 기회(life chances)’ (Goffman, 1963, p5)와 유사합니다(resembles).

 

임상 경험에 대한 접근성 감소(decreased access)를 넘어, 전공의들은 낙인에 직접적으로 기인할(directly attributed) 수 있는 장기적인 결과(longer term consequences) 또한 두려워하는 것으로 보고되었습니다:

"그가 걱정했던 것 중 하나는 이것이 그의 전임의 과정(Fellowship)과 업무, 그리고 다른 병원에서의 잠재적 고용(potential employment)에 영향을 미칠 것이라는 점이었습니다." (#16).

 

그러한 언급은 해당 전공의가 성과 부진의 낙인이 지역적인 상황(local circumstances)을 넘어 지속될 것(lasting beyond)임을 우려했음을 인정하는 것입니다(acknowledges). 감독관들이 자신들의 교정 관행에서 의도적으로 전공의에게 낙인을 찍으려는 것은 아닌 것으로 보이지만(appear not to intend), 그들의 행동은 낙인을 찍는 차이에 대한 예상된 반응(expected response)과 유사하며, 따라서 낙인을 강화(reinforce stigma)할 수 있습니다.

 

고찰 (Discussion)

이 연구는 성과 부진 전공의(underperforming trainees)에 대한 감독관들의 보고된 행동(reported behaviour)이 그들의 평가 관행(assessment practices) 속에서 어떻게 낙인(stigma)을 반영하거나 유발하는지(reflect or induce) 탐구했습니다. 우리는 Goffman의 낙인 이론(stigma theory)을 사용하여 우리의 이론 주도적 주제 분석(theory-driven thematic analysis)의 틀을 잡았습니다 (Braun & Clarke, 2022; Goffman, 1963).

 

낙인은 성과 부진과 연관되어 있습니다 (Chou et al., 2019; Ellaway, 2023). 우리의 결과는 참여자들의 보고된 말과 행동(reported words and actions)이 낙인찍기 과정(processes of stigmatisation)과 어떻게 일치하는지(align) 보여줌으로써 이러한 일반적인 이해를 구축합니다(build upon). 따라서, 전공의를 판단하고 교정하는(judging and remediating) 감독관의 경험을 탐구함에 있어, 우리는 낙인이 관행에 영향을 미칠 잠재력(potential for stigma to influence practice)관행이 낙인을 강화할 잠재력(practice to reinforce stigma)을 상세히 기술했습니다.

 

우리는 완벽주의(perfectionism)지속적인 높은 성취(sustained high achievement)가 성과 부진에 의해 방해받는(disrupted) 전공의에 대한 기대라고 제안합니다; 이는 의학 교육(medical training)에서의 정신 건강 낙인(mental health stigma)에 대한 관찰과 일치합니다 (Bynum & Sukhera, 2021). 선행 연구는 의료 행위(medical practice)에서의 완벽에 대한 요구(demand for perfection)와 우리의 불완전한 인간 본성(imperfect human nature) 사이의 부조화(incongruity) (Sawatsky et al., 2023), 그리고 이것이 전공의의 정체성 형성(identity formation)에 주는 스트레스를 강조해 왔습니다. 우리의 결과는 이러한 부조화가 사적 영역(private domain)에서 공적 영역(public domain)으로 이동할 때 어떻게 나타나는지(manifests) 보여줌으로써 이러한 발견을 확장합니다; 완벽에 대한 기대(expectation of perfection)인간의 연약함(human frailty)이라는 현실 사이의 괴리(discrepancy)를 평가 결정(assessment decision) 및 교정 과정(remedial process)으로 공식화하는 것(formalising)은 타인의 눈에 비친 전공의를 위축시킵니다(diminishes). 아무도 이러한 논의를 하거나 이러한 결정을 전달하고(communicate these decisions) 싶어 하지 않는 것은 놀라운 일이 아닙니다.

 

낙인이 반드시 낙인을 찍는 행동(stigmatising behaviours)에 동기를 부여하는 것은 아닐 수도 있습니다: 예를 들어, 은폐(concealing)는 전공의를 어쩐지 다른 존재로 보는 것(seeing... different)이라기보다는 사생활을 보호하려는 진정한 욕구(genuine desire to protect privacy)를 나타낼 수 있습니다. 그러나 교정 교육에 들어가는 전공의들과 그들의 실천 공동체(community of practice)의 나머지 구성원들은 성과 부진의 낙인을 찍는 본질(stigmatising nature)을 둘러싼 사회적 신호(social signals)를 이미 인식하고(recognise) 있을 가능성이 큽니다 (Goffman, 1963; Shaker et al., 2023). 이러한 무의식적인 학습된 태도와 행동(unconscious learned attitudes and behaviours)은 낙인을 피하려는 감독관의 고결한 시도(virtuous attempts)를 약화시킬(undermine) 수 있습니다 (Phelan et al., 2014). 비록 낙인의 효과(effects of stigma)에 대한 전공의의 노출(exposure)을 최소화하려는 동기일지라도, 이러한 노력은 역설적으로 성과 부진의 낙인을 찍는 본질을 강조(paradoxically emphasise the stigmatising nature)합니다.

 

낙인이라는 렌즈(lens of stigma)가 성과 부진을 다루는 것의 어려움을 강화하는 것처럼 보이지만, Goffman은 우리에게 약간의 희망(hope)을 제공합니다: ‘그러나 특정 개인적 속성(personal property)의 인지된 바람직하지 않음(perceived undesirability)과 그것이 이러한 낙인-정상화 과정(stigma-normal processes)을 촉발할 수 있는 능력은 그 자체의 역사를 가지고 있으며, 그 역사는 의도적인 사회적 행동(purposeful social action)에 의해 정기적으로 변화한다.’ (Goffman, 1963, p138). 낙인은 사회문화적 현상(sociocultural phenomenon)이기 때문에, 변화시키는 것은 우리의 집단적 능력(collective capacity) 안에 있습니다. 더 광범위한 낙인 문헌(broader stigma literature)은 낙인을 해결하기 위한 개입(interventions)이 성공하려면 다각적(multifaceted)이어야 함을 인식합니다 (Link & Phelan, 2001). 우리의 데이터로부터, 우리는 개입을 위한 세 가지 잠재적 목표(potential targets)를 확인했습니다:

  1. 기저 신념(Underlying beliefs)과 그것들의 문화적 및 구조적 지지(cultural and structural supports).
  2. 낙인을 모방하고(mimic) 따라서 유발하는(induce) 행동들(Actions).
  3. ‘통찰력 부족(lacking insight)’이라는 라벨(label)을 다루는 것.

전공의가 항상 잘 수행하거나 높은 점수를 받아야 한다는 기저의 기대(underlying expectation)를 어떻게 다룰 수 있을까요? 학부 교육(undergraduate education)에서는 높은 기대를 충족하는 것이 가능할지 모르지만, 졸업 후 교육(postgraduate education)은 본질적으로 더 복잡한(inherently more complex) 직업 세계(world of work)에 둥지를 틀고 있습니다(nested). 따라서 단순화된 점수 평가(simplistic scored assessments)는 덜 적합합니다(less amenable) (Bynum & Sukhera, 2021). 전공의들이 수행 중심(performance focus)에서 숙달(mastery)에 초점을 둔 성장 마인드셋(growth mindset)으로 전환(shift)하도록 돕는 것은 (Dweck, 2012) 전공의들이 완벽주의적 사고방식(perfectionist mindset)에서 벗어나도록 돕는 하나의 방법을 제공할 수 있습니다 (Kalet & Zabar, 2023; Mills, 2023). 교정(remediation)이라는 용어는 개발(development)로 유용하게 대체될 수 있습니다. 이는 전문성(expertise)의 모든 단계에서 적절하고 필요한 과정입니다 (비록 일부 단계에서는 더 많은 지원이 필요하더라도).

 

전공의들이 최소 가용 시간(minimum available time) 내에 수련을 진행할 것이라는 문화적 기대(cultural expectation)에 도전하는 것 또한 교정 교육의 낙인을 없애는 데(destigmatise) 도움이 될 수 있습니다.

 

학습자들이 서로 다른 속도(different rates)로 진척되는 것을 수용하고(accommodate) 진척(progression)을 결정하기 위해 시간이 아닌 평가에 의존하는 역량 중심 의학 교육(competency-based medical education)을 도입하는 것이 도움이 될 수 있습니다 (Lucey et al., 2018). 연구된 수련 프로그램은 이미 시간 가변적 수련(time-variable training)을 제공하고 있습니다. 불행히도, 이러한 규칙들은 문화를 바꾸지 못했습니다(not changed the culture). 문화적 변화는 관행을 바꾸기 위해 개인적 노력과 시스템적 노력(individual and systemic effort)을 모두 필요로 합니다 (Bearman et al., 2021). 시간 가변적 수련을 시행하는 다른 프로그램들은 새로운 규칙을 채택하는 것을 넘어 뿌리 깊은 문화적 기대(embedded cultural expectations)를 다루는 것이 현명할 것입니다.

 

변화를 위한 또 다른 목표 영역은 낙인 반응(stigmatising response)을 모방하는 감독관의 행동을 재고(reconsidering)하는 것일 수 있습니다. 감독관들은 성과 부진을 논의하는 것을 피했고(avoided), 교정 교육을 비밀리에(secretly) 수행했으며, 차별적 대우(differential treatment)의 이유를 설명하지 않았습니다; 의도(intentions)와는 상관없이, 이러한 행동들은 모두 성과 부진이 낙인을 찍는 차이(stigmatising difference)임을 나타냅니다(signify). 성과 부진이 낙인을 유발하지 않기를 바라는 감독관들은 마치 그것이 낙인을 찍는 것이 아닌 것처럼 행동하기(acting as if they believe it is not stigmatising) 시작할 필요가 있을 수 있습니다. 여기서 한 걸음 더 나아가, Bynum과 Sukhera (2021)는 정신 질환과 관련된 낙인을 논의할 때 ‘낙인에 민감한 돌봄(stigma-sensitive care)’이라는 개념을 언급합니다. 그들이 정신 건강을 위해 옹호하는 접근 방식은 교정 교육에서의 전공의 경험(trainee experience) 또한 개선할 수 있습니다. 의역하자면(To paraphrase), 이는 성과 부진을 받아들이고 공개하는 데 필요한 취약성(vulnerability)을 인정하고(acknowledging), 전공의들이 내면화된 낙인(internalised stigma)과 공개(disclosure) 또는 교정 활동에 대한 두려움을 다루도록 돕는 것을 포함합니다.

 

전공의를 통찰력이 부족하다(lacking insight)고 라벨링하는 것은 우리가 낙인으로부터 보게 될 것이라 예상하는 가장 가혹한 결과(severest outcomes)를 위협했습니다: 차별(discrimination), 비난(blaming), 그리고 배제(exclusion). 통찰력은 자기 평가(self-assessment)와 외부 평가(external assessment) 사이의 차이에 대한 인식(awareness)으로 묘사되어 왔습니다 (Price et al., 2023). 이 정의는 우리 연구에서 통찰력 부족이 암시하는 불일치의 깊이(depth of disagreement)를 포착하지 못합니다. 우리 감독관들은 전공의가 관점의 차이(discrepancy between viewpoints)를 인정하는 것 이상을 원했습니다; 그들은 전공의가 자신들에 대한 감독관의 견해(supervisor’s view)와 이에 반응하여 어떻게 행동해야 하는지(how they ought to behave)를 수용하기를(accept) 원했습니다. 우리 사례에서의 통찰력은, 낙인찍힌 사람을 받아들이기 위해 그들이 우리가 생각하는 방식에 순응(conform)하기를 기대한다는 Goffman의 견해와 일치합니다 (Goffman, 1963). 이러한 순응을 기대하고 강제하며(enforce) 그것의 부재를 처벌하는(punish) 감독관들의 능력은 우리의 관심을 그들의 구조적 권력(structural power)과 의학 교육의 위계적 본질(hierarchical nature)로 돌립니다. 낙인은 권력(power)에 의존하며 (Link & Phelan, 2001), 전공의를 통찰력이 부족하다고 라벨링하고 뒤이어 그들을 고정관념화(stereotype)하는 감독관들의 능력은 권력이 수행하는 역할(role power plays)을 예시합니다.

 

전공의들이 대안적인 견해(alternative view)를 가지고 있거나, 사실은 낙인을 찍는 차이를 ‘고백(confess)’하고 싶지 않을 수 있다는 점을 인식하는 것 (Bearman et al., 2018)은 다른 관점(different perspective)을 제공할 수 있습니다. 감독관들은 전공의 자신의 판단(own judgement)을 도움으로써 통찰력에 대한 요구 없이(without a demand for insight) 교정 교육으로 전환할 수 있습니다 (Price et al., 2021); 전공의들이 자신의 수행에 대한 의미를 만들도록(make meaning) 돕는 교육학적 전략(pedagogical strategies)에 더 많은 관심을 기울일 수 있습니다 (Bearman et al., 2023). 또한, 유능성(competence), 자율성(autonomy), 관계성(relatedness)에 초점을 맞춘 자기 결정 이론(self-determination theory) (Ryan & Deci, 2000)은 통찰력과 감독관-전공의 간의 합의(supervisor-trainee agreement)에 덜 의존하는 학습자 개선 관행(learner improvement practices)을 위한 기초를 제공할 수 있습니다 (Bearman et al., 2018).

  • 비록 성과 부진이 전공의의 유능감(feelings of competence)을 약화시키지만,
  • 감독관들은 전공의들에게 교정 교육을 계획하고(planning remediation) 향상된 수행의 증거(evidence of improved performance)를 제공하는 데 있어 더 큰 책임(greater responsibility)을 부여함으로써 전공의의 자율성(autonomy)을 증진시킬 수 있습니다 (Bearman et al., 2018).
  • 학습자의 소속감(Learner belonging)은 평가 과정 외부의 코치나 멘토와 신뢰 관계(trusting relationship)를 구축함으로써 강화될 수 있습니다 (Price et al., 2021).

낙인을 해결하는 데 있어 어려움(challenge)은, 그것이 차이가 낙인을 찍는 것이라고 결정하는 지배 집단(dominant group)의 권력(power)에 기초하고 있다는 점입니다 (Link & Phelan, 2001). 개요 된 접근 방식들을 사용하여 감독관들과 더 넓은 실천 공동체의 신념과 태도(beliefs and attitudes)를 변화시키는 것은 성과 부진과 관련된 낙인이 줄어들 수 있다는 희망(hope)을 제공합니다.

한계 및 향후 연구 (Limitations and further research)

우리 연구는 호주와 뉴질랜드의 마취과 수련(anaesthesia training)에 위치하고 있으며, 교정 교육 내의 낙인이 집단적 문제(collective problem)이긴 하지만 (Regehr, 2010), 독자들은 우리 결과의 자신들의 맥락(context)에 대한 적용 가능성(applicability)을 판단해야 할 것입니다. 우리의 인터뷰는 관련이 있기는 하지만 다른 목적(different... purpose)으로 수행되었으며, 따라서 질문들이 낙인을 직접적으로 다루지 않았는데(did not directly address stigma), 이는 분석을 위해 우리가 이용할 수 있는 정보를 제한했을 수 있습니다. 그러나 우리의 흥미를 돋우고(piqued our interest) 이 연구를 촉발한 것은 데이터에서 명백한 낙인을 찍는 행동과 행위들(stigmatising actions and behaviours)이었습니다. 게다가, 우리는 성과 부진의 낙인이 감독관의 관행을 유발했는지(caused)에 대해서는 추론할 수 없지만, 이러한 관행이 낙인을 찍는 효과(stigmatising effects)를 가졌을 가능성이 높다(likely)고 추론했습니다.

 

감독관들의 낙인에 대한 견해 보고를 1인칭 설명(first-person accounts)으로 보완하여, 전공의의 관점(trainee point of view)에서 성과 부진의 낙인을 조사하는 연구는 이 연구를 보완할 것입니다. 감정(Emotions)은 전공의의 교정 경험에서 중요한 역할을 하는 것으로 주목받아 왔으며 (Mills, 2023), 우리 데이터에서도 그 징후(manifestation)를 일부 볼 수 있었지만, 이것이 낙인과 어떻게 관련되는지 조사하는 것은 흥미로울 것입니다.

결론 (Conclusion)

평가 결정을 내리고 전공의를 교정하는 것(remediating trainees)은 모든 보건 전문직 수련 프로그램(health professions training program)의 근본적인 요구사항(fundamental requirements)입니다. 우리는 성과 부진과 관련된 낙인을 찍는 언어와 행동(stigmatising language and actions)이 이러한 과정에 스며들어(permeate), 감독관관리를 방해하고(impeding) 전공의의 고통(trainees’ suffering)을 증가시킬 수 있음을 발견했습니다. 특히, 전공의를 ‘통찰력이 부족하다(lacking insight)’고 라벨링하는 것은 고정관념화(stereotyping)와 그 결과의 극명한 예시(stark example)를 제공했습니다. 우리는 낙인을 반영하거나 강화하는 관행과 구조(practices and structures)를 수정하고, 성과 부진에 의해 방해받는 기저 신념(underlying belief)을 다루기 위한 다각적인 접근(multifaceted approach)을 제안합니다. 그러한 과정은 개인적으로나 집단적으로나 도전적인(challenging) 일이지만, 긍정적인 문화적 변화(positive cultural change)를 향한 길을 제시합니다.

 

 

 

 

Med Teach. 2025 Jun;47(6):1046-1048. doi: 10.1080/0142159X.2024.2382850. Epub 2024 Jul 27.

Transforming remediation for competency-based medical education

 

 

 

서론 (Introduction)

교정교육(remediation)의 필요성은 전 세계 의학 교육자(medical educators)와 교육생(trainees, 학생 및 전공의)들에게 도전 과제(challenges)가 되고 있습니다. 어려움을 겪는 것으로 식별된(identified as struggling) 교육생들은 종종 동료들과 다시 합류할 수 있을 정도의 숙달도(proficiency)를 입증할 때까지 표준적인 ‘정상(normal)’ 교육과정(curriculum)에서 열외되거나 배제(sidelined)됩니다. 혹은, 교육생의 어려움이 무시되다가(ignored) 결국 고위험의 실패(high-stakes failure)와 그에 따른 강제적인 교정교육(mandated remediation)이 뒤따르는 상황이 발생하기도 합니다. 따라서 교정교육에 직면한(faced with) 많은 교육생들이 이를 위협(threat)이자 처벌(penalty)로 경험하는 것은 흔한 일(common)입니다 [1].

 

너무나 자주(All too often), 의학 교육자들은 교정교육을 교육생의 장기적인(in the long run) 학습 역량(capacity for learning)을 구축하는 것에 초점을 맞추기보다, 저조한 성과(poor performance)에 대한 처방(remedy)을 내리는 일회성 과업(episodic task)으로 접근합니다. 이러한 접근 방식은 서로 매우 다른 두 가지 은유(metaphors)의 사용에 반영되어 있습니다.

  • ‘의학적 모형(medical model)’에서는 예후(prognostication)를 가능하게 하고 치료(treatment)를 안내하는 진단(diagnosis)을 내립니다. 또 다른 은유인
  • ‘원예(gardening)’에서는 교정교육 과정을 영양분 있는 토양(nutritious soil), 적절한 햇빛과 물 같은 기본 요소들을 경작함(cultivating)으로써 이루어지는 성공적인 성장(successful growth)으로 정의합니다.

우리는 특히 역량 바탕 의학 교육(competency-based medical education)을 위해 후자의 관점으로 초점을 전환할 것을 옹호(advocate)합니다. 교정교육을 현재 성과가 저조한(underperforming) 학습자에게서 건실한 성장을 경작하는 것(cultivating robust growth)으로 정의하는 것—마치 비옥도(fertility)를 높이기 위해 토양을 개량(remediating soil)하는 것과 유사하게—은 교정교육의 정책과 관행을 학습과 전문성 개발(expertise development)을 배양하는 정상화된 과정(normalized process)으로 변화시킵니다. 시간이 지남에 따라, 이러한 접근 방식은 학습자와 교육자를 더 잘 일치시키고(align), 낙인(stigma)과 수치심(shame)을 줄이며, 교정교육에 대한 체험된 경험(lived experiences)을 의미 있게 재형성할 것입니다. ‘벌칙 구역(penalty box)’성장을 지향하는 변화의 경로(growth-oriented pathways)로 대체함으로써, 모든 교육생을 위한 의학의 기초인 primum non nocere(무해성의 원칙, 해를 끼치지 말라)를 지지하는 새로운 교정교육 문화가 등장할 수 있습니다.

 

비록 교정교육을 완전히 재건하기 위해서는 의학 교육의 이념과 문화(ideology and culture)에 대한 전면적인 정비(overhaul)가 필요할 수 있지만 [2], 우리는 그 변혁(transformation)을 시작하기 위한 세 가지 필수적인 단계(essential steps)를 제안합니다:

  • 학습에서의 실패 과정을 정상화(normalize)하고,
  • 교정교육에 대해 진정으로 긍정적인 함의(genuinely positive connotations)를 의도적으로 구축하며,
  • 교정교육의 연속체(continuum) 전반에 걸쳐 더 높은 수준의 인식(awareness)을 불어넣는 것입니다.

학습에서의 실패를 정상화하기 (Normalize failure in learning)

제도적 문화(institutional cultures)는 변화하기에 느릴 수 있지만, 모든 숙달도 수준(levels of proficiency)에서 생산적 실패(productive failure) [3]와 바람직한 어려움/고군분투(desirable struggle) [4]의 가치를 정상화하고 높이려는 노력은 많은 긍정적인 영향(positive impacts)을 미칠 수 있습니다. 이를 어떻게 달성할까요? 모든 교육생은 위험을 감수하고(taking risks), 틀리기도 하며(being wrong), 예비 의사로서 마주하는 불확실성(uncertainty)에 대해 적극적으로 성찰(actively reflecting)하는 것에 대해 공개적으로 지지받고(openly supported) 박수를 받아야 합니다(applauded). 가장 큰 어려움을 겪는 이들을 포함한 모든 사람을 위한 일상적인 교육 관행(routine educational practice) 속에 교정교육을 매끄럽게 엮어 넣고(seamlessly weaving), 핵심 교수진과 교정교육 전문 교수진(만약 다르다면) 간의 긴밀한 협력(close collaboration)을 유지하는 것은 성공과 실패의 양극화(polarization)를 상당히 뒤집을(upend) 것입니다.

 

교정교육은 역량 개발(competency development)을 위한 세 가지 요소를 통해 정상화될 수 있습니다:

  • 학습‘에 대한’ 평가(assessment of learning)보다 학습‘을 위한’ 평가(assessment for learning)를 진정으로 강조하는 것 [5];
  • 적응적 학습자 기술(adaptive learner skills)을 생산적으로 활용하는 것(leveraging); 그리고
  • 학습자의 취약성(vulnerability)과 정직한 자기 평가(honest self-assessment)를 지원하는 심리적으로 안전한 공간(psychologically safe spaces)을 유지하는 것입니다.
    • 첫째, 학습은 쉽게 접근 가능한(easily accessed) 교정적 학습 지원과 짝을 이루는, 진정으로 형성적이고 성장을 촉진하는 평가(genuinely formative, growth-promoting assessments)의 초석(cornerstone)이 되어야 합니다. 예를 들어, 교육생이 나중에 평가 결과(assessment outcome)로서 받게 되는 공식적인 의뢰 결정(formal referral decision) 대신, 징후가 보일 때(when indicated) 교육생과 교수 평가자(faculty assessor)가 즉시 교정적 지원을 위한 계획을 공동으로 수립(co-create)할 수 있도록 하는 교육과정 구조(curricular structures)가 존재해야 합니다.
    • 둘째, 첫 번째 요소에서 논리적으로 이어지는 것으로, 교육자와 교육생 모두 적응적 학습 기술을 반복적으로 개발하고 다듬는 데(iteratively developing and refining) 능숙해져야(adept) 합니다 [6]. 교육생과 교육자-코치(educator-coaches)는 개별 역량 개발을 지원하는 단계별 개별화 학습(stepwise individualized learning)을 위한 실질적인 목표(practical goals)를 공동으로 수립해야 하며, 필요할 때 이 계획을 뒷받침할 수 있는 교정교육에 즉시 접근할 수 있어야 합니다.
    • 셋째, 교사(teachers)와 교육자(educators)는 모든 수준의 학습을 위한 심리적으로 안전한 공간을 조성하도록 훈련받고 장려되어야 합니다. 이러한 안전한 공간은 교육생들이 ‘무비판 지대(no judgement zone)’에서 적응적 학습에 필수적인 비판적 성찰(critical reflection) 역량을 연마할 수 있는 용기 있는 공간(brave spaces)이 될 수 있으며, 이는 그들의 개인적 진실성(personal integrity)과 성공 동기(motivations to succeed)를 허용합니다. 평생에 걸친 역량 개발을 촉진하기 위해,
      • 모든 교육생개별적으로 맞춤화된 도전(individually tailored challenges)어려움 또는 실패의 위험을 교육 여정(educational journey)의 정상적이고 중요한 구성 요소로 받아들이는 법을 배워야 합니다.
      • 교육자는 모든 역량 수준에서 학습의 바람직한 어려움(desirable difficulties) [4]을 장려하고 지지하며, 필요할 때 교정교육을 엮어 넣기 위해 교육생과 협력하는 학습 문화(learning culture)를 조성하는 데 능숙해져야 합니다.

진정으로 긍정적인 함의 구축하기 (Build genuinely positive connotations)

모든 학습자는 훈련 과정 전반에 걸쳐 다양한 수준과 빈도로 일정 범위의 어려움, 실패, 그리고 성공을 경험합니다 [7]. 교정교육은 흔히 예상된 경로(expected course)에서 부정적으로 일탈하는(negatively deviates) 교육생의 성과에 대해 처방됩니다 [8]. 이에 따라 일련의(a cascade of) 교육생 반응이 흔히 펼쳐지는데,

  • 여기에는 교정교육을 촉발한 평가 결과를 불공정하다며(unfair) 반박하는 것;
  • 교육생이 어려움을 겪고 있다고 식별한 교수진을 틀렸거나(incorrect), 가혹하거나(harsh), 편파적이거나(biased), 무관심하다(uncaring)고 비난하는 것; 그리고
  • 교육생과 교수진 양측 모두 동료들과 정규 교육과정으로부터 거리를 두는 것(distancing)이 포함될 수 있습니다.

실패를 고치는 것(fixing failure)에 초점을 맞춘 교정교육은 예상대로 의사가 되기에 부적합하다(unfit)고 간주될 것에 대한 교육생들의 두려움을 고조시킵니다(escalates). 뒤따르는 부적응적 행동(maladaptive behaviors)절박함(sense of urgency)은 종종, 특히 추가적인 실패의 위험이 가장 큰 사람들에게 있어 의미 있는 교정교육을 약화시킵니다(undermine).

 

이러한 결핍의 관점(deficit lens) 대신, 우리는 과정을 설명하기 위해 의학 용어를 사용하는 것에서 벗어나 ‘무엇이 잘못되었는가(what went wrong)’보다 ‘무엇을 얻을 수 있는가(what can be gained)’를 강조하는 원예 은유(gardening metaphor)를 사용함으로써 교정교육에 진정으로 긍정적인 함의를 불어넣을(instill) 수 있습니다. 토양을 개량하고(amending soil) 잡초를 뽑는 것(weeding)처럼, 교정교육은 개인적 성장(personal growth)을 이끌고 학습 기술 및 전략(learning skills and strategies)을 강화하는 다양한 경험이나 추가적인 관심(added attention)을 나타낼 수 있습니다. 코칭과 긍정 심리학 원칙(positive psychology principles)은 교사와 교육자가 성장을 장려하고 성과를 향상시키기 위한 생산적인 접근법 [9]을 촉진하는 데 활용될 수 있습니다. 어려움을 겪는 교육생을 교정 교육하는 사람들은 모든 역량 수준의 각 학습자의 가치(value)를 공개적으로 지지하는 강점 기반 접근법(strengths-based approaches)피드백 대화(feedback conversations)를 통합함으로써 이러한 변화를 주도할 수 있습니다. 긍정적인 렌즈(positive lens)의 힘을 입증하는 것은 교정교육을 실패로부터의 회복(recover from failure)이 아닌 새로운 방식으로 전진(advance)할 수 있는 기회(opportunity)로 재건할 잠재력을 가지고 있습니다.

인식을 불어넣기 (Infuse awareness)

어려움을 겪는 학습자의 생산적인 성장을 촉진하기(foster) 위해서는, 높은 수준의 인식(awareness)과 이해(understanding)를 가지고 교정교육 노력을 수행해야 합니다. 교정교육은 종종 깊이 있는 경청(deep listening), 교육생과 근본적으로 관계 맺기(radically relating), 그리고 비판적으로 함께 생각하기(critically thinking with)에 의존하는 복잡하고 다면적인 과정(messy, multifaceted process)입니다. 개인의 다양성(diversity), 배경, 그리고 체험된 경험(lived experiences)을 이해하고 가치 있게 여기는 것은 실패를 성장으로 재구성(reframes)하는 교육생과 교육자 간의 동맹(alliance)에 결정적입니다. 특히 과소대표된 배경(underrepresented backgrounds)이나 정체성을 가진 학습자들처럼 시스템적이고 구조적인 편향(systemic and structural biases)을 경험하는 학습자들에게는 개인적 고립(personal isolation)이 발생할 수 있습니다. 어려운 상황에서의 환자 진료와 평행하게(parallel to), 공정하고 포용적인(equitable and inclusive) 결과를 조성하겠다고 약속하면서 학습자의 관점과 경험을 면밀히 경청하고 ‘믿어줌(believing)’으로써 이러한 고립을 뒤집는 것(upending)은 편향 없는 보건 전문직 교육(unbiased health professions education)의 원칙을 지지하는 성공적인 교정교육에 있어 무엇보다 중요합니다(paramount).

 

교정교육에는 성장을 촉진하는 것과 특정 시기에 일부 교육생에게는 성장이 불가능할 수도 있음을 받아들이는 것 사이에 긴장(tension)이 존재합니다. 이러한 긴장과 그것이 크든 작든 부정적인 결과(adverse outcome)를 두려워하는 각 교육생에게 미치는 영향을 인식하는 것은 그들을 지도하고 고통(distress)을 줄이는 데 중요합니다. 학습자의 성과가 기대 이하(below expectations)로 남아 있는 드문 상황에서는, 퇴출(dismissal)이 가장 적절하고 연민 어린(compassionate) 접근 방식일 수 있습니다 [8]. 이때야말로 교정교육과 진로 지도(career guidance)에 대한 성장 촉진 접근법(growth-promoting approach)이 가장 중요할 수 있는데, 이는 어렵고 중대한 결과(consequential outcome)와 관계없이 교육생의 강점과 변화 잠재력(potential for change)을 지지하기 때문입니다.

결론 (Conclusion)

우리는 교정교육을 가장 힘겨운 어려움을 겪는 비교적 소수(comparative few)를 위한 처방을 구하는 것에서, 생산적이고 정상화된 성장 과정의 일부로서 실패를 진정으로 기념하는 것(celebrating failure)으로 재정의(redefine)하는 방법들을 제안합니다. 바람직한 도전(desirable challenges)이 개별 학습자의 필요에 맞춰 일상적으로 조정될(routinely calibrated) 수 있으며, 거의 모든 교육생이 높은 수준의 역량 개발을 달성할 수 있다고 믿을 만한 충분한 이유가 있습니다.

 

이제는 모든 교육생이 어려움을 겪는다는 사실을 인정하고(acknowledge), 교정교육이 모든 교육생을 위한 개별화된 학습(individualized learning)의 필수적인 측면임을 인식해야 할 때입니다. 이러한 관점(lens)을 통해, 어려움을 겪는 교육생들의 경험은 교육생과 그들의 기관 모두에게 자부심의 원천(source of pride)이 될 수 있으며, 종종 단편화된(often-fragmented) 시스템—어려움을 겪는 학습자에게만 초점을 맞춘—을 모든 교육생에게 혜택을 주는 개별화된 학습을 위한 통합된 시스템(unified system)으로 변혁시키는 추동력(impetus)이 될 수 있습니다. 교정교육은 모든 교육생을 위한 학습을 위한 평가(assessment for learning)의 견고한 프로그램 개발에 정보를 제공하는, 매우 영향력 있고 혁신적인 활동으로 초점이 재조정(refocused)될 수 있습니다. 교정교육에 집중하는 교육자와 교사들은 적응적 학습 계획(adaptive learning plans)의 설계, 코칭, 그리고 협력적인 학제간 지원(collaborative interdisciplinary support)을 통해 어떻게 개인의 역량 향상을 가장 잘 보장할 수 있을지 실험할 수 있습니다.

우리는 보건 전문직 교육과정(health professions curricula)이 지속적으로 어려움을 겪는(persistently struggle) 상대적으로 적은 수의 교육생들을 포함하여, 역량 개발의 다양한 궤적(variable trajectories)에 대한 계획을 일상적으로 통합하는 미래를 그립니다(envision). 이를 통해 보건 전문직 교육은 졸업 후 의학 교육(graduate medical education)과 그 이후의 미래 학습을 위한 적응적 기술을 내재화하는(embeds) 진정한 역량 바탕 의학 교육으로 성공적으로 나아갈 수 있을 것입니다.

 

 

 

Med Teach. 2025 Feb;47(2):329-337. doi: 10.1080/0142159X.2024.2337250. Epub 2024 Apr 8.

'We're like Spider-Man; with great power comes great responsibility': Coaches' experiences supporting struggling medical students

 

 

의대생 코치는 스파이더맨? 🕷️ "큰 힘에는 큰 책임이 따른다"

안녕하세요! 오늘은 의과대학 교육 현장에서 학생들을 가장 가까이에서 지켜보는 '코치(Coaches)'들의 이야기를 담은 흥미로운 논문을 소개하려고 해요.

 

의대 공부, 정말 힘들죠. 통계적으로 약 10~15%의 학생들이 의학 교육 과정에서 어려움(Struggle)을 겪는다고 해요. 이때 학생들의 곁에서 멘탈을 잡아주고 성장을 돕는 사람들이 바로 교수님들로 구성된 '코치'입니다.

 

그런데 말이죠, 학생이 힘들 때 과연 코치들의 마음은 어떨까요? 🤔 오늘 소개할 연구는 미국 UCSF와 UVA 의대 코치 15명을 심층 인터뷰해서, 그들이 '어려움을 겪는 학습자(Struggling Learner)'를 지도하며 어떤 경험을 하고 어떻게 성장했는지 분석했습니다.

1. "우리는 스파이더맨 같아요" 🕸️ : 막중한 책임감

연구에 참여한 코치들은 학생이 유급 위기에 처하거나 힘들어할 때, 마치 자기 일처럼 엄청난 개인적 책임감(Personal Responsibility)을 느꼈어요. 코치들은 학생과 장기적인 관계(Longitudinal relationship)를 맺기 때문에, 다른 교수들은 모르는 학생의 속사정을 알게 되는 경우가 많거든요.

한 코치는 이 상황을 이렇게 묘사했습니다.

"우리는 스파이더맨 같아요, 큰 힘에는 큰 책임이 따르죠. (We’re like Spider-Man, with great power comes great responsibility.)"

 

남들이 못 보는 걸 보는 위치에 있는 만큼, 학생을 살려야(?) 한다는 부담감과 사명감을 동시에 느끼는 것이죠.

2. 부모의 마음과 멘붕의 연속 😥 : 정서적 반응

코치들도 사람인지라 학생의 어려움을 처음 마주하면 놀라움(Surprise), 죄책감(Guilt), 실패감(Failure)을 느낀다고 해요. 특히 많은 코치들이 학생을 마치 '내 자식'처럼 느끼는 부모의 본능(Parental instincts)을 경험했다고 합니다.

"마치 당신의 아이들 같아요. 제가 코칭하는 학생들은, 저도 그들에게 보호적이라는 면에서 제 아이들처럼 됩니다. (It’s like your kids. The students I coach, they become like my children in that I’m also protective of them.)"

 

너무 몰입하다 보니 밤늦게 오는 연락을 받아야 할지, 어디까지 개입해야 할지 경계(Boundaries)를 설정하는 데 어려움을 겪기도 했답니다.

3. 위기 속에서 성장하다 🌱 : 코치의 개인적 학습

하지만 이 힘든 과정이 고통으로만 끝나지는 않았습니다. 연구진은 코치들이 이 경험을 통해 '전환 학습(Transformative Learning)'을 경험했다는 사실을 발견했어요. 처음에는 "내가 해결해줘야 해!"라고 생각했던 코치들이 점차 '개별화된 접근(Individualized approach)'의 중요성을 깨닫게 됩니다. "나 때는 안 그랬는데"라는 꼰대(?) 마인드를 버리고, 학생마다 배우는 방식과 속도가 다름을 인정하게 된 거죠. 또한, 자신의 편향(Bias)을 돌아보고 학생을 성적이나 결과가 아닌 '한 명의 인간'으로 이해하게 되었습니다.

"저는 사람들이 스냅샷에서 볼 수 있는 것보다 훨씬 더 많은 존재라는 것을 이해하는 방식에서 성장했습니다. (I’ve grown in my way of understanding that people are much more than what you get to see in a snapshot.)"

💡 결론 및 시사점

이 논문은 학생의 어려움이 코치에게도 큰 도전이자 성장의 기회임을 보여줍니다. 하지만 코치 혼자 끙끙 앓게 두면 안 되겠죠? 🙅‍♂️

연구진은 코치들이 죄책감(Guilt)이나 정서적 고통(Distress)을 덜고 건강하게 학생을 돕기 위해서는 대학 차원의 지원이 필요하다고 강조합니다.

"코칭 프로그램은 코치들이 편향에 대한 비판적 성찰에 참여할 기회와... 공식적인 암묵적 편향 훈련을 제공하는 것을 고려해야 합니다. (Coaching programs should consider providing opportunities for coaches to engage in critical reflection around bias and formal implicit bias training.)"

 

결국, 학생을 잘 돕기 위해서는 코치에게도 '코칭'과 '치유'가 필요하다는 사실! 의학교육에 관심 있는 분들이라면 꼭 한 번 생각해볼 주제인 것 같습니다. 🩺


Introduction (서론)

의과대학생(Medical students)들은 의과대학(medical school) 생활 동안 다양한 개인적 및 직업적 도전(personal and professional challenges)을 경험할 수 있으며, 학습자(learners)의 10~15%가 의학 교육(medical training) 과정에서 어려움을 겪는(struggle) 것으로 추정됩니다 (Steinert 2013; Boileau et al. 2017). 의대생 코치(Medical student coaches)는 개별화된 장기적 관계(individualized longitudinal relationships)를 통해 학생들에게 지원(support)을 제공하고, 공감적 경청(appreciative listening)과 지지를 동반한 자기성찰(supported self-reflection)을 통해 학습자의 발달(learner development)을 도모하는(foster) 교수 교육자(faculty educators)입니다 (Deiorio and Hammoud 2017; Lovell 2018; Landreville et al. 2019; Watling and LaDonna 2019). 코치들은 학습자의 개인적 및 직업적 성장(personal and professional growth)을 지원하며, 의대생들은 코치를 그들의 웰빙(wellbeing)에 필수적인(vital) 존재로 간주합니다 (Deiorio et al. 2017; Wolff et al. 2019; Hauer et al. 2023). 따라서 코치들은 어려움을 겪고 있을지 모르는 학습자(learners who may be struggling)를 식별(identify)하고 지도(guide)하기에 이상적인 위치에 있습니다(ideally situated) (Mills et al. 2021). 그러나 한 프로그램의 코치들은 어려움을 겪는 학습자(struggling learners)와 함께 일하는 것을 부담스럽고(taxing) 정서적으로 괴로운(emotionally distressing) 일이라고 언급했습니다 (Elster et al. 2021). 학습자의 성장을 도모하는(foster learners’ growth) 기법(technique)으로서 코칭(coaching)이 급격히 성장(rapid growth)하고 있음에도 불구하고, 장기적 코치(longitudinal coaches)들이 어려움을 겪는 학습자를 지원하는 경험을 통해 어떻게 배우고(learn) 변화하는지(transform)에 대해서는 거의 주목받지 못했습니다(little attention has been paid). 코치의 관점(coach perspective)을 더 잘 이해하는 것(Better understanding)은 코치들이 시간이 지나도 그들의 역할(roles)을 지속(sustain)하고 그 안에서 성취감(fulfillment)을 찾도록 지원하는 데 있어 매우 중요합니다(crucial).

Practice points (실무적 시사점)

  • 의대생 코치(Medical student coaches)는 다양한 범위의 학업적 및 개인적 어려움(academic and personal struggles)을 겪는 학습자(learners)를 지원한다.
  • 학생의 어려움(Student struggles)은 코치들에게, 특히 그들 자신의 학습자로서의 경험(experiences as learners)과 비교했을 때 종종 놀랍고 혼란스러운(surprising and disorienting) 일이다.
  • 코치들은 학생이 어려움을 겪을 때 정서적 부담(emotional burden)을 느끼며, 학생의 성공(success)에 대해 개인적인 책임감(personally responsible)을 느낀다.
  • 학습자의 어려움(Learner struggles)은 코치의 성장과 변화(coach growth and transformation)를 위한 중요한 기회(important opportunity)가 될 수 있다.

미국(United States)의 대부분의 의과대학(medical schools)은 성취도가 낮은(underperforming) 학생들을 위한 공식적인 보정 교육/재교육 프로그램(formal remediation programs)을 갖추고 있습니다 (Cleland et al. 2013). '어려움을 겪는 학습자(struggling learner)'는 '문제 학습자(problem learner)' 또는 '어려움에 처한 학습자(learner in difficulty)'라고도 불리며, 프로그램의 기대치(program expectations)에 비해 성과가 낮고(underperforms), 지식(knowledge), 기술(skills), 상호작용(interactions)의 격차(gaps)를 개선하고 잠재적인 기저 요인(underlying contributing factors)들을 해결하기 위해 개입(intervention)을 필요로 합니다 (Steinert 2013). 어려움을 겪는 학습자를 지원하는 것은 상당한 교수 시간(significant faculty time), 학습자의 고유한 요구(unique needs)에 대한 이해, 그리고 학습자가 성공하도록 돕는 접근법을 개별화(individualize)하기 위한 특정 기술(specific skills)을 필요로 하는 장기적인 과정(longitudinal process)입니다 (Steinert 2013; Krzyzaniak et al. 2017). 의대생 코치(Medical student coaches)는 학생들의 공식적인 보정 교육(formal remediation)에 참여하거나(participate in) 보정 교육 과정(remediation process) 동안 그들을 지원할 수 있습니다.

  • 교수진(Faculty)은 일반적으로 이 분야에 대해 자신감이 부족하며(lack confidence), 학습자의 어려움(learner’s struggle)을 처음 마주했을 때 종종 실패감(failure)과 죄책감(guilt)이라는 강한 감정을 경험합니다 (Yepes-Rios et al. 2016; Chou et al. 2019).
  • 코치들은 학습자 관계(learner relationships)의 매우 개인화된 특성(highly personalized nature)과 학습자가 잘 성장하도록(thrive) 돕고자 하는 강한 책임감(strong sense of responsibility)으로 인해 특히 고통(distress)을 겪을 위험(risk)이 있을 수 있습니다 (Schermuly 2014).

이러한 초기의 고통(initial distress)을 극복(Overcoming)하는 것은 성공적인 코칭 관계(coaching relationship)를 유지하고 학습자에게 적절하고 개별화된 지원(appropriate, individualized support)을 제공하는 데 중요합니다(critical) (Diller et al. 2020; Gingerich et al. 2020). 코치들은 그들의 접근 방식(approach)을 조정(adapt)하고, 코치 역할(coach role)에 필요한 것이 무엇이며 학습자를 가장 잘 지원하는 방법이 무엇인지 배우면서 기술(skills)을 습득하고, 그들의 노력(efforts)의 효과성(effectiveness)에 대해 성찰(reflect)할 기회를 갖습니다.

 

전환 학습 이론(Transformative learning theory, TLT)은 코치들이 어려움을 겪는 학습자를 지원하는 과정을 어떻게 경험(experience)하는지 탐구하는 데 유용한 렌즈(useful lens)입니다.

  • TLT에 따르면, 성인의 관점(perspectives), 가정(assumptions), 마음의 습관(habits of mind)은 그들이 삶의 경험(life experiences)을 어떻게 해석(interpret)하고, 성찰(reflect on)하며, 반응(respond)하는지를 안내합니다 (Hoggan 2016).
  • 학습(Learning)은 성인이 기존의 이해(understanding) 및 경험(experience)과 상충(conflict)하는 예상치 못한 경험(unexpected experience), 즉 '혼란스러운 딜레마(disorienting dilemma)'—일명 '아하 모먼트(aha moment)'—를 마주할 때 시작됩니다 (Mezirow 1997).
    • 어려움을 겪는 학습자와 함께 일하는 것을 포함할 수 있는 이러한 딜레마(dilemmas)는 종종 불편하며(uncomfortable) 강한 감정(strong emotions)을 유발합니다 (Steinert 2013; Sukhera et al. 2020).
    • 그러한 딜레마에 직면한 개인은 자기성찰(self-reflect)하고, 자신의 가정을 평가(evaluate their assumptions)하며, 변화를 위한 계획(plan for change)을 수립하기 위해 능동적이고 의도적인 선택(active and deliberate choice)을 해야 합니다.
  • 만약 성공한다면, 그들은 새롭거나 수정된 관점(new or modified perspective)을 가정하게 되며 경험을 통해 성장(grow)할 수 있습니다 (the Bellagio Global Health Education Initiative 2019).

코치들은 그들의 역할(role)과 학습자와의 관계(relationship)의 본질상 학생들의 성공에 특히 깊이 관여(invested)하고 있으며, 따라서 어려움을 겪는 학습자를 지원하는 것을 통해 높은 정서적 고통(high emotional distress)을 겪을 수도 있지만 잠재적으로 큰 보상(great reward)을 경험할 수도 있습니다. 전환적 학습 경험(transformative learning experience)의 일부로서 성찰하고 성장하는 교육자(Educators)는 자기효능감(self-efficacy), 기술(skills), 그리고 회복탄력성(resilience)을 구축할 수 있으며, 이는 코치들이 미래의 학생들을 더 잘 지원하도록 준비시킬 수 있습니다 (Cutrer et al. 2017).

 

우리는 코치들이 어려움을 겪는 학습자를 지원하면서 어떻게 배우고(learn) 진화(evolve)하는지를 탐구하기 위해 이 연구를 설계(designed)했습니다. 어려움을 겪는 학습자와 일하는 코치의 경험을 기술하는 것(Describing)은 코치 역할에 대한 이해를 증진(advance understanding)시키고, 교수진이 경험으로부터 배우고 새로운 상황(novel situations)에 접근 방식을 조정(adjust)할 준비가 된 적응력 있는 교육자(adaptive educators)로 어떻게 발전하는지를 이해하는 데 도움이 될 것입니다 (Cutrer et al. 2017; Auerbach et al. 2020). 우리의 연구 결과(findings)는 또한 교수진이 어려움을 겪는 학습자와 일하는 것으로부터 어떻게 배우고 성장할 수 있는지에 대한 더 풍부한 이해(richer understanding)를 제공하고 이 분야에서의 교수 개발(faculty development) 기회를 강조할 수 있습니다.

 

Methods (연구 방법)

Design (연구 설계)

우리는 해석주의 패러다임(interpretivist paradigm) 내에서 질적 연구(qualitative study)를 수행했습니다 (Bunniss and Kelly 2010). 우리는 두 연구 기관(study institutions)의 의대생 코치(medical student coaches)들과 반구조화된 인터뷰(semi-structured interviews)를 사용했으며, 어려움을 겪는 학습자와 일하는 코치들의 경험을 탐구하기 위해 주제 분석(thematic analysis)을 수행했습니다. 미국(United States)의 4년제 의학전문대학원(postgraduate medical schools)인 캘리포니아 대학교 샌프란시스코(University of California, San Francisco, UCSF)와 버지니아 대학교(University of Virginia, UVA) 의과대학의 두 연구 장소(study sites)에 있는 기관생명윤리위원회(institutional review boards, IRBs)는 본 연구를 검토하고 심의 면제(exempt)로 판정했습니다 (각각 IRB #21-34138 및 4862).

Team (연구팀)

연구팀(research team)은 각 연구 장소의 코치(coach) 1명 (MJE, ASP), 코칭 디렉터(coaching directors) 2명 (KEH, ASP), 교육과정 내 코칭 통합에 대한 책임을 맡은 학장(deans) 2명 (MG, KEH), 그리고 연구 보조원(research assistant) 1명 (SC)을 포함했습니다. 4명의 연구자(MJE, ASP, MG, KEH)는 비코칭 역할(non-coaching roles)에서 학습자를 지도(supervising)하고 가르친(teaching) 경험과 전문성(expertise)을 갖춘 임상 교육자(clinician educators)입니다.

Participants and setting (참여자 및 환경)

UCSF와 UVA 의과대학 코칭 프로그램(coaching programs)은 임상 교수 코치(clinical faculty coaches)를 모든 의대생과 짝을 지어주어, 의과대학 기간 내내 장기적인 임상 술기 지도(longitudinal clinical skills instruction)를 제공하고 학생들의 직업적 및 개인적 발달(professional and personal development)을 안내합니다. UCSF 코치들은 격년으로 약 6명의 의대생과 짝을 이루며(코치당 총 12명), UVA 코치들은 매년 약 6명의 의대생과 짝을 이룹니다(코치당 총 24명). 코치들은 자금 지원(전일제 환산[full-time equivalents] 20–30%)과 동료 지원(peer support)을 위해 다른 코치들과의 회의를 포함한 정기적인 교수 개발(faculty development)을 받습니다 (Sheu et al. 2020; Bray et al. 2021; Elster et al. 2021). 두 코칭 프로그램 모두에서, 코치들은 기초적인 임상 술기(foundational clinical skills)를 가르치고, 개별화된 학생 지원(individualized student support)을 제공하며, 강력한 장기적 학생 관계(longitudinal student relationship)를 구축하고, 학생들의 전문직 정체성 형성(professional identity formation)을 안내합니다 (Parsons et al. 2020; Hauer et al. 2023). 코치들은 지도(guidance), 지원(support), 자원(resources)을 제공함으로써, 그리고 때로는 어려움을 겪는 학생들의 기술 발달을 촉진(facilitate skill development)하기 위한 집중적인 코칭(focused coaching)을 통해 보정 교육 노력(remediation efforts)에 기여합니다.

 

성과 향상(performance improvement)을 위한 코칭에 관한 문헌(literature)과 TLT의 렌즈(lens of TLT)를 바탕으로, 우리는 어려움을 겪는 의대생을 지원하는 코치들의 개인적 경험(personal experiences)을 탐구하기 위한 인터뷰 가이드(interview guide)를 제작했습니다 (Mezirow 1997; Sukhera et al. 2020; the Bellagio Global Health Education Initiative 2019). 질문들은 코치들의 반응과 감정(reactions and emotions), 얻은 교훈(lessons learned), 그리고 코치들이 미래에 상황에 어떻게 다르게 접근할지(approach ... differently)를 탐구했습니다 (Supplementary Appendix 1). 연구 책임자(principal investigator, MJE)는 데이터 수집(data collection) 전에 어려움을 겪는 학습자와 일하는 3명의 교수진(코치 2명 포함)과 함께 가이드의 파일럿 테스트(pilot tests)를 수행했습니다; 우리는 자격을 갖춘 코치(eligible coaches)와의 인터뷰 2건을 분석에 포함시켰습니다. 파일럿 테스트 후, 우리는 두 개의 질문 어간(question stems)을 넓혔습니다. 인터뷰가 진행됨에 따라, 우리는 예비 데이터(preliminary data)에 대한 이해를 심화하고 부연 설명을 이끌어내기(elicit elaboration) 위해 몇 가지 추가적인 탐색 질문(probes)을 더했습니다.

 

우리는 2022년 1월부터 6월까지 월간 이메일(monthly e-mails)을 통해 최소 1년의 코칭 경험(coaching experience)이 있는 UCSF와 UVA의 모든 코치(n = 85)에게 참여를 요청했습니다. 우리는 코치들이 학습자의 어려움(learner struggles)을 마주쳤을 가능성을 최대화(maximize the likelihood)하기 위해 경험이 있는 코치들에 집중하기로 결정했습니다. UCSF의 참여자들은 20달러의 가상 기프트 카드 인센티브(incentives)를 받았습니다; UVA 사이트의 경우 인센티브를 위한 자금을 사용할 수 없었습니다. 우리는 연구 초대에 응답하고 참여에 동의한 모든 코치를 인터뷰했습니다.

 

두 저자(MJE, ASP)는 Zoom(San Jose, CA)을 통해 반구조화된 심층 인터뷰(semi-structured, in-depth interviews)를 수행했습니다. 저자들은 참여자의 비밀(participant confidentiality)을 존중하기 위해 자신의 기관 소속 코치는 인터뷰하지 않았습니다. 인터뷰는 Otter.ai(Mountain View, CA)를 사용하여 전사(transcribed)되었으며 분석 전에 익명화(de-identified)되었습니다. 우리는 주제 분석에 대한 이론 기반의 귀납적 접근(theory-informed inductive approach to thematic analysis)을 사용하여 인터뷰 녹취록(transcripts)을 분석했습니다 (Kiger and Varpio 2020; Varpio et al. 2020). 우리는 코딩(coding)을 하면서 인터뷰를 수행했고, TLT 문헌과의 공명(resonance), 범위(range), 복잡성(complexity)을 가지고 코치들의 경험을 기술하기에 충분한 개념적 깊이(conceptual depth)에 도달할 때까지 인터뷰를 계속했습니다 (Nelson 2017; Kiger and Varpio 2020; LaDonna et al. 2021). 두 저자(MJE, SC)는 첫 4건의 인터뷰로부터 코드북(codebook)을 생성했고, 4명의 저자(MJE, ASP, SC, KEH)는 코딩 과정 내내 반복적으로(iteratively) 이를 조정했습니다(adjusted). 4명의 저자(MJE, ASP, SC, KEH)는 독립적으로 녹취록을 코딩(independently coded)했으며, 각 녹취록을 두 저자가 코딩하고 토론(discussion)을 통해 불일치를 해소(reconciling discrepancies)했습니다. 우리는 코딩된 데이터(coded data)를 정리하고 검색하기 위해 Dedoose 질적 연구 소프트웨어(Los Angeles, CA)를 사용했습니다. 모든 저자는 정기적인 팀 회의(regular team meetings)에서 반복적인 토론을 통해 귀납적으로(inductively) 후보 주제(candidate themes)를 식별하기 위해 코딩된 데이터를 검토하고 분석하는 데 참여했습니다. 저자들은 주제(themes)를 논의하고, 대표 인용구(representative quotations)를 식별했으며, 주제들을 최종 결과(final results)로 수정(revised) 및 통합(consolidated)했습니다 (Kiger and Varpio 2020). 우리는 주제를 검토하고 주제 간의 연결(connections)을 심화하기 위해 렌즈(lens)로서 TLT에 대한 이해를 사용했습니다 (Varpio et al. 2020).

 

난수 생성기(random number generator)를 사용하여, 우리는 2023년 3월에 멤버 체킹(member checking) 참여 초대 이메일을 받을 6명의 코치를 선정했습니다 (Birt et al. 2016). 두 저자(MJE, ASP)는 포커스 그룹 형식(focus group format)으로 4명의 코치(2명은 응답하지 않음)와 결과 초안(draft results)을 공유했으며, 결과에 대해 열린 대화(open dialogue)를 나누고 그 주제들이 코치들의 경험과 얼마나 관련이 있고 대표성이 있는지(relevant and representative) 질문했습니다. 포커스 그룹 공유 후 중요한 변경 사항은 없었으며, 참여자들은 우리의 결과에 동의하고 공감(resonated)했습니다.

Reflexivity (성찰성)

우리는 다양한 역할과 관점(diverse roles and perspectives)을 대표하도록 연구팀을 구성했습니다. MJE와 ASP는 코치이고, ASP와 KEH는 코칭 리더십 역할(coaching leadership roles)을 맡고 있으며, SC는 연구 보조원(research associate), KEH와 MEG는 학부 의학 교육 리더십 역할(undergraduate medical education leadership roles)을 맡고 있습니다. 우리는 또한 학습자 보정 교육(learner remediation) 및/또는 어려움을 겪는 학습자 지원에 있어 다양한 역할(varied roles)을 가지고 있습니다. 우리는 이 연구 전반에 걸쳐 성찰적 대화(reflexive conversations)에 참여했습니다. 우리는 우리의 역할이 결과에 대한 이해(understanding of results)에 어떻게 영향을 미칠 수 있는지, 그리고 팀으로서 어떻게 다른 해석(different interpretations)을 설명(account for)할 수 있을지 논의했습니다 (Finlay 2002). 연구팀 회의에서, 우리는 정기적으로 어려움을 겪는 학습자에 대한 우리 자신의 경험과 그것이 데이터 속의 이야기(stories in our data)와 어떻게 비교되는지 논의했으며, 이러한 만남(encounters) 동안 우리가 어떻게 성장하고 변화했는지 성찰했습니다. 우리는 분석 전반에 걸쳐 성찰적 토론과 저널링(journaling)에 참여했습니다 (Ortlipp 2008). 두 명의 코치와 두 명의 교육 리더 연구자들은 어려움을 겪는 학습자와 일해본 경험이 있었으며, 그들이 처음에 어떻게 반응(responded)했고 어떻게 성장, 변화, 또는 경험으로부터 배웠는지 공유했습니다. 연구자들은 다른 연구자들이 반응하고 우리의 연구 결과 해석(interpretations of our findings)에 이의를 제기(challenge)할 수 있도록, 어려움을 겪는 학습자와의 과거 경험과 연구 데이터 내의 이야기에 대한 그들의 감정적 반응(emotional reactions)을 공유했습니다. 데이터 분석(Data analysis) 동안, 우리는 서로 다른 배경을 가진 연구자들로 짝을 지어 검토할 녹취록을 배정했습니다. 마지막으로, 우리는 멤버 체킹(member checking)을 수행하고 다양한 범위의 코칭 경험과 학습자 어려움 유형(learner struggle types)을 포함했는지 확인하기 위해 최종 데이터를 검토했습니다.

 

Results (결과)

우리는 총 85명의 코치 중 15명을 인터뷰했습니다(interviewed): UVA에서 10명, UCSF에서 5명이었습니다. 인터뷰의 평균 길이(average length)는 26분이었습니다(범위: 12~38분). 참여자는 대다수가 여성(majority women)(67%)이었으며 평균 코칭 경력(average coaching experience)은 4.8년(범위: 2~7년)으로, 각 학교의 전체 코치 집단(overall coaching population)과 일치했습니다.

 

인터뷰한 모든 코치들은 한 명 또는 여러 명의 어려움을 겪는 학생(struggling students)을 지원한 개인적 경험(personal experience)을 기술했습니다. 그 어려움들은 다양하고 다면적(diverse and multi-faceted)이었으며 개인적(personal), 직업적(professional), 그리고 임상적 도전(clinical challenges)을 포함했습니다; 몇 가지 예로는 시험 불합격(exam failures), 도전적인 임상 피드백(challenging clinical feedback), 정신 건강 위기(mental health crises), 그리고 전문성 위반(professionalism lapses)을 겪는 학생들을 코칭한 것이 있었습니다. 이러한 어려움들은 종종 코치를 놀라게 했으며(surprised), 많은 코치들이 그 어려움을 초기에 관리(manage)하거나 대응(respond)하기에 준비되지 않았고 훈련받지 않았다고(unprepared and untrained) 느낌을 표현했습니다:

저는 전략이 전혀 없었어요(had zero strategy). 왜냐하면 제가 심각한 [어려움]을 겪는 학생과 실제로 일해본 건 처음이었거든요... 저는 그저 무엇을 해야 할지 전혀 몰랐습니다(no idea what to do). 특별한 전략이 있었다고 생각하지 않아요. 저는 [학생에게] 무슨 말을 해야 할지조차 잘 교육받지 못했다고 느꼈어요(didn’t even feel very educated)... 저는 아무런 준비(preparation)가 되어 있지 않았습니다. (5)

 

코치들은 종종 그들 자신은 어려움을 겪지 않았거나(did not struggle) 학생들과 같은 방식(same way)으로 어려움을 겪지 않았다고 진술했으며, 따라서 왜, 그리고 어떻게 학습자가 어려움을 겪는지, 그리고 코치가 어떻게 반응해야 하는지에 대해 혼란(disorientation)과 고통(distress)을 느꼈습니다. 우리는 어려움을 겪는 학습자를 지원하는 코치의 경험과 관련된 세 가지 주제(themes)를 식별했습니다:

  • 1) 개인적 책임감(Personal Responsibility),
  • 2) 정서적 반응(Emotional Response), 그리고
  • 3) 코치의 개인적 학습(Coach Personal Learning).

주제와 하위 주제(subthemes)는 그림 1(Figure 1)과 아래에 대표 인용구(representative quotations) 및 참여자 식별 번호(#)와 함께 요약되어 있습니다.

 

Figure 1. 두 기관에서 어려움을 겪는 의대생을 지원하는 장기적 코치(longitudinal coaches)들을 대상으로 한 2022년 질적 인터뷰(qualitative interviews)에서 도출된 주제 및 하위 주제의 예시.

Personal responsibility (개인적 책임감)

코치들은 그들 학생의 성공(success)에 대해 개인적으로 책임감(personally responsible)을 느끼고 깊이 관여(highly invested)하고 있다고 기술했습니다. 이러한 감정들은 학생이 어려움을 겪는 시기에 강화(intensified)되었으며, 이는 코치들이 그들의 접근 방식(approach)과 관행(practices)을 성찰(reflect on)하도록 촉구했습니다(prompted). 우리는 두 가지 하위 주제를 식별했습니다: 책무성(Accountability)과 관계 활용하기(Leveraging the Relationship).

Accountability (책무성)

코치들은 학생의 성공에 대한 책무성(accountable), 그들의 성과(performance)에 대한 주인의식(ownership), 그리고 학습 진전(learning progress)에 대한 책임감을 느낀다고 상세히 설명했습니다:

당신은 [학생들의] 성공에 대해 주인의식(ownership)을 느낍니다. 당신은 그들이 성공하기를 원하며(want them to succeed), 당신이 그러한 지원(support)을 제공하기 위해 그곳에 있는 사람이라는 것을 알고 있습니다. 이 사람에게 그저 무작위의 교수진(random faculty member)이 아닌 것이 도움이 됩니다. (7)

 

코치들은 학생들을 지원하고자 하는 강한 열망(strong desire)을 공유했으며, 많은 이들이 장기적 관계(longitudinal relationship)를 통해 잠재적인 학생의 어려움을 감시(surveil)하고 예측(predict)할 수 있는 독특한 위치(unique position)에 있음을 인정했습니다:

코치로서, 우리는 종종 다른 누구보다도 [학생들을] 가장 일관되게(consistently), 혹은 다른 누구보다 더 지속적으로 봅니다. 그렇기 때문에, 우리는 다른 누구도 알아차리지 못하는 [어려움들을] 알아차릴 수 있습니다(notice)... [코치들은] 우리가 다른 누구도 가지지 못한 학생에 대한 시각(view)을 가질 수 있다는 것을 인식해야 합니다. 그리고 그와 함께 어떤 책임(responsibility)이 따릅니다. 우리는 스파이더맨(Spider-Man) 같아요, 큰 힘에는 큰 책임이 따르죠. (8)

 

일부 코치들에게, 이러한 높아진 책무성(heightened accountability)은 학생의 어려움에 대해 알게 되었을 때 깊은 정서적 도전(deep emotional challenge)과 부담(burden)으로 다가왔습니다:

그리고 [코치로서], 당신은 때때로 [학생들의] 짐(burden)을 짊어져야 합니다. 당신은 그들이 짊어지고 있는 짐들을 인지해야(be aware of) 합니다. 그리고 때로는 그것을 바꾸기 위해 당신이 개인적으로 할 수 있는 일이 아무것도 없을 때도 있습니다... 어떻게 그 어려움들이 당신 주위에 있게 하고(let those struggles be around you) 그 안에 머물게 하면서도, 그것들이 당신을 압도(overwhelm)하여 당신이 그저 웅크리고 있게 만들지 않도록 당신의 경계(boundaries)를 유지할 수 있을까요? (5)

 

그러나 많은 코치들은 이러한 강렬한 책임감의 순간(moments of intense responsibility)을 그들의 역할을 성찰하고 적용할(employ) 새로운 전략(new strategies)을 식별하는 데 활용한다고 기술했습니다. 그들은 학생들의 어려움을 더 잘 모니터링(monitor)하기 위해 접근 방식을 조정(adapted)했습니다:

그게 아마 코칭 직업의 가장 힘든 부분 중 하나일 거예요, 알다시피, 관여하고 있다고 느끼는 것(feeling invested)... 저는 [학생을] 돕기 위해 [어려움의] 근본 원인(bottom of)을 파악하는 데 매우 동기부여(motivated)가 되었어요... 그것은 제가 [코칭하는] 방식을 바꾸도록 촉구했습니다(prompted). (4)

 

코치들이 이를 어떻게 구체화(operationalized)했는지 보여주는 두 가지 예시는 학생들과 더 자주 확인(checking in more frequently)하는 것과 각 학생이 소그룹 환경(small group setting)에 참여하도록 확실히 하는 것이었습니다. 일부 코치들은 또한 어려움을 겪는 학생에 대한 책임과 학교 및/또는 교육과정(curriculum)에 대한 책임 사이의 긴장(tension)을 기술했습니다. 예를 들어, 참여자들은 학생의 어려움에 대해 학교와 얼마나 많은 혹은 어떤 정보를 공유(share)해야 하는지에 대한 불확실성(uncertainties)을 기술했습니다.

Leveraging the relationship (관계 활용하기)

코치들은 어려움을 겪는 학생에게 지원을 제공하기 위해 장기적 관계를 안전하고 비판단적인 공간(safe and non-judgmental space)으로 활용(leverage)하는 법을 배웠습니다:

저는... 이 학생과 기초적인 관계(base relationship)를 잘 구축했어요... 우리는 위기(crisis)가 닥쳤을 때 제가 안전한 착륙장(safe landing place)이 될 수 있을 만큼 충분히 좋은 관계였습니다. 그게 정말 중요했어요. 만약 제가 그를 즉시 '고치려(fix)' 했다면 우리는 그만큼 성공적이지 못했을 거라고 생각해요. 저는 그것을 [배운 점으로] 가져갈 것입니다. (1)

 

코치들은 강력한 관계(strong relationship)가 코치나 학생이 그 어려움이 학생을 규정(defined)한다고 느끼는 시나리오를 피하게 해준다고 인식했습니다(perceived). 코치들은 신뢰(trust)를 도모하고 개방적인 의사소통(open communication)을 가능하게 하는 학생들과의 공유된 파트너십(shared partnership)을 느낀다고 기술했습니다:

코칭 역할의 가장 중요한 점 중 하나는... 학생들이 장기적 관계를 맺고 있는 누군가가 있어서, 어려움이 발생했을 때(struggles occur), 그들이 [도전적인] 이야기를 들을 때 그것이 징벌적이거나 판단적(punitive or judgmental)으로 느껴지지 않고, 혹은 인간으로서의 그들 존재와 동떨어진 것(external)으로 느껴지지 않는다는 것입니다. (14)

 

코치들은 이 파트너십을 활용하여 학생과 어려움에 대한 어렵거나 불편한 대화(difficult or uncomfortable conversations)를 헤쳐나가는(navigate) 법을 배웠습니다:

우리는 그들이 와서 취약함(vulnerable)을 드러낼 수 있는 사람이 될 수 있습니다. 그리고 그들은 우리에게 말할 수 있죠. 그들이 겪고 있는 [일들]에 대해 우리에게 이야기한다고 해서 그들에게 어떤 불이익(repercussions)이 있어서는 안 됩니다. (9)

 

장기적 관계는 또한 코치들에게 성과 향상(performance improvement)뿐만 아니라 어려움을 겪는 기간(period of the struggle)과 그 이후에 추가적인 우려사항(additional concerns)을 지켜보기 위해 시간이 지남에 따라 학생들을 관찰(observe)할 기회를 제공했습니다.

Emotional response (정서적 반응)

코치들은 학생이 어려움을 겪을 때 다양한 감정(range of emotions), 그중에서도 가장 두드러지게는 불확실성(uncertainty), 죄책감(guilt), 그리고 개인적 실패(personal failure)의 감정을 인정(endorsed)했습니다. 그들은 또한 만약 학생이 어려움을 직접적으로 그들에게 가져오지 않았거나(did not bring up), 그 학생이 어려움을 겪을 것이라고 예측(predicted)했던 대상이 아니었을 경우 놀라움(surprise)의 감정을 기술했습니다. 코치들은 학습자로서의 그들의 개인적 경험이 종종 학생들의 그것과 다르다는 것을 알아차렸습니다(noticed); 결과적으로(consequently), 학생을 지원하는 것은 대개 새롭고 낯설게(new and unfamiliar) 느껴졌습니다. 우리는 두 가지 하위 주제를 식별했습니다: 부모의 본능 관리하기(Managing Parental Instincts)공유된 이해(Shared Understanding).

Managing parental instincts (부모의 본능 관리하기)

많은 코치들이 학생들, 특히 어려움을 겪는 학생들에게 향하는 강한 부모의 본능(parental instincts)을 헤쳐나가야(work through) 했다고 상세히 설명했습니다. 이러한 부모의 본능은 학습자를 보호(protect)하고 그들의 성공을 보장(ensure)하려는 코치들의 열망을 압축적으로 보여주는(encapsulate) 듯했습니다:

마치 당신의 아이들(kids) 같아요. 제가 코칭하는 학생들은, 저도 그들에게 보호적(protective)이라는 면에서 제 아이들처럼 됩니다. (9)

 

일부 코치들은 학생의 웰빙(wellbeing)에 대한 강한 책임감 때문에 적절한 개인적 및 정서적 경계(appropriate personal and emotional boundaries)를 유지하는 데 도전을 느꼈습니다(felt challenged):

그를 그냥 우리 집에서 재우고 싶어 하는 [나의] 모성적 본능(maternal instinct)과 그를 성인(adult)으로 대우하는 것 사이의 균형을 맞추는 것... 그게 이 특정 사례에서 저에게 가장 힘든 부분 중 하나였습니다. (8)

 

많은 코치들은 그 어려움이 강한 부모의 본능이나 학습자 상황에 대한 유일한 지원자(sole support)로서의 역할에 지나치게 동일시(identify too strongly)하려는 충동(urges)을 관리하기 위해 학습자와의 경계(boundaries)를 고려하도록 촉구했다고 기술했습니다:

저는 휴가(vacation)에서 집으로 돌아오는 길에 [제 학생이] 전화했던 것을 기억해요. 그리고 저는 이런 순간을 가졌죠, '이 경계가 존재해야 하나? 휴가 날에 이 전화를 받아야 하나?' (1)

 

예시로는 야간에 학생들로부터 오는 문자 메시지(text messages)에 응답하지 않는 것과 같은 코치의 휴무(time off)에 관한 경계 설정, 그리고 학생들을 아이들이 아닌 성인 학습자(adult learners)로 인식하려고 노력하는 것과 같은 정서적 경계(emotional boundaries)가 포함되었습니다:

처음에 저는... [학생들의] 많은 문제를 내면화(internalized)했던 것 같아요. 하지만 지금, 세 번째 학생 그룹을 맡으면서, 저는 약간의 거리(distance)를 인식하고 있어요... 그들은 성인 학습자이고, 그들 자신의 삶을 이끌어가고 있으며(leading their own lives), 실제로는 제 아이들이 아닙니다. 저는 그들로부터 어느 정도 거리와 분리(separation)를 두고 있습니다. (2)

 

많은 코치들이 시간이 지남에 따라 경계 설정 기술(boundary-setting skills)을 개발했다고 상세히 설명했습니다; 이러한 노력은 정서적 반응을 성찰(reflect)하고 처리(process)할 시간과 공간을 만들어 주었습니다.

Shared understanding (공유된 이해)

어려움을 헤쳐나가는(navigating) 과정을 통해, 코치들은 학생의 관점(perspectives)과 경험에 대한 공유된 이해(shared understanding)를 얻게 되었다고 기술했습니다. 어려움을 직접 목격한(witnessed struggles firsthand) 코치들은 학생의 시각(viewpoint)에서 어려움을 보는 법을 배웠습니다:

학생들의 가족 구성원이 코로나(COVID)에 걸립니다. 학생들의 가족 구성원이 물질 사용 장애(substance use disorders)를 겪습니다 – [저는] 이 모든 외부적 요인들(external factors)이 학생의 수행 능력(ability to perform)에 무겁게 작용한다는 것(weigh on)을 깨닫고 있습니다. (4)

 

그들은 결과적으로 모든 학습자에 대해 더 큰 공감(empathy)과 친절(kindness)을 키우게 되었다고 인정했습니다(endorsed):

저는 사람들이 스냅샷(snapshot)에서 볼 수 있는 것보다 훨씬 더 많은 존재라는 것을 이해하는 방식에서 성장했습니다 – 의사로서 그리고 세상 속의 사람으로서 기여할 수 있는 그들의 능력은 지식의 축적(fund of knowledge)을 묻거나 술기 역량(procedural competency)을 평가할 때 보이는 것 이상입니다. 그리고 저는 그것이 저를 더 친절한 교육자(kinder educator)로 만들었다고 생각합니다. 제 코칭 학생들뿐만 아니라 앞으로 상호작용할 [모든] 학생들에게도요. (3)

 

코치들은 어려움 밖에서 학생에 대한 더 전인적인 시각(holistic view)을 얻고 학생이 어려움을 겪을 수 있는 다양한 방식에 대한 이해(appreciation)를 얻게 되었다고 기술했습니다:

그게 아마 저에게 가장 큰 차이점일 거예요. 그저 [더 많은] 공감과 친절을 가지고 제가... 이 [학생]이 한 사람으로서 누구인가에 대한 빙산의 일각(tip of the iceberg)을 보고 있다는 것을 인식(recognition)하게 된 것이죠. (11)

 

코치들은 자신들이 종종 어려움을 겪지 않았거나 학생과 같은 방식(same way)으로 겪지 않았다고 언급했으며, 이러한 불일치(discrepancy)는 그 도전을 새롭고 위압적(intimidating)으로 느끼게 만들 수 있었습니다. 그러나 일부 코치들에게 이러한 낯설음(unfamiliarity)은 학습자 관점에 대한 더 많은 탐구(exploration)를 가능하게 했습니다:

교육과정(curriculum)은 제가 의과대학 훈련을 받을 때 겪었던 것과는 상당히 다릅니다. 알다시피 제 기준(barometer)은 제가 같은 경험을 하지 않았기 때문에 맞지 않을(miss a tune) 수도 있습니다. 하지만 그것은 또한 제가 경험을 중심에 두게(center the experience) 해줍니다. 왜냐하면 제가 [학생의] 경험을 더 많이 물어보기 때문이죠. (12)

 

전반적으로, 학생을 지원하는 것을 통해, 코치들은 학생들이 겪을 수 있는 구체적인 어려움(specific struggles)전반적인 학생 경험(overall student experience) 모두에 대한 이해를 발전시켰습니다(evolved).

Coach personal learning (코치의 개인적 학습)

코치들은 어려움을 겪는 학습자와의 경험으로부터 어떻게 개인적 학습(personal learning)을 경험하고, 기술(skills)을 구축하며, 통찰(insights)을 얻었는지 기술했습니다. 그들은 배운 교훈(lessons learned)을 적용하여 코치로서뿐만 아니라 교육자(educators)로서 자신을 개선했습니다. 그들은 학생들이 어려움을 극복(overcome)하도록 돕는 것을 통해 기쁨(joy)과 보상(reward)을 공유했습니다. 코치들은 또한 학생들의 경험을 자신의 경험과 비교하는 것의 한계(limits)를 깨닫게 되었으며, 누가 어려움을 겪을지에 대한 그들 자신의 편향(biases)과 가정(assumptions)에 도전하는 법을 배웠습니다. 우리는 이 영역 내에서 세 가지 하위 주제를 식별했습니다:

  • 시스템 지식 습득하기(Gaining Systems Knowledge),
  • 개별화된 접근법 채택하기(Adopting an Individualized Approach), 그리고
  • 역할에 대한 이해의 진화(Evolving Understanding of the Role).

Gaining systems knowledge (시스템 지식 습득하기)

코치들은 이용 가능한 다양한 자원(resources)으로 어려움을 겪는 학생들을 지원하기 위해 시스템 지식(systems knowledge)을 습득해야 했다고 기술했습니다. 그들은 의과대학 교육과정과 평가 프로그램(assessment program), 학생들을 위한 자원에 접근(access)하는 방법, 그리고 코치로서 조언(advice)과 지원을 위해 누구에게 연락해야 하는지에 대해 배웠습니다:

알다시피, 어떤 일이 처음 발생했을 때, 당신은 시스템을 안다고 생각하지만, 학생들을 위해 존재하는 시스템을 항상 아는 것은 아니라는 것을 알게 됩니다(find out). (8)

 

많은 코치들은 동료 코치(peer coaches)와 기관 리더(institutional leaders) 모두를 사고 파트너(thought partners)로 활용하는 것의 가치와, 학생들과의 힘든 상황에서 이러한 동료들을 참여시키는(engage) 구체적인 전략(specific strategies)을 배웠습니다:

[코치]가 경험하는 일 중에 다른 누구도 경험해보지 못한 일은 거의 없습니다(hardly anything)... 제 생각에 정말 중요한 것은 코치들에게 당신이 스스로 해결해야 한다고 여겨지는 상황은 절대 없다는 것을 알려주는 것입니다. 그것을 이전에 본 적이 있거나, 이 문제로 누구에게 가야 할지 아는 다른 누군가가 항상 밖에 있습니다(always someone else out there). (14)

 

결과적으로, 코치들은 더 큰 교육자 교수진 커뮤니티(larger faculty community of educators)와 더 많이 연결되어 있다(engaged)고 느꼈습니다. 자원과 지원에 대해 배우는 것은 죄책감(guilt)을 줄여주었는데, 이는 그들이 어려움을 겪는 학생을 지원하는 데 책임이 있는 유일한 사람이 아니라는 것을 깨달았기 때문입니다:

저는 제가... 제 자원을 동원해야(mobilize my resources) 한다는 것을 배웠습니다... 그것은 마치 코드(응급 호출)를 부르는 것(calling a code)과 같습니다. 방에 모든 사람을 모으고 나서 사람들을 보내는 편이 낫죠. 그리고 그것은 혼자서 하려고 노력하는 것보다 훨씬 더 좋은 계획입니다. (1)

 

자원에 대한 지식은 코치들이 학생을 전적으로 책임지는(singularly responsible) 사람이 아니라 조정자(coordinators)로서 그들 자신의 역량(capabilities)에 대해 자신감(confidence)을 얻게 했습니다. 일부 코치들은 기관이 제공하는 것(institutional offerings)에 대한 향상된 이해 덕분에 미래의 어려움을 겪는 학습자들을 다루는 데 더 준비되었다(prepared)고 느낀다고 기술했습니다.

Adopting an individualized approach (개별화된 접근법 채택하기)

코치들은 학생들의 요구(needs)를 충족시키기 위해 그들의 코칭 접근 방식을 조정(adapt)하고 개별화(individualize)하는 법을 점진적으로 배웠다고 기술했습니다. 그들은 코칭에서 '천편일률적인 방식은 통하지 않는다(one size does not fit all)'는 이해를 얻었습니다:

모든 사람은 다른 방식으로 배우거나 다른 방식으로 과정을 안내(guides)합니다. 그래서, 매번 할 때마다, 당신은 '그들이 항상 같은 길(same path)을 택하고 싶어 하지 않을 때 내가 그들을 필요한 곳으로 어떻게 데려갈까?'에 대한 도구 상자(toolkit)에 새로운 무언가를 추가하게 됩니다. (7)

 

코치들은 코칭 접근 방식에서 유연함(flexible)을 배우고 학습자의 현재 수준에 맞추는 데(meeting the learner where they are) 집중하는 법을 배웠습니다:

코치로서, 당신은 [학생이] 이해하도록, 그들이 될 수 있는 최고의 사람이 되도록 노력합니다. 하지만, 알다시피, 솔직히 말해서 [당신은] 그들의 현재 수준에 맞춰줍니다(meet them where they are). 그리고 당신은 그저 그들 앞에 모든 도구(tools)와 모든 자원(resources)이 있는지 확인하면 됩니다. (2)

 

코치들은 또한 학생들의 경험을 자신의 것과 비교하는 것의 한계(limits)를 깨달았습니다. 그들은 인종(race)과 성별(gender)과 같은 그들 자신의 정체성(identities)을 성찰해야 할 필요성과, 이것들이 학생에게 제공하는 지원에 어떻게 영향을 미칠 수 있는지 기술했습니다:

백인 여성(white woman)으로서의 저는 아마도 이 과정을 겪는 이 흑인(black person)을 돕기에 가장 적합한 사람은 아니었을 겁니다. 그래서, 죄책감을 느꼈고 또한 준비되지 않았다고(unprepared) 느꼈습니다 – 그저 제가 그를 돕기 위해 필요한 완전한 도구 세트(full toolset)를 가지고 있지 않은 것처럼 느꼈죠. (9)

 

성찰을 통해, 코치들은 그들이 가진 편향(biases), 특히 어떤 학생이 어려움을 겪을지 식별하는 것과 관련된 편향을 인식(recognized)했으며, 이러한 판단(judgements)이 종종 틀렸다는 것을 알게 되었습니다. 예를 들어, 코치들은 학생들의 초기 학업 성취(early academic performance)가 학생이 잘 성장하고 있다는(thriving) 거짓된 감각(false sense)에 어떻게 기여할 수 있는지 깨달았습니다:

우리는 후광 효과(halo effect) 같은 것에 대해 이야기합니다. 저는 그의 점수(scores)와 [상위 학위] 때문에 그가 정말 똑똑한 아이라는 점에 편향(biased)되어 있었던 것 같아요. 저는 그가 그렇게 많이 어려움을 겪을 것이라고는 예상치 못했습니다(didn’t expect). (8)

 

시간이 지나면서, 일부 코치들은 더 개방적이고 개별화된 코칭 접근을 촉진하기 위해 이러한 가정(assumptions)에 이름을 붙이고 도전하는(name and challenge) 법을 배웠습니다.

Evolving understanding of the role (역할에 대한 이해의 진화)

코치들은 어려움을 겪는 학생들과 일함으로써 코치로서의 역할에 대해 더 큰 이해를 얻었습니다. 가장 주목할 만한 점은, 코치들이 코치가 학생들에게 중요하지만 유일한 지원(only supports)은 아니라는 점을 인식함으로써, 그들의 강한 개인적 책임감을 관리하기 위해 자신을 어려움으로부터 충분히 분리(separate)하는 법을 배웠다고 기술한 것입니다:

한 명의 어려움을 겪는 학습자가 당신이 어려움을 겪는 교육자 코치(struggling educator coach)라는 것을 반영(reflection)하는 것은 아닙니다. [당신은] 그것이 당신을 반영한다는 생각에서 일종의 분리(dissociate)를 해야 하며, 이것이 저에게 엄청난 도움이 되었습니다. (15)

 

코치들은 또한 시간이 지남에 따라 기술을 구축하고 어려움을 겪는 학생과 일하는 정서적 부담(emotional burden)을 줄이기 위한 구체적인 전략을 명명(named)했습니다. 여기에는 코칭 관계 초기에 학생들과 명확한 기대치(clear expectations)를 설정하는 것, 어려움이 식별되었을 때 신속하게 개입(intervening quickly)하는 것, 그리고 학생들과 개인적 경계(personal boundaries)를 설정하는 것이 포함되었습니다:

저는 코치로서 너무 많은 것을 공유하는 것(sharing quite so much)을 조금 자제했습니다(pulled back). 취약함(vulnerability)의 모범을 보이는 것이 정말 강력할 수 있다고 생각하지만, 저는 또한 당신이 기억해야 한다고 느껴요, 그것은 당신에 관한 것이 아니라는 걸요(it’s not about you). 정말로 당신에 관한 게 아닙니다. (9)

 

어려움을 겪는 학생을 지원하는 것이 도전적이고 시간이 많이 걸리는(time-consuming) 본질을 가졌음에도 불구하고, 코치들은 그들의 역할에서 보람(reward)과 가치(value)를 느꼈습니다:

저는 그게 힘들다는 걸 배웠어요. 어려움을 겪지 않는 학생들과 함께 가는 것이 훨씬 쉽습니다. 하지만, 장벽(barriers)을 극복해내는 학생들을 돕고, 코칭하고, 함께 일하는 데에는 어떤 만족감(satisfaction)이 있습니다. (8)

 

역할에 대한 진화된 이해(evolved understanding)는 코치들이 그들 책임의 중대한 가치(significant value)를 인식하고 시간이 지남에 따라 정서적 부담을 줄이는 데 도움을 주었습니다.

 

Discussion (고찰)

두 기관의 장기적 코치(longitudinal coaches)에 대한 이 질적 연구(qualitative study)에서, 우리는 코치들이 다양한 범위의 개인적(personal), 학업적(academic), 그리고 임상 수행 능력의 어려움(clinical performance struggles)을 겪는 학생들을 지원한 경험을 탐구했습니다. 코치들은 학생들의 어려움이 놀랍고(surprising) 정서적으로 힘든(emotionally taxing) 일임을 알게 되었습니다. 그들은 학생에 대해 엄청난 개인적 책임감(immense personal responsibility)을 느꼈으며, 때로는 적절한 정서적 경계(emotional boundaries)를 유지하는 것이 도전적(challenging)이라고 보고했습니다. 그러나 경험과 자기성찰(self-reflection)을 통해, 코치들은 어려움을 겪는 학습자(struggling learner)를 지원하는 것이 전환적 사건(transformational event)이 될 수 있음을 밝혔고, 이러한 학습의 구체적인 결과(specific outcomes)를 상세히 설명했습니다. 코치들은 변화된 개인적 행동(changed personal behaviors), 향상된 자신감과 기술(improved confidence and skills), 진화된 정체성(evolved identities), 그들 자신의 역할과 책임에 대한 강화된 이해(strengthened understanding), 그리고 새로운 세계관(new worldviews)을 기술했습니다; 그들은 학습자의 관점(learner point of view)에 대한 이해를 얻었고 그들 자신의 편향(biases)에 직면했습니다 (Taylor 2008; Hoggan 2016).

 

어려움을 겪는 학생들을 지원한 코치들의 기술(descriptions)은 이러한 경험들이 지속적인 영향(lasting impact)을 미친다는 것을 시사했습니다. 이전 연구에서, 의대생 장기적 코치들은 역할 만족도(role satisfaction)를 인정했지만(endorsed) 어려움을 겪는 학습자를 지원하는 것을 고통의 원인(source of distress)으로 식별했습니다 (Elster et al. 2021). 우리 연구의 코치들은 불신(disbelief), 놀라움(surprise), 죄책감(guilt)을 포함한 반응들을 명명(named)했는데, 이는 어려움을 겪는 학습자와 일하는 교육자들에게 흔한 감정들입니다 (Cleland et al. 2013; Hegarty et al. 2018; Warburton and Mahan 2018; Gingerich et al. 2020). 전환 학습(Transformative learning)은 종종 교육자 자신의 관점(perspectives)에 의문을 제기하게 만드는, 놀랍고 초기에는 원하지 않았던 '혼란스러운 딜레마(disorienting dilemmas)'인 사건들에 의해 촉발됩니다(triggered) (Carrington and Selva 2010; Hoggan 2016; Carter et al. 2019). 혼란스러운 딜레마 이후, 교육자들은 비판적 자기성찰(critical self-reflection)과 자기평가(self-evaluation)의 과정을 시작해야 하며, 이는 성공적일 경우 의미 있는 경험적 학습(experiential learning)으로 이어질 수 있습니다 (Kitchenham 2008; Sukhera et al. 2020). 우리의 연구 결과는 어려움을 겪는 학습자를 지원하는 것이 코치의 개인적 학습(personal learning), 성찰(reflection), 그리고 변화(change)를 촉진한다(catalyzes)는 것을 시사합니다.

 

깊고 진보적인 학습(deep, progressive learning)에 참여하는 개인들은 그들의 정체성(identities)을 변화시키고 풍요롭게(transform and enrich) 할 수 있습니다 (Christopher et al. 2001; Illeris 2004; Taylor 2008; Stuckey et al. 2013). 우리 연구의 일부 코치들은 학습자와 적절한 정서적 경계를 유지하는 것의 어려움을 인정했으며, 그들의 코치 책임(coach responsibilities)과 강한 부모의 본능(parental instincts) 사이에서 갈등(conflicted)을 느꼈습니다. 간호학 문헌(nursing literature)에서도, 동료 코치(peer coaches)들은 개인적 책임감과 어려움을 겪는 학습자와의 경계 설정(setting boundaries)에 어려움을 경험했습니다 (Harrison et al. 2022). 통일된 전문직 정체성(unified professional identity)이 부족한 의학 교육자들은 업무 요구(work demands)를 충족시키기 위해 종종 임상의(clinician), 학자(scholar), 또는 부모(parent)와 같은 다른 사회적 정체성(social identities)을 끌어옵니다 (Sabel and Archer 2014). 개인들은 또한 스트레스를 받거나 압도되는(overwhelmed) 시기에 그들의 사회적 정체성과 개인적 지원(personal supports)에 더 많이 의존합니다 (Haslam et al. 2005). 코치들은 교육자로서 단일한 전문직 정체성(singular professional identity)을 형성하는 데 고조된 도전(heightened challenges)을 경험하고 코치 직무(coach job) 자체 내에서 역할의 균형을 맞추는 데 어려움을 겪는 것으로 알려져 있어, 역할 혼란(role confusion)의 위험이 증가할 수 있습니다 (Brooks et al. 2020; Elster et al. 2021). 그러나 우리의 연구 결과는 어려움을 겪는 학습자와의 코치 경험이 궁극적으로 그들 자신의 코치 역할에 대한 변화되고 진화된 이해(changed and evolved understanding)에 어떻게 기여하는지에 대한 새로운 통찰(novel insights)을 제공한다고 믿습니다.

  • 그들은 학습자의 어려움과 자신을 분리(separate)하는 법을 배우고,
  • 코치가 학생들에게 중요한 지원(supports)이 되지만 유일한 지원(only support)은 아니라는 것을 인식한다고 기술했습니다.
  • 그들은 또한 학습자를 위한 장기적 지원(longitudinal support)으로서의 역할 가치를 배웠으며,
  • 이를 활용하여 학습자에게 어려움에 대해 솔직하고 개방적으로(honestly and openly) 다가가고
  • 미래의 학습자 도전(learner challenges)을 모니터링했습니다.

전환 학습(transformative learning)을 경험한 교육자들은 새로운 세계관(new worldviews), 즉 그들이 세상에 존재하는 방식과 그들이 지닌 기대(expectations)에 대한 새롭고 더 포용적인 이해(inclusive understanding)를 구축할 수 있습니다 (Stuckey et al. 2013). 어려움을 겪는 학습자를 지원하는 것을 통해, 코치들은 더 포용적인 견해(inclusive views)를 얻고, 구체적인 학습자 문제(learner issues)에 대한 인식(awareness)을 구축하며, 학습 맥락(learning context) 안팎에서 학습자에 대한 그들 자신의 이해를 넓혔다고 기술했습니다. 코치들은 특히 어떤 학생이 어려움을 겪을지에 대한 그들의 편향(biases)을 인식하고 명명(name)하는 법을 배웠습니다. 편향을 명명하는 것(Naming bias)은 교육자가 인지적 편향(cognitive biases)을 극복하기 위한 중요한 첫걸음이지만, 이러한 변화(transformation)는 비판적 성찰(critical reflection)과 대화(dialogue)를 위한 지속적인 기회(ongoing opportunities)를 통해 지원되어야 합니다 (Sukhera et al. 2018; 2020; Fainstad et al. 2021). 편향 인식 훈련(Bias recognition training)은 기술을 구축하고 교육자들이 우리 연구의 코치들이 자주 마주쳤던 감정인 자기비난(self-blame)을 줄이는 데 도움을 줄 수 있습니다 (Gonzalez et al. 2021). 코칭 프로그램은 코치들이 편향에 대한 비판적 성찰에 참여할 기회와 이 분야에서 그들을 더 잘 지원하기 위한 공식적인 암묵적 편향 훈련(formal implicit bias training)을 제공하는 것을 고려해야 합니다.

 

전반적으로, 우리의 연구 결과는 어려움을 겪는 학습자와 일하는 것과 관련하여 필요한 코치 훈련(coach training)에 대한 지침(guidance)을 제공합니다. 의대생 코치 훈련은 일반적으로 기술 구축(skill building), 의과대학 교육과정(curricula) 및 자원(resources)에 대한 지식, 강화된 피드백 기술(enhanced feedback skills), 그리고 학습자 관계 구축(building learner relationships)에 초점을 맞춥니다 (Armson et al. 2019; Orr and Sonnadara 2019; Tippit et al. 2024). 그러나 우리 연구의 코치들은 어려움을 겪는 학습자를 지원하기 위해 추가적인 기술(additional skills)을 습득할 필요가 있다고 기술했습니다. 우리는 프로그램이 목표 지향적 코치 지원(targeted coach support) 및 교수 개발(faculty development)을 제공해야 할 세 가지 주요 시점(three main time-points)을 식별했습니다: (1) 학습자의 어려움 발생 전(in advance of), (2) 학습자가 어려움을 겪는 동안(during), (3) 어려움 이후(following).

  • 첫 번째 학습자의 어려움을 마주하기 전에, 코치들은 모의 사례 토론(mock case discussion)이나 진행자가 있는 역할극(facilitated role play) 등을 통해 학습자 도전의 유형(types of learner challenges), 이용 가능한 자원, 그리고 어려움이 발생할 것임을 예상하는 방법(how to anticipate)에 대한 훈련을 받아야 합니다. 코치들은 또한 그들이 학생과의 상호작용 및 관계에 가져올 수 있는 가정(assumptions)을 고려하기 위해 암묵적 편향 훈련(implicit bias training)을 받아야 합니다 (Gonzalez et al. 2021). 이러한 초기 교수 개발(early faculty development)은 코치의 자신감(confidence)을 도모하고 우리가 발견한 개인적 책임감과 죄책감(personal responsibility and guilt)을 줄일 수 있습니다 (Orr and Sonnadara 2019; Gonzalez et al. 2021).
  • 두 번째로, 코치들은 학생이 어려움을 겪는 기간(period of a student struggle) 동안 강화된 지원(enhanced support)을 받아야 합니다. 적응력 있는 교육자(Adaptive educators)는 지속적인 자기성찰과 비판적 평가(critical appraisal)에 참여하고 새로운 배움을 그들의 관행(practice)에 적용(adapt and apply)할 수 있어야 합니다 (Cutrer et al. 2017). 우리 연구의 코치들은 학습자가 어려움을 겪는 동안의 비판적 성찰이 성공을 가능하게 하며(enabling of success) 종종 동료 코치 및 리더들과 공유된다고 기술했습니다. 코치들은 일반적으로 동료 지원(peer support)으로부터 혜택을 받는 것으로 알려져 있으며, 우리의 연구 결과는 학생이 어려움을 겪는 시기에 동료 및 리더십 양쪽으로부터 지원을 받을 수 있는 전용 장소(dedicated venue)가 필요함을 드러냅니다 (Taylor and Snyder 2012; Sheu et al. 2020). 이 지원은 코치들이 전환 학습(transformative learning)을 극대화하기 위해 그들의 경험을 분석(analyze), 비판(critique), 사회화(socialize), 그리고 재구성(reframe)할 수 있는 성찰적 내러티브(reflective narration)를 위한 공간을 포함해야 합니다 (Cranton 2003; Liu 2017).
  • 마지막으로, 학생의 어려움 이후에, 코치들은 비판적 성찰을 위한 지속적인 공간과 배운 교훈(lessons learned)을 확인하고 다른 코치들과 공유할 기회를 포함하는 지원을 받아야 합니다. 예를 들어, 학생의 어려움을 헤쳐나간 경험이 있는 코치들은 어려움을 겪는 학습자를 지원하는 것에 대한 코칭 교수 개발의 진행자(facilitators) 역할을 할 수 있습니다.

우리 연구에는 제한점(limitations)이 있습니다. 한 국가의 두 연구 장소(study sites)는 교수 코치 시간(faculty coach time), 관계 구축(relationship-building)에 대한 초점, 학생 접촉 양(amount of student contact)과 관련하여 유사한 의대생 코칭 프로그램을 가지고 있어, 이는 우리 결과에 일관성(consistency)을 가져다줍니다. 따라서, 우리의 연구 결과는 모든 의과대학 코치나 코칭 프로그램, 특히 다른 구조(structures), 교수 기대치(faculty expectations), 또는 학습자 유형(types of learners)을 가진 프로그램에는 전이 가능하지(transferable) 않을 수 있습니다. 이 연구의 두 프로그램 모두 학습자의 성찰과 성장을 촉진하기 위해 널리 채택된 코칭 접근법(widely adopted coaching approaches)을 강조하지만, 우리는 특정 코칭 프로그램 설계가 구체적인 학습 맥락(specific learning context)에 맞춰져야 함(must be tailored)을 인식합니다 (Richardson et al. 2024). 마지막으로, 우리는 코치들의 보고를 확증(corroborate)하기 위해 어려움을 겪는 학생들의 경험을 포착하지 않았습니다.

Conclusions (결론)

이 연구는 어려움을 겪는 의대생을 지원하는 장기적 코치들의 경험(longitudinal coaches’ experiences)과 그들이 식별한 개인적 학습(personal learning)을 탐구합니다. 우리는 도전적(challenging)이기는 하지만, 어려움을 겪는 학습자를 지원하는 것이 중요한 코치 성장과 변화(coach growth and transformation)를 위한 기회로 작용할 수 있음을 제안합니다. 우리 연구의 코치들은 복잡한 감정(complex emotions)을 헤쳐나가고, 새로운 코칭 행동(new coaching behaviors)을 채택하며, 그들의 정체성을 진화(evolve)시키고, 새로운 관점(new perspectives)을 얻는 법을 배웠습니다. 우리의 연구 결과는 코칭 프로그램이 코치들에게 적절한 지원(adequate support)을 제공해야 할 필요성을 강조합니다. 이 지원은 코치들이 고통(distress)과 죄책감의 감정에 대처하고, 암묵적 편향(implicit biases)을 식별하며, 동료 코치 및 리더십과 함께 성찰적 탐구(reflective inquiry)에 참여하고, 학습자의 어려움 이후에 그들의 경험을 성찰하고 공유(reflect upon and share)하도록 돕는 목표 지향적 교수 개발(targeted faculty development)을 포함해야 합니다.

 

 

 

Overreliance on student satisfaction surveys in medical education: a call for reform in evaluation and accreditation practices 

Anthony R Artino, Jr, PhD , H Carrie Chen, MD, PhD , Sally A Santen, MD, PhD , Richard J Simons, MD , Jennifer G Christner, MD , Arianne Teherani, PhD

Academic Medicine, wvaf002, https://doi.org/10.1093/acamed/wvaf002

 

📝 강의 평가, 정말 믿을만할까요? 의과대학 평가 시스템에 대한 도발적인 제안

안녕하세요! 오늘은 의학 교육계에서 아주 뜨거운 감자인 주제, 바로 '학생 만족도 설문조사(Student Satisfaction Surveys)'와 '강의 평가(Student Evaluations of Teaching, SETs)'에 대해 이야기해 보려고 합니다. 의과대학에 계신 분들이라면 공감하실 거예요. 학생들은 쏟아지는 설문조사에 지쳐있고, 교수님들과 행정팀은 그 데이터를 분석하느라 바쁘죠. 우리는 흔히 "교육 수요자인 학생의 목소리가 정답이다"라고 생각합니다. 그런데 최근 발표된 한 학술적 관점(Scholarly Perspective) 논문에서는 이 믿음에 강력한 의문을 제기하고 있습니다.

 

과연 학생들의 '만족도'가 '좋은 교육'을 보장할까요? 함께 살펴보시죠! 👇


1. 설문조사의 늪에 빠진 의대생들 😵‍💫

우선 현실을 짚어볼까요? 의대생들은 재학 기간 동안 엄청난 양의 설문조사를 작성합니다. 연구진이 추산해보니, 학생 한 명이 4년 동안 무려 평균 64개의 설문조사에 참여하고, 여기에 쓰는 시간만 20시간에 달한다고 해요.

 

이러다 보니 '설문조사 피로(Survey Fatigue)'가 올 수밖에 없죠. 학생들은 내용을 대충 읽거나(rush through), 심지어 가상의 강사를 설문조사에 넣었더니 그 사람까지 평가해버리는(mindlessly complete) 웃지 못할 촌극이 빚어지기도 합니다.

2. 만족도가 높으면 정말 잘 가르친 걸까요? (Validity) 🚩

이 논문의 가장 핵심적인 지적은 바로 '타당도(Validity)' 문제입니다. 연구 결과들에 따르면, 강의 평가 점수(SET scores)와 실제 학생의 학습 성과(Learning Outcomes) 사이에는 상관관계가 매우 약하다고 해요. 오히려 학생들은 학점을 잘 주거나 내용이 쉬운 강의에 높은 점수를 주는 경향이 있습니다. 반대로, 학습 효과를 높이는 '바람직한 어려움(Desirable Difficulties)'이 있는 수업은 만족도가 낮게 나오기도 하죠.

 

연구진은 이 부분에 대해 아주 날카로운 지적을 합니다.

"학생들의 학습 인식에 기반하여 수업을 평가하려는 시도가 의도치 않게 열등한(수동적) 교수법을 조장할 수 있습니다."

"Attempts to evaluate instruction based on students’ perceptions of learning could inadvertently promote inferior (passive) pedagogical methods."

 

즉, 학생들이 "잘 배웠다"고 '느끼는 것'과 '실제로 배운 것'은 다를 수 있다는 겁니다. 소위 '스마일 시트(Smile Sheets)'가 되어버린 평가가 교육의 질을 떨어뜨릴 수도 있다는 무서운 경고죠.

3. 편향과 오류의 함정 (Bias & Flaws) ⚖️

더 큰 문제는 설문조사 자체가 가진 '체계적 편향(Systemic Bias)'입니다. 수많은 연구에서 강의 평가는 여성, 유색 인종, 소수자 강사에게 불리하게 작용한다고 입증되었습니다. 심지어 평가를 할 때 쿠키🍪를 주면 점수가 올라간다는 연구 결과도 있죠.

이런 불완전한 도구를 가지고 교수 승진(Faculty Promotion)이나 의학교육 인증(Accreditation) 같은 '고부담 결정(High-stakes Decisions)'을 내려도 되는 걸까요? 연구진은 단호하게 말합니다.

"이러한 평가들의 광범위한 사용이 고부담 결정에 쓰이는 것은 단순히 우려스러운 것을 넘어, 치명적인 결함이 있는 것일 수 있습니다."

"Their widespread use in high-stakes decisions is not just concerning, it may be fatally flawed."

4. 그렇다면 대안은 무엇일까요? (Alternatives) 💡

연구진은 학생 만족도 설문조사를 완전히 없애자고 하지는 않습니다. 하지만 그 비중을 확 줄여야 한다(Curtail)고 주장합니다. 대신 '프로그램적 평가(Programmatic Evaluation)'로 나아가야 한다고 제안해요.

여기에는 다음과 같은 대안들이 포함됩니다:

  • 동료 수업 참관 (Peer Observations of Teaching)
  • 수업 자료 리뷰 (Reviews of Teaching Materials)
  • 소규모 포커스 그룹 (Focus Groups)
  • 학습 중심 척도 (Learning-focused Measures)

그리고 학생 설문조사의 역할에 대해서는 이렇게 재정의합니다.

"학생 만족도 설문조사는 공식적인 교수 효과성 등급을 위한 기회라기보다는 학생 피드백을 위한 기회로 프레임되어야 합니다."

"Student satisfaction surveys should be framed as an opportunity for student feedback, rather than an opportunity for formal ratings of teaching effectiveness."

🔚 마치며: 이제는 바뀔 때가 되었습니다

학생들을 행복하게 만드는 것이 교육의 목표는 아닙니다. 때로는 힘들고 어렵더라도 '심층 학습(Deep Learning)'을 이끌어내는 것이 진짜 교육이겠죠. 우리는 지난 50년간의 연구 결과에 귀를 기울여야 합니다. 낡은 습관처럼 굳어진 설문조사 만능주의에서 벗어나, 조금 더 공정하고 타당한 평가 시스템을 고민해볼 시점입니다.

마지막으로 연구진의 강력한 제언을 인용하며 글을 마칩니다.

"학생 학습 및 경력 성공에 초점을 맞춘 기관들은 교수진의 교수 효과성 척도로서 SET 등급을 폐기하기를 원할 수 있습니다."

"Institutions focused on student learning and career success may want to abandon SET ratings as a measure of faculty’s teaching effectiveness."

 


 

의학 교육(Medical education)에서, 학생 피드백(student feedback)은 교육 프로그램의 질(quality of educational programs)을 평가(evaluating)하는 데 있어 필수적인 요소(essential component)입니다. 여기에는 교수(teaching), 교육과정(curricula), 그리고 전반적인 교육적 경험(overall educational experience)의 질이 포함됩니다. 그 전제(premise)는 간단합니다: 교육 서비스의 일차적인 수혜자(primary recipients)인 학생들은 무엇이 효과적이고(what works) 무엇이 그렇지 않은지(what does not)에 대한 통찰(insights)을 제공할 수 있는 독보적인 위치(uniquely positioned)에 있다는 것입니다. 이러한 논거(rationale)는 강의 평가(student evaluations of teaching, SETs)를 포함한 다양한 학생 만족도 설문조사(student satisfaction surveys)의 광범위한 사용(widespread use)으로 이어졌습니다.

  • 시간이 지남에 따라, 이러한 만족도 설문조사들은 일상적인 과정 및 프로그램 평가(routine course and program evaluations)뿐만 아니라, 교수 승진(faculty promotion, 많은 학구적 환경(academic settings) 전반에 걸쳐)이나 MD 학위로 이어지는 의학 교육 프로그램의 인증(accreditation of medical education programs)과 같은 고부담 영역(high-stakes areas)에서도 중심적인 역할(central role)을 맡게 되었습니다.
  • 예를 들어, 현재 미국의 의과대학을 인증(accredits)하는 의학교육 인증위원회(Liaison Committee on Medical Education, LCME)는 의대생 피드백(medical student feedback)을 강조합니다. LCME는 표준 8.5(Standard 8.5)의 일부로서 다양한 데이터 소스(multiple data sources)를 통한 학습 환경(learning environment) 및 교육과정(curriculum)의 평가를 의무화(mandates)하고 있지만, 학생 피드백 설문조사(student feedback surveys)에 불균형적인 비중(disproportionate emphasis)을 두고 있습니다.

학생 설문조사에 대한 이러한 과도한 의존(overreliance)은 우려스러운 일인데(concerning), 왜냐하면 이러한 (대체로 정량적인) 자기보고식 도구(self-report instruments)들은 경력(careers)과 기관(institutions)을 좌우할 수 있는 결정(decisions)의 무게를 감당하도록 설계된 적이 없기 때문입니다.

 

이 학술적 관점(Scholarly Perspective)에서, 우리는 Ginsburg와 Stroud의 최근 논평(commentary)을 확장하여(expand on), 학생 만족도 설문조사가 목적에 부합해야 한다(fit for purpose)고 주장합니다. 특정 맥락(contexts)에서 일부 목적(some purposes)을 위해 유용할 수는 있지만, 만족도 설문조사는 특히 의과대학 평가(evaluation) 및 인증 과정(accreditation processes)에서 남용되고(overused) 지나치게 의존(overly relied on)되고 있습니다. 게다가, LCME와 같은 곳에서 사용하는 인증 기준(accreditation standards)이 학생 피드백을 통합(integrate)하려는 선의의 노력(well-intentioned efforts)을 반영하고 있음에도 불구하고, 오랫동안 축적된 그리고 더 최근의 증거(evidence)들은 교육학 연구(educational research)의 발전(advances)에 더 잘 부합(align)하도록 평가 관행(evaluation practices)의 진화(evolution)를 요구하고 있습니다. 요약하자면, 학생 만족도 설문조사는 내재된 편향(inherent biases)을 보이며, SETs(강의 평가)의 경우 실제 교수 및 학습 성과(actual teaching and learning outcomes)와의 상관관계가 약하여(weak correlations), 중요한 교육적 결정(important educational decisions)을 내리는 데 있어 빈약한 토대(poor foundation)가 됩니다.

 

의과대학 리더(medical school leaders)이자 연구자(researchers)로서의 우리의 관점(perspectives)에서, 우리는 의학 교육에서 학생 만족도 설문조사의 역할(role)을 재고(reconsider)할 때가 되었다고 믿습니다. 이 주장(claim)을 뒷받침하기 위해, 우리는 의대생 만족도 설문조사 사용의 현재 관행(current practices)에 대한 개요(overview)를 제공하고, 이러한 설문조사들의 타당도 증거(validity evidence)를 간략히 검토(briefly review)하며, 고부담 적용(high-stakes applications)에서의 사용을 논의하고, 대안적 접근법(alternative approaches)에 대한 권고(recommendations)로 결론을 맺습니다. 우리의 목표는 학생 피드백의 중요성(importance)을 깎아내리는 것(diminish)이 아니라, 진화하는 증거(evolving evidence)와 현대의 교육적 우선순위(contemporary educational priorities)를 더 잘 반영하도록 수정(modifications)을 제안하는 것입니다. 추가적인 문헌(literature)을 통합하고 인증 관련 구체적 과제(accreditation-specific challenges)를 다룸으로써, 우리의 관점은 Ginsburg와 Stroud의 통찰(insights)을 보완(complements)하고 확장(extends)하며, 의학 교육의 평가 관행을 개선하기 위한 실행 가능한 권고안(actionable recommendations)을 제공합니다.

학생 만족도 설문조사에 대한 과도한 의존 (Overreliance on student satisfaction surveys)

의과대학과 인증 기관(accrediting agencies)으로부터의 학생 피드백에 대한 끊임없는 요구(constant demand)가 있으며, 이는 이미 스트레스를 받고(under stress) 의학 수련(medical training)의 강도 높은 요구(intense demands)와 씨름하고 있는(grappling with) 의대생들에게 상당한 부담(significant burden)을 지우고 있습니다. 과정 종료(end-of-course) 및 임상 실습 평가 설문조사(clerkship evaluation surveys)에서부터 국가 벤치마킹 설문조사(national benchmarking surveys, 예: 미국 의과대학 협회[AAMC] 입학생 설문조사[Matriculating Student Questionnaire], 2학년 설문조사[Year Two Questionnaire], 졸업 설문조사[Graduation Questionnaire, GQ])에 이르기까지, 의대생들은 자신들의 교육의 거의 모든 측면(almost every aspect)을 평가하도록 요청받습니다. 우리는 우리 6개 의과대학의 4년 과정 동안 완료된 학생 만족도 설문조사의 총수를 추산(estimated)해 보았는데, 학생들은 재정 지원(financial aid)이나 학생처(student affairs)와 같은 부서의 설문조사를 포함하지 않고도, 의과대학 재학 중 평균 64개의 설문조사—거의 20시간 분량(nearly 20 hours’ worth)—에 참여하는 것으로 나타났습니다. 뉴질랜드 의대생들을 대상으로 한 최근 연구(recent study)에서, 두 코호트(cohorts)는 단일 학년도(one academic year alone)에 각각 42개와 34개의 설문조사 평가 요청(survey evaluation requests)을 받았다고 보고했습니다. 이러한 유형의 설문조사 남용(survey overuse)은 피드백이 가치 절하되는(devalued) 문화를 조장할 위험(risks fostering a culture)이 있습니다. 만약 모든 학생 경험(every student experience)이 평가 대상이 된다면, 개별 평가(individual evaluation)의 중요성은 희석되고(diluted), 학생과 교수진 모두 이러한 설문조사를 개선을 위한 의미 있는 도구(meaningful tools for improvement)가 아닌 관료적 장애물(bureaucratic hurdles)로 여기기 시작하는 상황으로 이어지게 됩니다.

 

학생 만족도 설문조사의 엄청난 양(sheer volume)은 광범위한 설문조사 피로(survey fatigue)로 이어졌습니다. 이러한 피로는 결과적으로 전체 응답률(overall response rates)뿐만 아니라 제공된 응답의 질(quality of the responses)을 떨어뜨릴(diminish) 수 있습니다.

  • 학생들은 평가를 서둘러 끝내거나(rush through), 피상적인 피드백(superficial feedback)을 주거나, 항목을 아예 건너뛸(skip items altogether) 수 있습니다.
  • 그 최종 결과(end result)는 종종 불완전하고(incomplete), 일관성이 없거나(inconsistent), 진정한 학생 정서(true student sentiment)를 대표하지 못하는(unrepresentative) 데이터가 되어, 가치 있고 타당한(valuable and valid) 학생 피드백을 수집하려는 의도(intentions)를 약화시킵니다(undermining).

설문조사 완료 관행(survey completion practices)에 대한 독특한 연구에서, Uijtdehaage와 O’Neal은 2개의 임상 전 과정(preclinical courses)에 가상의 강사(fictitious lecturers)를 의도적으로 포함시켰는데, 대부분의 학생들이 이 가짜 강사들을 평가했다는 사실을 발견했습니다. 저자들은 “많은 의대생들이 그들이 누구를 평가하고 있는지에 대한 주의 깊은 고려(careful consideration) 없이, 그리고 그 교수 구성원이 어떻게 수행했는지에 대해서는 더더욱 고려하지 않고, 아무 생각 없이(mindlessly) SETs를 작성한다고 결론지었습니다.

 

학생 설문조사에서 수집된 방대한 데이터(reams of data)는 의학 교육을 피드백이 어디에나 존재하지만(omnipresent) 종종 놓치거나 무시되는(missed or ignored) 환경으로 변화시켰습니다. 끝없는 설문조사 주기(endless survey cycles)는 적절히 분석되거나(adequately analyzed), 충분히 고려되거나(fully considered), 적절하게 조치되지(appropriately acted on) 않는 데이터를 점점 더 많이 생성합니다. 우리 자신의 기관 내에서, 각 평가 부서(offices of evaluation)는 학생 만족도 설문조사를 시행(administering)하고 분석하는 데 매년 수백 시간을 소비하지만, 이러한 결과는 교육과정 회의(curriculum meetings) 중 교수진과 행정가들에 의해 종종 피상적인 방식(cursory manner)으로만 제시되고 논의됩니다. 이러한 데이터가 더 자세히 검토될 때, 종종 더 많은 질문(more questions)으로 이어져 설문조사를 통한 추가적인 데이터 수집(additional data collection)을 촉발합니다. 궁극적으로, 방대한 양(vast amounts)의 학생 설문조사 데이터를 수집하는 것은, 일부는 비건설적인(unconstructive) 학생 피드백의 바다(sea of student feedback) 속에서 가장 중요한 문제(most critical issues)를 가려버릴(obscuring) 위험이 있습니다.

SETs에 대한 약한 타당도 증거 (Weak validity evidence for SETs)

학생 만족도 설문조사에 대한 중대한 비판(significant criticism)은 그들의 정량적 점수(quantitative scores)가 타당도(validity)가 결여되어 있다는 것입니다. 특히, 강의 효과성(teaching effectiveness)을 측정하기 위해 설계된 특정 유형의 만족도 설문조사인 SETs는 타당도 문제(validity problems)에 특히 취약합니다(vulnerable). 수십 건의 연구(dozens of studies)에서 SET 점수가 학생 학습 성과(student learning outcomes)와 상관관계가 약하거나(correlate weakly), 전혀 없다(if at all)는 것을 발견했습니다. 어떤 경우에는, 더 높은 SET 점수가 학생들이 더 적은 노력(less effort)으로 더 좋은 학점(better grades)을 받는 덜 엄격한 과정(less rigorous courses)과 연관되어 있습니다. 사실상(in effect), 학생들은 쉬운 과정(easy courses)과 관대하게 채점하는(grade leniently) 교사에게 더 높은 SET 점수로 보상(reward)할 수 있으며, 따라서 열등한 교수 관행(inferior teaching practices)과 학점 인플레이션(grade inflation)을 장려하게 되는데, 이는 임상 실습 채점(clerkship grading)에서 심각한 문제로 확인된 바 있습니다. 이러한 발견은 강의(그리고 궁극적으로 학습) 효과성을 측정하도록 의도된 SETs가 진정한 교육적 질(true educational quality)보다는 학생 만족도(student satisfaction, 즉 스마일 시트[smile sheets])를 더 반영할 가능성(likely more reflective)이 높음을 시사합니다. 그러나, 쉬운 과정에 대한 만족(satisfaction)이 훌륭한 수업(good instruction)과 같은 것은 아닙니다. 마찬가지로, 도전적인 과정(challenging course)에 대한 불만족(dissatisfaction)이 형편없는 수업(poor instruction)과 같은 것은 아닙니다. 사실, 고품질의 수업(high-quality instruction)은 종종 소위 바람직한 어려움(desirable difficulties)을 포함하는데, 이는 SET 점수를 낮출 수 있습니다. 예를 들어, Deslauriers와 동료들은 능동적 학습 환경(active learning environments)의 학생들이 수동적 강의 환경(passive lecture settings)의 학생들보다 더 많이 배웠지만, 수업(instruction)은 더 열등하다고 평가(rated as inferior)했음을 발견했습니다. 실제 학습(actual learning)과 인지된 학습(perceived learning) 사이의 이러한 불일치(mismatch)는 “학생들의 학습 인식(perceptions of learning)에 기반하여 수업을 평가하려는 시도가 의도치 않게(inadvertently) 열등한(수동적) 교수법(inferior [passive] pedagogical methods)을 조장할 수 있음”을 시사합니다.

 

Deslauriers와 동료들이 기술한 효과—학습에 대한 학생 만족도가 학습의 착각(illusion of learning)에 지나지 않을 수 있다는 생각—는 새로운 개념이 아닙니다. 1973년에, Naftulin 등은 카리스마 있지만 실속 없는 강의(charismatic yet nonsubstantive teaching)가 학생들을 만족스럽게 느끼게 하고(feel satisfied), 심지어 무의미한 내용(meaningless content)이 제시되었을 때도 배웠다고 믿게(believe they had learned) 만들 수 있다는 가설을 검증했습니다. 실제로, 그 연구 결과(findings)는 카리스마 있게 전달된 터무니없는 강의(nonsensical lectures)가 높은 만족도로 이어질 수 있음을 입증했으며, 이는 SETs가 본질(substance)보다는 스타일(style)을 더 반영할 수 있음을 강조합니다(underscoring). 저자들은 50년도 더 전에, 교수 및 학습 효과성(teaching and learning effectiveness)은 단순한 학생 만족도(mere student satisfaction)를 넘어서 평가되어야 한다고 결론지었습니다.

이러한 우려(concerns) 외에도, SETs는 의과대학 평가(medical school evaluation)에 특히 부적합할(particularly unsuited) 수 있습니다.

  • SETs는 독특한 커리큘럼 구조(unique curriculum structures, 예: 다중 강사 코스[multi-instructor courses], 팀 티칭[team teaching], 통합 교육과정[integrated curricula], 임상적 초점[clinical focus])를 가진 의과대학이 아니라, 교실 기반의(classroom-based) 고등 교육 목적(higher-education purposes)을 위해 처음 설계되었습니다.
  • 게다가, 설문조사의 익명성(survey anonymity)은 솔직한 피드백(honest feedback)을 장려하기 위한 것이지만, SETs와 함께 사용될 때, 특히 학생들이 자신의 성적(performance)이나 학점(grade)에 불만족할 때, 비건설적이고(unconstructive), 상처를 주며(hurtful), 심지어 보복적인 응답(vindictive responses)을 조장할 수도 있습니다.
  • 마지막으로, 의과대학 설문조사의 응답률(response rates)은 종종 상대적으로 낮아(< 70%), 전반적인 학생 정서를 포착하기보다는 가장 목소리 큰 학생들(most vocal students)의 견해(views)만을 반영할 수 있는 SET 점수의 대표성(representativeness)을 약화시킵니다.

SET 점수의 약한 타당도(weak validity)는 불편한 진실(uncomfortable truth)을 제기합니다: 이러한 평가 중 다수는 우리가 측정하고 있다고 생각하는 것을 측정하고 있지 않을 가능성이 높습니다(likely not measuring what we think they are measuring). 또한, 만약 SET 점수가 교수 및 학습 효과성의 타당한 지표(valid indicators)가 아니라면, 고부담 결정(high-stakes decisions)에서의 광범위한 사용은 단순히 우려스러운 것을 넘어, 치명적인 결함이 있는 것(fatally flawed)일 수 있습니다. 이러한 접근 방식은 인기(popularity)가 의도치 않게 교육적 엄격함(educational rigor)을 가리고(overshadow), 자원이 잘못 배분되며(resources may be misallocated), 심층 학습(deep learning)보다 학생 만족도가 우선시될(prioritized) 수 있는 시스템을 조장할 위험이 있습니다.

학생 만족도 설문조사의 조작, 설계 결함, 그리고 체계적 편향 (Manipulation, design flaws, and systemic bias in student satisfaction surveys)

약한 타당도 증거(weak validity evidence) 외에도, 일반적인 학생 만족도 설문조사(student satisfaction surveys), 특히 SETs(강의 평가)는 조작(manipulation)과 결함 있는 구성(flawed construction)에 취약합니다(vulnerable).

  • 설문조사 설계자(Survey designers)는, 의도적이든 의도적이지 않든(intentionally or unintentionally), 응답자(respondents)를 특정 답변(certain answers)으로 유도하는(push) 방식으로 질문과 응답 옵션(response options)을 구조화할 수 있습니다. 예를 들어, 모호한 진술(vague statement)에 동의하는지 학생들에게 묻는 것은 묵종 응답 편향(acquiescence response bias), 즉 내용(content)과 관계없이 진술된 어떤 주장이든 지지하는(endorse) 경향을 초래할 수 있습니다.
  • 이러한 관행(practices)은 궁극적으로 실질적인 의미(little practical meaning)가 거의 없는 부풀려진 동의 점수(inflated agreement scores)를 낳을 수 있습니다.
  • 또한, 설문조사가 시행되는 맥락(context)이 결과에 상당한 영향(significantly influence)을 미칠 수 있습니다. 평가 중에 쿠키를 제공하는 것과 같은 맥락적 요인(contextual factors)은 인위적으로 만족도 점수를 높일 수 있습니다(artificially boost).
  • 마지막으로, 여러 최상위권 의학 교육 저널(top-tier medical education journals)에 발표된 설문조사 도구(survey instruments)를 검토한 연구에서, Artino와 동료들은 95%가 설문조사 설계(survey design)에 있어 경험적으로 근거한 모범 사례(empirically grounded best practices)를 하나 이상 위반(violations)했음을 발견했습니다.

주목할 점은, 이 연구에서 확인된 결함(flaws)들이 출판된 설문조사(published surveys)에서 나온 것이라는 점인데, 이러한 설문조사들은 일반적으로 리뷰어와 편집자들에 의해 상당한 정밀 조사(substantial scrutiny)를 거치며, 의도된 용도(intended use)에 대한 타당도 증거와 함께 다양하게 출판됩니다. 의과대학 직원, 행정가, 또는 개별 교사(individual teachers)가 만든 설문조사는 품질이 훨씬 더 낮을 가능성(likely to be of even lower quality)이 높습니다. 이러한 문제들은 중요한 질문(critical questions)을 제기합니다: 의과대학에서 수집한 피드백 중 얼마나 많은 부분이 학생들의 교육적 경험(educational experiences)을 진정으로 반영하며, 얼마나 많은 부분이 결함 있는 설문조사 설계(flawed survey design)나 기타 외부 요인(extraneous factors)에서 기인하는가?

 

아마도 훨씬 더 문제가 되는 것(perhaps even more troubling)은 학생 만족도 점수에서의 체계적 편향(systemic bias)에 대한 증거입니다. 경험적 문헌(empirical literature)은 수업의 질(instructional quality)이나 교수 효과성(teaching effectiveness)과 관련이 없는 구성개념 무관 요인(construct-irrelevant factors)이 만족도 점수에 영향을 줄 수 있음을 일관되게 발견해 왔습니다.

  • 특히, 수많은 연구(numerous studies)가 만족도 설문조사가 여성, 유색 인종(people of color), 그리고 기타 소외된 집단(other marginalized groups)에 대해 편향되어 있음(biased against)을 입증했습니다.
    • 예를 들어, 여성 강사(female instructors)는 교수 수행(teaching performance)이 동일할 때조차 남성 동료보다 종종 더 낮은 평가(lower ratings)를 받습니다.
    • 마찬가지로, 인종적 또는 민족적 소수자(racial or ethnic minorities)에 속하는 강사들은, 특히 자신의 배경(background)을 공유하지 않는 학생들로부터 부정적인 평가(negative evaluations)를 받을 가능성이 더 높습니다.

이러한 편향은 개별 교수진(individual faculty members)에게 불이익(disadvantage)을 줄 뿐만 아니라 학문 시스템(academic system) 내의 더 광범위한 불평등(broader inequities)을 영속화(perpetuate)합니다. 종합해보면, 이러한 편향들은 수업 평가(evaluating instruction)를 위한 학생 만족도 점수의 타당도를 더욱 약화시키며(undermine), 교수 승진(faculty promotion) 및 인증(accreditation)과 같은 중요한 결정의 유일한(또는 심지어 일차적인) 근거(sole or even the primary basis)로서의 부적절성(inadequacy)을 강조합니다.

승진 및 인증을 위해 만족도 설문조사에 의존하는 것의 과제 (Challenges in relying on satisfaction surveys for promotion and accreditation)

위에서 언급한 우려들을 고려할 때(Given the concerns noted above), 교수 승진 및 의과대학 인증 결정(medical school accreditation decisions)에 학생 만족도 설문조사 결과를 사용하는 것은 우려스럽습니다. 그러한 사용은 이 설문조사들이 교수 질(teaching quality)과 교육 효과성(educational effectiveness)을 포함하여 그들이 측정한다고 주장하는 것(what they purport to measure)을 충실히 측정한다고 가정합니다. 그러나, 논의된 바와 같이, 대부분의 학생 만족도 설문조사는 교수 및 학습과 무관한 요인들에 의해 영향을 받는 심각하게 결함 있는 도구(deeply flawed instruments)입니다. 교수 경력(faculty careers)과 기관 인증(institutional accreditation)에 대한 중요한 결정을 내리기 위해 결함 있는 데이터(flawed data)에 의존하는 것은 이러한 평가가 기여해야 할 바로 그 목표들(the very goals)을 약화시킵니다.

 

예를 들어, 인증 자체 평가(accreditation self-study) 과정에서, LCME는 AAMC 졸업 설문조사(GQ)독립 학생 분석(Independent Student Analysis, ISA)을 포함하여 의대생들이 완료한 다수의 자기보고식 설문조사(self-report surveys) 데이터에 의존합니다.

  • GQ는 교수 질, 전공의 과정 준비(readiness for residency), 학생 서비스(student services), 그리고 모욕(humiliation)이나 괴롭힘(harassment)과 같은 부정적 행동 경험 등 많은 주제와 관련된 275개 이상의 항목을 포함하는 설문조사입니다.
  • ISA 도구는 의대생들이 인증 기간 동안 개발, 배포 및 분석하는 50~100개 이상의 항목으로 구성된 설문조사입니다. 이는 학교의 의학 교육 프로그램, 학습 환경, 자원(resources) 및 행정(administration)의 질을 평가하도록 설계되었습니다.
  • LCME가 최근 만족도에서 벗어나도록(move away from satisfaction) ISA 응답 척도(response scale)를 수정했음에도 불구하고, GQ와 ISA 도구 모두 사실상(in effect) 학생 만족도 설문조사입니다.

그럼에도 불구하고, LCME 조사팀(Survey Team)은 GQ와 ISA 결과에 상당한 비중(considerable weight)을 둡니다. 예를 들어, 비록 LCME가 학생 피드백 점수에 대해 특정 절단점(specific cut points)을 사용하지는 않지만, 실제로는(in practice), 학교들은 인증 기관의 강화된 정밀 조사(heightened scrutiny)를 피하기 위해 비현실적으로 높은 등급(unrealistically high ratings)을 달성해야 한다는 압박감(pressure)을 종종 느낍니다. 게다가, 많은 의과대학이 학생 만족도 점수를 프로그램 평가 노력의 핵심 구성 요소(key components)로 사용하며, 이러한 설문조사의 결과(outcomes)는 인증 중 LCME에 의해 면밀히 검토됩니다(closely examined).

 

학생 만족도 설문조사에 대한 과도한 의존(overreliance)은 엄격한 교육(rigorous education)보다 학생들을 행복하게 유지하는 것(keeping students happy)이 더 중요하다는 잘못된 메시지(wrong message)를 보낼 수 있습니다.

  • 이것은 교수진과 행정가들이 예를 들어 학점을 부풀리거나(inflating grades), 도전적인 내용을 단순화하거나(simplifying challenging content), 학생들의 교육에 해로운(detrimental) 방식으로 학생 선호(student preferences)에 영합함으로써 심층 학습(deeper learning)보다 학생 만족도를 우선시하도록 장려(incentivize)할 수 있습니다.
  • 학생 만족도에 대한 지나친 강조(overemphasis)는 또한 의문의 여지가 있는 기관의 행동(questionable institutional behaviors)으로 이어질 수 있습니다.
  • 최근 LCME 현장 방문(site visit)을 준비하면서, 우리 기관 중 한 곳의 교육과정 리더들은 수업이나 평가(assessment)를 개선함으로써가 아니라 무료 음식(free food)을 제공하거나 학생들에게 인증 위험(accreditation risks)에 대해 경고함으로써 ISA 점수를 높이는 방법을 논의하는 데 많은 시간을 보냈습니다.

이러한 역효과를 낳는 행동들(counterproductive behaviors)은 굿하트의 법칙(Goodhart’s Law)을 보여줍니다: 만족도 점수와 같은 척도(measure)가 목표(target)가 되면, 그것은 가치를 잃고(loses its value) 더 이상 타당하지 않게 됩니다(ceases to be valid).

더 나은 접근을 향하여: 학생 만족도 설문조사의 대안 (Toward a better approach: alternatives to student satisfaction surveys)

의학 교육 커뮤니티는 많은 학생 만족도 설문조사가 보존할 가치가 없을 수도 있다(may not be worth preserving)는 불편한 현실(uncomfortable reality)을 직시해야 합니다. 잠재적으로 결함이 있고 편향된 설문조사 도구에 의존하는 대신, 그 사용을 상당히 줄인다면(significantly reduce their use) 어떨까요? 그 대신, 우리는 과도한 부담을 지닌 학생들(overburdened students)의 편향되고 신뢰할 수 없는 피드백에 의존하지 않는, 교수 효과성 및 학습 성과의 다중 소스 척도(multisource measures of teaching effectiveness and learning outcomes)에 초점을 맞출 수 있습니다. 누군가에게는 이것이 급진적인 아이디어(radical idea)처럼 보일 수 있지만, 우리가 증거에 입각한 관행(evidence-informed practices)을 사용하여 의학 교육을 개선하고 학생들을 21세기 임상 진료(clinical practice)에 대비시키는 데 진심이라면 고려해야 할 아이디어입니다. 게다가, 학생 만족도 설문조사의 사용을 상당히 줄이자는 제안은 기존 연구(established studies)와 더 최근 연구들로부터의 강력한 뒷받침(robust backing)을 받으며 경험적 증거에 의해 강력히 지지됩니다(strongly supported). 예를 들어, 수행된 학생 만족도 데이터에 대한 가장 엄격한 메타 분석(most rigorous meta-analyses) 중 하나의 결과는 “학생 학습 및 경력 성공(career success)에 초점을 맞춘 기관들은 교수진의 교수 효과성 척도로서 SET 등급을 폐기(abandon)하기를 원할 수 있다”고 결론지었습니다.

 

학생 만족도 설문조사가 상당한 한계(significant limitations)를 가지고 있지만, 잘 구성된 설문조사(well-constructed surveys)는 자원에 대한 학생 접근성(student access to resources), 일반적인 웰빙(general well-being), 그리고 부당 대우(mistreatment) 경험과 같은 영역에 대한 통찰을 여전히 제공할 수 있습니다. 이러한 경우, 학생 피드백은 기관이 비학문적 우려(nonacademic concerns)를 해결하는 데 도움을 줄 수 있습니다. 그러나, 교수 질(teaching quality)과 기관 효과성(institutional effectiveness)에 대한 고부담 결정을 내리는 일에 있어서는, 만족도 설문조사의 한계로 인해 불충분합니다(insufficient). 따라서, 우리의 주된 주장(primary argument)은 학생 만족도 설문조사가 남용되고 지나치게 의존되고 있으며, 특히 교수와 학습을 평가하도록 설계된 것들(즉, SETs)의 경우 의과대학에서의 사용은 축소되어야 한다(curtailed)는 것입니다. 사용될 때, 학생 만족도 설문조사는 “공식적인 교수 효과성 등급(formal ratings)을 위한 기회라기보다는 학생 피드백을 위한 기회(opportunity for student feedback)로 프레임(framed)되어야 합니다.” 그렇다 하더라도, 이 피드백은 수십 년간의 경험적 연구에서 얻은 지식을 반영하는 더 넓고, 더 포괄적인 평가 프레임워크(broader, more comprehensive evaluation framework)의 한 부분이 되어야 합니다. 목표는 포괄적인 평가 프레임워크, 즉 Ginsburg와 Stroud가 “교수진 교수 효과성에 대한 프로그램적 평가(programmatic evaluation of faculty teaching effectiveness)”라고 부른 것으로, 이는 다양하고 증거에 입각한 접근법(diverse, evidence-informed approaches)을 통합하고 과로한 의대생들의 만족도 점수에 대한 의존을 최소화(minimizes reliance)하는 것입니다.

 

우리는 대부분의 의과대학이 도달할 수 있는(within reach) 몇 가지 초기 단계(initial steps)를 제안합니다.

  • 첫째, 다양한 방법을 통해 수집된 다중 소스 데이터(multiple sources of data)를 통합(incorporate)하고 삼각 검증(triangulate)하십시오.
    • 여기에는 동료 수업 참관(peer observations of teaching), 수업 자료 검토(reviews of teaching materials), 포커스 그룹(focus groups) 및 인터뷰, 그리고 학생 성과의 학습 중심 척도(learning-focused measures) 등이 포함됩니다. 동료 참관은 학생들이 제공할 수 없는 통찰을 제공합니다.
    • 또한, 수업 자료(예: 실라버스[syllabi], 학습 목표, 학습 활동 검토)에 대한 동료 리뷰(peer reviews)를 표준화된 시험(standardized examinations) 및 역량 평가(competency assessments)와 같은 학습 중심 척도와 결합하면, 만족도 점수보다 교수 질 및 학습 성과에 대한 더 직접적인 지표(more direct indication)를 제공합니다.
  • 둘째, 학생 피드백에 대해 포커스 그룹 및 개별 학생 인터뷰를 통해 수집된 서술형 코멘트(narrative comments)와 같은 질적 접근법(qualitative approaches)을 고려하되, 학생들에게 과도한 부담을 주지 않도록 소량(small doses)으로만 하십시오.
    • 더 많은 서술형 코멘트를 사용하라는 평가 문헌(assessment literature)의 최근 권고와 유사하게, 서술형 과정 평가 피드백(narrative course evaluation feedback)은 만족도 점수보다 더 실행 가능한 통찰(more actionable insights)을 제공할 수 있습니다(즉, 신중하게 전달된다면 실제로 교육 관행을 개선할 수 있는 피드백).
    • 예를 들어, Brandl 등은 과정 책임자(course directors) 및 학생들과 포커스 그룹을 사용했는데, 이는 교사와 학생 모두에게 유익한 상세하고 구체적인 통찰(detailed and specific insights)을 산출했습니다. 응답률이 낮은 설문조사와 마찬가지로, 질적 접근법 또한 신중하게 고려되어야 할 표본 추출의 한계(sampling limitations)를 수반합니다.
    • 그럼에도 불구하고, 질적 피드백의 좁은 범위(narrower scope)는 이러한 방법들이 제공할 수 있는 통찰의 더 깊은 깊이(greater depth of insight)로 상쇄될 수 있으며, 특히 복잡한 교육 경험을 이해하거나 개선을 위한 실행 가능한 권고안을 생성하고자 할 때 그렇습니다.
  • 셋째, 학생들에게는 건설적인 피드백(constructive feedback)을 전달하는 방법에 대해, 교사들에게는 그것을 받아들이는 방법에 대해 지침(guidance)을 제공하십시오.
    • 아마도 교육에 관심 있는 학생 그룹(group of education-interested students)을 훈련시켜 교육 경험을 평가하도록 할 수 있을 것입니다. 이는 학생 수행의 평가자(assessors)로 훈련받는 교수진과 유사합니다.

이러한 프로그램적 평가 전략(programmatic evaluation strategies)을 구현하는 데는 추가 자원(additional resources), 전용 시간(dedicated time), 그리고 훈련된 인력(trained personnel)이 필요할 수 있음을 인정하는 것이 중요합니다. 이러한 전략들이 기관이 더 정확하고 실행 가능한 교육 효과성 데이터를 수집하도록 돕는 시작(start)에 불과하지만, 기관들은 또한 승진 및 정년 보장 위원회(promotion and tenure committees)와 협력하여 학생 만족도 데이터가 사용되는지 여부와 그 방법을 재고(reconsider)해야 합니다. 이 방향으로 나아가는 것은 또한 의학 교육 품질 개선이라는 공유된 헌신(shared commitment)으로 뭉친 의과대학들과 인증 기구(accrediting bodies) 간의 협력(collaboration)을 필요로 할 것입니다. 예를 들어, LCME는 최근 특정 설문 항목이 질문되고 답변되는 방식을 포함하여 ISA의 측면들을 변경했습니다. 그러나, 학생들이 모든 질문에 대해 올바른 청중(right audience)인지, 더 나은 증거 소스가 이용 가능한지, 그리고 학생들의 동의/비동의 응답이 다른 평가적 증거의 맥락에서 어떻게 가중치(weighed)가 부여되어야 하는지에 대한 질문은 여전히 남아 있습니다.

결론 (Conclusions)

우리가 물어야 할 본질적인 질문(essential question)은 학생 만족도 설문조사가 우리의 의학 교육 평가 및 인증 시스템에서 차지하고 있는 중심적 역할(central role)을 맡을 자격이 있는가 하는 것입니다. 우리는 대답이 '아니오'라고 믿습니다. 이러한 설문조사의 편향과 한계는 그것들을 고부담 결정을 위한 부적절한 토대(inadequate foundation)로 만듭니다. 수월성(excellence)을 추구하면서도, 의학 교육 커뮤니티는 우리의 평가 관행에서 공정성(fairness), 엄격성(rigor), 그리고 타당도(validity)를 우선시해야 합니다. 요약하자면, 우리는 지난 50년의 경험적 연구에 귀를 기울여야 하며(heed), 우리가 옹호하는(espouse) 증거 기반 표준(evidence-supported standards)에 더 잘 부합하는 더 견고하고 전체론적인 평가 전략(more robust and holistic evaluation strategy)으로 나아가야 합니다. 지금이야말로 우리의 교육 관행이 목적에 부합하고(fit for purpose), 학생과 교수진에게 유익하며(beneficial), 궁극적으로 우리 학생들이 언젠가 섬기게 될 환자들에게 유리하도록(advantageous) 확실히 할 때입니다. 그보다 못한 것을 받아들이기에는 판돈(stakes, 위험 부담)이 너무 큽니다.

 

 

 

 

+ Recent posts