Wilson Centre

[질적연구] 코드 및 코딩

Meded. 2024. 9. 25. 11:12

출처: Saldaña, J. (2021). The coding manual for qualitative researchers.

https://us.sagepub.com/en-us/nam/the-coding-manual-for-qualitative-researchers/book273583#contents

 

매뉴얼의 목적

Purposes of the Manual

 

매뉴얼의 주요 목적은 세 가지입니다:

  • 질적 데이터 수집 및 분석 과정에서 코드, 코딩, 분석 메모 작성의 기능을 논의합니다.
  • 질적 데이터 분석에 일반적으로 적용되는 다양한 코딩 방법을 소개합니다.
  • 독자들에게 질적 데이터를 코딩하고 추가 분석하는 데 필요한 출처, 설명, 권장되는 적용 방법, 예시 및 연습 문제를 제공합니다.

이 매뉴얼은 질적 연구 설계나 인터뷰 또는 참여 관찰 현장 연구를 수행하는 방법과 같은 주제를 다루지 않습니다. 그러한 주제는 이미 다른 교과서에서 탁월하게 논의되고 있습니다. 이 매뉴얼은 기존 연구를 보완하는 참고서로, 코딩과 코드가 질적 데이터 분석 과정에서 어떻게 작용하는지에 초점을 맞춥니다. 질적 탐구에 처음 입문하는 사람들을 위해 다양한 코딩 방법을 간략하게 소개하며, 각 방법에 대한 추가 정보와 확장된 논의는 대부분 인용된 출처에서 확인할 수 있습니다. 예를 들어, 2장에서 논의된 근거이론은 Kathy Charmaz(2006)의 『Constructing Grounded Theory: A Practical Guide through Qualitative Analysis』에서 명확하게 다루고 있으며, Graham R. Gibbs(2007)의 『Analysing Qualitative Data』에서는 기본적인 분석 과정을 우아하게 설명하고 있습니다.

 

이 매뉴얼은 특정 연구 장르나 방법론에 치우치지 않습니다. 책 전반에 걸쳐 학자들 사이의 다양한 의견을 강조하기 위해 코딩과 관련된 여러 관점을 읽게 될 것입니다. 다음은 그러한 학문적 차이를 보여주는 두 가지 예시입니다:

"질적 분석을 잘 수행하고자 하는 연구자는 코딩을 잘 하고 쉽게 할 수 있어야 합니다. 연구의 우수성은 코딩의 우수성에 크게 의존합니다." (Strauss, 1987, p. 27)
"질적 연구 인터뷰를 분석하는 방법으로서의 코딩에 대한 가장 강력한 반대 의견은 철학적인 것이 아니라, 실제로 코딩이 불가능하다는 점입니다. 실천적으로 불가능합니다." (Packer, 2011, p. 80)

 

코딩의 유용성이나 질적 데이터를 분석하는 "최고의" 방법에 대해 최종적인 권위를 주장할 수 있는 사람은 아무도 없으며, 저 자신도 마찬가지입니다. 실제로, 저는 명확성이나 유연성을 위해 제시된 코딩 방법을 약간 수정하거나 이름을 변경하는 경우도 있습니다. 이는 이 분야의 용어를 표준화하려는 의도는 아니며, 단지 이 매뉴얼 내에서 일관성을 유지하려는 목적입니다.

 

처음부터 강조하고 싶은 점은, 데이터를 코딩하는 것이 반드시 필요한 경우가 있는 반면, 연구에 적합하지 않은 경우도 있다는 것입니다. 모든 연구 질문, 방법론, 개념적 프레임워크, 현장 연구의 매개변수는 상황에 따라 다릅니다. 또한, 코딩을 할지 여부는 연구자가 질적 탐구에 대해 가지고 있는 개인적인 가치관, 태도, 신념에 달려 있습니다. 이를 기록으로 남기자면, 다음은 『Fundamentals of Qualitative Research』에서 언급한 저의 입장입니다:

 

"질적 연구는 사회과학에서 예술 형식에 이르기까지 다학문적인 활동으로 발전해 왔습니다. 그러나 많은 연구 방법 강사들은 현장 연구를 수행하는 방법이나 그 결과를 기술하는 방법에 대해 서로 다른 충성을 보이고, 선호하는 방식도 다르며, 처방 또한 다릅니다. 저는 인간 탐구에 대해 실용적인 입장을 취하며, 적절한 작업에 적절한 도구를 선택하는 것에 열려 있습니다. 때로는 시가 가장 적절한 방법일 수도 있고, 때로는 데이터 매트릭스가 그 역할을 할 수도 있습니다. 때로는 말이 가장 잘 전달할 수 있고, 때로는 숫자가 그렇습니다. 이 분야의 다양한 탐구 방법에 대해 더 많이 익힐수록 사회적 삶의 다양한 패턴과 복잡한 의미를 더 잘 이해할 수 있습니다." (Saldaña, 2011b, pp. 177–8)

 

코딩은 질적 데이터를 분석하는 많은 방법 중 하나일 뿐이지 유일한 방법은 아닙니다. 코딩 방법을 전면적으로 비판하는 사람들을 경계해야 하며, "코딩 집착"이라고 흔히 불리는, 코딩에 대해 고집스럽게 충성을 맹세하는 사람들 역시 주의해야 합니다. 코딩이 특정 연구 프로젝트에 적합한지 여부는 예측적인 이론가나 철저한 방법론자가 아니라, 연구자인 당신이 스스로 결정하기를 바랍니다.

 

또한 이 매뉴얼을 작성한 이유 중 하나는 제가 질적 연구 방법론 수업에서 코딩을 가르치는 데 어려움을 겪었기 때문입니다. 여러 출처에서 제공하는 코딩 과정을 학생들에게 읽히게 했지만, 코딩에만 집중한 단일 만족스러운 책을 찾지 못했기 때문에 이 매뉴얼을 만들게 되었습니다. 질적 탐구에 대한 일반적인 입문 텍스트는 너무 많고 잘 쓰여져 있어서 선택하기 어렵지만, 그 중 어떤 것이 가장 적합한 교과서로 사용할 수 있을지는 의문이었습니다. 이 매뉴얼은 코딩에 대한 논의가 주로 저자의 권장, 선호, 또는 시그니처 방법에 한정된 기존 입문서를 보완합니다. 저는 학생들과 동료들에게 교실에서의 연습과 과제, 그리고 자신의 독립적인 연구(학위 논문 현장 연구 및 향후 질적 연구)를 위해 유용한 참고 자료를 제공하고자, 여러 연구자들(저 자신 포함)이 개발한 다양한 코딩 방법의 선택적 모음을 한 곳에 제공하고자 했습니다. 하지만 이 매뉴얼은 결코 완전한 자료는 아닙니다. 정신치료의 'Narrative Processes Coding System' (Angus, Levitt, & Hardtke, 1999)이나 의료 인터뷰에서 사용되는 Davis Observation Code 시스템 (Zoppi & Epstein, 2002, p. 375)과 같은 특정 학문 분야의 방법들은 의도적으로 제외했습니다. 추가적인 코딩 방법에 대한 정보나 설명이 필요하다면 참고문헌을 확인하십시오.

 

이 매뉴얼은 주로 참고 자료로 의도된 것이며, 반드시 처음부터 끝까지 읽을 필요는 없습니다. 그러나 32개의 코딩 방법 프로파일과 그 분석 가능성을 모두 익히고자 한다면 그렇게 읽을 수도 있습니다. 사실, 코딩과 관련된 몇 가지 원칙들은 첫 두 챕터에서는 다루지 않지만, 프로파일 중 일부에서는 독특하게 다루고 있습니다. 모든 내용을 검토하기로 선택했다면, 한 번에 모든 섹션을 읽기보다는 선택된 섹션을 한 번에 읽는 것이 좋습니다. 그렇지 않으면 과도하게 부담스러울 수 있습니다. 이 매뉴얼에서 자신의 연구에 적합한 코딩 방법을 찾기 위해 스캔하고 있다면, 프로파일의 설명 및 적용 섹션을 읽어 추가적인 읽기가 필요할지 판단하거나, 부록 A에 있는 용어집을 확인하십시오. 당신이 이 매뉴얼에 포함된 모든 코딩 방법을 연구 경력 전반에 걸쳐 사용하지는 않을 가능성이 큽니다. 그러나 이곳에 있는 코딩 방법들은 당신의 독특한 프로젝트를 위해 필요할 때마다 사용할 수 있도록 제공됩니다. 마치 학문 커리큘럼처럼, 프로파일의 순서는 신중하게 고려되었습니다. 이들은 반드시 간단한 것에서 복잡한 것으로 선형적으로 진행되지는 않지만, 대체로 기본적인 것에서 중급, 고급 순으로 묶여 있습니다.

 

코드는 무엇인가?

What Is a Code?

 

질적 탐구에서 코드(code)는 대부분 하나의 단어나 짧은 구절로, 언어 기반 또는 시각적 데이터의 일부분에 대해 요약적이고, 두드러지며, 본질을 포착하거나 감정적으로 호소하는 속성을 상징적으로 부여하는 역할을 합니다. 데이터는 인터뷰 기록, 참여 관찰 현장 노트, 일지, 문서, 그림, 유물, 사진, 비디오, 인터넷 사이트, 이메일 서신, 문학 작품 등으로 구성될 수 있습니다.

  • 첫 번째 사이클 코딩 과정에서 코딩되는 데이터의 범위는 한 단어에서 전체 문단, 한 페이지의 텍스트, 연속적인 영상 스트림에 이르기까지 다양할 수 있습니다.
  • 두 번째 사이클 코딩 과정에서는 코딩된 부분이 동일한 단위일 수도 있고, 더 긴 텍스트 단락일 수도 있으며, 데이터에 대한 분석 메모나 지금까지 개발된 코드 자체의 재구성이 될 수도 있습니다.

Charmaz(2001)는 코딩을 데이터 수집과 그 의미 설명을 연결하는 "중요한 연결고리"라고 설명합니다.

 

코드의 사용을 기호학에서의 코드 사용과 혼동하지 않도록 주의하십시오. 두 응용 사이에 약간의 유사성이 있긴 하지만,

  • 기호학에서 코드특정 사회적 및 문화적 맥락에서 상징을 해석하는 것과 관련이 있습니다.
  • 질적 데이터 분석에서의 코드연구자가 생성한 구성물로, 각 데이터에 해석된 의미를 부여하여 패턴 감지, 범주화, 이론 구축 및 기타 분석 과정을 위한 목적으로 사용됩니다. 책, 영화, 시의 제목이 해당 작품의 주요 내용과 본질을 나타내는 것처럼, 코드도 데이터의 주요 내용과 본질을 나타내고 포착합니다.

코딩 예시
Coding examples

코딩된 데이터를 예로 들면, 다음은 도심 내 이웃에 대한 현장 노트에서 발췌한 것으로, 오른쪽 열에 대문자로 표시된 코드가 있습니다. 이는 Descriptive Code(묘사적 코드)라고 불리며, 발췌문의 주요 주제를 요약합니다:

1 나는 대부분의 집들이 앞에 쇠사슬 울타리를 가지고 있는 것을 1 SECURITY (보안)
   보았다. 울타리에는 많은 개들(대부분 독일 셰퍼드)과 
   "개를 조심하라"는 표지판이 있었다.

 

다음은 고등학교 졸업반 학생이 자신의 가장 좋아하는 선생님을 묘사한 인터뷰 기록에서 여러 코드를 적용한 예시입니다. 코드는 학생이 자신의 멘토로부터 받는 결과에 기반을 둡니다. 이 중 한 코드는 참여자가 직접 말한 내용을 인용한 것으로, 큰따옴표로 표시됩니다. 이는 In Vivo Code(생체 내 코드)라고 불립니다:

1 그는 나를 신경 써 준다. 그가 직접 말한 적은 없지만, 그가 그렇다. 1 SENSE OF SELF-WORTH (자존감)
2 그는 항상 내 곁에 있어주었다. 내 부모님이 없을 때도. 2 STABILITY (안정감)
   그는 내 삶에서 거의 유일하게 변하지 않는 몇 가지 중 하나다. 
   그래서 좋다.
3 나는 그와 함께 있으면 정말로 3 "COMFORTABLE" (편안함)
   편안함을 느낀다.

 

코드에 동의하셨나요? 데이터를 읽으면서 다른 단어나 구절이 떠올랐나요? 만약 당신의 선택이 저와 다르다면 괜찮습니다. 코딩은 정확한 과학이 아니라 주로 해석적인 행위입니다. 또한 코드는 데이터를 단순히 축소하는 것이 아니라, 요약하거나 압축하거나 응축할 수 있음을 인지해야 합니다. 사실 Madden(2010)은 이러한 분석 작업이 연구 이야기의 가치를 감소시키는 것이 아니라 오히려 "가치를 더한다"고 언급합니다 (p. 10).

 

위에서 제공된 도입부 예시는 의도적으로 단순하고 직관적으로 유지되었습니다. 그러나 연구자의 학문적 분야, 존재론적 및 인식론적 지향성, 이론적 및 개념적 프레임워크, 그리고 심지어 코딩 방법의 선택에 따라 어떤 코드는 데이터에 더욱 감정적인 의미를 부여할 수 있습니다. 아래 발췌문에서, 한 어머니가 사춘기 아들의 힘든 학교 시절을 묘사하고 있습니다. 이 코드는 대부분의 청소년에게 힘든 시기인 중학교 시절의 관점에서 도출된 것입니다. 이들은 특정한 유형의 코드가 아니라, Eclectic Coding(다양한 코딩)이라는 개방적인 과정을 통해 도출된 "첫인상" 문구들입니다:

1 내 아들 배리는 정말 힘든 시간을 겪었습니다. 아마도 5학년 1 MIDDLE-SCHOOL HELL (중학교 지옥)
   말쯤 시작되어 6학년으로 이어졌습니다. 
2 그가 어릴 때는, 학교에서 그는 사람들을 기쁘게 하는 2 TEACHER’S PET (선생님의 사랑을 받는 아이)
   아이였고, 선생님들은 그를 매우 사랑했습니다.
3 특히 그가 따라 하려고 선택한 두 명의 소년이 있었는데, 3 BAD INFLUENCES (나쁜 영향)
   그들은 그에게 좋은 친구가 아니었습니다.
4 그들은 그를 매우 비판적이었고, 항상 그를 깎아내렸습니다. 4 TWEEN ANGST (사춘기 불안)
   제 생각에 그는 오랜 시간 동안 그것을 받아들이고, 내면화한 것 같습니다.
5 그 기간 동안, 5학년에서 6학년 초반에, 그들은 완전히 그를 5 THE LOST BOY (잃어버린 소년)
   소외시켰고, 그래서 그가 알고 있던 사회적 네트워크는 사라졌습니다.

 

데이터의 핵심 의미를 해독하기 위해 해당 구절을 되돌아보는 것은 디코딩(Decoding)입니다. 적절한 코드를 결정하고 이를 레이블링하는 것은 인코딩(Encoding)입니다. 이 매뉴얼 전반에서의 참고 편의를 위해, 코딩이라는 용어만 사용됩니다. 단순히 코딩이 데이터 수집과 더 광범위한 데이터 분석 사이의 전환 과정이라는 점을 이해하면 됩니다.

 

패턴을 위한 코딩
Coding for patterns

 

지금까지 제시된 예시에서 각 데이터 단위는 고유한 코드가 할당되었습니다. 이는 주로 발췌문의 짧은 길이 때문입니다. 더 크고 완전한 데이터 세트에서는 동일한 코드가 여러 번 반복적으로 사용되는 경우가 많습니다. 이는 자연스러우면서도 의도적인 현상입니다. 자연스럽다는 것은 인간의 행동에서 주로 반복적인 패턴과 일관성이 나타나기 때문이고, 의도적이라는 것은 코더의 주요 목표 중 하나가 데이터에서 이러한 반복적인 행동 패턴과 일관성을 찾아내는 것이기 때문입니다. 다음 예시에서, 동일한 프로세스 코드(행동을 포착하는 단어 또는 구)가 초등학교 교실 활동의 작은 단위에서 두 번 사용된 것을 확인할 수 있습니다:

1 잭슨 선생님은 책상에서 일어나 "자, 이제 점심을 먹으러 줄을 섭시다. 1 LINING UP FOR LUNCH (점심을 먹으러 줄 서기)
   첫 번째 줄."이라고 말합니다. 첫 번째 줄에 앉아 있던 다섯 명의 
   아이들이 일어나 교실 문으로 걸어갑니다. 일부 아이들은 서로 
   이야기를 나눕니다.
2 잭슨 선생님은 그들을 바라보며 "이야기하지 말고, 점심시간에 하세요." 2 MANAGING BEHAVIOR (행동 관리)
   라고 말합니다.
3 "두 번째 줄." 두 번째 줄에 앉아 있던 다섯 명의 아이들이 일어나 3 LINING UP FOR LUNCH
   이미 줄을 서 있는 아이들에게 다가갑니다.

 

위의 구절은 MANAGING BEHAVIOR(행동 관리)가 LINING UP FOR LUNCH(점심을 먹으러 줄 서기)라는 일상적인 흐름을 방해하는 별개의 행동이 아니라, LINING UP FOR LUNCH이라는 더 큰 사회적 구조의 일부분으로 해석될 수 있습니다. Simultaneous Coding(동시 코딩)이라는 방법을 사용하여 한 데이터에 두 개 이상의 코드를 적용하는 방식으로 코딩할 수 있습니다:

1 잭슨 선생님은 책상에서 일어나 "자, 이제 점심을 먹으러 줄을 섭시다. 1 LINING UP FOR LUNCH (점심을 먹으러 줄 서기)
   첫 번째 줄."이라고 말합니다. 첫 번째 줄에 앉아 있던 다섯 명의 
   아이들이 일어나 교실 문으로 걸어갑니다. 일부 아이들은 서로 
   이야기를 나눕니다.
1a 잭슨 선생님은 그들을 바라보며 "이야기하지 말고, 점심시간에 하세요." 1a MANAGING BEHAVIOR (행동 관리)
3 "두 번째 줄." 두 번째 줄에 앉아 있던 다섯 명의 아이들이 일어나 3 LINING UP FOR LUNCH
   이미 줄을 서 있는 아이들에게 다가갑니다.

 

패턴과 규칙성을 이해할 때 유의해야 할 중요한 점은, 특이성도 하나의 패턴이라는 것입니다(Saldaña, 2003, pp. 118–22). 또한 데이터에는 패턴화된 변동성이 있을 수 있습니다(Agar, 1996, p. 10). 때로는 참가자가 이야기하는 주제를 기준으로 데이터를 코딩하고 범주화할 수 있습니다. 예를 들어, 그들은 학교 경험에 대한 개인적인 인식을 모두 공유할 수 있지만, 교육에 대한 개인적인 가치관, 태도, 신념 체계는 지루함과 무관심에서부터 열정적이고 내재적인 동기 부여까지 크게 다를 수 있습니다. 코딩된 데이터를 패턴을 찾아 범주화할 때, 반드시 동일하거나 매우 유사하기 때문에만 묶는 것이 아니라, 때로는 차이를 공유하면서도 어떤 공통점을 가질 수 있다는 사실을 이해해야 합니다. 이러한 공통점이 역설적으로 차이로 구성되더라도 말입니다.

 

예를 들어, 우리 각자는 나라를 이끌어야 할 사람에 대해 강한 의견을 가지고 있을 수 있습니다. 그 주제에 대해 각자가 개인적인 의견을 가지고 있다는 사실이 우리가 공유하는 공통점입니다. 그러나 누구를 나라를 이끌 지도자로 생각하는지는 우리가 각기 다른 차이와 변화를 보이는 부분입니다. 질적 탐구에서 범주를 구성하는 속성 중 하나는 데이터가 항상 명확하게 구분될 수 없다는 점이며, 그 경계는 "불분명한" 경계 안에 있을 수밖에 없습니다(Tesch, 1990, pp. 135–8). 그렇기 때문에 필요할 때는 Simultaneous Coding(동시 코딩)이라는 방법을 선택할 수 있습니다.

 

마지막으로, Hatch(2002)는 패턴을 단순한 안정적인 규칙성으로만 생각하지 말고, 다양한 형태로 나타날 수 있다고 제안합니다. 패턴은 다음과 같은 특성으로 설명될 수 있습니다:

  • 유사성: 같은 방식으로 발생하는 것
  • 차이점: 예측 가능한 다른 방식으로 발생하는 것
  • 빈도: 자주 또는 드물게 발생하는 것
  • 순서: 특정 순서로 발생하는 것
  • 상응성: 다른 활동이나 사건과 관련하여 발생하는 것
  • 인과성: 하나가 다른 하나를 유발하는 것 (p. 155)

 

코딩 필터

Coding filters

 

코딩 작업은 연구자의 분석 렌즈를 사용하는 것을 필요로 합니다. 하지만 데이터를 어떻게 인식하고 해석하느냐는 그 렌즈를 덮는 필터의 종류에 따라 달라집니다. 예를 들어, 나이 든 남성의 다음 발언을 생각해 봅시다: "이 나라에 불법 이민자가 있을 자리는 없습니다. 그들을 잡아들여서 그들이 왔던 곳으로 돌려보내야 합니다." 한 연구자는 참여자의 언어에 근거를 두기 위해 In Vivo Coding(생체 내 코딩)을 사용하는 근거이론 연구자로, 다음과 같이 코딩할 수 있습니다:

1 이 나라에 불법 이민자가 있을 자리는 없습니다. 그들을 잡아들여서 1 “NO PLACE”(자리가 없다)
   그들이 왔던 곳으로 돌려보내야 합니다.

 

두 번째 연구자는 다수의 참가자들이 발언한 의견의 폭을 문서화하고 범주화하기 위해 Descriptive Coding(묘사적 코딩)을 사용하는 도시 민속학자, 동일한 데이터를 이렇게 코딩할 수 있습니다:

1 이 나라에 불법 이민자가 있을 자리는 없습니다. 그들을 잡아들여서 1 IMMIGRATION ISSUES(이민 문제)
   그들이 왔던 곳으로 돌려보내야 합니다.

 

세 번째 연구자는 주관적인 관점을 포착하고 레이블링하기 위해 Values Coding(가치 코딩)을 사용하는 비판적 인종 이론 연구자로, 동일한 데이터를 다음과 같이 코딩할 수 있습니다:

1 이 나라에 불법 이민자가 있을 자리는 없습니다. 그들을 잡아들여서 1 XENOPHOBIA(외국인 혐오)
   그들이 왔던 곳으로 돌려보내야 합니다.

 

이 매뉴얼에서 제시한 코딩 방법들은 질적 탐구에 대한 접근 방식을 고려하고 적용할 수 있는 여러 가지 필터의 모음입니다. 하지만 그 이전에, 연구자로서 참여 관찰자로서의 개인적 관여 수준(주변적, 적극적, 또는 완전한 멤버로서 현장 연구에 참여)이 데이터를 인식하고 문서화하며 코딩하는 방식에 영향을 미칩니다(Adler & Adler, 1987). 또한 인터뷰 중에 어떤 질문을 하고 어떤 응답을 받는지(Kvale & Brinkmann, 2009), 현장 노트를 얼마나 자세히 작성하고 어떻게 구조화하는지(Emerson, Fretz, & Shaw, 2011), 참여자의 성별, 사회적 계층, 인종/민족 그리고 연구자 자신의 성별과 계층(베하 & Gordon, 1995; Stanfield & Dennis, 1993), 그리고 성인이나 어린이로부터 데이터를 수집하는지(Greene & Hogan, 2005; Tisdall, Davis, & Gallagher, 2009; Zwiers & Morrissette, 1999) 등도 코딩에 영향을 줍니다.

 

 

Merriam(1998)은 “우리의 분석과 해석, 즉 연구의 결과는 처음에 연구를 구조화한 개념, 언어, 모델, 이론을 반영할 것”이라고 말합니다(p. 48). 또한 연구자의 질적 탐구 접근 방식(예: 사례 연구, 민족지학, 현상학)과 존재론적, 인식론적, 방법론적 문제들이 코딩 결정에 영향을 미친다는 점도 고려해야 합니다(Creswell, 2013; Mason, 2002). Sipe와 Ghiso(2004)는 어린이 문해력 연구를 위한 코딩 딜레마에 대한 내러티브에서, “모든 코딩은 판단의 문제”이며 우리가 이 과정에 “자신의 주관성, 개성, 성향, 특이점”을 반영한다고 언급합니다(p. 482–3). 마치 감독 구로사와 아키라의 고전 영화 《라쇼몽》의 등장인물들처럼, 우리는 서로 다른 관점에서 사회적 삶을 인식하고 해석하기 때문에 여러 가지 현실이 존재할 수 있습니다.

 

코딩은 발견법으로서의 역할을 합니다.

Coding as a heuristic

 

대부분의 질적 연구자들은 데이터 수집 중이거나 수집 후에 코딩을 분석적 기법으로 사용합니다. 코딩 자체가 분석이기 때문입니다(Miles & Huberman, 1994, p. 56). 그러나 "코딩과 분석은 동의어가 아니지만, 코딩은 분석의 중요한 측면이다"라는 다른 시각도 있습니다(Basit, 2003, p. 145). 코딩은 발견법(그리스어로 '발견하다'라는 의미에서 유래)으로, 특정한 공식이나 알고리즘이 없는 탐색적 문제 해결 기법입니다. 코딩은 보고서를 위한 보다 엄격하고 감정적인 분석과 해석으로 가는 첫 번째 단계일 뿐입니다. 코딩은 단순히 레이블을 붙이는 것이 아니라, 연결하는 행위입니다. 즉, "코딩은 데이터를 아이디어로, 그리고 그 아이디어와 관련된 모든 데이터로 이끄는 과정"입니다(Richards & Morse, 2007, p. 137).

 

또한 코딩은 반복적인 과정입니다. 첫 번째 코딩 사이클이 완벽하게 이루어지는 경우는 드뭅니다. 두 번째 코딩 사이클(때로는 세 번째, 네 번째 등)에서는 재코딩을 통해 질적 데이터 기록의 핵심적인 특징을 더 잘 관리하고, 필터링하고, 강조하고, 초점을 맞추어 범주, 주제, 개념을 생성하고 의미를 파악하며, 이론을 구축할 수 있도록 합니다. Coffey와 Atkinson(1996)은 “코딩은 대개 데이터 요약과 데이터 복잡화의 혼합이다. 데이터를 분석적으로 관련된 방식으로 분해하여 데이터에 대한 추가 질문으로 이끄는 과정이다”라고 제안합니다(pp. 29–31).

 

Dey(1999)는 비록 원래는 비판적인 의도로 말했지만, "범주를 통해 우리는 의미를 부여하고, 코딩을 통해 우리는 그 의미를 계산한다"라고 주장합니다(p. 95). 일부 연구자들에게 코드란 "나쁜 말"로 인식될 수도 있습니다. 몇몇 연구 방법론자들은 코드를 더 중요한 범주를 발견하기 위한 단순한 약어로만 간주하기도 합니다. 불행히도 코드와 범주라는 용어를 혼용하거나 심지어 조합하여 사용하는 경우도 있지만, 사실 이들은 데이터 분석의 두 가지 별개의 구성 요소입니다. 저는 질적 코드가 연구 이야기의 본질을 포착하는 필수적인 요소라고 주장합니다. 이러한 코드가 유사성과 규칙성(즉, 패턴)에 따라 함께 묶일 때, 범주의 개발을 촉진하고, 그 범주들 간의 연결을 분석하는 데 중요한 역할을 합니다. 궁극적으로, Charmaz(2006)의 비유 중 하나가 이 과정을 잘 설명한다고 생각합니다. 그녀는 "코딩은 분석의 뼈대를 만들어낸다. 통합은 그 뼈대를 작동하는 골격으로 조립하는 과정"이라고 설명합니다(p. 45).

 


나의 생각

  • 코딩을 뼈대로 비유한다면, 데이터의 구조와 기능을 살펴보고, 뼈를 조립하여 논리적으로 기능하는 골격을 만드는 것이 목표(구성주의 근거이론)
  • 코딩을 물감에 비유한다면, 데이터의 표면적 특성(명도, 채도)을 살펴보고, 이를 자유롭게 조립하는 것이 목표 (민족지학자)
  • 코딩을 그림자로 비유한다면, 데이터로 인하여 가려지는 것(특정한 관점(광원)이 데이터를 만났을 때 형성되는 그림자)를 살펴보고, 그림자가 가리고 있는 것을 드러내는 것이 목표 (비판 이론)

 

코딩화와 범주화

Codifying and Categorizing

 

코딩화(codifying)는 사물을 체계적인 순서로 배열하고, 어떤 것을 시스템이나 분류의 일부로 만들며, 범주화하는 것을 의미합니다. 질적 데이터에 코드를 적용하고 다시 적용하는 것은 데이터를 “분리, 그룹화, 재그룹화, 그리고 재연결하여 의미와 설명을 통합하는” 과정입니다(Grbich, 2007, p. 21). Bernard(2011)는 분석을 “데이터에서 패턴을 찾고, 그 패턴이 처음에 왜 존재하는지 설명하는 아이디어를 찾는 것”이라고 간결하게 설명합니다(p. 338). 따라서 코딩은 유사한 코드를 공유하는 데이터를 범주나 “가족(families)”으로 조직하고 그룹화하는 방법입니다. 이는 그들이 어떤 특성을 공유한다는 이유 때문인데, 이것이 패턴의 시작입니다(패턴 코딩과 집중 코딩의 예시는 5장에서 확인할 수 있습니다). 데이터를 그룹화할 때, 분류적 추론과 더불어 암묵적이고 직관적인 감각을 사용하여 어떤 데이터가 “비슷해 보이고” “비슷한 느낌을 주는지” 결정하게 됩니다(Lincoln & Guba, 1985, p. 347).

코드에서 범주로 
From codes to categories

예를 들어, Harry, Sturges, 그리고 Klingner(2005)의 소수 민족이 특수 교육 프로그램에 과대 대표되는 문제에 대한 민족지학적 연구에서, 처음에는 교실의 MATERIALS(자료), COMPUTERS(컴퓨터), TEXTBOOKS(교과서)라는 코드가 Resources(자원)라는 주요 범주 아래에 범주화되었습니다. 연구가 계속되면서 Teacher Skills(교사 역량)이라는 또 다른 주요 범주가 나타났고, 이 범주에는 Instructional Skills(교수 기술)Management Skills(관리 기술)이라는 하위 범주가 생겼습니다. 이러한 하위 범주 아래에 속한 코드는 전체 계층적 “코딩 체계”의 일부로 포함되었습니다(Lewins & Silver, 2007):

  • 범주: Teacher Skills(교사 역량)
    • 하위 범주 1: Instructional Skills(교수 기술)
      • 코드: PEDAGOGICAL(교육적)
      • 코드: SOCIO-EMOTIONAL(사회-감정적)
      • 코드: STYLE/PERSONAL EXPRESSION(스타일/개인 표현)
      • 코드: TECHNICAL(기술적)
    • 하위 범주 2: Management Skills(관리 기술)
      • 코드: BEHAVIORIST TECHNIQUES(행동주의 기술)
      • 코드: GROUP MANAGEMENT(그룹 관리)
      • 코드: SOCIO-EMOTIONAL(사회-감정적)
      • 코드: STYLE(스타일, 교수 스타일과 중복됨)
      • 코드: UNWRITTEN CURRICULUM(비공식적 교육 과정)

또 다른 예로, Basit(2003)의 영국 무슬림 소녀들의 진로 포부에 관한 연구에서는, 소녀들, 그들의 부모, 그리고 교사들과의 인터뷰 데이터를 분석하여 23개의 주요 범주가 도출되었고, 이는 6개의 주요 주제 아래에 모였습니다. 그중 하나는 IDENTITY(정체성)라는 주제였으며, 이와 관련된 범주는 Ethnicity(민족성), Language(언어), Religion(종교)였습니다. CAREER ASPIRATIONS(진로 포부)라는 주제 아래에는 Career Choices(직업 선택), Unrealistic Aspirations(비현실적인 포부), Career Advice(진로 조언)라는 범주가 있었습니다.

 

Maykut과 Morehouse(1994)는 각 범주를 명제 형태의 포함 규칙과 샘플 데이터를 결합하여 세분화했습니다. 예를 들어, 한 사례 연구에서 Physical Health(신체 건강)라는 범주가 나타났다면, 이를 포함하는 규칙은 다음과 같은 명제로 나타날 수 있습니다:

  • Physical Health(신체 건강): 참가자가 신체 건강과 관련된 문제(예: 웰빙, 약물, 통증 등)를 공유함: “저는 매일 밤 25밀리그램의 아미트립틸린을 복용합니다”, “저는 체육관에 가는 것이 싫어요.”

또한, 새로운 범주는 설명적 주제보다는 개념적 과정으로 진화할 수도 있습니다. 예를 들어:

  • Inequity(불공정성): 참가자들은 자신에게 가해진 부당한 대우와 다른 사람에게 가해진 편애를 인식함: “저는 여기서 25년 넘게 일해 왔는데, 몇몇 신입사원들이 저보다 더 높은 급여를 받고 있어요.”

범주의 명제들은 서로 비교되어 가능한 관계를 식별하고, 이를 바탕으로 최종 결과 명제를 도출하게 됩니다.

 

코딩 및 재범주화

Recoding and recategorizing

 

처음부터 코딩을 완벽하게 해내는 경우는 드뭅니다. 질적 연구는 언어에 대한 세심한 주의와 인간 경험에서 나타나는 패턴과 의미에 대한 깊은 성찰을 요구합니다. 재코딩은 데이터를 다시 검토할 때 더 세밀한 관점을 반영할 수 있으며, 이는 첫 번째 사이클 코딩 방법을 다시 사용하는 경우도 있고, 두 번째(또는 세 번째, 네 번째) 리뷰에서 사용할 수 있는 코딩 방법을 적용하는 경우도 있습니다. Punch(2009)는 볼리비아에서 아동기 연구를 하면서, 민족지학적 현장 연구와 동시 진행된 데이터 분석 중 자신의 코드, 범주, 주제가 어떻게 발전하고 세분화되었는지 설명합니다:

 

"[처음에는] '집'이라는 큰 코드가 있었어요. 가정에서의 생활과 관련된 모든 내용이 이 범주에 코딩되었고, 세 가지 주제로 세분화되었습니다: 성 역할, 가정 내 아동/성인의 역할, 권력과 규율. 이 마지막 범주를 다시 읽었을 때, 이는 성인의 아동에 대한 권력뿐만 아니라 아동이 성인의 권력에 맞서기 위한 전략도 포함하고 있다는 것을 깨달았습니다. 이 두 하위 섹션을 재구성한 후, 아동의 전략을 회피 전략, 대처 전략, 협상 전략으로 나누기로 결정했습니다. 마지막으로 협상 전략 하위 주제를 다시 살펴보니, 이를 아동-부모 간 협상과 형제 간 협상으로 더 세분화할 수 있다는 것을 발견했습니다. 이 데이터는 결국 가정에서의 아동 생활에 대한 연구 결과를 구조화하는 데 기초가 되었습니다." (pp. 94-95)

 

Punch의 내러티브에서 설명된 코딩 체계를 추출하여 계층적 트리 형식으로 변환하면 다음과 같이 나타날 수 있습니다:

I. HOME
   A. Gender Roles
   B. Child/Adult Work Roles in the Household
   C. Power and Discipline
      1. Adult Power Over Children
      2. Children’s Strategies for Counteracting Adult Power
         a. Avoidance Strategies
         b. Coping Strategies
         c. Negotiation Strategies
            i. Child/Parent Negotiations
            ii. Sibling Negotiations

 

코딩과 재코딩을 진행하면서, 코드와 범주가 점점 더 세밀해지고, 연구 방법론에 따라 점점 더 개념적이고 추상적으로 발전하는 것을 기대하거나 목표로 삼아야 합니다. 첫 번째 사이클에서 생성된 일부 코드는 이후에 다른 코드로 통합되거나, 이름이 변경되거나, 완전히 제외될 수도 있습니다. 두 번째 사이클 코딩으로 나아가면서, 코딩된 데이터를 재배열하고, 다른 범주 또는 새로운 범주로 재분류하는 과정이 있을 수 있습니다. Abbott(2004)는 이 과정을 "방 꾸미기와 같다; 시도해보고, 뒤로 물러서서 다시 보고, 몇 가지를 움직이고, 다시 뒤로 물러서서 진지하게 재구성하는 식"으로 비유했습니다(p. 215).

 

예를 들어, 나는 4학년과 5학년 학생들을 관찰하고 인터뷰하여 그들이 서로를 해치고 억압하는 방식을 알아보았습니다(Saldaña, 2005b). 이는 학교 환경에서 괴롭힘에 대처하는 전략을 학생들에게 가르치는 실습 연극과 롤플레잉을 통해 아이들을 강화시키기 위한 행동 연구 프로젝트를 준비하기 위한 현장 연구였습니다. 처음에는 그들의 반응을 Physical Oppression(신체적 억압)Verbal Oppression(언어적 억압)이라는 두 가지 범주로 분류했습니다. 이 범주들 아래에 속한 코드의 예는 다음과 같습니다:

  • Physical Oppression(신체적 억압)
    • PUSHING(밀기)
    • FIGHTING(싸움)
    • SCRATCHING(할퀴기)
  • Verbal Oppression(언어적 억압)
    • NAME-CALLING(욕설)
    • THREATENING(위협)
    • LAUGHING AT(조롱)

코딩을 계속 진행하면서, 몇몇 억압 행동은 신체적 행동과 언어적 행동의 결합임을 발견했습니다. 예를 들어, 한 아이가 다른 아이들을 게임에서 배제할 때, "너는 우리랑 못 놀아"라는 말을 하면서 밀어내는 신체적 행동을 함께 취할 수 있습니다. 이에 따라 Physical and Verbal Oppression(신체적 및 언어적 억압)이라는 세 번째 주요 범주가 등장했습니다.

 

연구가 계속되면서 다른 방법을 통해 더 많은 데이터가 수집되었고, 아동들이 억압을 인식하고 행동하는 방식에서 성별 차이가 뚜렷하게 나타났습니다. 어린 참가자들에게 억압은 신체와 목소리보다는 "힘"과 "감정"에 관한 것이었습니다. 두 번째 사이클 코딩 동안 세 개의 초기 범주는 결국 두 개로 줄어들었고, 성별에 기반한 관찰 결과와 일치하도록 이름이 변경되었습니다. 새로운 범주와 몇 가지 예시 코드 및 재배열된 하위 코드는 다음과 같습니다:

  • Oppression through Physical Force(신체적 힘을 통한 억압) (주로 소년들에 의해 발생하나, 예외도 있음)
    • FIGHTING(싸움)
      • SCRATCHING(할퀴기)
      • PUSHING(밀기)
      • PUNCHING(주먹질)
  • Oppression through Hurting Others’ Feelings(타인의 감정을 상하게 하는 억압) (주로 소녀들에 의해 발생하나, 예외도 있음)
    • PUTTING DOWN(무시)
      • NAME-CALLING(욕설)
      • TEASING(놀림)
      • TRASH TALKING(험담)

또한, 하위 코드 자체는 코드와 관련된 구체적이고 관찰 가능한 행동 유형임을 주목할 수 있습니다. 반면, 두 가지 주요 범주인 Oppression은 더 개념적이고 추상적인 성격을 가지고 있습니다.

 

이 사례에 대한 더 자세한 논의는 3장에서 다루는 Domain and Taxonomic Coding(영역 및 분류 코딩) 프로파일, 3장과 5장에서 각각 다루는 Initial Coding(초기 코딩)Focused Coding(집중 코딩) 예시, 그리고 4장에서 다루는 Code Mapping(코드 매핑)Code Landscaping(코드 풍경화) 기법에서 확인할 수 있습니다.

코드와 범주에서 이론으로
From codes and categories to theory

일부 범주는 코딩된 데이터의 클러스터를 세분화하여 하위 범주로 발전할 수 있습니다. 그리고 주요 범주를 서로 비교하고 다양한 방식으로 통합하면서, 데이터를 넘어 주제적이고 개념적, 이론적인 단계로 나아가게 됩니다. 기본적인 과정으로, 코딩화는 이상적이고 간소화된 도식을 따릅니다.

 

하지만 실제로 이론에 도달하는 과정은 훨씬 더 복잡하고 혼란스러울 수 있습니다. Richards와 Morse(2007)는 "범주화다양한 데이터를 하나로 묶어 데이터의 형태를 드러내는 과정이며, 개념화보다 일반적이고 고차원적이며 추상적인 구성 요소로 나아가는 방법"이라고 설명합니다(p. 157). 이러한 주제와 개념이 체계적으로 상호 연관되는 방식을 보여주는 것이 이론의 발전으로 이어집니다(Corbin & Strauss, 2008, p. 55). Layder(1998)는 기존의 사회학적 이론이 초기 코딩 과정 자체를 지도하거나 영향을 미칠 수 있다고 주장합니다. 새로운 이론을 개발하는 것이 질적 연구의 필수적인 결과는 아니지만, 기존의 이론이 연구 전체를 이끌어간다는 사실을 인지해야 합니다(Mason, 2002).

 

앞서 설명한 아동 억압의 형태에 대한 연구에서 두 가지 주요 범주가 나타났습니다: Oppression through Physical Force(신체적 힘을 통한 억압)Oppression through Hurting Others’ Feelings(감정을 상하게 하는 억압)입니다. 이 범주들로부터 어떤 주요 주제나 개념을 발전시킬 수 있을까요? 우리가 관찰한 명백한 주제 중 하나는 또래 억압이 성별에 따라 다르게 나타난다는 것입니다. 우리가 도출한 더 높은 차원의 개념 중 하나는 아동의 낙인(Goffman, 1963)이었는데, 이는 아동들이 여러 방식으로 다른 사람을 "이상하다"고 판단하고, 이에 따라 억압적 행동을 취하는 관찰에서 비롯되었습니다. 이 연구에서는 제한된 현장 조사 시간으로 인해 정식 이론을 공식화하지는 못했지만, 주요 주장을 개발하여 제시할 수 있었습니다(Erickson, 1986):

 

"예술가이자 활동가인 아우구스토 보알은 사회 변화를 위한 연극에서 성인의 참여를 '혁명을 위한 리허설'이라고 말합니다. 그러나 9세에서 11세의 어린이에게는, 그들의 참여가 사춘기 전 사회적 상호작용을 위한 '오디션'처럼 보입니다. 이 연구의 주요 주장은: 사회 변화를 위한 연극은 초등학교 교실 미시문화 내의 대인간 사회 시스템과 권력 계층을 명백하게 드러냅니다. 어린이들이 창조한 원래의 연극 시뮬레이션은 그들의 지위와 낙인을 진정성 있게 반영하며, 리더, 추종자, 저항자, 그리고 목표물이 누구인지; 누가 영향력을 미치고 누가 무시당하는지; 더 높은 학년에서 계속해서 우위를 주장할 어린이가 누구인지; 그리고 더 높은 학년에서 더 많은 권위를 가진 사람들에게 굴복할 어린이가 누구인지를 진단적으로 보여줍니다." (Saldaña, 2005b, p. 131에서 각색)

 

이 주요 주장은 특정 상황에서 일반적인 이론으로 발전하려는 시도로, 하나의 초등학교 교실에서 관찰된 현상이 다른 지역의 비슷한 초등학교 교실에서도 관찰될 수 있음을 암시합니다. 또한, 현재와 미래의 유사한 맥락에서 관찰될 수 있는 패턴을 예측하면서도, 일반적인 결론으로 발전합니다.

 

코드와 주제의 차이
The differences between codes and themes

 

많은 질적 연구 텍스트는 처음에 "주제를 위한 코딩"을 권장합니다. 하지만 이는 오해를 불러일으킬 수 있는 조언입니다. 주제는 코딩, 범주화, 또는 분석적 성찰의 결과이지, 그것 자체로 코딩되는 것이 아닙니다. 이 매뉴얼에 "주제 코딩" 방법이 없는 이유가 바로 이 때문입니다. 그러나 주제 분석과 데이터의 주제화라는 섹션은 참고할 수 있습니다. 하나의 데이터는 연구의 필요에 따라 처음에는 물론 필요하다면 두 번째로도 코딩되어, 그 내용과 의미를 파악하고 라벨을 붙이게 됩니다. Rossman과 Rallis(2003)는 범주와 주제의 차이를 이렇게 설명합니다: "범주는 데이터의 일부를 설명하는 명시적인 단어 또는 구절로 생각할 수 있는 반면, 주제는 더 미묘하고 암묵적인 과정을 설명하는 구절이나 문장"입니다(p. 282, 강조 추가). 예를 들어, SECURITY(보안)는 코드가 될 수 있지만, DENIAL MEANS A FALSE SENSE OF SECURITY(부정은 거짓된 안전감을 의미한다)는 주제가 될 수 있습니다.

 

질적 연구자들은 알고리즘적 자동기계가 아닙니다. 데이터를 읽고 검토하는 과정에서 주제나 패턴, 트렌드, 개념을 발견하지 않을 수 없습니다. 이런 경우 발생하면 분석 메모에 기록해 두세요(2장에서 다룰 예정입니다). 이는 계속된 코딩 과정을 안내할 수 있기 때문입니다. 주제 집합이 분석에서 도출되는 것은 좋은 일이지만, 처음 코딩 사이클에서는 참여자의 과정, 감정, 가치 등과 같은 현상을 탐구하는 특정 코딩 방법으로 많은 풍부한 발견을 할 수 있습니다.

무엇을 코딩할 것인가?
What Gets Coded?

Richards와 Morse(2007)는 분석 작업에 대해 “움직이는 것은 코딩하라”라고 농담 섞인 조언을 합니다(p. 146). 그러나 실제로 데이터에서 무엇이 코딩되는 걸까요?

사회 조직의 단위
Units of social organization

Lofland, Snow, Anderson, Lofland(2006)은 사회적 삶이 네 가지 좌표에서 일어난다고 설명합니다. 즉, “한 명 이상의 배우(참여자)가 특정 시간과 특정 장소에서 하나 이상의 활동(행동)을 수행하는 교차점”에서 사회적 삶이 일어난다는 것입니다(p. 121). 이들은 먼저 사회 조직의 주요 단위를 다음과 같이 나눕니다:

  1. 문화적 실천: 일상적인 루틴, 직업적 과업, 소문화적 활동 등
  2. 에피소드: 이혼, 챔피언십 경기, 자연 재해와 같은 예상치 못하거나 불규칙적인 활동
  3. 만남: 두 명 이상의 개인 간의 일시적인 상호작용(예: 판매 거래, 구걸 등)
  4. 역할: 학생, 어머니, 고객 등과 같은 역할 및 괴롭히는 사람, 융통성 없는 사람, 괴짜 등과 같은 사회적 유형
  5. 사회적 및 개인적 관계: 부부, 파티 참석자 등
  6. 그룹과 클리크: 갱, 신도, 가족, 운동선수 무리 등
  7. 조직: 학교, 패스트푸드점, 교도소, 기업 등
  8. 거주지 및 서식지: 마을, 이웃 등
  9. 하위문화 및 라이프스타일: 노숙자, 스킨헤드, 게이 레더베어 등

이 매뉴얼에는 위의 주요 단위를 기반으로 한 "Encounter Coding(만남 코딩)", "Organization Coding(조직 코딩)", "Lifestyle Coding(라이프스타일 코딩)"과 같은 코딩 방법이 포함되어 있지 않습니다. 그러나 위의 단위가 아래에서 설명하는 측면과 결합될 때, 연구와 코딩의 주제가 됩니다. Lofland 외 연구진이 제시하는 측면은 다음과 같습니다:

  1. 인지적 측면 또는 의미: 이데올로기, 규칙, 자아개념, 정체성 등
  2. 감정적 측면 또는 감정: 건강 관리에서의 동정, 도로 분노, 직장 만족도 등
  3. 위계적 측면 또는 불평등: 인종 불평등, 학대받는 여성, 고등학교 클리크 등

Lofland 외 연구진은 위의 사회적 삶의 크기와 빈도를 조사하는 것 외에도, 참여자의 행위가 구조 및 과정과 어떻게 상호작용하고 상호작용하며, 데이터에서 관찰된 원인과 결과를 조사할 것을 권장합니다(2006, pp. 144–167).

 

이러한 단위측면이 결합되면,

  • Emotion Coding(감정 코딩), Values Coding(가치 코딩), Versus Coding(대조 코딩)과 같은 첫 번째 사이클 코딩 방법에 적합해집니다(3장 참조).
  • 구조와 과정Descriptive Coding(묘사적 코딩), Process Coding(과정 코딩), Domain and Taxonomic Coding(영역 및 분류 코딩)을 통해 파악할 수 있으며,
  • 원인과 결과Causation Coding(인과 코딩), Pattern Coding(패턴 코딩) 또는 근거이론의 두 번째 사이클 코딩 방법을 통해 파악할 수 있습니다(5장 및 Maxwell, 2004 참조).

코딩된 연구자
The coded researcher

3장에서 5장까지 다룬 코딩 예시에서 인터뷰어의 질문, 촉구, 코멘트는 코딩되지 않는 것을 볼 수 있습니다. 이는 연구자의 발언이 이 경우에 더 기능적이며 실질적이지 않기 때문에 코드를 부여할 필요가 없기 때문입니다. 또한 인터뷰를 분석할 때 저는 참여자의 데이터를 우선시합니다. 연구 대상은 저의 인식이 아니라 참여자들의 인식이기 때문입니다. 코딩을 통해 그들의 내러티브를 해석하는 것이 제가 의미를 창출하는 데 기여하는 방식입니다.

 

그러나 인터뷰어와 인터뷰이 간의 대화가 단순한 정보 수집을 넘어 중요한 대화적 교환이나 공동으로 의미를 만들어내는 상호작용이라면, 연구자의 기여도 참여자의 기여와 함께 적절하게 코딩될 수 있습니다. 물론 연구자가 작성한 참여 관찰 현장 노트는 1인칭 시점에서 기술되었으며, 자연스러운 행동을 기록하고 사회적 삶에 대한 중요한 해석 및 잠재적으로 풍부한 분석적 통찰을 포함하고 있기 때문에 충분히 코딩될 가치가 있습니다.

코딩할 데이터의 양
Amounts of data to code

질적 연구 방법론자들 사이에서는 데이터 본문(전체 데이터 집합)에서 어느 정도를 코딩해야 하는지에 대해 의견이 분분합니다.

  • 일부 연구자들은 (예: Friese, 2012; Lofland et al., 2006; Strauss, 1987; cf. Wolcott, 1999) 모든 기록된 현장 연구 세부 사항이 고려할 가치가 있다고 주장합니다. 왜냐하면 일상적이고 사소한 삶의 패턴에서 중요한 사회적 통찰을 얻을 수 있기 때문입니다.
  • 반면에 다수의 연구자들(예: Guest, MacQueen, & Namey, 2012; Morse, 2007; Seidman, 2006)은 연구 질문과 관련된 가장 중요한 부분만 분석할 가치가 있으며, 전체 기록 중 절반에서 3분의 2까지 요약하거나 "삭제"할 수 있으며, 나머지 부분만 집중적인 데이터 분석을 위해 남겨두는 것이 타당하다고 주장합니다.

 

문제는 삭제된 부분에 아직 알지 못하는 중요한 데이터가 포함될 수 있으며, 이것이 전체 데이터를 다시 생각하게 하거나 코드, 범주, 주제, 개념, 주장 또는 이론을 재고하게 할 수 있다는 점입니다. 민족지학적 텍스트에 대한 포스트모던 관점에서는 모든 문서와 보고서가 부분적이고 불완전하다고 간주되기 때문에, 전체 데이터 집합을 유지하고 코딩할 필요성에 대한 논쟁은 무의미할 수도 있습니다. 양에 관계없이 중요한 것은 충분히 질 높은 데이터가 적절하게 전사되고 형식화되었는지 확인하는 것입니다(Poland, 2002 참조).

 

오랜 기간 동안 질적 데이터 분석을 통해 얻은 경험으로, 이제는 데이터에서 중요한 것이 무엇이고 중요하지 않은 것이 무엇인지 더 잘 알 수 있게 되었으며, Auerbach와 Silverstein(2003)이 언급한 바와 같이 "관련 텍스트"만 코딩합니다. Sullivan(2012)는 데이터 집합에서 중요한 구절을 "중요한 순간"으로 식별하고, 동일한 주제의 인터뷰 구절을 "엄선된" 대화식 "사운드 바이트"로 재구성하여 집중적인 주제 또는 담화 분석을 수행합니다. 나머지는 전통적인 영화 편집실처럼 편집 테이블로 떨어지게 됩니다.

 

현장 연구 경력 초기에는 수집된 모든 것을 코딩했습니다. 저는 질적 연구를 처음 시작하는 연구자들에게도 같은 방법을 권장합니다. 경험을 통해 어떤 데이터가 중요한지, 무엇이 중요하지 않은지 점차 발견하게 될 것입니다. 물론, 인터뷰나 현장 노트에서 사소하거나 중요하지 않은 구절들이 흩어져 있을 것입니다. 이러한 구절들은 N/A(해당 사항 없음)으로 코딩하면 됩니다.

 

무엇을 코딩할 것인가? 데이터에서 기록된 사회적 삶의 일면이 코딩됩니다. 이는 참여자의 활동, 인식, 그리고 그들이 만든 문서와 유물들입니다. 자신의 성찰적 데이터, 즉 분석 메모(2장에서 다루는 내용)와 현장 노트에서의 관찰자 코멘트도 코딩할 만한 중요한 자료입니다. 이 과정을 마치 깊이 숨겨진 단서를 찾는 수수께끼나 탐정 소설처럼 다룰 필요는 없습니다. "인간의 행동은 사회적 또는 문화적 의미에 바탕을 두거나 그것에 의해 주입된다. 즉, 의도, 동기, 신념, 규칙, 담론, 그리고 가치"(Hammersley & Atkinson, 2007, p. 7)에 기초한다면, 그 행동과 사회적 의미를 데이터에서 직접 코딩하지 않을 이유가 없습니다. 데이터를 코드, 범주, 분석 메모, 그리고 그래픽 요약의 형태로 생성하는 전체 과정과 결과물은 "메타데이터 활동"이라고 불립니다(MacQueen & Guest, 2008, p. 14).

 

코딩의 기계적 과정
The Mechanics of Coding

코딩을 위해 데이터를 준비하는 것은 데이터에 대한 친숙함을 높이고 몇 가지 기본적인 분석 과정을 시작하게 해줍니다. 이는 더 세부적인 작업을 시작하기 전에 “워밍업”을 하는 것과 같습니다.

데이터 레이아웃
Data layout

텍스트 기반 질적 데이터를 수동으로(즉, 종이와 펜을 이용해) 코딩하고 분석할 때, 인쇄된 인터뷰 전사본, 현장 노트 및 연구자가 생성한 기타 자료를 왼쪽 절반 또는 왼쪽 3분의 2에 두 줄 간격으로 정렬하고, 오른쪽에는 코드를 작성하거나 메모를 기록할 수 있는 넓은 여백을 남겨둡니다. 데이터를 긴 문단으로 나열하는 대신, 주제나 하위 주제가 변하는 것처럼 보일 때마다 텍스트를 짧은 단락 길이의 단위로 나누고 그 사이에 한 줄씩 공백을 두십시오(물론 현실에서는 "사회적 상호작용이 깔끔하고 분리된 단위로 발생하지 않기 때문에" 최대한 맞추는 것이 중요합니다(Glesne, 2011, p. 192)). Gee, Michaels, O'Connor(1992)는 이러한 단위 구분과 이를 담화 분석에서 시처럼 배열한 것을 텍스트의 “stanzas(절)”라고 부르며, “포맷 선택이 분석의 일부이며 의미와 의도를 드러내거나 숨길 수 있다”고 강조합니다(p. 240). 이러한 단위 구분은 나중에 다룰 CAQDAS(Computer-Assisted Qualitative Data Analysis Software) 프로그램에 데이터를 형식화할 때 중요한 역할을 합니다.

 

아래는 중간에 중단 없이 텍스트가 기록된 인터뷰 전사본의 발췌문입니다. 이 참여자는 박사 과정 중간에 인터뷰를 받은 백인 남성 PhD 학생입니다:

PARTICIPANT: 저는 27세이고 50,000달러 이상의 학자금 대출을 갚아야 합니다. 
그게 정말 두렵습니다. 저는 내년에 논문을 끝내야 합니다. 학교에 더 이상 다닐 
돈이 없기 때문입니다. 취직을 해서 일을 시작해야 합니다.
INTERVIEWER: 어떤 직업을 원하나요?
PARTICIPANT: 대학교 어디에서든지 교수직을 원합니다.
INTERVIEWER: 특정한 지역이 있나요?
PARTICIPANT: 저는 동부로 돌아가서 그곳의 주요 대학들 중 한 곳에서 일하고 싶습니다. 
하지만 직업이 있는 곳이라면 어디든 열려 있습니다. 졸업반 친구들인 Jake와 Brian이 
교수직 인터뷰를 받고 거절당하는 것을 듣는 것은 힘듭니다. 백인 남성으로서, 고용될 
가능성이 줄어들었습니다.
INTERVIEWER: 대부분의 고용주는 인종과 상관없이 가장 적합한 사람을 찾으려고 한다고 생각합니다.
PARTICIPANT: 아마도요. 좋은 추천서를 받으면 도움이 될 것입니다. 제 성적은 정말 좋았고 
저는 여러 학회에서 제 이름을 알리고 있습니다.
INTERVIEWER: 그것이 모두 중요합니다.
PARTICIPANT: 기획서는 첫 번째 단계입니다. 음, IRB[Institutional Review Board 승인]가 첫 번째 
단계죠. 저는 이번 여름에 문헌 검토를 시작하고, 가을에는 인터뷰와 참여 관찰을 하고, 
논문을 작성하며, 봄까지 끝낼 예정입니다.
INTERVIEWER: 만약 논문을 더 오래 해야 한다면 어떻게 할 건가요?
PARTICIPANT: 저는 봄까지 끝내야 합니다.

 

위와 같은 포맷되지 않은 발췌문은 CAQDAS 프로그램에 그대로 입력될 수 있습니다. 하지만 수동 코딩을 위해서나 선택된 CAQDAS 프로그램의 일부 예비 형식화 작업을 위해, 인터뷰 텍스트를 주제나 하위 주제가 변화하는 곳에서 구분하여 단위나 절로 나눌 수 있습니다. 각 절은 고유한 코드를 받을 수 있는 단위가 될 수 있습니다. 또한 이름을 줄이거나 코딩되지 않은 구절을 괄호 안에 넣는 등 필요한 다른 형식화 작업도 데이터 준비 과정에서 처리할 수 있습니다:

P: 저는 27세이고 50,000달러 이상의 학자금 대출을
갚아야 합니다. 그게 정말 두렵습니다. 저는 내년에
논문을 끝내야 합니다. 학교에 더 이상 다닐 돈이 없기
때문입니다. 취직을 해서 일을 시작해야 합니다.
[I: 어떤 직업을 원하나요?]
P: 대학교 어디에서든지 교수직을 원합니다.
[I: 특정한 지역이 있나요?]
P: 저는 동부로 돌아가서 그곳의 주요 대학들 중 한 곳에서
일하고 싶습니다. 하지만 직업이 있는 곳이라면 어디든 열려
있습니다. 졸업반 친구들인 Jake와 Brian이 교수직 인터뷰를 받고
거절당하는 것을 듣는 것은 힘듭니다. 백인 남성으로서, 고용될
가능성이 줄어들었습니다.
[I: 대부분의 고용주는 인종과 상관없이 가장 적합한 사람을
찾으려고 한다고 생각합니다.]
P: 아마도요.
좋은 추천서를 받으면 도움이 될 것입니다. 제 성적은 정말 좋았고
저는 여러 학회에서 제 이름을 알리고 있습니다.
[I: 그것이 모두 중요합니다.]
P: 기획서는 첫 번째 단계입니다. 음, IRB[Institutional Review
Board 승인]가 첫 번째 단계죠. 저는 이번 여름에 문헌 검토를
시작하고, 가을에는 인터뷰와 참여 관찰을 하고, 논문을 작성하며,
봄까지 끝낼 예정입니다.
[I: 만약 논문을 더 오래 해야 한다면 어떻게 할 건가요?]
P: 저는 봄까지 끝내야 합니다.

 

위의 인터뷰 발췌문은 4장에서 다루는 Eclectic Coding의 프로파일에서 코딩되고 분석될 예정입니다.

사전 코딩 (Pre-coding)

코드를 단어와 짧은 구로만 작성하는 것 외에도, 중요한 참여자 인용문이나 구절을 동그라미로 표시하거나, 강조하거나, 굵게 표시하거나, 밑줄을 긋거나, 색상을 칠하는 사전 코딩(pre-coding)을 할 기회를 절대 놓치지 말아야 합니다(Layder, 1998). 이는 Boyatzis(1998)가 말한 주목할 만한 "코딩 가능한 순간(codable moments)"을 강조하는 방식입니다. Creswell(2013, p. 205)은 CAQDAS 프로그램 파일에 저장된 데이터에서 발견된 인용문을 QUOTES로 코딩하면서 다른 코드와 함께 저장하면 나중에 검색하기 쉽게 된다고 권장합니다. 일부 프로그램에는 흥미로운 인용문을 저장하고 나중에 접근할 수 있는 전용 공간이 마련되어 있습니다. 이러한 데이터는 연구 과정에서 당신의 주장이나 이론을 뒷받침하는 중요한 증거로 작용할 수 있으며, 보고서 전반에 걸쳐 설명의 예시로 활용될 수 있습니다(Booth, Colomb, & Williams, 2003; Erickson, 1986; Lofland et al., 2006).

 

특히 인용문이나 코드가 매우 도발적이거나 인상적일 경우, 보고서의 제목이나 조직 체계, 주제를 관통하는 핵심 요소로 사용할 수도 있습니다. 예를 들어, 제가 초등학교 아이들과 함께 진행한 사회 변화를 위한 연극(극단적 억압 극장) 연구에서, 아이들이 불균형한 권력 문제를 해결하기 위해 계속해서 공격적인 전술을 사용하는 이유가 궁금했습니다. 제가 그들에게 평화 구축 노력을 가르치려 했기 때문입니다. 그러나 한 4학년 여학생이 "때로는 억압을 해결하려면 착하게 대할 수 없어요"라고 말하며 제 의문에 답했습니다(Saldaña, 2005b, p. 117). 이 인용문은 너무 강력해서 제 최종 연구 보고서의 시작을 장식하며, 독자의 관심을 끌고 연구의 주제를 설명하는 중요한 요소가 되었습니다.

 

Bernard와 Ryan(2010)은 워드 프로세싱 소프트웨어의 리치 텍스트 기능을 사용하여 데이터가 전사되는 동안 초기 코딩 및 범주화를 쉽게 할 수 있다고 권장합니다. 예를 들어, 감기에 관한 건강 연구에서 참가자들이 자신의 경험을 이야기할 때, "징후와 증상은 이탤릭체로 표시되고, 치료 및 행동 수정은 밑줄로, 진단은 굵은 글씨로 태그된다"라고 설명합니다(p. 91). 현장 노트 또한 리치 텍스트 기능을 사용하여 코딩 및 분석 검토 전에 한눈에 구분할 수 있습니다:

  • 기술적 서술: 현장 노트의 설명적 서술은 일반 글꼴로 기록됩니다.
  • 인용문: 참여자가 말한 내용은 굵은 글꼴로 기록됩니다.
  • OC: 관찰자의 의견: 연구자의 주관적 인상이나 분석적 메모는 이탤릭체로 표시됩니다.

초기 메모 (Preliminary Jottings)

데이터 수집과 형식화가 진행되는 동안 코딩을 시작하세요. 현장 노트를 작성하거나 녹음된 인터뷰를 전사하거나 현장에서 수집한 문서를 정리할 때, 메모지나 전사본, 문서 자체에 예비적인 단어 또는 구를 기록하거나, 분석 메모 또는 연구 일지에 기록하여 나중에 참고할 수 있도록 하세요. 이 단계에서는 정확하거나 최종적인 코드를 작성할 필요는 없습니다. 단지 연구가 진행되는 동안 분석적으로 고려할 수 있는 아이디어를 떠올리는 데 중점을 두세요. 미래에 쓸 내용을 기억에 의존하지 말고, 떠오르는 생각을 어떻게든 기록해 두는 것이 중요합니다.

 

또한, 이러한 코드 메모들이 데이터 본문과 명확히 구분되도록 괄호, 대문자, 이탤릭체 또는 굵은 글씨로 표시하는 등 구분하세요. LiamputtongEzzy(2005, pp. 270-273)는 데이터를 두 개의 열이 아닌 세 개의 열로 형식화할 것을 권장합니다. 첫 번째이자 가장 넓은 열에는 데이터 자체(인터뷰 전사본, 현장 노트 등)가 포함됩니다. 두 번째 열에는 예비 코드 메모 및 기록을 위한 공간이 있고, 세 번째 열에는 최종 코드가 나열됩니다. 두 번째 열의 첫 인상이나 생각은 원시 데이터와 최종 코드 사이의 전환을 제공하는 데 도움이 될 수 있습니다:

COLUMN 1              | COLUMN 2              | COLUMN 3
Raw Data              | Preliminary Codes     | Final Code
--------------------- | --------------------- | ---------------------
The closer I get to   | RETIREMENT ANXIETY    | "retirement age"
retirement age, the   | "retirement age"      | 
faster I want it to   |                       | 
happen. I'm not even  | financial obligations | 
55 yet and I would    | dreams of early       |
give anything to      | retirement            | 
retire now. But       |                       | 
there's a mortgage to |                       |
pay off and still a   |                       |
lot more to sock      |                       |
away in savings before|
I can even think of   |
it. I keep playing    |
the lottery, though,  |
in hopes of winning   |
those millions. No    |
luck yet.             |

 

제 학생들 중 일부는 분석 초기 단계에서 특정 데이터 단위에 대해 예비적인 코드를 오른쪽 여백에 기록하고, 왼쪽 여백에는 나중에 작성할 분석 메모를 위한 더 넓은 주제나 해석적 메모를 포함시키는 경우도 있습니다(2장 참조).

 

거의 모든 방법론자들은 분석 메모를 작성하거나 여백에 잠정적인 코드, 주제, 눈에 띄는 패턴 또는 주제를 기록하면서 데이터를 처음부터 꼼꼼히 읽어보라고 권장합니다. 코딩할 때 코드 단어나 구를 약어로 쓰기보다는 완전하게 작성하는 것이 좋습니다. "PROC-AN CD"나 "122-A"와 같은 약어는 분석 중 뇌가 불필요하게 복잡한 해석 과정을 거쳐야 하므로 피해야 합니다.

코딩 중 고려해야 할 질문들
Questions to consider as you code

AuerbachSilverstein(2003, p. 44)은 연구 과정에서 불안감을 줄이고 코딩 결정을 집중시키기 위해, 연구 문제, 이론적 틀, 중심 연구 질문, 연구 목표 등의 중요한 사항을 한 페이지에 요약해 두고 참조할 것을 권장합니다. Emerson 외(2011)는 연구 목적과 상관없이, 현장 노트를 코딩할 때 고려할 수 있는 일반적인 질문 목록을 다음과 같이 제안합니다:

  • 사람들이 무엇을 하고 있습니까? 그들이 이루고자 하는 것은 무엇인가요?
  • 그들은 정확히 어떻게 이것을 하고 있습니까? 어떤 특정한 수단 및/또는 전략을 사용하고 있나요?
  • 구성원들은 현재 상황을 어떻게 이야기하고, 묘사하며, 이해하고 있나요?
  • 그들이 하고 있는 가정은 무엇인가요?
  • 여기에서 나는 무엇을 보고 있나요?
  • 이 노트를 통해 무엇을 배웠나요?
  • 왜 이것을 포함했나요? (p. 177)

저는 이 목록에 제가 코딩 및 데이터 분석의 모든 과정에서 스스로에게 묻는 질문인 “무엇이 눈에 띄는가?”를 추가하고 싶습니다. SunsteinChiseri-Strater(2007)는 프로젝트의 모든 단계에서 현장 연구자들이 다음과 같은 질문을 스스로에게 던지기를 제안합니다:

  • 무엇이 나를 놀라게 했는가? (자신의 가정을 추적하기 위해)
  • 무엇이 나를 흥미롭게 했는가? (자신의 입장을 추적하기 위해)
  • 무엇이 나를 불편하게 했는가? (자신의 가치, 태도, 신념 체계 내에서의 긴장을 추적하기 위해) (p. 106)

//나는 이 곳에서(가정), 저쪽을(관점 - 입장), 앉아서(자세 - 가치/태도/신념) 본다.

- 땅이 무너지면 놀람

- 흥미로운 곳으로 시선이 향함 

- 앉아 있다가 엎드리거나 서려면 불편함

대조적인 데이터 코딩
Coding contrasting data

여러 명의 참가자와 함께 연구를 진행하는 경우, 먼저 한 참가자의 데이터를 코딩한 후 두 번째 참가자의 데이터로 진행하는 것이 도움이 될 수 있습니다. 두 번째 데이터 세트가 첫 번째 참가자의 데이터를 재코딩하게 만들거나 나머지 참가자들의 데이터 코딩에 영향을 줄 수 있습니다. 동일한 방식은 인터뷰 전사본에 먼저 코딩 시스템을 적용한 후, 현장 노트나 문서에도 적용할 때도 유효합니다. Bazeley(2007)는 두 번째로 코딩하는 문서는 첫 번째 문서와 “어떤 중요한 측면에서 대조적이어야 한다”고 제안하여, 개념의 다양성을 최대한 일찍 이끌어낼 수 있다고 설명합니다(p. 61).

 

또한, 선택한 코딩 방법에 따라 특정 유형의 데이터에서 일부 코드가 다른 코드보다 더 자주 나타날 수 있음을 인식해야 합니다. CAQDAS 프로그램의 선택 기능은 분석이 진행되는 동안 코드와 그 빈도에 대한 추적을 도와줍니다.

코딩의 개수
The Numbers of Codes

각 프로젝트에서 생성하는 코드, 범주, 주제 또는 개념의 실제 개수는 많은 맥락적 요소에 따라 달라질 수 있습니다. 그러나 학생들이 가장 많이 묻는 질문 중 하나는 "코드가 얼마나 자주 적용되어야 하느냐"입니다. 이에 대한 답은 데이터의 특성, 선택한 코딩 방법, 그리고 얼마나 세부적으로 분석하고자 하는지에 따라 달라집니다. 즉, 다양한 필터를 고려해야 한다는 의미입니다.

데이터를 "통합"하고 "분리"하는 방식
“Lumping” and “splitting” the data

다음 데이터 발췌문은 K-8 학년을 담당하는 2년 차 도심 학교 교사가 교육 전공자들에게 연설하는 내용에서 발췌한 것입니다(Saldaña, 1997). 이 교사는 자신의 어려운 학생들에 대한 일화를 이야기하고 나서 다음과 같은 말을 했습니다. 여기서 In Vivo Coding 방법이 적용되어 이 145단어의 발췌문에 단 하나의 코드만 부여되었습니다. 이 방법은 Holistic Coding(전체 코딩)이라 불리며, 넓은 붓질처럼 대상을 포착하고 표현하는 방법입니다:

1 나는 여러분을 우울하게 하거나 겁주려는 게 아닙니다. 하지만 이것은 나에게는 현실이었습니다. 
저는 이 인구 집단을 위해 준비가 되어 있다고 생각했습니다. 왜냐하면 다른 그룹의 아이들을 가르친 경험이 있었기 때문입니다. 
그러나 이것은 매우 독특한 상황입니다. 도심 학교 말입니다. 아니, 그 말을 취소해야겠네요. 
더 이상 이것이 독특한 상황이 아닙니다. 점점 더 많은 학교가 도심 학교로 변하고 있습니다. 
저는 정말로 아이들에 대해 배워야 했습니다. 그들의 문화를 배워야 했고, 그들의 언어를 배워야 했고, 
갱 신호를 배워야 했고, 허용되는 음악이 무엇인지, 특정 요일에 어떤 티셔츠를 입을 수 있고 
어떤 요일에는 입을 수 없는지 배워야 했습니다. 배워야 할 것이 정말 많았고, 
그것에 대해 생각조차 못했습니다.

 

이 방법은 “lumper(통합자)” 코딩이라고 불립니다. 이와 반대되는 방식은 데이터를 더 작은 코딩 가능한 순간으로 나누는 "splitter(분리자)" 코딩입니다(Bernard, 2011, p. 379). 동일한 발췌문을 In Vivo Coding으로 더 세분화하여 코딩하면 다음과 같습니다:

1 나는 여러분을 우울하게 하거나 겁주려는 게 아닙니다. 하지만 이것은 나에게는 1 “REALITY”
   현실이었습니다.
2 나는 이 인구 집단을 위해 준비가 되어 있다고 생각했습니다. 2 “I THOUGHT I WAS SO READY”
   왜냐하면 다른 그룹의 아이들을 가르친 경험이 있었기 때문입니다.
3 그러나 이것은 매우 3 “UNIQUE SITUATION” 독특한 상황입니다. 도심 학교 말입니다.
4 더 이상 이것이 독특한 상황이 아닙니다. 점점 더 많은 학교가 4 “INNER CITY SCHOOLS”
   도심 학교로 변하고 있습니다.
5 나는 정말로 아이들에 대해 배워야 했습니다. 5 “I REALLY HAD TO LEARN”
6 나는 그들의 문화를 배워야 했고, 그들의 언어를 배워야 했고, 6 “THE CULTURE”
   갱 신호를 배워야 했고, 허용되는 음악이 무엇인지,
   특정 요일에 어떤 티셔츠를 입을 수 있고 어떤 요일에는 입을 수 없는지 배워야 했습니다.
7 배워야 할 것이 정말 많았고, 그것에 대해 생각조차 못했습니다. 7 “A LOT TO LEARN”

 

이제 이 145단어의 발췌문에는 한 개의 코드가 아닌 일곱 개의 코드가 적용되었습니다. 여기서 코드의 수가 많다고 해서 더 낫다는 것도 아니고, 적다고 해서 더 낫다는 것도 아닙니다.

  • 대신 lumper(통합자) 방식은 빠르게 현상을 범주화하는 방법이며, 추후 더 세부적인 하위 코딩이 가능할 수 있지만, splitter(분리자) 방식은 처음부터 더 미세한 분석을 생성합니다. 두 접근 방식 모두 시간과 정신적 에너지가 다르게 요구된다는 점에서 장단점이 있습니다.
  • lumper 방식은 현상의 본질을 빠르게 파악할 수 있지만, 지나치게 단순화된 분석으로 이어질 수 있습니다. 반면, splitter 방식은 데이터를 신중하게 검토하게 하지만, 너무 많은 세분화로 인해 나중에 코드를 범주화할 때 분석가를 압도할 수 있습니다.

 

문헌에서 전문가들의 견해는 다양합니다.

  • Stern(2007)은 “라인별 코딩 분석을 절대 하지 않는다. 건너뛰어야 할 것이 너무 많기 때문이다. 대신 데이터를 훑어보고 상위에 떠오르는 [가장 중요한] 것을 찾는 방식으로 진행한다”고 인정합니다(p. 118).
  • 반면, Charmaz(2008)는 자세한 라인별 코딩이 신뢰할 수 있는 분석을 촉진하며, "응답자와 수집된 데이터에 대해 자신의 동기, 두려움, 또는 해결되지 않은 개인적인 문제를 투영할 가능성을 줄인다"고 조언합니다(p. 94).

두 번째 사이클 코딩에서는 첫 번째 사이클에서 생성된 코드의 수를 재분석하여 더 큰 텍스트 단위에 하나의 주요 코드를 적용함으로써 코드를 축소할 수 있습니다. 경험을 통해 어떤 접근 방식이 자신의 연구와 연구 목표에 가장 적합한지 알 수 있을 것입니다.

코드의 양적 범위
The quantities of qualities

  • Friese(2012)최종 코드의 개수가 수천 개에 달하지 않도록 해야 하며, 총 120~300개의 코드가 적절하다고 권장합니다(p. 73).
  • 보다 겸손하게 Lichtman(2010)은 대부분의 교육 분야 질적 연구에서 80~100개의 코드를 생성하고, 이를 15~20개의 범주와 하위 범주로 조직하며, 궁극적으로 5~7개의 주요 개념으로 통합된다고 제시합니다(p. 194).
  • Creswell(2013)은 처음에 다섯에서 여섯 개의 잠정적인 코드(Provisional Codes)로 분석을 시작하며, 이 과정을 통해 25~30개의 범주로 확장되고, 다시 다섯에서 여섯 개의 주요 주제로 통합된다고 설명합니다(pp. 184–5).
  • 다양한 질적 연구 접근법이나 학문 분야에 따라 분석의 지침이 달라질 수 있지만, MacQueen 외(2009)는 연구자들이 한 번에 30~40개의 코드를 다루는 것이 적당하다고 관찰합니다(p. 218).

 

최종적으로 도출된 주요 주제나 개념의 개수는 분석의 일관성을 유지하기 위해 최소화해야 하지만, 이를 달성하기 위한 정해진 숫자는 없습니다. Lichtman의 다섯에서 일곱 개의 중심 개념, Creswell의 다섯에서 여섯 개의 주요 주제와 달리, 인류학자 Harry F. Wolcott(1994)는 세 가지의 주요 항목을 도출하는 것이 질적 연구 보고서에서 가장 우아한 양이라고 권장합니다(p. 10).

 

코드북 또는 코드 목록
The codebook or code list

코드의 수는 분석이 진행되면서 빠르게 누적되고 변할 수 있으므로, 분석이 진행되는 동안 코드북을 별도의 파일로 유지하는 것이 좋습니다. 코드북은 생성된 코드, 해당 코드의 내용 설명, 그리고 참고용으로 사용할 수 있는 데이터 예시를 기록한 것입니다. CAQDAS 프로그램은 기본적으로 프로젝트에서 생성된 코드 목록을 유지하며, 이를 정의할 수 있는 공간을 제공합니다. 코딩이 진행되면서 이 목록을 주기적으로 검토하고 화면이나 하드 카피로 확인하여 현재 목록과 그 진화를 평가할 수 있습니다. 이 목록을 유지하면 코드를 주요 범주와 하위 범주로 조직하고 재조직하는 분석 기회를 제공하게 됩니다. 또한, 여러 참가자와 연구 사이트에서 작업할 때 비교 목록을 제공하는 유용한 관리 기술이기도 합니다. 예를 들어, 한 학교 사이트에서 생성된 코드 목록은 다른 학교 사이트의 코드 목록과 상당히 다를 수 있습니다.

 

BernardRyan(2010)은 더 간결한 코드 수를 가진 연구의 경우, 코드북의 각 항목이 다음과 같은 항목을 포함할 수 있다고 조언합니다:

  • 짧은 설명: 코드 자체의 이름
  • 자세한 설명: 코드가 부여된 데이터의 특성이나 속성을 설명하는 1~3문장
  • 포함 기준: 해당 코드가 적용될 데이터 또는 현상의 조건
  • 제외 기준: 코드가 적용되지 않는 데이터 또는 현상의 예외 사례
  • 전형적인 예시: 코드를 가장 잘 대표하는 데이터의 몇 가지 예시
  • 비전형적인 예시: 극단적이거나 특별한 예시이지만 여전히 코드를 나타내는 데이터
  • "유사하지만 다른" 데이터: 이 코드에 잘못 할당될 수 있는 데이터 예시

또한 코드북은 인덱스와는 다릅니다. 인덱스는 데이터 본문을 코딩하여 알파벳순, 계층적, 연대기적 또는 범주적으로 구성한 종합적인 데이터 목록입니다. CAQDAS 프로그램은 질적 데이터 인덱싱 기능에 있어서 매우 우수합니다.

수동 코딩과 CAQDAS 코딩
Manual and CAQDAS Coding

통계 및 양적 데이터 분석을 가르치는 일부 교수들은 학생들이 먼저 손계산을 통해 공식을 이해하고 결과에 대한 인식을 높이도록 합니다. 계산기만을 사용하여 수동으로 통계 검정을 수행한 후, 전용 소프트웨어를 사용하여 더 큰 규모의 데이터를 처리하는 방식으로 진행됩니다. 질적 데이터 분석에서도 이와 비슷한 접근 방식을 사용합니다. 저 역시 학생들에게 데이터를 수동으로 코딩하고 분석하는 과정을 요구하는 교수 중 한 명입니다. 학생들의 과제는 소규모 데이터 수집 프로젝트로, 종이와 펜을 사용하여 기본 워드 프로세싱 소프트웨어에서 작성된 데이터를 수동으로 코딩하고 분석할 수 있습니다. 하지만 다수의 참가자 인터뷰, 장기간의 현장 연구, 그리고 방대한 현장 노트가 필요한 연구 프로젝트의 경우 CAQDAS(Computer-Assisted Qualitative Data Analysis Software)는 필수적인 도구가 됩니다.

 

Basit(2003)는 수동 코딩과 전자 코딩 간의 개인적인 경험을 비교하며, "선택은 프로젝트의 규모, 사용 가능한 자금과 시간, 그리고 연구자의 성향과 전문성에 따라 달라질 것"이라고 결론을 내렸습니다(p. 143). 여기에 저는 연구 목표와 전자 코딩 시스템에 대한 만족도 역시 고려해야 한다고 덧붙이고 싶습니다. Gallagher(2007)와 그녀의 연구팀은 CAQDAS를 사용하여 다중 사이트 민족지학 연구를 시작했으나, 소프트웨어가 데이터 관리에는 효과적이었지만 데이터 분석의 복잡성을 다루는 데는 부족하다는 것을 금세 깨달았습니다. 그녀는 다음과 같이 설명합니다:

"이 소프트웨어는 스타일은 제공했지만, 우리가 추구하던 세부적이고 복잡한 분석에는 적합하지 않았습니다. 결국, 우리는 질적 데이터의 양과 복잡성, 그리고 그와 관련된 맥락을 존중하는 수동 코딩 시스템으로 돌아갔습니다." (pp. 71, 73)

 

수동 코딩으로 협업하는 것은 연구 팀에게도 쉽지 않은 일입니다. 하지만 CAQDAS 파일을 여러 팀원이 서로 다른 시간에 공유하고 접근하게 되면, 작업의 복잡성은 기하급수적으로 증가합니다.

수동 코딩의 장점

  • 데이터에 대한 직접적인 상호작용을 통해 연구자가 데이터를 더 깊이 이해할 수 있습니다.
  • 소규모 프로젝트의 경우, 비용 효율적이고 간단한 접근 방식을 제공할 수 있습니다.
  • 데이터의 맥락과 복잡성을 더 잘 반영할 수 있습니다.

CAQDAS의 장점

  • 대규모 프로젝트에서는 데이터 관리와 코딩 효율성을 극대화할 수 있습니다.
  • 여러 참가자의 데이터를 신속하게 처리하고, 체계적으로 정리할 수 있습니다.
  • 특정 기능을 통해 다양한 코드를 추적하고, 코드의 빈도를 분석하는 데 유용합니다.

결론적으로, 연구의 크기, 예산, 시간, 그리고 연구 목표에 따라 수동 코딩과 CAQDAS의 선택이 결정될 수 있으며, 양쪽 모두 연구 상황에 맞게 적절히 사용될 수 있는 방법론적 도구입니다.

단독 코딩과 팀 코딩
Solo and Team Coding

대부분의 질적 연구에서 코딩은 연구자가 자신의 데이터와 밀접하게 작업하는 개인적인 작업입니다. Galman(2007)이 말한 "외로운 민족지학자"처럼 연구자가 혼자서 데이터를 처리하는 경우가 많습니다. 그러나 대규모 현장 연구 프로젝트에서는 팀이 함께 코딩을 진행하는 경우도 있습니다.

협업 코딩
Coding collaboratively

Erickson & Stull(1998), Guest & MacQueen(2008), Schreier(2012) 등의 학자들은 공동 연구 프로젝트에서 코딩이 협력적인 작업이 될 수 있고, 그렇게 되어야 한다고 주장합니다. 여러 연구자의 의견은 데이터를 분석하고 해석하는 여러 관점을 가져오며, 팀의 협력이 새로운 코드나 더 풍부한 코드를 생성할 수 있습니다. Weston 외(2001)“연구팀이 코드를 만들고, 코딩은 팀을 만들어 연구 중인 현상에 대한 공유된 해석과 이해를 창출한다”고 설명합니다(p. 382).

 

팀원들은 때때로 개인적으로 진행한 코딩 작업을 조율하여 데이터베이스 및 다중 사용자 CAQDAS 시스템을 사용할 경우, 코딩 작업이 일관성을 유지하도록 해야 합니다. MacQueen 외(2008)는 한 명의 팀원이 “코드북 편집자” 역할을 맡아 코드 목록을 생성하고, 업데이트하고, 수정하며, 이를 유지하는 것이 중요하다고 강조합니다.

 

행동 연구커뮤니티 기반 연구를 진행하는 연구에서는 연구 참여자나 이해관계자를 분석 과정에 초대하여, 데이터 분석 및 사회 변화에 대한 권고 사항에 대한 소유감과 참여감을 느끼게 할 수 있습니다(Stringer, 1999). Northcutt & McCoy(2004)는 참여자들이 자신이 관심 있는 범주를 개발하는 것을 “친화성”이라고 명명합니다. 또한 어린이와 청소년도 자신들의 사회적 세계와 관련된 문제를 조사하고 분석하는 방법을 배울 수 있습니다(Alderson, 2008; Heiligman, 1998; Warren, 2000).

 

Haw & Hadfield(2011), Heath 외(2010)는 데이터 세션을 열어 동료 연구자 또는 때로는 참여자들을 초대하여 현장 연구의 비디오 조각을 함께 검토하고 관련된 여러 연구 문제에 대해 협력적으로 논의하는 과정을 소개합니다. 이 같은 대화적 아이디어 교환은 연구팀이 비디오에 대한 더 심층적인 분석을 진행하기 전에 다양한 관점을 고려할 수 있게 합니다.

 

팀원들은 자신이 수집한 데이터뿐만 아니라 다른 팀원이 수집한 데이터를 코딩함으로써 더 넓은 분석 범위를 제공하고 상호 검증을 할 수 있습니다. 이러한 협업 작업에서는 코더 간 일치도(intercoder agreement) 또는 해석적 수렴이 중요한 요소입니다. 여러 코더가 특정 데이터에 대해 동일한 코드를 할당하는 비율을 측정하는 것이 중요합니다(자세한 공식 및 논의는 Bernard(2011), Boyatzis(1998), DeCuir-Gunby 외(2011), Hruschka 외(2004), Krippendorff(2009) 참조). 질적 연구에서 표준적인 일치 비율은 없지만, 80~90% 정도의 일치율이 최소한의 기준으로 간주됩니다. Kappa Coefficient와 같은 측정 도구는 MAXQDA 10NVivo 9와 같은 소프트웨어에 포함된 기능입니다.

 

그러나 일부 방법론자들은 질적 데이터 분석에서 코더 간 일치도의 유용성을 의문시합니다. 코딩 자체가 해석적 과정이기 때문에, 연구팀은 이러한 양적 측정을 완전히 배제하고 집단 토론, 대화적 상호주관성(dialogical intersubjectivity), 또는 단순한 집단 합의에 의존할 수도 있습니다(Harry 외, 2005; Kvale & Brinkmann, 2009; Sandelowski & Barroso, 2007).

 

"위원회에 의한 코딩"은 데이터의 양과 복잡성, 그리고 연구자들 간의 성격 차이에 따라 원활하게 진행되거나 좌절될 수 있습니다. 팀의 크기는 5명 이하로 구성하는 것이 문제 해결과 의사 결정을 훨씬 수월하게 할 수 있습니다. 또한, 코딩이 진전되지 않거나 전문가 간 의견 불일치가 발생할 경우를 대비한 전략과 대비책을 미리 마련하는 것이 현명합니다.

 

저는 개인적으로 연구 프로젝트에서 "혼자 코딩하는 것(lone wolf coder)"을 선호하지만, 팀원들에게 제가 코딩한 데이터를 검토할 수 있는 기회를 제공하며, 그들이 제 분석을 엄격하게 검토하고 감사하는 역할을 수행하도록 권장합니다.

혼자 코딩하기
Coding solo

혼자서 민족지학 연구를 진행할 경우, 코딩과 분석 과정을 진행하는 동안 동료나 멘토와 상의하는 것이 도움이 됩니다. 혼자 코딩하는 경우에도, 팀 단위 코더와 마찬가지로 분석 과정에서 참여자들과 상의할 수 있습니다. 이 과정은 "회원 확인(member checking)"이라고 불리며, 지금까지의 결과를 검증하는 방법으로 활용됩니다. 또한, 연구 세미나에 참석하는 다른 구성원들이 각기 다른 프로젝트를 진행하고 있더라도, 코딩된 현장 노트 발췌문을 공유하고 코딩 및 분석에 대한 딜레마를 논의하는 것은 동료 간의 지원을 받을 수 있는 좋은 기회입니다. 이러한 논의를 통해 여러분 자신과 다른 사람 모두가 범주 사이의 더 나은 연결성을 찾는 데 도움을 받을 수 있습니다(Burant 외, 2007; Strauss, 1987).

 

논의는 자신의 내부 사고 과정을 표현할 기회를 제공할 뿐만 아니라, 떠오르는 아이디어를 명확히 하고, 데이터를 새로운 방식으로 통찰할 수 있는 기회를 열어줍니다. Ezzy(2002)는 현장에서 분석 진행 상황을 확인하기 위한 몇 가지 전략을 제안합니다. 이는 팀 연구자들에게도 적용될 수 있지만, 혼자 연구하는 연구자에게 특히 유용한 다음과 같은 권장 사항입니다:

  1. 지금까지 발전시킨 해석을 참여자들과 확인하기
  2. 인터뷰 데이터를 전사하면서 즉시 코딩 시작하기
  3. 연구 프로젝트에 대한 반성적 저널을 유지하며, 충분한 분석 메모 작성하기

이러한 전략을 통해 자신의 분석이 신뢰할 만한지 평가하고, 지속적으로 발전시킬 수 있습니다.

 

 

코딩을 위한 필수 개인 속성

Necessary Personal Attributes for Coding

 

귀납, 연역, 가설 설정(abduction), 종합, 평가, 논리적 및 비판적 사고와 같은 인지적 기술 외에도, 질적 연구자들이 특히 코딩 과정에서 갖춰야 할 일곱 가지 개인적 속성이 있습니다.

 

첫째, 조직 능력이 필요합니다.

  • 이것은 일부 사람들에게만 주어지는 선천적인 능력이 아니라, 습관으로 배양할 수 있는 규율 있는 기술입니다. 소규모 질적 연구의 데이터는 수만에서 수십만 단어에 이를 수 있습니다. 생성된 여러 코드는 질적 분석을 위한 체계적으로 조직된 틀이 필요합니다. 사실, 조직화 자체가 분석입니다. 하드 드라이브와 CAQDAS와 같은 전자 파일 시스템이 있더라도, 여전히 많은 양의 종이 데이터를 다루고 조작해야 할 것입니다. 들어오는 모든 데이터를 날짜와 레이블로 기록하고, 디지털 및 종이 형태의 백업을 여러 개 유지하세요.

 

둘째, 인내심을 가져야 합니다.

  • 거의 모든 질적 연구 방법 문헌 저자들이 데이터를 코딩하는 과정이 도전적이며 시간이 많이 소요된다고 언급합니다. 일부 저자들은 이 과정이 얼마나 지루하고 좌절감을 줄 수 있는지에 대해서도 말합니다. 필요할 때에는 휴식을 취하세요. 이는 신선한 상태와 경계를 유지하는 데 도움이 될 것입니다. 그러나 개인적인 작업 윤리를 개발하고, 분석 작업에 전적으로 집중할 수 있는 환경과 일정을 만들어야 합니다.

 

셋째, 모호성을 다룰 수 있는 능력이 필요합니다.

  • 코딩과 코딩 체계화는 따라야 할 특정 알고리즘이나 절차가 있는 정확한 과학이 아닙니다. 때때로 답이 갑작스럽게 그리고 우연히 명확해질 수 있지만, 때로는 분석의 퍼즐 조각이 며칠, 몇 주, 심지어 몇 달 동안 맞춰지지 않을 수도 있습니다. 풍부한 아이디어는 시간이 필요하므로, 이러한 아이디어가 적시에 떠오를 수 있다는 자신감을 가지세요. 그러나 분석 메모 작성으로 이 과정을 가속화할 수 있다는 점도 기억하세요.

 

넷째, 유연성을 발휘해야 합니다.

  • 코딩은 순환적인 과정으로, 한 번이 아니라 두 번, 때로는 그 이상으로 재코딩해야 할 수 있습니다. 거의 아무도 첫 시도에서 완벽하게 코딩하지 못합니다. 초기 방법이 효과가 없거나 필요한 답을 제공하지 못한다고 느끼면, 접근 방식을 유연하게 바꿔보세요. 대부분의 연구자들이 개발한 코딩 체계는 처음부터 고정되어 있지 않고, 분석이 진행됨에 따라 진화합니다.

 

다섯째, 창의력이 필요합니다.

  • 사회과학에는 많은 예술적 요소가 포함되어 있습니다. 저명한 민족지학자 Michael H. Agar(1996)는 분석 초기 단계에서 "약간의 데이터와 많은 우뇌 활동"이 필요하다고 주장합니다(p. 46). 우리는 질적 연구자들이 데이터를 근본적으로 깊이 탐구해야 한다고 일반적으로 권장하지만, 여러분이 구축하거나 선택하는 모든 코드와 범주는 다양한 선택지 중에서 선택된 것입니다. 창의력은 시각적으로 생각하고, 비유적으로 생각하며, 문제를 해결하는 다양한 방법을 모색할 수 있는 능력입니다. 창의력은 데이터 수집, 데이터 분석, 그리고 최종 보고서 작성에서도 필수적입니다.

 

여섯째, 철저한 윤리 의식이 필요합니다.

  • 이는 정직함으로도 설명될 수 있지만, 저는 일부러 이 표현을 선택했습니다. 이 말은 참여자에게 항상 엄격하게 윤리적으로 대하고 그들을 존중하며, 데이터를 다룰 때 윤리적으로 문제되는 텍스트 부분을 무시하거나 삭제하지 않고, 분석에 있어서도 학문적 진실성을 유지하며 최종 결과를 위해 노력해야 한다는 의미를 담고 있습니다.

 

일곱째, 그리고 아마도 코딩에서 가장 중요한 기술은 폭넓은 어휘력입니다.

  • 양적 연구에서의 정확성은 수치적 정확성에 달려 있지만, 질적 연구에서의 정확성은 단어 선택에 달려 있습니다. 예를 들어, "may(일어날 수 있다)", "could(일어날 수 있을지도 모른다)", "can(일어날 수 있다)"처럼 표현되는 것에는 미묘한 해석의 차이가 있으며, "frequently(자주)", "usually(대개)", "often(종종)"이라는 표현에도 해석상의 차이가 큽니다(Hakel, 2009). 텔레비전 시트콤 에피소드에서 커스터드 파이를 누군가의 얼굴에 던지는 장면을 JUVENILE VIOLENCE(유치한 폭력)로 코딩할 것인지, SLAPSTICK COMEDY(슬랩스틱 코미디)로 코딩할 것인지를 결정해야 합니다. 완전판 사전과 유의어 사전은 코드, 범주, 주제, 개념, 주장, 이론에 적합한 단어를 찾는 데 중요한 참고 도구가 됩니다. 완전판 사전에서 주요 단어의 어원을 탐구하면 놀라운 새로운 의미를 발견할 수 있습니다(예: hypocrite의 어원은 "배우"라는 뜻입니다). 유의어 사전을 통해 선택한 코드나 범주의 주요 단어를 검토하면, 분석에 더 적합하고 정확한 단어를 발견할 수 있습니다.

 

코딩과 질적 데이터 분석에 필요한 인지적 기술과 개인적 속성에 대한 적용 소개는 부록 D의 연습 및 시뮬레이션을 참조하세요.

 

방법론에 대하여
On Method

 

연구자의 코드 개발 및 코딩 과정에 대한 자세한 설명, 심지어 대략적인 설명도 최종 보고서의 방법론 섹션에 거의 포함되지 않습니다(하지만 논문 작성자는 자신의 연구에 대한 부록으로 코드북을 포함하는 것을 고려해야 합니다). 대부분의 독자들은 주요 범주와 결과와 같은 더 중요한 특징에 비해 코드와 코딩에 대한 논의가 지루하거나 관련성이 없다고 생각할 가능성이 큽니다. 또한, 학술 저널은 논문 원고에 길이 제한을 두기 때문에 연구 이야기의 일부를 생략해야 하는 경우가 많으며, 그 중에서도 코드와 코딩은 종종 생략됩니다. 솔직히 말해, 학술 공동체 대부분은 이에 대해 개의치 않을 것이라고 생각합니다(cf. Stewart, 1998). 나는 출판된 연구에 대부분의 사람들이 배후의 문제라고 여기는 것들을 포함해야 한다고 주장하는 것이 아닙니다. 다만, 코딩과 분석 메모 작성을 통해 많은 시간을 투자하고, 치열한 노력을 기울이며, 경험하게 되는 개인적인 분석적 성장은 연구자와 데이터 사이의 사적 영역이라는 점을 인정하면 됩니다(cf. Constas, 1992).

 

중요한 손님을 저녁 식사에 초대했을 때, 손님들에게 서빙 시간이 두세 시간 전부터 부엌에서 요리 과정을 지켜보라고 요청하지 않습니다. 그들은 식사 직전에 도착해, 여러분이 힘들게 준비한 음식을 즐깁니다.

 

그러나, 이 비유는 접어두더라도 이 매뉴얼을 "요리책"으로 생각하거나 언급하지 마십시오. 이는 이곳에서 설명된 방법들이 매번 성공적인 결과를 보장하는 검증된 레시피와 같다는 암시를 줄 수 있기 때문입니다. 방법론은 단지 우리의 통찰력을 체계화하는 하나의 방식일 뿐이지, 그 자체로 통찰을 만들어내는 것은 아닙니다(Ruthellen Josselson, in Wertz et al., 2011, p. 321). 대부분의 방법론자들은 코딩 체계가 연구의 특정 맥락에 맞게 맞춤화된다고 동의합니다. 여러분의 데이터는 독특하며, 여러분 자신과 코드를 생성하는 창의적 능력 또한 독특합니다. 여러분의 질문에 대한 답을 가지고 있는 사람은 제가 아니라 여러분 자신과 여러분의 데이터입니다. 저는 성실하게 몇 가지 지침을 제공해드릴 수 있으며, 만약 운이 좋다면, 여러분에게도 저에게도 약간의 통찰이 생길 수 있습니다.

 

(저는 이 매뉴얼이 일부 사람들에 의해 "질적 데이터 분석의 클리프 노트" 또는 "코딩을 위한 더미스"라고 조롱당할지 모른다는 생각에 스스로 웃었습니다. 어쨌든 실용주의자로서 저는 이 표현을 이 작업에 대한 칭찬으로 받아들일 것입니다.)

 

 

코딩에 대한 비판

Critiques against coding

 

코딩에 대해 철학적이거나 방법론적인 비판들이 제기되어 왔습니다. 이러한 비판을 접할 때면, 저는 동료들이 느끼는 불만이 이전의 탈실증주의적 접근(post-positivist approaches), 즉 코딩을 기계적이고 기술적인 패러다임으로 봤던 시절에서 기인했다고 생각하게 됩니다. 그 시기에는 코딩이 정말로 단순한 노동에 불과했고, 그 결과도 주로 주제 중심의 목록에 불과한 경우가 많았습니다. 다음은 제가 자주 들어온 코딩에 대한 비판과 그에 대한 저의 답변입니다:

1. "코딩은 환원적이다"

  • 비판: 코딩은 데이터를 지나치게 단순화하여 환원적이라는 비판을 받습니다.
  • 답변: 코딩은 어떻게 받아들이느냐에 따라 달라집니다. 만약 환원적인 것으로 본다면, 그렇게 느껴질 것입니다. 하지만 제가 정의하는 코딩은 분석적 행위로, 데이터를 풍부한 상징적 의미로 해석하며 본질을 포착하거나 감정적으로 울림을 주는 속성을 부여하는 과정입니다. 이 책에서 소개하는 32개의 코딩 프로필은 다양한 방법을 제시합니다. 그중 일부는 단순한 기술적 인덱싱을 돕기 위한 것이고, 몇 가지는 공식적이고 처방적인 방법을 따르도록 설계되었습니다. 그러나 대부분의 방법은 참여자의 목소리, 과정, 감정, 동기, 가치, 태도, 신념, 판단, 갈등, 미시문화, 정체성, 생애 패턴 등을 발견하는 데 중점을 두고 있습니다. 이러한 결과는 단순한 환원주의적 결과가 아니라, 우리가 연구하는 사람들에 대한 다차원적인 측면입니다.

//비유적으로, 데이터가 삐죽삐죽한 나무라면, 가지를 모두 쳐내버리고(reduce) 가장 중심의 줄기만 남기는 과정으로 본다면 환원적이다. 하지만 가지를 포함한 데이터의 모양이 나타내는 상징적인 의미를 해석한다면 환원적이지 않다.

2. "코딩은 객관적이려고 한다"

  • 비판: 코딩은 연구 과정에서 객관성을 강조한다는 비판이 있습니다.
  • 답변: 어느 정도는 그렇지만, 그렇지 않다고도 할 수 있습니다. 이 주제는 존재론적, 인식론적, 방법론적 가정에 대한 긴 논의로 이어질 수 있지만, 간단하게 답변하겠습니다. 팀 코딩에서의 코더 간 일치도(intercoder agreement)는 여러 연구자가 각 데이터를 독립적으로 의미를 확인해야 한다는 점에서 객관성이 중요한 분석적 원동력처럼 보일 수 있습니다. 그러나 실제로는 객관적이기보다는 두 명 이상의 연구자가 비슷한 결과를 도출하는 것이 목표입니다.
  • 개별 연구자에게 데이터를 상징적으로 의미 부여하는 행위(즉, 코딩)는 개인적인 서명과 같은 것입니다. 우리는 각각 사회적 세계를 다르게 인식할 가능성이 크기 때문에, 그 경험을 다르게 받아들이고, 해석하고, 문서화하고, 코딩하고, 분석하고, 글로 쓸 것입니다. 객관성은 항상 이상적인 목표였지만, 양적 연구에서조차 거의 달성할 수 없는 구성된 목표였습니다. 그렇다면 왜 질적 연구가 그 부담을 져야 할까요? 우리는 객관적이라고 주장하지 않습니다. 왜냐하면 객관성이라는 개념은 허상에 불과하기 때문입니다.

이러한 비판에도 불구하고, 코딩은 잘 적용하면 사람들의 경험을 다차원적으로 해석하고 분석할 수 있는 강력한 도구임을 잊지 말아야 합니다.

 

 

3. "코딩이 데이터를 멀어지게 한다":

 

만약 여러분이 질적 연구자로서 자신의 역할을 제대로 수행하고 있다면, 이 주장은 사실과 거리가 멉니다. 잘하는 코딩은 각각의 데이터를 깊이 성찰하도록 요구합니다. 또한 코딩을 잘 하려면 데이터를 코딩하고, 다시 코딩하며 반복적으로 읽어야 합니다. 코딩을 잘 하면 데이터에 몰입하게 되며, 그 결과로 세부 사항, 미묘한 차이와 뉘앙스에 익숙해지게 됩니다. 만약 여러분이 데이터 속에서 참여자가 말한 내용을 기억하고 그와 관련된 코드를 외울 수 있다면, 그것이 어떻게 여러분을 작업에서 "멀어지게" 했다고 말할 수 있는지 이해할 수 없습니다.

 

4. "코딩은 단지 빈도수를 세는 것이다":

 

전통적인 내용 분석에서는 특정 코드가 발생하는 빈도를 세는 것이 중요할 수 있습니다. 하지만 이 매뉴얼에서 제가 제안하는 경고 중 하나는, 발생 빈도가 반드시 중요성의 지표는 아니라는 것입니다. 대부분의 코딩 방법론에서는 단순히 개수를 세는 것이 아니라, 깊이 숙고하고, 검토하며, 실험하고, 감정이입하고, 공감하고, 가설을 세우고, 평가하며, 조직하고, 패턴을 찾고, 범주화하고, 연결하며, 통합하고, 종합하고, 반성하고, 개념화하고, 추상화하는 등 다양한 사고 과정을 요구합니다. 숫자를 세는 것은 쉽지만, 생각하는 것은 어렵습니다.

 

5. "코딩은 '위험하다', '폭력적이다', '파괴적이다'":

코딩 행위를 설명하는 데 이러한 단어들이 사용된 이유를 이해하기 어렵습니다. 저는 이러한 단어들을 자연 재해, 범죄자, 전쟁과 연관 짓지, 질적 데이터 분석과 연관 짓지 않습니다. 이러한 표현은 공포 문화 속의 과장된 감정이라고 생각하며, 비판자들이 의도한 우려를 설명하기에는 적절하지 않다고 봅니다. 즉, 제게 이러한 표현은 잘못된 단어 선택으로 보이며, 잘못된 단어 선택을 하는 사람은 좋은 코더가 되기 어렵습니다.

 

6. "데이터 분석에는 코딩 외에 더 많은 것이 있다":

 

전적으로 동의합니다. 부록 B에만 40가지 이상의 분석 접근 방식이 문서화되어 있다는 점이 이를 뒷받침합니다. 이 매뉴얼은 코딩을 발견의 방법으로 제시하며, 여러분이 수집한 데이터를 깊이 사고할 수 있도록 자극하는 역할을 하길 바랍니다. 그리고 이 장의 시작에서 언급한 중요한 두 가지 원칙을 상기시키고자 합니다:

  • 코딩은 질적 데이터를 분석하는 하나의 방법일 뿐, 유일한 방법은 아닙니다.
  • 데이터를 코딩하는 것이 반드시 필요한 때가 있으며, 그 연구에 적합하지 않은 때도 있습니다.

 

코딩을 하나의 기술로서 바라보기
Coding as craft

저는 질적 연구에서 해석주의적 전환과 서사적 발표민족지학적 현장 연구를 통한 해방적 사회 행동으로의 움직임에 대해 잘 알고 있습니다(Denzin & Lincoln, 2011). 실제로 저의 질적 연구 프로젝트는 사실주의적에서 문학적, 고백적에서 비판적 접근에 이르기까지 다양했습니다(van Maanen, 2011). 그러나 연극 실무자로서, 저희 분야는 무대 작품의 성공을 위해 예술기술 모두에 주의를 기울여야 한다는 점을 인정합니다. 또한, 교사 교육자로서 저는 가르치는 방법을 가르치는 것이 제 임무입니다. 따라서 교실 실습의 다양한 방법에 대한 민감성을 가져야만 하며, 제 직업적 책임도 그렇게 요구합니다.

 

일부 방법은 조직적, 관리적, 시간 효율적이며, 신중하게 계획된 교육과정 설계와 관련이 있습니다. 그러나 저는 학생들에게 창의적 충동, 본능을 신뢰하는 것, 위험을 감수하는 것, 그리고 단순히 교실에서 인간적으로 공감하는 것 또한 정당한 교수 방법이라고 강조합니다. 교육은 복잡하며, 이는 사회생활질적 탐구에서도 마찬가지입니다.

 

저는 시간이 지남에 따라 저의 연구 작업 윤리에서 기술적 측면, 즉 '어떻게'라는 측면을 항상 의식하게 되었습니다. 제가 무엇을 하고 있는지 뿐만 아니라 왜 그것을 하고 있는지에 대해 겸허하면서도 날카롭게 자각하게 되었습니다. 심지어 질적 탐구와 같이 출현적이고, 직관적이며, 귀납적인 성격의 사회적 의식적 작업에서도 방법의 메타인지는 매우 중요합니다. 이러한 자각은 시간과 경험(그리고 시행착오)을 통해 얻을 수 있지만, "어떻게"에 대한 사전 지식이 있다면 발전 속도를 가속화할 수 있습니다. 저는 이 매뉴얼이 여러분의 학습 곡선을 약간 완화하고, 질적 연구자로서 여러분의 전문적, 개인적 성장에 도움이 되기를 바랍니다.

 

이 소개는 코드와 코딩에 중점을 두었으며, 이 과정에 동반되는 휴리스틱이 있는데, 그 중 하나가 다음 장에서 다룰 분석 메모 작성입니다.