Abductive Coding: Theory Building and Qualitative (Re)Analysis

 

 

 

 

🔍 가추적 분석(abductive analysis)과 코드 방정식(code equation): 2차 질적 자료를 이론으로 연결하기

최근 들어 ‘2차 질적 분석(secondary qualitative analysis)’에 대한 관심이 점점 높아지고 있습니다. 코로나19 이후로 직접 인터뷰나 현장 조사가 어려워진 현실에서, 이미 수집된 질적 데이터를 새롭게 해석하고 이론적으로 확장하려는 시도가 활발해졌기 때문이죠.

이번 포스팅에서는 이런 변화 속에서 "가추적 분석(abductive analysis)"과 "코드 방정식(code equation)"이 어떻게 질적 연구를 보다 체계적이고 창의적으로 만들어주는지, 한 논문을 통해 소개해드리려 합니다.


🧠 가추(abduction)란 뭘까?

단순히 데이터를 관찰해서 일반화를 도출하는 귀납(induction)이나, 기존 이론을 기반으로 자료를 검증하는 연역(deduction)과 달리, 가추(abduction)은 예외적인 사례(anomalous case)나 놀라운 발견(surprising finding)을 통해 새로운 이론적 통찰(theoretical insight)을 도출하는 접근이에요.

 

연구진은 이렇게 말합니다:

A key part of qualitative abduction is that there is a dialogue between each step of the process that serves to develop, extend, and refine theory.
이 말은 즉, 가추는 데이터 분석 과정의 각 단계를 통해 이론을 개발하고 확장하고 다듬는 대화의 과정이라는 뜻입니다.


🔧 코드 방정식(code equation), 그게 뭐길래?

질적 분석을 해보신 분들은 아시겠지만, 코드북을 구성해서 텍스트에 의미 있는 ‘코드’를 붙이다 보면, 그 수가 수백, 수천 개로 늘어나요. 그중 정말 ‘이론적으로 중요한 현상’을 어떻게 걸러낼 수 있을까요?

여기서 등장하는 게 바로 코드 방정식(code equation)입니다. 이건 말 그대로 여러 개의 코드들을 조합해서(combine) 어떤 복잡한 현상을 조작화(operationalize)하려는 도구예요.

 

연구진은 이렇게 정의하고 있어요:

We define ‘code equations’ as the combination of codes to operationalize phenomena that span individual codes.

 

즉, 코드 방정식은 텍스트의 복잡한 맥락을 단순히 키워드로 줄이는 게 아니라,
이론적 관점에서 의미 있는 코드들의 결합을 통해 현상을 축소하고 해석하는 방식입니다.


🔁 가추의 3단계 분석 전략

이 논문에서는 3단계 가추적 분석 전략을 제시하고 있어요:

1️⃣ 가추적 코드북 생성

  • 기존 이론을 반영한 연역적 코드(deductive codes)로 시작
  • 이후 데이터를 코딩하면서 귀납적 코드(inductive codes)를 추가
  • 이를 통해 초기 가추적 코드북(abductive codebook) 완성!

2️⃣ 코드 방정식을 통한 자료 축소

  • “코드 방정식”을 사용해, 복합적 개념이 실제 데이터에서 어떻게 나타나는지 탐색
  • 예를 들어, “신자유주의(neoliberalism)”와 “민족주의(nationalism)”라는 코드의 결합을 통해
    브렉시트 이전부터 존재했던 영국 시민들의 유럽회의주의(Euroscepticism)를 분석함

We found that the intersection of nationalism and neoliberalism in citizens’ beliefs allowed for the emergence of a specific form of Euroscepticism in the UK.

3️⃣ 심층 수작업 정성 분석

  • 축소된 사례를 중심으로 정성적으로 깊이 있게 분석
  • 이 과정을 통해 기존 코드북의 불완전함을 발견하거나, 이론을 더욱 섬세하게 정제(refine)하게 됨

💡 이 방법이 왜 중요한가요?

이 연구는 다음과 같은 핵심 기여를 했다고 말합니다:

Our approach helps to facilitate qualitative theory building through teamwork and may assist in strategies for the division of labor between researchers.

 

✔️ 팀 기반 분석(teamwork)에 적합하고
✔️ 이론 생성(theory building)을 정교하게 지원하며
✔️ 2차 질적 자료의 가능성을 활짝 열어준다는 점이에요.

 

그리고 무엇보다 중요한 건 이 말이죠:

Secondary qualitative analysis should never be a replacement for primary qualitative analysis... Instead, it is a tool... to build theory and to respond empirically to scientific inquiry that is impossible to answer with primary qualitative research alone.

👉 즉, 2차 질적 분석은 1차 질적 분석의 대체물이 아니라, 서로를 보완할 수 있는 강력한 도구라는 겁니다.


📝 마무리하며

이 논문은 가추(abduction)와 코드 방정식(code equations)이라는 도구를 통해,
이론적 통찰을 이끌어내는 새로운 질적 분석 방법론을 제안하고 있어요.

✔️ 기존 데이터를 새롭게 바라보고 싶은 분들
✔️ 질적 연구에서 이론을 만들고자 하는 분들
✔️ 특히 대규모 인터뷰나 2차 자료를 다루는 분들께 강력 추천합니다!

🧭 "현상을 보는 새로운 틀"이 필요할 때, 코드 방정식과 가추라는 도구를 기억해보세요.

 


서론 (Introduction)

질적 자료의 분석에서 많은 연구자들은 Glaser와 Strauss(1967)가 개발하고, 이후 Glaser(1992), Strauss(1987), Charmaz(2000)가 더욱 발전시킨 근거이론(grounded theory)에 자신들의 방법론적 접근을—명시적이든 암묵적이든—기초하고 있다. 근거이론은 질적 자료를 수행하고 분석하는 데 유용한 일련의 절차를 제공하며, 풍부하고 통찰력 있는 연구 성과들을 창출해왔다. 그러나 Deterding와 Waters(2018)는 근거이론의 “핵심적 규범—theoretical sampling toward saturation, strongly inductive analysis, and full immersion in the research field—는 실제 대규모 인터뷰 연구자들이 사용하는 방법과는 거의 유사성이 없다”고 주장한다¹.

 

이러한 관찰에서 출발하여, 연구자들의 실제 연구 관행이 근거이론의 핵심 규범과 일치하지 않을 때, 질적 자료를 분석하기 위해 어떤 경로를 선택할 것인가라는 문제가 제기된다. 본 논문에서는 이 지속적인 논의에 참여하며, 근거이론과 정렬되지 않는 여러 연구 관행 중 하나인 여러 데이터셋의 질적 2차 분석(qualitative secondary analysis)에 초점을 맞춘다. 질적 2차 분석이란 이미 생산된 질적 자료—대면 또는 포커스 그룹 인터뷰, 현장노트 및 관찰노트 등—를 활용하여 새로운 사회과학적 또는 방법론적 통찰을 개발하는 것을 의미한다².

 

질적 2차 분석은 지난 20여 년 동안 새로운 방법론적 접근으로 개발되어 왔다(Bishop and Neale, 2011; Corti, 2006, 2012; Corti, Witzel and Bishop 2005; Fiedling, 2004; Beck 2018; Hughes and Tarrant 2020; Duchesne 2017). 그러나 이 접근은 질적 연구의 인식론(epistemology)과 관련하여 뜨거운 논쟁을 불러일으켰다(Hammersley, 1997, 2010; Mauthner et al. 1998; Savage 2005; Duchesne 2017). 반대론자들은 질적 2차 분석이 귀납적 인식론(inductive epistemology)에 기반한 질적 연구의 규범과 모순된다는 점을 집중적으로 논의해 왔다.

 

본 논문에서는 질적 2차 분석을 포기하기보다는, Timmermans와 Tavory(2012), Tavory와 Timmermans(2014) 등이 제안한 “가추(abduction)” 접근법으로의 전환이 이론 구축을 지향하는 질적 2차 연구자들에게 유익한 길이 된다고 주장한다. 가추는 인식론적 틀일 뿐만 아니라, 현대 질적 연구자들의 실제 연구 관행에 부합하는 분석 방법을 함께 제공한다. 그러나 증가하고 있는 가추 관련 문헌들에서도, 가추적 추론의 구체적인 실행 방식, 특히 코딩(coding)과 관련된 논의는 아직 충분히 발전되어 있지 않다(가장 최근의 기여로는 Brandt and Timmermans 2021 참조).

 

이에 본 논문에서는 이러한 가추 문헌의 핵심적인 공백을 채우기 위해, 2차 자료뿐 아니라 1차 자료 분석에도 적용 가능한 가추적 분석(abductive analysis)을 위한 일련의 실용적 전략(tactics)을 제시하고자 한다.


¹ “central prescription—theoretical sampling toward saturation, strongly inductive analysis, and full immersion in the research field—bear little resemblance to the actual methods used by many large-scale interview researchers” (Deterding and Waters 2018, p. 2).
² Irwin (2013) 참조.


우리가 제안하는 접근은 Timmermans와 Tavory(2012; 2014)가 제시한 가추(abduction)의 세 단계현상 재고(Revisiting the Phenomenon), 낯설게 하기(Defamiliarization), 대안적 사례화(Alternative Casing)—를 다음의 질적 (2차) 분석의 세 단계에 적용한다:

  1. 가추적 코드북 생성(Generating an Abductive Codebook),
  2. 코드 방정식을 통한 가추적 자료 축소(Abductive Data Reduction through Code Equations),
  3. 심화 가추적 질적 분석(In-Depth Abductive Qualitative Analysis).

구체적으로,

  • 연구자는 연역적 코드북(deductive codebook)에서 출발하여 코딩 과정을 거치며 자료 기반의 귀납적 코드(inductive codes)를 개발함으로써 이론적으로 예외적인 사례(theoretically anomalous cases)를 문서화하고, 이를 통해 코드북—더 나아가 이론 그 자체—을 구성해 나간다(1단계).
  • 우리의 전략은 질적자료분석(QDA: Qualitative Data Analysis) 소프트웨어를 활용하여, 가추적 코드북에 있는 코드들을 결합하고, 복잡한 현상을 조작적으로 정의한다. 이 과정을 우리는 “코드 방정식(code equation)”이라 부른다(2단계).
  • 이 단계는 자료 축소(data reduction)에 핵심적이며, 마지막 질적 분석 단계를 가능하게 하는 귀납적 코딩으로 이어진다(3단계).

우리는 각 단계에서 일반적으로 적용 가능한 특징들과, 가추적 접근(abductive approach)의 전체적 관점에서 각 단계가 지니는 분석적 기여(payoff)를 논의한다. 본 접근은 명확히 이론 구축(theory-building)을 목표로 하기 때문에, 각 코딩 전략은 분석을 풍부하게 하고 창의적이고 새로운 이론적 통찰을 생성하는 조건을 조성한다고 주장한다. 이런 점에서, 우리의 목적은 이론 형성이라는 창의적 과정을 제약하려는 것이 아니라, 오히려 Timmermans와 Tavory(2012; 2014)가 제시한 핵심 원칙(principles)을 촉진하고 창의적 연구과정 자체를 지원하는 전략 세트를 제안하는 데 있다. 또한, 우리는 이론 구축을 위한 전략으로서 Peirce(1934)의 철학을 질적 분석에 적용한 Timmermans와 Tavory의 견해에 공감한다.

 

이와 관련하여, 본 논문의 핵심적인 기여는 바로 “코드 방정식(code equations)”이라는 개념의 발전이다. 우리는, 코드를 결합함으로써, 질적 연구자가 점점 더 복잡한 현상을 조작적으로 정의할 수 있고, 동시에 더 복잡한 연구 질문에 답할 수 있다고 주장한다. 따라서 코드 방정식은 가추적 접근뿐 아니라, 질적 자료를 활용하여 이론을 구축하는 다양한 질적 방법론에 있어 핵심 자원(key resource)이 된다.

 

우리는 본 논문에서 소개하는 가추적 분석의 세 단계를 ATLAS.ti에서의 경험을 기반으로 설명하고 있지만, 이 전략들은 모든 QDA 소프트웨어에서, 1차 자료든 2차 자료든 관계없이 적용 가능하다. 우리는 구체적인 사례로, 영국에서 1990년대 중반부터 2017년까지 서로 다른 연구자들이 수집한 인터뷰 및 포커스 그룹 자료로 구성된 시민의 민주주의 인식에 관한 질적 데이터셋 세 개를 사용한다¹.

 

논문의 전개는 다음과 같다. 먼저, 질적 2차 분석을 둘러싼 방법론적 논쟁의 맥락을 설정하고, 이러한 문제에 대응하기 위한 전략으로서 가추 문헌(abduction literature)을 제시하며, 코딩 전략에 대한 기존 문헌의 공백에 우리 접근이 어떻게 응답하는지 강조한다. 이어서, 우리가 제안하는 코딩 프레임워크와 각 단계별 전략(tactics)을 설명하고, 우리 연구에서 얻은 구체적 사례를 제시한다. 마지막으로, 이 방법의 함의(implications)와 본 논문에서 다룬 2차 분석 사례를 넘어서는 한계점에 대해 논의하며 글을 맺는다.


¹ 영국 시민의 민주주의 인식에 대한 질적 자료는, 1990년대 중반부터 2017년까지 여러 연구자들에 의해 수집된 인터뷰 및 포커스 그룹 데이터를 기반으로 한다.

 


질적 2차 분석: 귀납(induction)에서 가추(abduction)로

이 절에서는, 가추적 접근(abductive approach)에 기반할 때 질적 2차 분석(secondary qualitative analysis)의 핵심 특성들이 이론 구축을 위한 가추적 코딩(abductive coding)을 촉진하는 데 어떻게 활용될 수 있는지를 보여준다. 이러한 관점에서 볼 때, 우리가 논의의 출발점으로 삼는 질적 2차 분석의 한계들에 대한 기존의 인식—혹은 근거이론(grounded theory)과 귀납적 접근(induction)의 전제조건들과 충돌하는 질적 1차 분석(primary qualitative analysis)—은 오히려 이론 구축(theory construction)과 가추적 분석(abductive analysis)을 위한 기회(opportunity)로 전환될 수 있다.

 

이에 우리는 Timmermans와 Tavory가 제시한 가추적 접근의 세 단계(three steps of an abductive approach)를 바탕으로, 이를 질적 2차 자료에 대한 가추적 코딩을 구축하는 데 어떻게 적용할 수 있는지를 논의하며, 기존 가추 문헌에서 이 부분이 비어 있던 학술적 공백(gap)을 메우고자 한다.


귀납적 인식론 관점에서 본 질적 2차 분석에 대한 저항

지난 수십 년 동안, Henry A. Murray Research Centre (하버드), Qualitative Data Repository (시러큐스), Australian Data Archive, UK Data Archive, BeQuali (Sciences Po 파리) 등과 같은 질적 자료 저장소(qualitative repositories)가 활발히 구축되어 왔다². 이러한 저장소들은 연구자들에게 기존 질적 데이터셋을 재분석(reanalyze)할 수 있는 새로운 기회를 제공하며, 이에 따라 질적 2차 분석(qualitative secondary analysis)이 가능해졌다(Duchesne 2017; Hughes and Tarrant 2020).

 

질적 2차 분석은 “기존의 정량적 또는 질적 연구 데이터를 활용하여 새로운 질문을 탐구하거나 기존 연구를 검증하는 연구 전략”으로 정의된다 (Heaton 2004, p.16). 요컨대, 질적 2차 분석은 Salganik(2018)이 사회과학에서의 빅데이터(big data) 논의에서 Marcel Duchamp의 예술에 빗대어 언급한 “기성 데이터(ready-made data)”를 활용하는 방식이라 할 수 있다.

 

질적 2차 분석의 발전은 이 방식이 제공할 수 있는 새로운 연구 가능성에 대해 광범위한 논의를 불러일으켰다(Hughes and Tarrant 2020). 그러나 동시에, 이를 반대하는 주된 세 가지 논거도 제기되었다.

  1. 첫 번째 논거는, 질적 데이터의 유효한 분석은 분석가가 직접 데이터 수집에 참여했을 때에만 가능하다는 주장이다(Mauthner et al. 1998; Mauthner and Parry 2009, 2013; Parry and Mauthner 2005).
    1. 이 논의의 대표적인 글에서 Mauthner et al.(1998)은 “연구자가 데이터를 해석하고 이론화하는 역할만큼이나, 데이터를 구성하는 과정 자체에 참여하는 역할도 중요하다”고 강조한다 (ibid 1998: 733). 그들은 질적 2차 분석은 질적 연구가 기반하는 패러다임—즉 자기성찰적(reflexive)이고 해석적인 성격—과 본질적으로 충돌하는 인식론적 문제(epistemological issue)를 가지고 있다고 주장한다(ibid 1998). 이러한 인식론적 문제를 간과하면, 연구자는 자기도 모르게 “순진한 실재론적 입장(naively realist position)”을 취하게 된다고 경고한다.
  2. 두 번째 쟁점은, 수집된 원래의 맥락(original context)을 벗어난 상태에서 데이터를 분석하는 것이 과연 가능한가에 관한 것이다(Moore 2007; Heaton 2004).
    1. Parry와 Mauthner(2005)는, 질적 분석이 정량적 분석과 구별되는 핵심적 특성 중 하나는 '자료 생산의 맥락(context of production)'이 결정적으로 중요하다는 점이라고 본다. 2차 분석가는 1차 자료 수집 과정에 참여하지 않았기 때문에, 원래 연구자의 경험(experience)에 접근할 수 없으며, 따라서 질적 자료는 정량적 자료처럼 동일한 방식으로 재사용되어 새로운 실질적 발견(substantive findings)이나 이론을 생성하기 어렵다고 본다(Beck 2018: 13 참조, Thorne 2013도 같은 입장).
  3. 세 번째 비판은, 질적 2차 분석은 기존의 질적 데이터셋들을 하나의 새로운 코퍼스로 재구성해야 하기 때문에, 이 과정이 1차 연구의 이론적 샘플링(theoretical sampling)을 약화시킨다는 점이다.
    1. 이로 인해, 질적 연구에서 반복적으로 제기되는 대표성(representativeness)과 일반화 가능성(generalizability)의 문제가 다시 등장하게 된다. 일부 학자들은 질적 2차 분석이 오히려 1차 연구의 대표성 문제를 더욱 악화시킬 수 있다고 경고한다(Beck 2018: 14).

 


이처럼 질적 2차 분석에 반대하는 주장들중요하고 타당한 우려를 제기하며, 2차 분석을 수행하는 연구자들은 이러한 문제를 충분한 자기성찰(reflexivity)을 가지고 고려해야 한다. 그러나 본 논문에서는 이 논점들을 직접적으로 논의할 지면이 부족하다. 대신, 우리는 이러한 주장들이 특정한 인식론적 관점(epistemological perspective)에 기반하고 있으며, 본질적으로 귀납적(inductive)이며 근거이론의 “핵심 규범(central prescriptions)”과 긴밀히 연결되어 있다는 점을 강조하고자 한다(참고: Deterding and Waters 2018, p. 2).

 

예컨대, 인터뷰 참여자와의 상호작용을 포함한 연구자의 경험의 우선성자료 생성 맥락에 대한 밀접한 이해의 중요성을 주장하는 논리는, 연구자가 현장에 깊이 몰입해야 하며(data immersion), 분석은 “강하게 귀납적(strongly inductive)”이어야 한다는 근거이론의 이상과 연결되어 있다(Deterding and Waters 2018, p. 2).

 

하지만 이러한 규범은 질적 2차 분석의 실제와는 충돌한다. 2차 분석에서는 일반적으로 자료의 양이 1차 연구보다 훨씬 많고, 하나의 표본(sample)을 넘는 질문들에 답하기 위해 다양한 자료 출처(multiple data sources)를 사용하는 것이 일반적이기 때문이다. 따라서 2차 분석의 핵심 쟁점은 연구 현장에의 몰입(immersion)이 아니라, 오히려 자료 축소(data reduction)라고 할 수 있다.

 

더욱 중요한 점은, 모든 2차 분석에서는 귀납(induction)이 실질적으로 성립하지 않는다는 점이다. 연구자는 자신이 재분석할 2차 자료에 익숙해지기 위해, 1차 연구자들이 설정했던 연구 질문, 이론, 개념들을 인지하고 이에 민감해질 필요가 있다. 다시 말해, 2차 분석은 이미 존재하는 이론적 틀과 해석 프레임에 어느 정도 의존할 수밖에 없다.

 

또한, 이론적 샘플링(theoretical sampling)에 대한 반론 역시 포화(saturation)를 주요 목표로 설정하는 개념적 전제에 기반한다. 그러나 질적 2차 분석에서는 이론적 샘플링이 사용되긴 하지만, 그 목적은 반드시 포화에 있는 것이 아니라, 오히려 비교(comparison)를 중시하며, 다양성의 원칙(principle of diversity)에 기반한다. 즉, 연구자의 질문에 따라 다양한 데이터셋을 선별하여 2차 자료 코퍼스를 구성함으로써, 비교 가능한 2차 연구(comparative secondary research)의 기회를 열게 된다(Halford and Savage 2017 참조). 이러한 방식에서의 샘플링은, 이론적 포착력을 높이기 위한 수단으로서의 다양성 확보를 목표로 한다.

 

요컨대, 질적 2차 분석이 불러일으킨 질적 연구 인식론에 대한 논쟁은 대부분 귀납적 인식론에 기반해 왔으며, 이로 인해 질적 2차 분석 방법론의 잠재력은 제대로 평가되지 못했다. 그러나 질적 2차 분석이 귀납적 분석 접근의 요건과 부합하지 않는다고 해서, 그것이 곧 이론 형성의 사각지대(dead-end)라는 의미는 아니다.

 

오히려 우리는, 가추적 접근(abductive approach)으로의 전환미래를 여는 하나의 경로라고 제안한다. 이러한 전환은 질적 2차 분석이 지닌 핵심적인 특성들을 적극적으로 활용하여 이론을 구축(build theory)할 수 있는 가능성을 제공하기 때문이다.


가추(Abduction): 나아갈 길로서의 가능성

이론 구축을 위한 기법으로서 질적 연구에 가추(abduction)를 적용하려는 시도는, 귀납(induction)과 연역(deduction)의 사용을 둘러싼 격렬한 논쟁의 맥락 속에서 등장하였다(Timmermans and Tavory 2012; Tavory and Timmermans 2014). Glaser와 Strauss(1967)는 귀납적 접근(inductive approaches)의 발전에 지대한 영향을 미쳤으며, Michael Burawoy(1998, 2009)는 확장 사례 방법(Extended Case Method)을 통해 질적 연구에서 연역적 분석(deductive analysis)에 대한 논의를 형성해왔다.

 

이러한 배경에서, Timmermans와 Tavory는 귀납과 연역이라는 이분법적 구도를 넘어서는 전략으로서 “가추(abduction)”를 제시하였다(Timmermans and Tavory 2012; Tavory and Timmermans 2014; Tavory 2016; Tavory and Timmermans 2019). 가추는 귀납과 연역 간의 이분법이 허구적인 것(false dichotomy)이라고 보는 흐름의 일부로, 이 흐름은 두 추론 방식 사이의 긴장을 극복하거나 창의적으로 통합하려는 시도를 반영한다(Goldberg 2015; Wagner-Pacifici, Mohr, and Breiger 2015)³.

 

가추적 자료 분석(abductive data analysis)이라는 방법은 Peirce(1934)에 의해 처음 이론화되었으며, 이론 구축을 지향하는 추론 방식으로서 개발되었다. 가추란, 이론적으로 놀라운 사례(theoretically surprising cases)와 잠정적 설명(tentative explanations) 간의 반복적 과정(iterative process)을 의미한다(Coffey and Atkinson 1996; Kelle 2007; Reichertz 2007; Strübing 2007; Timmermans and Tavory 2012; Tavory and Timmermans 2014). 따라서 가추는 귀납과 연역 어느 하나에도 완전히 속하지 않으며, 양자의 특징을 결합한 제3의 추론 방식이다.

 

가추가 전형적인 귀납적 추론과 구별되는 핵심적인 점은, 관찰된 현상이 그 자체로 설명을 내포하지 않으며(귀납과 구별됨), 동시에 이미 알려진 일반 법칙의 새로운 사례로 환원되지도 않는다는 점이다(연역과도 구별됨). 즉, 가추는 이론적 놀라움과 설명의 결합을 통해 새로운 설명을 형성하려는 시도다.

 

Peirce는 이렇게 설명한다:

가추는 설명적 가설(explanatory hypothesis)을 형성하는 과정이다.”
(“Abduction is the process of forming an explanatory hypothesis”; Peirce 1934, p. 171).

 

연구자가 이러한 이론적으로 놀라운 사례를 “발견(discover)”하면, 그들은 여러 개의 설명을 결합하여 이론적으로 타당한 설명(theoretically sound account)을 구성하게 된다(Reichertz 2007, pp. 159–164 참조). 그 후, 연구자들은 이러한 귀납적으로 생성된, 이론에 기반한 설명들을 기존 및 추가적인 경험적 자료(empirical data)에 대조하여 검토하고, 그 결과는 또 다른 이론 형성의 라운드로 이어질 수 있다. Peirce에 따르면, 가추(abduction), 귀납(induction), 연역(deduction)은 서로 배타적인 추론 방식이 아니라, 연구 과정의 서로 다른 단계에서 기능하며, 그 자체로 순환적(iterative)인 특성을 갖는다.

 

특히 가추(abduction)는 하나의 이론 집합(a set of theories)에서 출발하여, 이를 이론적으로 예외적인 사례(theoretically anomalous empirical cases)를 탐색함으로써 확장해 나가는 방식이다. 즉, 경험적 관찰(empirical observations)이 예외적(anomalous)이거나, 새롭거나(novel), 놀라운(surprising) 것으로 간주될 수 있는 것은 이미 이론적으로 정립된 바 있거나 기존 이론에 기반해 기대되었던 것들과 비교될 때에만 가능하다. 그렇기에 기존 이론들은 예상 밖의 경험적 관찰을 식별할 수 있게 해주는 기준점(benchmark)의 역할을 한다.

 

더 나아가, 기존 이론은 새로운 가설을 형성하는 데 있어서도 핵심적인 구성 요소다. 왜냐하면 새로운 가설은 대개 관찰된 사실과 기존 이론 간의 불일치에서 출발하기 때문이다. 이론적으로 볼 때, 새로운 가설다른 가능한 이론적 설명들이 모두 검토되고, 그 어떤 설명도 해당 현상을 설명할 수 없다고 증명되었을 때에만 생성될 수 있다. 따라서 가추적 분석(abductive analysis)에서 이론적 폭(theoretical breadth)은 이론 구축을 위한 필수 조건이 된다(Timmermans and Tavory 2012; Tavory and Timmermans 2014).

 

  • 지난 5년간, 가추는 질적 사회학 연구에서 점점 더 중요한 영향력을 발휘해 왔다. 이는 유럽 학자들(Vassenden and Jonvik 2019)과 미국 학자들(Carlson 2017, 2018, 2019; Timmermans 2017; Reilly 2018; Blee 2019; Vila-Henninger 2020)에 의해 실제 연구에 적용된 사례들을 통해 확인할 수 있다.
  • 가추는 또한 계산사회과학(computational social science) 분야에서도 주목받고 있다. 예를 들어, Ignatow(2020)는 “디지털 가추(digital abduction)” 전략을, Karell과 Freedman(2019)는 “계산 가추(computational abduction)”를 개발하였다. 일부 연구자들은 심지어 가추적 접근을 활용하여 질적 2차 분석을 수행하기도 했다(Blee 2019). 더 나아가 Brandt와 Timmermans(2021)는 정량 연구를 위한 가추적 과학 추론(abductive logic of scientific inference)을 제안하기도 했다.
  • 질적 연구자들 중 일부는 가추가 질적 자료의 코딩에도 유용할 수 있다는 가능성을 암시해 왔지만(Deterding and Waters 2018), 가추 및 가추적 코딩을 어떻게 이론 구축 전략으로 구체적으로 실행할 수 있는지에 대한 논의는 여전히 학술적 공백 상태다. 예를 들어, Carleheden(2016)은 가추에 비판적인 입장에서, 가추가 어떻게 실제로 수행될 수 있는지에 대한 보다 구체적인 설명이 필요하다고 촉구하였다. 그러나 이러한 요구에도 불구하고, 여러 연구자가 함께 적용할 수 있는 가추적 코딩 및 분석 전략은 아직 명확히 제시되지 않고 있다.
  • 예컨대, Blee(2019)와 Rinehart(2021)는 자신의 가추 사용 경험에서 나온 통찰을 공유하긴 했지만, 이러한 통찰을 바탕으로 가추의 이론 발견 논리(logic of theory discovery)를 혁신적이고 창의적인 전략(tactics)으로 정형화하는 데까지는 나아가지 못했다.

 

가추적 분석(Abductive Analysis)과 질적 2차 분석(Qualitative Secondary Analysis)

우리는 Timmermans와 Tavory가 제시한 가추적 접근(abductive approach)의 세 단계현상 재고(Revisiting the Phenomenon), 낯설게 하기(Defamiliarization), 대안적 사례화(Alternative Casing)—를 출발점으로 삼아, 이를 질적 2차 데이터에 가추적 코딩(abductive coding)을 구축하는 데 어떻게 적용하는지를 논의한다. 이와 병행하여, 우리가 직접 수행한 가추적 2차 분석 경험을 토대로, 가추적 코딩을 촉진하고 이 세 단계를 실천적으로 구현할 수 있는 일련의 전략(tactics)도 제시하고자 한다.

 

첫 번째 단계는 “현상 재고(Revisiting the Phenomenon)”이다. 가추는 다양한 이론적 관점에서 경험적 관찰을 재고할 수 있는 능력에 기반한다—즉, 데이터를 “재방문(revisit)”하는 것이다(Timmermans and Tavory 2012). 자료를 다시 살펴보는 과정에서 이전에는 주목되지 않았던 측면들이 부각되며, 이는 이론에 기반한 경험적 수정(empirically-based revision)으로 이어진다. 이러한 재방문은 또한 연구자가 “서로 다른 이론적 접근에 민감해지도록(sensitize)” 만드는 데 기여한다(ibid: p. 176). Timmermans와 Tavory는 경험적 관찰들을 반복적으로 재방문하는 것이 다음과 같은 방식으로 이론 구축에 시간성(temporality)을 활용하는 방법이라고 주장한다:

“시간이 지남에 따라 초기의 기술(description)과 분석(analysis)은 진화하고, 추가적인 이론적 렌즈들이 통합된다.” (ibid: p. 176)

 

이러한 과정은 초기 분석 단계에서 간과되었던 데이터의 경험적 특징들을 드러내준다. 이와 같은 방식으로 연구자는 기존 이론을 활용해, 데이터에서 이론적으로 예외적이거나 놀라운 사례를 찾아낸다.

 

질적 2차 분석(Davidson et al. 2019)에서는 이러한 재방문(revisit)이 핵심적인 특징이다. 그러나 활용 가능한 데이터의 양이 많기 때문에, 이론적 접근에 민감해지는 과정(sensitization)은 다소 다른 조건에서 수행된다. 우리는 가추적 코딩(abductive coding)에서는 이 재방문이 반드시 자료 분석의 초기 단계에서 체계적으로 준비되어야 한다고 본다. 이를 위해 초기 코드북(codebook)은 이론적으로 폭넓고(theoretically broad), 다양한 이론적 관점을 내포한 구성이어야 한다(→ step 1.a 참조). 이러한 이론적으로 포괄적인 코드북은 데이터를 여러 이론적 렌즈로 바라보는 데 필수적인 도구가 된다.

 

하지만 “현상 재고”는 초기 코딩 단계에만 국한되지 않는다. 이는 자료 축소(data reduction) 과정에서도 발생한다. 우리는 자료 축소가 “코드 방정식(code equations)”의 형태를 띤다고 제안한다(→ step 2.a 참조). 이러한 이론 중심의 코드 결합각 이론을 조작적으로 정의하는 수단이 되며, 면담(interview) 데이터에 이러한 코드 조합을 적용함으로써 연역적 검토(deductive test)가 수행된다. 바로 이 가추적 코딩 형태의 재방문을 통해, 예외적인 사례(anomalous cases)가 식별되고, 이는 연구자의 초기 이론적 프레임워크를 확장하는 데 기여한다(→ step 3.a 및 3.b 참조).

 

Timmermans와 Tavory(2012, 2014)에 따르면, “낯설게 하기(defamiliarization)”는 가추적 분석 논리를 뒷받침하는 또 다른 방법론적 단계이다. 그 핵심 아이디어는 당연하게 여겨졌던 것을 의심하고, 데이터를 새롭게 보는 관점을 확보하는 것이다. 이때 시간(time) 또한 가추적 분석을 촉진하는 중요한 매개가 된다. 즉, 자료 수집과의 직접성이 사라지면서 생기는 거리감이, 오히려 데이터를 낯설게 인식할 수 있는 여지를 제공하는 것이다. 이러한 낯설게 하기 과정은 결국 이론적으로 예외적인 사례를 발견하는 데 기여한다.

 

질적 데이터를 재분석할 때, 특히 중간 또는 대규모(N이 큰) 질적 연구에서는, 연구자들이 처음부터 자신이 다루는 자료에 대해 충분히 익숙한 상태일 가능성은 낮다. 이러한 맥락에서, 연구자들은 코퍼스(corpus)와 그 안에 포함된 개별 연구들에 익숙해지는 과정(familiarization)을 통해서야 비로소 새롭거나 예상치 못한 경험적 관찰(empirical observations)을 발견할 수 있게 된다.

 

우리는 이러한 데이터 익숙화(familiarization) 과정이 연역적 코딩(deductive coding)을 통해 진행되며, 그 이후의 귀납적 코딩(inductive coding)을 통해 이론적으로 예외적인 관찰(theoretically anomalous observations)을 식별할 수 있고, 이는 곧 ‘낯설게 하기(defamiliarization)’로 이어진다고 주장한다(→ step 1.b 참조). Deterding와 Waters(2018)가 강조했듯이, 코딩(coding)은 자료와의 익숙함 혹은 낯설음 (familiarization/defamiliarization)을 만들어내는 핵심적인 분석 활동이다.

 

그러나 질적 2차 분석에서는, 데이터와의 익숙함이 연구자에게 ‘낯설게 하기’의 대체물로 기능하기도 한다. 이러한 익숙함은 자료 축소(data reduction) 이후에도 발생하는데, 이때 연구자는 자신이 조작화하려는 현상이 실제로 자료 안에 존재하는지 확인하기 위해 코드 방정식(code equation)을 검증하게 된다(→ step 2.b 참조). 만약 현상이 뚜렷하게 드러나지 않는다면, 이는 코드 방정식이 불완전하거나, 현상에 불충분하게 조정된 것일 수 있으며, 이는 곧 해당 현상 및 그 개념화(conceptualization)에 대한 재고(reconsideration)를 유도한다.

 

또한, (낯설게 하기 / 익숙하게 하기)는 가추적 데이터 분석의 마지막 단계에서도 나타난다(→ step 3.a 참조). 축소된 사례(reduced cases)를 현상의 뉘앙스를 반영하도록 귀납적으로 다시 코딩(recoding)하면서, 연구자는 데이터를 새로운 방식으로 바라보게 되고, 이러한 과정은 이론 구축의 기폭제(trigger)가 된다. 이러한 점에서, (익숙함)/(낯설음)의 조합은 단지 예외적인 사례를 발견하는 데 그치지 않고, 이를 설명하기 위한 새로운 이론적 통찰(theoretical insights)을 생성하는 데 기여한다.


대안적 사례화(Alternative Casing)

세 번째 방법론적 단계는 “대안적 사례화(alternative casing)”이다(Timmermans and Tavory 2012; Tavory and Timmermans 2014).
Timmermans와 Tavory에 따르면,

“각 사례화(casing)는 현상의 서로 다른 측면을 추상화하고 강조하며, 이를 다른 현상과 비교할 수 있게 하고, 더 나아가 다른 분야 및 이론들과 연결될 수 있는 일반화(generalization)로 전환시킨다.” (ibid 2012: p.177)
또한, “이론적 배경은 경험적 퍼즐을 설정하는 방식으로 전면에 배치된다.” (ibid: p.177)

 

대안적 사례화란, 하나의 이론 혹은 복수의 이론 집합정밀하게 적용하여 수행하는 심층 사례 연구(in-depth case study)이다. 이는 분석 과정에서 본질적인 일부를 구성하며, 특히 팀 단위 연구(team-based research)에서는 더욱 그러하다. 이는 팀 구성원들이 주된 연구 질문의 서로 다른 측면을 분석하며, 각각 다른 학술 전통 및 이론적 틀을 활용할 가능성이 높기 때문이다. 이러한 점에서, 협업(teamwork)은 곧 대안적 사례화의 촉진 요인이 된다.

 

또한, 코드 방정식이 기존 이론에 기반하여 구성되어 경험적 데이터를 분석할 때, 대안적 사례화는 자료 축소 단계(step 2.a)에서도 발생한다. 마지막으로, 확장된 질적 분석 과정(extended qualitative analysis)에서도 대안적 사례화는 발생한다(→ step 3.a 및 3.b 참조).

 

따라서, 우리 접근에서의 “대안적 사례화”는 질적 분석을 통해 구현되며, 이는 연구자가 주요 경험적 사례에 대해 다양한 이론적 프레임워크를 깊이 있게 적용하는 과정이라 할 수 있다.


가추적 분석의 코딩 전략 해체하기 Unpacking Abductive Analysis in Coding

학술 문헌에서 존재하는 공백(gap)에 응답하고, 가추적 이론 구축(abductive theory-building)을 촉진하기 위해, 본 절에서는 1차 및 2차 데이터에 대한 가추적 코딩(abductive coding)을 위한 전략의 집합을 제시한다. 이 접근은 Peirce(1934)의 전통적인 가추 개념을 질적 연구 방법론 전략(Timmermans and Tavory 2012; Tavory and Timmermans 2014)과 결합한 것이다. 또한 이 접근은 계산사회과학적 가추 응용(computational applications of abduction)(Karell and Freedman 2019; Ignatow 2020), 질적 2차 분석을 위한 Breadth-and-Depth Method(Davidson et al. 2019)⁵, 그리고 Flexible Coding 접근법(Deterding and Waters 2018)을 기반으로 발전하였다. 더불어, 이 접근은 비계산적 질적 가추 적용 사례들(Carlson 2017a, 2017b, 2019; Timmermans 2017; Reilly 2018; Blee 2019; Vassenden and Jonvik 2019; Vila-Henninger 2020)에서 얻은 통찰을 반영하고 확장한 것이기도 하다.

 

마지막으로, 이 접근은 Tavory와 Timmermans(2014) 및 Fine and Tavory(2019)가 말한 “탐구 공동체(community of inquiry)”의 실천으로부터 출발하며, 우리는 우리 연구팀이 코딩과 분석에서 가추를 어떻게 집단적으로 적용했는지를 논의한다.

 

우리의 분석 단계는 다음 세 가지로 구성된다:

  1. 가추적 코드북 생성(Generating an Abductive Codebook)
  2. 코드 방정식을 통한 가추적 자료 축소(Abductive Data Reduction through Code Equations)
  3. 심층 가추적 질적 분석(In-Depth Abductive Qualitative Analysis)
    이러한 세 단계를 통해 가추(abduction)를 적용하여 이론을 구축하는 것이 가능하다(아래 Table 1 참조).

가추는 일련의 발견(discovery)의 순간들로 구성된다—분석 과정 중 일어나는 작은 발견들과, 그러한 순간들이 종합되어 나타나는 더 큰 발견이 그것이다(Tavory and Timmermans 2014). 우리의 접근에서

  • Step 1b(집단 코딩을 통한 귀납적 코드 생성)Step 2a(코드 방정식을 통한 텍스트 축소)는 분석자가 작은 가추적 움직임(little abductive movements) 속에서 창의적으로 데이터에 개입하는 단계이다.
  • Step 1b코딩과 관련된 작은 가추적 발견들이 축적되는 단계이며, 이러한 발견들은 Step 2a에서 코드 방정식을 발전시키고 데이터를 축소하는 또 다른 발견으로 이어진다.
  • 그 후 Step 2b(코드 방정식 검증)를 완료하고 Step 3(심층 가추적 질적 분석)으로 넘어가면서, 분석자는 이러한 작은 가추의 축적을 토대로 더 큰 이론적 발견을 이끌어낸다.

따라서 이 세 단계는 전체 가추적 분석(abductive analysis)의 논리와 진행을 구조화하는 데 도움을 준다. 연구자는 이 세 단계를 거치며, 보다 폭넓은 가추적 발견의 과정(abductive discovery process)에 참여하게 되고, Step 2b와 Step 3에서 놀랍고 이례적인 연구 결과를 기반으로 한 새로운 이론적 통찰(new theoretical insights)에 도달할 수 있다. 이러한 관점에서, 우리는 각 단계와 하위 단계가추적 탐구의 논리(logic of inquiry) 안에서 누적적(cumulative)인 성격을 지닌다고 본다.

 

이제부터는, 우리가 수행한 팀 기반 연구에서 각 단계에 해당하는 가추적 접근 사례를 제공할 것이다. 우리는 이 분석 접근을 통해 정책과 정치의 상호작용에 대한 이해를 심화시키고자 했다. 보다 구체적으로는, 공공정책에서 관찰 가능한 경향들(초국가화와 신자유주의)이 시민의 민주적 연결(democratic linkages)—즉 “시민이 정치 체계와 구조적이며 지속적인 방식으로 연결되는 다양한 형태”(Kitschelt and Wilkinson 2007)에 어떤 영향을 미치는지를 분석했다. 이 프로젝트의 중심 이론적 주장은 “정책 피드백(policy feedback)”이다 (예: Pierson 1993; Campbell 2003; Mettler 2002; Bussi et al., 2022).

 

본 논문에서는 이 중 두 가지 차원—민주적 연결(democratic linkages)과 신자유주의(neoliberalism)—에 집중하며, 세 개의 질적 데이터셋에 기반해 논의한다(각 데이터셋에 대한 세부 설명은 부록 Appendix 참조).

  • Céline Belot이 1995–96년에 영국에서 수집한 반구조화 면담(semi-structured interviews) (Belot 2000)
  • 2005–2006년 UK CITAE 포커스 그룹 (Duchesne et al. 2013)
  • 2016–17년 영국 총선 질적 연구(Qualitative Election Study of Britain)에서 수집된 반구조화 면담 (Carvalho, Winters and Oliver 2019)

Step 1. 가추적 코드북 생성(Generating an Abductive Codebook)

우리의 첫 번째 방법론적 단계는 가추적 코드북(abductive codebook)의 생성과 발전이다. 본 연구에서는 연구팀 구성원들이 각자 코딩 작업을 분담하여 수행하였다.

 

가추적 코드북 생성 과정은 두 개의 하위 단계로 나눌 수 있다:

  • a) 이론에 기반한 초기 연역적 코드북(initial deductive, theoretically-based broad codebook)을 사용하는 단계,
  • b) 이어서 집단 코딩(group coding)을 통해 귀납적 코드(inductive codes)를 생성하는 단계.

이러한 두 단계는 함께 가추적 코딩에서의 인덱싱(indexing)과 메모 작성(memoing)의 대응물로 기능한다(Deterding and Waters 2018 참조).

 

하지만 여기서의 인덱싱은 인터뷰 질문지(interview grid)를 기계적으로 따를 수 없다. 왜냐하면 1차 연구자들의 연구 목표와, 2차 질적 분석에서 새롭게 제기된 연구 질문들 간에는 방향성이 다르기 때문이다. 좀 더 일반적으로 보면, 이 두 하위 단계는 가추적 코딩을 위한 적용 가능한 전략(applied strategy)이자, 가추가 가진 분석적 잠재력(analytical potential)을 활용하여 혁신적인 발견(innovative findings)을 유도하는 첫 번째 전술(first tactic)로 간주할 수 있다.

 

Step 1은 연구자가 전문 코더(expert coder)로서 데이터에 몰입하고, 코딩을 통해—특히 revisit(재방문)과 (낯설게 하기)/(익숙해지기)를 통해—첫 번째 발견의 라운드를 만들어내는 단계이다. 이 전략을 통해, 연구자는 자신의 창의성(creativity)을 바탕으로 자신의 연구에 가장 적합한 방식으로 가추에 참여할 수 있으며, 동시에 이미 구조화된 전략을 바탕으로 가추적 코딩에 접근함으로써 놀랍거나 이례적인 결과(surprising and anomalous results)를 기존 이론들과의 대조 속에서 새로운 이론적 통찰(theoretical insights)로 발전시킬 수 있다(Brandt and Timmermans 2021 참조).


Step 1.a. 이론에 기반한 초기 연역적 코드북 사용하기
Step 1.a. Using an initial deductive, theoretically-based broad codebook

첫 번째 하위 단계는 초기 연역적이고 이론적으로 폭넓은 코드북(initial deductive, theoretically broad codebook)을 생성하는 것이다⁶. 이 코드북은 연구 질문을 구성하는 데 사용된 이론과 선행 연구를 기반으로 해야 한다. 핵심은, 이 코드북을 설계할 때 연구자가 본인의 연구 질문을 경험적으로 다룰 수 있도록 텍스트 발췌(excerpts)를 코딩할 수 있어야 한다는 점이다.

 

이 하위 단계는, 데이터셋 내에서 전략적으로 선별된 소수의 사례들(특히 다양성을 고려하여 선정)에 대해 첫 번째 코딩 라운드를 수행하고, 이를 통해 예시적(indicative) 코드들을 생성하는 과정을 포함한다.

 

우리 프로젝트에서는 연구팀 하위 그룹(subgroups)이 QDA 소프트웨어를 사용하여 데이터셋의 일부를 코딩하는 작업을 담당하였다. 초기 연역적 코드북은 크게 두 부분으로 구성되어 있었다:

  • 주제적 코드(thematic)
  • 기술적 코드(descriptive)

우리는 사회학적 지식(sociological knowledge)을 바탕으로, 시민들이 정치와 정책에 반응하는 방식을 구조화할 가능성이 높은 사회인구학적 요인들(예: 나이, 교육 수준)을 중심으로 분석에 중요한 변수들을 담은 기술적 코드북(descriptive codebook)을 구성하였다. 이러한 기술적 코딩은 Deterding와 Waters(2018, pp.17–18)가 강조한 속성(attributes) 코딩에 해당한다.

 

기술적 코드는 개인 특성에만 국한되지 않으며, 예를 들어 데이터가 수집된 시기(time period)나 장소(location)와 같은 다른 분석 수준(levels of analysis)도 분석에 중요한 역할을 할 수 있다.

 

이러한 기술적 코딩을 구축하고 적용하는 것과 동시에, 우리는 프로젝트의 네 가지 핵심 차원에 해당하는 관련 문헌을 조사하였다:

  • 정책(policies)
  • 민주적 연결(democratic linkages)
  • 초국가화(supranationalization)
  • 신자유주의(neoliberalism)

이들 각각의 차원은 대체로 연구팀 구성원 중 한 명 이상이 주로 분석을 담당한 핵심 연구 영역에 해당하였다. 이 모든 차원을 하나의 공통 코드북에 통합함으로써, 분석은 이론적 폭(theoretical breadth)을 확보하게 되었고, 이는 현상 재고(revisit)와 낯설게 하기(defamiliarization)를 동시에 가능하게 하여 가추적 추론의 핵심 논리를 강화할 수 있었다.

 

우리가 수행한 질적 2차 분석에서는, 이러한 개념들을 국가나 시기에 종속되지 않도록 조작화(operationalization)해야 했으며, 하나의 데이터셋에만 국한되지 않고 여러 데이터셋에 적용 가능해야 했다. 우리 연구의 주요 목표 중 하나는 “민주적 연결(Democratic Linkages)”에 대한 이해를 심화시키는 것이다. 초기에는 “민주적 연결” 코드북명시적으로 연역적 방식으로 개발하되, 귀납적 코드가 emergent할 수 있도록 충분히 넓은 설계를 택했다. 하지만 동시에, 이 코드북은 귀납적 코딩의 범위를 일정 부분 제한하는 역할도 하도록 구성하였다. 우리가 설정한 Democratic Linkages에 대한 연역적 코드들은 Easton(1965)의 패러다임적 틀(paradigmatic framework)에 기반하였다. 이 선택은, 시민과 민주주의의 관계에 대한 전후(post-war) 연구의 역사적 궤적에 대한 문헌 독해에서 비롯되었다(Dalton 2007; Hay 2007; Norris 2011). 많은 여론조사 문항들이 Easton의 이론에 영감을 받아 구성되었으며, 정치적 지지에 대한 장기 종단적 비교(longitudinal comparison)이 가능하도록 최소한의 변경만을 거쳐 유지되었다(Linde and Ekman 2003, p.1; 또한 Torcal and Moncagatta 2011 참조).

 

이러한 틀에 따라 우리는 다섯 가지 연역적 민주적 연결 코드를 생성하였다:

  • 정치 공동체(Political Community)
  • 체제 원칙(Regime Principles)
  • 체제 제도(Regime Institutions)
  • 정치 행위자(Political Actors)
  • 시민 참여(Citizen Participation)

(초기 연역적 코드 전체 목록은 부록 Appendix의 표를 참조할 것)


Step 1.b. 집단 코딩을 통한 귀납적 코드 생성
Step 1.b. Generating inductive codes through group coding

우리의 이론 구축 관점(theory-building approach)에서, 코딩의 초기 라운드(initial round of coding)를 통해 연구자는 귀납적 코드(inductive codes)를 생성하며, 이를 통해 이례적(anomalous)이거나 놀라운(surprising) 사례들을 식별하고 문서화하게 된다. 만약 분석이 팀 단위로 진행된다면, 이 과정 전반에 걸쳐 진행 상황을 논의하고 코드북을 업데이트하기 위한 정기적 회의가 도움이 된다.

 

연구자가 귀납적 코딩이 포화(saturation)에 도달했다고 판단하면, 코드북을 갱신하여 최종적인 가추적 코드북(abductive codebook)을 형성한다. 이후 분석자는 전체 코퍼스(corpus)—대개는 복수의 데이터셋으로 구성된 자료 모음—를 이 가추적 코드북을 활용하여 코딩하게 된다. 이 과정에서는 초기 연역적 코드북으로 코딩된 자료를, 새롭게 개발된 가추적 코드북으로 다시 코딩(recode)하는 작업도 포함된다.

 

우리 프로젝트에서는, 귀납의 첫 번째 요소가 나타난 지점은 바로 민주적 연결(Democratic Linkages)에 대한 연역적 코드북을 시험하고 발전시켜 나가던 과정에서였다. 초기에는, 우리는 정치권력의 공식적 지위를 지닌 정치 행위자들(예: 정치인)과, 공식적 권한은 없지만 정치적으로 영향력을 행사하는 기타 행위자들(예: 이익집단, 압력단체) 사이의 구분이 시민과 정치 체제 간의 관계 변화를 설명하는 데 유효할 수 있을 것이라고 가정했다. 이러한 가정은 기존 문헌, 특히 전통적 정치 행위자가 중요성을 잃고 “새로운” 행위자들이 비정치화된 정치 권력을 획득하는 이중 전환(double shift) 논의에서 도출되었다—예컨대 2008년 유로 위기 당시의 기술관료(technocrats)와 경제학자(economists)들의 사례를 참고하였다(Hay 2004, 2007; Harmes 2012; Stoker and Hay 2017). 그러나 실제 데이터를 분석한 결과, 이 두 유형의 정치적 행위자 간 구분은 시민과 민주주의 사이의 관계 변화를 설명하는 데 그다지 유의미하지 않았다. 대신, 우리가 발견한 것은 포퓰리즘(populism) 문헌에서 논의되는 요소들과 유사한 내용이었다(Kaltwasser 2017). 예컨대, 반복적으로 등장하는 “엘리트(elite)”에 대한 회의적 태도와, 민주주의를 “국민의 지배(rule by the people)”로 이해하는 경향, 그리고 참여를 투표나 시위 등을 통해 국민의 의지를 표현하는 수단으로 간주하는 시각 등이 그것이다.

 

우리의 관점에서 볼 때, 근거이론(grounded theory)의 코딩 체계나 기계 학습 알고리즘(machine learning algorithms)은 데이터 내의 이상(anomalies)을 식별하는 데에 본질적 한계를 지닌다. 근거이론의 경우, 선행 이론 없이 경험적 관찰을 “놀랍다”고 판단할 수 없다는 인식론적 이유가 문제이고, 기계 학습은 실천적 한계 때문이다. 이례적인 사례(anomalous cases)란 본질적으로 예상 불가능(unforeseen)한 것이며, 이를 감지하기 위해서는 상당한 수준의 전문가 지식(expert knowledge)이 요구된다. 예컨대 우리는 문맥상 핵심적인 의미를 담고 있음에도, 명확한 키워드(keyword)가 없는 문장, 단락, 혹은 전체 발췌 부분을 종종 코딩해야 했다.

 

게다가 2차 자료 분석(secondary data analysis)의 특성상, 분석할 코퍼스는 독립적으로 수집되었으며, 매우 다양한 형태의 데이터로 구성되어 있다. 예를 들어, 다양한 언어로 된 자료, 포커스 그룹(focus groups), 반구조화 인터뷰(semi-directive interviews) 등 데이터 유형 자체가 다양하다. 기계 학습 알고리즘이 이와 같은 문제들을 점차 처리할 수 있게 되어가고는 있으나, 이론적으로 이례적인 사례를 탐지하는 데는 아직 부족할 수 있다. 그럼에도 불구하고, 기계 학습 기반의 방법들이 가추적 논리(abductive logic)와 양립 불가능한 것은 아니라고 본다. 예컨대, 가추적 코드북에 기반하여 감독 학습(supervised learning) 알고리즘을 훈련시키고,
“테스트 세트(test set)”를 적용하여 그 타당성을 검토하는 방식을 고려해볼 수 있다(Grimmer and Stewart 2013).

 

우리는 Quinn et al.(2010)의 다음 주장에 동의한다:

텍스트 콘텐츠를 분석하는 각 방법은 고유한 전제를 지니며, 따라서 특정 연구 질문이나 텍스트 유형에 따라 고유한 장점과 한계를 가진다. (Quinn et al. 2010, p. 210)

 

결국, 연구자가 사용할 분석 방법은 연구 질문의 특성과, 텍스트 자료의 양과 이질성(heterogeneity), 그리고 탐색하려는 개념 범주의 복잡성을 고려하여 결정되어야 한다. 우리의 접근법은 특히 코딩 단계에서 비교적 높은 수준의 인간 자원(human “cost”)을 필요로 하며(Quinn et al. 2010), 이로 인해 분석 가능한 데이터의 양에는 제한이 있을 수 있음을 인정한다.


Step 2. 코드 방정식을 통한 가추적 자료 축소
Abductive Data Reduction Through Code Equations

우리의 접근에서 가추적 자료 축소(abductive data reduction)는 두 개의 하위 단계로 구성된다:

  • a) 코드 방정식을 통한 텍스트 축소(Text-reduction through code equations)
  • b) 코드 방정식 검증(Code equation verification)

 

Step 2a와 Step 2b 사이에는 중요한 구분이 존재한다.

  • Step 2a에서는 연구자가 코드와 상호작용하며, 이를 통해 데이터에 더욱 깊이 개입하고, 그 과정에서 초기 코드 방정식(initial code equation)을 구성하게 된다.
  • 반면, Step 2b는 이 코드 방정식을 활용하여 다시 데이터를 재접근(reengage)하고, 그 과정에서 “최종” 코드 방정식(final code equation)에 관한 중대한 가추적 발견(big abductive discoveries)을 이루는 단계이다.

이러한 “최종” 코드 방정식은 사실상 Step 1에서의 코딩을 통해 이뤄진 작은 발견들(little discoveries)의 누적으로 가능해진다. 코드 방정식(code equation)을 사용하면, 연구자는 여러 개의 코드를 서로 연결짓는 방식으로 복잡한 현상(complex phenomenon)을 이해할 수 있는 구조적 틀을 구성할 수 있게 된다.

 

또한, 코드 방정식은 하나의 현상을 구성하는 여러 요소들이 어떻게 상호 연관되는지를 통찰할 수 있는 수단을 제공한다. 이 단계는 다양한 방법론적 접근에서 사용되는 차원 축소(dimensions reduction) 개념과 유사하다. 예를 들어, 토픽 모델(topic modeling)이 문서 내 수많은 단어로 구성된 차원을 문서-주제(document-topics)라는 구조로 줄이는 방식이 그러하다(DiMaggio et al. 2013 참조). 다른 많은 분석 방법들도 복잡한 구성 요소들이 일정한 방식으로 ‘함께 움직인다(hang together)’는 패턴을 보이는 것을 통해 차원을 축소하며, 그 결과, 연구자가 새로운 개념화(new conceptualizations)에 도달할 수 있도록 돕는다.


Step 2.a. 코드 방정식을 통한 텍스트 축소
Text Reduction through Code Equations

키워드를 중심으로 정해진 단어 수 범위의 텍스트를 예비 분석(preliminary analysis)하는 기존 방식(Davidson et al. 2019, p. 372)과 달리, 우리는 전체 가추적 코드북(full abductive codebook)을 사용하여 코딩한 텍스트 발췌(passages)를 분석하는 또 하나의 유용한 접근 방식을 제안한다.

 

이 단계에서 핵심 과업은 QDA 소프트웨어를 사용해 이미 질적으로 코딩된 데이터를 축소하는 작업이다. 이를 위해, 우리는 연구자가 여러 코드에 걸쳐 존재하는 복합적 현상을 조작화(operationalize)할 수 있게 해주는 QDA 소프트웨어 기능을 활용할 것을 제안하며, 이 과정을 통해 질적 2차 분석 연구 질문을 경험적으로 다룰 수 있도록 한다. 우리는 “코드 방정식(code equations)”을, 개별 코드를 조합하여 그 너머에 있는 현상들을 조작화하는 방식으로 정의한다.

 

코드 방정식을 생성하는 것은 다음 두 가지 측면에서 특히 중요하다.

  1. 하나의 코드가 수백, 수천 개의 텍스트 발췌를 포함할 수 있기 때문에, 코드 방정식을 통해 보다 정밀한 이론 중심 조작화(theory-driven operationalization)를 수행할 수 있고, 이를 통해 텍스트를 의미 있는 방식으로 축소할 수 있다.
  2. 질적 2차 분석의 핵심적인 특징 중 하나는, 단일한 데이터셋을 넘어서는 연구 질문을 탐구할 수 있다는 점이다. 연구자들이 점점 더 복잡한 질문을 탐구하기 위해 데이터셋을 종합(compilation)하게 됨에 따라, 코드 방정식은 이에 대응하는 복잡한 조작화를 가능하게 한다.

이후 논의와 시연에서는 우리가 실제로 사용한 QDA 소프트웨어인 ATLAS.ti를 중심으로 설명한다. 우리 접근의 핵심 요소 중 하나는 ATLAS.ti의 “Query Tool”을 활용한 것이었는데, 이 도구는 NVivo의 “Coding Query” 기능과 유사하다. 코드 방정식은 “AND”, “OR”, “COOC”(co-occurrence, 두 개 이상의 코드가 함께 등장하는 경우) 등의 연산 기능을 활용하여 Query Tool에서 코드들을 조합함으로써 생성할 수 있다. 연구자는 이러한 방식으로 연역적 코드 방정식(deductive code equations)을 생성한 뒤, 해당 조작화가 실제 데이터 안에 존재하는지 여부를 탐색하게 된다. 이러한 과정을 통해, 우리는 거대한 텍스트 자료를 코드 방정식에 부합하는 발췌로 축소할 수 있게 된다. 만약 코드 방정식이 데이터 축소에 성공하지 못한다면, 이는 연구자가 해당 방정식을 조정할 필요가 있다는 신호일 수 있다(→ Step 2.b 참조).


이 접근은 모든 질적 연구자들이 공유할 수 있는 두 가지 상황에서 특히 유용하다고 우리는 주장한다.

  • 첫째, 이 방법은 연구 질문이 아직 이론화되지 않았거나(theorized), 충분히 이론화되지 않은(under-theorized) 현상에 초점을 맞추는 경우에 유용하다. 이러한 경우에는, 구체적인 연역적 코드를 생성하기에 충분한 정보가 존재하지 않는다.

예를 들어, 우리 팀의 초기 분석 중 하나는 영국 내 유럽연합 회의론(Euroscepticism)에 관한 문헌에서 파생된 다음과 같은 연구 질문에서 시작되었다:

“영국 시민들은 어떻게 시장 경쟁을 지지하는 신자유주의적(Neoliberal) 이념과, EU 가입을 반대하는 민족주의적(Nationalist) 이념을 결합하는가?”

 

이 질문의 핵심에는 특정한 형태의 영국식 유럽연합 회의론이 자리잡고 있다. 즉, 국민 정치 공동체(national political community)로서의 민족주의(nationalism)와 공정한 시장 경쟁(fair market competition)이라는 신자유주의(neoliberalism)를 결합하여 EU를 거부하는 시민들의 태도이다. 따라서, 우리는 신자유주의와 민족주의의 교차지점(intersection)을 탐색하고자 했다. 이러한 교차는 당시 상당히 이론화되지 않은 상태였다. 그러나 우리는 신자유주의 코드와 민족주의 코드를 결합한 코드 방정식(code equation)을 통해, 가추적 발견(abductive discovery)의 과정을 진행할 수 있었다. 이처럼 두 가지 코드의 조합을 통한 방정식을 활용함으로써, 이론적 틀 없이도 데이터를 통해 새로운 통찰을 도출해낼 수 있었다.

 

  • 둘째, 코드 방정식은 기존 코드북의 코드보다 훨씬 구체적인 코드를 사용할 때에도 유용하다.

예컨대, 우리는 “영국 시민들이 적용한 신자유주의와 민족주의의 교차”만을 분석하고자 했다. 이를 위해 우리는 영국이라는 주제에 코딩된 연역적 코드를 코드 방정식에 추가하였고, 이를 통해 응답자가 신자유주의와 민족주의 이데올로기를 영국과 관련된 맥락에서 결합해 사용하는 사례만을 추출할 수 있었다. 보다 구체적으로, 우리는 다음과 같은 이론적 가정에서 출발하였다: 우리는 우리의 연구 질문을 통해, 민족주의적 신자유주의 정당화(nationalist neoliberal legitimations) 담론 속에서 ‘인풋 정당성(input legitimacy)’과 ‘아웃풋 정당성(output legitimacy)’을 모두 발견할 수 있을 것이라고 기대하였다. 이를 조작화(operationalization)하는 초기 단계에서, 우리는 다음 두 가지 코드 방정식을 구성하였다. 이 방정식들은 각각 Scharpf(1997, 1999)의 개념을 기반으로 하며, 우리가 생성한 여러 코드를 동원하였다:

 

 

우리 연구에서 코드 방정식(code equations)을 활용하는 방식이론적으로 관련 있는 코드들(theoretically relevant codes)을 결합하는 것이었다. 따라서, 이러한 접근은 보다 해석 중심의 방법(interpretative approaches)(Glaser and Strauss 1967; Nelson 2017)에서는 불가능했을 것이다. 왜냐하면 우리가 생성한 코드 방정식은 이론적으로 중요하다고 식별된 코드들을 조합한 것이기 때문이다. 우리가 사용한 가추적 코드(abductive codes)는 연구자들이 해석적 분석(interpretative analysis)을 통해 생성한 것으로, 이는 기계 학습 알고리즘(machine learning algorithms)을 통한 코딩으로는 재현이 불가능하다.

 

이 점에서, Karell and Freedman(2019)이 수행한 접근 방식—즉,

계산적 결과(computational results), 특정 코퍼스 자료의 정밀 독해(close reading), 사회운동 관련 문헌 및 추가 이론을 순환적으로 연결하여 급진적 수사(rhetoric)에 대한 새로운 개념화를 도출” (ibid: 730)—와 비교해볼 수 있다.

 

우리의 접근은 연역적 코드(deductive codes)와 귀납적 코드(inductive codes)를 모두 활용한 순환적 가추 코딩 접근(recursive abductive coding approach)으로 구성되어 있다. 특히, 연구팀 구성원들이 이론적으로 이례적(theoretical anomalies)이라고 판단한 코드를 활용했다는 점에서, 이 접근은 귀납적 분석이나 기계 학습 접근으로는 제공될 수 없는 방식으로 연구 질문에 적합한 분석 타당성(relevance)을 부여해 준다.

 

마지막으로, 이 단계는 Davidson et al.(2019)이 제시한 두 번째 단계 “Recursive surface ‘thematic’ mapping”과 유사한 핵심 역할을 수행한다는 점을 주목할 필요가 있다. 하지만, 우리의 하위 단계(sub-step)는 키워드를 기반으로 한 자료 축소가 아니라, 코드 방정식(code equations)을 통해 데이터를 축소한다는 점에서 차별화된다.


Step 2.b. 코드 방정식 검증(Code Equation Verification)

우리가 Query Tool을 사용해 코드 방정식(code equation)을 생성한 이후, 해당 코드 방정식으로 지정된 텍스트 발췌(excerpts)를 분석하였다. 이 단계를 진행하기 위해서는 분석자가 각 발췌를 재방문(revisit)하여, 해당 코드 방정식이 조작화(operationalization)하려는 현상이 실제로 그 텍스트 안에서 식별될 수 있는지를 검증해야 한다. 이 과정에서 “위양성(false positives)”을 식별하는 절차가 이루어진다. 여기서 위양성이란, 해당 코드 방정식에 지정된 모든 코드로 코딩된 발췌임에도 불구하고, 연구자가 그 안에서 조작화된 현상을 실제로 인식할 수 없는 경우를 의미한다.

 

연구자는 코드 방정식으로 식별된 각 발췌에 대해 메모와 함께 기록을 유지해야 하며, 각 위양성이 해당 현상의 사례가 아닌 이유도 명확히 정리해야 한다. 이 과정을 통해, 연구자는 조작화된 개념에 이론적으로 이례적인(anomalous) 사례를 식별할 수 있게 되고, 이로써 가추적 분석(abduction)의 적용을 한 단계 더 확장하게 된다. 이후 분석에서는 위양성과 검증된 사례 간 비교 및 대조를 수행할 수 있다.

 

코드 방정식의 유용성을 판단할 수 있는 핵심 요소는 두 가지이다. 첫째는 자료 축소(data reduction)이다. 만약 코드 방정식이 데이터를 사람이 적절한 시간 안에 분석할 수 있을 정도로 축소하지 못한다면, 이는 해당 방정식이 너무 광범위하고(overly broad),
따라서 조작화의 범위도 과도하게 넓다는 신호이다. 둘째는 위양성(false positives)의 수이다. 수용 가능한 위양성의 수는 데이터와 연구 질문의 성격에 따라 달라지겠지만, 일반적인 기준은 위양성의 수가 실제 일치 사례(matches)보다 많을 경우, 코드 방정식이 충분히 정밀하지 않다는 것이다.

 

이 단계에서는 또한, 연구자가 코드 방정식이 불완전하다는 사실을 깨닫고, 검증 단계에서 방정식을 조정하여, 새롭게 업데이트된 방정식으로 식별된 발췌를 다시 검토할 수도 있다. 코드 방정식을 개발하는 과정은 다소 시간이 걸릴 수 있으며, 여러 차례의 반복적 수정을 동반할 수 있다. 예를 들어, 코드 방정식이 텍스트 발췌를 전혀 축소하지 못하거나, 극히 제한적으로만 축소할 경우, 이는 방정식이 조정이 필요하다는 신호일 수 있다.

 

질적 연구에서 코드 방정식 검증(code equation verification)은 개념 정제(concept refinement)를 위한 유용한 도구이다. 해당 방정식으로 식별된 데이터와 일치 여부를 이중 점검(double-checking)함으로써, 코딩의 타당성을 확인하는 것뿐만 아니라, 해당 현상의 조작화 방식도 정교화할 수 있다. 따라서, 코드 방정식 검증은 연구자가 조작화 및 개념화(conceptualization)의 범위가 지나치게 좁거나 넓은지 판단하는 데에도 유용한 수단이 된다.


가추적 분석(abductive process)의 맥락에서, 코드 방정식(code equations)은 핵심적인 전환점(key turning point)이다. 코드 방정식 검증(code equation verification)은 작은 발견(small discoveries)과 큰 발견(large discoveries)을 모두 포함한다. 연구자는 코드 방정식을 검토하고 수정하는 과정에서 작은 가추적 발견들을 이끌어내고, 방정식이 너무 좁지 않으면서(위양성이 지나치게 많지 않으면서), 너무 넓지도 않아야(데이터가 거의 축소되지 않을 정도로 방정식이 포괄적이지 않아야) 한다는 기준에 도달할 때, 연구자는 코드 방정식이 식별한 사례들(matching cases)을 바탕으로, 그 데이터가 이론적으로 타당하며 일관성 있는 발견인지를 평가할 수 있다. 이러한 과정이 완료되면, 연구자는 자신이 “큰 가추적 발견(big abductive discovery)”을 했다는 것을 알 수 있으며, 이를 통해 “최종 코드 방정식(final code equation)”을 확립하게 된다.

 

우리의 연구에서는, 이렇게 도출된 코드 방정식을 통해, 해당 방정식과 일치하는 모든 인용구(quotations)를 분석하였다. 이 과정을 통해 두 가지 점이 명확해졌다. 첫째, COOC(co-occur) 기능은 충분히 정밀하지 않아, 인풋 정당성(input legitimacy) 또는 아웃풋 정당성(output legitimacy)을 설명하지 않는 인용구들—즉 위양성(false positives)—을 너무 많이 생성했다. 둘째, 두 가지 다른 정당성 유형을 구분하는 대신, 우리가 분석한 인용구들에서는 응답자들이 동일한 정당화 논리(one logic of legitimation)를 사용하여 영국(UK)을 정당화하고, 동시에 EU를 비정당화(delegitimate)하고 있음을 발견했다. 이에 우리는 이러한 현상을 “국가주의적 신자유주의 유럽회의주의(Nationalist Neoliberal Euroscepticism)”라고 명명하였다(Vila-Henninger et al. 2019a, 2019b). 이처럼, 코드 방정식의 여러 차례 반복 개발(iteration)을 통해 우리는 최종 코드 방정식을 도출해냈다.

 

여기에서 중요한 점은, 이론적 틀의 변화(shift in theoretical frameworks)가 있었음을 인정하는 것이다. 우리가 인용구를 분석한 결과, 인풋/아웃풋 정당성 구분은 분석에 적합하지 않았고, 대신 이러한 ‘공정성 정당화(fairness legitimations)’를 “정당한 통치 기준(rightful standards of governance)”에 관한 사회적으로 널리 수용된 믿음을 이용한 정치 권력의 정당화”로 이해하는 것이 더 유용하다는 것을 알게 되었다(Beetham 1991; Beetham and Lord 1998 참조). 

 

우리는 이 모든 과정이 귀납적(inductive) 접근이나 기계 학습(machine learning) 접근만으로는 불가능하다고 본다. 왜냐하면 우리의 기법은 연역적 코드(deductive codes)와/또는 가추적 코드(abductive codes)를 활용하기 때문이다. 따라서, 우리는 연역적 및 가추적 코드들을 활용하여, 연구 질문과 관련된 더 섬세한 뉘앙스를 분석에 포함할 수 있는 두 번째 가추(abduction)의 과정을 수행할 수 있었다. 이러한 목표 지향적 분석(directed analysis)1차 연구자나 텍스트 내 단어의 확률적 결합이 아니라, 2차 연구자의 연구 질문에 중심을 두는 방식이다(Karell and Freedman 2019, p.729 참조). 이 단계는 Davidson et al.(2019)이 말한 세 번째 단계 “Preliminary analysis(예비 분석)”와 유사하다. 하지만, 키워드를 포함하는 텍스트 발췌를 분석하는 대신, 이 단계에서는 가추적 코딩(abductive coding)을 통해 후속 코딩 및 예비 분석을 수행할 수 있다.


Step 3. 심층 가추적 정성 분석 (In-Depth Abductive Qualitative Analysis)

우리의 접근에서, 가추적 정성 분석(abductive qualitative analysis)은 다음 두 개의 하위 단계로 구성된다:

  • a) 축소된 사례에 대한 귀납적 코딩(Inductive coding of reduced cases)
  • b) (수작업) 정성 분석(Manual qualitative analysis)

이 단계의 두 하위 단계 모두를 통해, 연구자는 Deterding와 Waters(2018)가 제안한 “3단계: 코딩 타당성 탐색, 이론 검증 및 정제(Exploring Coding Validity, Testing, and Refining Theory)”(ibid: p. 23)을 가추적으로 적용할 수 있다는 점이 중요하다.


Step 3.a. 축소된 사례에 대한 귀납적 코딩

연구자는 QDA 소프트웨어의 코드 방정식을 통해 검증된 사례들(verified cases)을 기반으로 수작업 수단(manual means)을 통해 심층 정성 분석(in-depth qualitative analysis)을 수행한다. 이 과정의 일환으로, 코드 방정식에 의해 식별된 코드들을 중심으로 한 새로운 귀납적 코딩 체계가 생성된다.

 

이러한 귀납적 코딩 체계는,

  • 코드 방정식을 통해 검증된 사례를 분석하는 과정에서 등장하며,
  • 코드 방정식이 조작화한 현상의 뉘앙스(nuance)를 포착하고,
  • 아직 문헌에 문서화되지 않은 더 정교한 수준의 데이터 기반 코드(data-driven codes)를 생성함으로써
    이론을 한층 더 발전시킬 수 있도록 해준다.

이 하위 단계는 또한, 코드 방정식의 재수정(code equation revision)을 초래할 수 있으며, 그 결과 다시 2단계로 되돌아가게 되는 순환(iteration)을 만들 수도 있다. 우리 연구에서는, 최종 방정식에 부합하는 모든 사례를 추출하고, 모든 위양성을 제거한 후, 이러한 사례들에 대해 귀납적 코딩을 수행하였다. 그 결과, 우리는 국가주의(nationalism)와 신자유주의(neoliberalism)의 교차가 시민들의 인식 속에서 어떻게 결합되어, 1990년대 중반부터 브렉시트 직후까지의 특정한 형태의 영국 유럽회의주의(Euroscepticism)를 형성해왔는지를 발견할 수 있었다. 우리의 코딩 결과에 따르면, 이러한 영국식 유럽회의주의의 형태는 우리가 분석한 모든 데이터셋에서 발견되었으며, 즉 20년이 넘는 기간 동안, 다양한 사회 집단에 걸쳐 존재하고 있었다. 보다 구체적으로, 최종 방정식을 통해 식별된 사례들에 대한 정성 분석은 영국 시민들이 EU를 평가할 때 참조한 비교 준거(benchmarking)에서, 국가주의적 신념과 신자유주의적 신념이 어떻게 결합되어 나타났는지를 포착하였다(Vila-Henninger et al. 2019b). 우리는 시민들이 자국의 자율성(national autonomy)을 긍정적으로 참조점으로 삼았기 때문에, EU 가입이라는 현상(status quo)이 불리한 선택지로 인식되었다는 것을 보여준다(De Vries 2018 참조). 이러한 결과는 우리 분석에서 핵심적 역할을 했다. 바로 이 두 번째 가추적 분석 라운드(second round of abductive analysis)를 통해, 우리는 이례적인 사례들(anomalous cases)을 식별할 수 있었고, 이를 통해 연구 대상 현상에 대한 보다 섬세한 이해에 도달하였으며, 궁극적으로 우리의 이론적 설명(theoretical explanation)을 구축할 수 있었다.


Step 3.b. 심층(수작업) 정성 분석 (In-depth (Manual) Qualitative Analysis)

마지막 단계는 심층적인 수작업 정성 분석(in-depth manual qualitative analysis)이며, 이 과정에서는 논문, 연구 보고서, 또는 단행본 집필(writing of articles, research reports, and/or books)로 이어진다. 이 단계는 Davidson et al.(2019)이 제시한 4단계 “심층 해석 분석(In-depth interpretive analysis)”(p. 372)에 해당하며, 동시에 Deterding와 Waters(2018)의 3단계 “타당성 탐색, 이론 검증 및 정제(Exploring Validity, Testing and Refining Theory)”(pp. 23–25)를 종결짓는 단계이기도 하다.

 

이 단계가 “수작업(manual)” 분석임을 강조하는 이유는, 이 분석이 QDA 소프트웨어나 컴퓨터 프로그램이 아닌 인간 연구자(human researcher)에 의해 수행되기 때문이다. 이 단계에서, 연구자는 2단계의 코드 방정식(code equation) 또는 3.a 단계의 귀납적 코드(inductive codes)가 불완전하거나 미흡하다는 점을 깨달을 수도 있다. 그럴 경우, 다시 2단계 또는 3.a 단계로 되돌아가 분석을 정제(refine)하고, 보다 완결성 있는 실증적 응답(empirical response)을 연구 질문에 제공하게 된다.

 

우리의 연구 질문과 관련해서는, 최근의 기존 연구들이 시민 담론에서의 신자유주의(neoliberalism)와 민족주의(nationalism)의 표현을 확인한 바 있다 (Taylor-Gooby et al. 2019; Andreouli and Nicholson 2018; Andreouli 2019). 그러나 우리의 접근은,
단지 유럽회의주의의 혼종적(hybrid) 형태를 식별하는 데에 그치지 않고, 시민들이 민족주의적 신념과 신자유주의적 신념 사이를 어떻게 ‘항해(navigate)’하면서, 영국의 EU 회원국 지위를 자율성에 비추어 비교 참조(benchmarking)하는지를 보다 깊이 있게 조명할 수 있게 해주었다. 아래에서는, 우리의 가추적 코딩(abductive coding)과 심층 정성 분석이 어떻게 기존 이론을 토대로 하면서도 새로운 이론적 통찰(theoretical insights)을 생성했는지를 보여주는 수작업 정성 분석의 실제 사례를 제시하고자 한다(Vila-Henninger et al. 2019a, 2019b).


논의 (Discussion)

가추적 분석(abductive analysis)과 코딩(coding)을 함께 논의하는 것은, 특히 질적 2차 분석(secondary qualitative analysis)이나 대규모 인터뷰 연구(large-scale interview research) 같은 현대 사회과학의 새롭게 부상하는 분석 방식에서 코딩 전략이 어떻게 발전(또는 발견)될 수 있는지를 모색하는 데 핵심적이다. 오늘날 (대규모) 질적 2차 분석이 보여주는 변화된 분석 관행을 인정하지 않는다면, 많은 질적 연구자들은 엄밀한 분석을 수행하는 데 필요한 방법론적 준비가 부족한 상태에 놓이게 된다(Deterding and Waters 2018).

 

우리는 가추적 분석이, 신중한 방법론적 자료 분석 및 코딩 전략을 통해 더 효과적으로 수행될 수 있다고 주장하며, 이러한 코딩 전략이 분석을 어떻게 풍부하게 하고, 창의적이며 참신한 이론적 통찰(theoretical insights)을 생성하는 조건을 어떻게 조성하는지를 이 글에서 체계적으로 설명하였다. 질적 가추의 핵심은, 각 단계들 간의 대화적 연결(dialogue)을 통해 이론을 발전(develop), 확장(extend), 정제(refine)해 나가는 데 있다. 이러한 대화는 가추에 관한 질적 연구들(Timmermans and Tavory 2012; Tavory and Timmermans 2014)에서도, 그리고 대규모 질적 연구(Big Qual)에 관한 문헌(Davidson et al. 2019)에서도 공통적으로 관찰된다.

 

우리의 접근은 이론 중심(Theory-driven) 분석과 데이터 중심(Data-driven) 분석 간의 대화를 유도하려는 시도로 볼 수 있다. 바로 이 가추적 과정(abductive process)을 통해, 연구자는 이례적인 사례(anomalous cases)를 식별하고, 이를 가추 분석을 수행하는 이론적 틀 속으로 통합함으로써 이론 구축(theory building)에 참여하고, 가추적 추론(abductive inference)을 확장해 나간다. 우리는 본 논문이 가추에 대한 방법론적 작업(methodological work on abduction)— 즉 Timmermans와 Tavory(2012, 2014, 2019)의 작업—에 기여하고 있으며, 이러한 틀이 사회학을 비롯한 다양한 학문 영역에서 가추의 실증적 응용(empirical application)을 촉진하는 데 활용되기를 바란다 (Carlson 2017a, 2017b, 2019; Timmermans 2017; Reilly 2018; Blee 2019; Karell and Freedman 2019; Vassenden and Jonvik 2019; Ignatow 2020; Vila-Henninger 2020 참조).

 

특히 우리는 코드 방정식(code equations)을 핵심적인 코딩 전략으로 제안하고 있다. 코드 방정식은 연구자가 단지 현상의 하위 구성 요소들이 어떻게 ‘함께 작동(hang together)’하는지를 볼 수 있게 할 뿐만 아니라, 그 구성 요소들 간의 관계를 이해하게 해준다. 즉, 코드 방정식은 가추적 발견(abductive discovery) 과정의 촉진자 역할을 하며, 우리의 적용적 접근(applied approach)을 지탱하는 핵심 축(anchor)이 된다. 또한, 자료 축소 전략(data reduction strategy)에서도 중요한 기능을 한다. 우리는 코드 방정식을 통해, 단일 코드로는 분석할 수 없는 더 복잡한 연구 질문의 요소들을 연구자가 탐색할 수 있다고 주장한다. 이론 중심의 코드 방정식은 기계 학습(machine learning)이나 계산적 접근(computational approaches)에도 잘 활용될 수 있으며, 이러한 도구를 사용하는 연구자들이 이 전략을 적극적으로 적용해보기를 권장한다.

 

우리는 이 논문이 질적 2차 분석(secondary qualitative analysis)에 관한 연구에도 기여하고 있다고 본다. 이는 프랑스어권 문헌(Duchesne 2017)과 영어권 문헌(Hughes and Tarrant 2020) 모두에 해당한다. 우리는 질적 2차 분석이 점점 더 유용하고 필수적인 도구로 부상하고 있다고 생각한다. 이 접근이 다른 연구자들이 질적 2차 분석을 활용해 이론을 구축하는 데 도움을 줄 수 있기를 기대한다(Swedberg 2017). 또한 본 논문은 질적 2차 분석(Duchesne 2017; Hughes and Tarrant 2020)과 가추에 관한 문헌(Timmermans and Tavory 2012; Tavory and Timmermans 2014) 간의 학술적 교류를 촉진하는 데에도 기여할 수 있다. 우리는 더 많은 연구자들이 COVID-19로 인한 연구 제약, 그리고 질적 데이터 저장소의 증가 속에서, 질적 2차 분석이 제공하는 가능성을 주목하게 되기를 바라며, 이러한 변화 속에 가추적 접근이 포함되기를 희망한다. 마지막으로, 우리의 접근은 팀워크를 통한 질적 이론 구축을 촉진하고, 연구자 간 역할 분담 전략의 개발에도 기여할 수 있다.

 

결론적으로, 우리는 다음과 같은 점을 강조하고자 한다. 질적 2차 분석은 결코 1차 질적 분석(primary qualitative analysis)의 대체물이 되어서는 안 된다. 그보다는, 연구 질문이 요구하는 경우, 이론을 구축하고, 1차 질적 분석만으로는 실증적으로 응답할 수 없는 과학적 탐구에 대응하기 위한 도구로 사용되어야 한다. 따라서, 1차와 2차 질적 연구는 상호보완적(complementary)이며, 특정 질적 데이터셋의 기여도를 확장하고, 가추적 추론을 더욱 심화시키는 데 함께 사용될 수 있다.

 

+ Recent posts