출처: Patton, M. (1990). Qualitative evaluation and research methods (pp. 169-186). Beverly Hills, CA: Sage
https://psycnet.apa.org/record/1990-97369-000
목적적 표본추출 (Purposeful Sampling)
양적 연구와 질적 연구의 차이를 가장 잘 보여주는 것은 아마도 표본추출 접근 방식을 뒷받침하는 각기 다른 논리일 것입니다. 질적 연구는 대체로 비교적 적은 수의 표본이나 단일 사례(n=1)를 깊이 있게 분석하며, 이를 목적적으로 선택하는 경우가 많습니다. 반면에 양적 방법은 대개 무작위로 선택된 더 큰 표본에 의존합니다. 두 방법 간 표본추출 기법이 다를 뿐 아니라 각 접근 방식의 논리 또한 고유하며, 이는 각 전략의 목적이 다르기 때문입니다.
확률 표본추출의 논리와 강점은 진정한 무작위적이고 통계적으로 대표성 있는 표본을 선택함으로써 표본에서 더 큰 모집단으로 자신 있게 일반화할 수 있다는 점에 있습니다. 이러한 접근 방식의 목적은 일반화에 있습니다.
목적적 표본추출의 논리와 강점은 연구를 깊이 있게 수행하기 위해 정보가 풍부한 사례를 선택하는 데 있습니다. 정보가 풍부한 사례란, 연구 목적에 중요한 문제들에 대해 많은 것을 배울 수 있는 사례를 의미하며, 이러한 이유로 ‘목적적 표본추출’이라는 용어가 사용됩니다. 예를 들어, 프로그램이 낮은 사회경제적 계층에게 더 효과적으로 다가가는 방법을 평가하려는 목적이 있다면, 프로그램 전체에서 통계적으로 대표성 있는 표본을 대상으로 표준화된 정보를 수집하기보다는, 신중하게 선택된 소수의 빈곤 가정을 심층적으로 이해하여 그들의 필요, 관심, 동기를 파악함으로써 더 많은 것을 배울 수 있습니다. 목적적 표본추출의 목적은 연구 질문을 조명할 수 있는 정보가 풍부한 사례를 선택하는 것입니다.
정보가 풍부한 사례를 목적적으로 선택하기 위한 여러 가지 전략이 있으며, 각 전략의 논리는 특정 평가 목적에 부합합니다.
1. 극단적 또는 일탈 사례 표본추출 (Extreme or deviant case sampling):
이 접근법은 특정 방식으로 특이하거나 특별한 사례, 즉 정보가 풍부한 사례에 집중합니다. 특이하거나 특별한 사례는 특히 문제가 있거나 대단히 계몽적일 수 있으며, 이는 탁월한 성공 또는 주목할 만한 실패 사례 등을 포함할 수 있습니다.
- 예를 들어, 평가가 전국 프로그램이 더 많은 고객에게 다가가는 데 도움을 주기 위한 데이터 수집을 목표로 한다면, 대기자 명단이 긴 몇몇 프로젝트 현장을 대기자 명단이 짧은 현장과 비교할 수 있습니다. 만약 직원의 사기가 문제라면, 사기가 높은 프로그램과 낮은 프로그램을 비교하여 연구할 수 있습니다.
극단적 사례 표본추출의 논리는, 일반적인 프로그램을 개선하는 데 도움이 될 수 있는 비정상적 조건이나 극단적 결과에 대해 배울 수 있다는 데 있습니다.
- 예를 들어, 수백 개의 지역 사이트가 포함된 전국 프로그램을 연구하고자 한다고 가정해 봅시다. 상당수의 프로그램이 비교적 잘 운영되고 있으며, 일부는 문제가 많은 상태에 가깝고, 대부분의 프로그램은 '괜찮다'는 평가를 받는다고 알고 있습니다. 이는 여러 프로그램을 방문하여 해당 프로그램의 변동성을 대략적으로 파악한 지식이 있는 소식통을 통해 얻은 정보입니다.
그렇다면 연구를 위해 프로그램을 어떻게 표본추출해야 할까요? 프로그램 간의 자연스러운 변동성을 정확히 문서화하려면 무작위 표본을 추출하는 것이 적절하며, 충분히 대표성을 가지는 무작위 표본을 통해 프로그램 전체에 대한 일반화를 허용할 수 있습니다. 그러나 이미 프로그램 변동성에 대한 일부 정보가 확보된 상태에서, 즉각적인 관심사는 극단적 사례일 수 있습니다. 자원이 제한되고 시간이 부족한 경우, 평가자는 실제로 매우 열악한 프로그램 한두 개와 매우 우수한 프로그램 한두 개를 집중적으로 연구하여 더 많은 것을 배울 수 있습니다. 따라서 평가 초점은 프로그램이 어떤 조건에서 문제에 빠지는지, 어떤 조건에서 탁월성을 나타내는지를 이해하는 것으로 전환됩니다. 심지어 열악한 프로그램이나 우수한 프로그램을 무작위로 표본추출할 필요조차 없습니다. 연구자와 연구에 관여한 의도된 사용자가 가장 많은 것을 배울 수 있다고 생각하는 사례들을 깊이 고민하여 그러한 사례들을 연구 대상으로 선택합니다.
단일 프로그램 내에서도 동일한 전략을 적용할 수 있습니다. 설정된 환경 내 대표적인 사람들에 대한 표본을 연구하는 대신, 평가자는 특정 관심을 갖는 사례들, 예를 들어 예상치 못한 중도 탈락자나 탁월한 성과를 거둔 사례를 집중적으로 연구하고 이해하는 데 초점을 맞출 수 있습니다. 많은 경우, 극단적이거나 특이한 사례를 집중적으로 연구하는 것이 평균적인 사례의 통계적 묘사에서 배울 수 있는 것보다 더 많은 것을 배울 수 있습니다. 다른 평가에서도 특수 사례에 대한 상세 정보는 참여자들의 정상 분포에 대한 통계 데이터를 보완하는 데 활용될 수 있습니다.
민속방법론자(Ethnomethodologists)는 현장 실험(field experiment)을 수행할 때 극단적 사례 표본추출 방식을 사용합니다. 민속방법론자들은 특정 환경에서 사람들이 공유하는 깊이 이해된 일상 생활의 경험에 관심을 갖습니다(3장을 참조하십시오). 일상생활의 암묵적 가정과 규범을 드러내는 한 가지 방법은, 규범에서 벗어난 혼란을 만들어내는 것입니다.
- 예를 들어, 식당에서 누군가가 무례하게 음식을 먹는 것을 관찰하고 그 장면을 본 사람들을 인터뷰하여 그들이 무엇을 보고 어떤 느낌을 받았는지 조사하는 것은, 일상의 의미를 밝히기 위해 일탈 사례를 연구하는 한 예라 할 수 있습니다.
1982년 베스트셀러 연구 In Search of Excellence에서 Peters와 Waterman은 "미국에서 가장 잘 운영되는 기업들"을 대상으로 한 연구를 통해 목적적이고 극단적인 그룹 표본추출의 논리를 잘 보여주었습니다. 그들의 연구는 미국 산업 전반을 완벽하게 대표하려는 것이 아니라, 비즈니스 분야를 관찰한 전문가 그룹이 혁신적이고 우수하다고 평가한 62개 기업 목록을 기반으로 이루어졌습니다 (Peters와 Waterman, 1982: 19).
또 다른 극단적 그룹 표본추출의 훌륭한 예는 Angela Browne의 1987년 연구 When Battered Women Kill입니다. 그녀는 가정 폭력의 가장 극단적인 사례를 심층적으로 연구하여 폭력과 학대 현상을 설명하고자 했습니다. Browne의 책은 목적적 표본추출을 통해 적용 연구를 수행하는 질적 연구의 모범 사례로 평가됩니다.
2. 강도 표본추출 (Intensity Sampling):
강도 표본추출은 극단적 사례 표본추출과 동일한 논리를 따르지만, 극단적인 요소를 덜 강조합니다. 강도 표본은 연구 주제에 대한 현상을 강하게(하지만 극단적이지는 않게) 나타내는 정보가 풍부한 사례로 구성됩니다. 극단적이거나 일탈적인 사례는 연구 주제를 왜곡할 정도로 너무 특이할 수 있습니다. 강도 표본추출의 논리를 사용하면, 연구자가 관심을 가지는 현상의 우수하거나 풍부한 사례를 찾되, 특이한 사례는 제외하게 됩니다.
휴리스틱 연구는 강도 표본추출을 사용합니다. 휴리스틱 연구는 연구자의 개인적 경험을 강하게 반영하며, 외로움이나 질투와 같은 강렬한 감정을 경험한 공동 연구자들도 연구에 참여합니다(3장 참조). 휴리스틱 연구자는 외로움, 질투 또는 연구 주제의 병리적이거나 극단적인 형태를 찾는 것이 목적이 아닙니다. 이러한 극단적 사례는 휴리스틱 탐구의 반성적 과정에 적합하지 않을 수 있기 때문입니다. 반면에 연구자와 공동 연구자의 경험이 너무 약하다면 연구할 내용이 충분하지 않을 것입니다. 따라서 연구자는 연구 주제의 현상을 설명하기에 충분한 강도의 사례를 찾고자 합니다.
동일한 논리가 프로그램 평가에도 적용됩니다. 극단적 성공이나 특이한 실패는 너무 극단적이거나 특이하다는 이유로 평가에서 배제될 수 있습니다. 따라서 평가자는 성공 또는 실패의 성격을 밝히기에 충분한 강도의 사례를 선택하되, 극단적이지 않도록 합니다.
강도 표본추출에는 사전 정보와 신중한 판단이 필요합니다. 연구자는 연구 중인 상황의 변동성을 파악하기 위해 탐색적 작업을 수행해야 하며, 그 후 관심 있는 현상의 강렬한 예를 표본으로 삼을 수 있습니다
3. 최대 변이 표본추출 (Maximum Variation Sampling):
이 목적적 표본추출 전략은 참여자 또는 프로그램의 변이가 큰 경우에도 주요 주제나 핵심 결과를 포착하고 설명하는 것을 목표로 합니다. 소규모 표본에서 이질성이 크면 각 사례가 서로 매우 다르기 때문에 문제가 될 수 있습니다. 최대 변이 표본추출 전략은 이러한 겉보기의 약점을 강점으로 전환하는데, 그 논리는 다음과 같습니다: 큰 변이에서 공통적으로 나타나는 패턴은 특히 흥미롭고 가치가 있으며, 이는 프로그램의 핵심 경험과 중심적인, 공유된 측면 또는 영향을 포착하는 데 유용합니다.
소규모 표본에서 변이를 극대화하려면 어떻게 해야 할까요? 먼저, 표본을 구성하기 위한 다양한 특성이나 기준을 식별하는 것으로 시작합니다.
- 예를 들어, 주 전체에 걸쳐 다양한 지역에 프로젝트 사이트가 있는 주 단위 프로그램이 있다고 가정해 봅시다. 일부 사이트는 농촌 지역에, 일부는 도시 지역에, 또 일부는 교외 지역에 위치해 있습니다. 평가에 주 전체에 걸쳐 일반화할 수 있을 정도로 충분한 프로젝트 사이트를 무작위로 선택할 자원이 부족할 경우, 최소한 연구에서 사이트 간 지리적 변이가 반영되도록 할 수 있습니다.
큰 다양성을 지닌 소규모 표본을 선택할 때, 데이터 수집 및 분석은 두 가지 유형의 결과를 산출합니다:
- 각 사례의 고유성을 문서화하는 데 유용한 고품질의 세부 묘사
- 이질성에서 도출된 중요한 공유 패턴입니다.
동일한 전략을 단일 프로그램 내에서 연구 대상 개인을 선택할 때에도 사용할 수 있습니다. 평가자가 상당히 다른 경험을 한 개인들을 표본에 포함함으로써, 집단 내 변이를 더 철저하게 설명하고 경험의 차이를 이해하면서 핵심 요소와 공유된 결과를 조사할 수 있습니다. 최대 변이 표본추출 전략을 사용하는 평가자는 모든 사람이나 모든 집단에 일반화할 수 있는 결과를 도출하려는 것이 아니라, 프로그램의 변이와 그 변이 내에서 나타나는 중요한 공통 패턴을 밝혀주는 정보를 찾는 데 중점을 둡니다.
4. 동질적 표본 (Homogeneous Samples):
최대 변이 표본추출과는 정반대로, 동질적 표본추출 전략은 소규모 동질적 표본을 선택하는 것입니다. 이 전략의 목적은 특정 하위 집단에 대해 깊이 있는 설명을 제공하는 데 있습니다. 다양한 유형의 참여자가 포함된 프로그램에서는 특정 하위 집단에 대한 심층적 정보가 필요할 수 있습니다.
- 예를 들어, 다양한 부모가 참여하는 부모 교육 프로그램은 한부모 가정의 여성 가장의 경험에 초점을 맞출 수 있습니다. 이 집단은 프로그램에 참여시키고 유지하기 어려운 집단이기 때문입니다.
포커스 그룹 인터뷰는 일반적으로 동질적 집단을 기반으로 이루어집니다. 포커스 그룹 인터뷰는 5~8명의 사람들로 구성된 집단을 대상으로, 특정 주제에 대해 개방형 질문을 통해 진행됩니다. 포커스 그룹을 평가에 사용하는 방법은 인터뷰 관련 장에서 더 자세히 다루어질 것입니다. 여기서 중요한 것은 포커스 그룹을 위한 표본추출은 대개 유사한 배경과 경험을 가진 사람들을 한데 모아, 그들에게 영향을 미치는 주요 프로그램 문제에 대해 그룹 인터뷰를 수행한다는 점입니다.
5. 전형적 사례 표본추출 (Typical Case Sampling):
프로그램 또는 참여자를 프로그램에 익숙하지 않은 사람들에게 설명할 때, "전형적" 사례 한두 가지의 질적 프로파일을 제공하는 것이 도움이 될 수 있습니다. 이러한 사례는 프로그램 직원이나 지식이 풍부한 참여자와 같은 핵심 정보 제공자와의 협력을 통해 전형적인 사례를 식별하여 선택합니다. 또한 설문조사 데이터, 평균에 대한 인구통계 분석, 또는 "평균적" 예시를 식별할 수 있는 특성의 정상 분포를 제공하는 기타 프로그램 데이터로부터 전형적 사례를 선택할 수 있습니다. 전형적 사례 한두 가지의 질적 프로파일 제공 목적은 프로그램에 익숙하지 않은 사람들에게 전형적인 것이 무엇인지 설명하고 보여주는 것이며, 모든 참여자의 경험에 대해 일반화된 진술을 하려는 것은 아닙니다. 이 표본은 설명적일 뿐 결정적이지 않습니다.
분석 단위가 전체 프로그램이나 커뮤니티인 경우에도 다소 전형적인 사례를 표본으로 선택할 수 있습니다. 물론 이러한 전형적 프로그램 연구는 엄밀한 의미에서 일반화를 허용하지 않지만, 전형적인 프로그램의 과정과 효과가 "열악한" 사이트나 "탁월한" 사이트에만 국한된 것으로 무시될 필요는 없습니다. 전형적 사이트 표본추출 전략을 사용할 때에는 특별히 비전형적이거나, 극단적이거나, 일탈적이거나, 지나치게 특이하지 않은 사이트를 선택합니다. 이 전략은 제3세계 국가의 커뮤니티 개발 연구에서 마을을 표본으로 선택할 때 적절하게 사용될 수 있습니다. 전형적인 마을에 대한 연구는 이 유형의 마을을 대상으로 한 개발 프로젝트에서 고려해야 할 주요 문제들을 밝히는 데 유용합니다.
의사 결정자들은 항상 일부 열악한 프로그램과 일부 우수한 프로그램이 존재한다는 사실을 받아들일 수 있을지 모르지만, 그들이 더 많은 정보를 얻고자 하는 프로그램은 "평범해서 파악하기 어려운" 프로그램일 가능성이 큽니다. 이 전략을 사용할 때, 어떤 프로그램이 "전형적"인지를 결정하기 위해 폭넓은 합의를 구하는 것이 중요합니다. 전형적인 프로그램이 여러 개 식별되었고, 그 중 일부만 연구할 수 있으며 이를 위한 별도의 목적적 선택 기준이 없다면, 식별된 "전형적" 프로그램 중에서 무작위로 선택하여 연구에 포함할 실제 전형적 사례를 선정할 수 있습니다.
6. 층화 목적적 표본추출 (Stratified Purposeful Sampling):
전형적 사례 표본추출 전략을 다른 전략과 결합하여 평균 이상의 사례, 평균적인 사례, 평균 이하의 사례를 층화된 목적적 표본으로 선택하는 것도 가능합니다. 이는 최대 변이 표본보다는 작지만 주요 변이를 포착하는 것이 목적입니다. 이러한 접근은 공통 핵심을 식별하기보다는 주요 변화를 포착하려는 목적이지만, 분석 과정에서 공통 핵심이 드러날 수도 있습니다. 각 층은 비교적 동질적인 표본으로 구성됩니다. 이 전략은 층화 무작위 표본추출과 달리, 일반화 또는 통계적 대표성을 보장할 수 있을 만큼 큰 표본을 제공하지 않을 가능성이 높습니다.
7. 중요 사례 표본추출 (Critical Case Sampling):
또 다른 목적적 표본 선택 전략은 중요 사례를 찾는 것입니다. 중요 사례란 어떤 점에서 두드러지게 의미를 전달하거나, 특정 이유로 프로그램 체계 내에서 특별히 중요한 사례를 말합니다. 중요 사례가 존재한다는 단서는 “만약 이곳에서 발생한다면, 어디에서든 발생할 수 있다” 또는 “이곳에서 발생하지 않는다면, 어디에서도 발생하지 않을 것이다”라는 식의 진술입니다. 이 경우 데이터 수집의 초점은 해당 중요 사례에서 무엇이 일어나고 있는지를 이해하는 데 있습니다. 중요 사례의 또 다른 단서는 “그 그룹에 문제가 있다면 모든 그룹에 문제가 있을 것이 분명하다”는 식의 주요 정보 제공자의 관찰입니다.
중요 사례를 찾는 것은 자원이 제한되어 단일 사이트만을 평가할 수 있는 상황에서 특히 중요합니다. 이러한 상황에서는 가장 많은 정보를 제공하고 지식 발전에 가장 큰 영향을 줄 수 있는 사이트를 선택하는 것이 전략적으로 타당합니다. 비록 한두 개의 중요 사례를 연구하는 것이 모든 가능성 있는 사례에 대한 일반화를 기술적으로 허용하지는 않지만, 단일 중요 사례 연구에서 나온 확실한 증거에 기반해 논리적 일반화를 할 수 있습니다.
물리학에서 중요한 사례의 좋은 예는 갈릴레오의 중력 연구입니다. 갈릴레오는 물체의 무게가 낙하 속도에 영향을 미치는지 알아보려 했습니다. 무작위로 다양한 무게의 물체를 표본으로 선택하여 모든 물체에 일반화하기보다는, 깃털이라는 중요 사례를 선택했습니다. 만약 진공 상태에서 깃털이 더 무거운 물체(예: 동전)와 동일한 속도로 떨어진다면, 이 단일 중요 사례로부터 모든 물체에 논리적으로 일반화할 수 있습니다. 갈릴레오의 연구 결과는 매우 유용하고 신뢰할 수 있었습니다.
사회과학 연구에도 이러한 중요 사례가 많이 존재합니다. 예를 들어, 국가 정책 입안자들이 지역 사회가 자신들의 프로그램 운영에 대한 결정을 내리는 데 참여하도록 유도하고자 할 때, 지역 사회가 그들의 참여를 규제하는 복잡한 규정을 이해할 수 있을지 확신하지 못할 수 있습니다. 첫 번째 중요 사례는 학력이 높은 지역 사회에서 이 규정을 평가하는 것입니다. 만약 그들이 규정을 이해하지 못한다면, 학력이 낮은 사람들은 그 규정을 훨씬 이해하기 어려울 것이 분명합니다. 반대로, 학력 수준이 낮은 사람들로 구성된 지역 사회가 중요 사례가 될 수도 있습니다. “만약 그들이 규정을 이해할 수 있다면, 누구나 이해할 수 있다”는 논리입니다.
중요 사례를 식별하기 위해서는 중요 사례를 형성하는 핵심 차원을 인식하는 것이 필요합니다. 재정 상태가 중요 사례를 나타낼 수 있으며, 클라이언트당 비용 비율이 매우 높거나 낮은 프로그램은 중요 사례일 수 있습니다. 또는 특히 어려운 프로그램 위치가 중요 사례가 될 수 있습니다. 새 프로그램의 자금 제공자가 프로그램에 대한 참여자 모집에 대해 우려하는 경우, 프로그램 저항이 가장 클 것으로 예상되는 사이트를 연구하여 프로그램 모집 가능성에 대한 가장 엄격한 테스트를 제공하는 것이 전략적으로 타당할 수 있습니다. 만약 그 사이트에서 프로그램이 작동한다면, “어디에서든 작동할 수 있다”는 결론을 얻을 수 있습니다.
세계적으로 유명한 의료 최면술사 밀턴 H. 에릭슨(Milton H. Erickson)은 최면 분야에서 중요한 사례가 되었습니다. 에릭슨은 "전통적인 의료, 치과, 심리치료, 최면 및 종교적 방법을 모두 시도해 봤지만 원하는 변화를 이루지 못한 사람들"을 성공적으로 치료하는 능력으로 널리 알려졌습니다 (Grinder 외, 1977: 109). 에릭슨이 도울 수 없다면 아무도 도울 수 없을 것이라는 인식이 있을 정도로 탁월했으며, 그는 누구든지 최면에 걸릴 수 있음을 입증했습니다.
8. 눈덩이 표본추출 또는 체인 표본추출 (Snowball or Chain Sampling):
이 방법은 정보가 풍부한 주요 정보 제공자나 중요한 사례를 찾기 위한 접근법입니다. 이 과정은 먼저 잘 알고 있는 사람들에게 "누가 이 분야에 대해 많은 것을 알고 있는가? 누구와 이야기해야 하는가?"라고 묻는 것으로 시작됩니다. 여러 사람에게 누가 더 이야기할 가치가 있는지 물어보면서, 새로운 정보가 풍부한 사례를 축적할수록 눈덩이가 커집니다. 대부분의 프로그램이나 시스템에서는 몇 가지 주요 이름이나 사건이 반복해서 언급됩니다. 여러 정보 제공자가 가치 있다고 추천한 사람이나 사건은 특별한 중요성을 가지게 됩니다. 추천된 정보 제공자들은 처음에는 여러 다양한 소스로 확산되다가, 나중에는 몇몇 핵심 이름이 반복해서 언급되며 수렴하게 됩니다.
Peters와 Waterman(1982)의 연구 In Search of Excellence는 잘 운영되는 회사를 식별하기 위해 지식이 풍부한 사람들에게 물으며 눈덩이 표본추출을 시작했습니다. 또 다른 훌륭한 예로 Rosabeth Moss Kanter의 1983년 연구 The Change Masters가 있습니다. 그녀의 책은 혁신적인 회사에 대한 10가지 사례 연구를 중심으로 했으며, Kanter는 처음에 인사 관리 분야의 전문가들의 의견을 모아 "최고" 또는 "가장 혁신적인" 회사를 찾기 시작했습니다. 연구할 사례에 대한 추천이 눈덩이처럼 늘어났다가, 여러 정보 제공자가 지목한 핵심 사례들로 수렴했습니다.
9. 기준 표본추출 (Criterion Sampling):
기준 표본추출의 논리는 특정 중요 기준을 충족하는 모든 사례를 검토하고 연구하는 것입니다. 이 접근법은 품질 보증 노력에서 흔히 사용됩니다. 예를 들어, 정신 건강 외래 프로그램에서 예상되는 참여 기간 범위가 4주에서 26주라면, 28주 이상 소요되는 모든 사례를 검토하여 무엇이 일어나고 있는지 확인하고, 해당 사례가 적절하게 관리되고 있는지 확인합니다.
중요 사건은 기준 표본추출의 원천이 될 수 있습니다. 예를 들어, 프로그램에서 발생하는 모든 클라이언트 학대 사건은 품질 보증 노력의 일환으로 심층 평가의 대상이 될 수 있습니다. 방출 후 3개월 이내에 자살을 시도한 모든 농촌 정신 건강 클라이언트를 심층적, 질적 연구의 표본으로 삼을 수 있습니다. 학교 환경에서는 절반 이상 결석한 모든 학생들이 질적 사례 연구의 심층적 주의가 필요한 경우가 있을 수 있습니다. 기준 표본추출의 목적은 중요한 시스템 약점을 밝혀 프로그램 또는 시스템 개선의 기회를 제공할 수 있는 정보가 풍부한 사례를 이해하는 것입니다.
기준 표본추출은 관리 정보 시스템이나 지속적인 프로그램 모니터링 시스템에 중요한 질적 요소를 추가할 수 있습니다. 데이터 시스템에 있는 모든 사례 중 특정 기준 특성을 가진 사례를 정기적으로 식별하여 심층적, 질적 분석을 수행합니다. 또한 기준 표본추출은 양적 설문조사나 테스트에서 특정 기준을 충족하는 사례를 식별하여 심층 후속 연구를 위한 사례를 선택하는 데 사용할 수 있습니다.
10. 이론 기반 또는 운영적 개념 표본추출 (Theory-based or Operational Construct Sampling):
기준 표본추출의 보다 공식적이고 기본적인 연구 버전은 이론 기반 표본추출입니다. 연구자는 중요한 이론적 개념을 나타내거나 구현할 가능성이 있는 사건, 일상적 삶의 일면, 시간대, 또는 사람을 표본으로 삼습니다. 이 경우 표본은 관심 현상을 대표하게 됩니다.
- 예를 들어, 생태 심리학자는 사람과 환경 간의 상호작용을 연구하는 데 관심이 있습니다. 이러한 상호작용의 예는 이론적 전제에 기반해 정의되어야 하며, 이를 통해 연구자는 관심 현상을 나타내는 사례를 연구할 수 있습니다.
이것은 프로그램 평가에서 실용적 표본추출과 다릅니다. 평가자는 '프로그램'을 이론적으로 정의할 필요가 없으며, 대개 법적이거나 재정적으로 정의된 연구 대상이 있기 때문입니다. 그러나 사회 과학 현상을 특정 이론적 개념을 대표하는 표본으로 삼으려면, 환경과의 상호작용, 사회적 일탈, 정체성 위기, 창의성, 또는 조직 내 권력 상호작용과 같은 표본을 추출할 개념을 정의해야 합니다.
사람, 프로그램, 조직, 또는 지역 사회를 연구할 때, 관심 있는 모집단을 비교적 쉽게 파악할 수 있지만, 개념과 시간은 명확한 기준을 가지고 있지 않습니다. 시간 표본추출의 문제는 구체적인 관심 모집단이 없다는 점이며, 연구는 일반적으로 제한된 기간 내에서 이루어지거나 문헌이 축적된 역사적으로 한정된 시간대에만 의존할 수밖에 없습니다. 개념의 운영적 사례를 표본으로 삼을 때도 구체적인 목표 모집단이 존재하지 않습니다. 그래서 대부분 우리는 과거 타당성 연구, 기존의 관행, 개인의 직관, 또는 비판적 사고를 가진 사람들과의 상담을 통해, 관심 개념에 가장 부합하는 특정 사례를 목적적으로 선택해야 합니다. 또 다른 방법으로는 각 개념의 여러 운영적 대표 사례를 선택하는 절차를 사용할 수 있습니다. 이러한 운영적 사례는 개념의 중요한 이론적 요소를 나타내는 측면에서 중복되며, 관련이 없는 차원에서는 서로 차이를 가집니다. 이 두 번째 표본추출 방법을 다중 운영주의(multiple operationalism)라 부르며, 이는 명확히 정의된 목표 모집단에서 사람을 무작위로 표본추출하는 방법보다 개인의 판단에 더 의존합니다. 그러나 이러한 판단은 불가피하면서도 공식적 표본추출 방법보다 덜 이해되고 있어, 표본추출 전문가들 사이에서 거의 다루어지지 않습니다 (Cook 외, 1985: 163-64).
"운영적 개념" 표본추출은 연구자가 관심 있는 개념의 실제 사례(즉, 운영적 사례)를 표본으로 삼는 것을 의미합니다. 여러 운영적 사례를 연구하는 것을 다중 운영주의라 합니다 (Webb 외, 1966).
11. 확인 및 반증 사례 표본추출 (Confirming and Disconfirming Cases):
질적 현장 연구 초반에 평가자는 탐색을 하며 데이터를 수집하고 패턴이 나타나도록 합니다. 시간이 지나면서 탐색적 과정은 확증적 현장 연구로 바뀝니다. 이는 아이디어를 검토하고, 잠재적 패턴의 중요성과 의미를 확인하며, 새로운 데이터와 추가 사례로 새로운 발견의 타당성을 검증하는 작업을 포함합니다. 이 단계에서는 평가자가 확인 사례뿐 아니라 반증 사례도 찾아내는 데 있어서 상당한 엄격함과 진실성이 요구됩니다.
확인 사례는 이미 나타난 패턴과 일치하는 추가적인 예를 말합니다. 이러한 사례는 발견 내용을 확증하고 풍부함, 깊이, 신뢰성을 더합니다. 반면에 반증 사례 또한 이 시점에서 매우 중요합니다. 반증 사례는 패턴과 일치하지 않는 예로서, 경쟁적 해석을 제공하거나 확인된 발견의 경계를 설정하는 데 도움이 됩니다. 반증 사례는 “규칙을 증명하는 예외”일 수도 있으며, 주요 패턴으로 보였던 것을 반증하고 수정하는 예외가 될 수도 있습니다.
확인하거나 반증해야 할 질문이나 아이디어는 평가자의 현장 연구뿐 아니라 이해관계자들이나 기존 학술 문헌에서 나올 수 있습니다. 평가의 목적은 일부 이해관계자 또는 학자의 선입견을 확인하거나 반증하는 데 도움을 줄 수 있으며, 이는 초기 개념 설계 논의나 문헌 검토 과정에서 확인된 것입니다.
확인 및 반증 사례를 찾는 도전 과제에 대해 생각하면, 표본추출과 연구 결론 간의 관계가 강조됩니다. 표본은 평가자가 언급할 수 있는 내용을 결정하며, 따라서 신중하고 세심하게 표본을 선택하는 것이 중요합니다.
12. 기회 표본추출 (Opportunistic Sampling):
현장 연구는 종종 데이터 수집 중에 새로운 기회를 포착하기 위해 즉각적인 표본추출 결정을 포함합니다. 실험적 설계와 달리, 질적 연구 설계는 현장 연구가 시작된 이후 예기치 못한 기회를 활용하기 위한 새로운 표본추출 전략을 포함할 수 있습니다. 데이터가 이끄는 대로 유연하게 접근하는 것은 질적 연구 전략의 주요 강점입니다. 이를 통해 표본이 현장 연구 도중 자연스럽게 형성될 수 있습니다.
관찰 중에는 모든 것을 포착할 수 없기 때문에, 어떤 활동을 관찰할지, 어떤 사람을 관찰하고 인터뷰할지, 어떤 시간대를 선택하여 데이터를 수집할지를 결정해야 합니다. 이러한 결정은 사전에 모두 이루어질 수 없습니다. 앞서 논의된 목적적 표본추출 전략은 종종 연구 대상 환경에 대한 어느 정도의 지식을 필요로 하지만, 기회 표본추출은 상황이 전개되는 대로 발생하는 기회를 최대한 활용합니다.
13. 목적적 무작위 표본추출 (Purposeful Random Sampling):
소규모 표본이 심층 질적 연구를 위해 선택된다고 해서 표본추출 전략이 무작위적이지 않아야 한다는 의미는 아닙니다. 많은 사람들에게 무작위 표본추출은 표본이 작더라도 결과의 신뢰성을 상당히 높여줍니다. 최근 한 프로그램과 함께 일하면서, 매년 주 의회에 나가 클라이언트 성공 사례를 전하며, 가끔은 균형을 위해 실패 사례를 포함시키기도 한다는 사실을 알게 되었습니다. 이들은 평가 정보를 수집하기로 결정했지만, 개별화된 결과를 추구했기 때문에 평가를 표준화된 사전-사후 도구에 전적으로 의존하는 방식을 거부했습니다. 대신 클라이언트에 대한 사례 기록을 수집하고 심층 사례 연구를 수행하고자 했습니다. 그러나 이들에게는 제한된 자원과 시간이 있어, 각 프로그램 사이트의 직원들은 매년 10~15개의 심층적 임상 사례 기록만 작성할 수 있었습니다. 우리는 각 프로그램 사이트에서 수집할 정보의 종류를 체계화하고, 심층 사례 기록을 남길 클라이언트를 무작위로 선택하는 절차를 마련했습니다. 이를 통해 프로그램은 "전투 이야기" 수집을 체계적이고 무작위적으로 수행할 수 있었습니다. 각 프로그램 사이트에서 10개의 사례만을 기반으로 전체 클라이언트 모집단에 대해 일반화할 수는 없지만, 입법자들에게 보고된 이야기들이 사전에 무작위로 선택된 것이며, 결과를 알기 전에 수집한 정보라는 점에서 신뢰성을 확보할 수 있게 되었습니다. 체계적이고 무작위로 선택된 사례는 사후에 결과를 알고 난 후에 임의로 선택된 사례들보다 상당히 높은 신뢰성을 지닙니다.
그러나 이 경우는 대표성을 가진 무작위 표본이 아닌, 목적적 무작위 표본이라는 점을 이해하는 것이 중요합니다. 소규모 무작위 표본의 목적은 신뢰성이지, 대표성이 아닙니다. 소규모 목적적 무작위 표본은 특정 사례가 왜 연구 대상으로 선택되었는지에 대한 의심을 줄이는 데 목적이 있지만, 여전히 통계적 일반화를 허용하지는 않습니다.
14. 정치적으로 중요한 사례 표본추출 (Sampling Politically Important Cases):
평가에는 어느 정도 정치적 요소가 본질적으로 포함됩니다 (Palumbo, 1987; Patton, 1986, 1987b; Turpin, 1989 참조). 중요 사례 표본추출 전략의 변형으로, 정치적으로 민감한 사이트나 분석 단위를 선택하거나 때로는 피하는 방식을 포함할 수 있습니다.
- 예를 들어, 주 차원의 프로그램이 특정 입법자의 지역구에 있는 로컬 사이트를 포함한다면, 해당 입법자가 매우 영향력 있는 인물일 경우 그 지역의 프로그램을 면밀히 연구함으로써 평가 데이터가 더 많은 주목을 받을 가능성이 커집니다. 이는 평가자가 정치적 상황에 따라 해당 사이트를 긍정적으로 혹은 부정적으로 보이게 하려는 것이 아니라, 자원이 제한된 상황에서 정보의 유용성과 활용 가능성을 높이기 위해 추가적인 표본추출 전략을 사용하는 것입니다.
비슷한 정치적 관점은 응용 또는 기초 연구에서도 사례 표본추출에 영향을 줄 수 있습니다. 예를 들어, 정치학자나 역사가가 미국 정부 시스템에 대한 통찰을 제공할 수 있는 워터게이트나 이란-콘트라 사건을 연구 대상으로 선택할 수 있으며, 이들은 높은 주목을 받을 가능성이 있기 때문에 선택될 수 있습니다. 또한, 사회학자가 폭동을 연구하거나 심리학자가 유명한 자살 사례를 연구하는 경우에도 정치적 중요성을 고려하게 될 가능성이 큽니다.
15. 편의 표본추출 (Convenience Sampling):
마지막으로, 편리성에 따른 표본추출 전략이 있습니다. 이는 빠르고 편리하게 표본을 선택하는 방식입니다. 이는 아마도 가장 일반적이면서도 가장 바람직하지 않은 표본추출 전략입니다. 질적 방법을 사용하는 평가자들이 표본 크기가 너무 작아 일반화가 어렵다는 이유로, 어떤 사례를 선택해도 큰 차이가 없다고 생각하고 접근하기 쉬우며 비용이 저렴한 사례를 선택하는 경우가 많습니다. 편리성과 비용은 실제 고려 요소이지만, 표본 수가 제한된 상황에서 가장 유용한 정보를 얻기 위한 전략적 표본추출이 최우선적으로 이루어져야 합니다. 목적적이고 전략적인 표본추출은 중요한 사례에 대한 핵심 정보를 제공할 수 있지만, 편의 표본추출은 목적적이거나 전략적이지 않습니다.
정보가 풍부한 사례 (Information-Rich Cases):
위에서 논의한 15가지 목적적 표본추출 전략에 더해, 혼합 또는 복합 목적적 표본추출이라는 16번째 접근법을 요약한 표 5.5가 있습니다. 예를 들어, 극단적 그룹 표본추출이나 최대 이질성 접근법은 여전히 연구에서 다룰 수 있는 것보다 큰 잠재적 표본 크기를 제공할 수 있습니다. 최종적으로는 무작위로 선택하여 표본을 구성하는 혼합 접근법이 사용될 수 있습니다. 따라서 이러한 접근법은 상호 배타적이지 않습니다. 각 접근법은 약간씩 다른 목적을 가지고 있으며, 연구와 평가가 종종 여러 목적을 동시에 달성하려 하기 때문에 하나 이상의 질적 표본추출 전략이 필요할 수 있습니다. 장기적인 현장 연구에서는 이러한 모든 전략이 어느 시점에서든 사용될 수 있습니다.
이것들이 질적 표본추출의 유일한 방법은 아닙니다. 모든 전략의 공통된 기본 원칙은 정보가 풍부한 사례를 선택하는 것입니다. 이는 중요한 문제에 대해 많은 것을 배울 수 있는 사례들이며, 심층 연구할 가치가 있는 사례들입니다.
연구 설계를 개발하는 과정에서, 평가자나 연구자는 연구의 신뢰성을 높여줄 논거와 연구 결과를 공격하는 데 사용될 수 있는 논거를 고려하고 예상하려고 노력합니다. 사이트 선택 또는 개별 사례 표본추출에 대한 이유는 신중하게 설명되고 명확하게 밝혀져야 합니다. 또한 특정 표본추출 전략이 결과에 왜곡을 가져올 수 있는 방식—즉, 특정 표본추출 전략에 대한 비판을 예상할 수 있는 방식으로 연구의 한계를 개방적이고 명확하게 제시하는 것이 중요합니다.
증거를 저울질하고 대안을 고려한 후, 평가자와 주요 이해관계자들은 표본추출 결정을 내립니다. 이 과정이 때로는 어려울 수 있지만, 완벽한 설계가 없다는 점을 인식하며 결정을 내립니다. 표본추출 전략은 연구의 목적, 사용 가능한 자원, 질문, 그리고 직면한 제약에 맞춰 선택되어야 합니다. 이 원칙은 표본추출 전략뿐 아니라 표본의 크기에도 적용됩니다.
표본 크기 (Sample Size)
질적 연구에는 모호함이 가득합니다. 여기서는 방법론적 규칙 대신 목적에 기반한 전략이 사용되며, 통계적 공식 대신 탐구 접근법이 있습니다. 질적 연구는 모호성을 감수할 수 있는 사람들에게 가장 잘 맞는 방식으로 보입니다. (참고로, 이는 연구 설계에 대한 이야기일 뿐이며, 분석에 이르면 더 복잡해집니다.)
표본 크기에 대한 모호함은 특히 두드러집니다. 종종 질문을 받습니다.
- “10개의 표본으로 최대 변이를 달성할 수 있나요?”
- “원래 2시간씩 20명을 인터뷰하려 했는데, 두 명을 잃었습니다. 18명으로 충분한가요, 아니면 두 명을 더 찾아야 하나요?”
- “조직 하나만 연구하고 싶은데, 조직 내 20명을 인터뷰하려 합니다. 제 표본 크기는 1인가요, 20인가요, 아니면 둘 다인가요?”
이 질문에 대한 나의 보편적이고 확신에 찬 답변은 “상황에 따라 다릅니다.”입니다.
질적 연구에는 표본 크기에 대한 규칙이 없습니다. 표본 크기는 알고자 하는 내용, 탐구 목적, 이해관계, 유용성, 신뢰성, 그리고 사용할 수 있는 시간과 자원에 따라 달라집니다.
이 장에서 앞서 논의한 바와 같이, 연구의 폭(breadth)과 깊이(depth) 간의 균형을 맞추는 것이 중요합니다. 같은 자원과 시간으로, 연구자는 더 많은 사람의 특정 경험을 연구(폭 추구)하거나 더 적은 사람의 다양한 경험을 심층 연구(깊이 추구)할 수 있습니다. 적은 수의 사람들에게서 얻은 심층 정보는 특히 정보가 풍부한 사례일 때 매우 가치가 있을 수 있습니다. 반면, 많은 사람에게서 얕은 정보를 얻는 것은 현상을 탐구하고 다양성을 문서화하거나 변화를 이해하는 데 특히 유용할 수 있습니다. 다시 말하지만, 표본 크기는 무엇을 알아내고자 하는지, 왜 알아내려 하는지, 결과를 어떻게 활용할 것인지, 연구에 사용할 수 있는 자원(시간 포함)에 따라 결정됩니다.
질적 연구의 소규모 표본 문제를 이해하려면, 이 소규모 표본을 확률 표본추출의 맥락에서 살펴보아야 합니다. 질적 연구 표본은 모집단에 대한 일반화를 목표로 할 때 필요한 표본 크기와 비교했을 때만 작아 보입니다. 예를 들어,
- 100명의 사람들이 있는 프로그램을 평가한다고 가정합시다. 모집단에 대해 95% 신뢰 수준으로 일반화를 하기 위해서는 이 중 80명(80%)을 무작위로 추출해야 합니다.
- 만약 500명이 있다면, 같은 수준의 신뢰를 얻기 위해 217명(43%)을 표본으로 추출해야 하며,
- 1,000명이 있을 경우 278명(28%)이 필요하고,
- 5,000명일 경우 357명(7%)이 필요합니다.
- 반대로, 프로그램에 50명이 있다면, 44명(88%)을 무작위로 추출해야 95% 신뢰 수준을 달성할 수 있습니다 (자세한 표본 크기 결정 기준은 Fitzgibbon 및 Morris, 1987: 163 참조).
목적적 표본추출의 논리는 확률 표본추출의 논리와 상당히 다릅니다. 문제는 소규모 목적적 표본의 유용성과 신뢰성이 종종 확률 표본추출의 논리, 목적, 그리고 추천되는 표본 크기에 근거해 평가된다는 점입니다. 목적적 표본은 각 연구의 목적과 표본추출 전략에 따라 평가되어야 합니다. 표본은 질적 연구의 모든 다른 측면과 마찬가지로 맥락 속에서 평가되어야 하며, 이는 질적 데이터 분석 및 발표의 기본 원칙입니다. 무작위 확률 표본은 심층적인 목적적 표본이 달성하는 것을 이룰 수 없고, 그 반대도 마찬가지입니다.
피아제는 자신의 두 자녀를 장기간에 걸쳐 깊이 있게 관찰함으로써 아동의 사고 방식에 대한 이해에 큰 돌파구를 마련했습니다. 프로이트는 10명 미만의 사례를 바탕으로 정신분석학을 확립했습니다. 밴들러와 그라인더(1975a, 1975b)는 밀턴 에릭슨, 프릿츠 펄스, 버지니아 사틴이라는 세 명의 저명하고 매우 효과적인 치료사를 연구하여 신경언어프로그래밍(NLP)을 창안했습니다. 피터스와 워터맨(1982)은 수천 개의 회사 중 62개의 회사만을 연구하여 조직 우수성에 대한 8가지 원칙을 세웠습니다.
질적 연구에서 도출되는 타당성, 의미, 통찰력은 표본 크기보다, 선택된 사례의 정보가 풍부함과 연구자의 관찰 및 분석 능력에 더 큰 관련이 있습니다.
표본 크기에 대한 이 문제는 학생들이 과제 에세이를 작성할 때 자주 묻는 질문과 유사합니다.
- 학생: "글의 길이는 얼마나 길어야 하나요?"
- 교사: "과제를 다루기에 충분한 길이만큼입니다."
- 학생: "그렇지만 몇 페이지인가요?"
- 교사: "주제를 충분히 다루기에 필요한 만큼입니다. 그 이상도 그 이하도 아닙니다."
링컨과 구바(1985: 202)는 표본이 충분히 중복될 때까지 선택할 것을 추천합니다.
“목적적 표본추출에서는 표본 크기가 정보적 고려 사항에 의해 결정됩니다. 만약 정보 최대화가 목적이라면, 새로 표본화된 단위로부터 새로운 정보가 나오지 않을 때 표본추출이 종료됩니다. 따라서 중복성이 주요 기준이 됩니다.” (원본 강조)
이 전략은 표본 크기에 대한 질문을 열어 둡니다.
그러나, 평가 예산을 협상하거나 표본 크기에 대한 개념 없이 논문 심사위원회의 승인을 받는 데에는 실질적인 어려움이 따릅니다. 중복성에 도달할 때까지 표본추출하는 것은 기본 연구, 무제한의 시간, 제한이 없는 자원에서 가장 잘 작동하는 이상적 방식입니다.
해결책은 판단과 협상입니다. 질적 표본추출 설계에서는 연구 목적과 이해관계자의 관심을 고려하여 예상되는 현상에 대해 최소 표본을 지정하는 것을 권장합니다. 현장 연구가 진행됨에 따라 표본을 추가할 수 있으며, 변화가 유의미하다고 판단되면 표본을 변경할 수도 있습니다. 연구 설계는 유연하고 점진적으로 변화될 수 있음을 이해해야 합니다. 그러나 초기 계획 및 예산 목적을 위해서는 최소 기대 표본 크기를 명시하고, 그 최소 표본에 대한 논리와, 원래의 표본추출 접근법 및/또는 크기의 부적절성을 연구자가 알아차릴 수 있는 기준을 마련해야 합니다.
결국 표본 크기의 적절성은 다른 모든 연구 측면과 마찬가지로 동료 평가, 합의 검증, 그리고 판단에 의해 평가됩니다. 중요한 것은 표본추출 절차와 결정 사항을 충분히 설명하고, 정보 사용자와 동료 평가자들이 표본을 판단할 수 있는 적절한 맥락을 제공하는 것입니다. 연구자나 평가자는 표본이 연구 결과에 미친 영향, 표본추출 절차의 장단점, 그리고 보고된 결과 해석 및 이해에 관련된 모든 설계 결정을 반드시 논의해야 할 의무가 있습니다. 목적적 표본으로부터 과잉 일반화를 하지 않으면서, 심층적 목적적 표본추출의 이점을 최대한 활용하는 것이 소규모 표본 크기에 대한 우려를 완화하는 데 큰 도움이 될 것입니다.
'Wilson Centre' 카테고리의 다른 글
[리더십과 EDI] 코로나19 기간 중 형평성을 갖춘 의사 학자들의 학업 생산성: 스코핑 리뷰 (5) | 2024.10.25 |
---|---|
[리더십과 EDI] 미투 시대, 멘토링에 대한 남성의 두려움 - 학술 의학의 위기는 무엇일까요? (5) | 2024.10.25 |
[임상 감독] 급성 치료 환경에서의 대화형 임상 감독 모델. 환자 치료와 교육의 균형 맞추기 (1) | 2024.10.24 |
[임상 감독] 임상 수퍼비전의 마이크로 매니지먼트: 스코핑 리뷰 (2) | 2024.10.24 |
[임상 감독] 입원 내과 병동에 대한 감독 및 역량 판단에 대한 집단 사례 연구 (0) | 2024.10.24 |