🧠 보건의료 교육에서 ‘데이터 과학’은 과학일까?

안녕하세요! 오늘은 최근 Advances in Health Sciences Education 저널에 실린 흥미로운 에디토리얼을 소개해보려고 해요.
제목부터 강렬하죠?

"Is data science in health professions education a ‘science’ as the term is generally understood?"

 

즉, "보건의료 전문직 교육에서 데이터 과학(data science)은 우리가 일반적으로 생각하는 의미의 과학(science)일까?" 라는 질문이에요. 이 글에서는 이 질문을 중심으로, 우리가 쉽게 간과할 수 있는 데이터 과학의 본질, 윤리, 책임, 정체성까지 폭넓게 다루고 있어요.


1️⃣ 데이터 과학은 ‘이론’을 사용하는가?

우리가 흔히 ‘과학’이라 부를 수 있으려면, 어떤 이론(theory) 기반이 있어야 해요. 그런데 데이터 과학은 어떤가요?

"Much data science would seem to have very little of its own theory (other than a tacet commitment to the principle of ‘truth is in the data’)."
"데이터 과학은 ‘데이터에 진실이 있다’는 암묵적인 전제 외에는, 자체적인 이론이 거의 없어 보인다."

 

게다가 대부분 데이터 안의 패턴을 찾는 것에 집중하고, 그 패턴에 대해 사후적으로(post hoc) 설명하려는 경우가 많다고 지적해요. 이건 흔히 우리가 생각하는 '이론 기반 과학'과는 좀 거리가 있죠.


2️⃣ 누가 데이터를 만들고 책임지는가?

🔍 두 번째 핵심 포인트는 **책임(responsibility)**이에요. 과학자라면 보통 자신의 데이터에 대해 전반적인 책임을 져요— 무엇을, 어떻게, 왜 수집하는지 설계하는 것까지 포함해서요. 하지만 교육 현장에서 데이터는 대부분

  • 학습자가 클릭하거나
  • 온라인 시스템에서 자동으로 수집되거나
  • 교육 플랫폼 로그에서 생성되는 등
    우연히 생성되는 경우가 많아요.

"Only some educational activity generates data for data science purposes (usually when learners and teachers interact with online systems) and the data generated are not always reliable, complete, or meaningful."
"일부 교육 활동만이 데이터 과학 목적에 맞는 데이터를 생성하고, 그마저도 신뢰할 수 있거나, 완전하거나, 의미 있는 경우는 드물다."

 

그리고 데이터를 누가 만들었고, 누가 해석하며, **그 결과에 책임을 지는가?**라는 문제는 여전히 복잡하죠.


3️⃣ 동료 평가(peer review)는 가능한가?

과학의 핵심 중 하나는 **동료 평가(peer review)**인데요, 데이터 과학에서 다루는 **수동적 데이터(passive data)**는 이게 거의 불가능하다고 해요. 왜냐면 수집 과정이나 방법이 명확하게 드러나지 않거나, 데이터가 비공개거나, 기업 자산이기 때문이죠.

"Peer review of passive data is nearly impossible... If there is no peer review or scrutiny, then data science is not science – it is more akin to in-house evaluations and secondary data analyses."
"수동적 데이터는 동료 평가가 거의 불가능하다... 동료 평가나 검토가 없다면, 데이터 과학은 과학이라기보단 사내 평가나 2차 데이터 분석에 가깝다."


4️⃣ 진짜 ‘과학자’는 누구인가?

여러분, 지금 데이터 과학자라고 불리는 사람들은 어떤 사람들이 많을까요?
대부분 프로그래머(programmers), 통계전문가(statisticians), 또는 시스템 전문가들이죠.

"They are generally not professionally-trained researchers or academics – which begs the question of whether they truly reflect the title of ‘scientist’."
"이들은 보통 전문 연구자나 학자는 아니며, 과연 ‘과학자’라는 호칭이 적절한지에 의문이 든다."

 

👩‍🏫 그런데 교육 연구는 **사회과학(social sciences)**의 복잡성을 다루는 분야잖아요?
데이터 과학이 진짜 'HPE 안의 과학'이 되려면, 교육학과 사회과학의 전문 연구자가 팀에 반드시 포함되어야 한다는 게 저자들의 주장입니다.


5️⃣ 결론: 데이터 과학은 과학일까?

이 모든 질문을 정리하며, 연구자들은 이렇게 말해요.

“It depends.”

그래요, 상황에 따라 다르죠. 
하지만 데이터 과학이 진정한 과학이 되려면,

  • 이론을 고민하고,
  • 데이터의 질과 윤리를 신중히 다루며,
  • 학제 간 팀 구성과 학술적 맥락을 갖추어야 한다는 게 핵심 메시지입니다.

"We urge education researchers to reflect on these challenges to ensure that the science of data science in health professions education is as robust and scientific as it can be."
"HPE에서 데이터 과학이 가능한 한 엄밀하고 과학적인 모습으로 자리잡을 수 있도록, 교육 연구자들이 이러한 도전 과제를 숙고해주기를 강력히 권고한다."


💬 마무리 생각

이 논문은 단순히 데이터 과학을 비판하려는 게 아니라, “과학적”이라는 말이 의미하는 바가 무엇인지 되돌아보게 해주는 글이에요.
데이터가 많다고, 기술이 뛰어나다고, 그것만으로 ‘과학’이라고 부를 수는 없다는 점, 우리 모두가 다시 생각해봐야 하지 않을까요?

 

 


이 특별호(Special Issue)에서는 **보건의료 전문직 교육(Health Professions Education) 분야에서 데이터 과학(data science)**이 어떻게 최첨단 사고와 실제(practice)로 자리잡고 있는지를 보여주는 일련의 논문들을 수록하였습니다. 이 에디토리얼에서는 다음과 같은 질문을 제기합니다:

 

👉 “보건의료 전문직 교육에서의 데이터 과학은 우리가 일반적으로 이해하는 의미에서 ‘과학’(science)인가?”

 

이 질문은 이 신흥 분야나 그 분야의 연구자들을 폄하하기 위함이 아니라, _보건의료 전문직 교육 학문 영역 내에서 이 분야의 위치를 명확히 하기 위한 목적_에서 제기한 것입니다. 유사한 질문은 이미 다른 연구자들에 의해 제기된 바 있으며 (예: Malik, 2022), 데이터 과학이 통계학(statistics)이나 컴퓨터 과학(computer science)의 리브랜딩(rebranding)인지, 확장(extension)인지, 아니면 완전히 새로운 학문인지에 대한 논의는 오랫동안 지속되어 왔습니다. (Donoho, 2017)

 

이 질문에 답하기 위해, 저자들은 세 가지 기준을 중심으로 논의를 전개합니다:

  • 과학의 본질(nature of science)
  • 데이터의 통제와 질(control and quality of data)
  • 그리고 누가 이 작업을 수행하는가(who does the work)

과학의 본질(nature of science)

이 저널이 이론 중심(theory-oriented)인 점을 고려할 때, 다음과 같은 질문을 던지는 것이 타당해 보입니다:

 

👉 “데이터 과학은 이론을 사용하는(theory-using) 학문인가? 그리고 그 정도는 어느 수준인가?”

 

많은 데이터 과학 연구는, **‘데이터 속에 진실이 있다’(truth is in the data)**는 암묵적 전제(tacit commitment) 외에는 자체적인 이론(theory)을 거의 갖고 있지 않은 듯 보입니다. 실제로 데이터 과학의 상당 부분은, 데이터 안에 숨겨져 있는 ‘패턴(pattern)’을 이론 없이(atheoretical) 탐색하고, 그 패턴을 사후적으로(rationalized post hoc) 설명하는 데 초점을 맞춥니다.

 

데이터 과학은 데이터를 가지고 무엇을 하느냐에 초점을 맞춘다는 점에서 통계학 및 컴퓨터 과학과 유사하며, 데이터가 무엇을 나타내는지 혹은 왜 분석되는지에 대한 특정한 관점을 제시하지는 않습니다.

 

이러한 경향은 인공지능(AI) 분야의 문헌에서도 관찰되는데, 이 분야에서는 **특정한 과업(task)에 초점을 맞추기보다는 여러 문제 범위에 걸쳐 수행 능력을 발휘할 수 있는 ‘근본 모델(fundamental models)’**의 개념이 등장하였습니다. (Eisenstein, 2024)

 

그렇다면 다시 질문할 수 있습니다:
👉 “데이터 과학은 이론을 생성하는(theory-building) 학문인가?”

 

이에 대한 대답도 대체로 부정적입니다. 데이터 과학은 개념적 설명보다는 실용적 응용(practical applications)에 더 중점을 두며, 이론 생성에는 제한적인 성향을 보입니다. 물론, 이러한 특징은 응용 학문(applied field)에서는 반드시 단점이 되는 것은 아니지만, 과학적 활동(scientific activity)의 맥락에서는 우려의 대상이 될 수 있습니다.


또 하나의 질문은 다음과 같습니다:

 

👉 “데이터 과학은 탐구(inquiry)에 있어 체계적인 접근(programmatic approach)을 반영하고 있는가?”

 

과학(science)은 개별 과학자의 연구뿐 아니라, 그 연구가 다른 이들의 연구 위에 구축되고, 다시 공동체에 환원되어야 한다는 점에서 누적적(cumulative)이자 집적적(aggregative)인 활동입니다. 이러한 점은 ‘교수-학습에 대한 학문적 접근(Scholarship of Teaching and Learning, SOTL)’과 ‘학문적 교수(scholarly teaching)’ 간의 긴장에서도 비슷하게 나타납니다. (Hutchings & Shulman, 1999)

👉 SOTL은 단순히 교육 시스템을 운영하거나 관리하는 사람들에게만 의미 있는 지역적 통찰(local insight)이 아니라, _공동체적 활동(community activity)_이 되기 위해서는 반드시 공유(sharing)되어야 합니다.

 

데이터 과학이 학문적으로 기반을 두지 못할 이유는 전혀 없습니다. 하지만 현재의 데이터 과학은 많은 경우 기업적 필요(corporate needs)와 이해관계(interests)에 맞춰져 있는 경향이 있습니다. 📌 (이는 많은 데이터 과학 관련 직무가 기업에 의해 자금 지원을 받기 때문이기도 합니다.) 또한 기업이 이론적 목표(theoretical ends)를 추구하거나, 학문적 엄밀성(rigour)의 기준을 충족시키지 못할 이유도 없습니다.

 

다만, 기업적 필요와 가용한 재원(available funding)에 부응하기 위해 연구 방향을 설정해야 할 경우, 데이터 과학 역시 과학자들이 자신이 진정으로 하고 싶은 연구를 수행할 수 없는 불안정한 위치에 처하게 됩니다. 국가의 연구지원(government funding)은 충분하지 않을 수 있으며, 이런 상황에서 기업과 협력하려면, 과학자는 _현실적이거나 인식되는 이해충돌(real or perceived conflicts of interest)_을 최소화해야 할 책임을 갖습니다.


과학에 있어 또 다른 핵심 관심사는 바로 **‘엄밀성(rigour)’**입니다.

이 엄밀성은 곧 **연구 방법의 철저함(thoroughness of methods)**과 **비판적 사고의 유무(critical thinking)**를 의미합니다.
이와 관련하여 우리는 **Glassick 외(1997)**가 제안한 학문적 활동(scholarly activity)의 기준을 참고할 수 있습니다.

 

📌 학문적 활동으로 인정되기 위해서는 다음의 요소들을 갖추어야 합니다:

  • 명확한 목표(clear goals)
  • 충분한 준비(adequate preparation)
  • 적절한 방법(appropriate methods)
  • 의미 있는 결과(significant results)
  • 효과적인 발표(effective presentation)
  • 성찰적 비판(reflective critique)

물론 연구마다 그 구체적인 내용은 달라지겠지만, **이번 특집호에 실린 논문들(papers in this special issue)**은 동료평가(peer review)를 거치며 정제되었고, 이로 미루어 보아 데이터 과학도 분명히 학문적(scholarly)일 수 있음을 시사합니다.

 


가장 핵심적인 문제는 다음과 같은 책임(responsibility)의 문제입니다:
👉 “데이터 과학에서 사용되는 데이터에 대해 누가 어떤 책임을 지는가?”

 

일반적으로 과학자들은 자신이 다루는 데이터에 대해 매우 큰 책임을 집니다. 이들은 데이터를 이론화(theorizing)하고, **무엇을, 어떻게 수집할 것인지 설계(designing)**하며, 데이터의 질(quality)에 대해 깊이 고민합니다.

그러나 교육 활동 중 오직 일부만이 데이터 과학 목적에 맞는 데이터를 생성하며, 대개는 학습자와 교사가 온라인 시스템을 통해 상호작용할 때만 그러합니다.


그런데 이렇게 생성된 데이터는 반드시 신뢰할 수 있거나(reliable), 완전하거나(complete), 의미 있는(meaningful) 것은 아닙니다.

 

예를 들어,
👉 “클릭(click)은 과연 무엇을 의미하는가?”
👉 “참여자가 자신이 추적되고 있다는 것을 인식하면서 발생하는 ‘호손 효과(Hawthorne effect)’—또는 ‘암묵적 사회적 존재감(implied social presence)’(Wong & Stephen, 2019)—는 데이터에 어떤 영향을 주는가?”
👉 “과제가 자발적인지, 강제적인지에 따라 반응이 어떻게 달라지는가?”
👉 “학습자의 작업이 전자건강기록(Electronic Health Record, EHR)과 통합될 때, 추적(tracking)은 어떻게 작동하는가?”
👉 “진정으로 의미 있는 데이터란 무엇이며, 그러한 데이터를 정말로 얻을 수 있는가?”

 

이와 같은 질문들은, 우리가 데이터를 진정으로 학습에 도움이 되도록 사용하고자 할 때, 오늘날의 데이터 과학자들이 직면하는 중대한 도전 과제입니다.


데이터 과학의 책임은 또한 **연구 윤리(research ethics)**와도 밀접한 관련이 있습니다.

_사람들의 데이터(data from or about people)_가 관련될 경우, 이 책임은 더욱 중요해집니다.

현재 많은 학술지들은 과학의 재현성(reproducibility)을 보장하기 위해, 연구에 사용된 데이터셋의 공유(data sharing)를 요구하고 있습니다. (Ellaway, 2024)
👉 “그렇다면 데이터 과학 연구팀은 데이터를 저장소(repository)에 올릴 때, 타인이 해당 연구를 재현할 수 있도록 분석에 사용된 **코드(code)**도 함께 제공해야 하는가?”


일반적으로 과학자라면 어떤 데이터를 수집할지, 어떻게 수집할지에 대해 일정 수준의 통제(control)를 가지고 있다고 기대됩니다.
이러한 데이터는 **‘능동적 데이터(active data)’**라고 부를 수 있습니다.
즉, 데이터 과학자가 실험을 설계하고 데이터를 생성하는 활동을 조작(manipulate)할 수 있는 경우입니다.

반면, 과학자가 단지 주어진 데이터만을 가지고 작업할 수 있는 경우, 우리는 이를 **‘수동적 데이터(passive data)’**라고 부릅니다.
👉 데이터 과학의 상당 부분은 이러한 ‘수동적 데이터’에 의존하며, 이로 인해 발생하는 도전 과제 역시 함께 따라옵니다.

 

**전자건강기록(EHR)을 사용하는 2차 데이터 분석(secondary data analysis)**에서도 마찬가지로 **편향(bias)**과 **데이터 품질 문제(data quality)**에 대한 우려가 제기되어 왔습니다. (Sarwar et al., 2022)


흥미롭게도, 데이터 과학은 **정량적 데이터(quantitative data)**에 편향되는 경향이 있지만, 정성적 데이터(qualitative data) 또한 이러한 데이터셋의 일부가 될 수 있습니다. 그러나 **정성적 데이터의 2차 분석(secondary analysis of qualitative data)**은 다음과 같은 이유로 별도의 지침(guidance)이 필요합니다:

  • 정성 데이터 보관(archiving)의 어려움
  • 메모, 노트 등의 보조 자료를 어디까지 포함시킬 것인가
  • 배경 정보의 범위

이에 대해 **Sherif(2018)**는 **정성적 데이터의 2차 분석을 위한 네 가지 기준(four criteria)**을 제안합니다:

  1. 현재의 연구와 데이터셋 간의 적합성 및 관련성 (fit and relevance)
  2. 데이터셋의 일반적인 질 (general quality)
  3. 데이터셋의 신뢰도 (trustworthiness)
  4. 데이터셋의 시의성 (timeliness)

👉 이러한 기준들은 데이터 과학자에게 훨씬 더 높은 수준의 책임감을 요구하게 됩니다.

 


과학(science)은 종종 **추적된 사건, 과정, 현상(tracked events, processes, or phenomena)**으로부터 **추적되지 않은(untracked) 혹은 추적 불가능한(untrackable) 현상에 대한 추론(inference)**을 이끌어냅니다.

그렇다면 데이터 과학에는 **잠재 모형화(latent modeling)**가 얼마나 존재할까요?
이 저널에서는 2012년에 **잠재 모형화 논문(latent modeling paper)**이 게재된 바 있으며 (Boscardin, 2012),
10여 년이 지난 2024년에야 다시 한번 인용되었습니다 (Ding & Homer, 2024).

👉 이러한 현상은 데이터 과학이 '비과학(nonscience)'임을 시사하는 것일까요?
아니면 단순히 이 분야가 아직 '초기 단계(infancy)'에 있다는 증거일까요?


데이터 과학과 **동료평가(peer review)**의 관계는 어디에 있을까요?

특히 **수동적 데이터(passive data)**의 경우, 동료평가는 거의 불가능에 가깝습니다.

  • 데이터 수집 및 분석에 사용된 방법(methods)의 세부사항을 확인하는 것은 어렵고,
  • **기밀성(confidentiality)**이나 소유권(proprietary) 문제로 인해 데이터셋 자체를 검토할 수 없는 경우도 많습니다.

👉 **검토(scrutiny)**와 **동료평가(peer review)**가 없다면, 데이터 과학은 과학(science)이 아니라 **기업 내 자체 평가(in-house evaluation)**나 **2차 데이터 분석(secondary data analysis)**에 가까운 활동이 됩니다.

 

Sherif(2018)이 제안한 것과 같은 **정량 및 정성 연구를 위한 평가 기준(criteria)**이 존재하지 않는다면, 논문 심사만으로는 핵심 우려들을 다룰 수 없습니다. 따라서 연구자는 **충분한 설명(description)**과 **세부사항(details)**을 직접 책임지고 제공해야 할 의무가 있습니다.


우리는 **데이터 과학에서 데이터를 어떻게 사용하는지에 관한 윤리적 기준(ethical criteria)**이 필요합니다.
동의(consent), 익명성 또는 식별 가능성(anonymity/identifiability), 조작 또는 강제(manipulation/coercion)와 같은 기본적인 윤리 문제는 데이터 과학에도 동일하게 적용되지만,
👉 “데이터 과학자들은 윤리적으로 누구에게, 어떤 방식으로 책임을 지는가?”
👉 “그리고 어떤 상황에서 책임을 요구받는가?”

 

이 문제는 특히 **학문적 자유(academic freedom)**의 맥락에서 두드러집니다.
👉 “지도자나 제도, 현상 유지(status quo)에 도전하며, 권력자에게 진실을 말할 수 있는 학문적 자유 위에 서 있는 데이터 과학 연구는 얼마나 되는가?”

현재는 중요한 데이터를 수집조차 허용되지 않는 경우도 존재합니다.
그렇다면, **윤리(ethics)**는 **무언가가 과학인가 아닌가를 구분하는 또 하나의 기준(marker)**입니다.

  • *학자(academic)*는 그에 맞는 **행동의 의무(obligation to act)**와 **보호 장치(protection)**를 갖지만,
  • 기업 지향적(corporate-oriented) 접근은 보통 **정책(policy)**을 따르며, **위험 회피 성향(risk-averse)**이 강합니다.

Ellaway(2024)의 질문처럼,
👉 “데이터 과학은 타인이 소비할 수 있도록 **신뢰할 수 있는 지식(reliable knowledge)**을 생성하는 것인가?”
👉 “아니면 정책과 과정의 의사결정(decision-making) 및 **방향 설정(directing)**까지 포함하는가?”

물론 보건의료 전문직 교육(Health Professions Education, HPE)처럼 **응용 분야(applied field)**에서는 이러한 **경계(perimeter or boundary)**가 원래 다소 모호할 수 있습니다. 하지만,

 

👉 “데이터 과학이 HPE의 과학(sciences of HPE)과 분리되어 있거나, 분리된 채 유지된다면, 그 모호함은 훨씬 더 커지지 않을까?”


데이터 과학의 현 상황은 **상업적 목적의 활동(commercial for-profit activity)**과 **제도적 활동(institutional or corporate activity)**이 병존하면서 더욱 혼란스러워지고 있습니다.

 

이러한 상황 속에서 **학문적 동기(academic motivation)**나 **학문적 기반(academic grounding)**은 상대적으로 현저히 덜 나타나고 있는 것처럼 보입니다. 실제로 많은 기관(예: 대학 등)은 **불확실성과 비용(uncertainty and expense)**을 감수하며 자체적으로 데이터 과학 활동을 수행하기보다는,
👉 **외부 서비스 제공업체(external service providers)와 계약(contract)**하는 것을 선호하는 경향이 있습니다.

물론 **최종 결정권자(decision makers)**는 여전히 교수진일 수 있지만, 👉 실제 **데이터 수집, 처리, 보고(data collection, processing, reporting)**는 **학문 밖의 영역(outside the academy)**에서 이루어질 수 있습니다.

 

이러한 상황에서는, 데이터 과학이 ‘과학(science)’이라 주장할 수 있는 근거조차 매우 미약해지는 것이죠.
📌 “The tenuous claim to be science is even more attenuated in these situations.”


여기서 우리는 잠시 멈추어 **“도대체 누가 데이터 과학자인가?”**라는 질문을 던져야 합니다.
👉 “Who is on the team?”

 

데이터 과학은 **팀 기반 활동(team-based activity)**이기 때문에, 팀 구성원에 대한 고민이 반드시 필요합니다.

이와 관련하여 Young과 Dubé(2024)는 다음과 같은 논의를 제시합니다:
👉 과학(science)의 또 하나의 기준은, **개인(individual)**에서 **팀(team)**으로 초점이 전환되면서 발생한다는 것.

 

현실적으로 데이터 과학에 투입되는 인력은 대부분

  • 프로그래머(programmers)
  • 통계전문가(statisticians)
  • 시스템 중심의 전문가(systems-focused professionals)

이들은 **전문 연구자(professionally-trained researchers)**나 **학자(academics)**가 아닌 경우가 많습니다.

그렇다면 우리는 이런 질문을 던질 수밖에 없습니다:
👉 “이들이 과연 진정한 의미의 '과학자(scientist)'라고 부를 수 있는가?”

 

물론 실험을 설계하고, 도구를 개발하며, 데이터를 수집하고 분석하여 결론을 도출하는 것은 외형상 분명 과학 활동처럼 보입니다.
그러나, **교육 분야(education)**에서는 **사회과학(social sciences)의 복잡성(complexities)**이 중심이 됩니다.
이는 **물리학이나 지질학처럼 선형적(linear)**인 자연과학의 접근과는 본질적으로 다릅니다.

👉 따라서 보건의료 전문직 교육(HPE)에서 데이터 과학이 진정한 ‘과학’이 되기 위해서는,
반드시 교육(education)과 사회과학(social sciences) 분야의 전문가가 팀에 포함되어야 합니다.


마지막으로 데이터 과학을 과학(science)으로 간주할 수 있는 또 하나의 기준은,

👉 _“정당하게 데이터 과학자(data scientist)로 인정받는 개인(individuals)의 양성과정이 존재하는가?”_입니다.

전 세계적으로 **데이터 과학을 위한 대학원 과정(graduate programs)**이 점점 늘어나고 있지만, 만약 이것이 기준이라면, 우리는 **Norman(2011)**이 제시한 **‘이민 학자(immigrant)’와 ‘정착 학자(settler)’의 유형 분류(typology)**를 떠올리게 됩니다.

즉, 보건의료 전문직 교육(HPE)에 뿌리를 두지 않고, 다른 분야에서 넘어온 연구자들을 말합니다.
이들은 물론 좋은 동료들일 수 있지만,
👉 “우리는 HPE 내부에서 데이터 과학자를 양성해야 하는 것이 아닐까?”
라는 질문을 진지하게 고려할 필요가 있습니다.


그렇다면, 이 글의 제목이 묻고 있는 질문,

👉 “데이터 과학은 HPE에서 과학인가?” 에 대한 대답은?

“그것은 상황에 따라 다르다(It depends).”

우리의 이 복잡하고 모호한 분야(HPE)에서 많은 일들이 그러하듯이 말입니다.


우리는 HPE 내에서 데이터 과학을 수행하는 이들에게 다음을 깊이 고민해볼 것을 제안합니다:

  • 이론 구축(theory building)의 여부와 수준
  • **데이터에 대한 통제력(control)**과 질적 수준(quality)
  • **연구팀의 구성(team composition)**과 전문성

이번 특별호에 실린 논문들을 보면,
👉 데이터 과학이 과학적 방식으로 수행될 수 있으며, 정당하게 학술지에 게재될 수 있는 연구 활동이 될 수 있음을 보여줍니다.

또한, 이와 동일한 기준을 적용하면,
프로그램 평가(program evaluation), 교육 혁신(innovation), 역사적 연구(historical scholarship) 등 다른 학문적 활동 영역들도 **과학으로서 주변적인 위치(marginal position)**에 있다는 점을 알 수 있습니다.

👉 “이들이 과학으로서 얼마나, 어떤 방식으로 정당성을 가질 수 있는가는
여러 요인과 연구자의 관점에 따라 달라집니다.”


사실, 데이터 과학은 과학적이지 않은 방식으로 접근, 수행, 보고되는 경우도 많습니다.
📌 Calling it a science — 즉, 이를 '과학'이라 부르는 것은
✔️ **더 많은 엄밀성(rigour)**과 **실질성(substance)**을 추구하는 *열망적 주장(aspirational drive)*일 수 있고,
✔️ 때로는 정당하지 않은 대상에 *권위를 부여하려는 수사적 전략(rhetorical play)*일 수도 있습니다.

반대로, 데이터 과학은 지금 **새로운 패러다임(new paradigm)**으로 자리를 잡아가는 과정일 수 있으며,
이 경우에는 **비판적 분석(critical analysis)**보다는
✅ *육성(nurture)*과 *지원(support)*이 더 적절할 수도 있습니다.


우리는 HPE 분야의 교육 연구자들에게 다음을 강력히 권고합니다:

👉 **데이터 과학이 진정한 의미에서 과학으로서 갖춰야 할 기준과 도전 과제를 숙고(reflect)**함으로써,
👉 보건의료 전문직 교육 내 데이터 과학이 가능한 한 엄밀하고 과학적이 될 수 있도록 만들어야 합니다.


 

Ellaway, R. H., & O’Sullivan, P. (2025). Is ‘data science’science?. Advances in Health Sciences Education, 1-5.

 

 

+ Recent posts