왜 바람직한 어려움은 '효과'가 있는가: 인지 및 교육 심리학의 증거 고찰과 보건 의료 직종 교육 분야를 위한 몇 가지 주의 사항 (J Eval Clin Pract. 2026)

Meded 2026. 3. 4. 21:25

2026. 3. 4. 21:25

J Eval Clin Pract. 2026 Feb;32(1):e70349. doi: 10.1111/jep.70349.

Why Desirable Difficulties 'Work': A Review of the Evidence From Cognitive and Educational Psychology and Some Caveats for the Health Professions Education Field

공부가 너무 힘들다고요? 뇌과학이 증명한 '바람직한 어려움'의 비밀 🧠✨

안녕하세요! 혹시 책을 여러 번 읽고 다 외웠다고 생각했는데, 막상 시험을 보거나 실무에 적용하려고 하면 머릿속이 새하얗게 변한 경험 있으신가요?

우리는 보통 '쉽게 술술 읽히면 학습이 잘 되고 있다'고 착각하기 쉽습니다. 하지만 인지 심리학(Cognitive Psychology)과 교육학 연구진들은 진짜 내 것으로 만드는 학습을 위해서는 오히려 '어려움'이 필요하다고 말합니다. 단, 무작정 괴로운 어려움이 아니라 뇌를 적극적으로 깨우는 '바람직한 어려움(Desirable Difficulties)'이어야 하죠.

오늘은 의대생 등 보건 의료 전문직 교육(Health Professions Education)을 위해 작성된 흥미로운 논문을 바탕으로, 우리의 장기 기억력과 응용력을 폭발적으로 높여주는 학습 전략을 쉽고 재미있게 풀어볼게요!

🤔 1. 쉽게 배운 지식은 쉽게 날아간다?

우리가 눈으로 텍스트를 반복해서 읽을 때, 정보 처리(Processing information)가 너무 쉽게 느껴져서 미래에도 이 내용을 잘 기억할 것이라고 착각하게 됩니다. 이를 '유창성 편향(Fluency bias)'이라고 해요.

연구진은 이 부분에 대해 아주 명확하게 짚어줍니다.

"재읽기는 더 나은 즉각적인 회상을 만들어내지만, 시험은 새로운 학습에 대한 더 나은 장기 파지와 전이를 만들어냅니다." (Re-reading does produce better immediate recall, but testing produces better long-term retention and transfer of new learning.)

즉, 진짜 지식을 오래 남기고 다양한 상황에 적용하는 학습의 전이(Transfer of learning)를 원한다면, 뇌를 조금 괴롭혀야 한다는 뜻입니다.

🚀 2. '바람직한 어려움'을 만드는 3가지 특급 전략

그렇다면 구체적으로 어떻게 공부해야 할까요? 논문에서 제시하는 3가지 핵심 전략을 소개합니다.

① 인출 연습 (Retrieval Practice) / 형성 평가 (Formative Testing) 평가를 받기 위해 시험을 치는 것이 아니라, '학습을 위해' 스스로 시험을 치는 것입니다. 방금 배운 내용을 덮고 백지에 써보거나, 플래시카드(Flashcards)를 활용해 억지로 기억을 끄집어내는(Retrieval) 훈련을 해보세요. 기억해 내려고 낑낑대는 그 순간, 지식은 뇌에 강력하게 새겨집니다.
② 분산 연습 (Distributed Practice / Spaced Practice) 시험 전날 벼락치기(Cramming)를 하는 대신, 시간을 두고 간격을 벌려서 복습하는 방법입니다. 동일한 시간을 공부하더라도 하루에 몰아서 10시간을 하는 것보다, 일주일에 2시간씩 5번을 나누어 학습할 때 장기 파지(Long-term retention) 효과가 훨씬 뛰어납니다. 기억이 희미해질 때쯤 다시 끄집어내는 과정이 뇌의 기억 회로를 단단하게 만들어주거든요.
③ 교차 연습 (Interleaved Practice / Mixed Practice) 비슷한 유형의 수학 문제를 10개 연달아 푸는 방식(차단된 연습, Blocked practice) 대신, 덧셈, 곱셈, 나눗셈 등 서로 다른 유형의 문제를 섞어서 푸는 방식입니다. 처음엔 헷갈리고 진도도 느리게 나가는 것 같아 답답할 수 있습니다. 하지만 이 방식은 상황에 맞춰 '어떤 해결책을 꺼내 써야 할지' 구분하는 능력을 길러주어 실전에서 엄청난 위력을 발휘합니다.

⚠️ 3. 잊지 말아야 할 주의 사항 (연구진의 핵심 당부!)

이처럼 훌륭한 전략들이지만, 무조건 어렵게만 만든다고 능사는 아닙니다. 저자는 교육자들과 학습자들에게 다음과 같은 핵심적인 주의 사항(Caveats)을 강조합니다.

"교육자는 훈련을 더 힘들고 스트레스 받게 만드는 모든 관행이 필연적으로 학습에 유익하다고 가정해서는 안 됩니다." (Educators must not assume that any practice that makes training more arduous and stressful is perforce beneficial to learning.)

만약 기초 지식이 아예 없는 초보자에게 처음부터 너무 섞인 문제(교차 연습)를 주면 어떨까요? 오히려 인지적 과부하가 와서 학습을 포기하게 만드는 '바람직하지 않은 어려움(Undesirable difficulties)'이 될 수 있습니다. 즉, 학습자의 수준과 다루는 지식의 종류에 따라 적절한 수준의 어려움을 설계하는 것이 핵심입니다.

💡 마무리하며

공부하다가 막히고 잘 안 외워져서 스트레스받으신 적 있나요? 축하합니다! 🎉 여러분의 뇌는 지금 지식을 깊은 곳에 단단히 저장하기 위해 열심히 근육을 키우고 있는 중입니다. 오늘부터는 눈으로만 읽는 쉬운 공부 대신, 스스로 묻고, 간격을 두고, 섞어서 연습하는 '바람직한 어려움'을 학습에 적용해 보는 건 어떨까요?

전문성(expertise) 발달을 촉진하기 위한 효과적인 전략(effective strategies)을 찾고 사용하는 것은 모든 분야의 교육자들에게 항상 어려운 과제였습니다. 특히 보건 의료 직종(health professions)의 교육자들은 방대한 지식과 기술의 습득(acquisition), 파지(retention), 그리고 궁극적으로는 전문적인 실무에서의 적용 또는 전이(transfer)를 촉진하기 위해 고군분투합니다. 실제로, 전이(transfer)는 교육의 궁극적인 목표이자 '성배(holy grail)'이지만, 달성하기가 악명 높을 정도로 어렵다는 것이 입증되었습니다 [1]. 오래전, Salomon과 Perkins [2]는 하위 경로 전이(low-road transfer)와 상위 경로 전이(high-road transfer)를 구분했습니다.

하위 경로 전이는 잘 확립된 루틴(routines)의 수행을 수반하며 광범위한 연습(extensive practice)을 통해 달성됩니다. 반면,
상위 경로 전이는 상황이나 문제의 원리(principles), 개념적 요소(conceptual elements) 또는 심층 구조(deep structure)에 대한 의도적인 추상화(deliberate abstraction)를 포함합니다 [2].
하위 경로 전이는 범위와 적용 가능성(applicability)이 제한적인 반면,
상위 경로 전이는 사람들이 표면적으로 다양한 맥락(superficially diverse contexts)에서 원리나 문제 해결책(problem solutions)의 적용 가능성을 인식할 수 있게 해줍니다.

보다 최근에 LoGiudice 등 [3]은 '학습 시점에 수행되는 특정 정신적 조작(specific mental operations enacted at the time of learning)'(p. 58)이 학습의 '깊이(depth)'와 학습의 전이(transfer of learning) 가능성을 결정한다고 언급했습니다. 교육 심리학(educational psychology) 및 인지 심리학(cognitive psychology)의 증거에 따르면, 바람직한 어려움(desirable difficulties)은 지식과 기술의 파지(retention) 및 전이(transfer)를 뒷받침하는, 학습 중 수행되는 정신적 조작(mental operations)을 효과적으로 이끌어냅니다. 바람직한 어려움(desirable difficulties) [4]이라는 용어는 실행되는 동안에는 노력이 필요하거나 힘들어 보이고 실제로 즉각적인 수행(immediate performance)을 손상시키지만, 덜 힘들어 보이는 전략에 비해 우수한 장기 파지(long-term retention) 및 전이(transfer)를 이끌어내는 교육(educational) 또는 훈련 전략(training strategies)을 의미합니다. 예를 들어,

학생들은 일반적으로 정보의 인출(retrieve information)을 시도하는 것보다 텍스트 구절을 다시 읽는 것(re-reading)이 더 쉽기 때문에 그 내용에 대해 시험을 치르는 것보다 다시 읽는 것을 선호합니다 [5, 6]. 정보 처리(processing information)가 쉬울 때, 학습자는 유창성 편향(fluency bias)의 희생양이 될 수 있습니다. 즉, 그들은 쉽게 처리된 정보가 미래에도 쉽게 회상될 것(recalled)이라고 잘못 믿습니다 [7]. 다시 읽기(re-reading)는 더 나은 즉각적인 회상(immediate recall)을 만들어내지만, 시험(testing)은 새로운 학습에 대한 더 나은 장기 파지(long-term retention)와 전이(transfer)를 만들어냅니다.
바람직한 어려움(desirable difficulties)으로 알려진 관행 중에는 형성 평가(formative testing), 간격 연습(spaced practice) 또는 분산 연습(distributed practice), 혼합 연습(mixed practice) 또는 교차 연습(interleaved practice), 그리고 생산적 실패(productive failure) 접근법이 있습니다.
- 연습 시험(practice testing) 또는 인출 연습(retrieval practice)이라고도 알려진 형성 평가(formative testing)는 특정 영역에서 학습자의 지식을 측정(measure)하기 위한 총괄 평가(summative testing)와 대조적으로 학습 및 학습의 전이(transfer of learning)를 향상시키기 위한 것입니다.
- 간격 연습(spaced practice) 또는 분산 연습(distributed practice)에서는 집중 연습(massed practice)이나 '벼락치기(cramming)'와 대조적으로, 연습 세션(practice sessions)이나 학습 이벤트(learning events)가 시간적으로 압축되는 대신 시간에 따라 분산(spread out over time)됩니다.
- 혼합 연습(mixed practice) 또는 교차 연습(interleaved practice)에서는 문제 유형(problem types), 범주(categories) 또는 과제(tasks)의 제시나 연습이 번갈아 가며(alternated) 이루어집니다. 예를 들어, 기초 산수(elementary arithmetic)에서의 교차 연습 일정(interleaved practice schedule)은 동일한 문제 유형을 차단된 방식(blocked fashion)으로 묶어서 제시하는 것(AAAMMMDDD) 대신에, 학습자에게 덧셈 문제에 이어 곱셈 문제, 그 다음 나눗셈 문제(AMDAMD)를 제시할 수 있습니다.

이러한 관행은 어떻게, 그리고 왜 효과적일까요? Bjork, Bjork [8]는 바람직한 어려움(desirable difficulties)에 대한 기술적 설명(descriptive account)을 제공합니다. 이 이론은 두 가지 다른 기억 구성 요소(memory components)인 저장 강도(storage strength)와 인출 강도(retrieval strength)를 상정합니다.

저장 강도(storage strength)는 일반적으로 정보가 장기 기억(long-term memory)에 얼마나 강하게 확립되어 있는지를 나타내는 반면,
인출 강도(retrieval strength)는 특정 시간에 기억에 얼마나 쉽게 접근할 수 있는지(accessible)를 나타냅니다.

저장 강도와 인출 강도는 서로에게 영향을 미칩니다.

인출 강도(retrieval strength)가 높을 때, 저장 강도(storage strength)는 거의 증가하지 않습니다.
그러나 인출 강도가 낮을 때, 즉 특정 기억 표상(memory representation)을 회상(recall)하기 어려울 때, 저장 강도(storage strength)의 증가는 그에 상응하여 더 높아집니다. 결과적으로 저장 강도(storage strength)는 인출 강도(retrieval strength)가 얼마나 빨리 회복되거나 상실되는지를 결정합니다.
저장 강도가 높다면, 즉 정보의 한 조각이 수년간 살았던 주소처럼 장기 기억(long-term memory)에 잘 자리 잡고 있다면(well-entrenched), 인출 강도는 쉽게 회복됩니다(restored).
반대로 한 번만 방문할 건물의 주소처럼 특정 정보의 저장 강도(storage strength)가 낮을 때, 인출 강도(retrieval strength)는 빠르게 감소하고(diminish) 쉽게 회복되지 않습니다.

Bjork [9]는 새로운 폐기 이론(new theory of disuse)이 과정 모델(process model)이 아님을 인정합니다. 즉, 그것은 메커니즘(mechanisms)에 대한 설명을 제공하지 않은 채 기억 현상(memory phenomena)을 기술합니다. 그러나 Bjork는 시간이 지남에 따라 정보를 잊어버리는 것(forgetting information)이 학습자가 자료에 다시 관여하도록(re-engage) 촉구하기 때문에 실제로는 학습에 도움이 될 수 있다고 주장합니다. 이러한 주장을 뒷받침하기 위해, 그는 Jacoby의 예시를 인용합니다.

당신이 37 + 15 + 12의 합(sum)을 구하라는 요청을 받았다고 가정해 보십시오. 이 합을 얻은 후, 당신은 즉시 동일한 문제를 제시받습니다. 반복 제시(repeated presentation)에서 당신이 수행할 처리 유형(type of processing)은 크게 다를 것입니다. 첫 번째 조우(encounter)에서 당신은 합을 얻기 위해 의심할 여지 없이 덧셈 과정(process of addition)을 거쳤을 것입니다. 하지만 두 번째 조우에서는 합산 결과를 즉시 이용할 수 있으므로 숫자를 더하는 연산(operation of adding)으로 되돌아가지 않고도 답을 제시할 수 있습니다. 실제로, 약간의 지연(delay)이 없다면 처리 활동(processing activities)의 완전한 반복은 불가능하지는 않더라도 어려울 수 있습니다 [10] (p. 649).

검토할 증거는 학습 및 전이의 이점(learning and transfer benefits)을 가져오는 것이 그 자체로의 어려움(difficulty per se)이라기보다는 바람직하게 어려운 관행(desirably difficult practices)을 실행할 때 학습자가 참여하는 처리 활동(processing activities)이라는 것을 시사합니다. 실제로 학습자가 힘들고 좌절감을 느끼면서도 학습의 이점(learning benefits)을 낳지 않는 관행들이 존재합니다. 즉, 바람직하지 않은 어려움(undesirable difficulties)입니다 [11]. McDaniel과 Butler [12]는

'어려움'에 의해 유도된 처리 유형(type of processing)이
- 결과 평가(outcome test)나 활동에서 요구되는 것과 일치(congruent)할 때,
- 학습자가 해당 활동에 참여하는 데 필요한 지식(requisite knowledge)을 가지고 있을 때 (예: 합리적인 수준의 읽기/쓰기/산술 능력(literacy/numeracy) 보유), 그리고
- 과제에서 요구되는 처리 유형이 자료에 의해 자발적으로 유도되는 것과 다를 때, 그 어려움은 바람직하다고 제안합니다.
후자 기준의 한 예는 범주(category)별로 구성된 단어 목록에서 각 단어의 유쾌함(pleasantness)을 평가(rate)하라는 지시일 것입니다.
- 범주적 구성(categorical organisation)은 단어의 그룹화(grouping)나 군집화(clustering)를 자발적으로 유도하는 반면,
- 유쾌함 평가(pleasantness ratings)는 개별 단어에 대한 특이한 평가(idiosyncratic evaluation)를 요구합니다.

1 형성 평가 또는 시험 강화 학습 (1 Formative Testing or Test-Enhanced Learning)

개인의 지식과 기술 수준을 평가하기 위한 시험인 총괄 평가(summative testing)는 학업 성취(academic progression) 및 실무 적합성(fitness-for-practice)에 대한 결정을 알리는 증거를 제공하기 때문에 오랫동안 보건 의료 전문직 교육(health professions education, HPE)에서 주요 관심사였습니다 [13-20]. 그러나 최근 몇 년 동안 인지 심리학자(cognitive psychologists)와 임상 교육자(clinician educators) 간의 협력을 바탕으로 보건 의료 전문직 교육계 내에서 형성 평가(formative testing) 또는 학습을 위한 시험(testing for learning)에 대한 관심이 커졌습니다 [21]. 형성 평가, 즉 학습을 위한 시험은 지식의 파지(knowledge retention) 및/또는 전이(transfer)를 측정하기 위해 의도되고 설계된 총괄 평가(summative testing), 즉 학습의 시험(testing of learning)과 대조적으로, 지식의 파지(retention) 및 적용(application)을 촉진하도록 의도되고 설계되었습니다. 형성 평가에 대한 관심은 시험이 학습과 학습의 전이(transfer of learning)에 신뢰할 수 있을 만큼 강력한 효과를 미친다는 인식에 의해 주도되었습니다. 연구에 따르면 이러한 효과는 다양한 내용 영역(content domains) [24, 25]과 다양한 학습자 집단(populations of learners) [26, 27]을 대상으로 실험실과 교실 환경(laboratory and classroom settings) 모두에서 뚜렷하게 나타납니다 [22, 23]. 이러한 효과를 더 조사하기 위해 Green 등 [28]은 시험의 직접적 효과(direct effect of testing)를 보고하는 보건 의료 전문직 교육(HPE) 문헌에 대한 체계적 문헌 고찰(systemic review)을 수행하여 그 결과가 인지 심리학 문헌의 결과와 일치하는지 확인했습니다. 그들은 시험이 특히 해부학(anatomy) [26], 방사선 판독(radiologic interpretation) [29], 병태생리학(pathophysiology) [30-33], 심폐소생술(resuscitation) [34]의 학부 교육(undergraduate education)과 다양한 평생 교육(continuing education) 주제 [35]에서 파지(retention)와 전이(transfer)에 상당한 영향을 미친다는 것을 발견했습니다.

1.1 시험 효과 (1.1 Test Effects)

시험에는 직접적 효과와 간접적 효과가 모두 있습니다.

시험의 직접적 효과(direct effect) 또는 후방 효과(backward effect)는 무언가를 기억하려고 시도하는 것 자체가, 비록 인출 시도(retrieval attempt)가 실패하더라도, 미래에 그 정보를 회상(recall)할 가능성을 높인다는 발견입니다.
시험은 또한 간접적 효과(indirect effects) 또는 전방 효과(forward effects)를 가질 수 있습니다. 즉, 시험은 후속 학습(subsequent learning)을 향상시키는 인지적(cognitive), 메타인지적(metacognitive), 정의적(affective) 및 동기 부여적 과정(motivational processes)을 유도할 수 있습니다.

1.1.1 시험의 직접적 효과 (1.1.1 The Direct Effect of Testing)

일반적으로 시험의 직접적 효과를 조사하기 위해 설계된 실험은 즉각적 및 지연된 준거 검사(criterial tests)에서 두 집단 간의 수행(performance)을 비교합니다 [36]. 준거 검사는 교육 연구에서 교수 개입(pedagogical interventions)의 특정 결과(specific outcomes)를 평가하는 데 사용됩니다 [37]. 예를 들어, 준거 검사는 특정 개입이 사용된 후 회상(recall)을 평가하기 위해 학습자에게 정의(definitions)를 제공하도록 요구하거나, 전이(transfer)를 평가하기 위해 새로운 문제(novel problems)를 해결하도록 요구할 수 있습니다 [38]. 한 집단(시험 집단, test group)은 제시된 자료의 인출(retrieval)을 연습하는 반면, 다른 집단(재학습 집단, re-study group)은 단순히 자료를 다시 읽습니다(re-reads). 지배적인 결과는 재학습 집단이 즉각적인 회상 검사(immediate recall test)에서는 시험 집단보다 우수한 성과를 내지만, 지연된 준거 검사(delayed criterial test)에서는 시험 집단이 재학습 집단보다 우수한 성과를 낸다는 것입니다 [39]. 이 결과는 연구가 재학습(re-study)에 유리하게 편향되어 있을 때, 즉 참가자가 시험 조건(test conditions)에 비해 재학습에서 자료에 더 많이 노출되었을 때도 유지됩니다 [40].

Rowland [36]가 수행한 시험의 직접적 효과(direct effect of testing)에 대한 이론적 설명의 포괄적인 메타 분석(meta-analysis)은 시험 집단과 재학습 통제 집단(re-study control group) (개념도(concept mapping)와 같은 다른 통제 조건 대비) 간의 결과를 비교하고 시험과 재학습의 총 지속 시간(total duration)을 동일하게 맞춘 실험실 연구들을 검토했습니다. 결과는 새로운 폐기 이론(new theory of disuse)과 같은 인출 노력 이론(retrieval effort theories)의 예측과 일치했습니다. 이러한 이론은 초기 또는 연습 시험 단계(practice testing phase)에서 인지된 인출 노력(perceived effort of retrieval)이 증가함에 따라 시험 효과(testing effect)의 크기도 증가해야 한다고 예측합니다. 그러나 시험으로부터 이점을 얻으려면 인출(retrieval)이 성공적이어야 합니다. 그렇지 않은 경우 교정적 피드백(corrective feedback)이 필수적입니다 [41]. Kornell과 Vaughn [41]은 인지 처리(cognitive processing)의 두 단계, 즉 인출이 시도되는 처리와 정답(correct answer)을 처리하는 단계가 시험 강화 학습(test-potentiated learning)에 필수적이며, 더 나아가 인출 시도(retrieval attempt)가 어떤 의미에서는 마음이 정답을 처리하도록 점화(primes)한다고 제안합니다. 인출에 더 많은 노력이 필요하거나 실패할 경우, 정답이 처리될 때 더 큰 학습이 일어납니다.

인출 난이도(Retrieval difficulty)는
- 시험을 더 까다롭게 만들고,
- 시험 세션 내에서 다양한 종류의 문제를 혼합(mixing)하며,
- 학습과 시험 사이의 지연(delay), 즉 파지 간격(retention interval)을 늘림으로써 촉진될 수 있습니다 [41].

1. 시험의 효과 (Rowland의 연구)

연구진이 학생들을 두 그룹으로 나누어 실험했습니다. 한 그룹은 **'그냥 배운 내용을 다시 읽기(재학습)'**만 했고, 다른 그룹은 **'시험 보기'**를 했습니다. 두 그룹이 공부한 총 시간은 똑같았지만, 결과적으로 시험을 본 그룹의 학습 효과가 훨씬 더 컸습니다.

2. 뇌를 고생시킬수록 기억에 남는다 (인출 노력 이론)

'인출(Retrieval)'이란 머릿속에 저장된 기억을 끄집어내는 과정을 말합니다. 이 이론에 따르면, 연습 시험을 볼 때 정답을 쉽게 떠올리는 것보다 "아, 뭐였지?" 하고 끙끙거리며 힘들게 떠올리려고 노력할수록 나중에 그 내용을 훨씬 더 잘 기억하게 됩니다.

3. 단, 정답을 알아야만 의미가 있다 (교정적 피드백)

시험을 보는 것만으로 무조건 좋은 것은 아닙니다. 두 가지 조건 중 하나가 충족되어야 합니다.

힘들게 노력해서 결국 스스로 정답을 떠올리는 데 성공하거나,
만약 틀렸거나 끝내 기억나지 않았다면 반드시 **올바른 정답을 확인(교정적 피드백)**해야 합니다.

4. 틀렸는데 왜 학습 효과가 더 클까? (Kornell & Vaughn의 제안)

우리의 뇌는 두 단계를 거칩니다. 첫째는 '기억을 떠올리려고 애쓰는 단계'이고, 둘째는 '정답을 확인하는 단계'입니다. 정답을 떠올리려고 노력하는 과정 자체가 우리 뇌를 **'정답을 스펀지처럼 흡수할 준비 상태(점화, primes)'**로 만듭니다. 그래서 끙끙대다가 틀린 후 정답을 보게 되면, 뇌가 그 정답을 훨씬 더 강렬하게 받아들이고 기억하게 됩니다.

5. 학습 효과를 극대화하는 공부법 (인출 난이도 높이기)

위의 원리를 이용해 뇌를 더 '힘들게(효과적으로)' 만들려면 다음 세 가지 방법을 쓰면 좋습니다.

시험을 더 어렵게 만들기: 단순한 객관식보다 주관식으로 출제하기.
다양한 문제 섞기 (Mixing): 한 과목만 주구장창 푸는 게 아니라, 여러 종류의 문제를 섞어서 뇌가 계속 다른 방식을 쓰게 만들기.
시간 차이 두기 (Retention interval): 공부를 하고 직후에 바로 시험을 보는 게 아니라, 하루나 이틀 뒤에 시험을 봐서 기억이 가물가물할 때 억지로 떠올리게 만들기.

1.1.2 시험의 간접적 효과 (1.1.2 Indirect Effects of Testing)

시험의 전방 효과(forward effects) 또는 간접적 효과(indirect effects)는 인출 시도(retrieval attempts)가 주의 할당(attentional allocation), 학습 판단(judgments of learning), 동기 부여(motivation) 및 부호화 과정(encoding processes)과 같이 후속 학습(subsequent learning)을 촉진하는 과정에 미치는 영향입니다 [42].

시험은 특히 긴 강의나 학습 세션 중에 간헐적으로 제공될 때 마음 방황(mind-wandering)을 줄이고 주의(attention)를 집중시키는 것으로 알려져 있습니다 [43, 44]. 시험은 또한 학습자에게 자신이 아는 것과 모르는 것에 대한 피드백을 제공하여 시간과 노력을 적절히 할당할 수 있도록 합니다 [45, 46]. 따라서 시험은 학습 판단(judgments of learning)을 조정(calibrating)하는 데 특히 중요합니다. 학습자가 주로 책을 읽는 동안 처리(processing)가 쉽고 유창하다(fluent)고 느낄 때, 그들은 미래의 회상(future recall)을 과대평가(over-estimate)하고 학습 노력을 줄일 수 있습니다. 대조적으로, 시험은 처리를 더 노력이 필요한 것으로 보이게 하여, 회상 능력(recall ability)에 대한 더 정확한 자기 평가(self-assessments)로 이끕니다. 이러한 메타인지적 인식(meta-cognitive awareness)—또는 자신의 인지 과정(cognitive processes)에 대한 인식—과 자기 조절(self-regulation)은 학습이 점차 온라인과 교실 밖으로 이동함에 따라 학습자가 개발해야 할 중요한 요소입니다 [47]. Rivers [48]는 학습자가 일반적으로 시험의 이점에 대한 인식이 부족하기 때문에, 강사는 자가 테스트(self-testing)와 관련하여 학습자의 신념과 행동에 영향을 미치는 개입(interventions)을 제공해야 한다고 제안합니다. 그러한 개입에는

시험의 기억상 이점(memorial benefits)에 대한 직접 교수(direct instruction),
학습자가 재학습에 비해 시험의 효능(efficacy)을 경험하도록 유도하는 것, 그리고
잦은 부담 없는 퀴즈(low-stakes quizzes)를 제공하거나
강의 또는 수업 중 질문을 한 후 모든 학습자가 인출(retrieval)을 시도할 수 있도록 3~5초간 일시 정지(pausing)하는 등
- 인출을 촉진하는 관행에 참여하는 것이 포함됩니다.

학생들은 자신을 테스트하기 위해 Anki 및 First Aid와 같은 상업용 전자 플래시카드 애플리케이션(electronic flashcard applications)을 점점 더 많이 사용하고 있습니다 [49].

사용자는 교육적 필요를 충족하기 위해 질문 '덱(Decks)'을 다운로드하거나 만들 수 있습니다. 전공의(Medical residents)들은 당직 시간 중 휴식 시간(downtime)에 사용할 수 있기 때문에 이러한 애플리케이션을 선호한다고 보고합니다 [49]. 미국 의사 면허 시험(USMLE) 1단계를 준비하는 데 사용되는 AnKing 덱에는 40,000개 이상의 플래시카드가 있으며, 이 애플리케이션의 높은 사용 수준은 더 높은 시험 점수와 관련이 있습니다 [49]. 이러한 상용 애플리케이션과 관련하여 한 가지 주의할 점은 교육의 불평등(inequity)을 악화시킬 수 있다는 것입니다. Landoll 등 [50]은 학교가 학생들에게 무료로 제공될 수 있는 자체 복습 시험 문제 은행(bank of review test questions)을 만들고 유지함으로써 이러한 우려를 완화할 수 있다고 제안하지만, 그러한 프로젝트의 실현 가능성(feasibility)은 불확실합니다.

임상 분야(clinical area)에서 시험은 교수 전략(teaching strategy)으로 비교적 쉽게 사용될 수 있습니다. 회진(rounds)에서 논의된 주제에 대한 복습 질문(Review questions)은 학습자 참여(learner engagement)를 높이기 위해 청중 반응 시스템(audience-response system)을 활용하여 학습자에게 이메일로 전송되거나 사례 컨퍼런스(case conferences)에서 제시될 수 있습니다 [51].

지속적인 전문성 개발(continuing professional development)의 영역에서, 전자 형성 평가(electronic formative testing)는 매우 큰 가정의학과 의사(family physicians) 코호트에서 지식 파지(knowledge retention)와 최선의 진료 지침(best practice guidelines) 준수를 지원하는 데 사용되었으며 [52], 기술 및 지식의 쇠퇴(decay)를 완화하기 위해 다른 전문 분야에서도 사용될 수 있습니다. 새로운 자료에 대한 교육 이전에 수행되는 사전 검사(Pre-testing) 또는 시험은 새로운 학습에 고유한 이점을 갖는 것으로 나타났습니다. 사전 검사는 학습자가 새로운 내용 영역(novel content domain)의 질문에 대한 답변을 생성(generate)하려고 시도하도록 요구하기 때문에 이러한 시도는 거의 항상 실패합니다. Pan과 Sana [53]는 시험 형식(예: 단서 회상(cued recall) 대 다중 선택(multiple choice)), 정답 피드백(제공 여부), 길고 짧은 파지 간격(retention intervals), 연구 참가자(학부생 대 Amazon Mechanical Turk를 통해 모집된 참가자) 및 환경(온라인 대 실험실 환경)을 다르게 한 5개의 실험에 걸쳐 사후 검사(post-testing)에 비해 사전 검사(pre-testing)의 일관된 이점을 발견했습니다. 이 저자들은 다른 저자들 [54, 55]이 보고한 사전 검사에 비해 사후 검사를 선호하는 결과를 학습과 시험을 번갈아 하거나(alternating) 정답 피드백을 제공하는 것과 같은 교란 요인(confounds) 때문이라고 생각합니다. 사전 검사는 일반적으로 주의 집중(attentional focus)을 향상시키고 특히 시험된 자료에 주의를 집중시킴으로써 후속 학습(subsequent learning)에 도움이 되는 것으로 생각됩니다. 사전 검사는 주의를 이끄는 텍스트 구절의 섹션 제목처럼 기능하는 '조직적 신호(organisational signals)' [53] 또는 교육 이전에 적극적으로 생성된 설명과 새로운 정보의 통합(integration)을 촉진하는 '선행 조직자(advance organisers)' [56]를 제공할 수 있습니다.

흥미롭게도, 한 세트의 자료에 대해 학습자를 시험하는 것은 나중에 제시되는 다른 세트의 자료에 대한 학습을 강화(potentiate)하는 것으로 보입니다 [45]. 이 현상에 대한 메타 분석에서 Chan 등 [45]은 이러한 시험 강화 새로운 학습(test-potentiated new learning)에 대한 '통합(integration)' 이론을 뒷받침하는 증거를 발견했습니다. 시험은 첫 번째 자료 세트에 더 쉽게 접근할 수 있게(accessible) 만들어, 특히 두 자료 세트가 의미론적으로 관련되어 있을 때(semantically related) 은연중에 마음속에 떠오르게 하고 새로운 자료와 통합되도록 합니다. 따라서 최종 준거 검사(final criterial test)에서 원래 배운 자료는 나중에 배운 자료에 대한 기억 단서 기능(mnemonic cuing function)을 수행합니다. 이러한 시험 강화 새로운 학습의 다른 메커니즘도 아마 작동할 것입니다.

메타인지 이론(Metacognitive theories)은 시험이 후속 학습 과제의 요구 사항에 대해 학습자에게 단서를 제공하고 그에 따라 주의 할당, 부호화, 노력과 같은 메타인지 전략(metacognitive strategies)을 변경하도록 유도할 수 있다고 제안합니다.
맥락 이론(Context theories)은 학습(studying)과 시험(testing)이 서로 다른 부호화 과정을 수반하기 때문에 두 가지 다른 내부 맥락(internal contexts)을 제공한다고 상정합니다. 이는 학습자가 학습-시험 맥락(study-test context)과 연관된 자료와 학습 맥락(study context)에만 연관된 자료를 구별(differentiate)하는 데 도움을 줍니다.

사전 학습의 파지(retention)와 새로운 학습에 대한 시험의 효과는 모든 인지 심리학에서 가장 강력한(robust) 발견 중 하나입니다. 교사와 학생은 시험을 교수 전략(pedagogical strategy)으로 자신 있게 사용할 수 있습니다.

1. 나의 진짜 실력을 깨닫게 해줌 (메타인지 강화)

그냥 눈으로 책이나 자료를 읽을 때는 내용이 술술 읽히니까 "나 이거 다 안다"라고 착각하기 쉽습니다(이를 '유창성 착각'이라고 합니다). 하지만 시험을 쳐서 머리를 쥐어짜다 보면 "어, 나 이거 확실히 모르는구나" 하고 뼈맞는 깨달음을 얻게 되죠.
시험은 이렇게 내가 진짜 아는 것과 모르는 것을 정확히 구분하는 능력(메타인지)을 높여주어, 모르는 부분에만 시간과 노력을 효율적으로 투자할 수 있게 만들어 줍니다.

2. 수업 중 '딴생각' 원천 차단

길고 지루한 강의를 들을 때 뇌는 쉽게 멍해집니다. 하지만 수업 중간중간에 짧고 부담 없는 퀴즈를 보면, 뇌가 긴장 상태를 유지해서 딴생각으로 빠지는 것(마음 방황)을 확 줄여줍니다.

3. 배우기 전에 틀려보기 (사전 검사의 마법)

아직 배우지도 않은 내용을 먼저 시험(Pre-testing) 치면 당연히 틀리거나 대답하지 못하겠죠? 그런데 이 '실패하는 경험'이 엄청난 효과를 냅니다.
뇌가 미리 "아, 이 질문의 답이 대체 뭐지?" 하고 고민하게 되면, 이것이 일종의 '표지판'이나 '빈 상자(선행 조직자)' 역할을 합니다. 나중에 실제 수업을 들을 때 그 정답에 해당하는 내용이 나오면 스펀지처럼 훨씬 더 강력하게 흡수하게 됩니다.

4. A를 시험 보면 B도 잘 배우게 된다 (시험 강화 새로운 학습)

특정 주제(A)에 대해 시험을 치고 나면, 이어서 배우는 전혀 다른 새로운 주제(B)에 대한 학습 능력도 덩달아 올라갑니다. 여기에는 세 가지 이유가 있습니다.

통합: A와 B가 관련 있는 내용일 경우, A 시험을 보며 떠올린 생각들이 B를 이해하는 데 강력한 힌트(단서)가 됩니다.
메타인지 전략: 뇌가 눈치를 챕니다. "아, 시험이 이런 식으로 나오는구나. 다음 내용은 이렇게 집중해서 요령껏 공부해야지" 하고 스스로 공부법을 교정합니다.
맥락 분리: '공부할 때'와 '시험 볼 때'의 뇌 환경이 달라서, 머릿속에서 정보들이 뒤죽박죽 섞이지 않고 방마다 깔끔하게 정리되는 효과가 있습니다.

5. 실생활 적용: 퀴즈와 플래시카드

학생들은 본능적으로 시험을 귀찮아하기 때문에, 이 엄청난 효과를 누리려면 억지로라도 환경을 만들어야 합니다.

선생님이 질문을 던지고 학생들이 속으로 정답을 떠올리도록 3~5초간 침묵하며 기다려주기.
성적에 안 들어가는 가벼운 미니 퀴즈 자주 보기.
Anki나 First Aid 같은 '전자 플래시카드(단어장) 앱' 적극 활용하기. (실제로 암기량이 방대한 의대생들이 틈틈이 이 앱으로 스스로를 테스트해서 엄청난 효과를 보았다고 합니다.)

2 시험 강화 학습의 전이 (2 Transfer of Test-Enhanced Learning)

한 맥락에서 학습한 지식을 새롭거나 다른 맥락에 적용하는 능력인 학습의 전이(transfer of learning)는 교육 및 훈련의 궁극적인 목표로 묘사되어 왔습니다 [57]. Pan, Rickard [58]는 192개의 보고된 효과 크기(effect sizes)에 대한 메타 분석(meta-analysis)에서 시험이 학습의 전이를 향상시킬 수 있다는 개념을 뒷받침하는 증거를 발견했습니다. 그들은 발생하는 전이의 정도에 영향을 미치는 세 가지 요인의 프레임워크를 제안합니다: 초기 검사와 최종 검사 간의 반응 일치성(response congruency), 정교화된 인출 연습(elaborated retrieval practice)의 존재, 그리고 높은 초기 검사 수행(initial test performance)입니다.

반응 일치성이 있을 때, 비록 각 경우에 질문이 다르게 제기될 수 있지만 연습 검사(practice tests)와 준거 검사(criterial tests)는 동일한 정답을 갖습니다. 반응 일치성은 준거 검사 시점에 단서(cues)나 인출 경로(retrieval pathways)를 복원함으로써 정답의 접근성(accessibility)을 높여 전이를 촉진할 수 있습니다.
정교화된 인출 연습은 인출뿐만 아니라 추가적인 인지 처리(cognitive processing)를 수반하며, 광범위한 부호화(broad encoding)와 정교화된 피드백(elaborative feedback)을 포함합니다. 광범위한 부호화 전략(Broad encoding strategies)은 추가적인 유형의 인지 처리와 함께 인출을 수반합니다. 이러한 광범위한 부호화는 교사가 내리는 특정 지시(specific instructions)에 의해 유도될 수 있습니다. '정답과 관련될 수 있는 모든 것을 생각해 보시오'는 광범위한 인출 지시(broad retrieval instruction)의 한 예입니다. 예를 들어,
- 학생들에게 흉통(chest pain)의 원인에 대해 묻는다면 그들은 허혈(ischaemia), 염증(inflammation), 외상(trauma) 등과 같은 다양한 병인(etiologies)을 고려할 수 있습니다. '대답하기 전에 각 옵션을 신중하게 고려하시오'는 객관식 질문 시험(multiple-choice question test)의 문항에 답하기 위한 변별 지시(discrimination instructions)의 한 예입니다. '그 답이 정답이라고 생각하는 이유를 가능한 한 자세히 설명하시오'는 설명적 회상 지시(explanatory recall instruction)의 한 예입니다.
단순한 회상 질문 외에 적용 질문(application questions)과 같이 다른 수준의 인지 처리를 유도하는 질문을 사용하는 것도 광범위한 부호화를 이끌어낼 수 있습니다.
- 정교화된 피드백(Elaborative feedback)은 학습자가 시험 후 학습된 자료를 다시 검토하도록 허용하거나 답변이 왜 맞거나 틀린지에 대한 설명(explanations)을 제공하는 것을 수반할 수 있습니다.
- 학습자가 시험 후 받은 피드백을 장기간 검토할 기회를 갖는 연장된 피드백(extended feedback)과
- 각 시험 문항의 모든 응답 옵션에 대해 설명적 피드백이 제공되는 상세한 피드백(detailed feedback)은
  - ...정교화된 피드백을 제공하기 위한 다른 전략들입니다.

1. 학습의 전이 (Transfer of Learning)란?

수학 공식 하나를 배워서 전혀 다른 유형의 심화 문제나 실생활에 적용해 내는 것처럼, 한 번 배운 지식을 새로운 맥락에 써먹는 능력을 말합니다. 교육의 최종 보스이자 궁극적인 목표죠. 연구에 따르면 '단순히 다시 읽기'보다 **'시험 보기'**가 이 응용력을 훨씬 높여준다고 합니다.

2. 응용력(전이)을 폭발시키는 3가지 조건

연구자들(Pan & Rickard)은 시험이 단순 암기를 넘어 '응용력'으로 이어지려면 다음의 조건들이 필요하다고 말합니다. (문단에서는 주로 앞의 두 가지를 상세히 설명하고 있습니다.)

① 반응 일치성 (질문은 달라도 정답의 뿌리는 같게)
- 연습할 때 푼 문제와 실제 시험(준거 검사)의 문제 형태가 완전히 달라도, 결국 요구하는 핵심 지식(정답)이 같을 때 응용력이 높아집니다. 연습 과정에서 정답으로 가는 '길(인출 경로)'을 탄탄하게 닦아놓았기 때문에, 실전에서 질문이 조금 꼬여서 나와도 힌트를 찾아 정답을 쉽게 떠올리게 됩니다.
② 정교화된 인출 연습 (단순 암기를 넘어 깊고 넓게 생각하기)
- 단순히 "정답은 A" 하고 꺼내는 것을 넘어, 뇌를 더 복잡하게 쓰게 만드는 과정입니다. 여기에는 두 가지 강력한 무기가 있습니다.
  - 광범위한 부호화 (다각도로 생각하게 만들기): 선생님(또는 스스로)이 뇌를 쥐어짜도록 특별한 지시를 내리는 겁니다.
    - 예: "이 현상의 원인이 될 만한 걸 전부 다 말해봐." (의대생에게 흉통의 모든 원인을 묻는 것처럼요.)
    - 예: 객관식을 풀 때 "답만 고르지 말고, 나머지 보기가 왜 답이 아닌지 하나씩 다 따져봐."
    - 예: "이게 왜 정답인지 최대한 자세히 설명해봐."
  - 정교화된 피드백 (친절하고 끈질긴 오답 노트): 시험을 친 후 정답만 알려주고 끝내는 게 아니라, "왜 맞았고 왜 틀렸는지" 이유를 설명해 주는 겁니다. 피드백을 오랫동안 복습하게 하거나, 객관식 오답 보기 하나하나에 모두 해설을 달아주는 식입니다.
③ 높은 초기 검사 수행 (기본기 탄탄)
- 문단에 이름만 살짝 언급되었지만, 처음에 보는 연습 시험에서 어느 정도 성적이 잘 나와야(즉, 기본 지식이 머릿속에 있어야) 응용도 가능하다는 뜻입니다.

3 간격 연습 또는 분산 연습 (3 Spaced or Distributed Practice)

총 연습 또는 학습 시간이 일정하게 유지되더라도, 간격 연습(spaced practice) 또는 분산 연습(distributed practice)은 학습의 파지(retention) 및 전이(transfer)에서 더 큰 이득을 가져옵니다. Versteeg 등 [59]은 간격 연습 또는 학습을 특정 시간 간격(specified intervals of time)을 두고 동일한 자료를 제시하거나 인출하거나 동일한 기술을 실행하는 것으로 정의합니다. 이는 시간적으로 압축된, '벼락치기(cramming)'로도 알려진 집중 연습(massed practice) 또는 차단된 연습(blocked practice)과 대조됩니다 [60]. 간격 효과(Spacing effects)는 환경, 학습자 집단, 교육 수준 전반에 걸쳐 강력하며 최대 d = 1.0의 효과 크기(effect sizes)를 보입니다 [60]. 게다가 간격의 효과는 개념적/사실적 학습(conceptual/factual learning)과 심운동성 학습(psychomotor learning) 모두에서 관찰됩니다 [61, 62].

Moulton 등 [61]은 외과 전공의(surgical residents)들에게 미세 혈관 문합술(micro-vascular anastomosis)을 집중 조건(massed condition, 연습이 단 하루로 압축됨) 또는 간격 조건(spaced condition, 4주 동안 매주 1회의 연습 세션 진행) 중 하나로 연습하도록 할당했습니다. 총 연습 시간은 두 집단 간에 동일했습니다. 간격 조건의 참가자들은 훈련 1개월 후 실시된 기술 평가에서 집중 조건의 참가자들보다 우수한 성과를 보였습니다.

여러 이론이 분산 연습의 메커니즘을 설명하려고 시도합니다.

학습 단계 인출 이론(Study-phase retrieval theories)은 항목을 다시 마주하는 것이 학습자로 하여금 이전의 조우를 회상(recall)하도록 촉구한다고 제안합니다. 연속적인 제시 사이의 지연 시간(lag time)이 길어질수록 이 회상은 더 어려워지며, 이는 해당 항목에 대한 기억을 강화합니다 [63, 64].
부호화 다양성 이론(Encoding variability theories)은 학습자가 환경의 특징이나 내부 상태와 같이 학습이 발생하는 맥락(context)의 요소를 부호화(encode)한다고 제안합니다. 이렇게 부호화된 요소들은 이후에 기억 단서(mnemonic cues) 역할을 합니다. 부호화 사건이 시간적으로 분리될 때 맥락적 요소가 다양해질 가능성이 더 높으며, 따라서 회상을 돕기 위해 더 많고 다양한 단서를 제공합니다.
결핍 처리 설명(Deficient processing accounts)은 동일한 항목을 시간적으로 가깝게 연속해서 제시하면 주의력(attention)과 결과적으로 처리(processing)가 감소한다고 제안합니다. 대조적으로 항목의 반복 제시(repeated presentation) 사이에 일정 시간이 경과하면, 해당 항목은 더 이상 작업 기억(working memory)에 없게 되고 학습자는 그것을 처리하는 데 더 많은 주의를 기울입니다 [63].

분산 연습의 일정(schedule)에 대해 상당한 연구 관심이 주어졌습니다.

균일 일정(uniform schedule)에서는 자료의 재제시(re-presentations) 사이의 간격이 동일합니다.
수축 일정(contracting schedule)에서는 제시 간격이 점진적으로 짧아지는 반면,
확장 일정(expanding schedule)에서는 제시 간격이 점진적으로 길어집니다.
Toppino와 동료들 [63]은
- 초기 훈련 수준이 낮을 때(참가자가 자료를 두 번 재학습함) 확장 일정(expanding schedule)이 장기 파지(long-term retention)에 이점을 주지만,
- 초기 훈련 수준이 높을 때(참가자가 자료를 한 번 학습한 후 교정적 피드백과 함께 다섯 번 시험을 치름)는 그렇지 않다는 것을 발견했습니다.

분산 연습은 시험(testing) 및 혼합 연습(mixed practice)과 같은 다른 전략과 결합될 때 특히 효과적일 수 있습니다. 메타 분석에서 Latimier 등 [65]은 혼합 인출 연습(mixed retrieval practice)에 비해 간격 인출 연습(spaced retrieval practice)의 큰 이점을 발견했습니다 (g = 1.01, (95% CI [0.68, 1.34], p < 0.0001)). 이 연구자들은 또한 중요한 것은 시험의 일정(예: 균일 대비 확장)이 아니라 시험의 횟수(number of tests)라고 보고하며, 간격 재학습(spaced re-study)보다 간격 시험(spaced testing)에서 다른 인지 과정이 작동할 수 있음을 시사했습니다.

적응형 평가(Adaptive testing)는 학습과 전이를 향상시키기 위해 시험과 분산 연습을 결합한 비교적 최근의 혁신입니다. 이러한 시스템은 응답 시간(response time) 및 정확도(accuracy)와 같은 지표(metrics)를 평가하기 위해 알고리즘(algorithms)을 사용합니다. 그런 다음 이러한 지표를 사용하여 사용자에게 질문이나 과제의 순서(sequence), 간격(spacing) 및 난이도(difficulty)를 조정합니다.

Anki, Quizlet, Brainscape 및 RemNote 애플리케이션은 모두 이러한 알고리즘을 사용하여 선언적 지식(declarative knowledge)을 테스트합니다 [66].
적응형 평가 알고리즘을 사용하는 전문 분야별 애플리케이션(Specialty-specific applications)이 개발되어 널리 사용되고 있습니다. 그러한 애플리케이션 중 하나가 이비인후과(otolaryngology)에 대한 방대한 문제 은행을 제공하는 OtoRecall입니다 [67].
적응형 평가는 또한 지금까지 경식도 심초음파(transesophageal echocardiography) 및 심전도 판독(electrocardiogram interpretation)을 가르치는 데 효과적으로 사용되었으며 다른 많은 절차적 기술(procedural skills)을 가르치는 데에도 유망합니다 [68].
간격 연습 제공의 실현 가능성(feasibility)에 대한 교육자들의 우려는 학습이 분산될 때 기술 및 지식 습득(skill and knowledge acquisition)에 실제로 더 적은 시간이 필요하다는 증거에 의해 완화될 수 있습니다 [69].

이번 문단도 이전 내용들과 자연스럽게 이어지는 아주 중요한 학습 이론입니다. 앞서 "어떻게(시험을 통해)" 공부해야 하는지를 다뤘다면, 이번에는 "언제(시간 간격을 두고)" 공부해야 하는지를 설명하고 있습니다.
이 문단의 핵심을 한 줄로 요약하면 **"총 공부 시간이 똑같다면, 하루에 몰아서 벼락치기하는 것보다 며칠에 걸쳐 쪼개서 복습하는 것이 기억에 훨씬 오래 남고 시간도 절약된다"**입니다.
이해하기 쉽게 5가지 핵심 포인트로 풀어서 설명해 드릴게요.

1. 벼락치기(집중 연습) VS 쪼개서 공부하기(간격 연습)

시험 전날 밤을 새워 10시간을 공부하는 것(집중 연습)보다, 매일 2시간씩 5일에 걸쳐 공부하는 것(간격 연습)이 훨씬 효과적입니다. 놀라운 점은 이것이 단순한 암기뿐만 아니라 **'몸으로 익히는 기술'**에도 똑같이 적용된다는 것입니다. 연구진이 외과 의사들에게 미세 혈관 수술 기술을 가르칠 때, 하루 만에 몰아서 연습시킨 그룹보다 4주에 걸쳐 일주일에 한 번씩 연습시킨 그룹이 나중에 수술을 훨씬 더 잘했습니다.

2. 왜 간격을 두는 게 더 효과적일까? (3가지 과학적 이유)

학자들은 벼락치기보다 간격 연습이 통하는 이유를 다음 3가지로 설명합니다.

① 잊을 만할 때 뇌를 괴롭히기 (학습 단계 인출 이론): 공부하고 시간이 조금 지나면 배운 내용을 살짝 까먹게 됩니다. 이때 다시 복습을 하면, 희미해진 기억을 끄집어내느라 뇌가 더 고생하게 되고, 이 과정이 기억을 엄청나게 단단하게 만듭니다.
② 기억의 단서 늘리기 (부호화 다양성 이론): 오늘 낮에 카페에서 공부하고, 내일 저녁에 내 방에서 복습하면 뇌는 '다양한 시간과 장소의 느낌'을 정보와 함께 저장합니다. 나중에 기억을 떠올릴 때 연결 고리(힌트)가 많아져서 훨씬 쉽게 떠오릅니다.
③ 뇌의 '지루함' 방지 (결핍 처리 설명): 똑같은 내용을 연달아 계속 보면 우리 뇌는 "아, 이거 아까 본 거네" 하고 대충 처리해버립니다(주의력 감소). 하지만 며칠 쉬었다가 다시 보면 뇌가 다시 신선하게 집중하게 됩니다.

3. 복습 주기는 어떻게 짜는 게 좋을까?

복습하는 간격에 대해서도 연구를 했습니다.

균일 일정: 매일 똑같이 하루 간격으로 복습
수축 일정: 처음엔 5일, 그다음엔 3일, 그다음엔 1일 간격으로 점점 짧게 복습
확장 일정: 처음엔 1일, 그다음엔 3일, 그다음엔 7일 간격으로 점점 길게 복습

연구 결과, 처음에 내용을 잘 모를 때는 **점점 간격을 늘려가는 '확장 일정'**이 유리합니다. 하지만 어느 정도 내용을 숙지한 상태라면 주기의 모양보다는 **'얼마나 여러 번 스스로를 시험(테스트)했는가'**가 훨씬 중요합니다.

4. 기술의 발전: 적응형 평가 (알고리즘의 도움)

이러한 완벽한 복습 주기를 사람이 일일이 계산하기 힘들기 때문에 인공지능 알고리즘이 등장했습니다. Anki, Quizlet 같은 앱들이 바로 이 원리를 씁니다. 내가 어떤 플래시카드를 맞혔는지 틀렸는지, 대답하는 데 몇 초나 걸렸는지를 앱이 분석해서 "이 내용은 완벽히 아니까 한 달 뒤에 보여주고, 이 내용은 방금 틀렸으니 10분 뒤에 다시 보여줘야지" 하고 알아서 문제를 섞어줍니다. 의대생들이 이 앱으로 엄청난 양의 의학 지식을 외우고, 심지어 심전도 판독 같은 기술을 배울 때도 널리 쓰이고 있습니다.

5. "시간이 너무 오래 걸리지 않을까요?"

선생님이나 학생들은 "조금씩 쪼개서 언제 다 진도를 나가냐"라고 걱정할 수 있습니다. 하지만 연구 결과에 따르면, 간격을 두고 공부하면 뇌가 훨씬 효율적으로 정보를 흡수하기 때문에 결과적으로 해당 지식이나 기술을 완벽히 마스터하는 데 들어가는 '총 시간'은 오히려 줄어듭니다.

4 혼합 연습 또는 교차 연습 (4 Mixed or Interleaved Practice)

교차 연습(interleaved practice) 또는 혼합 연습(mixed practice)에는 필연적으로 어느 정도의 간격 요소가 있습니다. 그러나 그 이점은 간격을 넘어섭니다. 예를 들어, 다른 범주(categories)의 예시(exemplars)를 혼합하는 것은 변별적 대조 처리(discriminative contrastive processing)를 유도합니다: 학습자는 특히 범주가 매우 유사할 때 범주를 구별(differentiate)하는 특징(features)에 주의를 기울입니다.

자극이 나비와 새 종(species) [70], 그리고 예술가의 화풍(painting styles) [71]이었던 시각적 범주 학습(visual category learning) 연구에서 교차(interleaving)의 강력한 효과가 나타났습니다.
보건 의료 전문직 교육(HPE) 맥락에서 이러한 결과는 방사선 판독(radiologic interpretation)이나 피부과(dermatology)의 피부 병변(skin lesions) 식별과 같은 시각적 진단 과제(visual diagnostic tasks)와 관련이 있을 것입니다.
두 가지 실험에서 Kornell과 Bjork [71]는 참가자들에게 12명의 다른 예술가의 그림을 차단된 일정(blocked schedule) 또는 교차된 일정(interleaved schedule)으로 학습하도록 했습니다. 두 실험 모두에서 교차 조건(interleaved condition)의 참가자는 동일한 예술가의 새로운 그림을 올바르게 식별하는 데 있어 차단된 조건(blocked condition)의 참가자보다 우수한 성과를 보였습니다.
수학 학습에 대한 일련의 연구에서 다른 문제 유형(problem types)을 교차하는 것이 유익한 것으로 나타났습니다 [72-74]. Rohrer 등 [73]은 학생들이 차단된 일정 또는 교차된 일정으로 네 가지 다른 유형의 문제(선형 방정식, 비례, 선형 방정식 그래프 및 기울기 문제)를 해결하는 연습을 한 후 2주 뒤에 실시된 예고 없는 시험(unannounced test)에서 교차 연습의 큰 효과(d = 1.05)를 발견했습니다.
- 문제가 다른 유형일 때, 학습자는 먼저 문제 유형을 식별(identify)한 다음 적절한 해결책을 적용해야 합니다.
- 문제가 모두 같은 유형일 때, 학습자는 단순히 동일한 해결책을 반복적으로 적용하기만 하면 됩니다.
- 따라서 이 경우 교차(interleaving)는 인출 메커니즘(retrieval mechanisms)을 수반할 가능성이 높습니다.

초보자(Novices)는 범주화 결정(categorisation decisions)을 내릴 때 개념적 특징(conceptual features)보다는 표면적 특징(superficial features)에 의존하는 경향이 있습니다 [75]. 교차는 주어진 개념의 구조적 원리(structural principles)에 대한 인식을 촉진할 수 있는 맥락적 변동(contextual variation)을 제공합니다. Kulasegaram 등 [76]은 세 가지 생리학적 개념(physiological concepts)이 동일한 맥락 대비 여러 맥락에 적용되었을 때 학습자가 근거리 및 원거리 전이 검사(near and far transfer tests) 모두에서 우수한 수행을 보였다는 것을 발견했습니다.

교차 연습(Interleaved practice)은 많은 상황에서 학습에 유익하지만 모든 상황에서 유익한 것은 아닐 수 있습니다. 규칙 기반 범주(Rule-based categories)는 범주화 결정이 기반이 되는 각각의 속성(properties)이 의미론적 '레이블(label)'을 가지며 구두로 설명될 수 있는 범주입니다. 따라서 범주화 결정은 작업 기억(working memory)에 유지되는 결합된 '규칙(rules)'의 집합을 기반으로 합니다 [77]. 심전도(ECG) 리듬 판독은 규칙 기반 범주화 과제(rule-based categorisation task)의 한 예입니다. 심전도 파형(ECG waveform)의 각 구성 요소에 적용되는 기준(Criteria)이 결합되어 각 심장 리듬(cardiac rhythm)을 정의합니다. 즉, 개인은 각 구성 요소에 대해 정상과 비정상을 구별하는 값의 범위를 회상하고, 규칙을 결합한 다음, 결합된 규칙 집합에 의해 정의된 범주를 회상해야 합니다. 서로 다른 심장 리듬의 예시(exemplars)를 교차하는 것은 초보 학습자의 작업 기억 자원을 압도할 수 있습니다. 따라서 규칙 기반 범주를 학습하는 초기 단계에서는 교차 연습보다 차단된 연습(blocked practice)이 더 바람직할 수 있습니다 [78, 79]. 실제로 이것은 Monteiro 등 [80]의 정확한 발견이었습니다: 심전도 판독을 배우는 초보자에게는 차단된 연습이 교차 연습보다 우수했습니다.

일반적으로 증거는 혼합 연습 또는 학습의 사용을 지지하지만 학습자의 기술 수준(skill level) 및 범주 유형(category type); 즉, 규칙 기반 범주 대 시각적 지각(visual perception)에 크게 의존하는 범주와 관련하여 주의 사항(caveats)이 적용됩니다. 교육자는 문제 또는 과제의 순서(sequencing)를 결정할 때 이러한 요소들을 고려할 것을 권장합니다.

1. 차단된 연습(AAA) vs 교차 연습(ABC)

우리는 보통 수학을 공부할 때 '방정식' 단원을 다 끝내고(AAA), 그다음 '함수' 단원을 풀고(BBB), 그다음 '도형' 단원(CCC)을 풉니다. 이를 한 우물만 파는 **차단된 연습(Blocked practice)**이라고 합니다. 반면 교차 연습은 방정식, 함수, 도형 문제를 무작위로 섞어서(ABC, BCA, CAB) 푸는 방식입니다. 연구 결과, 이 '섞어 풀기'가 실제 시험 성적을 압도적으로 높여줍니다.

2. 미세한 차이를 캐치하는 능력 (변별적 대조 처리)

비슷해 보이는 화가의 그림들, 여러 종류의 나비, 혹은 피부과의 미세한 피부 병변이나 X-ray 사진들을 구별해야 할 때 섞어서 공부하는 것이 훨씬 유리합니다. A만 계속 볼 때는 A의 특징만 보이지만, A와 B와 C를 번갈아 가며 섞어 보면 뇌가 "아, A는 B랑 이 부분이 다르고, C랑은 저 부분이 다르구나" 하고 미세한 차이점을 본능적으로 구별(변별적 대조)하게 되기 때문입니다.

3. '뇌의 자동 주행' 방지

수학 문제집에서 '방정식' 단원만 20문제를 연달아 풀면, 나중에는 문제를 제대로 읽지도 않고 기계적으로 공식만 대입하게 됩니다. 뇌가 생각하기를 멈추는 것이죠. 하지만 문제 유형을 마구 섞어 놓으면, 문제를 맞닥뜨렸을 때 "잠깐, 이거 무슨 유형의 문제지? 어떤 공식을 써야 하지?" 하고 뇌가 매번 새롭게 판단하고 해결책을 꺼내야(인출 메커니즘) 합니다. 이것이 진짜 응용력을 길러줍니다.

4. 결정적 예외: 섞으면 독이 되는 경우 (규칙 기반 과제)

이 문단에서 가장 중요한 반전입니다. 교차 연습이 만병통치약은 아닙니다. 초보자가 복잡한 '규칙'을 외우고 조합해야 하는 분야에서는 오히려 독이 됩니다. 대표적인 예가 심전도(ECG) 그래프 읽기입니다. 심전도를 읽으려면 파동의 높이, 넓이 등 엄격하고 복잡한 수치 규칙들을 머릿속(작업 기억)에 꽉 채워두고 하나하나 따져야 합니다. 초보자에게 이런 복잡한 심장 리듬 예시들을 막 섞어서 던져주면 뇌에 과부하가 걸려 포기하게 됩니다. 따라서 복잡한 규칙을 처음 배우는 단계에서는 한 가지를 완벽히 마스터하는 '차단된 연습'을 먼저 하는 것이 정답입니다.

5 생산적 실패 접근법 (5 Productive Failure Approaches)

생산적 실패(productive failure, PF) 접근법에서 학습자는 교육을 받고 '정준의(canonical)', 즉 표준적이거나 널리 받아들여지는 문제 해결책(problem solution)을 제공받기 전에 새로운 문제를 해결하기 위해 데이터 세트(datasets)나 사례(cases)를 비교하여 규칙을 귀납적으로 도출(induce a rule)하도록 요구받습니다 [81]. 학습자는 종종 문제의 복잡성(complexity)과 참신함(novelty) 때문에 문제를 푸는 데 어려움을 겪습니다(struggle). 이러한 접근법은

'문제 해결-학습(problem-solving-instruction, PS-I)' 순서라고도 알려져 있으며,
학습자가 새로운 내용에 대해 직접 교수(direct instruction)를 받은 후 관련 문제 해결을 연습하는 전통적인 '설명 및 연습(tell-and-practice)' 또는 '학습-문제 해결(instruction-problem-solving, I-PS)' 순서와 대조됩니다.

이러한 접근법을 비교한 실험의 전형적인 결과는 전통적인 I-PS 조건의 학습자가 즉각적인 습득 평가(immediate tests of acquisition)에서는 PS-I 조건의 학습자보다 우수한 성과를 내지만, 전이 평가(transfer tests)에서 새로운 지식의 적용(application of new knowledge)을 평가할 때는 PS-I 조건의 학습자가 I-PS 조건의 학습자보다 우수한 성과를 낸다는 것입니다 [81-84]. 예를 들어,

Steenhof 등 [85]은 참가자들에게 크레아티닌 청소율(creatinine clearance)에 영향을 미치는 변수에 대한 원시 데이터(raw data)를 사용하여 크레아티닌 청소율 공식을 고안하도록 시도하게 했습니다. 이는 그들이 '정준의(canonical)' Cockcroft-Gault 방정식에 대한 교육을 받기 전에 수행되었습니다. 실험 조건(experimental condition)의 참가자들은 방정식에 대한 새로운 지식과 추가 정보를 모두 사용하여 새로운 문제를 해결해야 하는 '미래 학습을 위한 준비도(preparation for future learning)' 평가에서, 해결책에 대해 먼저 직접 교수를 받은 참가자들보다 우수한 성과를 거두었습니다.

생산적 실패(PF) 문헌의 결과를 설명하기 위해 여러 메커니즘이 제안되었습니다.

학습자가 새로운 문제에 대한 해결책을 찾으려 하거나 데이터 전반에 걸쳐 일반화(generalise)되는 규칙을 귀납적으로 도출(induce)하려고 시도할 때, 그들은 관련이 있을 수 있는 사전 지식(prior knowledge)—일반적, 경험적 지식 또는 그들이 가지고 있을 수 있는 영역 특이적 선언적 지식(domain-specific declarative knowledge)—을 활성화(activate)합니다 [86, 87]).
또한, 사례를 비교하고 대조(comparing and contrasting)할 때, 그들은 무관한 맥락적 또는 표면적 특징(surface features)과 대조적으로 사례들이 공통으로 갖는 '구조적(structural)' 특징이나 여러 사례에 적용되는 개념적 원리(conceptual principle)를 알아차릴 수 있습니다 [88, 89]. 이러한 개념적 원리의 귀납적 도출(induction)은 학습자가 올바른 해결책이 다양한 맥락(diverse contexts)에 어떻게 적용될 수 있는지, 즉 원거리 전이(far transfer)를 볼 수 있게 해줍니다.
문제와 씨름하면서 그들은 전반적인 지식 결핍(global knowledge deficits)을 인식하게 되며, 이는 결과적으로 호기심(curiosity)을 증가시키고 [90] 교육에 대한 주의(attention)를 예리하게 할 수 있습니다.
후보 해결책(candidate solutions)을 생성하려고 시도할 때, 그들은 교육이 제시될 때 그 부호화(encoding), 파지(retention) 및 전이(transfer)를 촉진하는 여러 인출 단서(retrieval cues)를 생성할 수도 있습니다 [91]. 따라서 생산적 실패(PF) 활동은 학습자가 교육으로부터 최적의 이점을 얻을 수 있도록 준비시키는 어느 정도 일관된 문제의 정신적 표상(mental representation of a problem)을 형성하게 할 수 있습니다.

모든 바람직한 어려움(desirable difficulties) 중에서 생산적 실패(productive failure) 접근법은 교육자와 학생 모두에게 가장 큰 저항에 부딪힐 수 있으며, 특히 한편으로는 서비스 제공 및 치료의 요구와 다른 한편으로는 교육을 위한 최적의 관행 사이에 종종 갈등이 있는 임상 환경(clinical setting)에서 그러합니다 [92]. Mylopoulos 등 [92]은 인증 표준 및 절차(accreditation standards and processes)를 활용하여 '구조적, 문화적, 절차적(structural, cultural and procedural)' (p. 3) 요인이 학습자의 성장 및 발달과 상충되지 않도록 보장할 수 있다고 제안합니다. 실패와 고군분투(struggle)에 대한 보건 의료 직종의 문화적 혐오(cultural aversion)에서 벗어나기 위해 교수 개발 이니셔티브(Faculty development initiatives)가 필요할 수 있습니다.

1. 두 가지 공부법의 대결: 전통적 방식 vs. 생산적 실패

전통적 방식 (설명 및 연습, I-PS): 선생님이 먼저 "이 공식은 이거야"라고 가르쳐 주고(Instruction), 학생이 그 공식에 숫자를 대입해 문제를 푸는(Problem-solving) 방식입니다. 우리가 아는 아주 흔한 수업 방식이죠.
생산적 실패 (문제 해결-학습, PS-I): 공식이나 정답을 절대 먼저 알려주지 않습니다. 대신 복잡한 원시 데이터나 사례들을 툭 던져주고, "여기서 규칙을 스스로 찾아내서 문제를 해결해 봐"라고 요구합니다. 학생들은 배운 게 없으니 당연히 끙끙대며 좌절하고 '실패'하게 됩니다. 그제야 선생님이 진짜 정답과 공식을 가르쳐 줍니다.

2. 당장 성적은 낮아져도, '응용력'은 폭발한다

이 두 그룹을 비교해 보면 결과가 아주 재미있습니다. 수업 직후에 보는 단순한 시험에서는 '전통적 방식'으로 배운 학생들의 성적이 더 좋습니다. 하지만, 배운 것을 새로운 상황에 적용해야 하는 '전이 평가(응용 시험)'에서는 끙끙대며 실패를 맛본 '생산적 실패' 그룹이 압도적으로 높은 성과를 냅니다. 의대생들에게 크레아티닌 수치 계산법을 가르칠 때도, 공식부터 외운 학생들보다 수많은 환자 데이터를 보며 스스로 공식을 만들어보려다 실패했던 학생들이 나중에 훨씬 더 복잡한 의료 문제를 잘 해결했습니다.

3. '실패'가 뇌에 미치는 4가지 마법 (왜 효과적일까?)

정답 없이 문제를 풀려고 '삽질'하는 동안 우리 뇌에서는 엄청난 일들이 벌어집니다.

① 잠자는 지식 깨우기: "아, 이거 어떻게 풀지?" 하면서 자기가 예전에 지나가듯 들었던 지식이나 경험까지 총동원하게 됩니다.
② 겉모습에 속지 않고 뼈대 보기: 여러 사례를 비교하면서, 문제의 겉모습(표면적 특징)에 속지 않고 그 안에 숨겨진 진짜 원리(구조적 특징)를 간파하는 눈이 생깁니다.
③ 지적 호기심과 메타인지 폭발: 끙끙대다 보면 "아, 내가 이 부분을 진짜 모르는구나" 하고 뼈저리게 느끼게 됩니다. 이때 정답을 가르쳐 주면, 호기심이 최고조에 달해 있어 스펀지처럼 쫙쫙 흡수합니다.
④ 나만의 오답 노트 생성: 스스로 온갖 가설을 세워보며 실패했던 흔적들이 나중에 정답을 들었을 때 "아, 그래서 내 방법이 틀렸던 거구나!" 하는 강력한 연결 고리(인출 단서)가 되어 기억에 평생 남습니다.

4. 현실적인 장벽: "실패를 허락하지 않는 문화"

이론적으로는 이렇게 완벽한 공부법이지만, 현실(특히 의대나 임상 환경)에서는 적용하기 가장 어렵습니다. 학생들은 "그냥 빨리 정답이나 알려주지 왜 고생을 시키냐"며 불만을 가질 수 있고, 의료계 자체가 사람의 생명을 다루다 보니 '실패'라는 단어 자체에 엄청난 거부감을 가지기 때문입니다. 그래서 이 방법을 쓰려면 학교 시스템이나 교수님들의 문화적인 인식 변화가 먼저 필요하다고 지적하고 있습니다.

6 연구에 대한 시사점 (6 Implications for Research)

통칭하여 '바람직한 어려움(desirable difficulties)'으로 알려진 관행들은 학습자가 노력이 필요하고 오류가 발생하기 쉬운(effortful and errorful) 것으로 경험하지만, 학습 및 학습의 전이에 강력한 이점(robust benefits)을 제공합니다. 증거에 따르면 이러한 관행이 수반하는 다양한 인지 처리(cognitive processing)가 어려움 그 자체(difficulty itself)보다 학습 이점에 더 많이 기여합니다. 그러나 생산적 실패(productive failure)와 비생산적 실패(unproductive failure)의 구분에서 알 수 있듯이 가장 강력한 결과에도 적용되는 경계 조건(boundary conditions)이 존재합니다. 범주 학습 패러다임(category learning paradigm)에서 범주와 그 구성원이 매우 유사할 때는 차단된 학습(blocked study)보다 교차 학습(interleaved study)이 더 유익합니다 [93, 94].

교차 학습은 방사선 사진 판독(radiograph interpretation)과 같이 시각적 지각(visual perception)에 크게 의존하는 범주를 학습하는 데 유익합니다.
차단된 학습은 명확하게 설명될 수 있는 규칙을 기반으로 멤버십이 결정되는 범주를 학습하는 데 일반적으로 유익합니다 [95]. 보건 의료 전문직 교육(HPE) 맥락에서 이러한 규칙 기반 범주(rule-based category)의 한 예는 동맥혈 가스 판독(arterial blood gas interpretation)일 것입니다.

규칙 기반 범주에 대한 차단된 학습의 이점에는 추가적인 조절 변수(moderators)가 있습니다: 규칙의 수와 학습자의 기술 수준(skill level)입니다. de Croock과 van Merriënboer [96]는 교차 학습이 매우 복잡하고 규칙 기반의 주제를 학습하는 과제를 맡은 초보자(novices)의 작업 기억 자원(working memory resources)을 압도한다는 것을 발견했습니다. 바람직한 어려움의 경계 조건(boundary conditions)에 대한 이해를 개선하기 위해 추가 연구가 필요합니다. 우리는 이러한 관행의 다른 실제 세계 조절 변수(real-world moderators)뿐만 아니라 이를 조작화(operationalise)할 방법도 식별해야 합니다. 예를 들어, Hughes와 Thomas [97]는 자연주의적 실체(naturalistic entities)에서 유사성(similarity)을 정량화하는 방법의 필요성을 지적하는데, 그 이유는 범주 유사성(category similarity)과 학습 일정(study schedule) 간의 상호작용에 대한 많은 연구가 연구자가 원하는 유사성 정도를 달성하기 위해 조작될 수 있는 컴퓨터 생성 자극(computer-generated stimuli)을 사용하여 수행되었기 때문입니다.

디지털 플랫폼(digital platforms)의 광범위하고 빠른 채택은 연구를 위한 새로운 길을 열어줍니다. 이러한 플랫폼은 학습자를 참여시키고 총괄 평가 점수(summative test scores)를 향상시키는 것으로 보이지만 잠재적인 부작용(adverse effects), 비용-편익의 상충 관계(cost-benefit tradeoffs) 및 형평성(equity)에 미치는 영향에 대해서는 알려진 바가 거의 없습니다 [98].

학습자는 임상 전 기간(pre-clinical years)이 끝나면 더 큰 규모로 자신의 학습을 조절(regulating)할 책임이 있습니다. 학습자가 학습 및 연습 전략을 선택하는 방법과 이유, 그리고 학습 순서를 어떻게 정하는지 명확히 하기 위한 연구가 필요합니다. 그러한 통찰력은 그들이 명확하게 표현할 수 있는 전략 사용에 대한 인식(awareness)을 가진 우수한 성과를 내는 학습자(high-performing learners)들로부터 얻을 수 있을 것입니다 [50, 78].

사용하지 않음(disuse)으로 인해 발생하는 지식과 기술의 감소, 즉 기술 및 지식 쇠퇴(skill and knowledge decay)를 이해하기 위한 추가 연구가 필요합니다.

이러한 감소는 임상의들 사이에서 고위험-저빈도(high-acuity, low-frequency) 절차적 기술 [99]과 연구 펠로우십의 훈련생들 사이에서 발생할 수 있습니다 [100, 101]. 이러한 연구는 이 문제를 완화하기 위한 최적의 확장 시험 일정(optimal expanding schedules of testing)과 같은 전략을 알리기 위한 목적으로 쇠퇴에 가장 취약한 실제 지식과 기술 및 쇠퇴의 시간 경과(time course of decay)를 조사할 것입니다 [102].

1. 만병통치약은 없다: 언제 쓰고 언제 피할 것인가? (경계 조건)

앞서 배운 내용의 중요한 복습이자 주의사항입니다. '바람직한 어려움'도 상황에 맞게 써야 합니다.

시각적 구별 (교차 학습 승리): X-ray 사진이나 피부병 사진을 구별하는 것처럼 '눈치'와 '감'이 필요한 과제는 여러 개를 마구 섞어서(교차해서) 훈련하는 것이 최고입니다.
복잡한 규칙 (차단된 학습 승리): 동맥혈 가스 분석(ABGA)처럼 공식과 수치를 엄격하게 따져야 하는 분야는 초보자에게 섞어서 가르치면 뇌(작업 기억)에 과부하가 옵니다. 이때는 한 놈만 패는 방식(차단된 학습)이 먼저입니다. 학자들은 현실 세계에서 이 '섞는 비율'을 어떻게 조절해야 할지 더 연구해야 한다고 말합니다.

2. 디지털 학습 앱의 명암 (플랫폼의 부작용)

요즘 학생들이 Anki나 Quizlet 같은 스마트폰 단어장/복습 앱을 쓰면서 성적이 오르고 있지만, 학자들은 조심스럽게 묻습니다. "이게 무조건 좋기만 할까?" 이런 앱들이 혹시라도 모르는 부작용은 없는지, 혹은 이런 유료 앱이나 기기를 살 수 있는 학생과 없는 학생 간의 **'교육 불평등(형평성)'**을 만들지는 않는지 파악해야 한다고 지적합니다.

3. 최상위권 학생들의 영업 비밀 캐내기 (자기 주도 학습)

학교를 졸업하거나 고학년이 되면, 누가 공부 스케줄을 짜주지 않습니다. 스스로 알아서 해야 하죠. 그래서 연구자들은 공부 잘하는 학생들(우수한 성과를 내는 학습자)이 실제로 이 '바람직한 어려움' 전략들을 어떻게 선택하고 섞어서 스케줄을 짜는지 그들의 머릿속을 심층적으로 인터뷰하고 분석해서 다른 학생들에게 알려줄 필요가 있다고 강조합니다.

4. 안 쓰면 잊어버린다: '기억상실' 막기 (기술 및 지식 쇠퇴)

의사들이 매일 하는 진료는 절대 안 까먹지만, 아주 가끔 일어나는 초응급 상황(고위험-저빈도) 대처법은 시간이 지나면 까먹기 마련입니다.
이렇게 '사용하지 않아서 생기는 지식의 증발'을 막으려면, 잊어버릴 만할 때쯤 기가 막힌 타이밍에 알림을 줘서 시험을 보게 만드는 **'최적의 복습 주기(확장 시험 일정)'**를 찾아내야 한다고 마무리합니다.

7 교육자 및 저자를 위한 주의 사항 (7 Caveats for Educators and Authors)

이 논문 전체에서 저는 교육자가 장기 파지(long-term retention) 및 학습의 전이(transfer of learning)에 유익한 종류의 노력적 처리(effortful processing)를 촉진하기 위해 사용할 수 있는 여러 전략을 제안했습니다. 그러나 교육자는 이러한 전략이나 기타 교육 전략의 실행에 대해 주의를 기울이는(mindful) 것이 중요합니다. 교육적 혁신과 관행이 채택될 때, 한 가지 측면이 전경화(foregrounded)되는 반면 중요한 뉘앙스(nuances)는 잊혀질 위험이 있습니다. 바람직하게 어려운 관행(desirably difficult practices)의 경우, 어려움(difficulty)이 바람직함(desirability) 또는 효과성(effectiveness)과 잘못 혼동(conflated)될 수 있습니다 [103]. 따라서 바람직하게 어려운 관행과 관련하여 강력한 주의 사항(caveat)이 제기됩니다: 교육자는 훈련을 더 힘들고 스트레스 받게 만드는 모든 관행이 필연적으로(perforce) 학습에 유익하다고 가정해서는 안 됩니다.

교육자와 연구자 모두 바람직하게 어려운 관행의 이론적 기반(theoretical basis)을 잘못 지정(mis-specification)하는 것을 주의해야 합니다. 바람직한 어려움 이론(Theories of desirable difficulties)은 주로

개인 수준의 인지적 및 메타인지적 메커니즘(cognitive and meta-cognitive mechanisms)을 지정하며
사회문화적(socio-cultural) 또는 상황 학습 메커니즘(situated learning mechanisms)을 지정하지 않습니다.
따라서, 예를 들어 순환 훈련 모델(rotational training models)은 교차 연습(interleaved practice)의 예시(instantiation)로 구현되거나 평가되어서는 안 됩니다 [104, 105]. 교육자는 규칙 기반 범주를 학습하는 초보자에게 교차 연습보다 차단된 연습(blocked practice)이 선호된다는 것과 같이 바람직하게 어려운 관행의 알려진 경계 조건(boundary conditions)을 염두에 두어야 합니다.

연구와 실무를 방해할 수 있는 또 다른 문제는 용어 정의의 명확성 부족(lack of clarity)입니다. 교차 연습(interleaved practice)에 내재된 간격(spacing)의 요소가 있지만, 일부 저자는 '간격 연습(spaced practice)'과 '교차 연습'이라는 용어를 잘못 상호 교환하여(interchangeably) 사용합니다 [106]. 교차 연습(Interleaved practice)은 비교적 제한된 영역(circumscribed domain) 내에서 문제나 과제를 번갈아 수행(alternating)하여 학습자가 과제나 문제의 중요한 개념적 또는 실질적 요소를 대조(contrasting)함으로써 이점을 얻는 것을 의미합니다. 예를 들어, 다양한 유형의 봉합술(suturing) 연습을 번갈아 하는 것과 봉합술 연습과 청진(auscultation) 연습을 번갈아 하는 것을 대조해 보십시오: 전자는 교차 연습(interleaved practice)을 구성하는 반면, 후자는 단지 과제 전환(task switching)을 구성할 뿐입니다. 교차 연습과 과제 전환은 마치 그 인지적 메커니즘(cognitive mechanisms)과 결과가 상응하는(commensurate) 것처럼 구현되거나 조사되어서는 안 됩니다. 따라서 연구자와 교육자는 무엇이 바람직하게 어려운 관행(desirably difficult practices)을 구성하는지 명확히 이해하도록 촉구됩니다.

8 결론 (8 Conclusions)

평가를 위한 시험(testing-for-assessment), 교차 및 간격 연습(interleaved and spaced practice), 생산적 실패(productive failure) 접근법과 같이 바람직한 어려움(desirable difficulties)으로 알려진 관행은 광범위한 맥락에서 장기 파지(long-term retention) 및 학습의 전이(transfer of learning)를 촉진하는 데 효과적인 것으로 나타났습니다. 교육자는 자원을 과도하게 지출(undue outlay of resources)하지 않고도 이러한 전략을 교수 관행(teaching practice)에 통합할 수 있습니다. 그러나 교육자와 연구자는 무비판적으로(uncritically) 모든 어려움을 교육적 이점과 혼동(conflate)해서는 안 되며, 더 큰(greater) 어려움이 반드시 더 큰(greater) 이점을 낳는다고 가정해서도 안 됩니다. 인지 및 교육 심리학(cognitive and educational psychology) 분야의 많은 연구가 바람직하게 어려운 관행의 사용을 지지하지만, 보건 의료 직종 교육(health professions education) 분야 내에서는 해당 주제에 대한 연구가 덜 수행되었습니다. 보건 의료 전문직 교육(HPE)의 연구자는 다른 모든 분야와 마찬가지로, 조사를 위한 정보를 제공하고 특히 보건 의료 전문직 교육 실무를 위한 권장 사항을 만들기 위해 바람직하게 어려운 관행에 대한 명확한 정의적, 이론적 이해(definitional and theoretical understanding)를 가지고 있어야 합니다.

'논문 읽기 (with AI)' 카테고리의 다른 글

교육과정 연구의 해결책: "우리 기관에서 효과가 있었나?"에서 학술적 대화에 기여하기로의 전환 (Acad Med, 2025) (0)	2026.03.04
객관구조화진료시험(OSCE)이 임상 준비도에 대한 진정성 있는 평가로 경험되는 방식, 이유 및 시기에 대한 실재론적 평가 (Med Teach, 2025) (0)	2026.03.04
정적이고 개인주의적인 주체성 접근을 넘어서: 의학 교육 연구자를 위한 주체성 이론 (AMEE Guide No. 177) (Med Teach, 2025) (0)	2026.02.12
Mixed up: 보건 전문직 교육 혼합 연구 방법 연구에서의 통합(Integration)에 대한 증거 (Adv Health Sci Educ Theory Pract. 2026) (0)	2026.02.05
보건의료전문직교육 연구에서 종단적 질적 연구(LQR)를 수행하는 방법 (Clin Teach. 2025) (0)	2026.02.05

의대에서 교육하고 있습니다.