이번 대학수학능력시험에서 한국교육과정평가원은 생명과학Ⅱ 20번 문항의 오류가 명백한데도 인정하지 않고 소송전까지 벌이다가 법원의 판단에 마지못해 굴복했다. 평가원의 ‘교육’이라는 이름이 부끄러운 사태다. 변별에 집착하다 ‘교육평가’를 포기했다. 교육계가 교육의 영역에서 내려야 하는 전문적 판단을 스스로 하지 못하고 법원 판단에 맡기는 전대미문의 수치를 보여줬다.
“해당 문제는 시험문제로서 가져야 할 판단 능력을 상실했다”는 언급이 교육계가 아니라 재판부의 판결문에서 나왔다는 것이 너무 부끄럽다. 평가원은 현실에서 존재할 수 없는 음수(-)의 개체수에 대해 문제 오류는 있으나 문제풀이해서 답을 구하는 데는 문제 없다고 주장했는데, 도대체 교육과 평가의 목적을 무엇으로 보고 있는지 안타깝다.
문제 오류는 있지만 평가 문항으로서 ‘타당성’은 유지된다는 논리. 평가원은 스스로 권위를 무너뜨렸다. 그 문제가 정말 대학 수학 능력을 타당하게 측정하고 있다는 건가? 국가교육과정 철학에 비춰도 전혀 타당하지 않다. 평가원의 대응은 현실에서 말이 안 돼도 일단 기계적 문제풀이만 하면 정답이라고 하고 그 점수를 ‘능력’으로 인정해 대입에서 우선순위로 선발하라는 것이다.
이번 수능 사태는 법, 정치, 정책, 여론 영역이 아니라 그냥 교육의 문제였다. 출제 오류는 실수였다 치자. 그런데 대응 과정은 실수가 아니라 전문성 결여의 민낯을 드러냈다. 도대체 어떻게 구워삶았길래 자문을 의뢰한 학회에서조차 문제풀이에 문제없으니 괜찮다는 결과가 나왔을까. 이 어불성설을 미국 스탠퍼드대 교수조차 지적하고 나섰는데 왜 한국의 교육계와 학계는 침묵하고 있었는지 참담하다. 교육평가의 가장 전문가 집단인 교육계가 판단 능력을 상실해 교육계 밖의 사법부, 언론에서 대신 판단해 주는 것에 끌려간 상황이다. 이 무슨 창피인가.
그런데 이번 사태를 비판하는 언론은 대부분 더 완벽한 수능 출제에 만전을 기하라는 당부 일색이다. 마차에서 자동차로 넘어가는 시대적 전환기에 더 나은 마차를 만들라는 격이다. 교육부 대응도 고작 수능 출제·이의 심사 제도 개선 방안을 마련하겠다는 것뿐이다. 정말 그게 최선인가? 대학수학능력시험이 진정 대학에서 수학할 능력을 재고 있는 건지, 국가교육과정이 목표로 하는 역량을 재고 있는 건지 묻고 싶다. 우리 시험은 무엇을 평가하고 있는가? 선다형 상대평가 체제하에서 오류 없는 출제를 하면 완벽한 평가인가?
현 수능의 가장 근본적인 문제는 국가교육과정에서 기르고자 목표하는 역량을 평가하지 못한다는 점이다. 평가원장 사퇴 반복으로 해결될 문제가 아니다. 경제협력개발기구(OECD) 대다수 국가가 학생 자신의 생각을 꺼내는 전 과목 논술 평가를 하고 있음에도 평가원은 객관식 선다형의 변별력에만 골몰해 왔다. 교육부가 2028 대입부터 적용을 검토하겠다는 논술형 수능에 대해서도 평가원은 공정한 논술 평가가 가능한 선진 입시를 분석해 한국형 모델을 개발할 생각은 하지 않고, 기존 선다형 수능은 그대로 두고 논술 문항 일부 추가하는 방식만 검토하고 있다. 정량평가 전문가들로만 구성된 평가원의 인력 구조로 예견된 결과다.
4차 산업혁명 시대에 맞게 선진화된 논술형 수능을 개발·수행하려면 정성평가 전문성 보강 등 조직 역량에 근본적인 수술이 불가피하다. 차제에 평가원 스스로 양적 평가 프레임을 극복할 평가 혁신의 선봉에 설 수 있도록 기관 쇄신을 해야 한다. 창의융합인재를 기르겠다는 국가교육과정의 목표를 왜 평가 못하는지 분석하고, 어떻게 평가할 수 있는지 모색하며, 공정한 논술 채점에 대한 전문성 보강 등 선제적인 조직 혁신에 나서지 않으면 평가원의 존립 가치는 유지되기 어려울 것이다.
평가되는 역량이 곧 길러지는 역량이다. 변별을 핑계로 엉뚱한 능력을 측정하는 시험은 교육의 이름으로 정당화될 수 없다. 교육을 참칭하는 킬러 문항의 집착에서 벗어나 진정 국가교육과정이 추구하는 역량을 제대로 평가할 수 있는 전문성을 갖추도록 이번 사태가 교육과정평가원 쇄신의 계기가 되길 바란다.
뉴스