서울대에서 강의할 때 간혹 학생들이 성적에 이의를 제기하러 찾아오곤 했다. 모두 논술형 과제·시험이었는데, 왜 충분한 점수를 받지 못했는지 설명해도 수긍하지 못하는 일이 많았다. 하루는 성심껏 설명하기를 포기하고 그냥 수강생 전체 평균과 최고 점수가 몇 점인데 당신의 점수가 몇 점이라고 했더니 놀랍게도 바로 수긍하는 것이었다. 학생은 그 점수가 어떻게 나왔는지 묻지도 않고 그냥 자기 점수의 상대적 위치만 보고 인정했다.
객관식 상대평가 점수는 대다수가 이의를 제기하지 않고 쉽게 받아들인다. 시험문제에 불공정 요소가 곳곳에 숨어 있어도 여전히 그것이 가장 공정하다고 믿는다. 대다수 시험문제의 형태는 ‘다음 중 가장 적절한 것은?’이다. 누군가가 정해놓은 가장 적절한 것이 맥락에 따라 적절하지 않을 수도 있음을 끊임없이 생각해낼 줄 알아야 하는 인공지능 시대인데도 이런 시험문제의 타당성에는 일단 눈을 감는다. 논·서술 시험일 경우 생길 채점의 공정성에 대한 불신 자체가 없어서이기 때문일 것이다. 그러면 선진국들은 몇십만 명의 전 과목 논·서술 대입 평가에서 어떻게 채점의 공정성을 확보할까. 마침 이를 확인할 기회가 생겼다.
지난 7월 제주교육청과 대구교육청이 국제바칼로레아(IB)의 한국어화 협약을 IBO(IB본부)와 공식 체결한 뒤 IBO가 주관한 교사연수가 지난 20~22일 한국에서 최초로 열렸다. 인천 채드윅국제학교에서 사흘간의 전일 워크숍으로 진행된 교사 연수에는 초·중·고 대상 43개 강좌에 전 세계 교사 700여 명이 참여했고 한국 교사들은 몇몇 교육청에서 250여 명이 참가했다.
IB는 국제적으로 공신력을 인정받고 있는 전 과목 토론, 논·서술 중심의 교육과정 및 대입시험이다. 한국 참여자 대부분은 입문 단계인 1단계 연수를 선택했는데, 필자는 가장 고난도라 하는 3단계 지식론(TOK: theory of knowledge) 평가 연수에 참여했다. 도대체 정답이 없어 보이는 에세이를 어떻게 공정하게 채점하는지, 글로벌 표준 채점기준이 궁금했기 때문이다.
지식론은 수능처럼 외부 평가되는 과목이다. 대입 시험문제는 제출 마감 수개월 전에 주어진다. 6개의 질문 중 하나를 골라 1600단어 이내의 에세이를 써서 제출하는 것이다. 프랑스 바칼로레아는 철학 교과가 필수인데, IB는 철학이 선택인 대신 지식론이 필수다. 교과 공부에 매몰되지 말고 교과에서 한 발 물러나 우리가 공부하는 대상인 지식의 본질이 무엇인지, 우리는 안다는 것을 어떻게 아는지 등 지식과 공부에 대해 메타인지하고 성찰하는 것을 정규 교육과정에 포함시킨 것이다. 우리 교육에서는 볼 수 없는 독특한 과목이다.
연수에서는 여러 에세이를 나눠주고 각자 채점해보게 했다. 이번 연수에서 다룬 기출문제들은 다음과 같다.
‘지식의 역사적 발전에서 핵심적인 사건들은 항상 그 시대의 기준으로 평가돼야 하는가?’
‘어떤 것을 설명하는 것과 묘사하는 것은 분명히 다르다는 주장에 얼마나 동의하는가?’
‘현재의 지식은 전적으로 과거의 지식에 의존한다는 주장을 두 가지 다른 지식 영역에서 논하라.’
우리 교실에 있던 15명 중 필자를 제외한 모두가 외국 IB 학교의 지식론 교사였다. 전공 교과는 역사, 수학, 과학, 문학 등 다양했다. 참여자 모두 각자 채점을 해봤는데 놀랍게도 대부분 점수가 비슷했다. 대다수 채점 결과가 IBO 수석채점관의 최종 점수와 동일했다. 다른 참석자들처럼 지식론 평가기준표에 익숙하지 않은 필자는 그냥 십수 년간 해온 학술지 논문심사 기준으로 평가했다. 그런데도 채점 결과는 매번 수석채점관의 최종 점수와 일치했다.
채점 결과에서 약간의 차이를 보인 참석자들도 연수에서 지속적으로 채점 연습을 하고 최종 점수와 비교해 토론하면서 채점 안목이 표준화되도록 훈련했다. 실제 채점에서는 답안지 사이에 기채점된 스파이 답안지가 무작위로 들어가 있어 채점에 차이를 보이는 것을 걸러낸다. 획일화된 객관성은 없지만 각자의 주관이 연수와 교차채점을 통해 집단지성으로 수렴되면서 객관화돼갔다. 이것이 전 과목 논술 대입을 치르는 유럽 전역이 채점의 공정성을 확보하는 방식이다. 우리라고 못할 이유가 있을까.