관광객들이 파리나 로마에 가면 그 찬란한 유산에 감탄하며 꼭 하는 말이 있다. “이 나라 사람들은 조상을 잘 둬서 잘살고 있네.” 그러나 나는 종종 다른 관점으로 자문하곤 한다. “우리 아이들에게는 과연 어떤 유산을 물려줄 수 있을까?” 세계적인 디지털 대전환 시기에 이 질문의 해답을 찾는 것은 우리에게 더욱 중요해졌다.
정부의 ‘디지털 뉴딜’ 사업은 필자의 질문에 구체적 비전과 산업 육성 전략을 제시하고 있다. 특히 디지털 뉴딜의 대표 과제인 ‘데이터 댐’ 사업은 인공지능(AI) 산업 경쟁력 제고를 위한 학습 데이터 구축을 포함해 국가적 디지털 전환을 위한 인프라 및 자산 확보, 그리고 일자리 창출이라는 일석이조 효과를 목표로 하고 있어 눈길을 끈다.
지난 8월 사업 2년차를 맞은 데이터 댐 사업은 한국 AI 산업 발전 기반을 다졌다는 데 그 의의가 있다. AI의 핵심은 바로 데이터다. 무엇이든 척척 해낼 것 같은 AI는 그 시작 단계에서는 신생아와 같다. 아이들이 끝없는 질문과 답변을 통해 성장해 나가듯 AI 또한 데이터에 기반한 지속적인 학습을 통해 완성된다. 따라서 데이터는 AI가 얼마나 똑똑하고 정확해질 수 있는지를 결정하는 가장 중요한 요소다.
우리 산업 규모와 구조를 고려할 때 정부 주도의 데이터 댐 사업 추진은 선택의 여지가 없다. 데이터 자체가 국가 경쟁력을 결정하는 전략적 ‘자산’이기 때문이다. 2년 전 일본의 수출 금지 조치와 올해 요소수 사태를 통해 우리는 기업의 이익 추구만으로는 산업 기반과 글로벌 공급망 확보가 어렵다는 사실을 체감했다. 4차 산업혁명에서 데이터가 갖는 중요성은 그 이상이다. 한국 성장을 견인해 나갈 신산업의 가치사슬은 전적으로 데이터에 달려 있기 때문이다.
데이터 댐 사업을 통해 구축된 대규모 AI 학습용 데이터의 개방과 활용은 디지털 경제 발전 가능성을 실감하게 한다. 6월부터 개방된 5억 건에 달하는 데이터는 11만 건 넘게 이용되며 관련 업계 성장을 촉진하고 있다. AI 학습용 데이터 구축 사업은 데이터의 절대량뿐만 아니라 질적인 면에도 집중했다는 게 돋보인다. 품질 교육, 피드백-보완 프로세스 등 단계별 품질 관리를 거쳐 고품질 데이터를 공급하고 이를 통해 신뢰할 수 있는 국내 공급망을 확보했다는 평가다.
겨울바람보다 차갑게 얼어붙은 구직 시장에서도 가장 위태로운 자리에 있는 경력단절 여성, 장애인, 은퇴자들을 위해 AI 학습용 데이터 구축 과정에서 일자리 사다리를 제공한다. 단순 데이터 레이블링 단계부터 관리자까지 수준별 교육을 제공함으로써 데이터 구축 분야 전문 인력을 확보하는 동시에 일자리도 창출하고 있다.
아이들 교육에는 100년을 바라보는 큰 계획이 필요하다고 한다. 100년 후의 디지털 경제를 바라보는 큰 계획이 바로 디지털 뉴딜과 데이터 댐 사업이라는 생각이다. 물론 여러 도전 과제와 문제들도 남아 있다. 조만간 과학기술정보통신부 주최로 ‘2021년 데이터 진흥주간’ 행사가 열린다. ‘데이터로 이끄는 디지털 대전환, 함께 누리는 대한민국’이라는 주제에 걸맞게 데이터에 대한 비전과 열정, 그리고 많은 기업인과 국민에게 영감을 주는 행사가 되길 기대한다.
뉴스