슈퍼컴퓨터에 쓰는 연산 전용 가속기 칩을 국내 연구진과 기업이 개발했다. 그동안 전적으로 해외 기업에 의존해온 슈퍼컴퓨터 기술 자립 기반이 처음 마련됐다는 평가가 나온다.
한국전자통신연구원(ETRI)은 슈퍼컴퓨터용 가속기 칩 ‘K-AB21’(사진)을 산학연 협력을 통해 최초로 개발했다고 30일 발표했다. 슈퍼컴퓨터는 인공지능(AI)을 비롯해 우주·항공, 에너지, 바이오 등 미래 첨단 기술을 개발하는 데 필수적인 인프라다. 방위산업 등 국방 안보 기술을 개발할 때도 역할이 급증하고 있다.
슈퍼컴퓨터는 크게 중앙처리장치(CPU), 가속기인 그래픽처리장치(GPU), 메모리, 인터커넥트 네트워크 등이 모인 ‘계산노드’와 이를 구동하는 소프트웨어(SW)로 나뉜다. 전력 공급 장치와 냉각 장치 등도 따로 필요하다. 가속기는 계산노드를 구성하는 가장 핵심 요소다. ETRI 컨소시엄은 K-AB21과 계산노드, 컴파일러 등 SW를 자체 개발했다.
K-AB21은 가로 77㎜, 세로 67㎜ 크기로 대만 TSMC의 반도체 파운드리 12나노 공정으로 만들었다. 가속기 칩에는 범용인 GPU, 추론에 특화된 가속기인 텐서플로(TPU), 사람 뇌 뉴런을 모방한 신경망처리장치(NPU) 등이 있다. K-AB21은 트랜지스터 약 100억 개가 집적된 병렬형 프로세서다. GPU와 구조가 비슷하다. 칩을 구동하는 SW는 한국과학기술정보연구원(KISTI)이 개발했다. 칩 제작은 코스닥 상장사 에이직랜드가 맡았다. 계산노드 1대에는 액체 냉각 시스템을 포함해 K-AB21 칩 2개를 넣을 수 있다.
K-AB21은 소수점이 수시로 변하는 가운데 소수점 아래 51번째까지 사칙연산(부동 소수점 연산)을 한다. 정수로 따지면 40억의 40억제곱 단위라는 어마어마한 숫자의 사칙연산을 처리할 수 있다. 이런 연산을 1초에 8조 번 할 수 있는 8테라플롭스(TF) 성능을 갖췄다. 같은 12나노 공정을 적용한 엔비디아 ‘V100’의 7TF보다 성능이 우수하다. 제작 원가가 훨씬 비싼 4나노 공정을 적용한 엔비디아의 상용 AI 가속기 ‘H100’ 속도가 26TF인 점을 감안하면 ‘슈퍼컴퓨터 불모지’이던 한국으로선 적잖은 성과를 낸 셈이다. 슈퍼컴퓨터 칩을 자체 생산할 수 있는 국가는 현재 미국, 중국, 일본, 프랑스 등 네 곳뿐이다.
K-AB21은 과학기술정보통신부의 ‘초병렬 프로세서 기반 슈퍼컴퓨터 계산노드 개발’ 과제의 지원을 받았다. 2020년부터 5년간 10여 개 산학연이 모여 연구한 결과다. ETRI는 K-AB21과 관련해 국내외 특허 29건을 출원하고 SCI급 논문 15편을 냈다. 데이터센터를 운영하는 대기업 계열 시스템통합(SI) 업체를 비롯해 자율주행차, 로봇, 클라우드 관련 기업에 기술을 이전할 예정이다.
5월 기준 세계에서 가장 빠른 슈퍼컴퓨터는 미국 에너지부(DOE) 산하 오크리지국립연구소가 보유한 ‘프런티어’다. 프런티어를 포함해 이글, 알프스, 리어나도, 서밋 등 10위권 슈퍼컴퓨터 대부분이 엔비디아 또는 AMD의 가속기를 사용한다. 한국에서 가장 빠른 슈퍼컴퓨터는 네이버가 보유한 ‘세종’으로 25위에 이름을 올렸다. 실측 성능 32.97페타플롭스(PF, 1초당 1000조 번 연산)로 엔비디아 가속기 ‘A100’을 넣었다. 컴파일러 등 소프트웨어는 엔비디아의 ‘쿠다(CUDA)’를 쓴다. 실측 성능 25.18PF로 32위에 오른 삼성전자의 SSC-21도 마찬가지로 엔비디아에 계산노드와 SW를 전부 의존하고 있다.
K-AB21 개발 연구를 이끈 한우종 ETRI 슈퍼컴퓨팅시스템연구실 연구위원은 “글로벌 빅테크가 독식하는 가속기 시장에서 독립할 수 있는 계기를 마련했다”고 말했다.
이해성 기자 ihs@hankyung.com