간밤 뉴욕증시에서 마이크론이 10% 이상 폭락한 데 이어 국내 반도체 투톱도 주가가 크게 하락하고 있습니다.
메모리 사용량을 크게 줄이는 터보퀀트의 충격파가 이어지는 가운데, 중동 전쟁 장기화라는 대외 악재까지 겹쳤기 때문으로 보입니다.
자세한 내용 산업부 홍헌표 기자와 알아보겠습니다.
터보퀀트의 파장이 생각보다 센 것 같군요?
<기자>
최근 반도체 기업의 주가 하락 원인은 크게 3가지로 나눌 수 있습니다.
터보퀀트로 인한 메모리 반도체 성장성 둔화, 수요 둔화와 공급 확대가 엇갈리는 수급 문제, 대외 변수로 인한 빅테크들의 투자 감소로 정리할 수 있습니다.
구글이 지난 25일 공개한 터보퀀트는 AI 모델이 사용하는 데이터를 효율적으로 처리하기 위해 설계된 압축 기술입니다.
구글은 AI 모델의 메모리 사용량을 최대 6분의 1로 줄이고 처리 속도를 8배 향상시킨다고 밝혔습니다.
이 기술이 나오고 과연 상용화가 언제쯤 가능할 것인가에 대한 의견이 분분했는데요,
이번 연구에 공동연구자로 이름을 올린 한인수 카이스트 교수의 이야기 직접 들어보겠습니다.
[한인수 / 카이스트 전자공학부 교수 : 이 기술을 정확히 이해하면 직접 가져가서 AI 모델에 구현하는데 큰 문제가 없습니다. 사전 학습된 LLM 모델에 바로 적용할 수 있는 좋은 장점이 있습니다. 빠른 시일 내에 적용이 돼서 실제 성능이 검증이 될 수 있다고 생각합니다.]
한 교수는 터보퀀트 기술은 곧바로 적용이 가능하다는 입장을 내놨습니다.
<앵커>
터보퀀트가 적용되면 메모리 사용량이 1/6로 줄어든다고 했는데, 이게 AI 모델에서 KV Cache가 1/6로 줄어드는 것이고, 메모리 반도체 수요가 그만큼 감소하는 것은 아니지 않습니까?
<기자>
구글 밝힌 메모리가 1/6로 줄어드는 것은 KV Cache에 해당하는 것이고 우리가 아는 D램, HBM의 수요가 1/6이 되는 것은 아닙니다
제가 KV Cache가 1/6이 되면 GPU 수요에 어떻게 영향을 미치는 지 계산해봤습니다.
AI 모델 마다 차이가 있지만 계산하기 쉽게 메타의 AI 모델 LLaMA 2 70B를 예로 들어보겠습니다.
이 모델에는 엔비디아의 H100 GPU 80GB가 들어갔는데요,
기본 크기가 140GB고, 32K의 컨텍스트(문맥)를 적용하면 KV Cache가 80GB를 차지합니다.
그러면 둘을 더해 총 용량은 220GB로 H100 GPU 80GB 기준으로 3장(240GB)이 필요합니다.
그런데 터보퀀트를 적용하면 KV Cache가 13GB(80/6)로 급감해 총 용량은 153GB로 줄어 80GB GPU가 2장이면 됩니다.
GPU 1장당 동시 처리량은 5~6배 증가하면서도 GPU 1장의 수요가 감소하는 겁니다.
AI 모델마다 쓰는 GPU의 성능과 용량, 또 컨텍스트의 길이가 천차만별이기 때문에 정확한 계산은 어렵습니다.
다만 AI 수요라는 조건이 같다고 놓고 본다면 터보퀀트 적용시 GPU 수요가 대략 20~30% 정도 줄어든다는 설명은 가능합니다.
<앵커>
이렇게 수요가 줄어들 가능성이 높아지는데, 메모리 반도체 회사들은 공급을 늘리고 있지 않습니까? 이 부분 때문에 수요와 공급이 안 맞을 수 있다는 우려도 나오고 있죠?
<기자>
터보퀀트가 당장 적용이 된다면 대용량의 HBM 수요가 줄어들 수 있습니다.
같은 성능의 GPU로도 처리량이 늘어나기 때문에 HBM4가 192GB까지 필요없고, 144GB로도 충분하다는 결론이 나올 수도 있습니다.
물론 제본스의 역설처럼 효율 증가로 비용이 줄어 오히려 수요가 더 늘어날 수도 있습니다.
그만큼 AI 산업에 대한 예측은 어렵습니다.
한인수 교수 역시 연구할 때 메모리 하드웨어까지는 생각하지 못했다며 난색을 표했습니다.
지금 메모리 반도체 3사는 수요가 지속적으로 늘어날 것을 대비해 모두 공장 증설에 속도를 내고 있습니다.
삼성전자는 평택캠퍼스 P5 공장 가동을 앞당기려 하고, SK하이닉스는 내년 상반기 청주 M15X와 용인 클러스터 1기 팹이 본격적으로 가동될 예정입니다.
마이크론 역시 내년 미국 아이다호에 2개의 팹을 가동할 계획입니다.
잇따른 공장 증설로 내년 하반기부터는 공급이 증가할 수 밖에 없는 상황이 됐습니다.
그런데 갑자기 터보퀀트가 등장하면서 예상보다 수요가 적을 수 있다는 전망이 나온 겁니다.
시장에서는 이것을 보고 2~3년 뒤에 반도체 수급이 안 맞는 것 아니냐는 우려를 하고 있다는 분석입니다.
<앵커>
단기적으로는 대외 변수 역시 무시할 수 없습니다. 금리 인상 가능성까지 제기되면서 빅테크들의 투자가 감소할 가능성도 있지 않습니까?
<기자>
중동 전쟁이 장기화 되면서 유가 급등으로 인플레이션 우려가 제기되고 있습니다.
이렇게 되면 전세계적으로 금리를 인하하기 어렵고 오히려 인상 가능성도 있습니다.
금리가 인상되면 기업들의 자본 조달 부담이 자연스럽게 커집니다.
그동안 AI 거품론에도 불구하고 공격적인 투자를 이어갔던 빅테크들이 움츠러들 수 있습니다.
AI 산업을 포함해 전반적으로 보수적인 투자가 진행되면 시장이 예상했던 것만큼 수요가 빠르게 증가하지 않을 수 있습니다.
또 일각에서는 1분기말을 맞아 운용사들이 포트폴리오를 조정한 것도 반도체주가 떨어진 요인이라고 분석합니다.
수익률이 높았던 반도체주를 대거 매도하는 과정에서 낙폭이 커졌다는 설명입니다.
<앵커>
잘 들었습니다.