삼성SDS가 엔비디아의 최신 그래픽처리장치(GPU)인 'B300'을 기반으로 한 클라우드 서비스를 국내 처음 선보였다.
삼성SDS는 자사 클라우드 플랫폼 '삼성 클라우드 플랫폼(SCP)'을 통해 B300 기반 GPU 구독형 서비스(GPUaaS)를 출시했다고 23일 밝혔다.
이번 출시는 기업들이 AI 모델 개발을 넘어 실제 서비스에 적용하는 추론 단계로 진입하면서 증가하는 고성능 컴퓨팅 수요에 대응하기 위한 전략이다.
B300 GPU는 12단 고대역폭메모리인 HBM3E를 탑재해 GPU당 288GB의 메모리 용량과 초당 8TB의 대역폭을 제공한다.
이는 기존 H100 대비 메모리 용량은 3.6배, 대역폭은 2.4배로 향상된 수준이다.
이를 통해 거대언어모델(LLM) 구동 시 연산 속도에 비해 메모리 전송 속도가 느려 발생하는 데이터 병목 현상이 크게 개선됐다.
앞서 삼성SDS는 지난 2021년 A100, 2023년 H100 기반 GPUaaS를 선제적으로 도입한 데 이어 이번 B300 서비스까지 확대했다.
기업 고객은 고용량 메모리를 기반으로 거대 AI 모델을 효율적으로 처리할 수 있으며, AI 에이전트와 이미지·영상·코드 생성 등 고성능 AI 서비스에서 지연 시간을 단축할 수 있다.
또한, 구독형 방식으로 필요한 만큼만 사용하고 비용을 낼 수 있다.
GPU 수급이 어려운 상황에서도 최신 아키텍처를 신속하게 도입할 수 있는 점 역시 장점으로 꼽힌다.
삼성SDS는 올해 3분기에 별도 인프라 비용 없이 사용한 만큼만 비용을 내는 '서버리스 추론 서비스'와 AI 모델을 자동으로 분산 학습시키는 'AI 학습 서비스'도 출시할 계획이다.