
[더구루=김예지 기자] SK텔레콤(SKT)이 미국의 고성능 스토리지 전문 기업 DDN(DataDirect Networks)과 협력해 '구독형 GPU(GPUaaS·GPU as a Service)' 상용화를 꾀한다. 엔비디아 B200 그래픽처리장치(GPU) 기반의 국내 최대 규모 GPUaaS '해인(海印) 클러스터'에 적용된 자체 가상화 솔루션 '페타서스(Petasus) AI 클라우드'에 DDN의 병렬 파일 시스템 'EXAScaler'를 통합해, GPU 자원을 클라우드처럼 유연하게 활용할 수 있는 구조를 구현했다. SKT와 DDN은 일본 시장의 고성능 AI 인프라 수요가 높은 기업들을 대상으로 기술 검증을 우선 진행한다. 이후 아시아 시장을 포함한 글로벌 진출 기반을 다질 방침이다.
1일 DDN에 따르면 GPUaaS 상용화는 전 세계적으로 증가하고 있는 GPU 연산 수요와 유연한 소비 모델 요구에 대응하기 위해 기획됐다. 장비를 직접 구매하거나 장기 계약을 체결하지 않아도 필요한 시점에 고성능 GPU 자원을 곧바로 사용할 수 있도록 설계된 것이 특징이다.
스토리지 인프라는 DDN이 제공하고, 운영은 SKT가 통신망 인프라 운영 경험을 기반으로 맡는다. 양사는 이를 통해 기업들이 AI 개발과 학습 환경을 보다 빠르게 구성할 수 있도록 지원한다는 계획이다. 현재 일본을 포함한 해외 시장을 대상으로 개념검증(PoC)을 진행 중이며, 기술적 완성도와 상용화 가능성을 점검하고 있다.
AI 모델의 복잡도와 데이터셋 규모가 커지면서, 기업들은 고성능 GPU 자원에 대한 신속하고 유연한 접근 방식을 필요로 하고 있다. 기존의 장비 구매 및 구축 방식은 속도와 비용 면에서 한계를 드러내고 있다는 평가다.
SKT는 이에 대응해 자사가 보유한 클라우드 자동화와 인프라 운영 노하우를 GPU 인프라에 적용했다. △가상머신(VM) 생성 △워크로드 스케줄링 △리소스 격리 등의 프로세스를 자동화해, 개발자와 데이터팀이 GPU 자원을 빠르게 활용할 수 있는 환경을 구축했다.
GPUaaS 서비스는 높은 가용성과 복원력을 갖춘 '통신사급' 안정성을 기반으로 한다. 여기에 운영 효율성과 예측 가능한 비용 구조까지 더해, 기업 고객의 요구를 충족시키겠다는 전략이다.
스토리지 측면에선 DDN의 엑사스케일러(EXAScaler)가 핵심 역할을 맡는다. 이 시스템은 AI 및 고성능 컴퓨팅(HPC) 워크로드에 최적화된 병렬 파일 시스템으로, 대규모 데이터 처리 과정에서 발생하는 입출력(I/O) 병목을 최소화하는 데 중점을 두고 있다. DDN 측은 EXAScaler가 기존 대비 수백 배 빠른 데이터 접근 속도와 베어메탈 수준의 성능을 구현한다고 밝혔다.
양사의 GPUaaS 솔루션은 △온프레미스 △코로케이션 △하이브리드 등 다양한 구축 방식을 지원한다. 기업은 각자의 성능 요구, 보안 정책, 비용 구조에 맞춰 인프라 환경을 유연하게 선택할 수 있다.