
[더구루=정예린 기자] SK텔레콤이 미국 데이터·스토리지 플랫폼 기업과 손잡고 엔비디아 B200 그래픽처리장치(GPU) 기반 국내 최대 규모 GPUaaS '해인(海印) 클러스터'를 고도화한다. 대규모 인공지능(AI) 모델 학습과 추론 성능을 극대화, 국가 AI 경쟁력 강화와 글로벌 AI 시장에서의 경쟁력 확보에 기여할 것으로 기대된다.
18일 바스트 데이터(VAST Data, 이하 바스트)에 따르면 회사는 최근 SK텔레콤과 해인 클러스터를 기반으로 한 자체 가상화 솔루션 '페타서스(Petasus) AI 클라우드'에 바스트의 AI 운영체제(VAST AI OS)를 통합하는 파트너십을 체결했다. 이를 통해 GPU 자원을 가상화하고 최적화하며, 다양한 AI 워크로드를 효율적으로 처리할 수 있게 됐다.
해인 클러스터는 엔비디아 B200 GPU 1000장 이상을 단일 클러스터로 구성한 국내 최대 규모 GPUaaS(서비스형 GPU)다. 과학기술정보통신부의 'AI 컴퓨팅 자원 활용 기반 강화(GPU 임차 지원)' 사업에 선정돼 국가 AI 파운데이션 모델 개발에도 활용된다. 해인 클러스터 위에서 운영되는 페타서스 AI 클라우드는 GPU 자원을 가상화하고 유연하게 배분해 고객 수요에 맞춰 즉시 분할·재구성할 수 있으며, 다중 테넌트 환경에서도 높은 보안성과 성능을 유지한다.
바스트 AI OS가 페타서스에 통합되면서 해인 클러스터는 기존 베어메탈(서버 자원을 직접 운영하는 전통적 방식) 환경에서 며칠~몇 주 걸리던 GPU 워크로드 구성을 10분 내로 단축할 수 있게 됐다. 동시에 가상화 상태에서도 베어메탈 수준의 성능을 유지하며, AI 모델 학습과 추론을 모두 지원하는 통합 파이프라인 환경이 구축됐다. 단순히 GPU를 많이 확보하는 것만으로는 성능을 끌어낼 수 없지만 바스트 AI OS가 GPU 자원을 효율적으로 분배하고 최대 처리 성능을 유지하도록 조율한다.
SK텔레콤은 바스트와의 협력을 통해 GPU 환경을 수요에 맞춰 즉시 제공할 수 있는 유연성을 확보했다. 연구기관·기업·정부 고객은 지연 없이 대규모 AI 실험을 수행할 수 있으며, 국가 차원에서는 독자적인 AI 인프라 자급 역량을 강화하게 된다. AI 파운데이션 모델 경쟁에서 글로벌 사업자와 대등하게 경쟁할 수 있는 기반을 마련한 셈이다.
이번 파트너십으로 도입된 바스트의 핵심 기술인 '분리형 공유 아키텍처(DASE, Disaggregated and Shared-Everything)'는 기존 AI 인프라에서 병목을 유발하던 데이터 이동·저장 제약을 제거해 GPU 성능을 최대한 활용할 수 있도록 한다. 슈퍼마이크로(HGX 서버 아키텍처)와 결합해 고성능·보안·멀티테넌트 환경을 제공하며, GPU 리소스를 다양한 워크로드에 유연하게 할당할 수 있다. 이 기술 덕분에 AI 모델 학습과 추론에 필요한 데이터 공급 속도가 GPU 연산 속도와 맞춰져 성능 손실 없이 처리된다.
바스트는 2016년 미국 뉴욕에서 설립돼 AI와 데이터 중심 워크로드를 위한 스토리지 및 클라우드 OS를 제공하는 기업이다. 엔비디아 GPU 아키텍처와 호환돼 글로벌 고객사에 대규모 데이터 처리와 AI 워크로드 최적화 솔루션 등을 공급한다. 미국 에너지부, 미 공군, 버라이즌 등을 고객사로 두고 있다.
이동기 SK텔레콤 AI DC 랩장은 "바스트의 통합 아키텍처 덕분에 기존 베어메탈 기반에서 완전 가상화된 상용 AI 클라우드로 전환할 수 있었다"며 "주권형 AI 워크로드를 지원할 수 있는 성능·단순성·유연성을 확보, 한국의 정부, 연구 기관, 기업 AI 고객의 엄격한 요구를 충족하는 GPUaaS 플랫폼을 구축할 수 있게 됐다"고 밝혔다.
써닐 차반 바스트 아시아·태평양지역 부사장은 "초기 논의부터 SK텔레콤은 엔터프라이즈급 가동 시간과 국가 단위 추론 및 학습의 속도와 복잡성에 부합하는 최첨단 인프라가 필요하다는 것이 분명했다"며 "바스트는 데이터 이동, 프로비저닝, 보안 등 기존의 병목 요소들을 제거해 SK텔레콤이 한국에 대규모 속도와 유연성을 제공하는 안전하고 독립적이 AI 인프라를 구축할 수 있도록 지원한다"고 전했다.