SK하이닉스, 美 에너지부 산하 LANL과 빅데이터·AI 분석 솔루션 개발

美 FMS서 개선된 객체 기반 컴퓨팅 스토리지(OCS) 시스템 시연
작년 '슈퍼컴퓨팅'서 LANL과의 협력 결과물 공개한 바 있어
데이터 분석 성능·신뢰성 개선…실제 데이터 활용·API 다변화

[더구루=정예린 기자] SK하이닉스가 미국 에너지부 산하 로스앨러모스 국립연구소(LANL)와의 기술 파트너십을 강화한다. 차세대 데이터 분석 솔루션을 개발해 인공지능(AI), 고성능 컴퓨팅(HPC) 등 데이터 집약적인 응용처를 위한 첨단 스토리지 생태계를 구축한다. 

 

LANL은 6일(현지시간)부터 사흘간 미국 캘리포니아주 산타클라라에서 열리는 글로벌 메모리 반도체 행사 'FMS 2024'에서 SK하이닉스와의 공동 연구 성과를 공개한다고 발표했다. 양측이 함께 개발한 객체 기반 컴퓨팅 스토리지(OCS) 시스템을 시연한다. 

 

OCS는 데이터 분석 성능을 높여주는 스토리지 장비다. 높은 확장성과 데이터 인식 성능이 특징이다. 기존 데이터 분석을 위해 불러왔던 방대한 데이터를 줄이기 위해 스토리지 자체에서 스스로 데이터를 분석하고 그 결과를 서버에 전송해 데이터 이동량을 최소화한다.

 

SK하이닉스는 작년 미국 콜로라도주 덴버에서 열린 '슈퍼컴퓨팅 2023(Supercomputing 2023)'에 참가해 OCS 시스템을 비롯한 LANL와의 협업 결과물을 선보인 바 있다. 당시 OCS 시스템과 CXL 기반 CMS(Computational Memory Solution)도 전시했었다. CMS는 HPC 물리 서버에 활용되는 응용 프로그램의 성능을 개선하고 에너지 사용량을 줄여주는 솔루션이다. 

 

SK하이닉스와 LANL의 OCS 시스템은 VTK(Visualization Toolkit) 기반 데이터분석·시각화 애플리케이션 ‘파라뷰(ParaView)’를 활용한다. 올해 시연에서는 파라뷰가 OCS 시스템에 쿼리를 푸시해 △비휘발성 메모리 익스프레스(NVME) 스토리지 근처의 데이터 감소 효율성 개선 △적당한 분석 리소스(데스크톱 포함)에서 대규모 데이터 분석 허용 △분석 리소스에서 통찰력 얻는 시간 단축 등의 방법을 선보인다. 

 

작년 대비 데이터 분석 성능과 신뢰성도 대폭 개선했다. 우선 시연에 실제 데이터를 활용했다. 작년 슈퍼컴퓨팅에서는 실험용 데이터를 적용해 테스트했지만 올해는 현존하는 HPC에 쓰이는 워크로드 시스템을 사용해 개선된 성능을 확인했다. 또 테스트에 활용된 분석 도구인 사용자 애플리케이션 프로그래밍 인터페이스(API)를 다변화했다. △덕DB(DuckDB) △파케이(Parquet) △애로우(Arrow) 등이 있다. 

 

SK하이닉스와 LANL은 OCS 시스템이 분석 커뮤니티 생태계를 활용함으로써 표준 HPC 과학 컴퓨팅 분석 도구의 효율성을 높일 수 있을 것이라고 기대하고 있다.

 

류성수 SK하이닉스 HBM사업담당(부사장)은 "OCS 시스템과 같은 데이터 처리에 대한 새로운 접근 방식은 분석 애플리케이션과 스토리지 간의 중복 데이터 전송을 최소화하고 스토리지 소프트웨어 스택을 가볍게 한다"며 "이를 통해 빅데이터 분석, AI 등과 같은 데이터 집약적 애플리케이션의 성능이 가속화된다"고 강조했다. 

 

이어 "LANL의 고성능 컴퓨팅 전문성과 SK하이닉스의 첨단 스토리지 솔루션 간의 긴밀한 협업을 통해 혁신적인 OCS시스템을 개척할 수 있었다"며 "SK하이닉스는 업계 파트너와 협력하여 분석 생태계를 개발하기 위해 노력하고 있다"고 덧붙였다. 










테크열전

더보기




더구루인사이트

더보기