'TSMC CoWoS 적용' 퓨리오사AI, 차세대 AI 가속기 '레니게이드' 성능 공개

美 반도체 업계 컨퍼런스 '핫 칩스 2024' 참여
AI 가속기 '레니게이드' LLM 실행 데모·성능 발표

[더구루=정예린 기자] 국내 인공지능(AI) 반도체 스타트업 '퓨리오사AI'가 자체 개발한 차세대 AI 가속기 '레니게이드(RNGD)’ 알리기에 나섰다. 우수한 칩 성능을 입증하며 내년 출시 준비에 속도를 낸다.

 

28일 퓨리오사AI에 따르면 회사는 지난 25일(현지시간)부터 사흘간 미국 실리콘밸리에서 열린 반도체 업계 컨퍼런스 '핫칩스(Hot Chips) 2024'에 참여했다. 백준호 퓨리오사AI 대표가 직접 2세대 레니게이드 성능 벤치마크를 발표하고 라이브 데모를 선보였다. 

 

레니게이드는 퓨리오사AI가 신경망처리장치(NPU)를 기반으로 설계한 2세대 AI 가속기다. 올 4월 미국 산타클라라 컨벤션센터에서 열린 'TSMC 2024 테크놀로지 심포지엄'에서 처음으로 실물을 공개한 바 있다. 지난달 일부 고객을 대상으로 조기 샘플링을 개시하고 첫 번째 비공개 데모를 실시했다. 오는 2025년 초 공식적으로 시장에 내놓는다는 계획이다. 

 

추론용 AI 반도체 최초로 4세대 고대역폭메모리(HBM)인 HBM3를 탑재한 것이 특징이다. TSMC의 5나노미터(nm) 공정으로 생산된다. 엔비디아 고성능 그래픽처리장치(GPU) 등에 쓰이는 TSMC의 첨단 후공정 기술 '칩 온 웨이퍼 온 서브 스트레이트(CoWoS)'도 적용됐다. CoWoS는 칩을 겹쳐 공간을 절약하고 소비 전력을 줄이는 동시에 처리능력을 높이는 2.5차원(D) 패키징 기술이다. TSMC가 특허권을 갖고 있다. 

 

엘류서AI와 메타가 개발한 초거대언어모델(LLM) 'GPT-J’와 '라마(Llama) 3.1'를 기반으로 테스트를 수행했다. 단일 칩 당 약 100억 개의 매개변수가 있는 모델에 대해 초당 2000~3000개의 토큰 처리량이 확인됐다. 이밖에 150W의 전력소모량으로 효율성이 뛰어나는 등 전력대비 성능 측면에서 경쟁력을 가지고 있다는 게 퓨리오사AI의 설명이다. 

 

백준호 대표는 "레니게이드는 추론에 대한 업계의 실제적 요구를 충족하는 지속 가능하고 접근 가능한 AI 컴퓨팅 솔루션"이라며 "이제 저희 하드웨어가 고성능으로 LLM을 실행하기 시작하면서 저희는 지속적인 발전의 흥미로운 단계에 접어들고 있다"고 밝혔다. 

 

한편 핫칩스는 1989년 시작돼 매년 8월 실리콘밸리에서 열리는 반도체 컨퍼런스다. 전 세계 반도체 기업와 학계 관계자 500명 이상이 참석해 차세대 기술을 알리고 교류한다. 올해 행사에는 AMD, 인텔, 엔비디아, 퀄컴, IBM, SK하이닉스 등이 참석했다. 컨퍼런스 기간 각 기업 전문가들이 각기 다른 주제로 발표를 진행했다. 










테크열전

더보기




더구루인사이트

더보기