中 딥시크, 'GPU 없어' 1년 동안 허송세월

2026.01.10 07:30:37

화웨이 어센드 칩 기반 시스템, R2 모델 훈련 실패

 

[더구루=홍성일 기자] 전세계에 충격을 주며 등장한 중국의 인공지능(AI) 스타트업 딥시크(Deepseek)가 멈춰버렸다. 지난해 1월 혜성처럼 등장해 엔비디아 등 빅테크의 주가를 폭락시켰던 딥시크가 '컴퓨팅 파워 부족' 문제를 해결하지 못하며 새로운 충격을 만들어내지 못하고 있다는 분석이다. 

 

10일 업계에 따르면 딥시크는 지난해 1월 R1 모델을 출시한 이후 후속 모델을 공개하지 못하고 있다. 딥시크가 지난해 출시한 7개모델은 전부 V3, R1의 업그레이드 모델이었다. 

 

딥시크의 등장은 글로벌 AI 산업계에 충격과 공포를 줬다. 실제로 R1이 출시된 이후 엔비디아의 주가는 하루에만 17%가 폭락했으며 브로드컴, ASML 등도 각각 17%, 7%씩 급락했다. 

 

딥시크가 쇼크를 줬던 이유는 R1이 미국의 최신 모델과 대등하거나 이상의 성능을 보여주면서도 훨씬 적은 비용으로 개발됐다는 점 때문이었다. 당시 미국 빅테크들은 신규 AI모델을 개발하는데 수천억원을 투입했는데, 딥시크는 약 80억원만을 투입해 R1을 만들어냈다. 딥시크가 공개한 자료에 따르면 V3모델의 개발비용은 오픈AI GPT4 개발비용의 18분의 1, 메타 라마3의 10분의 1 수준이었다.

 

AI 산업에 혁신을 가져왔다고 평가받던 딥시크가 1년동안 제품을 선보이지 못하고 있는 배경으로는 컴퓨팅 자원 부족 문제가 꼽히고있다. 

 

 

대표적인 사례가 R2 개발 지연 사태다. 딥시크는 당초 지난해 5월 R2 모델을 공개하려고 했지만 여전히 출시하지 못하고 있다.

 

R2 개발이 지연된 이유는 지난해 8월 전해졌다. 딥시크가 중국 정부의 권고에 따라 도입한 화웨이 어센드(Ascend) 칩의 성능이 문제였다. 딥시크는 화웨이 어센드 칩을 기반으로 한 AI 가속기를 도입해 R2의 훈련을 진행했다. 문제는 화웨이 어센드 시스템이 R2 훈련에 필요한 막대한 연산량을 제대로 처리하지 못했다는 점이다. 당시 보도에 따르면 화웨이 어센드 시스템은 단 한 번의 학습 사이클도 완료하지 못했다. 화웨이는 딥시크에 전담 엔지니어팀을 파견하는 등 적극적인 지원에 나섰지만 기술적인 문제를 해결하는데 실패했다.

 

결국 딥시크는 R2의 학습은 엔비디아 칩, 추론은 화웨이 어센드 칩을 활용하는 것으로 전략을 수정했다. 하지만 딥시크가 보유하고 있는 엔비디아 칩도 고급 모델을 학습시키기에는 부족한 모습을 보였고 계속해서 개발이 지연될 수 밖에 없었다. 

 

딥시크도 최근 공개한 논문을 통해 이 부분을 인정했다. 딥시크 측은 "고급 모델을 구축하려면 그만큼의 컴퓨팅 자원이 필요하다"며 "제미나이3와 같은 첨단 모델에 비해 자사의 모델이 한계를 가지고 있다"고 설명하기도 했다.

 

업계는 미국 정부가 엔비디아 H200 등의 중국 수출 허용한 만큼 올해는 반격이 시작될 가능성이 높다고 전망했다.

 

업계 관계자는 "딥시크가 최근 AI모델 개발 효율성을 높이는 새로운 논문을 발표했다"며 "컴퓨팅 자원도 추가로 확보할 길이 열린만큼 제2의 딥시크 쇼크가 발생할 수 있다"고 말했다.

홍성일 기자 hong62@theguru.co.kr
Copyright © 2019 THE GURU. All rights reserved.