엔비디아 ‘DGX B200’, LLM 실시간 추론 '세계 신기록'...초당 1000 토큰 돌파

메타 '라마 4 매버릭' 모델로 초당 1000토큰 처리 속도 달성
단일 노드에서 대형 언어모델 실시간 구동 가능성 입증
AI 지연 시간 획기적 단축…사용자경험 대폭 개선 '기대'

[더구루=정예린 기자] 엔비디아의 최신 인공지능(AI) 연산 플랫폼 ‘DGX B200’이 초거대 언어모델(LLM) 실시간 추론에서 세계 신기록을 세웠다. AI와 사람 간 대화의 지연 시간이 크게 줄어들면서 본격적인 실시간 AI 시대가 열릴 전망이다.


해당 콘텐츠는 유료 서비스입니다.

  • 기사 전체 보기는 유료 서비스를 이용해주시기 바랍니다. (vat별도)
  • 해당 콘텐츠는 구독자 공개 콘텐츠로 무단 캡처 및 불법 공유시 법적 제재를 받을 수 있습니다.








테크열전

더보기




더구루인사이트

더보기