[더구루=홍성일 기자] 애플이 엔비디아와 거대언어모델(LLM) 추론 성능 향상을 위해 협력한다. 과거 좋은 파트너 관계였던 애플과 엔비디아가 인공지능(AI) 시대에서 예전처럼 좋은 시절을 함께 보낼 수 있을지 관심이 집중되고 있다. [유료기사코드] 20일 업계에 따르면 애플은 엔비디아와 협력해 그래픽처리장치(GPU)에서 리커런트 드래프터(Recurrent Drafter, 이하 리드래프터)를 텐서RT-LLM(TensorRT-LLM) 추론 가속 프레임워크에 통합했다. 텐서RT-LLM은 엔비디아 GPU에서 LLM의 추론 성능을 최적화하는데 사용되는 오픈 소스 라이브러리다. 이번 협력은 애플의 LLM 추론 성능 강화 연구 과정에서 진행됐다. 애플이 엔비디아 GPU에 통합한 리드래프터는 올해 초 공개됐으며 현재는 오픈소스로 제공되고 있다. 애플에 따르면 리드래프터는 새로운 추측 디코딩 접근 방식이다. 추측 디코딩은 프로세서가 명령어를 실행하기 전 미리 다음 명령어를 예측해 디코딩하는 것이라고 정의된다. AI모델에서도 LLM의 추론 속도를 높이기 위해 초안모델(draft model)을 만들고 다음에 올 가능성이 높은 토큰을 예측하고 이를 밑그림 삼아 빠르게 텍스트를 생
[더구루=홍성일 기자] 일본 인터넷서비스 기업 라쿠텐(Rakuten)이 일본어 최적화 인공지능(AI) 모델을 선보였다. 라쿠텐은 새로운 AI모델을 기반으로 일본 내 AI 서비스 확대에 속도를 낸다. [유료기사코드] 라쿠텐은 18일 일본어에 최적화된 새로운 거대언어모델(LLM) '라쿠텐 AI 2.0'과 소형언어모델(SLM) '라쿠텐 AI 2.0 미니'를 공개했다. 라쿠텐은 두 모델을 내년 봄까지 오픈 소스 커뮤니티에 공개, AI 애플리케이션 개발을 지원할 것이라고 설명했다. 라쿠텐 AI 2.0은 지난 3월 출시된 라쿠텐 AI 7B 모델을 기반으로 8x7B MoE(Mixture of Experts) 기반 모델이다. 8x7B MoE는 70억개 매개변수를 가진 8개의 전문화 카테고리로 구성된 모델이라는 뜻으로, 추론 및 학습 중에는 8개 카테고리 중 특정한 카테고리만 활성화 돼 프롬프트를 처리한다. 라쿠텐은 입력된 토큰을 가장 관련성이 높은 두 카테고리에 전달돼 처리되는 방식으로 작동한다고 설명했다. 라쿠텐 AI 2.0 미니는 15억 개 매개변수를 기반 라쿠텐 최초의 SLM이다. 라쿠텐은 라쿠텐 AI 2.0 미니가 일본어 생성 부문에서 높은 성능과 정확성을 보여줬다
[더구루=홍성일 기자] 대만 미디어텍(MediaTek)이 내주 중국에서 개최되는 행사에서 차세대 플래그십 애플리케이션 프로세서(AP)를 출시할 것이라는 주장이 제기됐다. [유료기사코드] 19일 업계에 따르면 미디어텍은 오는 23일(현지시간) 중국에서 새로운 디멘시티 칩을 공개한다. 미디어텍은 어떤 칩이 공개될지는 공개하지 않았다. 업계에서는 차세대 AP '디멘시티 8400'이 공개될 것으로 전망하고 있다. 중국 유명 IT 팁스터인 디지털 챗 스테이션(数码闲聊站)은 지난 11일 웨이보를 통해 "디멘시티 8400은 12월 23일 출시 예정"이라고 밝혔다. 디지털 챗 스테이션에 따르면 디멘시티 8400은 TSMC 4나노미터(nm) 공정에서 생산되면 3.25GHz 코어 1개, 3.0GHz 코어 3개, 2.1GHz 코어 4개로 구성된다. 그래픽처리장치(GPU)는 임모탈리스-G720 MC7이 탑재된다. 디지털 챗 스테이션이 공개한 정보 중 가장 눈길을 끈 것은 안투투 벤치마크 점수다. 안투투 벤치마크는 반도체 성능을 수치화 한 것으로, 디지털 챗 스테이션은 디멘시티 8400의 안투투 벤치마크 점수가 180만점을 넘었다고 소개했다. 이는 갤럭시S24 울트라 등에 탑재된
[더구루=홍성일 기자] 일론 머스크 테슬라 최고경영자(CEO)가 2030년까지 뉴럴링크(Neuralink)를 통해 100만명 이상의 사람들에게 뇌-컴퓨터 인터페이스(BCI) 칩을 이식하겠다는 계획을 밝혔다. 일론 머스크는 BCI 칩의 성능도 기하급수적으로 향상될 것이라고 주장해 눈길을 끌고 있다. [유료기사코드] 19일 업계에 따르면 머스크는 엑스(X, 옛 트위터)를 통해 "입출력 비트 전송 속도와 이식 환자 수가 5년 이상에 걸쳐 기하급수적으로 증가할 것"이라며 "추측으로는 2030년까지 입출력 비트 전송 속도(I/O Bit rate) 1Mbs, 이식 환자는 100만 명 이상이 될 것"이라고 말했다. 머스크의 발언은 미국 밴처캐피탈(VC) 알티미터(Altimeter)의 투자자인 아푸르브 아그라왈(Apoorv Agrawal)의 뉴럴링크 분석에 대한 답변이었다. 아푸르브 아그라왈은 "뉴럴링크는 2020년대 가장 중요한 회사"라며 "뉴럴링크의 기술이 수백만명의 독립성을 회복시키는 혁명을 일으킬 것"이라고 극찬했다. 그러면서 뉴럴링크의 BCI 임플란트 장치인 'N1'의 전송속도에 대한 분석을 게재했다. 아푸르브 아그라왈이 공개한 자료에 따르면 현재 N1 임플란트가
[더구루=홍성일 기자] 구글 양자컴퓨팅 칩 '윌로우(Willow)'가 공개되며 양자컴퓨터에 대한 관심이 커지고 있다. 관련 업계에서는 윌로우가 양자컴퓨터가 실용적인 계산 도구로 발전하는데 중요한 이정표가 될 것이라는 기대감을 표하고 있다. [유료기사코드] 18일 업계에 따르면 구글이 지난 10일 공개한 윌로우는 최강의 슈퍼컴퓨터인 프런티어로 10자년(10의 24제곱)이 걸리는 계산을 5분 이내에 수행하는 등 양자컴퓨터 기술 개발의 신기원을 열었다는 평가를 받았다. 윌로우가 높은 평가를 받는 것은 물리적 큐비트의 오류를 획기적으로 줄이는데 성공했기 때문이다. 양자컴퓨터는 0과1이 중첩된 큐비트를 기반으로 작동한다. 중첩을 기반으로 하다보니 전통적인 컴퓨터보다 특정분야에서 최대 30조배까지 빠른 연산이 가능하다. 문제는 중첩상태로 인해 작은 잡음에도 오류를 발생시킨다는 것. 오류는 큐비트가 늘어날 수록 오류도 늘어난다. 잡음에는 소리, 중력파 등 각종 파장 등이 포함된다. 잡음으로 인해 큐비트가 불안정해지면 양자컴퓨터도 제대로 사용할 수 없게 된다. 이에 양자컴퓨터 개발에 필수 기술로 뽑히는 것이 '양자 오류 정정(Quantum error correction,
[더구루=홍성일 기자] NHN의 일본 클라우드 자회사인 'NHN테코라스'가 클라우드 사용 비용 최적화를 지원하는 서비스를 선보였다. NHN테코라스는 인공지능(AI), 디지털 전환 등으로 클라우드 사용량이 늘어나고 있는 기업 시장 공략에 속도를 높인다. NHN테코라스는 17일 클라우드 비용 최적화(FinOps) 툴 '클라우드 일루미네이터(Cloud illuminator)'를 정식 출시했다고 밝혔다. NHN테코라스가 클라우드 일루미네이터를 개발한 것은 기업의 클라우드 이용량이 증가하고 있기 때문이다. 기업의 클라우드 이용량이 늘어나는 것은 디지털 전환과 생성형 AI 등 첨단 기술 수요가 확대되고 있는 것이 원인이다. 여기에 많은 기업에서 클라우드가 엔지니어 부서에 집중돼 있어 비용 관리를 위한 체계를 갖추지 못한 것도 FinOps 툴 개발 필요성으로 강조돼 왔다. NHN테코라스는 클라우드 일루미네이터를 이용해 기업들의 클라우드 사용량을 정확하게 측정해 적절한 과금 모델을 선택할 수 있도록 지원한다. NHN테코라스는 FinOps 툴을 활용해 클라우드 비용을 최적화하면 관련 지출을 최대 30% 줄이는 것이 가능하다고 설명했다. NHN테코라스는 "클라우드 일루미네이터
[더구루=홍성일 기자] 사티아 나델라(Satya Nadella) 마이크로소프트(MS) 최고경영자(CEO)가 엑스박스(Xbox)에 대한 기대감을 전했다. 콘텐츠와 운영 방식을 두고 다양한 목소리가 나오는 상황에서 MS의 향후 엑스박스 전략에 대한 궁금증이 더욱 커지게 하고 있다. [유료기사코드] 18일 업계에 따르면 사티아 나델라 CEO는 연례 주주총회에 참석해 "장기적으로 인공지능(AI) 혁신, 클라우드 혁신, 콘솔 혁신, PC 혁신을 통해 모든 게이머가 즐길 수 있는 최고의 게임을 만들 수 있다고 생각한다"고 밝혔다. 이어 그는 "우리는 게임의 즐거움을 모든 곳에 가져가자고 생각했다"며 "'This is an Xbox' 광고 등을 통해 모든 디바이스에서 엑스박스를 즐길 수 있다는 점을 강조하고 있다"고 덧붙였다. 사티아 나델라 CEO의 발언을 두고 업계에서는 다양한 분석이 나오고 있다. 일부에서는 이번 발언을 두고 독점 콘텐츠를 중심으로 하는 '퍼스트파티 전략'을 포기하고 엑스박스 게임패스, 엑스박스 클라우드 게이밍 등 구독 서비스 확대에 집중, 플랫폼을 뛰어넘는 생태계를 확장하겠다는 뜻을 밝힌 것이라고 전망하기도 했다. 엑스박스 게임패스는 월 구독료를 내
[더구루=홍성일 기자] 인공지능(AI) 반도체 설계전문(팹리스) 기업 '퓨리오사AI' 백준호 대표가 2세대 AI 반도체 '레니게이드(RNGD)'를 앞세워 글로벌 AI 칩 경쟁이 도전할 것이라는 포부를 밝혔다. 대만 IT전문매체 디지타임즈아시아는 16일(현지시간) 백 대표와의 인터뷰를 보도했다. 백 대표는 디지타임즈아시아와의 인터뷰를 통해 퓨리오사AI의 시작, AI 가속기 기술력, 국제 협업 등에 대한 의견을 전했다. 그는 2017년 퓨리오사AI 설립 당시부터 데이터센터를 위한 AI추론 인프라 구축을 목표로 칩 설계에 집중했다. 퓨리오사AI는 2021년 1세대 칩을 개발했고 높은 MLperf 벤치마크 점수를 기록했다. MLperf는 개방형 엔지니어링 컨소시엄 'ML커먼스(MLCommons)'에서 공개하는 벤치마크 점수다. MLperf는 기계 학습을 뜻하는 머신러닝(Machine Learning)과 성능을 의미하는 퍼포먼스(Performance)를 합친 단어다. 1세대 모델의 높은 평가에 힘입어 대규모 투자를 유치하는데 성공한 퓨리오사AI는 2세대 칩 개발에 나섰다. 지난 8월 퓨리오사AI는 2세대 AI 반도체 '레니게이드'를 공개하는데 성공했다. 레니게이드는
[더구루=홍성일 기자] 마이크로프로세서의 시대를 연 인텔8080 프로세서가 출시 50주년을 맞이했다. 인텔은 8080프로세서 출시 50주년 특별 전시회 등을 개최하는 등 기념행사를 진행하고 있다. [유료기사코드] 인텔은 16일(현지시간) '8080프로세서 출시 50주년을 기념하다'는 제목의 글을 홈페이지에 게재하고, 8080프로세서 출시 50년주년 기념 전시를 캘리포니아 산타클라라에 위치한 인텔 박물관에서 진행하고 있다고 밝혔다. 인텔 8080프로세서는 1974년 출시됐다. 인텔은 8080프로세서 출시 전까지만 하더라도 기업들의 요청에 따라 맞춤형 칩을 제공하는데 집중하고 있다. 대표적인 것인 4004와 8008이다. 4004는 부시컴 141-PF 인쇄 계산기용으로 개발됐으며 8008은 컴퓨터 터미널 코퍼레이션의 데이터포인트 2200 프로그래밍 가능 단말기용으로 설계됐다. 8080프로세서는 시마 마사토시, 페데리코 파진 등이 주도해 개발한 8비트 마이크로프로세서다. 초당 29만번의 연산이 가능하며 40핀으로 구성돼 18핀으로 구성된 8008보다 다른 구성 요소에 쉽게 연결될 수 있었다. 특히 4004, 8008로 나눠져있던 기능을 통합해 범용 마이크로프로세서
[더구루=홍성일 기자] 네이버의 일본 비즈니스 그룹웨어 플랫폼 기업인 라인웍스(LINE WORKS)가 새로운 지역 거점을 마련했다. 라인웍스는 신규 사무실을 거점 삼아 이용자 지원 서비스를 강화한다. 라인웍스는 16일 나고야 영업소를 신설했다고 밝혔다. 라인웍스 나고야 영업소는 나고야시 나카무라구 메이에키 위워크 JR 센트럴 타워즈 50층에 위치했다. 라인웍스 나고야 영업소는 시부야 본사를 포함해 일본 내 4번째 지역 거점 역할을 수행한다. 라인웍스는 나고야 영업소를 앞세워 일본 중부 지역 기업들에 대한 지원을 강화하고 신규 사업 확대를 가속한다. 라인웍스는 새로운 영업소를 앞세워 제조업 중심 도시인 나고야의 신규 노동자 부족, 고령화 문제 해결에 일조한다는 계획이다. 한편 라인웍스 가입자는 2024년 1월 기준 총 46만개 회사다. 라인웍스는 내년 초부터 인공지능(AI) 관련 기능도 대거 도입할 예정이다. 라인웍스는 클라우드, AI를 기반으로 사업 영역을 빠르게 넓혀갈 것으로 전망된다.
[더구루=홍성일 기자] 일론 머스크의 xAI에 이어 미국 반도체기업 브로드컴도 100만장 인공지능(AI) 가속기가 탑재된 하이퍼스케일 데이터센터 건설을 발표하고 나섰다. AI기술 발전 속도에 따라 컴퓨팅 인프라 발전 속도도 빨라지고 있는 모양새다. [유료기사코드] 17일 업계에 따르면 브로드컴은 지난 12일(현지시간) 4분기 실적을 발표하며 "대형 클라우드 기업 3곳과 AI반도체를 개발 중"이라며 "2027년까지 구글, 메타, 바이트댄스 등이 100만 확장형 처리 장치(Extensible Processing Unit, XPU)를 탑재한 AI 슈퍼컴퓨터를 구축할 것"이라고 밝혔다. XPU는 다양한 종류의 프로세서들을 포함하는 개념으로 AI프로세서가 대표적이다. 브로드컴은 3개 회사와 협업으로 2027년까지 최대 900억 달러(약 130조원) 매출을 올릴 것으로 전망했다. 이에 브로드컴의 주가가 급등, 시가총액 1조달러 클럽에 가입했다. 브로드컴 외에도 100만장 규모 데이터센터를 구축하려는 곳은 일론 머스크의 xAI다. xAI는 현재 미국 테네시주 멤피스에 '콜로서스'라는 현존 최강 AI슈퍼컴퓨터를 가동하고 있다. 콜로서스는 그래픽처리장치(GPU) 성능면에서
[더구루=홍성일 기자] SK텔레콤(이하 SKT)이 미국 기업용 인공지능(AI) 솔루션 구축기업 펭귄 솔루션스(Penguin Solutions) 투자를 마무리했다. SKT는 이번 투자로 북미 기업용 AI 데이터센터 시장에서 영역을 확대할 수 있을 것으로 기대된다. 펭귄 솔루션스는 16일(현지시간) SKT의 2억 달러(약 2900억원) 규모 전략적 투자를 완료했다고 밝혔다. SKT는 지난 7월 펭귄 솔루션스의 전신인 스마트 글로벌 홀딩스(SMART Global Holdings, SGH)와 투자 계약을 체결한 바 있다. 펭귄 솔루션스는 1988년 설립된 데이터센터 솔루션 기업이다. 펭귄 솔루션스는 기업들을 AI 가속기 솔루션은 물론 고성능 컴퓨팅(HPC), 클라우드 서비스를 제공하고 있다. 펭귄 솔루션스는 지난 10월 15일 기존 SGH라는 사명에서 펭귄 솔루션스로 리브랜딩을 진행했다. 펭귄 솔루션스는 맞춤형 컴퓨팅 솔루션 제공에 집중하고 기존 SGH 발광다이오드(LED)칩 사업부인 크리 LED도 독자적으로 사업을 영위할 것이라고 밝힌 바 있다. 이번 투자는 SKT가 펭귄 솔루션스의 전환우선주 20만 주를, 주당 1000달러에 인수하는 형태로 진행됐다. SKT는
[더구루=홍성환 기자] 미국 전기차 제조업체 루시드(Lucid Group)가 약 1조5000억원 규모로 전환사채를 발행한다. 최대 주주인 사우디아라비아 국부펀드 공공투자기금(PIF)이 이를 지원할 전망이다. [유료기사코드] 루시드는 3일 최대 10억 달러(약 1조4600억원) 규모로 2030년 만기 전환선순위채권Convertible Senior Notes)을 발행할 계획이라고 밝혔다. 선순위전환채권은 약정 시점이나 투자자 전환권 행사 시점에 주식으로 전환, 원금을 상환받을 수 있는 채권이다. 다만 일반 전환사채(CB)와 달리 전환 가격이 정해져 있지 않다. 루시드의 선순위전환채권 발행과 관련해 PIF 자회사인 '아야르서드 컴퍼니'가 특정 투자자와 선불 선도 계약을 체결할 예정이다. 이는 미래 보유 주식 매각을 담보로 미리 자금을 조달하는 방법이다. PIF는 루시드의 지분 60%를 보유한 최대 주주이다. 2022년 12월 15억 달러, 2023년 5월 18억 달러를 지원한 데 이어 작년에도 3월 10억 달러, 8월 15억 달러의 유동성을 공급했다. <본보 2024년 8월 6일자 참고 : 사우디 국부펀드, 루시드에 '2조' 자금 투입> 루시드는 또 작
[더구루=홍성일 기자] 구글이 인공지능(AI) 수요 급증에 따라 엔비디아 AI칩 추가 조달에 나섰다. 구글의 AI칩 추가 조달이 'AI반도체 수요 고점론'을 약화시킬 것이라는 분석이다. [유료기사코드] 3일 경제전문매체 디 인포메이션에 따르면 구글은 AI 데이터센터 임대기업 코어위브(CoreWeave)와 엔비디아 블랙웰(Blackwell) AI칩 임대를 위한 사전 논의를 진행하고 있다. 상세한 조달 규모는 공개되지 않았다. 구글이 코어위브와 협상에 나선 배경에는 AI 수요 급증이 있다는 분석이다. AI관련 수요가 빠르게 증가하는데 맞춰 데이터센터 인프라를 설치하기 위해 서버 임대를 선택했다는 것. 코어위브는 미국 전역에 32개 데이터센터를 구축했으며 탑재된 엔비디아 그래픽처리장치(GPU)는 25만 장이 넘는다. 특히 이번 계약으로 AI칩 수요 고점론이 약화될 것으로 보인다. AI칩 수요 고점론은 지난달 28일(현지시간) 코어위브 기업공개(IPO) 결과가 기대에 못미치면서 고개를 들었다. 당초 코어위브는 주당 공모가를 47~55달러로 목표했지만 시장의 미온적 반응에 공모가격을 40달러 낮췄다. 지난해 매출의 62%를 담당한 마이크로소프트(MS)가 미국 내 AI