엔비디아 젠슨 황이 “더 큰 GPU가 필요하다”며 호주머니에서 꺼낸 것은

역대 최대 규모 AI 콘퍼런스 GTC 2024에서 신제품과 함께 AI 비전 밝혀

15년 만에 세계에서 가장 중요한 AI 콘퍼런스로 성장한 GTC가 5년 만에 첫 오프라인 행사로 돌아왔다. 이 행사의 거의 모든 것이 AI와 교차했다고 과언이 아니다.

엔비디아의 창립자 겸 CEO인 젠슨 황(Jensen Huang)이 지난 19일 오전 5시(한국시간) 실리콘밸리 SAP 센터에서 열린 GTC 기조연설 연단에 섰다. 이날 현장에는 11,000여 명이 참석했으며, 수만 명 이상이 온라인 실시간 생중계를 통해 기조연설을 시청했다. 젠슨 황은 주요 발표와 함께 강력한 데모와 세계 최대 기업들과의 파트너십, 그리고 자신의 비전을 자세히 소개했다.

젠슨 황(Jensen Huang), 엔비디아의 창립자 겸 CEO

젠슨 황은 수조 개의 파라미터로 구성된 대규모 언어 모델(LLM)에서 실시간 생성형 AI를 구현해 전 세계 AI 인프라에 대대적인 업그레이드를 제공할 엔비디아 블랙웰 플랫폼을 소개했다. 젠슨 황은 이날 엔비디아 추론 마이크로서비스에 대한 레퍼런스인 엔비디아 NIM을 들고 나와 주목을 끌었다.

이는 개발자가 모든 종류의 맞춤형 AI를 배포할 수 있도록 수억 개의 GPU와 연결해주는 새로운 소프트웨어 패키징이자 제공 방식이다. 엔비디아는 AI를 실제 세계에 접목해 고급 시뮬레이션 기능을 제공하는 옴니버스 클라우드 API(Omniverse Cloud API)를 소개했다.

호퍼 후속작, 블랙웰

젠슨 황은 기조연설을 시작하면서 여러 모델에서 처리 가능하며 다양한 데이터 유형을 처리할 수 있는 멀티모달(multi-modal) AI의 등장으로 AI의 적응력과 성능이 향상됐다고 설명했다. 이러한 모델은 매개변수를 늘림으로써 더 복잡한 분석을 처리할 수 있다. 이는 컴퓨팅 성능에 대한 필요성이 크게 증가한다는 의미이기도 하다. 그리고 이러한 협업형 멀티모달 시스템이 1조 개에 달하는 매개변수로 더욱 복잡해짐에 따라 고급 컴퓨팅 인프라에 대한 수요도 증가한다.

젠슨 황은 “더 큰 GPU가 필요하다”고 말했다. 이를 증명한 플랫폼이 블랙웰이다. 젠슨 황은 주머니에서 블랙웰 칩을 꺼내 호퍼(Hopper) 칩과 나란히 들어보였다. 호퍼가 왜소해 보였다.

블랙웰(Blackwell) 플랫폼

게임 이론과 통계학을 전공한 캘리포니아 버클리 대학교의 수학자이자 흑인 학자로는 최초로 미국국립과학원에 입회한 데이비드 해롤드 블랙웰(David Harold Blackwell)의 이름을 딴 이 새로운 아키텍처는 2년 전 출시된 엔비디아 호퍼 아키텍처의 후속작이다. 젠슨 황은 "업계 전체가 블랙웰을 맞을 준비를 하고 있다. 블랙웰은 엔비디아 역사상 가장 성공적인 출시가 될 것”이라고 말했다.
블랙웰은 훈련용 FP8에서 칩당 이전 세대 대비 2.5배, 추론용 FP4에서는 5배의 성능을 제공한다. 이 제품은 호퍼보다 두 배 빠른 5세대 NV링크(NVLink) 인터커넥트를 갖추고 있으며 최대 576개의 GPU까지 확장할 수 있다.

그리고 엔비디아 GB200 그레이스 블랙웰 슈퍼칩(Grace Blackwell Superchip)은 초당 900 기가바이트(GB) 초저전력 NV링크 칩투칩(chip-to-chip) 인터커넥트를 통해 두 개의 블랙웰 엔비디아 B200 텐서 코어(Tensor Core) GPU를 엔비디아 그레이스 CPU에 연결한다.

최고의 AI 성능을 위해 이날 발표된 GB200 기반 시스템을 최대 800Gb/s의 속도로 고급 네트워킹을 제공하는 엔비디아 퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand)와 스펙트럼-X800 이더넷(Spectrum-X800 Ethernet) 플랫폼과 연결할 수 있다.

“생성형이 바로 미래”

젠슨 황은 "우리가 절약하는 에너지의 양, 절약하는 네트워킹 대역폭의 양, 절약되는 시간의 양은 엄청날 것이다. 생성형이 바로 미래이기 때문에 이 분야는 완전히 새로운 산업이다. 우리의 컴퓨팅 방식은 근본적으로 다르다. 우리는 생성형 AI 시대를 위한 프로세서를 만들었다"고 말했다.

엔비디아는 블랙웰을 확장하기 위해 NV링크 스위치(NVLink Switch)라는 새로운 칩을 개발했다. 이 칩은 초당 1.8테라바이트(TB) 속도로 4개의 NV링크 인터커넥트를 연결하고 네트워크 내 감소를 수행해 트래픽을 제거할 수 있다.

엔비디아 스위치와 GB200은 젠슨 황이 ‘하나의 거대한 GPU’라고 부른 멀티노드의 수냉식 랙 규모 시스템인 엔비디아 GB200 NVL72의 핵심 구성요소이다. 이는 블랙웰을 활용해 단일 랙에서 720페타플롭의 AI 훈련 성능과 1.4 엑사플롭의 AI 추론 성능을 제공하는 조 단위 파라미터 모델을 위한 초강력 컴퓨팅을 제공한다. 그는 60만 개의 부품으로 구성돼 있으며 무게가 3,000파운드(1,360kg)에 달하는 이 장비에 대해 “엑사플롭 장비는 현재 지구상에 두세 대 정도밖에 없다. 그래서 이것은 하나의 랙에 들어 있는 엑사플롭 AI 시스템이다. 이제 그 뒷면을 살펴보자”고 말했다.

엔비디아는 차세대 AI 슈퍼컴퓨터인 엔비디아 GB200 그레이스 블랙웰 슈퍼칩 기반 DGX 슈퍼팟(DGX SuperPOD)도 발표했다. 이 슈퍼컴퓨터는 수조 개의 파라미터 모델을 처리하고 초거대 생성형 AI 훈련과 추론 워크로드를 위한 지속적인 가동 시간을 보장한다.

새로운 고효율 수냉식 랙 스케일 아키텍처를 특징으로 하는 새로운 DGX 슈퍼팟은 엔비디아 DG GB200 시스템으로 구축됐다. 또한 FP4 정밀도에서 11.5 엑사플롭의 AI 슈퍼컴퓨팅과 240테라바이트의 고속 메모리를 제공하며, 랙을 추가하면 더 확장할 수 있다.
업계는 이미 블랙웰을 환영하고 있다고 엔비디아 측은 설명했다.

애플 비전 프로(Apple Vision Pro)에 오픈USD(OpenUSD) 기반의 엔비디아 옴니버스(NVIDIA Omniverse) 엔터프라이즈 디지털 트윈을 구현한다.

이 밖에도 엔비디아는 통신 분야에서 차세대 통신 시대를 앞당기기 위한 생성형 AI와 옴니버스 기반 플랫폼인 엔비디아 6G 리서치 클라우드(NVIDIA 6G Research Cloud)를 발표했다. 이 플랫폼은 엔비디아의 시오나(Sionna) 뉴럴 라디오 프레임워크, 엔비디아 에리얼(Aerial) 쿠다 가속 무선 액세스 네트워크, 6G용 엔비디아 에리얼 옴니버스 디지털 트윈으로 구축됐다.

또한 반도체 설계와 제조 분야에서 젠슨 황은 TSMC, 시놉시스(Synopsys)와의 협력을 통해 엔비디아가 혁신적인 컴퓨팅 리소그래피 플랫폼인 cu리소(cuLitho)의 생산을 시작한다고 발표했다. 이 플랫폼은 반도체 제조에서 가장 컴퓨팅 집약적인 워크로드를 40~60배까지 가속화할 것이다.

젠슨 황은 엔비디아 지구 기후 디지털 트윈(Earth Climate Digital Twin)도 발표했다. 현재 이용 가능한 이 클라우드 플랫폼은 대화형 고해상도 시뮬레이션을 통해 기후와 날씨 예측을 가속화한다. 젠슨 황은 AI의 가장 큰 영향력은 의료 분야에서 나타날 것이라고 말했다. 엔비디아는 이미 영상 시스템, 유전자 염기서열 분석 기기 분야에서 작업 중이며 선도적인 수술 로봇 회사들과 협력하고 있다고 설명했다. 엔비디아는 새로운 유형의 생물학 소프트웨어를 출시한다. 이날 엔비디아는 전 세계 의료 기업이 어디서나 모든 클라우드에서 최첨단 생성형 AI를 활용할 수 있는 20여 개의 새로운 마이크로서비스를 출시했다. 이 서비스들은 고급 영상, 자연어와 음성 인식, 디지털 생물학 생성, 예측, 시뮬레이션을 제공한다.

이날 엔비디아는 엔비디아 옴니버스 클라우드를 API로 제공한다고 발표했다. 이를 통해 산업용 디지털 트윈 애플리케이션과 워크플로우를 제작하는 세계 최고의 플랫폼의 적용 범위를 소프트웨어 제조업체의 전체 에코시스템으로 확장할 것이라고 밝혔다.
또한 애플 비전 프로에 옴니버스를 제공한다. 새로운 옴니버스 클라우드 API를 통해 개발자는 대화형 산업용 디지털 트윈을 VR 헤드셋으로 스트리밍할 수 있게 된다. 마지막으로는 휴머노이드 로봇을 위한 범용 파운데이션 모델 GR00T를 발표했다. GR00T는 로보틱스와 임바디드 AI(Embodied AI)의 혁신을 주도하는 엔비디아의 노력을 더욱 진전시키기 위해 설계됐다.

젠슨 황의 말말말

엔비디아가 엔비디아(NVIDIA) GTC 2024 AI 콘퍼런스에서 AI의 또 다른 도약을 위한 발판을 마련했다.

이번 GTC 2024의 핵심이라 할 수 있는 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)의 개막 기조연설은 행사 전부터 많은 기대를 모았다. 젠슨 황 CEO 기조연설은 3월 19일 화요일 오전 5시(한국 시간 기준) 캘리포니아주 새너제이(San Jose, California)에 위치한 SAP 센터에서 진행됐다. 이날 기조 연설에 나선 젠슨 황 CEO의 주요 발언을 따로 모았다.

젠슨 황 아바타

“가속 컴퓨팅은 변곡점에 도달했으며 범용 컴퓨팅은 한계에 다다랐다. 우리는 계속해서 컴퓨팅 비용을 낮추면서 지속 가능한 방식으로 더 많은 컴퓨팅을 수행할 수 있도록 끊임없이 확장 가능한 컴퓨팅을 위한 새로운 방법이 필요하다. 가속 컴퓨팅은 모든 산업에서 범용 컴퓨팅에 비해 획기적인 속도 향상을 가져온다.”

-강화된 컴퓨팅 성능이 모든 분야에 놀라운 혁신을 가져올 것이라며.

“우리는 더 큰 모델이 필요하다. 이러한 모델은 인터넷의 텍스트뿐 아니라 텍스트와 이미지, 그래프와 차트, 그리고 우리가 TV를 보면서 배웠던 것처럼 수많은 영상을 시청하는 멀티모달 데이터로 훈련시킬 것이다.”

-협업형 멀티모달 시스템이 1조 개에 달하는 매개변수로 더욱 복잡해졌다며.

“이 컴퓨터는 이 작은 공간에 이렇게 많은 컴퓨팅이 들어가는 최초의 컴퓨터다. 메모리 일관성이 있기 때문에 하나의 애플리케이션에서 함께 작동하는 하나의 행복한 가족과 같다."

-시스템이 탑재된 보드를 들어 보이며.

“앞으로 데이터센터는 AI 공장으로 여겨질 것이다. 이들의 목표는 수익을 창출하는 것이며, 이 경우에는 인텔리전스를 창출하는 것이다.”

-차세대 AI 슈퍼컴퓨터 소개하며.

“미래에는 소프트웨어를 어떻게 구축할까? 처음부터 새로 작성하거나 파이썬(Python) 코드 같은 것을 작성하는 일은 거의 없을 것이다. 아마도 AI 팀을 구성할 가능성이 높다."

-소프트웨어를 만드는 새로운 방법에 대하여.

“기업용 IT 업계는 금광 위에 앉아 있다. 그들은 수년에 걸쳐 구축한 놀라운 툴과 데이터를 모두 보유하고 있다. 이 금광을 코파일럿으로 만들 수 있다면, 이는 우리의 업무에 도움을 줄 수 있다.”

-코파일럿은 특정 기업만이 알 수 있는 전문 기술을 모델에 학습시켜 가치 있는 새로운 서비스를 만들 수 있다며.

“로봇이 로봇이 되는 방법을 배울 수 있도록 로봇을 위해 세계를 디지털로 표현하는 시뮬레이션 엔진이 필요하다. 우리는 이 가상 세계를 옴니버스라고 부른다."

-AI의 다음 물결은 실제 세계에 대해 학습하는 AI가 될 것이라며.

“움직이는 모든 것이 로봇이 될 것이다. 컴퓨터 그래픽, 물리학, 인공지능의 교차점이 바로 엔비디아의 핵심이다. 이 모든 것이 지금 이 순간 이루어졌다."

-엔비디아 기반의 소형 로봇 한 쌍을 무대에 올리며.

엔비디아 젠슨 황이 “더 큰 GPU가 필요하다”며 호주머니에서 꺼낸 것은

2024-03-20

신윤오 기자, yoshin@elec4.co.kr