AWS 차세대 트레이니엄4 칩, 그래비톤, AWS 니트로 시스템 등 자사 맞춤형 칩에 엔비디아 NV링크 퓨전 통합
엔비디아가 미국 라스베이거스에서 12월 1일(월)부터 5일(금)(현지 시간)까지 열린 AWS 리인벤트(AWS re:Invent)에서 아마존웹서비스(Amazon Web Services, AWS)와 전략적 협력 확대를 발표했다. 양사는 인터커넥트 기술, 클라우드 인프라, 오픈 모델, 피지컬 AI 등 핵심 분야의 최신 기술을 통합해 차세대 AI 혁신 가속화를 추진한다.
이번 협력 확대의 일환으로 AWS는 맞춤형 AI 인프라 플랫폼인 엔비디아 NV링크 퓨전(NVIDIA NVLink Fusion)을 통해 자사의 맞춤형 설계 칩 배포를 지원한다. 여기에는 추론과 에이전트 AI 모델 훈련을 위한 차세대 트레이니엄4(Trainium4) 칩, 광범위한 워크로드를 위한 그래비톤(Graviton) CPU, 니트로 시스템(Nitro System) 가상화 인프라 등이 포함된다.
AWS는 엔비디아 NV링크 퓨전을 기반으로 엔비디아 NV링크 스케일업 인터커넥트와 엔비디아 MGX 랙 아키텍처를 AWS 맞춤형 칩과 결합한다. 이를 통해 차세대 클라우드 규모의 AI 성능을 향상시키고 시장 출시 기간을 단축할 계획이다.
AWS는 NV링크 퓨전을 위한 엔비디아와의 다세대 협력의 첫 단계로, 트레이니엄4가 NV링크와 엔비디아 MGX에 통합되도록 설계하고 있다.
AWS는 이미 엔비디아 GPU를 탑재한 MGX 랙을 대규모로 배포하고 있다. AWS는 NV링크 퓨전 통합을 통해 자사 플랫폼 전반에 걸친 배포와 시스템 관리를 더욱 간소화할 수 있게 된다고 업체 측은 밝혔다.
또한 AWS는 NV링크 퓨전 공급 생태계를 활용할 수 있다. 이 생태계는 랙과 섀시부터, 전원 공급, 냉각 시스템에 이르기까지 전체 랙 규모 배포에 필요한 모든 구성 요소를 제공한다.
엔비디아 베라 루빈(Vera Rubin) 아키텍처는 AWS의 엘라스틱 패브릭 어댑터(Elastic Fabric Adapter, EFA)와 니트로 시스템을 지원하며, 고객들에게 강력한 네트워킹 옵션을 제공하는 동시에 AWS 클라우드 인프라와의 완벽한 호환성을 유지하고 새로운 AI 서비스 출시를 가속화할 예정이다.
엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “GPU 컴퓨팅 수요가 급증하고 있다. 더 많은 컴퓨팅은 더 스마트한 AI를 만들고, 더 스마트한 AI는 더 광범위한 활용을 주도하며, 더 광범위한 활용은 더 많은 컴퓨팅 수요를 만드는 AI의 선순환이 시작됐다"라며 "엔비디아 NV링크 퓨전이 AWS 트레이니엄4에 도입되면서, 엔비디아는 스케일업 아키텍처를 AWS의 맞춤형 칩과 통합해 차세대 가속화 플랫폼을 구축하고 있다"고 밝혔다. 이어 그는 "엔비디아는 AWS와 함께 AI 산업 혁명을 위한 컴퓨팅 패브릭을 만들고 있으며, 이를 통해 전 세계 모든 기업에게 첨단 AI를 제공하고, 세계가 인텔리전스로 나아가는 길을 가속화할 것”이라고 덧붙였다.
AWS의 CEO 맷 가먼(Matt Garman)은 “AWS와 엔비디아는 15년 이상 긴밀히 협력해왔으며, 오늘은 그 여정의 새로운 이정표를 세우는 날"이라며 "AWS는 엔비디아와 함께 대규모 AI 인프라를 발전시켜 고객에게 최고의 성능, 효율성, 확장성을 제공한다"고 밝혔다. 이어 그는 "AWS 트레이니엄4, 그래비톤, 니트로 시스템은 엔비디아 NV링크 퓨전을 통해 고객에게 새로운 기능을 제공하며 그 어느 때보다 빠르게 혁신할 수 있도록 지원할 것”이라고 말했다.
<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>