슈퍼마이크로, 대규모 GPU 도입 간소화하는 혁신적인 기술 발표해
  • 2022-03-23
  • 박종배 기자, jbpark@elec4.co.kr

슈퍼마이크로컴퓨터(이하 슈퍼마이크로)는 대규모 GPU 도입을 간소화하는 혁신적인 기술을 발표했다. 이는 미래 지향적인 설계로 현재까지 발표되지 않았던 기술을 지원하며, 범용 GPU 서버는 리소스 절약형 서버에서 최고의 유연성을 제공한다.

범용 GPU 시스템 아키텍처는 다수의 GPU 폼팩터, CPU 선택, 스토리지, 네트워킹 옵션을 지원하는 최신 기술을 결합하고 고유한 형태로 구성되며 높은 확장 시스템을 제공한다. 이 시스템은 각 고객의 특정 인공 지능(AI), 머신 러닝(ML), 고성능 컴퓨팅(HPC) 애플리케이션에 최적화될 수 있다. 전 세계 기업은 차세대 CPU 및 GPU를 위한 발열 측면에서 확보한 여유 공간(thermal headroom)이 있는 차세대 컴퓨팅 환경을 위한 새로운 옵션을 요구하고 있다.

]

슈퍼마이크로 찰스 리앙(Charles Liang) 사장 겸 CEO는 “슈퍼마이크로의 범용 GPU 서버는 산업 및 데이터 센터 인프라를 위한 획기적인 기술이다. 슈퍼마이크로는 강력한 모듈식의 미래 지향적인 단일 플랫폼을 통해 CTO와 IT 관리자가 새로운 도입을 계획하는 방법에 대한 기본 규칙을 변경했다. 이는 최고의 가용성을 제공하는 유연하고 혁신적인 시스템 설계이며, 규모에 맞게 신속한 도입을 가능하게 해준다”고 말했다.

범용 GPU 플랫폼은 초기에는 MI250 GPU 또는 엔비디아 A100 텐서 코어(Tensor Core) 4-GPU를 탑재한 3세대 AMD EPYC 7003 프로세서와 AI 액셀러레이터를 탑재한 3세대 인텔 제온 스케일러블 프로세서 및 엔비디아 A100 텐서 코어 4-GPU를 탑재한 시스템을 지원한다. 이 시스템은 최대 700W GPU를 수용할 수 있도록 향상된 열 용량으로 설계되었다.

슈퍼마이크로 범용 GPU 플랫폼은 개방형 표준 설계를 기반으로 광범위한 GPU와 함께 실행할 수 있도록 설계되었다. 범용 베이스보드(Universal Baseboard; UBB) 및 OCP 엑셀러레이터 모듈(OAM)은 물론 PCI-E와 플랫폼 고유의 인터페이스와 같은 합의된 하드웨어 설계 표준 세트를 준수함으로써 IT 관리자는 HPC 및 AI 워크로드에 가장 적합한 GPU 아키텍처를 선택할 수 있다.

이는 많은 기업의 까다로운 요구 사항을 충족하고 GPU 솔루션의 설치, 테스트, 생산 및 업그레이드를 단순화한다. 또한, IT 관리자는 사용자가 가장 적합한 시스템을 이용할 수 있도록 올바른 CPU와 GPU의 조합을 쉽게 선택할 수 있다.

4U 또는 5U 범용 GPU 서버는 UBB 표준과 PCI-E 4.0 뿐만 아니라 곧 출시될 PCI-E 5.0을 사용하는 액셀러레이터에도 사용할 수 있다. 또한, 32개의 DIMM 슬롯과 다양한 스토리지 및 네트워킹 옵션을 사용할 수 있으며 PCI-E 표준을 사용하여 연결할 수 있다. 슈퍼마이크로 범용 GPU 서버는 엔비디아 NVLink 및 AMD xGMI 인피니티 패브릭과 같은 초고속 GPU-GPU 상호 연결을 활용하거나 PCI-E 슬롯을 통해 GPU를 직접 연결하는 SXM 또는 OAM 폼팩터의 베이스보드를 사용하여 GPU를 수용한다. 현재 모든 주요한 CPU 및 GPU 플랫폼이 지원되며 고객에게 정확한 워크로드에 맞는 선택권을 제공한다.

서버는 최대 공기 흐름을 위해 설계되었으며 최대 애플리케이션 성능을 위해 최고 수준의 TDP CPU 및 GPU가 필요한 현재 및 미래형 CPU와 GPU를 수용한다. 또한, CPU 및 GPU는 향상된 냉각 솔루션이 필요하기 때문에 슈퍼마이크로 범용 GPU에서 액체 냉각 옵션을 사용할 수 있다. 모듈식 설계를 통해 서버의 하위 시스템은 경우에 따라 교체 또는 업그레이드가 가능하므로 전체 시스템의 서비스 주기를 연장하고 새로운 세대의 CPU 또는 GPU 교체 시 발생하는 전자 폐기물을 줄일 수 있다.

파레쉬 카리아(Paresh Kharya) 엔비디아 데이터 센터 컴퓨팅 부문 제품 관리 선임 디렉터는 “엔비디아 A100 텐서 코어 GPU는 모든 AI 애플리케이션과 2,700개 이상의 HPC 애플리케이션을 가속화한다. 슈퍼마이크로의 새로운 서버 플랫폼은 엔비디아 A100을 통합하여 HPC, AI 추론, 교육 및 머신러닝을 포함한 광범위한 워크로드에 대해 탁월한 성능과 생산성을 제공할 수 있는 강력한 시스템을 기업에 제공한다”고 말했다.

브래드 맥크레디(Brad McCredie) AMD 데이터센터 GPU 및 가속 프로세싱 사업 부문 부사장은 “AMD는 슈퍼마이크로와 긴밀한 관계를 맺고 있다. AMD는 HPC 산업의 요구와 컴퓨팅 가속 데이터 센터 워크로드에 대한 요구를 해결하는 고급 AMD EPYC CPU 및 AMD 인스팅트(Instinct) GPU 혁신을 보여주는 이상적인 플랫폼이 될 슈퍼마이크로 범용 GPU 시스템을 기대하고 있다”고 말했다.
 

<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>


#스토리지   #네트워크   #반도체   #부품   #소프트웨어  

  •  홈페이지 보기
  • 100자평 쓰기
  • 로그인

세미나/교육/전시
TOP