새로운 알베오 U55C 가속기 카드 출시…쉽게 확장 가능한 클러스터링 지원
사례 #1. 세계 최대 규모의 전파 천문학 안테나 어레이를 보유하고 있는 호주 국립과학산업연구기구(CSIRO). 이 기구가 SKA(Square Kilometer Array) 전파 망원경의 신호 처리를 위해 선택한 것은 자일링스 알베오 U55C 카드이다. HBM과 함께 알베오 카드를 네트워크 연결 가속기로 구축하면, HPC 신호처리 클러스터를 확장하여 대규모 처리량을 달성할 수 있기 때문이다. CSIRO는 알베오 가속기 기반 클러스터를 통해 131,000개의 안테나에서 데이터를 실시간으로 집계하고, 필터링, 준비 및 프로세싱을 위한 방대한 컴퓨팅 작업을 처리하고 있다.
사례 #2. 전세계 거의 모든 자동차 회사에서는 앤시스의 LS-DYNA 충돌 시뮬레이션 소프트웨어를 사용하고 있다. 안전 및 구조 시스템의 설계는 물리적 충돌 테스트 비용을 완화하는 컴퓨터 지원 설계 유한 요소법(Finite Element Method, 혹은 FEM) 시뮬레이션 모델의 성능에 달려 있기 때문이다. FEM 해석은 자유도가 수억 개에 달하는 시뮬레이션을 구동하는 주요 알고리즘이다. LS-DYNA는 다수의 알베오 카드 전반에 걸쳐 하이퍼 병렬 데이터 파이프라이닝으로 확장됨에 따라 x86 CPU에 비해 성능을 5배 이상 가속화할 수 있었다.
네이선 창(Nathan Chang) 자일링스 데이터센터 그룹, HPC 제품 매니저와 알베오 U55C(Alveo U55C) 데이터센터 가속기 카드
사례에서 보는 것처럼 자일링스(Xilinx)는 이번에 출시하는 알베오 U55C(Alveo™ U55C) 데이터센터 가속기 카드가 고성능 컴퓨팅(HPC: High Performance Computing) 및 데이터베이스 작업부하를 위해 탁월한 와트 당 성능을 제공한다는 점을 분명히 했다.
16일 온라인 간담회에 참석한 네이선 창(Nathan Chang) 자일링스 데이터센터 그룹, HPC 제품 매니저는 “HPC가 엑사급 한계를 넘어 발전하기 위해서는 전력소모 문제가 차기 과제로 대두될 것”이라며, “일반적인 HPC 아키텍처는 적정한 와트 당 성능을 제공하는데 어려움을 겪게 된다. 이는 클럭 주기 낭비, 작업량 감소, 전력소모 증가로 이어질 것”이라고 말했다.
이에 새로운 알베오 가속기는 이러한 문제를 해결하는데 중점을 두었다. HPC 및 빅데이터 작업부하를 위해 특별히 구현된 새로운 알베오 U55C 카드는 자일링스 알베오 가속기 포트폴리오 중 가장 높은 컴퓨팅 밀도와 HBM 용량을 제공한다. 알베오 U55C 카드는 낮은 150W의 최대 전력으로 단일 슬롯 FHHL(Full Height, Half Length) 폼팩터로 구현되었다. 이전 제품인 듀얼 슬롯 알베오 U280 카드 대비 두 배에 이르는 16GB HBM2와 탁월한 컴퓨팅 밀도를 제공한다.
또한 대규모 컴퓨팅 작업부하를 처리하는 광범위한 고객들은 새로운 자일링스 RoCE v2 기반 클러스터링 솔루션을 이용해 기존의 데이터센터 인프라 및 네트워크에서 강력한 FPGA 기반 HPC 클러스터링을 구현할 수 있다.
네이선 창 매니저는 이번 발표한 HPC 아키텍처에 대해 “기존의 고객 인프라 및 네트워크 전반에 걸쳐 대규모 스케일아웃(Scale-Out)이 가능한 획기적인 HPC 클러스터링 솔루션”이라며 “애플리케이션 및 클러스터 모두 완벽한 하이-레벨 프로그래밍이 가능하다”고 말했다.
자일링스 스케일 아웃(Scale-Out) 시스템 아키텍처는 기존의 데이터센터 서버 인프라를 이용한 RoCE v2 및 DCBx 기반의 스케일 아웃 아키텍처이다. 비용절감은 물론, 독점 하드웨어가 필요하지 않으며 1,000개 이상의 노드를 확장할 수 있다. 다수의 카드 전반에 걸쳐 작업부하 공유 및 메모리를 공유할 수 있으며 MPI를 통해 노드 전반에 걸쳐 자일링스 적응형 컴퓨팅의 하이퍼 병렬화가 가능하다.
1,000개 이상의 노드 확장 가능해
API 기반 클러스터링 솔루션은 RoCE v2 및 데이터센터 브릿징과 200Gbps 대역폭을 활용한다. HPC 개발자들은 통합 MPI를 통해 자일링스 바이티스(Vitis) 통합 소프트웨어 플랫폼에서 알베오 데이터 파이프라인을 스케일 아웃(Scale-Out)할 수 있다. 서버 플랫폼 및 네트워크 인프라와 공유 작업부하 및 메모리와 상관없이 수백 개의 알베오 카드 확장이 가능해진 것이다.
자일링스는 하드웨어 전문지식이 없는 소프트웨어 개발자와 데이터 과학자들이 적응형 컴퓨팅에 보다 쉽게 접근할 수 있도록 바이티스 개발 플랫폼과 툴 플로우에 상당한 투자를 진행했다. 파이토치(Pytorch) 및 텐서플로우(Tensorflow)와 같은 주요 AI 프레임워크는 물론, C, C++ 및 파이썬(Python)과 같은 하이-레벨 프로그래밍 언어를 지원함으로써 개발자들이 특정 API 및 라이브러리를 사용하여 도메인 솔루션을 구현하거나 자일링스 소프트웨어 개발 키트를 활용하여 기존 데이터센터 내의 주요 HPC 작업부하를 쉽게 가속화할 수 있도록 지원한다.
네이선 창 매니저는 향후 로드맵에 대해 “자일링스는 알베오 가속기에 대한 투자를 계속 늘려가고 있다. 와트당 성능과 전력 효율을 극대화하려는 노력은 지속될 것”이라고 말했다.
<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>