코로나 대유행의 여파로 변화된 패러다임으로 인해 대부분 온라인 화상회의를 통해 업무를 수행하고 있다. 하지만 이러한 회의에서 생성되는 모든 컨텐츠들을 스트리밍하는데 필요한 요구사항에 대해서는 고려하지 않았을 것이다. 반면 데이터센터 운영자들은 지난 1년 동안 전례 없이 급증하는 비디오 트래픽 처리 방안을 두고 상당한 어려움을 겪었을 것이다.
뿐만 아니라 오늘날 데이터센터는 화상회의와 스트리밍 컨텐츠, 온라인 게임 및 전자상거래와 같은 광범위한 작업부하로 인해 급증하는 비정형 데이터를 처리해야 한다. 이러한 애플리케이션 중 상당수는 지연시간이 매우 중요하며, 끊임없이 진화하는 압축, 암호화 및 데이터베이스 아키텍처 표준에도 적응해야 한다.
이로 인해 데이터센터는 광범위한 작업부하의 까다로운 성능 및 지연시간 요건을 충족하고, 동시에 비용과 전력소모를 최소화하기 위해 인프라 확장이 필요하게 되었다. 하지만 이는 상당히 어려운 일이다. 따라서 데이터센터 운영자는 현재의 아키텍처를 재고하고, 본질적으로 보다 확장 가능한 효율적인 새로운 구성을 모색하는 것이 필요하다.
현재 대부분의 데이터센터는 단일 서버에 SSD, CPU, 가속기 등을 결합한 고정된 형태의 리소스 기반의 랙을 사용하고 있다. 이는 컴퓨팅 및 스토리지 간의 고대역폭 연결을 제공할 수 있지만, 모든 서버의 스토리지와 컴퓨팅 비율이 고정되어 있기 때문에 리소스 활용 측면에서는 매우 비효율적이다. 작업부하에 따라 각기 다른 컴퓨팅과 스토리지 조합이 필요하기 때문에 각 서버에 사용하지 않는 리소스가 발생하게 된다.
리소스 활용도를 높여라, 컴포저블 인프라
리소스 활용도를 크게 향상시킬 수 있는 새로운 아키텍처가 부상하고 있다. 이를 구성 가능한 인프라 즉, ‘컴포저블 인프라(Composable Infrastructure)’라고 한다. 컴포저블 인프라는 리소스를 분리하고, 이를 다시 풀링(Pooling)함으로써 어디서나 액세스할 수 있도록 만든다. 컴포저블 인프라를 사용하면, 적절한 규모의 리소스 만으로 작업부하를 프로비저닝하고, 소프트웨어를 통해 신속하게 재구성할 수 있다.
컴포저블 아키텍처는 CPU와 SSD 및 가속기를 네트워크로 연결하고, 표준 기반 프로비저닝 프레임워크를 통해 제어함으로써 데이터센터의 리소스 효율성을 크게 향상시킬 수 있다. 이러한 아키텍처는 각기 다른 컴퓨팅과 스토리지 및 가속 요건을 가진 각 작업부하에 따라 하드웨어를 낭비하지 않고 리소스를 할당할 수 있다. 이는 이론적으로는 매우 뛰어나 보이지만, 실제로는 한 가지 큰 문제가 있다. 바로 지연시간이다.
리소스가 분리되고, 더 멀리 떨어지게 되면, CPU와 SSD 또는 CPU와 가속기 간의 네트워크 트래픽으로 인해 지연시간이 더 증가하고, 대역폭이 감소하게 된다. 네트워크 트래픽을 줄이고, 리소스를 효율적으로 상호 연결할 수 있는 방법이 없다면, 이는 심각한 제약사항이 될 수 있다.
FPGA는 이러한 지연시간 문제를 해결할 수 있는 3가지 주요 역할을 수행한다. 첫째, FPGA는 각 작업부하에 따라 성능을 극대화할 수 있도록 커스터마이제이션이 가능한 적응형 가속기 역할을 수행한다. 둘째 FPGA는 데이터와 더 근접한 위치에서 컴퓨팅을 수행함으로써 지연시간을 줄이고, 필요한 대역폭을 최소화할 수 있다. 마지막으로 FPGA의 적응 가능한 지능형 패브릭을 통해 과도한 지연 없이 리소스를 효율적으로 풀링할 수 있다.
작업부하 성능 크게 향상
FPGA 기반 컴퓨팅 가속기의 첫 번째 중요한 이점은 최근 증가하고 있는 작업부하에 대한 성능을 크게 향상시킬 수 있다는 점이다. 라이브 스트리밍 애플리케이션을 위한 비디오 트랜스코딩과 같은 적용 사례에서 FPGA 솔루션은 일반적으로 x86 CPU 보다 성능이 30배 뛰어나기 때문에 데이터센터 운영자들이 엄청나게 증가하고 있는 동시 스트리밍을 충족할 수 있도록 해준다.
또 다른 예는 중요한 생명과학과 관련된 유전체 염기서열(Genomic Sequencing) 분야이다. 최근 자일링스(Xilinx®)의 유전체학 분야의 고객은 자일링스의 FPGA 기반 가속기가 CPU 보다 90배 더 빨리 결과를 제공함으로써 의료 연구진들이 이전보다 훨씬 짧은 시간 안에 DNA 샘플을 테스트할 수 있다는 사실을 확인했다.
컴포저블 데이터센터에서 FPGA의 두 번째 중요한 이점은 고정 또는 모션이든 데이터와 근접한 위치에서 적응형 컴퓨팅을 수행할 수 있다는 점이다. SmartSSD 연산 스토리지 장치에 사용되는 자일링스 FPGA는 일반적으로 CPU에서 수행되는 고속 검색 및 파싱, 압축, 암호화와 같은 기능을 가속화한다. 이를 통해 보다 복잡한 작업 수행할 수 있도록 CPU의 부담을 덜어주는 것은 물론, CPU와 SSD 간의 트래픽을 줄여 소요되는 대역폭 및 지연시간을 줄일 수 있다.
또한 자일링스 FPGA는 새로운 자일링스 알베오(Alveo) SN1000과 같은 SmartNIC에도 사용되고 있으며, 와이어 스피드의 패킷 처리와 압축 및 암호화 서비스를 통해 모션 데이터를 가속화하는 것은 물론, 특정 데이터센터나 고객의 스위칭 요구사항도 수용할 수 있다.
미래는 이미 시작되었다
FPGA의 적응형 컴퓨팅 가속 성능과 짧은 지연시간의 연결 기능을 결합하면, 컴포저블 데이터센터에서 한 단계 더 나아갈 수 있다. 적응 가능한 지능형 패브릭으로 상호 연결된 가속기 클러스터에 컴퓨팅 집약적인 작업부하를 할당하면, 온디맨드 방식으로 고성능 컴퓨터를 구현할 수 있다.
물론 최적의 가속 알고리즘을 사용하여 컴퓨팅 가속기와 SmartSSD, SmartNIC을 프로그램할 수 없다면, 이 중 어느 것도 실현될 수 없다. 이러한 작업을 위해 자일링스는 텐서플로우(TensorFlow) 및 FFMPEG과 같은 도메인별로 특화된 업계 프레임워크를 활용한 포괄적인 소프트웨어 스택을 구축하고, 자일링스의 바이티스(Vitis) 개발 플랫폼에서 실행할 수 있도록 지원하고 있다. 또한 레드피쉬(RedFish)와 같은 보다 상위 레벨의 프로비저닝 프레임워크를 통해 지능형 리소스 할당을 지원할 수 있을 것으로 보고 있다.
컴포저블 데이터센터의 가능성은 흥미로운 변화의 시작이며, 자일링스의 디바이스 및 가속기 카드는 이러한 새로운 효율적인 아키텍처의 핵심 빌딩 블록이다. 자일링스는 변화하는 작업부하에 적응할 수 있는 신속한 재구성 능력과 짧은 지연시간 및 유연한 아키텍처를 통해 이러한 발전을 선도하는 기업으로 자리매김하고 있다.
<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>