AMD, 컴퓨텍스 2024 개막 기조연설서 인스팅트 GPU 로드맵 공개
  • 2024-06-03
  • 신윤오 기자, yoshin@elec4.co.kr

AI 성능, 메모리 지원 등 연도별 개발 계획 공개

AMD의 리사 수(Lisa Su) CEO는 컴퓨텍스 2024 개막 기조연설에서 AMD 인스팅트(AMD Instinct™) 가속기 제품군의 향후 성장 방향에 대해 공개했다.

AMD는 모든 세대에서 매년 선도적인 AI 성능 및 메모리 용량을 제공하는 다년간의 확장된 AMD 인스팅트 가속기 로드맵을 발표했다.



업데이트된 로드맵은 2024년 4분기에 출시될 새로운 AMD 인스팅트 MI325X 가속기부터 시작된다. 이후, 2025년 출시되는 새로운 AMD CDNA™ 4 아키텍처 기반의 AMD 인스팅트 MI350 시리즈로 이어질 예정이다.

이 제품은 AMD CDNA 3 아키텍처 기반의 AMD 인스팅트 MI300 시리즈에 대비 35배 향상된 AI 추론 성능을 제공할 전망이다. 2026년 출시 예정인 AMD 인스팅트 MI400 시리즈는 AMD CDNA "넥스트(Next)" 아키텍처를 기반한다.

AMD 데이터 센터 가속 컴퓨트 부문의 브래드 맥크레디(Brad McCredie) 부사장은, "AMD 인스팅트 MI300X 가속기는 마이크로소프트 애저(Microsoft Azure), 메타(Meta), 델 테크놀로지스(Dell Technologies), HPE, 레노버(Lenovo) 등 수많은 파트너 및 고객의 선택을 받고 있다. 이는 AMD 인스팅트 MI300X 가속기가 제공하는 뛰어난 성능과 제품 가치로 인한 직접적인 결과이다"라고 설명했다. 그는 또, "업데이트된 제품 개발 계획에 따라, 우리는 AI 업계와 고객이 데이터 센터 AI 훈련 및 추론 분야의 발전을 위해 필요로 하는 선도적인 성능과 기능 제공하고자 지속 혁신해 나갈 예정이다"라고 밝혔다.

AMD 인스팅트 MI325X 가속기

AMD ROCm™ 6 개방형 소프트웨어 스택은 지속적인 발전을 통해 AMD 인스팅트 MI300X 가속기가 가장 널리 사용되는 대규모 언어 모델(LLM)에서 탁월한 성능을 제공할 수 있도록 지원한다. 8개의 AMD 인스팅트 MI300X 가속기와 메타 라마-3(Meta Llama-3) 70B를 구동하는 ROCm 6을 사용하는 서버에서 AMD의 고객은 경쟁사에 대비 1.3배 더 나은 추론 성능 및 토큰 생성 능력을 확보할 수 있다.

또한, ROCm 6이 탑재된 단일 AMD 인스팅트 MI300X 가속기는 미스트랄-7B(Mistral-7B)의 경쟁 제품 대비 1.2배 더 높은 추론 성능과 토큰 생성 처리량을 확보할 수 있다.

AMD는 현재 AI 모델 관련해 가장 크고 폭넓게 사용되는 저장소인 허깅 페이스(Hugging Face)가 현재 AMD 인스팅트 MI300X 가속기에서 신속하게 작동하는지 확인하고자 매일 밤 가장 많이 활용되는 모델 700,000개에 대한 테스트를 실시하고 있다. AMD는 파이토치(PyTorch), 텐서플로우(TensorFlow) 및 JAX와 같은 인기 AI 프레임워크에 대한 업스트림 작업도 지속하고 있다.

HBM3E 메모리와 초당 6테라바이트의 메모리 대역폭 제공

288GB의 HBM3E 메모리와 초당 6테라바이트의 메모리 대역폭을 제공하는 새로운 AMD 인스팅트 MI325X 가속기는 기존 AMD 인스팅트 MI300 시리즈와 동일한 업계 표준 유니버설 베이스보드(Universal Baseboard) 서버 설계를 기반으로 하며, 2024년 4분기에 출시된다. 이 제품은 경쟁사보다 각각 2배, 1.3배 더 많은 업계 최대의 메모리 용량과 대역폭, 경쟁사보다 1.3배 더 높은 컴퓨팅 성능을 제공한다.

AMD 인스팅트 MI350 시리즈의 첫 번째 제품인 AMD 인스팅트 MI350X 가속기는 AMD CDNA 4 아키텍처를 기반으로 하며 2025년에 출시될 예정이다. 이 제품은 다른 MI300 시리즈 가속기와 동일한 업계 표준 유니버설 베이스보드(Universal Baseboard) 서버 설계를 기반으로 한다. 고급 3nm 공정 기술을 바탕으로 FP4 및 FP6 AI 데이터 유형을 지원하며 최대 288GB의 HBM3E 메모리 탑재한다.

AMD 인스팅트 MI400 시리즈 가속기에 활용되는 AMD CDNA "넥스트" 아키텍처는 2026년 출시 예정이며, 추론 및 대규모 AI 훈련을 위한 추가적인 성능 및 효율성을 구현을 지원하는 최신 기능을 제공한다.

<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>


#네트워크   #반도체   #부품   #소프트웨어   #인공지능  

  •  홈페이지 보기
  •  트위터 보기
  •  페이스북 보기
  •  유투브 보기
  • 100자평 쓰기
  • 로그인

세미나/교육/전시
TOP