사피온(SAPEON, 대표 류수정)은 16일 대만 TSMC의 7나노(nm) 공정에서 생산된 데이터센터용 AI 가속기 칩 ‘X330’을 언론에 공개했다.
“사피온은 자동차, 보안, 미디어 등 다양한 분야로 상용 서비스 분야를 지속적으로 확대하고 있습니다." - 사피온 류수정 대표
사피온은 X330이 올해 출시된 경쟁사의 5나노 공정 제품보다 두 배 빠른 추론 성능과 1.3배 이상의 전력효율을 제공한다고 소개했다. 사피온은 주요 고객사를 대상으로 X330 시제품 테스트와 신뢰성 검증을 마치는 대로 2024년 상반기부터 양산을 시작할 계획이라고 밝혔다.
사피온에 따르면, X330은 기존 X220 대비 4배 이상의 연산 성능과 2배 이상의 전력효율을 확보해 대규모 언어 모델(Large Language Model, LLM) 지원에 적합하다.
X330은 4개의 AI 코어와 16개의 RISC-V 기반 CPU가 탑재돼 있다. AI 코어는 64K MXC와 4개의 NVP로 구성돼 있다. 메모리는 SK하이닉스의 GDDR6 D램 8개가 내장돼 있으며, 입출력은 PCIe Gen 5를 지원한다.
사피온 마이클 쉐바노우(Michael C. Shebanow) 최고기술책임자(CTO)는 “내부 분석 결과, 동급 GPU와 비교해 최대 1.9배의 전력 효율을 달성했다.”며 “경쟁사 GPU를 X330 칩으로 교체한다면 소나무 1,180만 그루를 심는 것과 같은 효과를 얻을 수 있다.”라고 말했다.
사피온은 풀스택 접근 방식을 추구한다. X330 장착 서버의 경우, 성능을 최적화할 수 있는 개방형 신경망 교환(Open Neural Network Exchange, ONNX) 기반 소프트웨어 스택을 지원하고 AI 추론 플랫폼 소프트웨어와 소프트웨어 개발 도구(SDK)도 함께 제공한다.
X330은 비디오 코덱과 비디오 후처리 IP를 내장하고 있어 동영상 관련 프로그램의 처리속도를 높여준다. 또한, 내장된 하드웨어 IP를 통해 4채널 4K 60fps 동영상 입력 처리가 가능하다.
이날 사피온은 X330의 차기 제품인 X430(2025년 말 양산 계획)에 고대역폭메모리(HBM)3 D램 탑재와 칩렛 적용을 고려하고 있다고 밝혔다. 칩렛의 경우, 어떤 칩투칩(chip-to-chip) 인터페이스를 가져갈지 고민 중이며 I/O 인터페이스 역시 확장 가능성을 고려해 어떤 프로토콜도 지원하게끔 검토 중이라고 했다. 사피온은 CXL(Compute eXpress Link)을 비롯해 다양한 형태의 인터페이스를 고려하고 있다. 또한, 내년에 자율주행 자동차용 SoC(System on chip) 시장에 X330의 배리언트(Variant)인 AI NPU를 IP(Intellectual Property: 반도체 설계자산)로 선보일 계획이다.
사피온은 지난해 12월 SK브로드밴드 가산 IDC 내에 X220 장착 서버를 사용해 7.6Peta OPS 처리량에 달하는 대규모 NPU Farm을 구축했다. 이를 통해 실제 데이터센터 환경에서 서비스를 상용화하고 운영하는 프로젝트를 추진한 바 있다. 사피온은 NPU Farm 프로젝트를 통해 이미지 분석, 자연어 처리, 화질 개선 등 다양한 분야에서의 상용화 테스트를 성공적으로 수행함으로써, 비즈니스 모델 확대 가능성을 확인했다.
사피온 류수정 대표는 “사피온은 지난 2020년 국내 최초로 데이터센터용 AI 반도체 X220을 발표한 이후 다수의 기반 서비스 제공을 통해 시장 검증을 완료했고 자동차, 보안, 미디어 등 다양한 분야로 상용 서비스 분야를 지속적으로 확대하고 있다. X220의 장점을 극대화한 X330을 통해 AI 서비스 모델 개발 기업과 데이터센터 시장 공략에 박차를 가할 전략이다. 산업 전 분야에서 AI 반도체 활용도를 높여 고도의 AI 기술을 누구나 저렴하게 이용할 수 있게 제공함으로써 모두가 첨단 기술 발전의 혜택을 향유할 수 있는 사회를 만드는 데 공헌하고자 한다.”라고 말했다.
<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>