엔비디아(CEO 젠슨 황)가 미국 라스베이거스에서 열린 세계 최대 IT·가전 전시회 CES 2026에서 엔비디아 블루필드-4(NVIDIA BlueField®-4) 데이터 프로세서가 엔비디아 추론 컨텍스트 메모리 스토리지 플랫폼(Inference Context Memory Storage Platform)을 구현한다고 밝혔다. 이는 차세대 AI를 위한 새로운 등급의 AI 네이티브 스토리지 인프라이며, 엔비디아 블루필드-4는 풀스택 엔비디아 블루필드 플랫폼에 포함된다.
AI 모델이 수조 개의 파라미터와 다단계 추론으로 확장됨에 따라 방대한 양의 컨텍스트 데이터가 생성되고 있다. 이러한 데이터는 정확성, 사용자 경험, 연속성을 좌우하는 키-밸류(key-value, KV) 캐시로 표현된다.

KV 캐시는 다중 에이전트 시스템에서 실시간 추론에 병목 현상을 유발하므로 GPU에 장기간 저장될 수 없다. 따라서 AI 네이티브 애플리케이션은 이러한 데이터를 저장하고 공유할 수 있는 새로운 형태의 확장형 인프라가 필요하다.
엔비디아 추론 컨텍스트 메모리 스토리지 플랫폼은 GPU 메모리 용량을 확장해 컨텍스트 메모리를 위한 인프라를 제공하며, 노드 간 고속 공유를 가능하게 한다. 이를 통해 초당 토큰 처리량을 최대 5배까지 향상시키고, 기존 스토리지 대비 최대 5배 높은 전력 효율을 제공한다고 업체 측은 밝혔다.
엔비디아의 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “컴퓨팅 스택 전체를 혁신하는 AI는 이제 스토리지까지 변화시키고 있다. AI는 더 이상 단순 챗봇에 국한되지 않으며, 지능형 협업자로 진화하고 있다"라며, "즉, 물리적 세계를 이해하고, 장기적 관점에서 추론하며, 사실에 기반해 사고할 수 있다"고 밝혔다. 이어 "또한 도구를 활용해 실제 업무를 수행하며, 장단기 메모리를 모두 유지할 수 있다"라며, "엔비디아와 소프트웨어, 하드웨어 파트너들은 블루필드-4를 통해 차세대 AI를 위한 스토리지 스택을 재정의하고 있다”라고 말했다.
엔비디아 추론 컨텍스트 메모리 스토리지 플랫폼은 KV 캐시 용량을 확대하고 랙 스케일 AI 시스템 클러스터 전반에서 컨텍스트 공유를 가속한다. 또한 멀티턴(multi-turn) AI 에이전트를 위한 지속적인 컨텍스트를 통해 반응성을 개선하고, AI 팩토리 처리량을 증가시키며, 장문 컨텍스트 다중 에이전트 추론의 효율적인 확장을 지원한다.
블루필드-4를 기반으로 조기에 차세대 AI 스토리지 플랫폼을 구축하는 스토리지 혁신 기업으로는 AIC, 클라우디안(Cloudian), DDN, 델 테크놀로지스(Dell Technologies), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE), 히타치 밴타라(Hitachi Vantara), IBM, 뉴타닉스(Nutanix), 퓨어스토리지(Pure Storage), 슈퍼마이크로(Supermicro), 바스트 데이터(VAST Data), 웨카(WEKA) 등이 있다. 블루필드-4는 2026년 하반기에 출시될 예정이다.
<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>












