크라우드스트라이크, 우버, 줌 등 글로벌 리더와 협력해 AI 에이전트 개발
엔비디아가 글로벌 최대 컴퓨터 그래픽 콘퍼런스인 시그라프(SIGGRAPH)에서 추론 기능을 갖춘 2개의 모델 제품군인 엔비디아 네모트론(NVIDIA Nemotron)과 엔비디아 코스모스(Cosmos)의 확장을 발표했다.
캡제미니(Capgemini)에 따르면 AI 에이전트는 2028년까지 매출 증가와 비용 절감을 통해 최대 4,500억 달러의 가치를 창출할 것으로 예상된다. 이러한 에이전트를 개발하는 개발자들은 AI 에이전트 플랫폼과 피지컬 AI 시스템을 개선하기 위해 성능이 더 우수한 추론 모델을 활용하고 있다.
업계 선도 기업들은 AI 에이전트와 휴머노이드 로봇을 통해 생산성을 높이는 데 엔비디아의 확장된 모델 제품군을 활용하고 있다. 크라우드스트라이크(CrowdStrike), 우버(Uber), 마그나(Magna), 넷앱(NetApp), 줌(Zoom)이 그 대표적인 기업들이다.
새로운 엔비디아 네모트론 나노 2(Nemotron Nano 2)와 라마 네모트론 슈퍼 1.5(Llama Nemotron Super 1.5) 모델은 과학적 추론, 수학, 코딩, 툴 호출, 명령어 준수, 채팅 분야에서 해당 크기 범주 내 최고 정확도를 제공한다. 이 새로운 모델은 AI 에이전트가 더 깊이 생각하고 효율적으로 작업할 수 있도록 지원한다. 이를 통해 더 폭넓은 옵션을 탐색하고, 연구 속도를 높이며, 설정된 시간 내에서 더 우수한 결과를 제공한다.
모델은 AI 에이전트의 두뇌와 같다. 핵심 지능을 제공하는 것이다. 그러나 이 두뇌가 비즈니스에 유용하려면 특정 워크플로우뿐 아니라 산업과 비즈니스 용어를 파악하고 안전하게 작동하는 에이전트에 탑재돼야 한다. 엔비디아는 선도적인 라이브러리와 AI 블루프린트(AI Blueprint)를 제공해 기업이 AI 에이전트를 대규모로 도입하고 맞춤화하며 관리할 수 있도록 지원한다.
코스모스 리즌(Cosmos Reason)은 피지컬 AI 애플리케이션을 위해 개발된 새로운 추론 비전 언어 모델(vision language model, VLM)이다. 이는 구조화된 추론을 통해 물리학, 객체 영속성, 시공간 정렬과 같은 개념을 이해하는 데 탁월하다.
코스모스 리즌은 로봇 비전언어행동(vision language action, VLA) 모델의 추론 기반 구조로 설계됐으며, 로보틱스와 자율주행 차량을 위한 훈련 데이터의 평가와 캡션 생성에 활용된다. 또한 공장이나 도시와 같은 환경에서 물리적 작업에 대한 시공간 이해와 추론 능력을 런타임 시각 AI 에이전트에 제공한다.
네모트론, 엔터프라이즈 AI 에이전트 위한 최고 수준의 정확도와 효율성 제공
기업들은 복잡한 다단계의 작업에 대응하기 위해 AI 에이전트를 개발하고 있다. 이에 따라 강력한 추론 정확도와 효율적인 토큰 생성을 제공하는 모델은 지능적이고 자율적인 의사결정을 대규모로 수행하고 있다.
엔비디아 네모트론은 선도적인 모델과 엔비디아가 선별한 오픈 데이터세트 그리고 첨단 AI 기술을 활용해 AI 에이전트에 정확하고 효율적인 출발점을 제공하는 고급 오픈 추론 모델 제품군이다.
최신 네모트론 모델은 세 가지 방식으로 업계 최고의 효율성을 제공한다. 새로운 하이브리드 모델 아키텍처, 소형 양자화 모델 그리고 토큰 생성 과정을 개발자가 제어할 수 있는 구성 가능한 사고 예산(thinking budget)이다. 이를 통해 추론 비용을 약 60% 절감할 수 있다. 이 조합은 모델이 더 깊이 추론하고 더 빠르게 응답할 수 있도록 하며, 추가적인 시간이나 컴퓨팅 파워를 요구하지 않는다. 즉, 더 낮은 비용으로 더 나은 결과를 제공하는 것이다.
코스모스 리즌, 피지컬 AI에 혁신 가져오다
VLM은 컴퓨터 비전과 로보틱스 분야에서 혁신을 가져오며, 기계가 사물과 패턴을 식별할 수 있도록 했다. 그러나 비추론 VLM은 현실 세계를 이해하고 상호작용하는 능력이 부족하다. 이는 곧 모호하거나 새로운 상황을 처리하지 못하고, 복잡한 다단계 작업을 해결할 수 없다는 것을 의미한다.
엔비디아 코스모스 리즌은 피지컬 AI와 로보틱스를 위해 설계된 새로운 개방형 맞춤화 가능 70억 파라미터 추론 VLM이다. 코스모스 리즌은 로봇과 비전 AI 에이전트가 사전 지식, 물리학 이해, 상식을 활용해 실제 인간처럼 물리적 세계를 이해하고 행동할 수 있도록 한다.
코스모스 리즌은 로보틱스와 피지컬 AI 애플리케이션 전반에 걸쳐 고급 기능을 제공한다. 여기에는 훈련 데이터 평가와 캡션 생성, 로봇 의사결정, 영상 분석 AI 에이전트 구축 등이 있다.
이 모델은 방대하고 다양한 훈련 데이터세트의 큐레이션과 주석 작업을 자동화해 고정밀 AI 모델 개발을 가속화할 수 있다. 또한 새로운 환경에서도 복잡한 지시를 실행 가능한 단계로 해석해 VLA 모델에 전달하는 고급 추론 엔진으로 작동해 로봇 계획 수립을 지원할 수 있다.
<저작권자©스마트앤컴퍼니. 무단전재-재배포금지>