엔비디아가 Vera CPU를 앞세워 데이터센터 CPU 시장에 본격 진입한다. 회사는 Vera CPU가 본격 생산에 들어갔으며, OpenAI, SpaceX, Anthropic, Oracle 등 주요 AI 기업에 초기 시스템을 공급했다고 밝혔다.
NVIDIA’s Vera CPU is in production for agentic AI and inference workloads, with standalone CPU revenue projected near $20 billion as the company targets a new $200 billion CPU market beyond GPUs.

Vera는 Rubin 플랫폼을 구성하는 핵심 CPU이자, 엔비디아가 처음으로 독립형 CPU 시장을 겨냥해 내놓는 제품이다. Arm 기반 커스텀 Olympus 코어 88개를 탑재했으며, 176스레드, 1.2TB/s LPDDR5X 메모리 대역폭, 최대 1.5TB 시스템 메모리 구성을 지원한다.
엔비디아는 Vera를 에이전트형 AI와 추론 워크로드에 최적화된 CPU로 설명한다. 주요 역할은 오케스트레이션, 툴 호출, 강화학습 워크로드, 데이터 분석, 에이전트 샌드박싱, 장문맥 상태 관리 등이다. 기존 범용 서버 CPU가 코어 임대 중심 경제성에 맞춰 설계됐다면, Vera는 AI 에이전트가 작업을 빠르게 완료하도록 데이터 처리와 메모리 효율에 초점을 맞췄다.
성능 목표도 공격적이다. 엔비디아는 Vera가 기존 x86 기반 CPU 대비 코어당 성능 1.5배, 와트당 성능 2배, 랙당 밀도 4배를 제공한다고 설명했다. 이는 AI 데이터센터에서 전력, 공간, 냉각 제약이 커지는 상황에 대응하기 위한 설계다.
Vera는 네 가지 방식으로 활용된다. 첫 번째는 Vera Rubin 랙의 호스트 CPU다. Rubin GPU 4개와 Vera CPU 2개가 결합되는 구조로, 대규모 AI 랙에서 GPU를 조율하는 역할을 맡는다. 두 번째는 독립형 CPU다. 세 번째와 네 번째는 CX9와 결합해 스토리지, 보안, 컴퓨트 격리, 기밀 컴퓨팅 용도로 쓰이는 구성이다.
엔비디아가 제시한 200억달러 매출 전망은 Vera 전체가 아니라 독립형 CPU만을 기준으로 한 수치다. 회사는 Vera가 2,000억달러 규모의 신규 시장을 열 수 있다고 보고 있으며, 올해 단독 CPU 매출만으로도 인텔 Xeon과 AMD EPYC을 넘어설 수 있다는 자신감을 드러냈다.
다만 공급 제약은 가장 큰 변수다. 젠슨 황 CEO는 Vera Rubin 수명주기 내내 공급이 수요를 따라가지 못할 가능성이 크다고 밝혔다. 특히 Vera는 LPDDR5X 메모리에 크게 의존하는데, AI 슈퍼사이클로 LPDDR5X 수요가 급증하면서 메모리 공급망 부담이 커지고 있다.
Groq 3 LPX에 대해서는 제한적인 역할을 예상했다. 젠슨 황 CEO는 LPX가 낮은 지연시간과 높은 토큰 생성률에 특화된 SRAM 기반 LPU지만, 처리량과 모델 크기 수용 능력, 장문맥 처리 능력이 제한적이라고 평가했다. 따라서 프리미엄 토큰 서비스처럼 특정 수요가 있는 영역에서는 의미가 있지만, 범용 AI 인프라 시장에서는 당분간 틈새 제품에 머물 것으로 봤다.
Vera는 엔비디아의 사업 영역을 GPU 중심에서 CPU, 메모리, 네트워크, 스토리지, 보안까지 확장하는 핵심 제품이다. 에이전트형 AI 확산으로 CPU 수요가 다시 부상하는 가운데, 엔비디아는 Rubin GPU와 Vera CPU를 결합한 랙 스케일 플랫폼으로 AI 데이터센터 시장 지배력을 더 넓히려 하고 있다.

