La nueva GPU de Rubin CPX de Nvidia ofrece 30 Petaflops Compute y 128 GB de memoria para inferencia

- NVIDIA anuncia Rubin CPX GPU con memoria de 128 GB construida para cargas de trabajo de IA empresariales
- Vera Rubin NVL144 CPX Rack ofrece 8 ExaFlops Compute y 100TB Memoria rápida
- Envíos planeados para finales de 2026 con Rubin Ultra y Feynman ya en hoja de ruta
Nvidia ha anunciado una nueva GPU construida en la arquitectura de Rubin y diseñada para cargas de trabajo de IA de contexto largo.
Rubin CPXcomo se sabe, incluye 128 GB de memoria GDDR7, lo que la convierte en la primera GPU de la compañía a esa capacidad.
Hubo rumores de una tarjeta de juego RTX de 128 GB, pero esto es 100% no eso. Esta GPU es un motor de cómputo dirigido a la inferencia en áreas como el desarrollo de software, la investigación y la generación de videos de alta definición. No se ejecutará Metal Gear Solid Delta: Snake Eater en cualquier momento pronto.
Vera Rubin NVL144 CPX Rack
La GPU ofrece hasta 30 petaflops de NVFP4 calcula e integra la aceleración de atención de hardware que NVIDIA dice que es tres veces más rápido que el GB300 NVL72.
También incorpora cuatro unidades NVENC y cuatro NVDEC para acelerar los flujos de trabajo de video.
Como parte del impulso más amplio de NVIDIA hacia la inferencia desagregada, Rubin CPX está diseñado para manejar la fase de contexto de cómputo, mientras que otras tareas de generación de GPU de Rubin y CPU de VERA abordan.
Al concentrar Rubin CPX en las tareas de procesamiento de contexto, NVIDIA tiene como objetivo mejorar el rendimiento al tiempo que reduce los costos de implementación de inferencia de alto valor.
El software Dynamo de Nvidia administrará cosas detrás de escena, entregando transferencias de caché de baja latencia y enrutamiento entre componentes.
El modelo de implementación más grande de la compañía es el Vera Rubin NVL144 CPX Rack. Cada unidad integra 144 GPU de Rubin CPX, 144 GPU de Rubin y 36 CPU de Vera.
Juntos entregan 8 exafultos de computa NVFP4, 100TB de memoria de alta velocidad y 1.7pb/s de ancho de banda de memoria.
Quantum-X800 Infiniband o Spectrum-X Ethernet con supernics ConnectX-9 proporciona la conectividad.
Los envíos de Rubin CPX y los bastidores NVL144 CPX se encuentran actualmente a finales de 2026, después de la reciente cinta adhesiva en TSMC.
La hoja de ruta de Nvidia incluye a Rubin Ultra, ahora esperado en 2027, y Feynman, programado para 2028.
Esos diseños extenderán la arquitectura de Rubin con módulos de mayor densidad, memoria HBM4E y redes más rápidas.
A través de Videocardz