NVIDIA presenta una nueva GPU diseñada para una inferencia de contexto largo

En la cumbre de infraestructura de IA el martes, Nvidia anunció una nueva GPU llamada el rubin cpxdiseñado para ventanas de contexto mayores de 1 millón de tokens.
Parte de la próxima serie de Rubin del gigante de chips, el CPX está optimizado para procesar grandes secuencias de contexto y está destinado a usarse como parte de Un enfoque de infraestructura más amplio de “infraestructura de inferencia desagregada”. Para los usuarios, el resultado será un mejor rendimiento en tareas de contexto largo como la generación de videos o el desarrollo de software.
El ciclo de desarrollo implacable de Nvidia ha resultado en enormes ganancias para la compañía, lo que trajo $ 41.1 mil millones en ventas de centros de datos en Su trimestre más reciente.
El Rubin CPX está programado para estar disponible a fines de 2026.