Cursor, una plataforma de codificación de IA de San Francisco de la startup Anysphere valorado en 29.300 millones de dólareslanzado Compositor 2Un nuevo modelo de codificación interna ahora está disponible en el entorno de codificación de IA de su agente y ofrece puntos de referencia dramáticamente mejorados con respecto al modelo interno anterior.
También está lanzando y haciendo Compositor 2 rápidouna variante más cara pero más rápida, la experiencia predeterminada para los usuarios.
Aquí está el desglose de costos:
-
Patrón de compositor 2: $0,50/$2,50 por 1 millón de tokens de entrada/salida
-
Compositor 2 Rápido: a $1,50/$7,50 por 1 millón de tokens de entrada/salida
Esa es una gran caída con respecto al modelo interno predecesor del Cursor, Compositor 1.5, febreroque cuesta 3,50 dólares por millón de tokens de entrada y 17,50 dólares por millón de tokens de salida; Composer 2 es aproximadamente un 86% más barato en ambos aspectos.
Composer 2 Fast también es aproximadamente 57% más barato que Composer 1.5.
También hay descuentos por “precios de lectura de caché”, es decir, enviar algunos de los mismos tokens en un mensaje nuevamente al modelo, a $ 0,20 por millón de tokens para Composer 2 y $ 0,35 por millón para Composer 2 Fast, frente a $ 0,35 por millón para Composer 1.5.
También es importante que parezca una versión nativa de Cursor, no un modelo independiente ampliamente distribuido. En el anuncio de la empresa y la documentación del modelo, Composer 2 se describe como disponible en Cursor, ajustado para el flujo de trabajo del agente Cursor e integrado en la pila de herramientas del producto.
Los materiales proporcionados no indican disponibilidad separada a través de plataformas de plantillas externas o como API de propósito general fuera del entorno de Cursor.
Cursor está lanzando codificación a largo plazo, no solo mejores conclusiones
La afirmación técnica más profunda de esta versión no es sólo que Composer 2 obtiene una puntuación más alta que Composer 1.5. Es solo que Cursor dice que el modelo es más adecuado para la codificación de agentes a largo plazo.
En su blog, Cursor afirma que las mejoras en la calidad provienen de su primera ejecución continua de preentrenamiento, lo que le dio una base más sólida para el aprendizaje por refuerzo a escala. A partir de ahí, la compañía afirma que entrenó a Composer 2 en tareas de codificación de largo plazo y que el modelo puede resolver problemas que requieren cientos de acciones.
Este marco es importante porque aborda uno de los mayores problemas sin resolver en la codificación de IA. Muchos modelos son buenos para la generación de código aislado. Muchos menos siguen siendo confiables en un flujo de trabajo más largo que incluye leer un repositorio, decidir qué cambiar, editar múltiples archivos, ejecutar comandos, interpretar fallas y continuar hacia un objetivo.
La documentación de Cursor refuerza que este es el caso de uso que le interesa. Describe Composer 2 como un modelo de agente con una ventana contextual de 200.000 tokens, optimizada para el uso de herramientas, ediciones de archivos y operaciones de terminal dentro de Cursor.
También destaca técnicas de formación como el autoresumen para tareas de larga duración. Para los desarrolladores que ya utilizan Cursor como entorno principal, este ajuste más estricto puede ser más importante que una afirmación genérica en la tabla de clasificación.
Las ganancias de referencia son sustanciales, incluso si GPT-5.4 todavía lidera un gráfico importante
Los resultados publicados de Cursor muestran una clara mejora con respecto a los modelos Composer anteriores. La compañía enumera Composer 2 en 61.3 en CursorBench, 61.7 en Terminal-Bench 2.0 y 73.7 en SWE-bench Multilingual.
Esto se compara con Composer 1.5 en 44.2, 47.9 y 65.9, y Composer 1 en 38.0, 40.0 y 56.9.
El lanzamiento es más mesurado que el de algunos modelos porque el Cursor no pretende tener un liderazgo universal.
En Terminal-Bench 2.0, que mide qué tan bien un agente de IA realiza tareas en interfaces de línea de comandos estilo terminal, GPT-5.4 sigue liderando con 75,1, mientras que Composer 2 obtiene 61,7, por delante de Opus 4.6 con 58,0, Opus 4.5 con 52,1 y Composer 1.5 con 47,9.
Esto hace que el discurso de Cursor sea más pragmático y posiblemente más útil para los compradores. La compañía no dice que el Composer 2 sea el mejor modelo en absoluto. Se dice que el modelo ha pasado a un nivel de calidad más competitivo, al tiempo que ofrece una economía más atractiva y una integración más estrecha con los productos que los desarrolladores ya utilizan.
Cursor también ha incluido un gráfico de rendimiento versus costo en su suite de evaluación comparativa CursorBench que parece diseñado para presentar un argumento al estilo de Pareto a favor de Composer 2.
En este gráfico, Composer 2 presenta un punto de costo-rendimiento más sólido que Composer 1.5 y se compara favorablemente con las configuraciones de mayor costo de GPT-5.4 y Opus 4.6 mostradas por Cursor. El mensaje de la compañía no es simplemente que Composer 2 obtiene una puntuación más alta que su predecesor, sino que puede ofrecer un equilibrio más eficiente entre costo e inteligencia para el trabajo diario de codificación dentro de Cursor.
Por qué el punto “cursor bloqueado” es importante para los compradores
Para los lectores que decidan utilizar Composer 2, la cuestión más importante puede no ser sólo el rendimiento comparativo. Podría serlo si quieren un modelo optimizado para la propia experiencia del producto Cursor.
Este podría ser un punto fuerte. Según la documentación, Composer 2 puede acceder a la pila de herramientas del agente Cursor, incluida la búsqueda de código semántico, búsqueda de archivos y carpetas, lecturas de archivos, ediciones de archivos, comandos de shell, control del navegador y acceso web.
Este tipo de integración puede ser más valioso que la calidad del modelo en bruto si el objetivo es completar tareas de software reales en lugar de producir respuestas únicas e impresionantes.
Pero también reduce el público objetivo. Los equipos que buscan un modelo que puedan implementar ampliamente en una variedad de herramientas y plataformas externas deben reconocer que Cursor presenta Composer 2 como un modelo para los usuarios de Cursor, no como un modelo base independiente y disponible de forma generalizada.
Panorama general: el cursor está presentando un argumento operativo
La importancia de Composer 2 no es que Cursor haya tomado repentinamente el primer lugar en todos los puntos de referencia de codificación. No fue así. El punto más importante es que Cursor presenta un argumento operativo: su modelo está mejorando, su precio es lo suficientemente bajo como para fomentar un uso más amplio y su nivel más rápido tiene suficiente capacidad de respuesta como para que la empresa se sienta cómoda convirtiéndolo en el estándar a pesar del mayor costo.
Esta combinación puede resonar en los equipos de ingeniería a los que les importa menos el prestigio del modelo abstracto y más si un asistente puede seguir siendo útil durante largas sesiones de codificación sin volverse prohibitivamente costoso.
El cursor es más ancho. estructura de precios ayuda a enmarcar la presión competitiva que rodea este lanzamiento. En su página de precios actual, Cursor ofrece un nivel Hobby gratuito, un Plan Pro de $20 por mes, Pro+ por $60 al mesy Ultra por $200 al mes para usuarios individuales, con niveles más altos que ofrecen más uso en todos los modelos de OpenAI, Anthropic y Google.
En el lado empresarial, Los equipos cuestan 40 dólares por usuario al mesmientras que Enterprise tiene un precio personalizado y agrega uso conjunto, facturación centralizada, análisis de uso, controles de privacidad, SSO, registros de auditoría y controles administrativos granulares. En otras palabras, Cursor no sólo cobra por el acceso a un modelo de codificación. Está cobrando por una capa de aplicación administrada que se basa en múltiples proveedores de plantillas y al mismo tiempo agrega capacidades de formación de equipos, gobernanza y herramientas de flujo de trabajo.
Este modelo está cada vez más bajo presión a medida que las empresas de IA profundizan en la codificación. OpenAI y Anthropic ya no se limitan a vender modelos a través de productos de terceros; También están lanzando sus propias interfaces de codificación, agentes y marcos de evaluación, como Codex y Claude Code, lo que plantea la cuestión de cuánto espacio queda para una plataforma intermediaria.
Los comentaristas de X, aunque no verificados y no necesariamente representativos del mercado en general, han descrito cada vez más el paso de Cursor a Code Claude de Anthropic, especialmente entre los usuarios avanzados atraídos por los flujos de trabajo que priorizan la terminal, el comportamiento de los agentes de mayor duración y los menores gastos generales percibidos.
Algunas de estas publicaciones describen la frustración con el precio de Cursor, la pérdida de contexto o la experiencia centrada en el editor, al tiempo que elogian a Claude Code como una forma de trabajar más directa y totalmente agente. Incluso tratado con cautela, este tipo de charla social apunta al problema estratégico que enfrenta Cursor: tiene que demostrar que su plataforma integrada, controles de equipo y ahora sus propios modelos internos agregan valor suficiente para justificar la posición entre los desarrolladores y los fabricantes de modelos, cada vez más capaces de codificar productos.
Esto hace que Composer 2 sea estratégicamente importante para Cursor.
Al ofrecer un modelo interno mucho más económico que Composer 1.5, encajarlo perfectamente en la pila de herramientas Cursor y hacer que la versión predeterminada sea más rápida, la compañía está tratando de demostrar que proporciona más que un contenedor para sistemas externos.
El desafío es que a medida que mejoran los productos de codificación propios, los desarrolladores y compradores empresariales pueden preguntarse cada vez más si quieren una plataforma de codificación de IA separada o si las propias herramientas de los creadores de modelos se están volviendo suficientes por sí solas.







