Actualizaciones de cursor Modelo de pestaña Autocompletar para hacer mejores sugerencias de codificación

Foto del archivo: Cursor ha realizado mejoras en su modelo de pestaña, o el sistema que sugiere cambios en el código para los desarrolladores entre archivos, utilizando el aprendizaje de refuerzo en línea. | Crédito de la foto: Reuters
Cursor dijo que hicieron mejoras en su modelo de pestaña, o el sistema que sugiere cambios en el código para los desarrolladores en todos los archivos, utilizando el aprendizaje de refuerzo en línea.
La plataforma de codificación de IA anunció la actualización en X, diciendo que el modelo ahora hace “un 21% menos de sugerencias que el modelo anterior, al tiempo que tiene una tasa de aceptación 28% más alta para las sugerencias que hace”.
Un blog publicado por Cursor explicó cómo se hizo esto. El aprendizaje de refuerzo funciona a través de recompensas, donde un agente pasa por pruebas y errores varias veces en un entorno para maximizar las recompensas acumulativas.
Sin embargo, el blog señaló que a veces, no había suficiente información para que el agente supiera qué acción iba a tomar el usuario; Entonces, incluso si el modelo se hiciera técnicamente “más inteligente”, todavía no sabría qué hacer.
En tales situaciones, sería simplemente mejor para el modelo no dar ninguna sugerencia, en lugar de una sugerencia inexacta que podría descarrilar al desarrollador que trabaja en el código.
“Los métodos de gradiente de políticas son una forma general de optimizar una ‘política’ (en este caso, el modelo de pestaña) para aumentar una” recompensa “, dijo el blog. La recompensa es un número asignado a cada acción tomada por el modelo de pestaña.
“Al utilizar un algoritmo de gradiente de política, podemos actualizar la política para que obtenga una recompensa promedio más alta en el futuro”, señaló.
Por lo tanto, cualquier sugerencia aceptada de TAB fue recompensada, mientras que se desanimaron las sugerencias inútiles hechas por TAB, lo que finalmente mejoró el sistema.
A principios de junio, Cursor lanzó una aplicación web para que los usuarios administren agentes de codificación directamente desde sus navegadores.
Publicado – 12 de septiembre de 2025 03:07 PM es