Durante los últimos tres meses, el Gemini 3 Pro de Google se ha mantenido como uno de los modelos fronterizos más capaces disponibles. Pero en el mundo de la IA, que evoluciona rápidamente, tres meses es toda una vida, y los competidores no se han quedado quietos.
Hoy temprano, Google lanzó Géminis 3.1 Prouna actualización que trae una innovación importante al poderoso modelo de trabajo de la compañía: tres niveles de pensamiento ajustables que efectivamente lo convierten en una versión liviana del sistema de razonamiento especializado Deep Think de Google.
El lanzamiento marca la primera vez que Google lanza una actualización de “punto uno” para un modelo Gemini, lo que indica un cambio en la estrategia de lanzamiento de la compañía desde lanzamientos periódicos de versiones completas a actualizaciones incrementales más frecuentes. Lo más importante para los equipos de IA empresarial que evalúan su conjunto de modelos es que el nuevo sistema de pensamiento de tres niveles de 3.1 Pro (bajo, medio y alto) brinda a los desarrolladores y líderes de TI un modelo único que puede escalar su esfuerzo de pensamiento dinámicamente, desde respuestas rápidas para consultas rutinarias hasta sesiones de pensamiento profundo de varios minutos para problemas complejos.
El modelo ahora se está lanzando en versión preliminar en la API de Gemini a través de Estudio de IA de GoogleGemini CLI, la plataforma de desarrollo de agentes antigravity de Google, Vertex AI, Gemini Enterprise, Android Studio, la aplicación para consumidores Gemini y NotebookLM.
El efecto ‘Deep Think Mini’: razonamiento ajustable según demanda
La característica más importante de Gemini 3.1 Pro no es un único número de referencia: es la introducción de un sistema de pensamiento de tres niveles que brinda a los usuarios un control detallado sobre cuánto esfuerzo computacional invierte el modelo en cada respuesta.
El Gemini 3 Pro sólo ofrecía dos modos de pensamiento: bajo y alto. El nuevo 3.1 Pro agrega una configuración media (similar a la alta anterior) y, de manera crítica, remodela lo que significa “alta”. Cuando se configura en alto, 3.1 Pro se comporta como una “versión mini de Gemini Deep Think”, el modelo de pensamiento especializado de la compañía que fue actualizado la semana pasada.
Las implicaciones para la implementación empresarial pueden ser significativas. En lugar de enrutar solicitudes a diferentes modelos especializados en función de la complejidad de la tarea (un patrón común pero operativamente oneroso), las organizaciones ahora pueden usar un único modelo de punto final y ajustar la profundidad del razonamiento en función de la tarea en cuestión. El resumen de documentos de rutina se puede realizar con poco razonamiento y tiempos de respuesta rápidos, mientras que las tareas analíticas complejas se pueden elevar a un alto razonamiento para un razonamiento del calibre de Deep Think.
Rendimiento de referencia: más del doble del razonamiento en comparación con el 3 Pro
Los puntos de referencia publicados por Google cuentan una historia de mejoras espectaculares, especialmente en áreas asociadas con el razonamiento y la capacidad de acción.
En ARCO-AGI-2un punto de referencia que evalúa la capacidad de un modelo para resolver nuevos patrones de razonamiento abstracto, obtuvo una puntuación de 3,1 Pro 77,1% — más del doble del 31,1% logrado por Gemini 3 Pro y sustancialmente por delante de Sonnet 4.6 (58,3%) y Opus 4.6 (68,8%) de Anthropic. Este resultado también eclipsa al GPT-5.2 de OpenAI (52,9%).
Las ganancias se extienden a todos los sectores. En El último examen de la humanidadUn riguroso punto de referencia de razonamiento académico, el 3.1 Pro logró un 44,4% sin herramientas, por encima del 37,5% del 3 Pro y por delante del Claude Sonnet 4.6 (33,2%) y el Opus 4.6 (40,0%). En Diamante GPQAEn la evaluación de conocimientos científicos, el 3.1 Pro logró un 94,3%, superando a todos los competidores de la lista.
Donde los resultados se vuelven particularmente relevantes para los equipos de IA empresarial es en los puntos de referencia de las agencias: las evaluaciones que miden cómo se desempeñan los modelos cuando se les dan herramientas y tareas de varios pasos, el tipo de trabajo que define cada vez más las implementaciones de IA de producción.
En Terminal de banco 2.0que evalúa la codificación de agentes terminales, el 3.1 Pro obtuvo una puntuación del 68,5% en comparación con el 56,9% de su predecesor. En Atlas de MCPun punto de referencia que mide flujos de trabajo de varios pasos utilizando el protocolo de contexto del modelo, el 3.1 Pro logró un 69,2%, una mejora de 15 puntos sobre el 54,1% del 3 Pro y casi 10 puntos por delante de Claude y GPT-5.2. Etcétera NavegarCompAl probar la capacidad de búsqueda web de un agente, el 3.1 Pro logró un 85,9%, superando el 59,2% del 3 Pro.
Por qué Google eligió una versión ‘0.1’ y qué indica
La decisión de versionar es digna de mención. Las versiones anteriores de Gemini siguieron un patrón de vistas previas desactualizadas: múltiples vistas previas de 2.5, por ejemplo, antes de alcanzar la disponibilidad general. La elección de designar esta actualización como 3.1 en lugar de otra vista previa del 3 Pro sugiere que Google considera que las mejoras son lo suficientemente sustanciales como para justificar un aumento de versión, mientras que el marco del “punto uno” establece expectativas de que se trata de una evolución, no de una revolución.
La publicación del blog de Google afirma que 3.1 Pro se basa directamente en las lecciones de la serie Gemini Deep Think, incorporando técnicas de versiones anteriores y más nuevas. Los puntos de referencia sugieren firmemente que el aprendizaje por refuerzo jugó un papel central en las ganancias, particularmente en tareas como ARC-AGI-2, puntos de referencia de codificación y evaluaciones de agentes, exactamente los dominios donde los entornos de capacitación basados en RL pueden proporcionar señales de recompensa claras.
El modelo se lanza en versión preliminar en lugar de como versión de disponibilidad general, y Google dice que continuará haciendo avances en áreas como los flujos de trabajo de los agentes antes de pasar a GA completo.
Implicaciones competitivas para la pila de IA de su empresa
Para los tomadores de decisiones de TI que evalúan proveedores de modelos de alta gama, el lanzamiento de Gemini 3.1 Pro no sólo debería hacerles repensar qué modelos elegir, sino también cómo adaptarse a un ritmo de cambio tan rápido para sus propios productos y servicios.
La pregunta ahora es si este lanzamiento provocará una respuesta de la competencia. El lanzamiento original del Gemini 3 Pro en noviembre pasado desencadenó una ola de lanzamientos de modelos en ecosistemas abiertos y propietarios.
Con 3.1 Pro recuperando el liderazgo en varias categorías críticas, la presión recae sobre Anthropic, OpenAI y la comunidad de peso abierto para que respondan, y en el panorama actual de la IA, esa respuesta probablemente se mida en semanas, no en meses.
Disponibilidad
Gemini 3.1 Pro ya está disponible en versión preliminar a través de API de Géminis en Google AI Studio, Gemini CLI, Google Antigravity y Android Studio para desarrolladores. Los clientes corporativos pueden acceder a él a través de IA de vértice y Compañía Géminis. Los consumidores de los planes Google AI Pro y Ultra pueden acceder a él a través de la aplicación Gemini y NotebookLM.
















