Google despliega Gemini Deep Think AI, un modelo de razonamiento que prueba múltiples ideas en paralelo

Google Deepmind se está implementando Géminis 2.5 Profunde Pensarque, según la compañía, es su modelo de razonamiento de IA más avanzado, capaz de responder preguntas explorando y considerando múltiples ideas simultáneamente y luego usando esas salidas para elegir la mejor respuesta.
Suscriptores a los $ 250 por mes de Google Ultra La suscripción obtendrá acceso a Gemini 2.5 Profunde Think en la aplicación Gemini a partir del viernes.
Primero presentado en mayo en Google I/O 2025, Gemini 2.5 Deep Think es el primer modelo de agente múltiple disponible públicamente de Google. Estos sistemas generan AI múltiples agentes para abordar una pregunta en paralelo, un proceso que utiliza significativamente más recursos computacionales que un solo agente, pero tiende a dar como resultado mejores respuestas.
Google usó una variación de Géminis 2.5 Profunde Pensar para anotar una medalla de oro en la Olimpiada Internacional de Matemáticas de este año (OMI).
Junto a Gemini 2.5 Deep Think, la compañía dice que está lanzando el modelo que utilizó en la OMI a un grupo selecto de matemáticos y académicos. Google dice que este modelo de IA “lleva horas a la razón”, en lugar de segundos o minutos como la mayoría de los modelos de IA orientados al consumidor. La compañía espera que el modelo IMO mejore los esfuerzos de investigación y tiene como objetivo obtener comentarios sobre cómo mejorar el sistema de múltiples agentes para los casos de uso académico.
Google señala que el modelo de pensamiento profundo de Gemini 2.5 es una mejora significativa sobre lo que anunció en E/S. La compañía también afirma haber desarrollado “nuevas técnicas de aprendizaje de refuerzo” para alentar a Gemini 2.5 Profund Pensar para hacer un mejor uso de sus caminos de razonamiento.
“El pensamiento profundo puede ayudar a las personas a abordar los problemas que requieren creatividad, planificación estratégica y realizar mejoras paso a paso”, dijo Google en una publicación de blog compartida con TechCrunch.
Evento de TechCrunch
San Francisco
|
27-29 de octubre de 2025
La compañía dice que Gemini 2.5 Deep Think logra el desempeño de última generación en el último examen de la humanidad (HLE), una prueba desafiante que mide la capacidad de la IA para responder a miles de preguntas de crowdsourcing en matemáticas, humanidades y ciencias. Google afirma que su modelo obtuvo un 34.8%en HLE (sin herramientas), en comparación con el Grok 4 de Xai, que obtuvo un 25.4%, y el O3 de OpenAI, que obtuvo un 20.3%.
Google también dice que Gemini 2.5 Deep Piens supere los modelos AI de OpenAI, XAI y Anthrope en LivecodeBench6, una prueba desafiante de tareas de codificación competitiva. El modelo de Google obtuvo un 87.6%, mientras que Grok 4 obtuvo un 79%, y el O3 de OpenAI obtuvo un 72%.
Gemini 2.5 Deep Piense funciona automáticamente con herramientas como la ejecución del código y la búsqueda de Google, y la compañía dice que es capaz de producir “respuestas mucho más largas” que los modelos de IA tradicionales.
En las pruebas de Google, el modelo produjo tareas de desarrollo web más detallado y estéticamente agradable en comparación con otros modelos de IA. La compañía afirma que el modelo podría ayudar a los investigadores y “potencialmente acelerar el camino hacia el descubrimiento”.

Parece que varios laboratorios de IA principales están convergiendo alrededor del enfoque de múltiples agentes.
XAI de Elon Musk lanzó recientemente un sistema de múltiples agentes, Grok 4 pesadoque, según dice, fue capaz de lograr el rendimiento líder de la industria en varios puntos de referencia. El investigador de Operai, Noam Brown, dijo en un podcast Que el modelo de IA inédito que la compañía usó para lograr una medalla de oro en la Olimpiada Internacional de Matemáticas de este año también fue un sistema de múltiples agentes. Mientras tanto, Agente de investigación de Anthropeque genera exámenes de investigación exhaustivos, también funciona con un sistema de múltiples agentes.
A pesar del fuerte rendimiento, parece que los sistemas de múltiples agentes son aún más costosos para servir que los modelos de IA tradicionales. Eso significa que las empresas tecnológicas pueden mantener estos sistemas cerrados detrás de sus planes de suscripción más caros, lo que Xai y ahora Google han elegido hacer.
En las próximas semanas, Google dice que planea compartir Gemini 2.5 Profunde Piense con un grupo selecto de probadores a través de la API de Géminis. La compañía dice que quiere comprender mejor cómo los desarrolladores y las empresas pueden usar su sistema de múltiples agentes.