Gemini 2.5 Pro supera a otros AIS en matemáticas, ciencias y razonamiento

5 1 minute read

Googlees nuevo Géminis Pro es más inteligente que otro Ais en razonamiento, ciencia y codificación.

Esto es de acuerdo con una serie de resultados de referencia publicados por Google el jueves. En resumen, Gemini 2.5 Pro vence a los competidores principales en casi todo, aunque estamos seguros de que las compañías detrás de esos competidores no estarían de acuerdo.

Este tweet no está disponible actualmente. Puede estar cargando o ha sido eliminado.

Según los datos de Google, Gemini 2.5 Pro tiene una ventaja saludable sobre OPERAI O3, Trabajo cerrado 4, Grok 3 betay Deepseek r1en el último punto de referencia de examen de la humanidad, que evalúa las matemáticas, la ciencia, el conocimiento y el razonamiento de un modelo. También es mejor en la edición de códigos (según el punto de referencia de Polyglot Aider), y gana sobre todos los competidores en varios puntos de referencia de hecho, incluida la base de hechos, lo que significa que es menos probable que proporcione un texto de hecho inexacto.

Velocidad de luz mashable

El único punto de referencia en el que Gemini 2.5 Pro no es un ganador claro es el AIME 2025 centrado en las matemáticas, e incluso allí las diferencias entre los resultados son bastante pequeñas.

Ver también:

Gemini ahora autogéna en autogenados para hilos largos de Gmail

Como resultado de todas las mejoras en Gemini 2.5 Pro, este modelo ahora está al tanto de Tabla de clasificación de Lmarena con un puntaje de 1470.

Sin embargo, hay una trampa: la versión final de Gemini 2.5 Pro aún no está ampliamente disponible. Google llama a esta última versión una “vista previa actualizada”, con una versión estable que viene “en un par de semanas”. Sin embargo, la vista previa ahora debería estar disponible en la aplicación Gemini.

Temas
Inteligencia artificial
Google Géminis

Fuente

Manuel García 2 días ago

5 1 minute read