Google presenta Gemini 2.5 Computer Use para navegación web

FOTO DE ARCHIVO: Google ha presentado un nuevo modelo de IA llamado Gemini 2.5 Computer Use que puede navegar y navegar por la web utilizando un navegador virtual e incluso realizar tareas como completar formularios. | Crédito de la foto: Reuters
Google ha presentado un nuevo modelo de inteligencia artificial llamado Gemini 2.5 Computer Use que puede navegar y navegar por la web utilizando un navegador virtual e incluso realizar tareas como completar formularios. Construido sobre el Gemini 2.5 Pro, el modelo de IA tiene “capacidades de razonamiento y comprensión visual” y solo sigue las indicaciones de un mensaje del usuario.
“Si bien los modelos de IA pueden interactuar con el software a través de API estructuradas, muchas tareas digitales aún requieren interacción directa con interfaces gráficas de usuario, por ejemplo, completar y enviar formularios. Para completar estas tareas, los agentes deben navegar por páginas web y aplicaciones tal como lo hacen los humanos: haciendo clic, escribiendo y desplazándose”, decía la publicación del blog que hace el anuncio.
Los usuarios pueden probar y navegar directamente por las interfaces sin utilizar una API.
Deben proporcionar entradas que incluyan una captura de pantalla del entorno, un historial de acciones recientes y cualquier función que quieran incluir. El modelo de IA analiza estas direcciones y genera una respuesta mientras realiza la acción.
Google también dijo que el modelo de IA tiene acceso únicamente a un navegador y no a todo el entorno informático.
El modelo Gemini 2.5 Computer Use también ha mostrado un rendimiento comparable para las tareas de control de la interfaz de usuario móvil, pero no está “optimizado para el control a nivel del sistema operativo de escritorio”.
Los desarrolladores pueden acceder al modelo de uso de computadora Gemini 2.5 a través de la API Gemini en Google AI Studio y Vertex AI.
Ya se han utilizado otras versiones del modelo para Project Mariner, un prototipo que utiliza agentes de IA para tareas y para algunas capacidades de agente en el modo AI en Búsqueda.
Publicado – 08 de octubre de 2025 01:32 p. m. IST