Google esta temblando el equipo detrás Proyecto marinerosu agente de IA que puede navegar por el Navegador Chrome y completar tareas en nombre del usuario, según ha aprendido WIRED. En los últimos meses, algunos empleados de Google Labs que trabajaron en el prototipo de investigación pasaron a proyectos de mayor prioridad, según dos personas familiarizadas con el asunto.

Un portavoz de Google confirmó los cambios, pero dijo que las capacidades de uso de computadoras desarrolladas en Project Mariner se incorporarán a la estrategia de agentes de la compañía en el futuro. Google ya ha incorporado algunas de estas funciones en otros productos de agentes, incluido el recientemente lanzado Agente Géminisañadió el portavoz.

La medida se produce mientras Google y otros laboratorios de inteligencia artificial se apresuran a responder al surgimiento de agentes altamente capaces como garra abierta. Si bien estas herramientas son utilizadas principalmente por desarrolladores hoy en día, Silicon Valley cree que pronto podrían impulsar asistentes de uso general para personas y empresas. El director ejecutivo de Nvidia, Jensen Huang, comparó la herramienta con un nuevo sistema operativo para computadoras de agentes. “Hoy en día, todas las empresas del mundo necesitan tener una estrategia OpenClaw”, dijo en la conferencia de desarrolladores de la empresa a principios de esta semana.

El director ejecutivo de Google, Sundar Pichai, destacó el Proyecto Mariner durante conferencia de E/S del año pasado. En ese momento, los agentes de navegador parecían ser la próxima gran novedad de la industria, con OpenAI y Perplexity lanzando agentes de consumo que prometían automatizar las tareas en línea para los usuarios. Los agentes podían hacer clic, desplazarse y completar formularios en una página web, como un ser humano. Sin embargo, la adopción de estos productos ha tenido dificultades para cumplir con las expectativas de la industria.

El agente de navegador Comet de Perplexity logró apenas 2,8 millones de usuarios activos semanales en diciembre de 2025. Mientras tanto, el agente ChatGPT de OpenAI habría caído a menos de 1 millón de usuarios activos semanales en los últimos meses. En comparación con los cientos de millones de usuarios que chatean con ChatGPT semanalmente, usar el agente del navegador equivale esencialmente a un error de redondeo.

Nuevos agentes en la ciudad

El impulso en el mundo de la IA ha cambiado drásticamente durante el último año hacia agentes como Claude Code y OpenClaw (cuyo creador fue contratado por OpenAI). A diferencia de los agentes de navegación web, estos sistemas controlan las computadoras a través de la línea de comandos, lo que ha demostrado ser una forma más confiable de completar tareas. Algunos de estos productos incluyen el uso de la computadora como recurso, entre otras habilidades de los agentes. En comparación, los agentes de navegador ahora parecen algo limitados como productos independientes.

Kian Katanforoosh, director ejecutivo de la plataforma de habilidades de IA Workera, que da conferencias sobre IA en Stanford, dice que parte de la razón por la que los agentes basados ​​en computadora no han despegado es por sus enormes requisitos computacionales. La mayoría de estos agentes trabajan tomando una serie de capturas de pantalla de una página web, introduciéndolas en un modelo de IA y luego tomando acciones basadas en lo que ven. Procesar toda esta información puede ser lento y a veces faltón.

“Lo que Claude Code y OpenClaw demostraron fue que en realidad es mucho más eficiente trabajar con la terminal, porque la terminal está basada en texto y los LLM están basados ​​en texto”, dijo Katanforoosh. “Probablemente sean necesarios entre 10 y 100 veces menos pasos para llegar a los mismos resultados”.

Esto no quiere decir que los agentes de navegador no estén mejorando o que la investigación sobre el uso de las computadoras haya llegado a un callejón sin salida.

El mes pasado, la startup Standard Intelligence lanzó un modelo de uso de la computadora entrenado en videos en lugar de capturas de pantalla. La startup afirma haber desarrollado un codificador de vídeo que puede comprimir vídeos en la ventana contextual de un modelo de IA, que, según afirma, es 50 veces más eficiente que los modelos anteriores de uso de computadoras. Para mostrar las capacidades de su modelo de IA, la startup lo conectó a un automóvil, video en vivo y un teclado de computadora. El modelo pudo brevemente conducir de forma autónoma por San Francisco.

Fuente