Siga ZDNET: Agréganos como fuente preferida en Google.
Hallazgos clave de ZDNET
- El MIT publicó una lista de los principales agentes de IA y sus funcionalidades.
- La mayoría se centra en los flujos de trabajo empresariales.
- La búsqueda y síntesis de información es el principal caso de uso.
¿Qué agentes autónomos o semiautónomos están teniendo el mayor impacto en el mundo (y potencialmente en su trabajo) hoy? Ciertos agentes están apareciendo en todos los titulares últimamente, pero hay varios agentes con roles específicos disponibles para desarrolladores y usuarios.
El CSAIL del MIT, el laboratorio universitario dedicado a la investigación de la IA, se propuso identificar y documentar la historia y las capacidades de estos agentes, y sus hallazgos se detallan en su último Índice de agentes de IA. Los investigadores realizaron un análisis de todo el ecosistema de agentes de IA de próxima generación en 1.350 puntos de datos.
Además: los agentes de IA son rápidos, flexibles y están fuera de control, según un estudio del MIT
¿Cuál es la funcionalidad y origen de los agentes líderes? Los investigadores descubrieron que las interfaces son las más abundantes, seguidas de cerca por las plataformas de flujo de trabajo empresarial. También descubrieron riesgos compartidos entre estos actores, como lo exploró mi colega de ZDNET, Tiernan Ray.
Los agentes que aparecen en el índice del MIT incluyen los siguientes:
- Claude/Claude Código Antrópico
- CLI de Google Géminis/Géminis
- Guante de IA
- OpenAI ChatGPT/Agente ChatGPT/Codex/AgentKit
- Perplejidad
- Agente móvil de Alibaba
- Agente TARS de ByteDance
- Perplejidad del cometa
- Orquesta IBM Watsonx
- Copiloto de Microsoft 365
- Estudio SAP Joule
- Fuerza de agentes de Salesforce
- Agentes de IA de ServiceNow
Aquí están las tres categorías principales de agentes identificados por los investigadores:
Agentes de flujo de trabajo empresarial (13 sistemas de 30 sistemas cubiertos): Se trata de plataformas con capacidades de agentes para automatizar tareas comerciales. Los ejemplos incluyen Microsoft 365 Copilot y ServiceNow Agent.
Aplicaciones de chat con herramientas de agentes (12 sistemas): Según los investigadores, esta categoría incluye principalmente interfaces de chat con amplio acceso a herramientas. Los ejemplos incluyen agentes de codificación de propósito general como Claude Code, así como agentes integrados en productos más amplios como Manus AI y ChatGPT Agent.
Además: dejé que el agente de inteligencia artificial de Chrome comprara, buscara y enviara correos electrónicos por mí: así es como sucedió
Agentes basados en navegador (5 sistemas): Son agentes cuya interfaz principal es el uso de un navegador o computadora, con amplias herramientas de interacción navegador/computadora. “Son diferentes de los agentes de chat con capacidades de búsqueda web (búsqueda web ChatGPT, búsqueda web Claude) que realizan principalmente recuperación y resumen”, dicen los investigadores. “Los agentes basados en navegador introducen mayores riesgos a través de la ejecución en segundo plano, activadores de eventos y transacciones directas”. Los ejemplos incluyen Perplexity Comet, ChatGPT Atlas, ByteDance Agent TARS.
¿Cuáles son los usos más populares de los agentes de IA?
Los principales casos de uso de agentes de IA, que abarcan las categorías anteriores, incluyen la búsqueda y síntesis de información, como se ve en 12 de los 30 agentes cubiertos, que abarcan tanto asistentes de chat para consumidores como plataformas empresariales. Justo detrás de esta funcionalidad está la automatización del flujo de trabajo en todas las funciones comerciales, como recursos humanos, ventas, soporte y TI, habilitada por 11 agentes, que se encuentran principalmente en productos empresariales. En siete de los modelos están presentes agentes centrados en las capacidades de GUI o navegador, utilizados para tareas como formularios, pedidos y reservas.
Además: 6 razones por las que las empresas autónomas siguen siendo más una visión que una realidad
Los niveles de autonomía varían considerablemente, encontraron los investigadores. Los asistentes de chat mantienen los niveles más bajos de autonomía. Se basan en interacciones por turnos e incluyen Anthropic Claude, Google Gemini y OpenAI ChatGPT, que “realiza un único conjunto de acciones y espera la siguiente solicitud del usuario”.
En el límite superior de autonomía, los agentes de navegador ofrecen “oportunidades más limitadas para la intervención a mitad de ejecución”. Esto incluye el Cometa de Perplexity, que realiza tareas de forma autónoma una vez que se le solicita. “Una vez enviada una consulta, los usuarios no pueden intervenir ni guiar fácilmente al agente hasta que finalice la consulta”.
Las plataformas empresariales están divididas en lo que respecta a la autonomía de los agentes. “Durante la fase de diseño, los usuarios configuran manualmente activadores, acciones y protecciones mediante pantallas visuales”, escribieron los investigadores. Otros pueden ofrecer asistencia de IA en este proceso. Una vez desplegados, estos agentes suelen operar con niveles más altos de autonomía, “activados por eventos como un nuevo correo electrónico o un cambio en la base de datos, sin ninguna participación humana durante la ejecución real de la tarea”. Estos agentes incluyen Glean, Google Gemini Enterprise, IBM watsonx, Microsoft 365 Copilot, n8n y OpenAI AgentKit.
Además: Google Workspace ahora te permite crear agentes de IA para automatizar tu trabajo: cómo empezar
Algunas ofertas se consideran agentes de desarrollador/interfaz de línea de comandos (CLI) que requieren confirmación explícita para operaciones confidenciales, como ediciones de archivos y ejecución de comandos. Algunos agentes ofrecen un “modo de observación” para la supervisión en tiempo real de acciones críticas, incluidos ChatGPT Agent/Atlas y Opera Neon.
Los desarrolladores de agentes se concentran en EE. UU. y China, con una representación limitada de otras regiones, según el estudio.
















