
¿Recuerdas cuando los modelos de IA sólo podían decirte qué hacer? Ahora, los LLM más nuevos pueden realmente hacer cosas con la ayuda del software de inteligencia artificial del agente, y el nuevo modelo insignia de OpenAI es el más nuevo del grupo.
GPT-5.4 ahora está disponible en ChatGPT (donde se conoce con el nombre GPT-5.4 Thinking), así como en la API de OpenAI y en la herramienta de codificación Codex de OpenAI (una versión de la cual acaba de salir para Windows).
Este nuevo GPT llega con un cantidad de trucos nuevos y renovadoscomenzando con sus habilidades mejoradas con las hojas de cálculo, su razonamiento más eficiente (lo que significa que puede resolver problemas usando menos tokens y costando menos) y su capacidad para mostrar un plan “anticipado” antes de realizar tareas complejas, lo que le brinda la oportunidad de dirigir el modelo en una nueva dirección antes de que comience a funcionar.
Lo más interesante es que GPT-5.4 marca el primer modelo de propósito general de OpenAI que realmente puede hacer cosas en tu computadora, no solo digas como para hacer cosas. Por ejemplo, GPT-5.4 puede hacer clic con el mouse o, para ser más precisos, puede emitir un comando de “clic del mouse” a un sistema de agente de inteligencia artificial en su PC, que hace el clic real. GPT-5.4 también puede editar archivos en su sistema, ingresar comandos de teclado y “ver” capturas de pantalla (lo que le permite usar un navegador web o interactuar con programas de computadora).
Ahora, una advertencia importante aquí: GPT-5.4 solo puede tomar el control de su PC cuando está funcionando a través de la API OpenAI o la herramienta Codex de OpenAI. Cuando usa GPT-5.4 Pensando en ChatGPT, es decir, la aplicación de escritorio o la interfaz web de ChatGPT, LLM todavía está limitado a su cuadro de chat y sus diversas integraciones de ChatGPT como Google Drive, Spotify, Adobe Photoshop y otras.
También es importante señalar que, aunque GPT-5.4 es el primer uso general GPT que realmente puede usar tu PC, no es el primer GPT siempre esto puede hacer eso. Existen GPT específicos del Codex que pueden ejecutar comandos, editar archivos y (hasta cierto punto) navegar por interfaces gráficas y navegar a través de flujos de trabajo web. Pero con su capacidad para navegar por la web y controlar programas de PC, el GPT-5.4 lleva las capacidades de “uso de la computadora” de los modelos anteriores específicos del Codex al siguiente nivel.
Esto significa que puede pedirle a un agente de IA controlado por GPT-5.4 en su computadora que “equilibre mis libros en Quicken” y podrá iniciar de forma autónoma la aplicación Quicken, hacer clic en la interfaz y equilibrar sus libros.
Por supuesto, si tu querer GPT-5.4 jugar con Quicken por su cuenta es un tema completamente diferente. Para tareas delicadas, probablemente quieras observar cómo funciona, como puedes hacerlo al codificar con GPT-5.4 en la aplicación Codex.
Aun así, las capacidades de “hacer, no sólo decir” de GPT-5.4 sirven como un ejemplo perfecto de hacia dónde nos dirigimos: PC controladas por agentes de IA que hacen las cosas por sí mismos, con nuestra guía de alto nivel. Dicho esto, hacer que nuestros agentes de IA sigan nuestras instrucciones. correctamente Será el verdadero truco.














