
Quizás ya conozcas la historia: un ejecutivo de Meta le pidió a la herramienta viral OpenClaw AI que clasificara su bandeja de entrada y sugiriera mensajes para eliminar, luego observó con horror cómo el agente se deshonraba y atacaba más de 200 correos electrónicos, su frenético mensaje “STOP OPENCLAW” se perdió en medio de la enorme tarea del robot.
¿El giro? El ejecutivo era el principal oficial de seguridad de IA de Meta, Summer Yue.
El apocalipsis del correo electrónico de Yue destacó una forma de evitar historias de terror similares sobre IA.
Sí, Yue involuntariamente. se convirtió en un conejillo de indias para OpenClaw y sus automatizaciones incontroladas – y de hecho, prácticamente cualquiera que use OpenClaw es ahora un conejillo de indias.
Pero el apocalipsis del correo electrónico de Yue también destacó una forma de evitar historias de terror similares sobre la IA, y es un método con el que la mayoría de los programadores (e incluso muchos expertos) ya están familiarizados.
Tiene diferentes nombres; escuché eso llamado “agente git flow” y “rama de recursos del agente”, por ejemplo. Pero sobre todo se trata de aplicar la metodología “git” (la utilidad de línea de comandos esencial para rastrear cambios de código) a los agentes de IA.
¿La mejor parte de esta solución? Esto nos permite tener nuestro pastel (el pastel es algo genial que pueden hacer los agentes de IA) y comerlo también.
Pollo, pescado y OpenClaws
Primero, un experimento mental. Imagina que estás en un restaurante y hay dos platos en el menú: pollo o pescado. El pollo tiene muy buena pinta, pero el pescado: ¡salmón! Elección difícil.
Imagine que, en lugar de arriesgarse a cometer un error costoso al elegir pollo en lugar de pescado (¡y qué pasa si el pollo está malo!), podría crear una “rama” de su futuro inmediato: una copia temporal de su línea de tiempo que le permita probar una elección antes de tomarla de forma permanente.
Entonces, sigue adelante y crea (o “compruébalo”) una nueva rama de tu línea de vida “principal” – llamémosla “rama de pollo” – y luego pide y prueba el pollo. ¡Qué asco! Es repugnante.
Ningún problema; descartamos la rama de pollo, volvemos a la rama “principal” y revisamos una nueva segunda rama: la rama “pescado”. Ahora probamos el salmón, ¡delicioso! Nos gusta esta rama del pescado, así que ahora la fusionamos con nuestra rama “principal” de la vida y comenzamos con una comida que seguro quedará rica.
En el mundo del seguimiento de código de git, llamamos a esta funcionalidad (que solo he descrito de manera aproximada) ramificación de características, y es una forma ingeniosa y probada en batalla de probar grandes cambios y nuevas características en nuestro código antes de enviarlos a nuestro proyecto principal.
Una rama de características en git es en realidad solo una copia de la rama “principal”. Lo revisamos como si fuera un libro de biblioteca, hacemos todos los cambios que queremos, lo probamos, encontramos errores, hacemos más cambios y así sucesivamente. Mientras tanto, la rama “principal” de nuestro proyecto está segura y intacta.
Solo después de haber sometido nuestra rama de funciones a una serie de pruebas (algunas automatizadas, otras realizadas por un usuario humano) y haber determinado que está en buen estado, consideramos fusionar nuestra rama de “funciones” con la rama principal. Y si no nos gusta cómo va la rama de recursos, podemos descartarla: no hay daño ni problema.
¿Mi punto? Esta metodología de ramificación de código también puede funcionar con agentes de IA. (Y no, no soy la primera persona a considera esta idea.)
¿Cómo podría haber sido mejor?
Volvamos a Summer Yue y probemos el tamaño de nuestro escenario de “sucursal”. Esta vez, Yue se sienta con OpenClaw y le pregunta: “Ve a mi bandeja de entrada y sugiere eliminaciones”. (Su otro mensaje en la historia del mundo real – “esperar aprobación” – probablemente fue eliminado de la ventana contextual de OpenClaw debido a la gran cantidad de mensajes de correo electrónico por los que se desplazaba).
Más versiones (y potencialmente más aterradoras) del terrible, horrible, nada bueno y muy malo día de correo electrónico de Summer Yue volverán a suceder si no le damos a esta idea una respuesta justa.
Ahora, en lugar de que OpenClaw se sumerja en la bandeja de entrada en vivo, crea una rama (llámela rama de “clasificación”) que le permite simular los resultados de examinar, organizar y seleccionar su bandeja de entrada, todo en un entorno de espacio aislado y todo sin tocar los mensajes de correo electrónico reales.
OpenClaw hace su trabajo, tal vez se deje llevar y empiece a borrar mensajes quiera o no. Si eso sucediera, Yue podría simplemente mirar la rama de selección, decidir que no está satisfecha con los resultados y luego descartar la rama o continuar trabajando con ella, probando diferentes iteraciones del mensaje de OpenClaw o agregando documentos “andamios” con formato de rebajas que gobiernan las acciones de OpenClaw desde el principio. Mientras tanto, su verdadera bandeja de entrada está sana y salva.
Ahora bien, ¿funcionará esta “rama de funciones” para todos los escenarios de agentes de IA? Probablemente no. Es fácil colocar código informático ramificado en un entorno limitado y probar la seguridad de cualquier cantidad de acciones y resultados. Pero así como realmente no se puede aislar la elección de pollo versus pescado, hay muchas acciones y funciones de agentes de IA del mundo real (como, por ejemplo, agentes de IA centrados en recursos humanos) que no se pueden simular fácilmente.
Dicho esto, más (y potencialmente más aterradoras) versiones del terrible, horrible, nada bueno y muy malo día de correo electrónico de Summer Yue volverán a suceder si no le damos una sacudida justa a esta idea de “ramificación de funciones de agente”.












