Todo líder de ingeniería que observe la ola de codificación de agentes eventualmente enfrentará la misma pregunta: si la IA puede generar código con calidad de producción más rápido que cualquier equipo, ¿cómo será la gobernanza cuando los humanos ya no escriban el código?

La mayoría de los equipos todavía no tienen una buena respuesta. Datos del tesorouna plataforma de datos de clientes respaldada por SoftBank que presta servicios a más de 450 marcas globales, ahora tiene una, aunque aprendieron algunas partes de la manera más difícil.

La empresa hoy Código del Tesoro anunciado oficialmenteuna nueva interfaz de línea de comandos nativa de IA que permite a los ingenieros de datos y equipos de plataforma operar su CDP de un extremo a otro a través de un lenguaje natural, con Claude Code manejando la creación y la iteración subyacente. Fue construido por un solo ingeniero.

La empresa afirma que la codificación en sí tardó unos 60 minutos. Pero ese número es casi irrelevante. La historia más importante es lo que tenía que ser cierto antes de que esos 60 minutos fueran posibles y lo que sucedió después.

“Desde una perspectiva de planificación, todavía tenemos que planificar para reducir el riesgo empresarial, y eso llevó algunas semanas”, dijo a VentureBeat Rafa Flores, director de producto de Treasure Data. “Desde el punto de vista de la ideación y la ejecución, ahí es donde se mezclan los dos y vamos, vamos, vamos. Y no se trata sólo de crear prototipos, sino de llevar las cosas a producción de una manera segura”.

Construya primero la capa de gobernanza

Antes de que se escribiera siquiera una sola línea de código, Treasure Data tuvo que responder una pregunta más difícil: ¿qué se debe prohibir al sistema y cómo puede imponerlo a nivel de plataforma, en lugar de esperar que el código lo respete?

Las barreras de seguridad de Treasure Data se construyen en vivo antes del código mismo. Cuando cualquier usuario se conecta a CDP a través de Treasure Code, el control de acceso y la gestión de permisos se heredan directamente de la plataforma. Los usuarios sólo pueden acceder a recursos para los que ya tienen permiso. La PII no puede exponerse. Las claves API no se pueden mostrar. El sistema no puede hablar despectivamente sobre una marca o un competidor.

“Tuvimos que involucrar a los CISO. Yo estuve involucrado. Nuestro CTO, jefes de ingeniería, solo para asegurarnos de que esto no saliera mal”, dijo Flores.

Esta base hizo posible el siguiente paso: permitir que la IA generara el 100 % del código base, con un proceso de calidad de tres niveles, aplicando estándares de producción en todo momento.

El proceso de tres niveles para la generación de código de IA

La primera capa es un revisor de código basado en IA que también utiliza Claude Code. El revisor de código se encuentra en la etapa de solicitud de extracción y ejecuta una lista de verificación de revisión estructurada en cada fusión propuesta, verificando la alineación arquitectónica, el cumplimiento de la seguridad, el manejo adecuado de errores, la cobertura de las pruebas y la calidad de la documentación. Cuando se cumplen todos los criterios, se puede fusionar automáticamente. Cuando no lo son, indica la intervención humana.

El hecho de que Treasure Data haya integrado el revisor de código en Claude Code no es casualidad. Esto significa que la propia herramienta de validación de código generada por IA fue generada por IA, prueba de que el flujo de trabajo se refuerza a sí mismo en lugar de depender de una capa de calidad separada escrita por humanos.

La segunda capa es una canalización de CI/CD estándar que realiza pruebas unitarias, de integración y de extremo a extremo automatizadas, análisis estáticos, linting y controles de seguridad para cada cambio. El tercero es la revisión humana, que es necesaria siempre que los sistemas automatizados señalan riesgos o las políticas comerciales requieren aprobación.

El principio interno con el que opera Treasure Data es: la IA escribe código, pero no envía código.

¿Por qué no es solo el cursor el que apunta a una base de datos?

La pregunta obvia para cualquier equipo de ingeniería es por qué no simplemente apuntar una herramienta existente como Cursor a su plataforma de datos o exponerla como un servidor MCP y dejar que Claude Code la consulte directamente.

Flores argumentó que la diferencia es la profundidad de la gobernanza. Una conexión genérica proporciona acceso a datos en lenguaje natural, pero no hereda ninguna de las estructuras de permisos existentes de la plataforma, lo que significa que cada consulta se ejecuta con cualquier acceso que permita la clave API.

Treasure Code hereda el control de acceso completo y la capa de permisos de Treasure Data, por lo que lo que un usuario puede hacer a través del lenguaje natural está limitado por lo que ya está autorizado a hacer en la plataforma.

La segunda distinción es la orquestación. Debido a que Treasure Code se conecta directamente a AI Agent Foundry de Treasure Data, puede coordinar subagentes y habilidades en toda la plataforma en lugar de realizar tareas individuales de forma aislada: la diferencia entre decirle a una IA que realice un análisis y orquestarlo a través de activación omnicanal, segmentación e informes simultáneamente.

¿Qué se rompió de todos modos?

Incluso con la arquitectura de gobernanza implementada, el lanzamiento no fue bien y Flores fue sincero al respecto.

Inicialmente, Treasure Data puso Treasure Code a disposición de los clientes sin un plan de comercialización. Se suponía que todo permanecería en silencio mientras el equipo decidía los próximos pasos. Los clientes lo encontraron de todos modos. Más de 100 clientes y casi 1000 usuarios lo adoptaron en dos semanas, íntegramente a través de descubrimiento orgánico.

“No hicimos ningún movimiento de comercialización detrás de esto. No pensamos que la gente lo encontraría. Bueno, lo hicieron”, dijo Flores. “¿Estamos confundidos acerca de cómo hacemos realmente los movimientos de comercialización? ¿Hacemos una versión beta ya que técnicamente está activa?”

La adopción no planificada también ha creado una brecha de cumplimiento. Treasure Data todavía está en el proceso de certificar formalmente el Código del Tesoro bajo su programa de cumplimiento Trust AI, una certificación que no se había completado antes de que el producto llegara a los clientes.

Un segundo problema surgió cuando Treasure Data abrió el desarrollo de habilidades a equipos que no eran de ingeniería. Los CSM y los directores de cuentas comenzaron a desarrollar y presentar habilidades sin comprender qué se aprobaría y fusionaría, lo que generó un esfuerzo desperdiciado significativo y una acumulación de presentaciones que no lograron aclarar las políticas de acceso al repositorio.

Validación empresarial y lo que aún falta

Thomson Reuters se encuentra entre los primeros en adoptarlo. Flores dijo que la compañía estaba tratando de construir una plataforma interna de agentes de IA y tenía dificultades para avanzar lo suficientemente rápido. Se conectó con AI Agent Foundry de Treasure Data para acelerar el trabajo de segmentación de audiencia y luego lo extendió a Treasure Code para personalizarlo e iterarlo más rápido.

Los comentarios, dijo Flores, se centraron en la extensibilidad y la flexibilidad, y en el hecho de que la adquisición ya se había realizado, lo que eliminó una importante barrera empresarial para la adopción.

La brecha que Thomson Reuters señaló, y que Flores reconoce que el producto aún no aborda, es una guía sobre la madurez de la IA. Treasure Code no les dice a los usuarios quién debería usarlo, qué resolver primero o cómo estructurar el acceso en diferentes niveles de habilidades dentro de una organización.

“La IA que te permite aprovecharte pero también te dice cómo aprovecharte, creo que eso es muy diferente”, dijo Flores. Él ve esto como la siguiente capa importante que se construirá.

Lo que los líderes de ingeniería deberían aprender de esto

Flores se tomó el tiempo para reflexionar sobre lo que realmente le enseñó la experiencia y fue sincero sobre lo que cambiaría. La próxima vez, dijo, la divulgación sería interna primero.

“Sólo lo vamos a publicar internamente. No lo voy a revelar a nadie fuera de la organización”, dijo. “Será una liberación más controlada para que realmente podamos saber a qué estamos expuestos con menos riesgo”.

En el desarrollo de habilidades, la lección fue establecer criterios claros sobre lo que se aprueba y fusiona antes de abrir el proceso a equipos ajenos a la ingeniería, no después.

El hilo conductor de ambas lecciones es el mismo que dio forma a la arquitectura de gobernanza y al proceso de tres niveles: la velocidad sólo es una ventaja si se mantiene la estructura que la rodea. Para los líderes de ingeniería que evalúan si la codificación de agentes está lista para la producción, la experiencia de Treasure Data se traduce en tres conclusiones prácticas.

  1. La infraestructura de gobernanza debe preceder al código, no seguirlo. Los controles de acceso a nivel de plataforma y la herencia de permisos son los que hicieron que fuera seguro permitir que la IA se generara libremente. Sin esta base, la ventaja de la velocidad desaparece porque cada resultado requiere una revisión manual exhaustiva.

  2. Un puerto de calidad que no dependa totalmente del ser humano no es opcional a gran escala. Construya una puerta de calidad que no dependa exclusivamente de los humanos. La IA puede revisar cada solicitud de extracción de manera consistente, sin fatiga, y verificar sistemáticamente el cumplimiento de las políticas en todo el código base. La revisión humana sigue siendo esencial, pero como control final más que como mecanismo de calidad primario.

  3. Plan de adopción orgánica. Si el producto funciona, la gente lo encontrará antes de que usted esté listo. Las brechas de cumplimiento y comercialización que Treasure Data aún está cerrando son el resultado directo de subestimar esto.

“Sí, la codificación por vibración puede funcionar si se realiza de forma segura y si existen las salvaguardias adecuadas”, dijo Flores. “Acéptalo de una manera que encuentre formas de no reemplazar el buen trabajo que haces, sino el trabajo tedioso que probablemente puedas automatizar”.

Fuente