Un agente de IA se volvió rebelde en Meta y expuso datos confidenciales de la empresa y de los usuarios a empleados que no tenían permiso para acceder a ellos.

Según un informe de incidente, que fue visto y reportado por La informaciónun empleado de Meta publicó en un foro interno pidiendo ayuda con un problema técnico, lo cual es una acción estándar. Sin embargo, otro ingeniero le pidió ayuda a un agente de IA para analizar la pregunta y el agente terminó publicando una respuesta sin pedirle permiso al ingeniero para compartirla. Meta confirmó el incidente a The Information.

Resulta que el agente de IA no dio buenos consejos. El empleado que hizo la pregunta acabó siguiendo el consejo del agente, que sin darse cuenta puso a disposición de los ingenieros, que no estaban autorizados a acceder a ellos, grandes cantidades de datos de la empresa y de los usuarios durante dos horas.

Meta consideró el incidente “Sev 1”, que es el segundo nivel más alto de gravedad en el sistema interno de la empresa para medir problemas de seguridad.

Los agentes rebeldes de IA ya han planteado un problema en Meta. Summer Yue, directora de seguridad y alineación de Meta Superintelligence, publicado en X el mes pasado describiendo cómo su agente de OpenClaw terminó borrando toda su bandeja de entrada, a pesar de que le pidió que confirmara con ella antes de tomar cualquier medida.

Aun así, Meta parece optimista sobre el potencial de la IA del agente. La semana pasada, Meta compró Libro de mudaun sitio de redes sociales similar a Reddit para que los agentes de OpenClaw se comuniquen entre sí.

Fuente