Técnica
Anthrope libera Petri, una herramienta de código abierto que utiliza agentes de IA para pruebas de seguridad, y dice que observó múltiples casos de modelos que intentaban soplar el silbato (antrópico)

Antrópico:
Antropic liberidad Petri, una herramienta de código abierto que utiliza agentes de IA para pruebas de seguridad, y dice que observó múltiples casos de modelos que intentaban soplar el silbato -Petri (herramienta de exploración paralela para interacciones riesgosas) es nuestra nueva herramienta de código abierto que permite a los investigadores explorar hipótesis sobre el comportamiento del modelo con facilidad.
Fuente