Técnica

Anthrope libera Petri, una herramienta de código abierto que utiliza agentes de IA para pruebas de seguridad, y dice que observó múltiples casos de modelos que intentaban soplar el silbato (antrópico)


Antrópico:

Antropic liberidad Petri, una herramienta de código abierto que utiliza agentes de IA para pruebas de seguridad, y dice que observó múltiples casos de modelos que intentaban soplar el silbato -Petri (herramienta de exploración paralela para interacciones riesgosas) es nuestra nueva herramienta de código abierto que permite a los investigadores explorar hipótesis sobre el comportamiento del modelo con facilidad.



Fuente

Related Articles

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Back to top button