Técnica

Anthrope nucleará su intento de usar AI para construir una nuclear


  • Anthrope ha desarrollado una herramienta con IA que detecta y bloquea los intentos de pedirles a los chatbots de AI para el diseño de armas nucleares
  • La compañía trabajó con el Departamento de Energía de los Estados Unidos para garantizar que la IA pueda identificar tales intentos
  • Anthrope afirma que ve las peligrosas indicaciones nucleares con una precisión del 96% y ya ha demostrado ser efectivo en Claude

Si eres el tipo de persona que le pregunta a Claude cómo hacer un sándwich, estás bien. Si eres el tipo de persona que pregunta a la IA chatbot Cómo construir una bomba nuclear, no solo dejará de obtener ningún plan, sino que también puede enfrentar algunas preguntas puntuales. Eso es gracias al detector recién implementado de Anthrope de indicaciones nucleares problemáticas.

Al igual que otros sistemas para detectar consultas a las que Claude no debería responder, el nuevo clasificador escanea las conversaciones de los usuarios, en este caso marcando cualquier territorio que se vea al territorio de “cómo construir un arma nuclear”. Anthrope construyó la función de clasificación en una asociación con la Administración Nacional de Seguridad Nuclear del Departamento de Energía de los Estados Unidos (NNSA), dándole toda la información que necesita para determinar si alguien solo pregunta cómo funcionan esas bombas o si están buscando planos. Se realiza con una precisión del 96% en las pruebas.

Fuente

Related Articles

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Back to top button