Constitución de Claudio

Hace unas semanas, la empresa de inteligencia artificial Anthropic Publicar la constitución que utilizan para formar a Claude LLM. (“Bajo Escritura Creative Commons CC0 1.0Esto significa que cualquiera puede utilizarlo libremente para cualquier fin. sin pedir permiso”) Comunicado de prensa de la empresa: :

Estamos lanzando una nueva versión para nuestro modelo de IA Claude. Es una descripción detallada de la visión de la Antropología sobre los valores y comportamientos de Claude. Un documento holístico que describe el contexto en el que opera Claude y el tipo de entidad que queremos que sea Claude.

La estructura es una parte importante de nuestro proceso de formación de modelos. Y el contenido determina directamente el comportamiento de Claude. El modelo de formación es una tarea difícil y es posible que el desempeño de Claude no siempre cumpla con los ideales constitucionales. Pero pensamos en una manera de redactar una nueva Constitución con una explicación detallada de nuestras intenciones y el razonamiento detrás de ella. Esto hará que sea más probable que inculques buenos valores durante el entrenamiento.

en documento completo Hay más de 80 páginas, pero presione soltar Hace un buen trabajo al resumir lo que contiene.

La Constitución de Claude es el documento básico que expresa y define el carácter de Claude. Contiene una explicación detallada de los valores que queremos que Claude encarne y por qué. En él explicamos lo que creemos que significa ayudar a Claude. manteniéndolo en general seguro, ético y siguiendo nuestras pautas. La Constitución da a Claude información sobre su situación. y brindar consejos sobre cómo manejar situaciones difíciles y compensaciones, como equilibrar la honestidad con la empatía. y protección de información confidencial Aunque pueda parecer sorprendente, esta constitución fue escrita principalmente para Claude. Su objetivo es proporcionar a Claude el conocimiento y la comprensión que necesita para comportarse bien en el mundo.

Tratamos la Constitución como la autoridad final sobre cómo queremos que Claude sea y se comporte, es decir, a través de capacitación u otras directivas. dada a Claude debe ser coherente tanto con el texto como con el espíritu subyacente en él. Esto hace que la publicación de la Constitución sea extremadamente importante desde una perspectiva de transparencia. Ayuda a las personas a comprender cuáles de los comportamientos de Claude fueron intencionales y cuáles no. para tomar una decisión informada con información completa y proporcionar sugerencias útiles. Creemos que este tipo de transparencia será cada vez más importante a medida que la IA se vuelva más influyente en la sociedad.

Casey Newton y Kevin Rouse Recién entrevistado La autora principal de la Constitución, la filósofa Amanda Askell, para el podcast Hard Fork (los segmentos comienzan en aproximadamente 25 minutos)

Newton dijo que el documento decía: “Una carta de un padre a un niño que tal vez esté dejando la universidad”:

Y es como Esperamos que lleves contigo los valores con los que creciste. Y sabemos que no estaremos ahí para ayudarte con todo. Pero confiamos en ti. y buena suerte

Tanto La Constitución como la conversación con Askell son interesantes. No importa cuál sea su posición en el debate actual sobre la IA, es posible que le interese este vídeo en el que Askell responde las preguntas del usuario Claude sobre su trabajo:

Fuente