La firma de IA de ex openai CTO anuncia el primer producto para ajustar a los modelos de IA

0 4 2 minutes read

La firma de IA de ex openai CTO anuncia el primer producto para ajustar a los modelos de IA

Foto del archivo: Thinking Machines ha presentado su primer producto, Tinker, que facilita el proceso de ajuste de los modelos de IA. | Crédito de la foto: AP

Thinking Machines, la startup de IA fundada por la ex CTO Operai Mira Murati, ha presentado su primer producto, Tinker, que facilita el proceso de los modelos AI ajustados. La API se ha puesto a disposición para desarrolladores en beta privada.

“Tinker trae herramientas fronterizas a los investigadores, ofreciendo abstracciones limpias para escribir experimentos y capacitar tuberías mientras maneja la complejidad de capacitación distribuida. Permite nuevas investigaciones, modelos personalizados y líneas de base sólidas”, dijo Murati en X mientras hace el anuncio.

Normalmente, los modelos AI ajustados para tareas específicas implican la gestión de grupos de GPU para que las ejecuciones de entrenamiento sean eficientes y suaves. Tinker quiere automatizar este proceso y brindar a los investigadores acceso a la API fácil de usar para que puedan controlar las diferentes partes del ajuste fino: las funciones de pérdida, los bucles de capacitación y los flujos de trabajo de datos en el código de Python, mientras que Tinker se encarga de las GPU distribuidas.

Tinker tiene dos modelos de código abierto, Llama de Meta y el Qwen de Alibaba para que los usuarios ajusten, un informe de Cableado fijado.

El ex cofundador de Openai, Andrej Karpathy, elogió el lanzamiento en X que decía: “Si es un investigador/desarrollador, Tinker simplifica drásticamente la Training de LLM. En comparación con el paradigma más común y existente de”, cargaremos sus datos, postales posteriores a su LLM, “esto es un lugar más inteligente para” recortar “la complejidad de la compensación de la compra de la compra, tanto delgando el ritmo pesado, y también es un lugar más inteligente de la mayoría de la mayoría de la mayoría de la mayor parte delgada, y también es un lugar más inteligente de la mayoría de la intensidad, básica, y también el levantamiento de la intensidad. Datos/control creativo algorítmico “.

El laboratorio ha sido relativamente más transparente que las empresas como OpenAI mientras publican investigaciones recientemente. En septiembre, publicó un blog sobre la “derrota del no determinismo” en los modelos de idiomas grandes (LLM).

A principios de este año, en julio, Thinking Machines recaudó $ 2 mil millones en fondos iniciales a una fuerte valoración de $ 12 mil millones.

Publicado – 03 de octubre de 2025 03:16 pm es

Fuente

Manuel García 10 horas ago

0 4 2 minutes read