Técnica

Operai libera modelos de razonamiento de peso abierto optimizados para ejecutar en computadoras portátiles

Los parámetros o pesos capacitados de un modelo de idioma abierto son accesibles públicamente [File]
| Crédito de la foto: Reuters

Openai dijo el martes que ha lanzado dos modelos de idiomas de peso abierto que se destacan en un razonamiento avanzado y están optimizados para ejecutarse en computadoras portátiles con niveles de rendimiento similares a sus modelos de razonamiento patentados más pequeños.

Los desarrolladores pueden utilizar los parámetros o pesos capacitados de un modelo de lenguaje abierto, lo que los desarrolladores pueden utilizar para analizar y ajustar el modelo para tareas específicas sin requerir datos de capacitación originales.

“Una de las cosas que son únicas sobre los modelos abiertos es que las personas pueden ejecutarlos localmente. La gente puede ejecutarlas detrás de su propio firewall, en su propia infraestructura”, dijo el cofundador de Operai, Greg Brockman, en una sesión informativa de prensa.

Los modelos de lenguaje de peso abierto son diferentes de los modelos de código abiertoque proporcionan acceso al código fuente completo, datos de capacitación y metodologías.

Por separado, Amazon anunció que los modelos de peso abierto de OpenAI ahora están disponibles en su mercado de IA generativo de roca en Amazon Web Services. Marca la primera vez que se ofrece un modelo Operai en Bedrock, dijo Atul Deo, director de productos de Bedrock.

“Openai ha estado desarrollando excelentes modelos y creemos que estos modelos serán excelentes opciones de código abierto, o opciones de modelos de peso abierto para los clientes”, dijo Deo, en una entrevista. Se negó a discutir cualquier acuerdo contractual entre AWS y OpenAI.

Las acciones de Amazon cayeron la semana pasada después de que la compañía informó desacelerar el crecimiento en su unidad AWS, particularmente en comparación con los rivales. El paisaje de los modelos AI de peso abierto y de código abierto ha sido muy disputado este año. Durante un tiempo, los modelos de llama de Meta se consideraron los mejores, pero eso cambió a principios de este año cuando Deepseek de China lanzó un modelo de razonamiento poderoso y rentable, mientras que Meta luchó por entregar LLAMA 4.

Los dos nuevos modelos Operai son los primeros modelos abiertos que Openai ha lanzado desde GPT-2, que se lanzó en 2019.

El modelo más grande de OpenAI, GPT-OSS-20B, puede ejecutarse con una sola GPU, y el segundo, GPT-OSS-20B, es lo suficientemente pequeño como para funcionar directamente en una computadora personal, dijo la compañía.

Operai dijo que los modelos tienen un rendimiento similar a sus modelos de razonamiento patentados llamados O3-Mini y O4-Mini, y especialmente Excel en la codificación, las matemáticas de competencia y las consultas relacionadas con la salud.

Los modelos fueron entrenados en un conjunto de datos solo de texto que además del conocimiento general, se centró en la ciencia, las matemáticas y el conocimiento de la codificación. Operai no lanzó puntos de referencia que compararon los modelos de peso abierto con los modelos de los competidores como el modelo Deepseek-R1. OpenAi respaldado por Microsoft, actualmente valorado en $ 300 mil millones, actualmente está recaudando hasta $ 40 mil millones en una nueva ronda de fondos dirigida por SoftBank Group.

Fuente

Related Articles

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Check Also
Close
Back to top button