Inicio Técnica Operai lanza dos modelos de razonamiento de IA ‘abierto’

Técnica

Operai lanza dos modelos de razonamiento de IA ‘abierto’

Por

5 agosto 2025

Openai anunció el martes el lanzamiento de dos modelos de razonamiento de IA de peso abierto con capacidades similares a su serie O. Ambos están disponibles gratuitamente para descargar desde la plataforma de desarrolladores en línea Cara abrazadadijo la compañía, describiendo los modelos como “estado del arte” cuando se mide en varios puntos de referencia para comparar modelos abiertos.

Los modelos vienen en dos tamaños: un modelo GPT-OSS-20B más grande y más capaz que puede ejecutarse en una sola GPU NVIDIA, y un modelo GPT-OSS-20B de peso más ligero que puede ejecutarse en una computadora portátil de consumo con 16 GB de memoria.

El lanzamiento Marca del primer modelo de idioma ‘abierto’ de OpenAi desde GPT-2que se lanzó hace más de cinco años.

En una sesión informativa, OpenAi dijo que sus modelos abiertos serán capaces de enviar consultas complejas a Modelos de IA en la nube, Como informó TechCrunch anteriormente. Eso significa que si el modelo abierto de OpenAI no es capaz de una determinada tarea, como procesar una imagen, los desarrolladores pueden conectar el modelo abierto a uno de los modelos cerrados más capaces de la compañía.

Mientras que los modelos de IA de origen abierto de OpenAI en sus primeros días, la compañía generalmente ha favorecido un enfoque de desarrollo de código cerrado patentado. La última estrategia ha ayudado a Operai a construir una gran empresa que vende acceso a sus modelos de IA a través de una API a empresas y desarrolladores.

Sin embargo, el CEO Sam Altman dijo en enero que cree que OpenAi ha estado “en el lado equivocado de la historia” cuando se trata de abordar sus tecnologías. La compañía hoy enfrenta una creciente presión de los laboratorios de IA chinos, incluidos Deepseek, el Qwen de Alibaba y Moonshot AI, que han desarrollado varios de los modelos abiertos más capaces y populares del mundo. (Mientras que Meta anteriormente dominaba el espacio abierto de IA, los modelos de IA Llama de la compañía han Quedarse atrás en el último año).

En julio, la administración Trump también instó a los desarrolladores de IA de EE. UU. código abierto más tecnología para promover la adopción global de IA alineada con los valores estadounidenses.

Evento de TechCrunch

San Francisco
|
27-29 de octubre de 2025

Con el lanzamiento de GPT-OSS, Operai espera que se convierta en el favor de los desarrolladores y la administración Trump, los cuales han visto a los laboratorios de IA chinos ascender a la prominencia en el espacio de código abierto.

“Volviendo a cuando comenzamos en 2015, la misión de Openai es garantizar AGI que beneficie a toda la humanidad”, dijo Altman en un comunicado compartido con TechCrunch. “Con ese fin, estamos entusiasmados de que el mundo se construya en una pila de IA abierta creada en los Estados Unidos, basado en valores democráticos, disponibles de forma gratuita para todos y para un amplio beneficio”.

Créditos de imagen:Tomohiro Ohsumi / Getty Images

Cómo se desempeñaron los modelos

OpenAi tenía como objetivo hacer su Abierto Modelo A Leader Entre otros modelos de IA de peso abierto, y la compañía afirma haber hecho exactamente eso.

En CodeForces (con herramientas), una prueba de codificación competitiva, GPT-OSS-120B y GPT-OSS-20B obtienen 2622 y 2516, respectivamente, superan a Deepseek’s R1 al tiempo que tiene un rendimiento inferior de O3 y O4-Mini.

El rendimiento del modelo abierto de OpenAI en CodeForces.Créditos de imagen:Opadai

En el último examen de la Humanidad (HLE), una prueba desafiante de preguntas de crowdsourcing en una variedad de temas (con herramientas), GPT-OSS-20B y GPT-OSS-20B obtienen un 19% y 17.3%, respectivamente. Del mismo modo, esto tiene un rendimiento inferior a O3, pero supera a los modelos abiertos líderes de Deepseek y Qwen.

El rendimiento del modelo abierto de Openai en HLE.Créditos de imagen:Opadai

En particular, los modelos abiertos de OpenAI alucinan significativamente más que sus últimos modelos de razonamiento de IA, O3 y O4-Mini.

Las alucinaciones han sido cada vez más severo En los últimos modelos de razonamiento de IA de OpenAI, y la compañía dijo anteriormente que no entiende por qué. En un libro blanco, OpenAi dice que esto es “esperado, ya que los modelos más pequeños tienen menos conocimiento mundial que los modelos fronterizos más grandes y tienden a alucinar más”.

Operai descubrió que GPT-OSS-20B y GPT-OSS-20B alucinaron en respuesta al 49% y el 53% de las preguntas sobre Personqa, el punto de referencia interno de la compañía para medir la precisión del conocimiento de un modelo sobre las personas. Eso es más que triplicar la tasa de alucinación del modelo O1 de OpenAI, que obtuvo un puntaje del 16%, y más alto que su modelo O4-Mini, que obtuvo un 36%.

Entrenando los nuevos modelos

Operai dice que sus modelos abiertos fueron entrenados con procesos similares a sus modelos patentados. La compañía dice que cada modelo abierto aprovecha la mezcla de expertos (MOE) para tocar menos parámetros para cualquier pregunta dada, lo que hace que se ejecute de manera más eficiente. Para GPT-OSS-120B, que tiene 117 mil millones de parámetros totales, OpenAI dice que el modelo solo activa 5.1 mil millones de parámetros por token.

La compañía también dice que su modelo abierto fue capacitado con alto rendimiento Aprendizaje de refuerzo (RL) -Un proceso posterior a la capacitación para enseñar modelos de IA correctamente desde malos entornos simulados utilizando grandes grupos de GPU NVIDIA. Esto también se utilizó para entrenar la serie O de los modelos O de Openai, y los modelos abiertos tienen un proceso similar de la cadena de pensamiento en el que toman tiempo adicional y recursos computacionales para trabajar a través de sus respuestas.

Como resultado del proceso posterior a la capacitación, OpenAI dice que sus modelos de IA abiertos se destacan en los agentes de IA y son capaces de llamar a herramientas como la búsqueda web o la ejecución del código de Python como parte de su proceso de cadena de pensamiento. Sin embargo, OpenAI dice que sus modelos abiertos son solo de texto, lo que significa que no podrán procesar o generar imágenes y audio como los otros modelos de la compañía.

Operai está lanzando GPT-OSS-120B y GPT-OSS-20B bajo la licencia Apache 2.0, que generalmente se considera una de las más permisivas. Esta licencia permitirá a las empresas monetizar los modelos abiertos de OpenAI sin tener que pagar u obtener el permiso de la empresa.

Sin embargo, a diferencia de las ofertas de código abierto de AI Labs como AI2, OpenAI dice que no liberará los datos de capacitación utilizados para crear sus modelos abiertos. Esta decisión no es sorprendente dado que varias demandas activas contra los proveedores de modelos de IA, incluido OpenAI, han alegado que estas compañías capacitaron inapropiadamente sus modelos de IA en trabajos con derechos de autor.

Opadai demorado El lanzamiento de sus modelos abiertos varios tiempos en los últimos meses, en parte para abordar las preocupaciones de seguridad. Más allá de las políticas de seguridad típicas de la compañía, Openai dice en un libro blanco que también investigó si los malos actores podrían ajustar sus modelos GPT-oss para que sean más útiles en los ataques cibernéticos o la creación de armas biológicas o químicas.

Después de las pruebas de los evaluadores de OpenAI y terceros, la compañía dice que GPT-oss puede aumentar marginalmente las capacidades biológicas. Sin embargo, no encontró evidencia de que estos modelos abiertos pudieran alcanzar su umbral de “alta capacidad” para el peligro en estos dominios, incluso después del ajuste.

Si bien el modelo de OpenAI parece ser de vanguardia entre los modelos abiertos, los desarrolladores esperan ansiosamente el lanzamiento de Deepseek R2, su próximo modelo de razonamiento de IA, así como un nuevo modelo abierto del laboratorio de superinteligencia de Meta.

Fuente

Operai lanza dos modelos de razonamiento de IA ‘abierto’

Cómo se desempeñaron los modelos

Entrenando los nuevos modelos

Últimas noticias

¿Por qué dormir bien comienza por la mañana?

Los candidatos pacifistas enfrentan una prueba temprana para los demócratas estadounidenses...

Informe: Khalil Mack no se retirará con planes de explorar todas...

La muerte del ayatolá iraní Jamenei provoca indignación entre los clientes...

El juez desestima los cargos de blanqueo de capitales contra Joan...

Lanzamiento del tráiler de Jab Khuli Kitab: Pankaj Kapoor, Dimple Kapadia...

Melania Trump hace historia e impulsa la “paz a través de...

Estatua de Los Lagartos en El Paso, Texas

Weston McKennie, centrocampista estadounidense, amplía contrato con la Juventus hasta 2030

Mastodon ahora tiene un botón para compartir contenido de otros sitios

Presidente cubano impulsa cambios “urgentes” en el modelo económico y empresarial...

Molly-May Hague y Tommy Fury ‘preocupados’ por enviar a Bambi a...

Lunes 2 de marzo de 2026: 4 propietarios de hoteles

AurumX se asocia con KazarHQ para construir un ecosistema de juegos...

Categoría