Técnica

OpenAi se enfrenta a Meta y Deepseek con modelos AI gratuitos y personalizables | Inteligencia artificial (IA)

Operai se enfrenta al meta y rival chino de Mark Zuckerberg, Deepseek, lanzando sus propios modelos de inteligencia artificiales disponibles gratuitamente.

El desarrollador de ChatGPT ha anunciado dos modelos de idiomas grandes “de peso abierto”, que son de descarga gratuitos y pueden ser personalizados por los desarrolladores.

Los modelos de Llama de Meta están disponibles de manera similar, y el movimiento de OpenAI marca un desvío de ChatGPT, que se basa en un modelo “cerrado” que no se puede personalizar.

Sam Altman, director ejecutivo de Openai, dijo que la compañía estaba emocionada de agregar a una pila de modelos de IA disponibles gratuitamente “basado en valores democráticos … y para un amplio beneficio”.

Agregó: “Estamos entusiasmados de hacer este modelo, el resultado de miles de millones de dólares de investigación, disponibles para el mundo para poner a la IA en manos de la mayoría de las personas posibles”.

Operai dijo que los modelos podrían sustentar un agente de IA que opera de forma autónoma, y que fueron “diseñadas para ser utilizadas dentro de los flujos de trabajo de agente”.

Zuckerberg, de manera similar, ha dicho que hacer modelos disponibles libremente y personalizable “asegurará que más personas en todo el mundo tengan acceso a los beneficios y oportunidades de la IA” y que el poder no se concentra en manos de un pequeño número de empresas.

Sin embargo, Meta ha dicho que su compañía puede necesitar ser “cuidadosa” al adoptar un enfoque similar con modelos de IA altamente avanzados.

Skip Paster Newsletter Promotion

Sam Altman recientemente compartió una captura de pantalla de lo que parecía ser el último modelo de IA de la compañía, GPT-5. Fotografía: Alexander Drago/Reuters

Deepseek, un Rival chino a OpenAi y Metatambién ha lanzado modelos poderosos que se pueden descargar y personalizar libremente.

Operai dijo que los dos modelos, llamados GPT-ASS-120B y GPT-OSS-20B-Two, superaron a los modelos de tamaño similar en tareas de razonamiento, con el modelo de 120b más grande que alcanza un rendimiento casi igual a su modelo O4-Mini en términos de razonamiento central.

La compañía agregó que durante el proceso de prueba había creado versiones “malhumoradas malos” de los modelos para simular amenazas biológicas y de ciberseguridad, pero descubrieron que no podían alcanzar niveles de capacidad altos “.

La existencia de modelos de IA poderosos y disponibles gratuitamente que los desarrolladores pueden personalizar a algunos expertos que han advertido que podrían adaptarse causar daños gravescomo desarrollar biowapons.

Meta ha definido sus modelos de llama como “código abierto”, lo que significa que también se pueden descargar y personalizar libremente, mientras que sus conjuntos de datos de capacitación, arquitectura y código de capacitación también se proporcionan.

Sin embargo, la iniciativa de código abierto, una organización de la industria con sede en Estados Unidos, ha dicho que las restricciones que meta coloca en usar sus modelos significa que no califica como código abierto. Operai ha utilizado el término “peso abierto”, en efecto, una muesca de código abierto, lo que significa que el modelo aún puede ajustarse, pero sus trabajos no son completamente transparentes para el desarrollador.

El anuncio de Openai se produjo en medio de especulaciones de que una nueva versión del modelo que sustenta ChatGPT podría lanzarse pronto. El domingo Altman compartió una captura de pantalla de lo que parecía ser el último modelo de IA de la compañía, GPT-5.

Mientras tanto, Google tiene describió su último paso hacia la inteligencia general artificial (AGI) con un nuevo modelo que permite que los sistemas de IA interactúen con una simulación convincente del mundo real.

El “modelo mundial” de Genie 3 podría usarse para entrenar robots y vehículos autónomos mientras se relacionan con recreaciones realistas de entornos como los almacenes, según Google.

Su división de ai, Google DeepMindargumenta que los modelos mundiales son un paso clave para lograr AGI, un nivel hipotético de IA donde un sistema puede llevar a cabo la mayoría de las tareas a la par con los humanos, en lugar de solo tareas individuales como jugar al ajedrez o traducir idiomas, y potencialmente hacer el trabajo de alguien.

DeepMind dijo que tales modelos jugarían un papel importante en el desarrollo de los agentes de IA, o sistemas que realizan tareas de forma autónoma.

“Esperamos que esta tecnología desempeñe un papel fundamental mientras empujamos hacia AGI, y los agentes juegan un papel más importante en el mundo”. Profundo dicho.

Fuente

Related Articles

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Back to top button