Deepseek de China lanza el modelo de IA ‘intermedio’ de China en la ruta a la próxima generación

0 13 1 minute read

Deepseek de China lanza el modelo de IA ‘intermedio’ de China en la ruta a la próxima generación

Es probable que esa arquitectura sea el lanzamiento de productos más importante de Deepseek ya que V3 y R1 conmocionaron a los inversores de Silicon Silicon e inversores tecnológicos fuera de China [File]
| Crédito de la foto: Reuters

El desarrollador chino de IA Deepseek ha lanzado su último modelo “experimental”, Lo que dijo fue más eficiente para entrenar y mejor para procesar secuencias largas de texto que las iteraciones anteriores de sus modelos de idiomas grandes.

La compañía con sede en Hangzhou llamó a Deepseek-V3.2-Exex un “paso intermedio hacia nuestra arquitectura de próxima generación” en una publicación sobre el foro de desarrolladores que abraza la cara.

Esa arquitectura probablemente será el lanzamiento de productos más importante de Deepseek ya que V3 y R1 conmocionaron a los inversores de Silicon Silicon e inversores tecnológicos fuera de China.

El modelo V3.2-EXP incluye un mecanismo llamado Deepseek SpeSte Attence, que la firma china dice que puede reducir los costos informáticos y aumentar algunos tipos de rendimiento del modelo. Deepseek dijo en una publicación sobre X el lunes que está reduciendo los precios de API en un “50%+”.

Si bien es poco probable que la arquitectura de próxima generación de Deepseek vaya a los mercados como lo hicieron las versiones anteriores en enero, aún podría ejercer una presión significativa sobre rivales nacionales como las contrapartes Qwen y Estados Unidos de Alibaba como OpenAI si puede repetir el éxito de Deepseek R1 y V3.

Eso requeriría que demuestre una alta capacidad para una fracción de lo que los competidores cobran y gastan en capacitación modelo.

Publicado – 30 de septiembre de 2025 09:34 en IS

Fuente

Manuel García 5 horas ago

0 13 1 minute read