El lanzamiento de R2 de Deepseek tropieza con las fallas de chips de Huawei – Nvidia interviene mientras Alibaba se adelanta

- Deepseek retrasa el lanzamiento de R2 debido a dificultades técnicas persistentes con los chips Huawei Ascend
- Los sistemas NVIDIA H20 siguen siendo más confiables para la capacitación de IA que el hardware de ascendencia nacional
- El QWEN3 de Alibaba explota los retrasos de Deepseek, incorporando algoritmos centrales mientras mejora la eficiencia y la flexibilidad
El gigante chino de IA Deepseek aparentemente se ha encontrado con retrasos inesperados en la liberación de su último modelo, R2, después de enfrentar dificultades técnicas persistentes con los chips Ascend de Huawei.
La compañía había sido alentada por las autoridades chinas a adoptar procesadores nacionales en lugar de confiar en Sistemas H20 de NVIDIAque generalmente se consideran más maduros y confiables.
A pesar de que los ingenieros de Huawei están en el sitio para ayudar, Deepseek no pudo completar una carrera de capacitación exitosa usando chips ascend, y como resultado, la compañía confió en Nvidia Hardware para el entrenamiento mientras usa Ascender para tareas de inferencia.
Los desafíos técnicos retrasan el desarrollo de R2
El lanzamiento de R2, originalmente programado para mayo de 2025, se pospuso debido a estos obstáculos técnicos y un etiquetado de datos más largo de lo esperado para el conjunto de datos de capacitación actualizado.
Según los informes, el fundador de Deepseek, Liang Wenfeng, expresó insatisfacción con el progreso del modelo, enfatizando la necesidad de un tiempo de desarrollo adicional para producir un modelo capaz de mantener la ventaja competitiva de Deepseek.
Mientras tanto, competidores como el QWEN3 de Alibaba pudieron aprovechar este retraso, ya que ha incorporado los algoritmos de entrenamiento básicos de Deepseek mientras mejoran la eficiencia y la flexibilidad, mostrando cuán rápido pueden evolucionar los ecosistemas de IA incluso cuando una sola inicio lucha.
El impulso más amplio de Beijing para la autosuficiencia de IA ha presionado a las empresas nacionales para que adopten hardware local.
En la práctica, sin embargo, esta estrategia ha revelado brechas en la estabilidad, la conectividad entre chip y la madurez del software entre los chips Huawei y los productos NVIDIA.
Los desarrolladores continúan desempeñando un papel crucial en la configuración del éxito de los ecosistemas de IA: Nvidia ha enfatizado el mantenimiento del acceso a los desarrolladores chinos es estratégicamente importante, advirtiendo que restringir la adopción de la tecnología podría dañar los intereses de seguridad económica y nacional.
Mientras tanto, las empresas chinas de IA deben equilibrar las presiones del gobierno con realidades prácticas en el desarrollo y el despliegue LLMS.
A pesar de estos contratiempos, el modelo R2 de Deepseek aún se puede lanzar en las próximas semanas.
Es probable que el modelo enfrente un escrutinio con respecto a su rendimiento en relación con los rivales entrenados en hardware más maduro, ofreciendo un claro ejemplo de la tensión entre las ambiciones políticas, la capacidad técnica y la implementación de IA del mundo real.
A través de Arstechnica