Deesik lanza competidores GPT-5 que son adecuados para chips chinos.

El comienzo de la IA Deeseek china sorprendió al mundo en enero con el modelo AI llamado R1, el principal competidor de OpenAI y Antropology. Fue creado con solo el costo de esos otros modelos que usan menos chips Nvidia y se ha lanzado de forma gratuita. En este momento, solo dos semanas después de que el último Openai lanzó el GPT-5 Deeseek, de regreso con un modelo insignia V3 que los expertos dicen que coincide con el GPT-5 en ciertos estándares, y tiene un precio estratégico para reducir los precios.
El nuevo modelo V3.1 de Deeseek se ha lanzado en silencio en uno de los grupos de WeChat, que son todos los mensajes chinos y las aplicaciones de redes sociales, así como en su primera plataforma de abrazos. Experimente las mayores conferencias de IA. En un momento, Deeseek es una parte importante del ancho de China en el desarrollo y el control de la IA. Avanzado sin depender de la tecnología extranjera (y en realidad, el nuevo modelo V3 de Deeseek ha sido personalizado para funcionar bien en chips chinos).
Si bien las empresas en los Estados Unidos de América aceptan el modelo de Deeseek, son ampliamente aceptadas en China y aumentan en otras partes del mundo. Incluso algunas empresas estadounidenses crean aplicaciones en forma de Deeseek R1. Al mismo tiempo, los investigadores siempre están cerca del Partido Comunista Chino, la historia certificada, hagan preguntas sobre su neutralidad y credibilidad.
El impulso de la IA en China es más que Deeseek: su industria también incluye el modelo de Alibaba, Kimi de Moonshot Ai y Ernie de Baidu. Sin embargo, el nuevo lanzamiento de GPT-5 de la nueva OpenAI, que es el lanzamiento de la manera de gran altura, la determinación de progresar al frente.
Operai está preocupado por China y Deeseek.
Los esfuerzos de Deeseek nos hacen un laboratorio con seguridad. En la reciente cena con el reportero de Sam Altman de Openai, la competencia aumentó del modelo chino chino, incluido Deesseek, ha influido en las decisiones de su compañía que liberará su modelo de peso abierto hace dos semanas.
“Está claro que si no lo hacemos, el mundo se creará principalmente en el estilo abierto de Surz”, dijo Altman. “Ese es definitivamente nuestro factor de toma de decisiones, no el único. Pero eso es muy grande”.
Además, la semana pasada, Estados Unidos recibió la licencia NVIDIA y AMD para exportar los chips de IA chinos únicos, incluido el solo NVIDIA en el caso de que acepten entregar más del 15% de esas ventas a Washington. Beijing retrocedió rápidamente, moviéndose a la compra de chips de Nvidia después del secretario comercial. Howard Lutnick le dijo a CNBC el 15 de julio: “No vendemos lo mejor, no lo mejor.
Al aumentar la eficiencia del Deeseek para los chips chinos, la compañía es una señal para controlar las exportaciones de EE. UU. Y conducir para reducir la dependencia de los puestos NVIDIA de DeepSeek de NVIDIA. Observa que el nuevo modelo se ha ajustado para ser apropiado para el próximo “chip” en el país que se distribuirá pronto.
Altman, en la misma cena, advierte que Estados Unidos puede evaluar la complejidad y el progreso del progreso de China en IA demasiado bajo y que el único control de exportación puede no ser una solución confiable.
“Estoy preocupado por China”, dijo.
Menos pero aún aumentando las tareas
En técnico, lo que hace que el nuevo modelo de Deeseek sea sobresaliente es cómo crear con un ligero progreso que los consumidores no pueden ver. Pero para estos desarrolladores de innovación, V3.1 es más barato en el trabajo y más diverso que los competidores que están cerrados y más caros.
Por ejemplo, V3.1 es grande – 685 mil millones de parámetros, que están en el nivel de muchos modelos principales de “borde”. Pero el diseño de “ingredientes de expertos” significa solo los fragmentos del modelo que habilitan al responder cualquier pregunta.– Y diferente del modelo de Deeseek anterior, que separa el trabajo que se puede responder inmediatamente de acuerdo con la modificación del modelo del modelo que requiere razón, paso a paso, incluidas respuestas rápidas y razonamiento en un solo sistema.
GPT-5, incluidos los últimos modelos de Anthropology y Google, tienen habilidades similares. Pero solo unas pocas versiones abiertas que se pueden hacer hasta ahora la arquitectura híbrida de V3.1 es “las mejores características”, Ben Dickson, analista de tecnología y fundador del blog TechTalks. suerte–
Otros indican que si bien el modelo Deeseek es menor que el R1 de la compañía, lo cual es una forma de razones que se destilaron del V3 original que sorprendió al mundo en enero V3.1 sigue siendo excepcional. “Es bastante impresionante que sigan mejorando el siguiente paso”. Village Fall, el fundador y CEO de AI Lightning AI. Operai responderá si el modelo de su propio código abierto “comienza significativo” y señala que el modelo de Deepsek es difícil para los desarrolladores ingresar a la producción, mientras que la versión OpenAI es bastante fácil de aplicar.
Para todos los detalles técnicos, el último lanzamiento de Deeseek enfatiza el hecho de que la IA es vista como parte de la Guerra Fría de Tecnología, que se mueve entre Estados Unidos y China. En la mente, si la compañía china puede crear un mejor modelo de IA para lo que afirman que es solo una fracción del costo de los competidores de los EE. UU., Hay una razón para preocuparse por estar adelante.