Alibaba se encuentra en la Conferencia Mundial de Inteligencia Artificial celebrada en el Centro de Exposiciones de la Exposición Mundial de Shanghai el 5 de julio de 2024 en Shanghai, China.
Nurfoto | Nurfoto | Imágenes falsas
Mercados estadounidenses antrópicos y Herramientas altruistas en el software. Los gigantes tecnológicos de China lanzaron esta semana modelos de inteligencia artificial que muestran avances en robótica y producción de videos.
AlibabaCreador de TikTok ByteDance y plataforma de vídeos cortos kuaishouHa publicado nuevos modelos de inteligencia artificial que subrayan cómo las empresas chinas se mantienen al día con las empresas de Estados Unidos.
Google sigue al jefe de DeepMind, Demis Hassabis le dijo a CNBC Que los modelos chinos de IA están a sólo “meses” de retraso con respecto a sus rivales occidentales.
Estos modelos de China compiten directamente con los modelos de renderizado de vídeo como Sora de OpenAI, así como con los modelos de robótica de China. NVIDIA Y Google.
Aquí tenéis un resumen de los modelos.
RynnBrain de Alibaba
Academia DAMO de Alibaba Presentamos RynnBrain esta semanaUn modelo de inteligencia artificial diseñado para ayudar a los robots a comprender el mundo físico que los rodea e identificar objetos.
En una demostración en vídeo, Alibaba mostró un robot con manos de agarre que puede contar naranjas, recogerlas y ponerlas en una cesta. También se mostró sacando leche del refrigerador.
Los modelos requieren una formación exhaustiva para garantizar que puedan identificar objetos cotidianos con los que interactuar; Esto significa que tareas simples como recoger fruta pueden resultar un desafío para la robótica.
RynnBrain ahora pone a Alibaba en competencia con sus pares NVIDIA Y Google Están desarrollando sus propios modelos de inteligencia artificial para robots.
“Una de sus innovaciones más importantes es la conciencia incorporada del tiempo y el espacio”, dijo a CNBC Adina Yakefu, una de las investigadoras de Hugging Face.
“En lugar de simplemente reaccionar a entradas momentáneas, el robot puede recordar cuándo y dónde ocurrieron los eventos, rastrear el progreso de la tarea y continuar a través de múltiples pasos. Esto lo hace más confiable y consistente en entornos complejos del mundo real”.
Yakefu añadió que el “objetivo más amplio” de Alibaba es “construir una capa fundamental de inteligencia para sistemas incorporados”.
Sedance 2.0 de ByteDance
Sedance 2.0 es un modelo de IA de renderizado de video que puede crear un video realista a partir de un único mensaje de texto del usuario. Sin embargo, las indicaciones también pueden incluir otros videos e imágenes.
Los vídeos creados con Seedance 2.0 y revisados por CNBC muestran imágenes y vídeos muy realistas creados íntegramente por inteligencia artificial.
Billy Boman, que dirige una agencia de publicidad creativa con sede en Estocolmo, Suecia, que produce contenido generado por IA, utilizó Sedance 2.0.
Dijo que la producción de videos con inteligencia artificial ha logrado avances significativos en los últimos dos años, con rápidos desarrollos en toda la industria.

“En 2023… era difícil convencer a alguien de correr o caminar. Cualquier realismo [limited to] Los clips eran demasiado cortos, todo era demasiado lento, las texturas eran malas, no había texturas de piel, faltaban detalles. Ahora el escenario es al revés. Puedo hacer cualquier cosa ahora. “Los avances tecnológicos han sido extraordinarios”, dijo Boman a CNBC en una entrevista. dijo.
Yakefu de Hugging Face añadió que el modelo Sedance 2.0 avanza con respecto a las generaciones anteriores en términos de “controlabilidad, velocidad y eficiencia de producción”.
“Seedance 2.0 es uno de los modelos de creación de video más completos que he probado. Me sorprendió mucho cómo, incluso con una simple guía, obtuvo resultados satisfactorios en el primer intento. Las imágenes, la música y la cinematografía se combinan de una manera más pulida que experimental”, dijo Yakefu.
Pero mientras los usuarios elogian la tecnología, Sedance tiene problemas. Medios locales chinos reportado Sedance ha suspendido una función que permitía a la IA crear la voz de una persona basándose en una imagen que cargaba. Esto se produce después de que un bloguero en China expresara su preocupación por la producción de audio no consensuada.
ByteDance no estuvo disponible de inmediato para hacer comentarios cuando CNBC lo contactó.
Kling 3.0 de Kuaishou
Lanzado la semana pasada, Kling 3.0 de Kuaishou es otro modelo de renderizado de video que rivaliza con ByteDance.
Kling 3.0 “ofrece mejoras importantes en consistencia, salida fotorrealista, duración de video extendida hasta 15 segundos y reproducción de audio nativo en múltiples idiomas, dialectos y acentos.
Kuaishou dijo que el modelo sólo está disponible para suscriptores de pago, pero que pronto estará disponible para el público.
El éxito de Kuaishou con sus modelos Kling ha sido un factor clave detrás del aumento de más del 50% en el precio de sus acciones durante el año pasado.
Acciones de Kuaishou desde principios de año hasta hoy.
Otros lanzamientos notables de modelos de IA
Zhipu AI – operando de la siguiente manera: Tecnología del atlas de información En Hong Kong – lo vi Las acciones subieron el jueves Después del lanzamiento de GLM-5, un modelo de lenguaje grande y código abierto con capacidades de codificación avanzadas y tareas de agente de larga duración.
La compañía dijo que el modelo. Claude Opus de Anthropic se acerca al 4.5 En las pruebas de codificación, superó al Gemini 3 Pro de Google en algunas pruebas. CNBC no pudo verificar estas afirmaciones.
acciones minimax Luego saltó el jueves. lanzado actualizado M2.5 Modelo de código abierto con herramientas avanzadas de agentes de IA. “Agentes” o “IA de agencia” se refiere a herramientas de IA diseñadas para automatizar tareas.
— Anniek Bao y Dylan Butts de CNBC contribuyeron a este informe.













