MAI‑Image‑1 coloca a Microsoft en el juego del arte de la IA, esta vez con su propio pincel

- Microsoft ha lanzado MAI‑Image‑1, su primer modelo interno de conversión de texto a imagen
- El modelo se centra en la velocidad, el fotorrealismo y la flexibilidad, con el objetivo de evitar tropos visuales repetitivos.
- MAI-Image-I llegará pronto a Copilot y Bing
microsoft acaba de presentar MAI‑Image‑1, su primer generador interno de texto a imagen. Al construir el modelo internamente, Microsoft está apostando un nuevo reclamo, compitiendo no sólo con pesos pesados de la industria como Google‘s Nano Banana y Midjourney, pero también con su socio muy cercano, la propia línea de modelos de imágenes de IA de OpenAI.
MAI‑Image‑1 ya se ubicó entre los 10 primeros en la clasificación de LMArena, una plataforma pública de evaluación comparativa donde es el único lugar donde está disponible por ahora. Sin embargo, eso cambiará pronto, ya que Microsoft dice que el modelo pronto se implementará en Copilot y Bing Creador de imágenes.
Microsoft está particularmente orgulloso de los valores de producción fotorrealistas de MAI-Image-1 y de la iluminación y texturas controlables. La idea de la empresa era ofrecer imágenes de IA que no se parecieran a las creadas por otros modelos, diferenciándose de la estética común y familiar para cualquiera que haya visto muchas imágenes de IA, en particular las de la forma “basura” que proliferan en las redes sociales.
La clave fue seleccionar los datos de capacitación y trabajar con creativos profesionales para ajustar el modelo, probándolo en comparación con cómo lo usaría una persona promedio. Microsoft espera que MAI haga que los modelos Midjourney o Stable Diffusion parezcan erráticos y lentos en comparación.
Las propias imágenes de IA de Microsoft
Microsoft ha estado invirtiendo mucho en incorporar IA en todo lo que fabrica, pero eso se ha traducido principalmente en herramientas OpenAI.
Sin embargo, eso está cambiando a partir de ahora. MAI-Image-1 ahora se une a los modelos de lenguaje y habla locales MAI‑1 y MAI‑Voice‑1. MAI‑Imagen‑1 es la siguiente pieza del rompecabezas.
Por supuesto, la persona promedio no notará nada de eso. Simplemente les gustará o les molestará cualquier imagen que produzca la IA de Microsoft PowerPoint cuando estén creando una presentación. La compañía dice que su enfoque en el realismo y la utilidad significa que la gente estará muy satisfecha. Habrá menos manchas oníricas y más imágenes que realmente funcionen en documentos, anuncios y presentaciones.
Porque la pregunta no es “¿quién tiene un modelo de imagen?” Es “¿quién tiene uno útil que la gente realmente use en herramientas reales?” Ahí es donde Microsoft apuesta a que MAI‑Image‑1 brillará.
Para los profesionales creativos, esto podría significar un camino más rápido desde un concepto rápido hasta un concepto pulido. Para los usuarios cotidianos, significa menos brechas frustrantes entre la idea y la ejecución. Y para Microsoft, si a los usuarios les encanta el modelo, hace que todo el ecosistema AI Copilot sea más atractivo. Si fracasa, es posible que deba recurrir a OpenAI en busca de ayuda.
Por ahora, sin embargo, parece que la era de Microsoft de depender de OpenAI ha terminado. El futuro de las herramientas de IA dependerá de quién las construye y dónde aparecen, así como de lo que realmente pueden hacer y qué problemas resuelven. Con MAI‑Image‑1, Microsoft dice que quiere responder todas esas preguntas por sí mismo.
Siga TechRadar en Google News y agréganos como fuente preferida para recibir noticias, reseñas y opiniones de nuestros expertos en sus feeds. ¡Asegúrate de hacer clic en el botón Seguir!
Y por supuesto también puedes Siga TechRadar en TikTok para noticias, reseñas, unboxings en forma de video y reciba actualizaciones periódicas de nuestra parte en WhatsApp también.