El nuevo equipo de superinteligencia de Microsoft, liderado por Mustafa Suleyman, ha presentado MAI-Image-2, un modelo de IA de texto a imagen. Según Microsoft, el modelo ocupa el tercer lugar en el ranking de Arena.ai para generadores de texto a imagen. Por delante, con bastante diferencia, se encuentran GPT-Image-1.5 de OpenAI y Nano Banana 2 de Google.
MAI-Image-2 está diseñado para generar imágenes especialmente realistas, con iluminación natural y tonos de piel precisos. También puede crear escenas muy detalladas y surrealistas. Según Microsoft, el modelo fue desarrollado en colaboración con fotógrafos, diseñadores y artistas visuales.
Tres imágenes generadas por MAI-Image-2 se muestran lado a lado: un retrato con sombras en el rostro, una macrofotografía de un iris y una persona dentro de una cueva glaciar azul.
El modelo también ofrece buenos resultados en tareas menos artísticas, como la representación fiable de texto dentro de imágenes para pósters, infografías o gráficos.
Tres imágenes tipo póster generadas por MAI-Image-2 se muestran lado a lado: un póster modernista con un círculo rojo, un menú de cafetería con ilustración de naranja y un cartel de un evento ecuestre con un caballo saltando.
MAI-Image-2 ya está disponible para pruebas en el MAI Playground, según la región, y también se está integrando en Copilot y Bing Image Creator. El acceso vía API está disponible para algunos clientes empresariales y se espera que pronto esté abierto a todos los desarrolladores a través de Microsoft Foundry. Microsoft no ha revelado detalles técnicos, precios ni información sobre los datos de entrenamiento.
Microsoft presentó su primer modelo de generación de imágenes, MAI-Image-1, en octubre de 2025. En ese momento ocupaba el noveno lugar entre los modelos de texto a imagen en la AI Arena y no tuvo gran impacto. Con MAI-Image-2 alcanzando ahora el tercer puesto, la situación parece haber cambiado, aunque Microsoft aún no logra competir con los modelos líderes de OpenAI y Google.
ES
EN