El nuevo equipo de superinteligencia de Microsoft, liderado por Mustafa Suleyman, ha presentado MAI-Image-2, un modelo de IA de texto a imagen. Según Microsoft, el modelo ocupa el tercer lugar en el ranking de Arena.ai para generadores de texto a imagen. Por delante, con bastante diferencia, se encuentran GPT-Image-1.5 de OpenAI y Nano Banana 2 de Google.

MAI-Image-2 está diseñado para generar imágenes especialmente realistas, con iluminación natural y tonos de piel precisos. También puede crear escenas muy detalladas y surrealistas. Según Microsoft, el modelo fue desarrollado en colaboración con fotógrafos, diseñadores y artistas visuales.

Tres imágenes generadas por MAI-Image-2 se muestran lado a lado: un retrato con sombras en el rostro, una macrofotografía de un iris y una persona dentro de una cueva glaciar azul.

MAI-Image-2 genera imágenes fotorrealistas con luz natural y gran nivel de detalle, incluyendo un retrato, una macro de un ojo y una cueva glaciar. | Fuente: Microsoft
MAI-Image-2 genera imágenes fotorrealistas con luz natural y gran nivel de detalle, incluyendo un retrato, una macro de un ojo y una cueva glaciar. | Fuente: Microsoft

El modelo también ofrece buenos resultados en tareas menos artísticas, como la representación fiable de texto dentro de imágenes para pósters, infografías o gráficos.

Tres imágenes tipo póster generadas por MAI-Image-2 se muestran lado a lado: un póster modernista con un círculo rojo, un menú de cafetería con ilustración de naranja y un cartel de un evento ecuestre con un caballo saltando.

MAI-Image-2 también puede representar texto en imágenes de forma fiable, incluyendo pósters y diseños tipográficos. | Fuente: Microsoft
MAI-Image-2 también puede representar texto en imágenes de forma fiable, incluyendo pósters y diseños tipográficos. | Fuente: Microsoft

MAI-Image-2 ya está disponible para pruebas en el MAI Playground, según la región, y también se está integrando en Copilot y Bing Image Creator. El acceso vía API está disponible para algunos clientes empresariales y se espera que pronto esté abierto a todos los desarrolladores a través de Microsoft Foundry. Microsoft no ha revelado detalles técnicos, precios ni información sobre los datos de entrenamiento.

Microsoft presentó su primer modelo de generación de imágenes, MAI-Image-1, en octubre de 2025. En ese momento ocupaba el noveno lugar entre los modelos de texto a imagen en la AI Arena y no tuvo gran impacto. Con MAI-Image-2 alcanzando ahora el tercer puesto, la situación parece haber cambiado, aunque Microsoft aún no logra competir con los modelos líderes de OpenAI y Google.