Microsoft ha sorprendido con el anuncio de MAI-Image-2-Efficient, su nueva versión más eficiente de su modelo de generación de imágenes que es capaz de crear contenido un 40 % más rápido que sus rivales, como Gemini de Google.
El gigante tecnológico presentó su modelo MAI-Image-2 en el mes de marzo como una opción para generar resultados fotorrealistas profesionales a partir de texto, acaba de lanzar una nueva versión del mismo.
MAI-Image-2-Efficient es una versión diseñada específicamente para crear imágenes con el foco puesto en la “velocidad y la escalabilidad”, según informa Microsoft en un comunicado.
La compañía explica que esto es posible debido a que las capacidades de MAI-Image-2-Efficient son un 22 % más rápidas que la versión estándar y opera con un coste que se reduce casi un 41 %.
También ha destacado que su nueva versión no es solo más rápida que MAI-Image-2, sino que es capaz de alcanzar velocidades de respuesta un 40 % más rápidas que la media de otros modelos de texto a imagen rivales.
Meet MAI-Image-2-Efficient.
Production-ready quality, 22% faster, and 4x more efficient than MAI-Image-2. Priced almost 41% lower too.
Plus 40% average lower latency than other leading models.
Live now in Microsoft Foundry + MAI Playground. https://t.co/1Z0IKfytwV pic.twitter.com/UKLm5FQzxx— Mustafa Suleyman (@mustafasuleyman) April 14, 2026
De esta manera, MAI-Image-2-Efficient puede ofrecer una respuesta en tan solo 13,70 segundos ante un promt estándar, frente a los 17,50 segundos de MAI-Image-2 o los 19,10 segundos de Gemini 3 Pro Image de Google o los 41,41 segundos de ChatGPT de OpenAI.
Microsoft ha afirmado que MAI-Image-2-Efficient es la “herramienta de producción ideal” y que está pensada para usarse cuando se necesite un volumen elevado de trabajo, velocidad y un “control de costes preciso”.
Por ejemplo, se podría usar MAI-Image-2-Efficient para generar fotos de producto de cara una campaña de marketing, o creatividades o recursos, entre otros. Microsoft ha destacado igualmente su uso para textos cortos como titulares o etiquetas.
Incluso ha señalado que MAI-Image-2-Efficient está optimizado para ejecutarse en flujos de trabajo interactivos en tiempo real. Mientras que el modelo estándar consiste en una herramienta de precisión.
Por lo que esta última está pensada para utilizarse en tareas que requieran la “máxima fidelidad”, como es el caso de retratos, escenas o ilustraciones fotorrealistas; además de para textos largos o complejos integrados en imágenes.
Cabe destacar que MAI-Image-2-Efficient ya está disponible en las plataformas de Microsoft Foundry y MAI Playground; y que, igualmente, se está implementando en Copilot y Bing. Próximamente este modelo llegará a otras herramientas de la firma, como PowerPoint.
