El gigante estadounidense Microsoft presentó MAI-Image-1, su primer modelo desarrollado íntegramente para convertir texto en imágenes.

A diferencia de sus herramientas visuales anteriores, basadas en la tecnología de OpenAI, esta nueva propuesta representa una ruptura estratégica.

Por primera vez, Microsoft se despega de OpenAI y apuesta por una solución propia, diseñada desde cero por la división Microsoft AI.

En el blog de la empresa se explica que MAI-Image-1 se especializa en la creación de imágenes fotorrealistas, aunque también permite generar ilustraciones y composiciones más estilizadas.

Según Microsoft, el modelo fue concebido para ofrecer resultados que se alejen de lo genérico y repetitivo, una crítica frecuente a otros generadores del mercado.

Uno de la cualidades claves de MAI-Image-1 es su velocidad de generación. Las pruebas realizadas en LMArena, una plataforma que evalúa modelos de IA, posicionan al sistema entre los diez mejores del mundo en su categoría. 

Microsoft se despega de OpenAI 

La presentación del modelo también coincide con un cambio de liderazgo en la división de inteligencia artificial (IA) de la empresa.

Mustafa Suleyman, cofundador de DeepMind, asumió recientemente como CEO de Microsoft AI, y su llegada parece haber acelerado el desarrollo de soluciones propias.

MAI-Image-1 es el primero de una serie de modelos que buscan posicionar a Microsoft como un actor independiente y competitivo en el campo de la IA generativa, más allá de su alianza con OpenAI.

En términos de aplicación, MAI-Image-1 está diseñado para interpretar instrucciones textuales detalladas y traducirlas en imágenes con alto nivel de precisión.

Esto lo convierte en una herramienta útil para:

La empresa destacó que desarrolló el modelo tomando en cuenta los comentarios de artistas, diseñadores y comunicadores.

Te puede interesar