Google, con su proyecto Imagen, quiere competirle a Dalle-2, que es un sistema diseñado para generar imágenes a partir de descripciones escritas por los usuarios, con resultados de gran realismo.

Google presentó su proyecto de IA como un modelo de difusión de texto a imagen, el cual plantea una alternativa a la IA de OpenAI, Dalle-2. Imagen es capaz de crear imágenes fotorrealistas a partir de textos descriptivos.

Imagen creada a partir de «Una pared en un castillo real. Hay dos cuadros en la pared. El de la izquierda es un óleo detallado del rey mapache real. El de la derecha es un óleo detallado de la reina mapache» 

Imagen está construido a partir de grandes modelos lingüísticos para lograr un mejor entendimiento de la descripción, y crea una imagen que se adecúe con mayor eficiencia a las descripciones realizadas.

Uno de los principales descubrimientos que han realizado en el desarrollo de Imagen, es que la integración de amplios modelos de lenguaje aumenta la fidelidad y la alineación imagen-texto, mucho más que el aumentar el tamaño del modelo de difusión de imágenes. Así, los modelos de lenguaje genéricos de gran tamaño, los cuales están pre entrenados en la interpretación de corpus de textos (serie de fragmentos de lenguaje estructurados), son ideales para las funciones de este proyecto de IA. Además, permiten conseguir imágenes de alta calidad y relación con el texto como las que hemos visto.

Imagen creada a partir de «Un simpático corgi vive en una casa hecha de sushi»

Google también publicó un DrawBench. Su finalidad es servir de guía y comparativa, siendo un punto de referencia de la aceptación de Imagen, frente a los otros motores de IA para la creación de imágenes a partir de texto en el mercado, como Dalle-2 y VQ-GAN CLIP.

El proceso que lleva a la creación de la imagen

Proyecto en pausa

Tanto Google como OpenAI, son conscientes de las amplias posibilidades de uso, y mal uso, que estos nuevos modelos de difusión pueden ofrecer. Por ello se ha dedicado a trabajar de manera cerrada en sus respectivas tecnologías. En el caso de Dalle-2 es posible solicitar probar la IA desde un formulario, mientras que con Imagen han decidido mantenerla completamente aislada. Por lo tanto, se ha decidido no publicar ninguna clase de código o demostración pública sobre la generación de las imágenes, indicó Marketing4Ecommerce.

Cómo funciona esta inteligencia artificial

Cuando la IA se encuentre disponible para tu cuenta de Google, la podrás habilitar de la siguiente manera:

Desde el celular:

Desde un navegador web:

Más algoritmos creativos

Starryai, una aplicación gratuita para iOS y Android, que ha desarrollado un sistema de inteligencia artificial capaz de generar imágenes basándose en una frase o palabra clave que puede procesar. La aplicación te permite configurar los preajustes de procesamiento dependiendo del resultado y tipo de diseño deseados.

Fotos obtenidas con la app Starryai

No es necesario crear una cuenta para comenzar a utilizarla y las imágenes generadas son propiedad del usuario, que podrá hacer de ellas el uso que crea conveniente.

La aplicación se encarga de crear la imagen por capas, que se van añadiendo unos sobres otras hasta conseguir el arte final. La única limitación que tiene Starryai es que permite generar únicamente dos imágenes al día, que quedarán guardadas por un plazo máximo de una semana, tras el cual se eliminarán automáticamente.

Te puede interesar