¿Puede una Inteligencia Artificial crear arte? Damavis Blog

Todos sabemos que la Inteligencia Artificial está avanzando a un ritmo importante en los últimos años. En uno de los aspectos que más visibilidad está teniendo actualmente, es en la capacidad de generación de imágenes con la única fuente de origen de un texto descriptivo.

Evolución en el tiempo
Modelos de Inteligencia Artificial al alcance de todos
1. Imágenes de alta resolución con Latent Diffusion Models (LDM)
2. Stable Diffusion Models: Imágenes más precisas que con LDM
Recreando obras de arte con Inteligencia Artificial
Conclusión

Evolución en el tiempo

Existen distintos proyectos trabajando en esta misma finalidad, pero el primero que nos sorprendió con sus resultados fue DALL-E, basado en GPT-3, que, en enero de 2021 nos mostró cómo con unos simples textos de entrada generaba unas imágenes sorprendentemente fieles a ese texto.

Imágenes generadas a partir del texto: “un sillón en forma de aguacate”.

Un año después, aparece DALL-E 2, con unos resultados todavía más impactantes que su predecesor, imágenes más realistas y cuatro veces mayor en resolución.

“Un cuadro de un zorro sentado en un campo al amanecer al estilo de Claude Monet”.

Muestra del uso de CLIP (*Contrastive Language–Image Pre-training)* y unCLIP para la obtención de imágenes a partir de un origen te texto plano.

Modelos de Inteligencia Artificial al alcance de todos

Aunque inicialmente estos grandes avances solo estaban al alcance de grandes empresas con apuestas importantes de recursos sobre estos sistemas, con el tiempo, diferentes comunidades de expertos en estas áreas han trabajado en conjunto para publicar diferentes proyectos bajo licencias de software libre, que nos permiten probar y disponer de estos avances directamente en casa.

Así que disponemos de proyectos como Diffusers, o Stable Diffusion entre otros, que podemos configurar y poner en marcha en nuestros equipos en pocos minutos para crear imágenes con estas técnicas desde casa.

De esta forma, configurando un entorno local con las librerías pertinentes y unas pocas líneas de código, podemos empezar a realizar las primeras pruebas a nuestro antojo.

Imágenes de alta resolución con Latent Diffusion Models (LDM)

Por ejemplo, si queremos utilizar un sistema basado en LDM (Latent Diffusion Models), con unos pocos minutos de trabajo tenemos nuestro entorno configurado y listo para crear contenido.

from diffusers import DiffusionPipeline
model_id = "CompVis/ldm-text2im-large-256"
ldm = DiffusionPipeline.from_pretrained(model_id)
prompt = "a cat programming on a laptop"
images = ldm([prompt])["sample"]
for idx, image in enumerate(images):
    image.save(f"img-output-{idx}.png")

Imagen obtenida desde el texto: “a cat programming on a laptop”.

Aunque es una imagen en baja resolución, hemos obtenido una imagen única, generada a partir de ese texto interpretado.

Esto no significa que tengamos un modelo que ha copiado y pegado trozos de un gato y de un portátil en nuestra imagen. Lo que tenemos en un sistema que ha inferido en el proceso de entrenamiento cómo debería ser un gato, cómo debería ser un portátil y ha generado una nueva imagen intentando poner al gato en la acción que se le pedía.

Stable Diffusion Models: Imágenes más precisas que con LDM

Si utilizamos ese mismo texto de “input” pero utilizando un modelo más avanzado como Stable Diffusion, obtenemos una imagen con mayor resolución, más precisa en algunos aspectos e igual de única y original.

De esta forma tan sencilla, podemos proponer imágenes con la única limitación de nuestra imaginación y la forma de representar nuestra idea en un texto.

Por ejemplo, ¿cómo sería un plano de un avión de combate diseñado por Leonardo Da Vinci?

En la imagen generada se aprecia un boceto de lo que podría ser un avión, aparentemente de perfil y de frente, con esbozos que podrían representar las mediciones del autor a la hora de dibujarlo a escala.

Recreando obras de arte con Inteligencia Artificial

Entonces, ¿es posible que una inteligencia artificial sea creativa? Vamos a ponerlo a prueba.

Seguro que todos tenemos en mente cómo es la famosa obra “La noche estrellada” de Vincent van Gogh.

Pues bien, vamos a realizar el siguiente ejercicio: vamos a pedir que se representen distintas obras de arte muy conocidas pero interpretadas por otros artistas también conocidos para ver, por ejemplo, cómo hubiese interpretado dicha obra artistas como Leonardo Da Vinci, Pablo Picasso o Salvador Dalí.

En el siguiente cuadro veremos la representación por un modelo basado en LDM, con una resolución menor.

Aunque al ver las imágenes somos capaces de identificar de qué obra se trata, cada una de ellas tiene un estilo, colores y trazos distintos, ya que el modelo ha intentado ser fiel a la obra de cada uno de los autores para representar el cuadro.

Si repetimos el mismo ejercicio pero con un modelo Stable Diffusion:

Aquí apreciamos un trazo más definido, en parte gracias a la mejor resolución de este modelo, pero evidentemente por tener un volumen de datos de entrenamiento mayor y una evolución importante sobre el primero.

En cualquier caso, las nuevas obras son genuinas representaciones creadas a partir del “conocimiento” de la obra a imitar y de las técnicas de los autores que quiere representar.

Pero subamos un poco más el nivel de dificultad. Ahora vamos a recrear “La Última Cena”, comparando también cómo se desenvuelve cada modelo para ello.

LDM:

Stable Diffusion:

En este caso, la representación de la obra tiene unos detalles sorprendentes y se aprecian claramente los “estilos” que ha interpretado la inteligencia artificial para obtener cada uno de los resultados.

Si buscamos algo todavía más complicado de interpretar, podemos pedir la representación de “La Capilla Sixtina” por diferentes autores (en este caso, una imagen de la capilla a través de los ojos de cada autor).

LDM:

Stable Diffusion

(Imagen no generada, contiene desnudos y el modelo está programado para no mostrar este tipo de imágenes)
Pablo Picasso

En este punto se me ocurrió que tenía que buscar un buen reto, una obra con mucho detalle, llena de objetos, personas, sombras y matices, así que le pedí la representación de “Las Meninas” por distintos autores.

Stable Diffusion:

Los resultados son fascinantes y, teniendo en cuenta que cada una de esas imágenes ha sido creada sólo a partir de un simple texto (y el entrenamiento de un modelo con un gran volumen de información, obviamente), hay que reconocer que las imágenes obtenidas dan para todo un debate.

Conclusión

Entonces, consideramos arte a cualquier producto o actividad que se realiza con el objetivo de obtener algo estético, que transmita conceptos, ideas o emociones. Cuando el arte es generado por un humano, lo tenemos claro, es arte. Pero, ¿consideramos arte a una obra generada por una inteligencia artificial?

En realidad, el proceso que ha seguido es muy similar. Ha aprendido a interpretar información, contextualizarla y expresarla de una forma nueva y única, que es lo que haría un humano en su proceso de aprendizaje.

Por lo tanto, nos encontramos con nuevas herramientas que ponen sobre la mesa nuevos escenarios, nuevas profesiones, nuevos retos. ¿Quizá se convierta en un nuevo arte el hecho de crear los “inputs” adecuados para obtener obras que impacten a la humanidad en un futuro no muy lejano?

En cualquier caso, lo que está claro es que gracias a los grandes avances en inteligencia artificial, tanto para la comprensión de texto como para la creación de artes gráficas, disponemos de herramientas al alcance de nuestras manos que abren nuevas posibilidades para la creación de proyectos de gran valor. Proyectos que veremos ir saliendo a la luz en los próximos años, marcando un antes y un después en estos ámbitos.

Si te ha parecido interesante este artículo, te animamos a que visites la categoría de Algoritmos de nuestro blog para ver posts similares a este y a que lo compartas en redes con todos tus contactos. No olvides mencionarnos para hacernos llegar tu opinión @Damavisstudio. ¡Hasta pronto!

deep learning, inteligencia artificial, LDM, machine learning, Stable Difussion

Inteligencia Artificial y creatividad: ¿Puede una IA crear arte?