La nueva herramienta se llama ‘Outpainting’, y tiene la capacidad de generar un nuevo entorno con base en el estilo artístico y elementos de la obra original.
La Inteligencia Artificial DALL-E está dando un paso en su capacidad creativa, porque ahora cuenta con una nueva función que le permite expandir los bordes de cualquier imagen, incluidas pinturas clásicas, como ‘La joven de la perla’ o ‘Perros jugando póquer’.
La nueva herramienta se llama ‘Outpainting’ y de acuerdo con OpenAI, la empresa que se encarga de desarrollar a DALL-E, tiene el objetivo de ampliar la creatividad de los usuarios, al continuar una imagen más allá de sus bordes originales, agregando elementos visuales en el mismo estilo artístico, o bien construyendo una nueva narrativa para las obras.
Algunos usuarios que tienen acceso a DALL-E -existe una lista de espera para poder usar la herramienta- ya han generado interesantes imágenes, como ampliar los horizontes de la ‘Mona Lisa’, para convertirla en una pintura apocalíptica o incluso para ver qué más había en Abbey Road, en la icónica portada de The Beatles.
¿Cómo funciona la ‘Outpainting’ de DALL-E?
Para comprender el funcionamiento de ‘Outpainting’, es necesario entender cómo trabaja DALL-E. Se trata de una Inteligencia Artificial capaz de crear imágenes realistas o pinturas a partir de una descripción de lenguaje natural en texto, donde se pueden combinar conceptos, estilos artísticos o características.
Si bien una persona entrega una sola descripción, la IA tiene la capacidad de crear diferentes variaciones de la misma imagen y su funcionamiento se basa en que ha aprendido la relación entre las imágenes y el texto que las describe a través de un proceso llamado ‘difusión’.
La IA ha sido entrenada con bases de datos de millones de imágenes y lo que hace es reconocer las referencias en texto y extraer elementos o detalles de cada una, para ir formando una imagen completamente nueva.
Por ejemplo, una persona puede escribir la siguiente descripción: ‘Ositos de peluche trabajando en nuevas investigaciones de IA bajo el agua con tecnología de la década de 1990’.
Entonces, a partir de todas estas herramientas, la IA evolucionó hacia ‘Outpainting’, que incluso tiene en cuenta los elementos de la imagen existente, como sombras, reflejos o texturas, para mantener su contexto y que el resultado sea más convincente.
Cabe mencionar que OpenAI no es la única empresa que está desarrollando este tipo de tecnología artista y un ejemplo muy similar es NUWA-Infinity, a cargo de Microsoft, que la describe como ‘un modelo generativo multimodal diseñado para generar imágenes y videos de alta calidad, a partir de una entrada de texto, imagen o video’.
La gran diferencia de NUWA-Infinity respecto a estos sistemas, es que puede generar videos de larga duración a través de una descripción, además de imágenes en alta resolución con tamaños arbitrarios.
Por otra parte, Google cuenta con ‘Brain’, una IA que más allá de crear nuevas imágenes, tiene el propósito de fortalecer a los sistemas de inteligencias artificiales a partir de datos que los hagan aún más sofisticados e intentar reducir los prejuicios que estas tecnologías pueden reproducir.