Skip to content

Avanzan herramientas tecnológicas para crear arte con inteligencia digital

En los últimos 10 años el desarrollo de nuevas herramientas ha acelerado la creación de arte a través de la inteligencia artificial y este 2023 se prevé que las tecnologías sigan mejorando

Hace unos 10 años, investigadores descubrieron que alimentando a los algoritmos de redes neuronales con grandes cantidades de imágenes y etiquetas asociadas, les permitieron identificar otras imágenes que nunca habían visto.

De esa manera es como Apple Photos y Google Photos organizan las imágenes tomadas en un teléfono inteligente.

Ahora, con la ayuda de la inteligencia artificial y nuevas herramientas es posible generar arte con solo teclear unas cuantas palabras. La calidad de las ilustraciones, las fotografías y las ‘pinturas’ que se pueden hacer de esa manera mejoró notablemente, respecto al inicio de estas experimentaciones, expone WIRED.

Estos rápidos avances han impulsado a las personas a crear productos y empresas en torno a estos generadores de imágenes. WIRED pudo experimentar recientemente con una de las primeras herramientas de inteligencia artificial capaz de generar video, desarrollada por investigadores de Meta. Los videos no son perfectos, pero si los comparamos con ejemplos de los años de investigación que precedieron a la explosión del arte creado por inteligencia artificial de 2022, podremos ver la cronología de una tecnología que madura rápidamente, desde el experimento de laboratorio, hasta el prototipo de producto.

Las herramientas de inteligencia artificial para crear imágenes le dan la vuelta al truco de etiquetado de Apple Photos y Google Photos. Los algoritmos que han digerido de la web una gran cantidad de representaciones y texto asociado pueden generar nuevas imágenes a partir del texto proporcionado por un usuario.

En su núcleo está lo que se llama un «modelo generativo», que aprende las propiedades de una colección de datos y luego puede crear nuevos datos que estadísticamente se ajusten a la colección original. Además de crear imágenes, este enfoque se puede utilizar para escribir texto, componer música o responder preguntas. El potencial comercial de la llamada inteligencia artificial generativa ha despertado entusiasmo entre los inversores en tecnología.

Nacimiento y desarrollo

La bonanza de creación de imágenes de inteligencia artificial tiene sus raíces en una invención de 2014, cuando Ian Goodfellow, estudiante de la Universidad de Montreal, ideó una nueva clase de modelos generativos, denominada redes generativas antagónicas (GAN, por sus siglas en inglés).

GAN involucra dos redes neuronales, algoritmos utilizados en aprendizaje automático (Machine Learning), que trabajan ‘uno contra el otro’. Mientras el primero intenta generar algo que coincida con una colección de ejemplos, el otro intenta distinguir entre ejemplos reales y falsos. Durante muchas rondas de competencia, uno empuja al otro mejorar. Este truco demostró ser capaz de crear imágenes simples de caracteres escritos a mano, rostros toscamente dibujados y escenas más complejas que parecían fotos reales.

En 2019, un equipo de la empresa Nvidia cautivó a internet al revelar un algoritmo con base en GAN para generar caras fotorrealistas. Se ven impresionantes en comparación con los primeros intentos, aunque todavía tienen fallas evidentes.

En enero de 2021, OpenAI anunció DALL-E, un sistema que podía generar imágenes impresionantes a partir de un mensaje de texto. DALL-E era capaz de producir imágenes casi fotorrealistas en una variedad de estilos, y también combinar conceptos de maneras divertidas; por ejemplo, dibujando ‘sillones de aguacate’ o ‘una ilustración de un rábano paseando a un perro’.

En junio de 2022, OpenAI anunció a DALL-E 2, que se pudo mejorar gracias a más datos y más poder de cómputo. Utiliza un tipo de algoritmo generativo nuevo y más potente, conocido como modelo de difusión, inspirado en las matemáticas que se usan para modelar fenómenos en la física. Funciona ‘desafiando’ a un algoritmo para que aprenda a eliminar el ruido que se ha agregado a una imagen.

Implicaciones éticas

La amplia disponibilidad de generadores de imágenes ha provocado no solo una explosión de experimentación, sino también un caldeado debate sobre las implicaciones de la tecnología. Un problema complicado es el de que las imágenes creadas pueden heredar sesgos de los datos de los que se alimentan; otro es que podrían ser utilizados para generar contenidos nocivos. Las implicaciones de los derechos de autor y las marcas registradas del arte de la inteligencia artificial tampoco están claras; a algunos artistas les preocupa que tales herramientas puedan hacer que el trabajo sea más difícil de encontrar.

Esos debates continuarán este 2023, y es probable que la tecnología siga mejorando rápidamente. A medida que crece la emoción y el financiamiento de las herramientas de arte de inteligencia artificial, probablemente traerá imágenes de mayor calidad y quizás la aparición de generadores de video.

Es posible que esté a punto de comenzar un nuevo conjunto de debates sobre el poder creativo de la inteligencia artificial y sus consecuencias éticas y económicas.

Fuente: WIRED

También te recomendamos