La locura de crear arte con IA generativa transformando texto en imagen

La locura de crear arte con IA generativa transformando texto en imagen

Obtener la imagen que desea puede ser un largo ejercicio de prueba y error. Fuente: OpenAI

Crear arte usando inteligencia artificial no es nada nuevo. Es tan antiguo como la propia inteligencia artificial..

Lo nuevo es que la ola de herramientas ahora permite a la mayoría de las personas generar imágenes ingresando un mensaje de texto. Todo lo que necesita hacer es escribir “Paisaje estilo Van Gogh” en el campo de texto y la IA puede crear una hermosa imagen según las instrucciones.

La fuerza de esta tecnología radica en su capacidad de utilizar el lenguaje humano para controlar la generación de obras de arte. Pero, ¿estos sistemas traducen con precisión la visión del artista? ¿Puede la introducción del lenguaje en el arte conducir realmente a avances artísticos?

Salidas de ingeniería

He estado trabajando con inteligencia artificial generativa como artista e informático durante años, y sostengo que este nuevo tipo de herramienta limita el proceso creativo.

Cuando escribe un mensaje de texto para generar una imagen usando IA, tiene infinitas posibilidades. Si es un usuario habitual, puede estar satisfecho con lo que AI genera para usted. Y startups e inversores derramó miles de millones en esta tecnología, viéndola como una forma fácil de generar gráficos para artículos, personajes de videojuegos y anuncios.

Por el contrario, un artista puede necesitar escribir una carta de presentación similar a un ensayo para generar una imagen de alta calidad que refleje su visión, con la composición adecuada, la iluminación adecuada y el sombreado adecuado. Esta larga exhortación no necesariamente describe la pintura, pero generalmente usa muchas palabras clave para evocar el sistema de lo que está en la mente del artista. Hay un término relativamente nuevo para esto: ingeniería rápida.

Esencialmente, el papel del artista que usa estas herramientas se reduce a la ingeniería inversa del sistema para encontrar las palabras clave correctas para obligar al sistema a producir el resultado deseado. Encontrar las palabras correctas requiere mucho esfuerzo, mucho ensayo y error.

La inteligencia artificial no es tan inteligente como parece

Para aprender a controlar mejor las salidas, es importante darse cuenta de que la mayoría de estos sistemas están entrenados con imágenes y subtítulos de Internet.

Piense en lo que dice un pie de foto típico sobre la imagen. Los subtítulos generalmente se escriben para complementar la experiencia visual de navegar por la web.

Por ejemplo, una firma podría incluir el nombre del fotógrafo y el propietario de los derechos de autor. En algunos sitios web, como Flickr, el pie de foto suele describir el tipo de cámara y objetivo utilizados. En otros sitios, la leyenda describe el motor de gráficos y el hardware utilizados para representar la imagen.

La locura de crear arte con IA generativa transformando texto en imagen

La IA generativa se considera una herramienta prometedora para inventar personajes de videojuegos. Fuente: Benlisquare/Wikimedia Commons, CC BY-SA

Entonces, para escribir un mensaje de texto útil, los usuarios deben insertar muchas palabras clave no descriptivas para que el sistema de IA cree la imagen correcta.

Los sistemas de IA de hoy no son tan inteligentes como parecen; estos son esencialmente sistemas de búsqueda inteligentes que tienen una gran memoria y funcionan por asociación.

Artistas frustrados por la falta de control

¿Es realmente una herramienta que puede ayudar a los artistas a crear grandes obras?

En Playform AI, la plataforma de artes generativas de IA que fundé, dirigió un encuesta para comprender mejor las experiencias de los artistas con la IA generativa. Recopilamos respuestas de más de 500 artistas digitales, pintores tradicionales, fotógrafos, ilustradores y diseñadores gráficos que utilizaron plataformas como DALL-E, Stable Diffusion y Midjourney, entre otras.

Solo el 46 % de los encuestados consideró que estas herramientas eran “muy útiles” y el 32 % las consideró algo útiles, pero no pudo integrarlas en su flujo de trabajo. El resto de usuarios, el 22%, no los encontró útiles en absoluto.

La principal limitación que señalaron los artistas y diseñadores fue la falta de control. En una escala de 0 a 10, donde 10 es el más controlable, los encuestados describieron su capacidad para controlar el resultado en un nivel de 4 a 5. La mitad de los encuestados encontraron los resultados interesantes pero no de la calidad suficiente para ser utilizados en su práctica.

Cuando se trata de creencias sobre si la IA generativa afectará su trabajo, el 90 % de los artistas encuestados cree que sí. El 46% pensó que el efecto sería positivo y el 7% predijo que tendría un efecto negativo. Y el 37% pensó que afectaría su práctica, pero no estaban seguros de cómo.

El mejor arte visual va más allá del lenguaje

¿Son fundamentales estas limitaciones o simplemente desaparecerán a medida que se desarrolle la tecnología?

Por supuesto, las versiones más nuevas de IA generativa brindarán a los usuarios más control sobre los resultados, así como una resolución más alta y una mejor calidad de imagen.

Pero para mí la principal limitación cuando se trata de arte es fundamental: es el proceso de utilizar el lenguaje como principal motor de generación de imágenes.

La locura de crear arte con IA generativa transformando texto en imagen

La misma entrada puede conducir a una serie de salidas aleatorias. Fuente: OpenAI/Wikimedia Commons

Los artistas visuales por definición son pensadores visuales. Al imaginar su trabajo, la mayoría de las veces se basan en referencias visuales, no en palabras: un recuerdo, una colección de fotografías u otro arte con el que han entrado en contacto.

Cuando el lenguaje impulsa la generación de imágenes, veo una barrera adicional entre el artista y el lienzo digital. Los píxeles solo se representarán a través del prisma del lenguaje. Los artistas pierden la libertad de manipular píxeles más allá de los límites semánticos.

Hay una limitación más fundamental de la tecnología de texto a imagen.

Si dos artistas ingresan exactamente el mismo aviso, es muy poco probable que el sistema genere la misma imagen. Esto no se debe a nada que haya hecho el artista; los diferentes resultados se deben simplemente a la IA comenzando con diferentes imágenes de inicio aleatorio.

En otras palabras, el trabajo del artista se reduce al azar.

Casi dos tercios de los artistas que encuestamos estaban preocupados de que sus generaciones de IA pudieran ser similares al trabajo de otros artistas, y que la tecnología no reflejara su identidad, o incluso la reemplazara por completo.

La cuestión de la identidad del artista es crucial a la hora de crear y reconocer el arte. En el siglo XIX, cuando la fotografía comenzó a extenderse, hubo un debate sobre si la fotografía era una forma de arte. Todo se redujo a un caso judicial en Francia en 1861 para decidir si la fotografía podía tener derechos de autor como una forma de arte. La decisión dependía de si la identidad única del artista podía expresarse a través de la fotografía.

Las mismas preguntas surgen cuando consideramos los sistemas de IA que se enseñan a partir de imágenes web existentes.

Antes de la llegada de las indicaciones de texto a imagen, crear arte con IA era un proceso más complicado: los artistas generalmente entrenaban sus propios modelos de IA a partir de sus propias imágenes. Esto les permitió utilizar su propio trabajo como referencia visual y tener más control sobre los resultados, que reflejaban mejor su estilo único.

Las herramientas de texto a imagen pueden ser útiles para algunos creadores y usuarios ocasionales que desean crear gráficos para una presentación de trabajo o una publicación en las redes sociales.

Pero cuando se trata de arte, no veo cómo el software de texto a imagen puede reflejar adecuadamente las verdaderas intenciones del artista, capturar la belleza y la resonancia emocional, u obras que capturen a los espectadores y les hagan ver el mundo de una manera nueva.

Presentado por Talk


Este artículo ha sido republicado desde Conversación bajo una licencia Creative Commons. leer artículo original.Conversación

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *