Nvidia (un cliente del autor) ha hecho muchas cosas fascinantes últimamente, desde la creación de estaciones de trabajo diseñadas para diseñar el metaverso, hasta asistentes digitales que evolucionan hasta convertirse en gemelos digitales humanos, hasta herramientas que podrían permitirle a cualquiera crear arte atractivo. Una de las herramientas más interesantes es Generator StyleGAN, que crea caras de personas mezclando imágenes.

El conjunto de capacitación para esta oferta basada en IA contiene 70 000 imágenes PNG de alta calidad (cada una con una resolución de 1024 x 1024 píxeles) que permiten al usuario una flexibilidad casi ilimitada del material de origen.

StyleGAN existe desde 2018, estuvo más disponible en 2019 cuando el código fuente se convirtió en código abierto y ahora se encuentra en su tercera permutación. StyleGAN3 fue lanzado en octubre pasado.

Los beneficios para aquellos de nosotros que trabajamos con imágenes incluyen la capacidad potencial de crearlas a partir de grandes grupos de imágenes de origen protegidas por derechos de autor sin enfrentar problemas de derechos de autor o preocuparse por la infracción de los derechos de autor. Y a medida que el proceso evoluciona para incluir otras imágenes (es básicamente un motor de fusión de imágenes), podría permitirle mezclar fotografías profesionales de varias fuentes para crear imágenes o pinturas únicas y hermosas creadas a partir de la memoria o la imaginación con poca o ninguna conexión con algo real.

Una herramienta de combinación de imágenes basada en IA como StyleGAN podría cambiar y mejorar radicalmente una serie de industrias y prácticas (o usarse para «falsificaciones profundas» más nefastas). Vamos a explorar.

¿Dibujantes automáticos de crímenes?

Veo muchos procesos penales en la televisión; generalmente hay un segmento en el que alguien se sienta frente a un dibujante para crear una imagen de un criminal que ha estado observando. Todo este proceso podría ser automatizado por una IA conversacional. Al testigo se le puede mostrar una imagen en evolución con características de muestra que se barajan a pedido hasta que la imagen coincida con la memoria de la víctima. El resultado final sería una imagen fotorrealista que podrían utilizar los programas de reconocimiento facial para localizar rápidamente al delincuente. (El daño colateral sería que no habría necesidad de caricaturistas encargados de hacer cumplir la ley).

Un área en la que esta tecnología podría tener un gran impacto es en la localización de niños secuestrados. La IA podría envejecer rápidamente la imagen del niño para que se identifique mejor más adelante en la vida.

Marketing, TV y Cine

Muchos materiales de marketing utilizan imágenes de archivo o modelos de producción. El problema con el primero es que esas mismas imágenes se pueden usar en otras campañas, vinculando inadvertidamente campañas dispares. Por ejemplo, si se usa la misma imagen en un anuncio de un medicamento y un restaurante, los clientes pueden asociar los dos y evitar el restaurante. El mismo problema podría resultar del uso de un modelo en vivo que luego termina en otra campaña, ya que algunos actores y modelos se mueven entre los concursantes. Y los modelos/actores vivos pueden tener problemas personales que pueden dañar una marca o una campaña publicitaria.

Pero el uso de imágenes y videos combinados de algo como StyleGAN significa que puede crear una imagen que puede tener derechos de autor de su empresa, ser única de cualquier imagen de archivo y no estar vinculada a ningún actor o modelo, vivo o muerto. El resultado es un menor costo y, lo que es más importante, un menor riesgo. Obtendrá resultados más rápido y se reduciría la necesidad de modelos y actores. Solo puede usar actores en trajes de imágenes 3D que ocultan su identidad, y con los avances en herramientas de metaverso y reproductores de imágenes 3D, es posible que ni siquiera los necesite. También nos acerca a no necesitar actores para las películas.

¿Gemelos digitales humanos?

Otra área que Nvidia está explorando involucra la creación de gemelos digitales para el metaverso. Y a medida que mejore la IA detrás de estos gemelos, se volverán más indistinguibles del material de origen. Cuando esto sucede, ¿quién es el dueño del resultado? Puede argumentar que un empleado debería ser dueño de su gemelo digital. Pero si se usa una herramienta como StyleGAN para mezclar las imágenes y habilidades de un empleado, esa posición se vuelve más precaria; una empresa podría ser capaz de defender su propiedad del resultado. (Espero que los futuros empleados y sindicatos tengan problemas importantes con algo como esto que se usa para desplazar a los empleados sin compensación.

Un futuro mixto

La capacidad de mezclar material de origen que puede (o no) tener derechos de autor a gran escala es convincente, especialmente si elimina posibles problemas legales. El proceso de Nvidia utiliza una fuente de imagen verificada que elimina la exposición legal, pero herramientas como esta no deberían basarse únicamente en bases de datos de fotos; podrían usarse en imágenes de figuras públicas tomadas de publicaciones en redes sociales, películas u otros materiales publicitarios.

En algún momento, espero que esta tecnología fuerce una reescritura de las leyes de derechos de autor que tratan con imágenes compuestas. Al mismo tiempo, reducirían la cantidad de esfuerzo y costo necesarios para crear películas e imágenes fotorrealistas que pueden usarse en negocios y entretenimiento. Es un ejemplo temprano de cambios importantes en las prácticas comerciales actuales y los ingresos asociados para quienes trabajan como modelos, actores o directores, y para los artistas encargados de crear imágenes que definen eventos recordados.

Herramientas como StyleGAN redefinirán el futuro de los medios virtuales para los negocios, el gobierno y el entretenimiento.

Derechos de autor © 2022 IDG Communications, Inc.

Share This