A revolução das imagens criadas pela Inteligência Artificial
"El conejo está listo para comer" Si te pido que me hagas un dibujo
basado en esta frase, ¿qué dibujarías? Tienes, al menos, dos opciones: un conejo
sentado a la mesa listo para recibir su Comida, o un conejo cocido servido para la cena. Cuando escuchas la frase y tienes que dibujarla,
tu cerebro tiene que identificar el sentido De esas palabras y el contexto de la frase,
según los conocimientos que ya tienes De la cultura y del idioma en que fue dicha
y encontrar la equivalencia de ese sentido Con imágenes que ya conoces o
puedes imaginar: un conejo cocido, o un Conejo casi humano, sentado a la mesa. Entonces eliges y dibujas. Si ya has usado programas de inteligencia artificial
para crear imágenes en base en un comando De texto, como Midjourney, DALL-E 2 o la aplicación
Lensa, este es el proceso que intentan simular. En pocos segundos, producen
producen resultados cada vez más parecidos a lo que Haría un ser humano. ¿Pero cómo llegan las inteligencias artificiales a esos resultados?
(La revolución de las imágenes creadas por Inteligencia Artificial) Para empezar, piensa en lo que ves cuando
miras una imagen en la computadora. Si le haces mucho zoom a la imagen, verías
miles de cuadritos, como si estuviera Descompuesta en muchos pedazos. A estos pedazos les llamamos pixeles. Así más o menos es como un algoritmo entiende
una imagen — en pedazos de colores: Rojo, verde o azul. Aquí es necesario decir que vamos a simplificar
algo que implica matemáticas aplicadas Avanzadas: el proceso que llamamos aprendizaje
de máquinas. Para los algoritmos de aprendizaje de máquinas,
cada pixel es un número, que corresponde A una especie de coordenada, una posición
en un espacio imaginario. Esos algoritmos codifican cualquier cosa
de esa manera, incluso los textos. Siguiendo con el ejemplo del conejo, cuando
escribes una frase en uno de estos programas, Es como si él transformara esta frase en
una secuencia numérica, que él mismo ha inventado, Encontrara su equivalente en otra secuencia
numérica que representa una imagen y decodificara El resultado en una forma que podamos
reconocer: una ilustración o foto. Pero es aún más complicado que eso:
Este tipo de inteligencia artificial funciona Como una compleja red de neuronas que es
entrenada por bases de datos de miles de millones De imágenes sacadas de la internet, acompañadas
por textos descriptivos. En su proceso de aprendizaje, esa red,
que está hecha de funciones matemáticas complejas,
Mapea cada pedazo de esas imágenes y de esos textos,
estableciendo relaciones entre ellos. Estas relaciones hacen que el algoritmo
pueda saber, por ejemplo, que la palabra conejo corresponde A la imagen de un conejo. Pero los programas como Midjourney, Stable
Diffusion (lo que utiliza Lensa) o DALL-E 2 No guardan todas las imágenes de conejo
con las que fueron entrenados. De la misma manera, nuestro cerebro no es solamente
un gran archivo de todas las fotos e ilustraciones Que hemos visto en nuestra vida y tiene otras maneras
de memorizar. Lo que hacen algunos es practicar miles
de veces un proceso equivalente a bajar Mucho la calidad de esas imágenes y luego
predecir cómo reconstruirlas correctamente en Alta calidad. Como si quitaras la antena de tu televisión
y, a partir de la estática en la pantalla, Pudieras adivinar y redibujar la imagen
en alta definición, pixel por pixel. Otros programas, mientras mapean y analizan los pedazos de las imágenes, guardan una especie De esencia del conejo. Eso les permite utilizar menos memoria
y funcionar más rápido. Para lograr eso, determinan lo que se
llaman características latentes, O sea, las coordenadas que le permiten
construir la imagen de un conejo. O de cualquier otra cosa. Esas características latentes no son
visibles, o sea, van más allá de lo Que podemos observar. No son cosas fáciles de describir como "tiene
orejas puntiagudas, es peludo, come zanahoria, No es una liebre".
En eso también está el gran salto De esos algoritmos — y la parte más difícil
de explicar, hasta por quienes los han creado. Las personas que programaron esas inteligencias
artificiales deciden cuáles son las fórmulas matemáticas Que van a utilizar para aprender, y cuáles bases
de datos van a usar para entrenarlas. Pero no saben exactamente cuál
va a ser el aprendizaje final. En otras palabras, no sabemos qué es lo
lo que el algoritmo ha determinado, matemáticamente, Que es la esencia de un conejo. O cuáles son los pixeles que, ordenados de
cierta manera, forman la imagen de un "conejo Listo para comer".
Lo que sí sabemos es: los algoritmos aprenden conceptos Que reflejan los sesgos y prejuicios de
nuestra sociedad — porque están presentes en las Bases de datos que usamos para entrenarlos. Así lo explica Mike Cook, investigador de
inteligencia artificial en King´s College, en Londres: Nuestra tendencia es pensar en las inteligencias artificiales, y hablar de ellas,
Como si fueron las de las películas, que son
muy racionales y distantes de los problemas humanos, Y cosas así. Entonces, si una IA nos dice algo, creemos que
lo está haciendo de manera muy objetiva Y sin opinión, cuando la verdad es que
ha heredado todos los sesgos y problemas que Están en sus datos de entrenamiento porque sus datos
de entrenamiento vinieron de personas cómo tu y como yo Y las cosas que ponemos en la internet. En poco más de un año y medio, saltamos de
inteligencias artificiales que producían imágenes De baja calidad, a programas que hacen videos
cortos, animaciones e imágenes en 3D a partir De comandos de texto. Esa evolución tan rápida significa que esa
tecnología podría dar superpoderes a profesionales En industrias muy distintas. Imagínate, por ejemplo, una arquitecta creando
un edificio con materiales que aún no han sido inventados. O científicos obteniendo la imagen de una
proteína que no tenemos en el cuerpo, para Crearla en laboratorio y hacer un nuevo medicamento
algo que de hecho, ya están Intentando. Pero también en muy poco tiempo pasamos de los modelos cerrados,
usados por pocas personas, hasta los abiertos, que Pasaron del millón de usuarios en los primeros
tres meses. Y todo eso trajo, claro, sus problemas. Por ejemplo, los comandos de texto alrededor del concepto
de "mujer guapa" o de etnias específicas, Como "mujer asiática" suelen producir
más imágenes de desnudez, por el predominio De la pornografía en la internet. De la misma manera, se ha denunciado que las personas no blancas
han encontrado dificultades para que las IAs produzcan Imágenes con sus características. Y en las industrias creativas, que están sintiendo
el impacto inmediato, ya se escuchan voces de protesta. Muchos artistas se quejan de que cuando su
trabajo y su estilo es utilizado para entrenar Inteligencias artificiales y generar imágenes
esto equivale a un robo. Algunas agencias de imágenes ya han prometido
pagarles una compensación. Pero muchas Obras ya fueron usadas sin consentimiento. Y hay un problema aún más serio: la desinformación
y el discurso de odio. Sería posible crear fotos y videos falsos
para fines políticos, de acoso O bullying. Algunos programas intentan evitar
la mala utilización de la IA poniendo filtros, pero otros Otros dejan la moderación a cargo de los usuarios, lo cual
no está funcionando muy bien. Ese debate nos lleva a una idea aterradora
del futuro próximo: si la inteligencia artificial
Ya puede generar imágenes tan buenas tan rápido, ¿cómo sería posible saber si un registro fue realmente Tomado por alguien con una cámara
en la vida real? Mike Cook, investigador de inteligencia
artificial, cree que debemos seguir optimistas, aunque Parezca difícil. Hay movimientos interesantes
en lugares como la Unión Europea para proponer Leyes que restringen la IA, pero eso aún
se mueve mucho más lentamente que la industria de la tecnología, Y como esa industria se preocupa
más que todo por su progreso, Vemos esa velocidad. Esto es lo que está causando
problemas. Cuando las cosas van así rápido, no estamos
pisando los frenos. No estamos pensando en los peligros, y este período de transición será muy Peligroso, Mientras la sociedad se adapta a todos esos cambios.
Dicho eso, Creo que es importante ser optimista
y no desistir. La IA debería ser algo sobre el cual tenemos la confianza
de debatir y no debería importarnos si no Lo sabemos todo. Tenemos que discutirlo
unos con otros, decidir cómo queremos Que eso cambie nuestras vidas y pedir eso
a los gobiernos y los políticos, para que Hagan cambios y leyes que nos hagan
más seguros. Lo cierto es que estamos en medio de una revolución
tecnológica que está empezando en la industria Creativa y se dispersará por muchas otras. Y, como todas las revoluciones tecnológicas,
está en nuestras manos. Será la causa de muchos conflictos y, probablemente,
de algunas pérdidas. Pero, si la sabemos utilizar promete abrirnos
la puerta para un futuro que, hasta hace poco Tiempo, solo podíamos imaginar. Para ver más videos como este,
ve a nuestro canal de YouTube, A nuestras redes sociales
(Instagram, TikTok, Twitter y Facebook) Y a nuestra página, bbcbrasil.com. Gracias y hasta luego.
Ciao ciao!