#132 El cambio de paradigma de las inteligencias artificiales generativas

sep 10, 2022

Hola, soy @samuelgil, Partner en JME Ventures.

Bienvenido a mi newsletter semanal, un lugar donde nos reunimos aquellos que creemos que la tecnología transforma juegos de suma cero en juegos de Suma Positiva.

Tras cortar mucha leña y llevar mucha agua la semana pasada, continuamos hoy con la primera firma invitada de la temporada: Javier López o, como todos le conocemos en el ecosistema emprendedor, @Javilop.

Javi fue cofundador de Erasmusu, una comunidad online de estudiantes internacionales que fue adquirida por Spotahome allá por 2018. Desde entonces, Javi se ha volcado en devolver al ecosistema emprendedor en sus facetas como business angel y escritor.

Aunque todo lo que ha hecho y hace Javi en el plano profesional es impresionante de por sí, es imposible no destacar su personalidad alegre y entusiasta, su creatividad y, sobre todo, su generosidad con los demás, como seguro puede confirmar cualquiera que lo conozca.

Es un honor que nos traiga hoy un tema que, como veréis, le apasiona y obsesiona por igual en los últimos meses y que estoy seguro que despertará vuestro interés: la inteligencia artificial generativa y sus últimos avances.

Aprovecho por último para deciros que hemos abierto la reserva de patrocinios de Suma Positiva para el primer trimestre de 2023. Toda la información, aquí.

Esta edición de Suma Positiva ha sido patrocinada por:

Inteligencia Artificial: What’s next?
Estamos siendo testigos de la revolución creativa de la inteligencia artificial (IA). Pero no solo sectores como el del diseño son susceptibles de incorporar soluciones de IA, sino otros muchos más: industria, retail, logística, legaltech, salud, banca y finanzas, turismo, las telecomunicaciones, la energía o el sector inmobiliario. ¿Trabajas en alguno de ellos? ¿Y qué piensas hacer?
En el Instituto de Inteligencia Artificial, formamos a profesionales como tú, para que estés preparado para los cambios y participes en la toma de decisiones de tu organización. Con nuestro Máster Ejecutivo conocerás todo el potencial que brinda la IA. Adelántate.
Formación 100% online
Sin conocimientos técnicos
Con más de 20 ponentes expertos
Plazas limitadas
Inicio: 15 de octubre 2022
Más info: 5ª edición Máster Ejecutivo en Inteligencia Artificial
*En exclusiva para los lectores de Suma Positiva, cupón de 300€ de descuento:
SUMAPOSITIVA300

❤️ ¿Quieres patrocinar Suma Positiva? Toda la información aquí.

El cambio de paradigma de las inteligencias artificiales generativas

por @Javilop

Si hace tan solo 5 meses alguien me hubiera preguntado si en los siguientes 50 años íbamos a ver inteligencias artificiales dibujando al nivel de un humano hubiera respondido con un rotundo: “¡No! ¡Estamos muy lejos de eso!”.

Estaba muy, pero que muy equivocado.

Me encanta el olor a cambio de paradigma por la mañana, cuando mis creencias son abrasadas por el napalm.

Ahora basta con escribir esto:

"Tifa Lockhart Aerith Gainsborough, photorealistic character design, Goddess ex machina beautiful humanoid robot,dramatic, CineStill 800T, 40mm f2.8, 50mm, Unreal Engine 5, realistic CGI, 32k"

Para que una IA genere en cuestión de segundos esta imagen:

¿Impresionado?

No es para menos: es quizás el mayor logro en el campo de la IA hasta la fecha.

Me gustaría explicaros cómo este y otros modelos de IA moldearán nuestro futuro a pasos de gigante: ahondaremos en las implicaciones a corto, medio y largo plazo de esta tecnología disruptiva, revisaremos sus implicaciones legales y morales, soñaremos con el futuro y mucho más.

¿Me acompañas en este viaje? Prometo que merecerá la pena.

¿Cómo empezó y cómo funciona?

¿Cómo es posible generar dibujos e imágenes de alta calidad a partir de una mera descripción?

«Cualquier tecnología suficientemente avanzada es indistinguible de la magia»
— Arthur C. Clarke.

Es… complicado. Pero aquí tenemos una explicación accesible:

Yo me lancé a la piscina de las IAs generativas cuando estaban dando sus primeros pasitos. En este hilo en el que relato mi experiencia puedes ver la increíble velocidad con la que han evolucionado en unos pocos meses. Desde complicados scripts quemando GPUs durante varias horas de render… hasta generar cualquier imagen en unos pocos segundos.

A día de hoy, con mayor o menor acierto, estas IAs son capaces de dibujar cualquier cosa que les pidas y esto es una revolución en sí mismo.

Podríamos por supuesto centrarnos en lo que no pueden hacer y señalar sus imperfecciones… Pero hay que tener en cuenta que hemos pasado en tan solo un año de un "aguacate-silla" que hasta un niño podría pintar (con Dalle-1) a una ilustración de una calidad que antes nos hubiera parecido ciencia ficción utilizando por ejemplo MidJourney + StableDiffusion.

Y esto es solo el principio.

Señalar hoy las imperfecciones de una tecnología que está aún en pañales sería como mirar a la bombilla de Edison y decir: "Oye, no da mucha luz, la del sol es mejor... y encima está mal soldada".

Y esto va a ir mucho más rápido que los usos de la electricidad.

Un detalle importante de estos modelos es que mejoran mucho con una simple cuestión de fuerza bruta. Es decir, entrenando el modelo con más datos generará mejores resultados. De ahí que su progreso sea tan acelerado.

Pero los investigadores seguirán iterando no solo en la dirección de la fuerza bruta, sino también en la de mejorar los algoritmos que sustentan a estas IAs.

Implicaciones

Todo cambio de paradigma arrollador trae consigo una gama de reacciones que son diferentes según cómo afecte a cada persona: indiferencia, entusiasmo, negación, desconcierto, miedo y… sí, incluso odio.

Estas reacciones son naturales. Lo que los humanos creíamos algo único e inherente a nuestra especie, la creatividad, ahora es terreno también de la IA.

En el pasado, cada vez que la tecnología había mejorado mediante la automatización un trabajo, siempre había sido de índole mecánica: trabajos repetitivos o que implicaban una labor física costosa.

Es la primera vez en la historia de la humanidad que el ser humano crea una automatización que afecta al trabajo creativo. Y esto no es cualquier cosa. Esto es algo de una importancia tremenda. Es la génesis de un cambio.

¿Somos capaces de ver las implicaciones? ¿Del impacto profundo que tendrá en nuestro futuro?

En los inicios de una tecnología es difícil ver sus consecuencias y alcance. Algo parecido pasaría en los comienzos de la electricidad. Si en apenas unos meses estos modelos de IA han dado semejantes saltos. ¿De qué serán capaces en otro año? ¿Y en 10? ¿Y en 50? ¿Hacia qué consecuencias lógicas nos lleva este camino?

Pronto no podremos creernos ninguna fotografía (todavía menos, me refiero 🤣). Cualquiera con un simple móvil podrá “adecentar” sus fotos y vídeos ya no solo con filtros, sino añadiendo todo un universo: un árbol, un portal dimensional, cambiando la cámara de ángulo, metiendo a Chiquito de la Calzada…

Otra de las implicaciones será la proliferación de fake news: imagina vídeos falsos perfectos sobre un evento como una guerra, de presidentes, políticos, etc… ¿Podrán otros modelos de IA discriminar los que son reales de los que no? Será una batalla digna de ver.

¿Esto es arte? ¿Es diseño? ¿Es el mismísimo diablo? ¿Qué es?

Podríamos argumentar que lo que hacen estos modelos no es crear. Que son meros trucos estadísticos.

¿Pero hasta qué punto la creatividad humana no es más que un truco estadístico combinando nuestros recuerdos captados a través de nuestros sentidos para crear algo "nuevo"? Y si vamos más allá... ¿no son la consciencia e inteligencia humanas también meros trucos estadísticos orquestados por nuestras neuronas?

En realidad, da igual cómo lo llamemos. Da igual si lo consideramos arte, diseño o nada en absoluto. La IA generativa es ya una realidad. Y ha entrado en una espiral de iteración y mejora continua.

¿Afectará por tanto a los artistas?

El tiempo dirá.

Pero yo creo que el arte tradicional (pintura, escultura, etc) será un reducto inexpugnable que permanecerá incólume mientras existan humanos. No puedes matar el humanismo a no ser que mates a los humanos.

Quizás pasemos a llamar "arte" únicamente a lo que produzca un humano sin asistencia de la IA. Y tendrá valor "artístico" justo por haber sido creado por un humano sin asistencia de una IA. ¿O permitimos al menos que las utilices como fuente de inspiración?

¿Afectará a los ilustradores, diseñadores y otros profesionales?

El tiempo dirá.

La aparición de Deep Blue en el ajedrez y AlphaGo en el go provocó que los jugadores humanos incrementaran su nivel a la hora de competir entre ellos.

A corto plazo creo que veremos algo parecido con los diseñadores, ilustradores y otros profesionales. Será como tener una varita mágica a su disposición.

Pero incluso hoy en día, cualquier persona puede ya utilizar estas imágenes para lo que quiera: iconos, ilustraciones para un libro, un cómic, etc.

En palabras de Sam Altman de OpenAI (creadora de Dalle-2):

¿Matará la creatividad humana el hecho de que el grueso de los contenidos sean generados por IAs?

No lo creo. Si acaso en un período de transición golpeará nuestro ego. El orgullo humano puede quedar herido: la creatividad no es una cualidad única nuestra. Pero quizás simplemente hará subir la capa de creatividad a un nivel superior de abstracción.

Finalmente tendremos un universo de creaciones a nuestra disposición con las que poder interactuar.

Más que una herramienta de edición, más que un videojuego, más que una película... Imagina un entorno en el que podrás crear lo que se te antoje con el apoyo de las IAs.

Legalidad y debate moral

Una de las frases que más vamos a oír en los próximos años en cuanto a creación de contenidos será esta: "¿Lo has hecho de cero (refiriéndose a una ilustración, un texto, una melodía, etc.) o has usado IA de apoyo?".

Actualmente, el copyright de las imágenes creadas, según los términos de uso de las tres empresas que están liderando (Stable Diffusion, Dalle-2 y MidJourney) indica que son propiedad de la persona que las genera. Así que en la práctica puedes ya, a día de hoy, utilizar las imágenes que generes para lo que quieras.

Por otro lado, ha salido a debate una sentencia en USA hace unos meses que parecía dictar que una imagen generada por IA no podía tener copyright. Pero en la práctica, aunque esto fuera así (que no está claro), cualquiera podría seguir trabajando en un proceso de mejora sobre la imagen resultante como base y hacerla suya.

En realidad, vamos a llegar muy rápidamente a un punto en el que no será posible discernir si una imagen ha sido generada usando IA o no… si es que no estamos ya ahí.

Estas IAs permiten también ya, a partir de una imagen, crear tantas variaciones de ella como queramos. ¿Te gusta ese icono de stock, una ilustración o la foto de algún artista? Podrías generar una variante de ella, con esencia parecida pero diferente visualmente.

También podríamos coger un fondo de por ejemplo el videojuego Monkey Island y decirle: "genera algo de ese estilo". Y chimpún. ¡Peleas como una vaca! O usar el nombre de cualquier artista, tanto del pasado como del presente, y pedirle a la IA que imite su estilo.

Estas IAs han sido entrenadas a partir de millones de imágenes. Desde los cuadros de Van Gogh, hasta las obras digitales de cualquier artista de ArtStation. Por lo que actualmente hay abierto un debate moral con dos punto de vista enfrentados:

Postura 1 (no necesariamente todos los puntos):

Estas IAs se han entrenado usando millones de imágenes y fotografías con copyright sin el consentimiento de sus autores. ¡Y no! No es lo mismo ni por asomo que un humano observe una serie de obras y se inspire en ellas a que sean copiadas, masticadas y regurgitadas por una máquina.
Tienen un coste energético enorme y un impacto ecológico terrible.
Estos algoritmos son propiedad de empresas con afán de lucro. El capitalismo golpeando con fuerza una vez más.
Tienen una ventaja injusta dado que pueden dibujar mucho más rápido que un humano.
Pueden destruir puestos de trabajo.

Postura 2 (no necesariamente todos los puntos):

Las IAs no están copiando. De la misma manera que un artista observa las obras de otros artistas, tengan o no tengan copyright, y las usa para inspirarse, las IAs hacen lo mismo: solo que a un nivel mucho mayor. Tanto las IAs como los humanos no están haciendo más que “inspirarse”.
Lo costoso es entrenar el modelo (600.000€ en el caso de Stable Diffusion). Una vez entrenado, en realidad son tremendamente eficientes: el coste de generar una imagen como las de este artículo es equivalente a 30 segundos jugando a un videojuego en un ordenador con una GPU decente.
Dalle-2 y MidJourney tienen algoritmos propietarios. Pero Stable Difussion es Open Source, abierta para cualquiera. Y se puede usar gratuítamente en su versión local, instalándola tú mismo en tu ordenador y utilizando tu propia tarjeta aceleradora.
Sí, son increíblemente rápidas. Pero no han caído del cielo, han sido creadas por nosotros, los humanos. Y no es la primera vez en la historia que la tecnología hace más eficiente un proceso, aunque sí que es la primera vez que impacta en el ámbito de la creatividad.
Difícil de anticipar si destruirá trabajos. Puede que impacte en algunos y cree otros nuevos. Siendo optimistas redundará con el tiempo en algo bueno para el conjunto de la sociedad: aumentando varios puntos de magnitud las capacidades creativas de la especie humana.

Yo comprendo ambas posturas, puedo empatizar con ambos puntos de vista y sigo con mucha atención el debate.

El tema es que, como en todo debate moral, no hay axiomas: tan solo juicios de valor que posicionarán a la persona en “esto es bueno”, “esto es malo” o las dejará a medio camino en un vórtice de disonancia cognitiva.

Como puedes imaginar, este debate está ya levantando chispas, polarizando, alterando las emociones de muchas personas. Y no ha hecho más que empezar. ¿Cambiarán las leyes del copyright para poder adaptarse a estos enormes cambios en algunos países? El tiempo dirá.

¿Cómo lo ves tú?

El futuro

Creo que esta tecnología va camino de convertirse en el estándar de ilustración, diseño y edición de imágenes. Las implicaciones a más corto plazo serán las de un nuevo set de herramientas de edición brutales.

En pocos años estarán totalmente integradas en nuestro móvil para retoque fotográfico y también en las suites de edición y diseño profesionales como Photoshop, Figma, Procreate, etc.

En este vídeo podemos ver un adelanto de lo que nos viene:

Estas herramientas abrirán un nuevo horizonte de creatividad y permitirán explorar a la velocidad del rayo un set ilimitado de nuevos conceptos e ideas.

Y no solo dando las indicaciones por texto... ¿te imaginas seleccionar a una persona en una foto y poder moverle los brazos o el cuerpo y que la iluminación se adapte como si fuera 3d? ¿o disfrazarla o cambiarle la ropa? ¿o transformarla en un lagarto? ¿o mover la cámara como si de una película se tratase?

Creo que en pocos años veremos también los primeros motores gráficos para videojuegos que utilizarán, para renderizar cada frame del juego en tiempo real, esta tecnología.

Esto permitirá a la imagen del juego adaptarse a los deseos del usuario, a sus reacciones, transformar cualquier objeto en otro, hacer zoom hasta el “infinito” sobre cualquier superficie. Incontables posibilidades que ya no estarían limitadas por las de una biblioteca de sprites, objetos 3d, mapas y texturas concretas… y sin que se estén renderizando mallas poligonales ni vóxeles. Sería algo nuevo. Y tiene el potencial de llevar al videojuego “generativo” a un siguiente nivel.

¿Adiós al reinado de los polígonos?

Y de momento solo he hablado del plano visual. Los modelos de IA impactarán también en los escritores, músicos y resto de creativos.

¿Dónde estarán los límites de lo que podrán generar?

Dando un salto en el tiempo a los próximos 10-50 años, puede que el grueso de los contenidos que consumiremos en el futuro sean generados por IAs. Y no solo a las ilustraciones, todo: novelas, películas, videojuegos, música, etc.

¿Imposible?

¿Una nueva canción con la voz y estilo de Michael Jackson? ¿Una nueva película de Star Wars con actores imaginarios? ¿Una novela ambientada en el universo de Harry Potter? Quizás se podrán generar infinitas creaciones, al vuelo, a golpe de un click… Siempre y cuando pagues las licencias correspondientes.

¿Imposible?

Ante un cambio de paradigma semejante, ¿cómo cambiaría el mundo?

Ahora muchas personas consumimos un mismo contenido (una canción, una película, una novela, un videojuego). En el futuro, quizás cada uno tendremos nuestros contenidos exclusivos creados a la carta para nosotros.

Quiero probar. ¿Por dónde empiezo?

¡Pies en tierra! ¡Volvamos al presente!

A día de hoy, estos son los tres programas que han tomado la delantera. Pero esto va tan rápido que estoy seguro que en unos meses podrían ser otros.

Y para temas de IA en general, Carlos Santana (@DotCSV) es el mejor divulgador que conozco: hace poco publicó esta completísima guía de Stable Diffusion.

En mi cuenta (@javilop), también puedes aprender con los diferentes ejemplos (prompts, herramientas, etc) que voy publicando. Estoy además preparando una guía detallada.

¿Es tan fácil como registrarse en una web, describir la imagen y descargarla?

Más o menos. ¡Prueba tú mismo! Verás que dar con la imagen que tenías en mente implica algo de práctica. Y dirigir esa destreza hacia un producto acabado en las que aparezcan de forma coherente… es mucho más complejo.

¿Para qué las estás utilizando tú?

¡Gracias por preguntar! 😂

Para ilustrar mi novela corta ambientada en el universo de Lovecraft. ¡Aventuras y horror cósmico! Puedes leer los primeros capítulos aquí y echarle un vistazo a las retorcidas imágenes que he generado: El cántico de Cthulhu.

Para crear atmósfera en mis hilos de Twitter y artículos. Por ejemplo: “12 soluciones 👽 a la paradoja de Fermi. ¿Estamos solos en el universo? ¿Hay vida inteligente ahí fuera?

Conclusión

La IA ya está aquí. Y viene con fuerza.

No hemos hablado de la IA aplicada a otros campos, pero te aseguro que está avanzando con rapidez en muchos frentes al mismo tiempo: será un agente del cambio de magnitud muy superior a la revolución industrial y tendrá un gran impacto en nuestras vidas.

De todo esto, a mí lo que me fascina y me apasiona, a la vez que me provoca algo de pavor, es pensar en cómo las IAs van a transformar el futuro de la humanidad.

Y a la vez, si doy un gran salto, dado que se supone que estamos muy lejos, y pienso en una futura AGI (una inteligencia artificial consciente de sí misma, que dudo que veamos durante nuestras vidas, aunque lo mismo decía sobre la generación de imágenes), me crea un respeto casi reverencial... y miedo.

En cualquier caso, va a ser una época muy interesante.

Gracias por leer Suma Positiva.

Si te ha gustado esta edición, no te olvides de dar al ❤️ y de compartirla por email o redes sociales con otras peas a las que les pueda gustar.

Si quieres patrocinar una próxima edición, aquí tienes toda la información.

Tomeu Ozonas

Sep 11, 2022

Samuel, esperaba un artículo como este hace unas semanas. Abre un debate que creo que no mucha gente imagina sus dimensiones. Lo comparto y lo guardo para reelerlo en un añito. Enhorabuena.

Responder

Francisco Montilla Domene

... todo esto siempre que haya electricidad suficiente para mantener el modelo de vida actual....supongamos que sí, en ese caso la literatura y la filosofía se van a convertir en materias esenciales para crear y describir cualquier realidad o sueño que pueda generarse mediante la IA. Todo lo que describes es tan inquietante como emocionante, absolutamente.

2 comentarios más...

Suma Positiva

Discusión sobre este post

Por supuesto, sigue adelante.