Dall E, la IA que está rompiendo el internet
Probablemente hayas visto imágenes disímiles flotando en el internet o a través de tus redes sociales: Elvis como el “rey de los lagartos”, Michael Jackson “regresando a su planeta” o el legendario basquetbolista, Michael Jordan, haciendo una épica anotación… en el espacio.

Algunas de estas imágenes son producidas a través de la Inteligencia Artificial, Dall E, que con una simple descripción de lo que quieres ver, produce una imagen relativamente fiel a lo que tenías en mente. ¿Cuál es el límite y qué hay tras bambalinas de esta entretenida pero compleja IA? Quedate a averiguarlo en Tech Takes.

Más allá de un generador de imágenes

Aunque a primera vista Dall E podría parecer sólo un generador de imágenes, tras bambalinas hay un trabajo de años que implica un uso de la tecnología muy particular.

Al ingresar a la web, lo primero con lo que te encontrarás es, precisamente, un campo en blanco para que puedas ingresar una descripción y generar la imagen que desees (tocaremos esto un poco más adelante); sin embargo, también es un amplio patio de juegos si buscas aprender algo sobre inteligencia artificial.

La lista de temas relativos a esta particular herramienta incluyen:

  • Algoritmos para digitalizar la ropa utilizada por los modelos.
  • Identificación de valores específicos (como nombre, edad, adjetivos o lugar de origen) en un texto.
  • Modelos de traducción entre diferentes idiomas.
  • Detección y clasificación de objetos.
  • Segmentación de imágenes. 
¿Cuál es el uso de estas herramientas en la vida real? En su respectiva sección, encontrarás la respuesta: vehículos autónomos que pueden identificar el mejor camino posible, poder eliminar el fondo de una imagen para crear efectos especiales e incluso comparar imágenes médicas para obtener un diagnóstico más preciso. Y esto apenas hablando de la segmentación de imágenes; imagina el uso que se puede hacer de todas estas aplicaciones.

Ahora que conocimos un poco más a fondo todo el trabajo que hay detrás de esta herramienta empecemos a divertirnos con ella.

El ABC de Dall E

¿Listo para la acción? Generar una imagen a través de Dall E es tan fácil como:

  1. Ingresá a: https://www.craiyon.com/
  2. Haz una descripción de la imagen que quieres generar.
  3. Espera unos segundos y… ¡voilá! tu idea es ahora una imagen real, más o menos.
Es muy posible que tu primer resultado no sea el que esperabas del todo, así que dejanos darte unos tips sobre cómo afinar tus búsquedas y experimentar con esta herramienta.

Intenta poner en el campo de descripción: “Elvis en la cárcel”, verás a un rey del rock tras las rejas, pero sentirás también como que algo hace falta; intenta ahora con “Elvis en la cárcel con uniforme de reo”, luce bastante más convincente ¿no?; ¿qué tal: “Elvis en la cárcel con uniforme de reo y policías”?, el resultado será una foto bastante convincente del inmortal ídolo tras las rejas (y no en la cárcel del rock).

Este experimento sirve para afinar cada vez más las instrucciones y poder entrenar el machine learning con el que funciona esta herramienta; más datos de entrada equivalen a un resultado más preciso. Y, aunque este generador de imágenes haya sido la sensación de internet por las curiosas imágenes que la gente creaba y compartía, es apenas un vistazo de lo que la comunidad puede hacer con una herramienta así en sus manos.
elefante en en el cielo elevado por un globoelefante en en el cielo elevado por un globo

El siguiente paso en IA

Para adivinar qué es lo que sigue en esta rama de la informática, debemos voltear a ver a un sector que ha sido fundamental para extender los alcances de la IA: la comunidad. ¿Quieres saber qué otras curiosas aplicaciones han creado? Te las compartimos a continuación.

Descubriendo aplicaciones de machine learning creadas por la comunidad


Puedes encontrar estas aplicaciones en https://huggingface.co/spaces, todas ellas han sido desarrolladas por la comunidad a través de machine learning. Pudes experimentar con la mayoría de ellas y echar un vistazo a la documentación técnica en inglés por si quieres comenzar a crear tu propia herramienta de IA.

Is it huggable: ¿Alguna vez has visto un objeto sin saber si es seguro abrazarlo? Olvidate de este predicamento con esta herramienta. Lo único que necesitas es tomarle una foto y subirla en esta inteligencia artificial Python; tendrás la respuesta en unos segundos.

Smile or Not Smile: ¿Tienes dudas sobre ese gesto ambiguo con el que tu crush te saluda a diario? Sal de la duda con esta herramienta, lo único que necesitas es una imagen de su cara y con certeza te enterarás si está sonriendo o no.

Cassava Leaf Disease Classification: Si eres un aficionado de la botánica, esta herramienta te interesará. Las plagas son inevitables, aunque no todas requieren el mismo tratamiento. Si quieres saber con precisión qué enfermedad aqueja a tus plantas, este clasificador de enfermedades botánicas realizará el trabajo por ti; lo único que necesitas es una foto de las hojas de la planta enferma para tener un diagnóstico para su posterior tratamiento.

Cat breed 2: Todos adoran a los gatitos, eso es un hecho. Pero si quieres obtener un poco más de información sobre el linaje de tu pequeño amigo peludo, esta herramienta te ayudará a saber si es un gato persa, siamés, egipcio, azul ruso, etc.

Shakespearify: Si deseas hablar como si estuvieras en una obra del máximo poeta inglés, difícil será, señor mío, encontrar una mejor herramienta (prometemos que el resultado será mejor que nuestro insulso intento).

Question answering: Si eres un maestro y quieres poner a prueba esta IA, todo lo que tienes que hacer es darle algo de contexto, un párrafo o dos; después, pregunta lo que quieras y sorprendete con la precisión de la respuesta

Estas herramientas son apenas una prueba de los cientos de aplicaciones de machine learning creadas por la comunidad y disponibles en la web.

Advertencia: una gran parte de estas herramientas son un trabajo en proceso, así que si te encuentras con un enlace que no funciona, dale un par de días para que la comunidad pueda arreglarlo.

En resumen

Aunque Dall E fue algo que nos tomó por sorpresa y que probablemente se perderá con el tiempo en el mar de información que es internet, llamó la suficiente atención para alimentar nuestra curiosidad por crear aquellas imágenes que de otra manera solo vivirían en nuestra imaginación.

Puedes dar el paso entre consumir y crear las aplicaciones que se convertirán en la próxima sensación de internet. ¿Tienes el equipo adecuado para hacerlo? Revisa nuestra sección de Notebooks para adquirir los más poderosos equipos de cómputo y lograr programar tu propia inteligencia artificial Python.