Herramientas

Creación de nuevos Pokémon con Stable Diffusion

By Sara Francisco

Esta es una demostración divertida de una aplicación ML de pila completa. Toma su solicitud de texto como entrada y utiliza tres modelos para producir cuatro imágenes de tarjetas Pokémon de muestra:

La tecnología Stable Diffusion ha sido afinada para trabajar con imágenes de Pokémon, permitiendo una mejor detección y clasificación de los distintos tipos de criaturas. Además, se ha desarrollado un RNN básico para generar nombres de Pokémon de manera automática.

Por último, se ha implementado un modelo básico de eliminación de fondo utilizando la librería OpenCV para mejorar la presentación de las imágenes de los Pokémon.

Un RNN (Red Neuronal Recurrente) básico es un tipo de red neuronal que tiene una característica especial llamada «recurrencia», lo que significa que los datos pasados son utilizados como entrada para las próximas operaciones en la red. Esto permite que los RNNs procesen secuencias de datos, como texto, audio o vídeo, y hagan predicciones sobre el próximo elemento en la secuencia.

En el caso específico de generación de nombres Pokémon, el RNN básico se entrena con un conjunto de nombres existentes de Pokémon y luego es utilizado para generar nombres nuevos de manera automática.

Realmente no hay ninguna innovación técnica interesante en esta demostración. Es solo una combinación interesante de lo que existe. Se ha vuelto tan fácil unir modelos de ML, a menudo sin entrenar a muchos o a todos ellos por su cuenta.

Creación de Nuevos Pokémon con Stable Diffusion

Referencias y Enlaces.

El trabajo esta publicado en los servidores modal.com son servidores que permiten ejecutar o implementar modelos de aprendizaje automático, trabajos informáticos paralelos masivos, colas de tareas, aplicaciones web y mucho más, sin su propia infraestructura.

Sara Francisco
Últimas entradas de Sara Francisco (ver todo)

Deja un comentario