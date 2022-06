Google presentó el modelo de texto a imagen autorregresivo llamado Pathways (Parti), un sistema que logra la generación de imágenes fotorrealistas de alta fidelidad, que involucra composiciones complejas y conocimiento del mundo.



"Los avances recientes con modelos de difusión para la generación de texto a imagen, como Imagen de Google , también han demostrado capacidades impresionantes y un rendimiento de vanguardia en los puntos de referencia de investigación", indicó la compañía.



Patri tiene la capacidad de utilizar la Inteligencia Artificial (IA) y transformar el texto en imágenes. Esto se lleva a cabo con la generación de texto a imagen como un problema de modelado de secuencia a secuencia, análogo a la traducción automática.



Los resultados de destino son secuencias de tokens de imagen en lugar de tokens de texto en otro idioma. El sistema Parti utiliza un tokenizador de imágenes, ViT-VQGAN , para codificar imágenes como secuencias de tokens discretos y aprovechar su capacidad para reconstruir tales secuencias de tokens de imágenes como imágenes visualmente diversas de alta calidad.



Así funciona el sistema de Google:

Se ingresó el texto "Portrait of a tiger wearing a train conductor’s hat and holding a skateboard that has a yin-yang symbol on it (Retrato de un tigre con un sombrero de conductor de tren sosteniendo una patineta con un símbolo de yin-yang)".



Con el que se tuvo este resultado:

Generador de imágenes de Google Foto: Google

