Lumiere de Google genera vídeos a partir de texto e imágenes e introduce funciones de edición

Modelo de IA generativa Lumier
Modelo de IA generativa Lumier - GOOGLE
Publicado: lunes, 29 enero 2024 15:59

   MADRID, 29 Ene. (Portaltic/EP) -

Google ha presentado una nueva herramienta de inteligencia artificial (IA) generativa que crea un vídeo a partir de una descripción en texto o una imagen, e introduce capacidades de edición y de trabajo sobre partes determinadas de la imagen.

   Lumiere es un nuevo modelo de difusión que genera vídeo, que Google ha diseñado con capacidad para crear resultados realistas y con movimiento coherente y de editarlo para conseguir estilos determinados.

   Lo que caracteriza a este modelo es que genera en un solo paso la duración temporal del vídeo, algo que logran con una arquitectura que han denominado 'Space-Time U-Net' (STUNet), que reduce la señal temporal y espacial y realiza la mayor parte del trabajo computacional en una representación compacta. Con este enfoque, se genera un vídeo de 5 segundos.

   Los vídeos se pueden crear a partir de una descripción en texto y incluso editar para conseguir un estilo determinado. Pero también a partir de una imagen con una indicación en texto que la acompañe, como informa Google en la página de GitHub dedicada a este proyecto.

   Las capacidades de Lumiere incluyen la animación de una parte determina de una imagen y la reconstrucción de una parte que falte en un vídeo, para que se vea completo.

Leer más acerca de: