Présentation de la diffusion vidéo stable

Aujourd’hui, nous mettons en ligne Stable Video Diffusion, notre premier modèle de base pour la vidéo générative basée sur le modèle d’image Stable Diffusion. Disponible dès maintenant en aperçu de la recherche, ce modèle d’IA générative de pointe représente une avancée significative dans notre quête visant à créer des modèles pour tout le monde, de tous les types. Avec cette mise en ligne de recherche, nous avons rendu le code pour Stable Video Diffusion disponible sur notre dépôt GitHub et les poids nécessaires pour exécuter le modèle localement sont disponibles sur notre page Hugging Face. De plus amples détails sur les capacités techniques du modèle sont disponibles dans notre article de recherche. Adaptable à de nombreuses applications vidéo Notre modèle vidéo peut être facilement adapté à diverses tâches de post-traitement, y compris la synthèse multi-vues à partir d’une seule image avec ajustement fin sur des jeux de données multi-vues. Nous prévoyons une variété de modèles qui s’appuient et étendent cette base, similaire à l’écosystème qui s’est développé autour de la diffusion stable.

Share the Post: