Aujourd’hui, nous lançons la diffusion vidéo stable, notre premier modèle de base pour la vidéo générative basée sur le modèle d’image diffusion stable. Disponible en aperçu de recherche, ce modèle d’apprentissage automatique vidéo de pointe représente une étape importante de notre parcours vers la création de modèles pour tous les types de personnes. Avec ce lancement de la recherche, nous avons rendu le code de la diffusion vidéo stable disponible dans notre dépôt GitHub et les poids nécessaires pour exécuter le modèle localement peuvent être trouvés sur notre page Hugging Face. De plus amples détails sur les capacités techniques du modèle peuvent être trouvés dans notre article de recherche. Adaptable à de nombreuses applications vidéo Notre modèle vidéo peut être facilement adapté à diverses tâches de post-traitement, y compris la synthèse multi-vue à partir d’une seule image avec un ajustement fin sur des jeux de données multi-vues. Nous prévoyons une variété de modèles qui s’appuient et étendent cette base, similaire à l’écosystème qui s’est construit autour de la diffusion stable.
Google I/O 2026 : Gemini 3.5, agents IA et révolution éducative – Ce que nos clients doivent savoir
Google I/O 2026 marque un tournant avec Gemini 3.5 Flash, Gemini Omni et les agents IA. Découvrez ce que ces innovations signifient pour vous, décrypté par l’équipe Netz Informatique.