Restez connecté aux dernières tendances en matière d’IA en vous abonnant à nos newsletters régulières qui livrent des informations de dernière minute et des aperçus exclusifs sur l’industrie de l’IA. En savoir plus.
Le domaine de création de vidéo a vu des avancées rapides avec l’introduction du nouveau Pyramid Flow. Ce produit innovant a été lancé plus tôt cette semaine et est conçu pour produire des extraits vidéo en haute définition de 10 secondes avec une vitesse remarquable. De plus, il est complètement en open source.
Fruit d’un effort conjoint entre l’université de Pékin, l’université des Postes et des Télécommunications de Pékin et la technologie Kuaishou – cette dernière étant connue pour son générateur de vidéos AI Kling largement loué – Pyramid Flow emploie une approche unique de génération de vidéos. Un seul modèle d’IA est déployé pour produire une vidéo en phases, la plupart d’entre elles étant en basse résolution, préservant une restitution en très haute résolution pour le produit final.
Le cadre est disponible sous forme de code brut sur les plateformes Hugging Face et Github. Pour l’utiliser, il faut télécharger et faire fonctionner le code du modèle sur leurs systèmes personnels. Un de ses accomplissements significatifs est sa vitesse d’inférence – une vidéo de 384p de 5 secondes peut être générée en seulement 56 secondes, égalant ou même surpassant beaucoup de modèles de diffusion globale en compétition. Toutefois, c’est le Gen 3-Alpha Turbo de Runway qui mène en matière de rapidité de développement des vidéos AI, réduisant les temps de génération de vidéos à moins d’une minute – souvent aussi rapidement que 10-20 secondes lors de nos essais.