Le mercredi, le développeur de Replicate Charlie Holtz a combiné la vision GPT-4 (communément appelée GPT-4V) et la technologie de clonage vocal d’ElevenLabs pour créer une version non autorisée de l’AI du célèbre naturaliste David Attenborough qui narrait les moindres faits et gestes de Holtz devant une caméra. D’après ce que nous savons jeudi après-midi, le post X décrivant ce stunt avait déjà recueilli plus de 21 000 likes. « Voici un exemplaire remarquable d’Homo sapiens, distingué par ses lunettes rondes d’argent et une crinière bouclée en bataille », dit le faux Attenborough dans la démo alors que Holtz le regarde avec un sourire. « Il porte ce qui semble être un tissu bleu recouvrant, ce qui ne peut être que sa display de reproduction ». « Observez de près l’arche subtile de son sourcil », poursuit-il, comme s’il narrait un documentaire de la BBC sur la faune. « C’est comme s’il était en plein milieu d’un rituel complexe de curiosité ou de scepticisme. L’arrière-plan suggère un habitat abrité, possiblement une zone de nourrissage ou d’abreuvement commune ». Comment ça marche ? Toutes les cinq secondes, un script Python nommé « narrateur » prend une photo à partir de la webcam de Holtz et la soumet à GPT-4V, la version du modèle de langage OpenAI qui peut traiter les entrées d’image, via une API, qui possède une invite spéciale pour qu’elle génère du texte dans le style des narrations d’Attenborough. Ensuite, elle soumet ce texte à un profil vocal AI d’ElevenLabs entraîné sur des échantillons audio de la parole d’Attenborough. Holtz a fourni le code (appelé « narrateur ») qui permet de tout assembler sur GitHub, et il nécessite des jetons d’API pour OpenAI et ElevenLabs qui coûtent de l’argent à utiliser. Si certaines de ces fonctionnalités étaient déjà disponibles séparément depuis un certain temps, les développeurs ont récemment commencé à expérimenter leur combinaison grâce à la disponibilité des API, ce qui peut donner lieu à des démonstrations surprenantes comme celle-ci.
Équilibrer la Numérisation et la Sobriété Numérique dans la Formation Professionnelle : Solutions Actuelles et Besoins Émergents
La formation professionnelle tout au long de la vie (FTLV) connaît une transformation significative dans le contexte actuel de numérisation