Google lance Imagen 2 avec génération de texte et de logo.

Google rend la deuxième génération d’Imagen, son modèle d’intelligence artificielle capable de créer et de modifier des images à partir d’un texte, plus largement accessible – du moins aux clients de Google Cloud utilisant Vertex AI et ayant obtenu l’accès. Cependant, l’entreprise ne divulgue pas les données qu’elle a utilisées pour former le nouveau modèle, ni ne propose de moyen aux créateurs qui ont pu contribuer involontairement à l’ensemble de données de se retirer ou de demander une compensation. Appelé Imagen 2, le modèle amélioré de Google – qui a été discrètement lancé en version préliminaire lors de la conférence I/O du géant technologique en mai – a été développé à l’aide de la technologie de Google DeepMind, le laboratoire phare d’intelligence artificielle de Google. Par rapport à Imagen de première génération, la qualité de l’image s’est « nettement » améliorée, affirme Google (l’entreprise a bizarrement refusé de partager des échantillons d’images avant ce matin), et introduit de nouvelles fonctionnalités, notamment la capacité de rendre du texte et des logos. « Si vous souhaitez créer des images avec un texte superposé – par exemple, de la publicité – vous pouvez le faire », a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’un point de presse mardi. La génération de texte et de logos met Imagen au même niveau que d’autres modèles leaders de génération d’images, tels que DALL-E 3 d’OpenAI et Titan Image Generator d’Amazon récemment lancé. Cependant, Imagen 2 se distingue par sa capacité à rendre du texte dans plusieurs langues, notamment le chinois, l’hindi, le japonais, le coréen, le portugais, l’anglais et l’espagnol, avec davantage de langues à venir d’ici 2024, ainsi que la superposition de logos sur des images existantes.

Share the Post: