Google dévoile Imagen 2 avec génération de texte et de logo.

Google rendra la deuxième génération d’Imagen, son modèle d’intelligence artificielle capable de créer et d’éditer des images à partir d’instructions textuelles, plus largement disponible, du moins pour les clients de Google Cloud utilisant Vertex AI qui ont obtenu l’approbation d’accès. Cependant, l’entreprise ne divulgue pas les données qu’elle a utilisées pour former le nouveau modèle, ni ne propose une option permettant aux créateurs qui ont pu contribuer involontairement à l’ensemble de données de se retirer ou de demander une compensation. Appelé Imagen 2, le modèle amélioré de Google – qui a été discrètement lancé en avant-première lors de la conférence I/O du géant de la technologie en mai – a été développé à l’aide de la technologie de Google DeepMind, le laboratoire phare d’intelligence artificielle de Google. Comparé à la première génération d’Imagen, il est « considérablement » amélioré en termes de qualité d’image, affirme Google (l’entreprise a étrangement refusé de partager des échantillons d’images avant ce matin), et introduit de nouvelles fonctionnalités, notamment la capacité de rendre du texte et des logos. « Si vous souhaitez créer des images avec un texte superposé – par exemple, une publicité – vous pouvez le faire », a déclaré Thomas Kurian, PDG de Google Cloud, lors d’un point de presse mardi. La génération de texte et de logos place Imagen au même niveau que d’autres modèles leaders de génération d’images, tels que DALL-E 3 d’OpenAI et Titan Image Generator récemment lancé par Amazon. Cependant, Imagen 2 se distingue par sa capacité à rendre du texte dans plusieurs langues – précisément le chinois, l’hindi, le japonais, le coréen, le portugais, l’anglais et l’espagnol, avec d’autres langues à venir d’ici 2024 – et à superposer des logos sur des images existantes.

Share the Post: