Google lance Imagen 2 avec génération de texte et de logo.

Google est en train de rendre la deuxième génération d’Imagen, son modèle d’intelligence artificielle capable de créer et d’éditer des images à partir d’un texte, plus largement accessible, du moins aux clients de Google Cloud qui utilisent Vertex AI et qui ont été approuvés pour y accéder. Cependant, la société ne divulgue pas les données qu’elle a utilisées pour former le nouveau modèle, et elle ne propose pas non plus de moyen aux créateurs qui ont pu contribuer involontairement à l’ensemble de données de se désinscrire ou de demander une compensation. Appelé Imagen 2, le modèle amélioré de Google, qui a été discrètement lancé en version de prévisualisation lors de la conférence I/O de la société en mai, a été développé à l’aide de la technologie de Google DeepMind, le laboratoire phare d’intelligence artificielle de Google. Selon Google, par rapport à Imagen de première génération, il présente une amélioration « significative » en termes de qualité d’image (la société a curieusement refusé de partager des exemples d’images avant ce matin) et introduit de nouvelles fonctionnalités, notamment la capacité de rendre du texte et des logos. « Si vous voulez créer des images avec un texte superposé, par exemple pour de la publicité, vous pouvez le faire », a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’un briefing à la presse mardi. La génération de texte et de logos place Imagen au même niveau que d’autres modèles leaders de génération d’images, tels que le DALL-E 3 d’OpenAI et le Titan Image Generator récemment lancé par Amazon. Cependant, Imagen 2 se distingue par sa capacité à rendre du texte dans plusieurs langues, notamment le chinois, l’hindi, le japonais, le coréen, le portugais, l’anglais et l’espagnol, avec davantage de langues à venir d’ici 2024, ainsi que par la superposition de logos sur des images existantes.

Share the Post: