Google lance Imagen 2 avec la génération de texte et de logos.

Google rend la deuxième génération d’Imagen, son modèle d’intelligence artificielle capable de créer et de modifier des images à partir d’une commande textuelle, plus largement accessible – du moins aux clients de Google Cloud utilisant Vertex AI et ayant été approuvés pour y accéder. Cependant, la société ne divulgue pas les données utilisées pour former le nouveau modèle, et n’a pas non plus prévu de permettre aux créateurs qui pourraient avoir contribué involontairement à l’ensemble de données de se retirer ou de demander une compensation. Appelé Imagen 2, le modèle amélioré de Google, qui a été discrètement lancé en version de prévisualisation lors de la conférence I/O du géant de la technologie en mai, a été développé à l’aide de la technologie de Google DeepMind, le laboratoire phare d’IA de Google. Selon Google, par rapport à la première génération d’Imagen, il présente une amélioration « significative » en termes de qualité d’image (la société a refusé étrangement de partager des exemples d’images avant ce matin) et introduit de nouvelles fonctionnalités, notamment la capacité de rendre du texte et des logos. « Si vous souhaitez créer des images avec un superposition de texte – par exemple, de la publicité – vous pouvez le faire », a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’un point presse mardi. La génération de texte et de logos permet à Imagen de se rapprocher d’autres modèles leaders de génération d’images, tels que DALL-E 3 d’OpenAI et l’imageur Titan récemment lancé d’Amazon. Cependant, Imagen 2 se distingue par deux points possibles : il peut générer du texte dans plusieurs langues – notamment le chinois, l’hindi, le japonais, le coréen, le portugais, l’anglais et l’espagnol, avec d’autres langues à venir en 2024 – et superpose des logos sur des images existantes.

Share the Post: