Google présente Imagen 2 avec génération de texte et de logo.

Google est en train de rendre plus largement disponible la deuxième génération d’Imagen, son modèle d’IA qui peut créer et éditer des images à partir d’un texte de commande, du moins pour les clients de Google Cloud utilisant Vertex AI qui ont été approuvés pour y accéder. Cependant, l’entreprise ne divulgue pas les données utilisées pour entraîner le nouveau modèle, ni ne propose une option permettant aux créateurs qui auraient involontairement contribué à l’ensemble de données de se retirer ou de demander une compensation. Appelé Imagen 2, le modèle amélioré de Google, qui a été discrètement lancé en prévisualisation lors de la conférence I/O du géant de la technologie en mai, a été développé en utilisant la technologie de Google DeepMind, le laboratoire d’IA phare de Google. Comparé à la première génération d’Imagen, il est « nettement » amélioré en termes de qualité d’image, affirme Google (l’entreprise a bizarrement refusé de partager des échantillons d’images avant ce matin) et introduit de nouvelles fonctionnalités, notamment la capacité de rendre du texte et des logos. « Si vous souhaitez créer des images avec un texte superposé, par exemple de la publicité, vous pouvez le faire », a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’un point de presse mardi. La génération de texte et de logo place Imagen au même niveau que d’autres modèles leaders de génération d’images, comme DALL-E 3 d’OpenAI et Titan Image Generator récemment lancé par Amazon. Cependant, Imagen 2 peut rendre du texte dans plusieurs langues, notamment le chinois, l’hindi, le japonais, le coréen, le portugais, l’anglais et l’espagnol, avec d’autres langues à venir d’ici 2024, ce qui constitue peut-être deux points de différenciation par rapport aux autres modèles.

Share the Post: