Google lance Imagen 2 avec la génération de texte et de logos.

Google simplifie l’accès à la deuxième génération de son modèle Imagen, qui peut créer et éditer des images à partir d’un texte donné, en le mettant à disposition de ses clients Cloud utilisant Vertex AI, sous réserve de l’approbation de ceux-ci. Cependant, l’entreprise ne divulgue pas quelles données elle a utilisées pour entraîner ce nouveau modèle, ni ne propose de moyen pour que les créateurs qui auraient contribué involontairement à ce jeu de données puissent s’y opposer ou demander une compensation. Appelé Imagen 2, le modèle amélioré de Google, lancé en version bêta lors de la conférence I/O de la société en mai, a été développé à l’aide de la technologie de Google DeepMind, le laboratoire de l’IA de Google. Selon Google, il est «significativement» meilleur en termes de qualité d’image que le modèle Imagen de première génération (l’entreprise a étrangement refusé de partager des images avant ce matin), et introduit de nouvelles fonctionnalités, notamment la possibilité de générer des textes et des logos. «Si vous voulez créer des images avec un texte surimpressionné – par exemple pour de la publicité – vous pouvez le faire», a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’un point presse mardi. La génération de textes et de logos met Imagen au niveau des autres principaux modèles de génération d’images, comme DALL-E 3 d’OpenAI et le Titan Image Generator d’Amazon, lancé récemment. Imagen 2 peut générer du texte dans plusieurs langues – chinois, hindi, japonais, coréen, portugais, anglais et espagnol – et superposer des logos sur des images existantes, ce qui le différencie peut-être des autres modèles en deux points.

Share the Post: