Google lance Imagen 2 avec la génération de texte et de logo

Google rend la deuxième génération de Imagen, son modèle IA capable de créer et d’éditer des images sur une base de texte, plus largement disponible – du moins pour les clients Google Cloud utilisant Vertex AI qui ont été approuvés pour y avoir accès. Mais la société ne divulgue pas quelles données elle a utilisées pour former le nouveau modèle – ni ne présente de moyen pour que les créateurs qui auraient involontairement contribué à la base de données puissent s’en désister ou demander une compensation. Appelé Imagen 2, le modèle amélioré de Google – lancé en version bêta lors de la conférence I/O de la société en mai – a été développé à l’aide de la technologie de Google DeepMind, le laboratoire IA phare de Google. Selon Google, il est «considérablement» amélioré en termes de qualité d’image par rapport à la première génération d’Imagen (la société a bizarrement refusé de partager des échantillons d’image avant ce matin), et présente de nouvelles fonctionnalités, notamment la possibilité de rendre du texte et des logos. «Si vous voulez créer des images avec un texte surimpressionné – par exemple, pour de la publicité – vous pouvez le faire», a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’un point presse mardi. La génération de texte et de logos met Imagen en conformité avec d’autres modèles de génération d’images de pointe, tels que DALL-E 3 d’OpenAI et Titan Image Generator d’Amazon, lancé récemment. En deux points de différenciation potentiels, Imagen 2 peut cependant générer du texte dans plusieurs langues – chinois, hindi, japonais, coréen, portugais, anglais et espagnol, avec d’autres à venir en 2024 – et superposer des logos dans des images existantes.

Share the Post: