Google dévoile Imagen 2 avec la génération de texte et de logo

Google met en œuvre la deuxième génération de Imagen, son modèle IA capable de créer et de modifier des images à partir d’une invitation textuelle, afin qu’il soit plus largement disponible – du moins pour les clients Google Cloud qui utilisent Vertex AI et ont été approuvés pour y avoir accès. Cependant, l’entreprise ne divulgue pas quelles données elle a utilisées pour former le nouveau modèle – ni ne propose de moyen pour que les créateurs qui auraient contribué involontairement à la base de données puissent s’y désinscrire ou demander une indemnisation. Appelé Imagen 2, le modèle amélioré de Google – lancé en toute discrétion en version préliminaire lors de la conférence I/O de la tech giant en mai – a été développé à l’aide de la technologie de Google DeepMind, le laboratoire IA phare de Google. Selon Google, il est «significativement» amélioré en termes de qualité d’image par rapport à la première génération d’Imagen (l’entreprise a bizarrement refusé de partager des images avant ce matin), et introduit de nouvelles fonctionnalités, notamment la possibilité de générer du texte et des logos. «Si vous voulez créer des images avec un texte superposé – par exemple, de la publicité – vous pouvez le faire», a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’un point presse mardi. La génération de texte et de logos permet à Imagen de se mettre au niveau des autres modèles de génération d’images de pointe, tels que DALL-E 3 d’OpenAI et le Titan Image Generator d’Amazon, lancé récemment. En deux points de différenciation possibles, Imagen 2 peut générer du texte dans plusieurs langues – en particulier le chinois, l’hindi, le japonais, le coréen, le portugais, l’anglais et l’espagnol, avec d’autres à venir en 2024 – et superposer des logos dans des images existantes.

Share the Post: