Google présente Imagen 2 avec génération de texte et de logo

Google rend la deuxième génération de son modèle Imagen, qui peut créer et éditer des images à partir d’une invitation textuelle, plus largement disponible – du moins pour les clients Google Cloud utilisant Vertex AI qui ont été approuvés pour y accéder. Mais l’entreprise ne divulgue pas quelles données elle a utilisées pour former le nouveau modèle – ni ne présente de moyen pour que les créateurs qui auraient contribué involontairement à la collecte de données puissent se désister ou demander une compensation. Appelé Imagen 2, le modèle amélioré de Google – lancé en avant-première lors de la conférence I/O du géant de la technologie en mai – a été développé à l’aide de la technologie de Google DeepMind, le laboratoire d’IA phare de Google. Selon Google, il est «significativement» amélioré en termes de qualité d’image par rapport à la première génération d’Imagen (l’entreprise a bizarrement refusé de partager des échantillons d’image avant ce matin), et présente de nouvelles fonctionnalités, notamment la possibilité de générer du texte et des logos. «Si vous voulez créer des images avec un texte superposé – par exemple, de la publicité – vous pouvez le faire», a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’un point de presse mardi. La génération de texte et de logos met Imagen en conformité avec d’autres modèles de génération d’images de pointe, comme DALL-E 3 d’OpenAI et Titan Image Generator récemment lancé d’Amazon. Dans deux points de différenciation possibles, cependant, Imagen 2 peut générer du texte dans plusieurs langues – en particulier le chinois, l’hindi, le japonais, le coréen, le portugais, l’anglais et l’espagnol, avec d’autres à venir en 2024 – et superposer des logos dans des images existantes.

Share the Post: