Google dévoile Imagen 2 avec la génération de texte et de logo

Google rend la deuxième génération de Imagen, son modèle IA qui peut créer et éditer des images à partir d’une invite textuelle, plus largement disponible – du moins pour les clients Google Cloud utilisant Vertex AI qui ont été approuvés pour y avoir accès. Cependant, l’entreprise ne divulgue pas quelles données elle a utilisées pour entraîner le nouveau modèle – ni ne propose de moyen pour que les créateurs qui auraient involontairement contribué à la base de données puissent s’opposer ou demander une compensation. Appelé Imagen 2, le modèle amélioré de Google – lancé en version preview lors de la conférence I/O de la tech giant en mai – a été développé à l’aide de la technologie de Google DeepMind, le laboratoire IA phare de Google. Selon Google, il est «significativement» amélioré en termes de qualité d’image (l’entreprise a bizarrement refusé de partager des exemples d’images ce matin), et introduit de nouvelles fonctionnalités, notamment la possibilité de générer du texte et des logos. «Si vous voulez créer des images avec un texte superposé – par exemple, de la publicité – vous pouvez le faire», a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’une conférence de presse mardi. La génération de texte et de logos met Imagen en conformité avec d’autres modèles de génération d’images de pointe, comme DALL-E 3 d’OpenAI et le Titan Image Generator récemment lancé par Amazon. Dans deux points de différenciation possibles, Imagen 2 peut générer du texte dans plusieurs langues – en chinois, en hindi, en japonais, en coréen, en portugais, en anglais et en espagnol, avec d’autres à venir en 2024 – et superposer des logos sur des images existantes.

Share the Post: