Google présente Imagen 2 avec génération de texte et de logo

Google rend la deuxième génération d’Imagen, son modèle IA capable de créer et de modifier des images à partir d’une invitation textuelle, plus largement disponible – du moins pour les clients Google Cloud utilisant Vertex AI qui ont été approuvés pour y avoir accès. Mais l’entreprise ne divulgue pas quelles données elle a utilisées pour entraîner le nouveau modèle – ni ne propose de moyen pour que les créateurs qui auraient contribué involontairement au jeu de données puissent s’y opposer ou demander une compensation. Appelé Imagen 2, le modèle amélioré de Google – lancé en avant-première lors de la conférence I/O de la tech giant en mai – a été développé à l’aide de la technologie de Google DeepMind, le laboratoire d’IA phare de Google. Selon Google, il offre une qualité d’image «significativement» améliorée par rapport à la première génération d’Imagen (l’entreprise a refusé de partager des échantillons d’images avant ce matin de manière étrange), et introduit de nouvelles fonctionnalités, notamment la possibilité de rendre du texte et des logos. «Si vous voulez créer des images avec un texte superposé – par exemple, de la publicité – vous pouvez le faire», a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’un briefing avec la presse mardi. La génération de texte et de logos met Imagen au niveau des autres principaux modèles de génération d’images, comme DALL-E 3 d’OpenAI et le Titan Image Generator récemment lancé par Amazon. Dans deux points de différenciation possibles, cependant, Imagen 2 peut générer du texte dans plusieurs langues – en particulier le chinois, l’hindi, le japonais, le coréen, le portugais, l’anglais et l’espagnol, avec d’autres à venir en 2024 – et superposer des logos dans des images existantes.

Share the Post: