Google dévoile Imagen 2 avec la génération de texte et de logo

Google met à disposition de ses clients Cloud Vertex AI, qui ont obtenu l’accès, la deuxième génération de Imagen, son modèle d’IA capable de créer et de modifier des images à partir d’un texte. Mais l’entreprise ne divulgue pas quelles données elle a utilisées pour entraîner le nouveau modèle, ni ne propose de moyen pour que les créateurs qui auraient involontairement contribué à la base de données puissent s’opposer ou demander une compensation. Appelé Imagen 2, le modèle amélioré de Google, lancé en avant-première lors du salon I/O de la tech giant en mai, a été développé à l’aide de la technologie de Google DeepMind, le laboratoire d’IA phare de Google. Selon Google, il offre une «qualité d’image significativement améliorée» par rapport au premier Imagen (l’entreprise a refusé de partager des exemples d’images avant ce matin), et présente de nouvelles fonctionnalités, comme la possibilité de générer du texte et des logos. «Si vous voulez créer des images avec un texte superposé – par exemple, pour de la publicité – vous pouvez le faire», a déclaré le PDG de Google Cloud, Thomas Kurian, lors d’un point presse mardi. La génération de texte et de logos permet à Imagen d’être en phase avec d’autres modèles de génération d’images de pointe, comme DALL-E 3 d’OpenAI et le Titan Image Generator d’Amazon, lancé récemment. En deux points de différenciation possibles, Imagen 2 peut générer du texte dans plusieurs langues – chinois, hindi, japonais, coréen, portugais, anglais et espagnol, avec d’autres à venir en 2024 – et superposer des logos dans des images existantes.

Share the Post: