Déplacez-vous sur Bing Image Creator! Google annonce un nouvel outil de génération d’images basé sur l’IA

Comme aujourd’hui, l’expérience de recherche alimentée par IA de Google, baptisée SGE, est multimodale. Sur les talons de la sortie de DALL-E 3 d’OpenAI et de la création d’images Bing de Microsoft, SGE de Google dispose maintenant de son propre outil de génération d’images IA. Alimenté par les modèles de diffusion d’images Imagen de Google, les utilisateurs ayant accès à SGE peuvent décrire une image qu’ils veulent voir, et en quelques secondes, SGE leur fournira quatre variantes à choisir. De là, les utilisateurs peuvent éditer plus avant la description pour ajuster l’image qu’ils veulent voir. Dans l’exemple de Google, la requête initiale est pour une image fantaisiste d’une capybara portant un chapeau de chef et cuisinant du bacon. Les utilisateurs peuvent éditer la description pour faire cuire la capybara des pommes de terre rissolées au lieu de cela. Dans la course à l’IA, ou le Thunderdome – ou ce que vous voulez appeler les géants de la technologie en compétition pour la domination du marché de l’IA – la multimodalité est un territoire stratégique convoité. La multimodalité fait référence à la capacité d’un modèle IA de comprendre et de traiter différents types de médias, notamment des images et du son. Un chatbot IA conversant avec des utilisateurs, c’est une chose, mais «voir», «entendre» et produire des outputs créatifs, c’est un tout nouveau niveau de sophistication IA. OpenAI a récemment publié la dernière version de son outil de génération d’images DALL-E 3. Microsoft, qui est un investisseur d’OpenAI, utilise maintenant DALL-E 3 pour la création d’images Bing. Et maintenant, Google apporte sa propre version à SGE. L’accès généralisé aux outils de génération d’images IA n’est pas sans soulever de majeures préoccupations, notamment la diffusion de fausses informations/désinformation et de violations du droit d’auteur. SGE a été formé pour bloquer le contenu nocif ou trompeur qui violerait la politique de génération IA de Google, et il ne montrera pas de visages photoréalistes de personnes célèbres pour prévenir les deepfakes potentiels. Comme mesure supplémentaire, l’outil est destiné aux utilisateurs âgés de 18 ans et plus.

Share the Post: