Google donne un coup de turbo à son moteur genAI avec Gemini 1.5.

Seulement une semaine après avoir publié son dernier modèle d’intelligence artificielle générative (IA génAI), Google a dévoilé jeudi le successeur de ce modèle, Gemini 1.5. La société se vante que cette nouvelle version surpasse la précédente dans presque tous les domaines.

Gemini 1.5 est un modèle d’IA multimodal désormais prêt pour les tests préliminaires. Contrairement au populaire ChatGPT d’OpenAI, Google affirme que les utilisateurs peuvent fournir à son moteur de requêtes une quantité beaucoup plus importante d’informations pour obtenir des réponses plus précises.

(OpenAI a également annoncé aujourd’hui un nouveau modèle d’IA : Sora, un modèle de texte-vidéo capable de générer des scènes vidéo complexes avec plusieurs personnages, des types spécifiques de mouvements et des détails précis sur le sujet et l’arrière-plan « tout en maintenant une qualité visuelle et une conformité aux sollicitations de l’utilisateur. Le modèle comprend non seulement ce que l’utilisateur a demandé dans la sollicitation, mais aussi comment ces choses existent dans le monde physique. »)

Une scène de film générée par Sora.

Les modèles Gemini de Google sont les seuls grands modèles de langage multimodaux (LLM) natifs de l’industrie. Gemini 1.0 et Gemini 1.5 peuvent tous deux absorber et générer du contenu via des requêtes textuelles, des images, de l’audio, de la vidéo et du code. Par exemple, les sollicitations utilisateur dans le modèle Gemini peuvent être sous forme d’images JPEG, WEBP, HEIC ou HEIF.

Share the Post: