Google lance ses systèmes Gemini AI, affirme qu’il bat OpenAI et d’autres – surtout

Google a dévoilé Gemini, ses nouveaux modèles de transformateurs les plus puissants à ce jour, capables de traiter du texte, des images, de l’audio et de la vidéo. Gemini est un modèle multimodal avec une fenêtre de contexte de 32 000 mots qui peut prendre différents types de données en entrée et générer des images et du texte en sortie, et se décline en trois tailles différentes. Le plus grand, Gemini Ultra, est la version la plus puissante conçue pour les tâches complexes nécessitant un « raisonnement » ou le traitement de plusieurs types de données. Gemini Pro, est le modèle de taille moyenne qui a été optimisé pour fonctionner plus efficacement et effectuer une gamme plus large de tâches. Le plus petit Gemini Nano est divisé en deux, le Nano-1 compte 1,8 milliard de paramètres, et le Nano-2 en compte 3,25 milliards, et ils sont conçus pour fonctionner sur de petits appareils. Google n’a pas révélé combien de paramètres contiennent ses modèles Gemini Pro et Gemini Ultra plus puissants. Alors, à quoi sert Google Gemini? A partir d’aujourd’hui, son chatbot AI Bard a été mis à jour pour fonctionner avec Gemini Pro, ce qui signifie qu’il devrait mieux comprendre et résumer le texte que sa version précédente propulsée par le langage PaLM 2 de Google. Les capacités multimodales, cependant, ne sont pas tout à fait prêtes et la version Gemini Pro de Bard ne peut traiter et générer que du texte, et ne prend en charge que l’anglais pour le moment. Google prévoit également de revoir certains de ses produits de recherche, de publicité, de Chrome et d’IA Duet, tels que Gmail, Google Docs, et plus encore, au cours des prochains mois.

Share the Post: