Google vient de lancer Gemini, son nouveau modèle de langage large. Il y aura une intégration progressive de Gemini dans l’écosystème de Google, y compris son moteur de recherche et son navigateur Chrome. Une version, Gemini Pro, alimente déjà le chatbot Bard AI de Google, et même les utilisateurs de Pixel 8 Pro bénéficient de fonctionnalités avancées activées par une autre version, Gemini Nano. Le PDG Sundar Pichai a fait allusion à Gemini lors de la conférence de développeurs I/O plus tôt cette année, et maintenant Google le met à la disposition du public. Oui, Gemini est la réponse de Google aux modèles GPT d’OpenAI, mais c’est aussi le modèle IA le plus avancé de Google à ce jour, conçu pour être plus qu’un simple processeur de texte. Il prend en charge plusieurs formes d’entrée de données, y compris le texte, les images, la vidéo et l’audio, et a le potentiel d’être une avancée significative par rapport aux technologies IA existantes. Google ne le présente pas comme une amélioration incrémentielle de l’IA, mais plutôt comme un changement de paradigme vers des systèmes IA plus intégrés et multimodaux. « Il prend en charge plusieurs formes d’entrée de données, y compris le texte, les images, la vidéo et l’audio… » Alors que la plupart des modèles GPT se concentrent principalement sur le traitement basé sur le texte, Gemini a été conçu dès le départ pour être natif multimodal, capable de comprendre et de traiter plusieurs types d’entrées de données. Cela lui donne un avantage considérable dans les tâches impliquant des interactions audio et vidéo – quelque chose que GPT-4 commence seulement à faire. Dans des comparaisons de benchmarks, Google a affirmé que Gemini avait surpassé GPT-4 d’OpenAI dans 30 des 32 tests impliquant le traitement audio et vidéo. Gemini est actuellement disponible en trois versions différentes, et son lancement est progressif. La première version, Gemini Nano, est légère et s’exécute nativement et hors connexion sur les appareils Android. La seconde, Gemini Pro, est plus robuste et sert de cœur pour de nombreux services IA de Google, y compris Bard, le chatbot IA de Google. La troisième, Gemini Ultra, est la version la plus puissante, conçue principalement pour les centres de données et les applications d’entreprise. Google a déclaré que les développeurs et les clients d’entreprise auront accès à Gemini Pro via Google Generative AI Studio ou Vertex AI dans Google Cloud le 13 décembre, et Gemini Ultra fera ses débuts l’année prochaine. Bien qu’initialement disponible en anglais, Google prévoit d’étendre ses fonctionnalités à d’autres langues prochainement. L’IA Gemini de Google est maintenant disponible gratuitement dans le chatbot Bard. Rendez-vous simplement sur le site web de Bard dans votre navigateur, connectez-vous ou créez un compte si vous n’en avez pas déjà un. Gardez à l’esprit que Bard nécessite spécifiquement un compte Google pour y accéder. Si vous utilisez Google Workspace, vous devrez peut-être passer à votre compte de messagerie personnel pour essayer Gemini. Nous sommes toujours en phase expérimentale, alors soyez prêt pour les bugs occasionnels de logiciel dans les réponses de votre chatbot. De plus, gardez à l’esprit que Bard est intégré à d’autres services Google, vous pouvez donc ajouter « @Gmail » pour obtenir des résumés de messages ou « @YouTube » pour des sujets relatifs aux vidéos. Pocket-lint a tous les détails sur la dernière mise à jour de Pixel et les nouvelles capacités d’IA:
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du