Aujourd’hui, Google a dévoilé Gemini, son modèle de logiciel de génération d’IA (genAI) le plus puissant à ce jour – et il est disponible en trois tailles différentes afin qu’il puisse être utilisé dans tout, des centres de données aux appareils mobiles. Google a développé le grand modèle de langage Gemini (LLM) au cours des huit derniers mois et a récemment donné accès à une version précoce à un petit groupe d’entreprises. L’outil conversationnel et genAI est de loin le plus puissant de Google, selon l’entreprise, et il pourrait devenir un sérieux concurrent des autres LLM, tels que Llama 2 de Meta et GPT-4 d’OpenAI. « Cette nouvelle ère de modèles représente l’un des plus importants efforts scientifiques et techniques que nous avons entrepris en tant qu’entreprise », a écrit dans un blog post le PDG de Google Sundar Pichai. Le nouveau LLM est capable de multiples méthodes d’entrée, telles que des photos, de l’audio et de la vidéo, ou ce qu’on appelle un modèle multimodal. La méthode standard pour créer des modèles multimodaux consiste généralement à former séparément les composants pour les différentes modalités, puis à les assembler.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du