Il semble que nous soyons en plein cœur de la deuxième ère où toute technologie populaire doit être équipée d’intelligence artificielle. Il y a à peine une dizaine d’années, des éléments d’apprentissage automatique ont fait leur apparition dans de petits trucs comme l’identification de sujets dans la vision d’une caméra ou la création de phrases qui peuvent être plus ou moins utiles. Maintenant, alors que nous nous approchons d’un pic de l’IA générative (avec peut-être davantage à venir), Google augmente les enjeux avec son nouveau modèle «multimodal» appelé Gemini. Si vous vous demandez ce qui fait fonctionner Gemini, pourquoi il est si différent des ChatGPT d’OpenAI et comment vous pourriez avoir l’occasion de le voir en action, nous sommes là pour vous donner un aperçu de la situation. Google a présenté Gemini le 6 décembre 2023, comme son dernier modèle de génération d’intelligence artificielle «multimodal» tout usage. Il est disponible en trois tailles – Ultra, qui est retenu pour une utilisation plus large pour le moment, Pro et Nano. Jusqu’à ce jour, les grands modèles de langage largement disponibles ou LLM fonctionnaient en analysant les médias d’entrée afin de se développer sur le sujet dans un format de média souhaité. Par exemple, le modèle GPT (Generative Pre-trained Transformer) d’OpenAI s’occupe d’échanges de texte à texte tandis que DALL-E traduit les invite
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du