Aujourd’hui, Google a dévoilé Gemini, son logiciel de génération d’IA (genAI) le plus puissant à ce jour – et il est disponible en trois tailles différentes pour être utilisé dans tout, des datacenters aux appareils mobiles. Google développe le grand modèle de langage Gemini (LLM) depuis huit mois et a récemment donné accès à une version précoce à un petit groupe d’entreprises. L’outil de conversation genAI est de loin le plus puissant de Google, selon l’entreprise, et pourrait devenir un sérieux concurrent des autres LLM, tels que Llama 2 de Meta et GPT-4 d’OpenAI. «Cette nouvelle ère de modèles représente l’un des plus importants efforts scientifiques et techniques que nous avons entrepris en tant que société», a écrit le PDG de Google Sundar Pichai dans un message sur le blog. Le nouveau LLM est capable de plusieurs méthodes d’entrée, telles que des photos, de l’audio et de la vidéo, ou ce que l’on appelle un modèle multimodal. La méthode standard pour créer des modèles multimodaux consiste généralement à former séparément les composants pour les différentes modalités, puis à les assembler.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du