Aujourd’hui, Google a dévoilé Gemini, son modèle de logiciel génératif AI (genAI) le plus puissant à ce jour – et il existe en trois tailles différentes afin qu’il puisse être utilisé dans tout, des centres de données aux appareils mobiles. Google développe le grand modèle de langage Gemini (LLM) depuis huit mois et a récemment donné accès à une version précoce à un petit groupe d’entreprises. L’outil genAI conversationnel est de loin le plus puissant de Google, selon l’entreprise, et pourrait devenir un sérieux concurrent des autres LLM tels que Llama 2 de Meta et GPT-4 d’OpenAI. «Cette nouvelle ère de modèles représente l’un des plus importants efforts de science et d’ingénierie que nous ayons entrepris en tant que société», a écrit dans un blog le PDG de Google Sundar Pichai. Le nouveau LLM est capable de plusieurs types d’entrée, comme des photos, de l’audio et de la vidéo, ou ce que l’on appelle un modèle multimodal. La approche standard pour créer des modèles multimodaux consiste généralement à former des composants séparés pour différentes modalités, puis à les assembler.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du