Google a dévoilé aujourd’hui Gemini, son logiciel de génération de modèles AI (genAI) le plus puissant à ce jour – et il est disponible en trois tailles différentes afin qu’il puisse être utilisé dans tout, des centres de données aux appareils mobiles. Google développe le grand modèle de langage Gemini (LLM) depuis huit mois et a récemment donné accès à une version précoce à un petit groupe d’entreprises. L’outil de conversation genAI est de loin le plus puissant de Google, selon l’entreprise, et pourrait devenir un sérieux concurrent des autres LLM, tels que Llama 2 de Meta et GPT-4 d’OpenAI. «Cette nouvelle ère de modèles représente l’un des plus importants efforts de recherche et de développement que nous ayons entrepris en tant que société», a écrit le PDG de Google Sundar Pichai dans un message sur le blog. Le nouveau LLM est capable de plusieurs méthodes d’entrée, telles que des photos, de l’audio et des vidéos, ou ce que l’on appelle un modèle multimodal. La méthode standard pour créer des modèles multimodaux consiste généralement à former des composants séparés pour différentes modalités, puis à les assembler.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du