Le jeudi, Google a dévoilé Gemini 1.5 Pro, que l’entreprise décrit comme offrant des performances « nettement améliorées » par rapport au modèle précédent. La trajectoire de l’IA de l’entreprise, considérée en interne comme de plus en plus cruciale pour son avenir, suit la présentation de Gemini 1.0 Ultra la semaine dernière, en même temps que le changement de nom du chatbot Bard (en Gemini) pour correspondre aux capacités plus puissantes et polyvalentes du nouveau modèle. Dans un article de blog d’annonce, Sundar Pichai, PDG de Google, et Demis Hassabis, PDG de Google DeepMind, tentent de trouver un équilibre entre l’assurance de leur audience quant à la sécurité éthique de l’IA et la mise en valeur des capacités rapidement croissantes de leurs modèles. « Nos équipes continuent de repousser les limites de nos derniers modèles en mettant la sécurité au cœur du développement », résume Pichai. L’entreprise doit mettre l’accent sur la sécurité pour les sceptiques de l’IA (dont un ancien PDG de Google) et les régulateurs gouvernementaux. Mais elle doit également souligner les performances en constante accélération de ses modèles pour les développeurs d’IA, les clients potentiels et les investisseurs qui s’inquiétaient que l’entreprise ait réagi trop lentement au succès fulgurant de ChatGPT d’OpenAI. Pichai et Hassabis affirment que Gemini 1.5 Pro offre des résultats comparables à ceux de Gemini 1.0 Ultra. Cependant, Gemini 1.5 fonctionne à ce niveau de manière plus efficace, avec des exigences computationnelles réduites. Les capacités multimodales incluent le traitement de texte, d’images, de vidéos, d’audio ou de code. À mesure que les modèles d’IA évoluent, ils continueront d’offrir une gamme de capacités plus polyvalente dans une seule boîte de dialogue (un autre exemple récent étant l’intégration par OpenAI de la génération d’images DALL-E 3 dans ChatGPT). Gemini 1.5 Pro peut également traiter jusqu’à un million de jetons, ou unités de données que les modèles d’IA peuvent traiter dans une seule demande. Google affirme que Gemini 1.5 Pro peut traiter plus de 700 000 mots, une heure de vidéo, 11 heures d’audio et des bases de code avec plus de 30 000 lignes de code. La société affirme même avoir « testé avec succès » une version prenant en charge jusqu’à 10 millions de jetons.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ à la formation IA »
‘Écrit par Emma Roth, dont le portfolio couvre aussi bien les percées technologiques grand public, les dynamiques de l’industrie du