Au cours des derniers mois, nous avons observĂ© avec intĂ©rĂȘt les temps de rĂ©ponse pour GPT 3.5 et 4. Les tendances Ă©mergentes ont Ă©tĂ© intrigantes. L’observation marquante? GPT-4 rattrape son retard en vitesse, rĂ©duisant l’Ă©cart de latence avec GPT 3.5. Nos rĂ©sultats rĂ©vĂšlent une baisse constante de la latence de GPT-4. Bien que vos rĂ©sultats puissent varier en fonction des invitations spĂ©cifiques, la tendance gĂ©nĂ©rale est claire, comme le montre le graphique suivant mettant en Ă©vidence les demandes mĂ©dianes sur une pĂ©riode de trois mois. Mais quels facteurs contribuent Ă la latence? Voyons ça en dĂ©tail: il est important de noter qu’un grand nombre de jetons ne signifie pas toujours une rĂ©ponse plus lente. Par exemple, une invitation avec 204 jetons, bien que simple, peut ĂȘtre traitĂ©e en 4,5 secondes. D’un autre cĂŽtĂ©, une invitation de 33 jetons, si elle est complexe, peut prendre jusqu’Ă 32 secondes pour ĂȘtre traitĂ©e.
« Les livres de Penguin Random House disent maintenant explicitement ‘non’ Ă la formation IA »
‘Ăcrit par Emma Roth, dont le portfolio couvre aussi bien les percĂ©es technologiques grand public, les dynamiques de l’industrie du