GPT-4 est de plus en plus rapide 🐇

Au cours des derniers mois, nous avons attentivement observĂ© les temps de latence pour GPT 3.5 et 4. Les motifs Ă©mergents ont Ă©tĂ© intrigants. La principale observation? GPT-4 rattrape son retard en matiĂšre de vitesse, rĂ©duisant ainsi l’écart de latence avec GPT 3.5. Nos rĂ©sultats rĂ©vĂšlent une rĂ©duction constante de la latence de GPT-4. Bien que vos rĂ©sultats puissent varier en fonction des invitations spĂ©cifiques, la tendance gĂ©nĂ©rale est claire, comme le montre le graphique suivant prĂ©sentant les requĂȘtes mĂ©dianes sur une pĂ©riode de trois mois. Mais quels sont les facteurs qui contribuent Ă  la latence? Voyons cela de plus prĂšs: il est important de noter qu’un grand nombre de jetons ne signifie pas nĂ©cessairement une rĂ©ponse plus lente. Par exemple, une invitation avec 204 jetons, bien qu’elle soit simple, peut ĂȘtre traitĂ©e en 4,5 secondes. D’un autre cĂŽtĂ©, une invitation de 33 jetons, si elle est complexe, peut prendre jusqu’à 32 secondes pour ĂȘtre traitĂ©e.

Share the Post: