« Les documents internes de Google sur le classement des recherches fuient en ligne, déclenchant une frénésie de référencement SEO. »

Un trésor de documents qui semblent décrire comment Google classe les résultats de recherche est apparu en ligne, probablement suite à une publication accidentelle par un bot interne. La documentation divulguée décrit une ancienne version de l’API Content Warehouse de Google et offre un aperçu du fonctionnement interne de la recherche Google. Le matériel semble avoir été commis involontairement à un dépôt accessible au public détenu par Google sur GitHub vers le 13 mars par l’outil automatisé de la société. Cette automatisation a ajouté une licence open source Apache 2.0 à la publication, comme c’est la norme pour la documentation publique de Google. Une confirmation ultérieure le 7 mai a tenté d’annuler la fuite. Le matériel a quand même été repéré par Erfan Azimi, PDG de EA Digital Eagle, une entreprise d’optimisation pour les moteurs de recherche (SEO), puis a été divulgué le dimanche par ses collègues dans le SEO, Rand Fishkin, PDG de SparkToro, et Michael King, PDG de iPullRank. Ces documents ne contiennent pas de code ou autre chose, et décrivent plutôt comment utiliser l’API Content Warehouse de Google probablement réservée à un usage interne seulement ; la documentation divulguée comprend de nombreuses références aux systèmes internes et projets. Alors qu’il existe déjà une API Google Cloud du même nom qui est publique, ce qui s’est retrouvé sur GitHub va bien au-delà, semble-t-il.

Share the Post: