Un informateur anonyme a révélé des milliers de documents de l’API de recherche Google, offrant un aperçu inédit des systèmes internes de classement des résultats de recherche. L'auteur a d'abord été sceptique, mais après avoir consulté des ex-employés de Google et des experts en SEO tels que Mike King, l’authenticité des documents a été confirmée. Ces documents révèlent notamment l’existence de "NavBoost", un système qui utilise les données de navigation des utilisateurs pour améliorer la qualité des résultats de recherche, et de diverses méthodes pour combattre le spam de clics. Les documents montrent également que Google utilise des données de clickstream provenant du navigateur Chrome, et qu’ils maintiennent des listes blanches pour certains types de recherches sensibles, comme les élections et la Covid-19. Des évaluations humaines via la plateforme de notation « EWOK » influencent aussi les algorithmes de recherche. Enfin, il apparaît que Google classe les liens en fonction de la qualité des clics qu’ils reçoivent, ce qui déterminerait leur impact sur les classements. Ces révélations sont potentiellement révolutionnaires pour les professionnels du SEO, remettant en question bon nombre de déclarations publiques de Google et soulignant l'importance d'établir une marque de confiance. Malgré cette mine d’informations, il reste des incertitudes quant à l’utilisation précise de certains éléments dans l’algorithme actuel de Google. Pour en savoir davantage et découvrir toutes les implications de cette fuite, consultez l'article complet.
Tout LIRE 👇Une Source Anonyme a Partagé des Milliers de Documents d'API de Recherche Google Avec Moi ; Tout le Monde dans le SEO Devrait les Voir
Dimanche 5 mai, j'ai reçu un email d'une personne prétendant avoir accès à une fuite massive de documents internes de Google Search. Cet informateur anonyme m'a assuré que des anciens employés de Google avaient confirmé l'authenticité des documents et qu'ils avaient partagé des informations confidentielles sur le fonctionnement des algorithmes de recherche.
Le contenu de ces documents contredit directement plusieurs déclarations publiques de Google, notamment la négation de l'utilisation des signaux utilisateurs basés sur les clics, le traitement différent des sous-domaines, l'existence d'une sandbox pour les nouveaux sites, et plus encore.
Évidemment, j'étais sceptique. Les affirmations de cette source semblaient extraordinaires, comme :
- Au début, l'équipe de recherche de Google a reconnu le besoin de données complètes de clickstream pour un grand pourcentage d'utilisateurs du web, afin d'améliorer la qualité des résultats de recherche.
- Un système appelé "NavBoost" a initialement recueilli des données via la Google Toolbar, et l'envie d'obtenir plus de données de clickstream a été une motivation clé pour la création du navigateur Chrome.
- NavBoost identifie la demande de recherche en fonction du nombre de recherches pour un mot-clé donné, ainsi que par les clics longs par rapport aux clics courts.
Ces documents montrent également que Google utilise l'historique des cookies, les données des utilisateurs connectés à Chrome, et d'autres techniques pour lutter contre le spam de clics. NavBoost évalue aussi l'intention de l'utilisateur en fonction des clics et de l'engagement dans les recherches.
Leake Authentique ou Non ?
À ce stade, il était crucial de vérifier l'authenticité des documents de l'API. J'ai donc contacté des ex-employés de Google pour recueillir leurs avis. Deux ont confirmé de manière anonyme que les documents avaient toutes les caractéristiques d'une API interne de Google.
Pour analyser et déchiffrer les aspects techniques des documents, j'ai fait appel à Mike King, expert SEO et fondateur de iPullRank. Après un examen minutieux, Mike a confirmé que les documents semblaient légitimes et contenaient une quantité extraordinaire d'informations non confirmées auparavant sur le fonctionnement interne de Google. Voici quelques conclusions clés :
#1 : Utilisation des Données de Clics par NavBoost et Chrome
NavBoost utilise différents types de clics (bons, mauvais, longs, courts), les impressions, et d'autres métadonnées pour affiner la qualité des résultats de recherche. Les données de clics provenant de Chrome sont également utilisées pour déterminer les URL les plus populaires et importantes pour chaque site.
#2 : Listes Blanches pour le Covid-19 et les Élections
Google utilise des listes blanches pour certains types de recherches sensibles, comme celles concernant le Covid-19 et les élections, pour s'assurer que l'information provient de sources fiables.
#3 : Utilisation des Évaluations Humaines
Des éléments provenant de la plateforme d'évaluation EWOK influencent les algorithmes de recherche, suggérant que les avis humains sur la qualité des sites Web sont pris en compte.
#4 : Impact des Données de Clics sur le Poids des Liens
Google classe les liens selon la qualité des clics qu’ils reçoivent. Un lien qui génère beaucoup de bons clics figure dans l’index des liens de haute qualité et transmet des signaux de classement.
Implications pour les Professionnels du SEO
Ces découvertes soulignent l’importance de développer une marque de confiance et de comprendre que la construction d’une présence forte en ligne, reflétée par un grand nombre de clics et une interaction utilisateur positive, peut améliorer significativement les classements dans Google.
En résumé, ces documents révèlent des méthodes internes et des données collectées par Google pour améliorer la qualité des résultats de recherche, bien souvent en contraste avec les déclarations publiques faites par l'entreprise. Pour les professionnels du SEO, cette fuite offre un nouvel éclairage potentiellement révolutionnaire sur les véritables opérations de Google.