‍‍‍‍‍‍
Logo Afffect Media - l'actualité du marketing et de la publicité.
Marketing

Google Leaks : les secrets de l'algo révélés ?

Google Leaks : la fuite de 2500 documents internes apporte un éclairage nouveau sur le fonctionnement de la recherche Google

L'algorithme de recherche de Google fait la pluie et le beau des sites Internet. Mais la manière exacte dont Google classe les sites Web reste en grande partie opaque et mystérieuse. La fuite de 2500 documents internes pourrait apporter un éclairage nouveau.

La fuite de milliers de pages de documents internes pourrait offrir un aperçu sans précédent du fonctionnement de la recherche Google. D’après les experts, ces documents suggèrent que le géant des GAFAM n’a pas été tout à fait honnête à ce sujet depuis des années (seriously ?). Jusqu'à présent, Google n'a pas répondu aux multiples demandes de commentaires sur la légitimité des documents.

Google Leaks : fuite de documents internes sur l'algorithme de recherche de Google

Rand Fishkin, fondateur de SparkToro et ex-fondateur de Moz, affirme qu'une source (qui avait initialement demandé à rester anonyme et qui a finalement dévoilé son identité) a partagé 2 500 pages de documents avec lui dans l'espoir de contrecarrer les « mensonges » de Google sur le fonctionnement de son algorithme de recherche. Les documents internes proviendraient du “Content API Warehouse” interne de Google. “Le dimanche 5 mai, j'ai reçu un e-mail d'une personne prétendant avoir accès à une fuite massive de documentation API provenant de la division Recherche de Google. L'e-mail affirmait en outre que ces documents divulgués avaient été confirmés comme authentiques par d'anciens employés de Google et que ces ex-employés et d'autres avaient partagé des informations privées supplémentaires sur les opérations de recherche de Google. “

Les détails partagés sont denses et techniques, probablement plus lisibles pour les développeurs et les experts SEO que pour le profane. Le contenu de la fuite ne prouve pas non plus nécessairement que Google utilise les données spécifiques et les signaux mentionnés pour les classements de recherche. Selon l’expert en référencement Mike King, la fuite décrit plutôt les données que Google collecte sur les pages Web et offre des indications indirectes aux experts en référencement sur ce qui semble intéresser Google.

Les documents divulgués abordent des sujets tels que le type de données que collectées et utilisées, les classificateurs des pages traitant de sujets sensibles comme les élections ou la santé, la manière dont Google gère les petits sites Web, et bien plus encore. Selon Fishkin et King, certaines informations contenues dans les documents semblent être en conflit avec les déclarations publiques des représentants de Google. "Même si je ne reproche pas nécessairement aux représentants publics de Google de protéger leurs informations exclusives, je conteste leurs efforts visant à discréditer activement les professionnels du marketing, de la technologie et du journalisme qui ont présenté des découvertes reproductibles." écrit King. En effet, certains détails contenus dans les documents divulgués remettent en question l'exactitude des déclarations publiques de Google concernant le fonctionnement de la recherche.

Parmi les exemples cités par Fishkin et King, celui du rôle de Google Chrome dans le classement des sites web. Les représentants de Google ont à plusieurs reprises indiqué qu'ils n'utilisaient pas les données Chrome pour classer les pages. Pourtant, le navigateur est spécifiquement mentionné dans les sections sur la façon dont les sites Web apparaissent dans la recherche. Tout laisserai donc à penser que Google utilise les flux du navigateur Chrome pour améliorer ses résultats de recherche.

Autre exemple : le rôle des EEAT (Expérience, Expertise, Autorité et Trust). Une métrique Google utilisée pour évaluer la qualité des résultats. Si les représentants de Google ont déjà déclaré que EEAT n'était pas un facteur de classement, la fuite laisse penser que Google serait en réalité en capacité d’identifier les auteurs de contenu et de les traiter comme des entités dans son système. Renforcer son influence en tant qu’auteur pourrait donc conduire à des avantages en matière de classement sur Google.

Bien que ces documents ne soient pas exactement une preuve irréfutable, ils fournissent un aperçu approfondi et non filtré d’un système de boîte noire étroitement gardé.

Google Leaks : les principales informations à retenir

  • Les clics et les comportements post-clics seraient des facteurs de classement très importants
  • NavBoost, système de re-ranking basé sur les clics, influencerait de manière directe le classement
  • Google intègre les données de clics issues de Chrome
  • Les clics permettent de pondérer les liens dans les SERP en classant les pages sur 3 niveaux
  • Google applique des listes blanches pour des requêtes sensibles.

Si certaines de ces informations recoupent des informations révélées lors du procès antitrust contre Google (Google/DOJ) beaucoup sont nouvelles et invitent à une analyse plus approfondie des déclarations de la firme de Mountain View à l'avenir. « Historiquement, certains des éditeurs les plus bruyants et les plus prolifiques du secteur de la recherche se sont fait un plaisir de répéter sans critique les déclarations publiques de Google. Ils écrivent des titres comme « Google dit que XYZ est vrai » plutôt que « Google affirme que XYZ ; » Les preuves suggèrent le contraire », écrit Fishkin. « S'il vous plaît, faites mieux. Si cette fuite et le procès du DOJ peuvent créer un seul changement, j’espère que ce sera celui-là. »

Mise à jour le 30/05/2024

Google a confirmé que les documents de recherche divulgués sont réels.

______________________________________________________________

Restez informés  en vous inscrivant à notre newsletter

_________________________________________________________________

Lire davantage d'articles

Recevez Le Feuillet
Votre Newsletter marketing hebdo, pour ne manquer aucune actualité.
Il y a une erreur..