Google PageRank, comment fonctionne le calcul des liens aujourd’hui
Il était une fois le PageRank… ou l'est-il encore ? Le site Search Engine Watch a consacré une étude approfondie à la méthode de calcul de la qualité et de la quantité des liens reçus par un site, qui détermine sa crédibilité et son autorité sur les moteurs de recherche, en essayant de dissiper certaines idées fausses qui persistent encore aujourd'hui.
L’histoire du PageRank
En 2008, le PageRank était la partie principale de l'algorithme de classement de Google, a déclaré Udi Manber, alors vice-président de la société californienne, mais les évolutions ultérieures du moteur de recherche ont beaucoup changé la situation, et nous savons qu'il existe aujourd'hui au moins 200 facteurs de classement utilisés pour déterminer la position d'un site et de ses pages.
Métriques pour calculer la quantité et la qualité des backlinks
Au début, le PageRank était un indice de la popularité d'un site sur le Web, déterminé par le nombre de liens retour qu'il recevait d'autres sites, qui représentaient des "votes" de confiance et d'approbation, lesquels avaient à leur tour un poids différent selon la valeur du site de liaison et sa popularité.
Formule simplifiée
L'algorithme complet de calcul du PageRank fait appel à la théorie des processus de Markov et est classé dans la véritable catégorie des algorithmes de classement par analyse des liens. À partir de la formule initialement développée par les fondateurs de Google, Sergey Brin et Larry Page, il est possible de comprendre comment le PageRank est distribué entre les pages :
Où :
- PR[A] est la valeur du PageRank de la page A que nous voulons calculer.
- N est le nombre total de pages connues.
- n est le nombre de pages qui contiennent au moins un lien vers A. Pk représente chacune de ces pages.
- PR[Pk] sont les valeurs de PageRank de chaque page Pk.
- C[Pk] sont le nombre total de liens contenus dans la page proposant le lien.
- d (damping factor) est un facteur décidé par Google et qui dans la documentation originale prend la valeur 0.85. Il peut être ajusté par Google pour décider du pourcentage de PageRank qui doit passer d'une page à l'autre et de la valeur minimale de PageRank attribuée à chaque page de l'archive.
D'après la formule, on peut donc voir que plus le nombre total de liens de sites pointant vers A augmente, plus le PageRank augmente.
Adieu au PR dans la barre d'outils Google
La dernière mise à jour publique officielle de PageRank a eu lieu en décembre 2013, et en octobre de l'année suivante, l'adieu à PageRank dans la barre d'outils Google a été annoncé, cette même barre étant retirée du navigateur deux ans plus tard.
Cependant, comme nous l'avons mentionné dans un article plus ancien sur l'algorithme RankBrain et Hummingbird de Google, le PageRank s'est en quelque sorte fondu dans le système plus général et plus complexe avec lequel le moteur de recherche gère le contenu et les classements, devenant l'un des facteurs d'évaluation.
Le PageRank est toujours un facteur de classement des moteurs de recherche
Ainsi, le PageRank de la barre d'outils a disparu, mais il existe différentes indications sur l'architecture qui sous-tendait la métrique : en 2017, Gary Illyes a confirmé sur Twitter que le PageRank était toujours un signal de classement, et en avril 2018, Google a mis à jour et étendu le brevet PageRank 2018. On peut dire que le système d'analyse des liens existe toujours et est toujours pris en compte par Google, et c'est à partir de cette réflexion que s'ouvre l'article signé par Aleh Barysevich.
Le "PageRank de Google est l'une des métriques qui a tout déclenché", déclare l'auteur en ouverture, rappelant que le terme figurait déjà dans le tout premier document de recherche qui a jeté les bases de tout le système de classement de Google, signé par Sergey Brin et Lawrence Larry Page.
Qu’est-ce que le PageRank de Google ?
En bref, le PageRank est une méthode permettant de détecter l'importance, la crédibilité et le "poids" d'une page web en fonction du type de backlink qu'elle reçoit. Il s'agit d'un système qui fonctionne de manière similaire aux citations académiques : plus le profil de backlink est solide, plus un site reçoit de backlinks appropriés et faisant autorité, plus il a de chances d'être bien classé sur Google.
Par conséquent, depuis que le PageRank a été adopté, la communauté des référenceurs tente d'optimiser les sites en fonction de ces valeurs. Au cours de sa longue histoire en tant que "facteur de classement vital", le PageRank a été entouré d'une multitude d'idées fausses, dont celles mises en évidence par l'article américain.
Le PageRank est une métrique obsolète (idée fausse N°1)
La première idée fausse consiste précisément à considérer que le système PageRank est vieux, obsolète et dépassé, ou du moins le raisonnement qui sous-tend la métrique. Certes, l'internet et le système de recherche de Google évoluent constamment à la vitesse de l'éclair, mais le PR reste à bien des égards une pierre angulaire de l'ensemble du système de classement de Google, conçu à l'origine pour aider les utilisateurs à éviter les résultats inutiles dans leurs recherches.
En outre, de nombreux changements ont été apportés à la formule du PageRank depuis la version de 1999, reflétant les évolutions de l'algorithme et du paysage du Web.
Google n’utilise plus le PageRank ? (idée fausse N°2)
Une considération connexe suit : Google n'utilise plus cet outil depuis qu'il a cessé de le mettre à jour publiquement. En fait, et comme mentionné, il n'y a jamais eu d'interruption officielle du PageRank, il a juste été rendu non ouvertement disponible aux utilisateurs.
En pratique, cela pourrait signifier (et Barysevich en semble tout à fait convaincu) que Google a seulement cessé de montrer les scores PR publics (la valeur de un à dix de toute page visitée, qui apparaissait également via la barre d'outils Google susmentionnée), mais que son utilisation interne reste valable.
Pourquoi Google a supprimé le PageRank
Cette révolution était nécessaire car les informations publiques sur le PageRank avaient facilité les activités d'optimisation manipulatrices (y compris par le biais de techniques SEO black hat) et l'utilisation de spam de liens afin de forcer le classement. Cette situation a donné naissance à l'algorithme Pingouin et à ses pénalisations massives, et a également conduit à l'émergence de l'attribut nofollow pour les liens ou de l'outil de désaveu des liens, qui étaient utiles pour éviter que le PageRank ne soit influencé négativement par certains backlinks suspects ou hors de contrôle.
Malgré cela, de nombreuses agences et sites de référencement ont continué à travailler en se concentrant uniquement sur la manipulation du PageRank, au détriment de la qualité du contenu et de la "finalité bénéfique" des pages pour les utilisateurs réels, ce qui a contraint Google à une répression finale et définitive.
Vous ne pouvez pas mesurer le poids d’une page (idée fausse N°3)
La prochaine idée fausse fréquente concerne la possibilité d'évaluer le poids d'une page : selon cette idée fausse, depuis que le PageRank n'est plus public, il n'y aurait aucun autre moyen de savoir quelle valeur Google accorde à une page.
En réalité, même si aucune entreprise ni aucune équipe de développeurs ne peut prétendre connaître exactement le PageRank d'une page, il existe des outils alternatifs utiles (à utiliser toujours avec sagesse et professionnalisme), parmi lesquels le CF de Majestic.
L'objectif de cette métrique doit être clair : une indication claire et immédiate pour quiconque souhaite connaître le jugement du moteur de recherche sur une page, en fonction des estimations de trafic, des possibilités de développement, de la confiance dans le domaine, de la stabilité de la position, etc.
FAQ sur le Pagerank
Quel est le principe du PageRank ?
Le PageRank est un algorithme développé par Larry Page et Sergey Brin, les fondateurs de Google, pour évaluer la pertinence des pages web dans les résultats de recherche. Le principe du PageRank repose sur l'idée que la qualité d'une page web dépend non seulement du nombre de liens pointant vers elle, mais aussi de la qualité de ces liens.
Voici les principaux éléments du fonctionnement du PageRank :
Notion de lien comme vote : Le PageRank considère un lien d'une page A vers une page B comme un vote de la page A en faveur de la page B. Plus une page reçoit de votes (liens), plus elle est considérée comme importante.
Poids des liens : Tous les liens ne sont pas égaux. Le PageRank attribue des poids différents aux liens en fonction de la qualité et de l'autorité de la page source. Ainsi, un lien provenant d'une page très influente compte davantage qu'un lien provenant d'une page moins importante.
Propagation du score : L'algorithme distribue les scores de PageRank de manière itérative à toutes les pages du web. Initialement, chaque page a un score égal. Lors des itérations, ce score est redistribué en fonction des liens entrants.
Importance de la diversité des liens : Afin d'éviter la manipulation du système, le PageRank prend en compte la diversité des sources de liens. Ainsi, une page avec des liens provenant de différentes sources est mieux évaluée qu'une page avec un grand nombre de liens provenant d'une seule source.
Calcul de la probabilité de transition : Le PageRank utilise une formule mathématique basée sur la probabilité de transition entre les pages pour déterminer la distribution finale des scores.
Qui a créé le PageRank ?
Le PageRank a été créé par Larry Page et Sergey Brin, les cofondateurs de Google. Ils ont développé cet algorithme au début des années 1990 alors qu'ils étaient doctorants à l'Université Stanford. L'idée était de concevoir un moyen de mesurer la pertinence des pages web en fonction de la qualité et de la quantité de liens pointant vers elles. Le PageRank a été l'un des éléments fondamentaux qui a contribué au succès de Google en fournissant des résultats de recherche plus pertinents et en améliorant la qualité globale de l'expérience utilisateur.
Comment calculer le PageRank ?
Le calcul précis du PageRank est basé sur un algorithme complexe et itératif. Bien que les détails exacts de l'algorithme de Google ne soient pas divulgués publiquement, voici une explication simplifiée du processus de calcul du PageRank :
Attribution initiale des scores : Chaque page web commence avec un score de PageRank initial, généralement égal.
Notion de vote : Les liens entre les pages sont considérés comme des votes. Une page qui reçoit un lien de qualité depuis une autre page bénéficie d'un vote plus fort.
Poids des votes : Les votes ne sont pas tous égaux. Le PageRank prend en compte la qualité de la page source. Ainsi, un lien provenant d'une page plus importante a un poids plus élevé.
Distribution des scores : Les scores de PageRank sont redistribués de manière itérative à chaque page en fonction des votes qu'elle reçoit. Ce processus est répété plusieurs fois pour converger vers une distribution stable des scores.
Probabilité de transition : Le calcul du PageRank utilise des concepts de probabilité de transition pour modéliser le fait qu'un utilisateur, lorsqu'il surfe sur le web, peut passer d'une page à une autre en suivant les liens.
Diversité des liens : Le PageRank prend en compte la diversité des sources de liens. Ainsi, une page avec des liens provenant de différentes sources est mieux évaluée qu'une page avec un grand nombre de liens provenant d'une seule source.
Itérations : Le processus de redistribution des scores est répété plusieurs fois (généralement des centaines de fois) pour que les scores convergent vers une valeur stable.
Pourquoi pour les entreprises qui ont un site web le PageRank Est-il important ?
Pour les entreprises qui ont un site web, le PageRank est important pour plusieurs raisons :
Visibilité dans les résultats de recherche : Le PageRank est un facteur essentiel utilisé par les moteurs de recherche, en particulier Google, pour déterminer la pertinence d'une page web. Les pages avec un PageRank élevé ont plus de chances de figurer en haut des résultats de recherche, ce qui augmente leur visibilité en ligne.
Credibilité et confiance : Les utilisateurs ont tendance à faire confiance aux résultats de recherche bien classés. Un PageRank élevé peut être perçu comme une indication de la qualité et de la pertinence d'une page, renforçant ainsi la crédibilité de l'entreprise.
Trafic organique : Les sites web bien classés bénéficient généralement d'un trafic organique plus important, car les utilisateurs ont plus de chances de cliquer sur les premiers résultats de recherche. Cela peut conduire à une augmentation du nombre de visiteurs sur le site, ce qui est crucial pour la croissance en ligne d'une entreprise.
Compétitivité en ligne : Dans des secteurs concurrentiels, avoir un bon PageRank est un avantage concurrentiel. Un classement élevé dans les résultats de recherche peut permettre à une entreprise de se démarquer de la concurrence et d'attirer davantage d'attention.
Marketing en ligne efficace : Un site web bien classé grâce à un PageRank élevé peut réduire la nécessité de dépenser de l'argent sur des publicités en ligne. Le trafic organique provenant des résultats de recherche peut être une source précieuse et rentable de visiteurs.
Optimisation pour les moteurs de recherche (SEO) : Travailler à améliorer le PageRank encourage également une optimisation plus générale du site pour les moteurs de recherche. Les bonnes pratiques de SEO visant à améliorer la qualité du contenu et la structure du site contribuent à une meilleure visibilité en ligne.
PageRank a perdu du poids
Venons-en au dernier point : par rapport au passé, le PageRank a perdu du poids et de l'importance pour Google, qui privilégie d'autres facteurs pour effectuer ses classements.
Il s'agit en fait d'une évaluation complexe, car il est impossible d'établir avec certitude quels critères ont un impact prioritaire pour l'algorithme : par exemple, dans les occasions publiques, des Googlers comme Martin Splitt parlent ouvertement de la qualité du contenu ou de la performance, tandis que la référence aux backlinks est presque toujours négligée, plus ou moins délibérément.
Cependant, les liens ont toujours une valeur concrète et solide, et les expériences de référencement le confirment : pour cette raison, le link building reste une option valable pour tenter de dynamiser des pages de valeur de manière naturelle et non manipulatrice, si évidemment il est réalisé correctement et sans erreurs qui pourraient alarmer Google.