Contactez-nous

Prenons rendez-vous

Revenir au blog

Le moteur de recherche de Google décrypté par Google (Infographie)

Christian Neff
Christian Neff Lecture : 2 min - 05 septembre 2013

Vous êtes-vous déjà demandé comment Google fonctionnait réellement? Comment, en l’espace d’une fraction de seconde, son moteur de recherche arrive à analyser, trier et indexer des millions de pages en fonction des requêtes des utilisateurs, et à répéter cette prouesse des milliards de fois par jour ?  Bien que le géant de la Sillicon Valley ne soit pas du genre à dévoiler ses secrets, il lève quelque peu le voile sur le mystère grâce à cette magnifique infographie interactive en trois parties qui explique de manière simple et ludique la manière avec laquelle son moteur de recherche procède. 

Retrouvez l’infographie complète ici.

NB : Pendant votre lecture, n’oubliez pas de balader votre curseur sur les différentes images présentes sur l’infographie, certaines sont cliquables et recèlent des informations complémentaires plutôt intéressantes…

Partie 1. Indexation de données par Google

La première des trois parties de cette infographie explique comment Google scanne le World Wide Web (qui contient actuellement plus de 30 trillions de pages individuelles !) à la recherche de contenu et répertorie celui-ci dans son index virtuel.  Cette partie nous apprend que :

  • Les robots d’indexation de Google scannent le web en passant de page en page en utilisant les liens hypertextes comme autoroutes ;
  • Les pages visitées sont ensuite triées en fonction de leur contenu ainsi que d’autres facteurs ;
  • Elles seront ensuite stockées dans un index géant  (qui pèse plus de 100 millions de gigabytes !)

Partie 2. Algorithmes du moteur de recherche

Les ingénieurs de chez Google créent et améliorent sans cesse (de 500 à 600 fois par an) leurs algorithmes de recherche afin de mieux s’adapter aux évolutions technologiques (ainsi qu’aux pirates) pour proposer aux utilisateurs les meilleurs résultats en réponse à une soumission de requête. Ce sont ces programmes et formules qui vont décider quelles pages méritent les meilleures positions dans les résultats Google. Voici comment :

  • Lorsqu’une requête est introduite dans son moteur de recherche, Google la traite en analysant jusqu’à 200 facteurs différents afin de mieux comprendre la recherche demandée et mieux cibler les résultats ;
  • Ensuite il interroge son index et en ressort les pages qu’il juge les plus pertinentes ;
  • Et il classe enfin  les résultats en fonction de divers critères (qualité de la page et du site, « fraîcheur » du contenu, pertinence de la traduction, nombre de liens entrants, etc.) sur votre page de résultats… le tout à une vitesse moyenne 1/8e de seconde! Impressionnant, n’est-ce pas ?

Partie 3. Traiter le spam selon Google

Il est vraiment intéressant de remarquer que la 3e et dernière partie de cette infographie est entièrement consacrée aux pratiques liées au spam, preuve que Google se soucie de plus en plus de cette problématique, surtout depuis la sortie de sa dernière mise à jour Penguin (voir à ce propos notre article sur le sujet). Les techniques de spam (ou « black hat SEO ») ont pour but de manipuler l’algorithme de Google en plaçant des sites en tête des résultats par le biais de pratiques frauduleuses, telles la répétition incessante de mots-clés, l’achat de liens ou encore le contenu dupliqué. Pour Google, combattre le spam est essentiel afin de garantir des résultats pertinents. De quelle manière est-il traité ?

  • Bien que la méthodologie soit inscrite dans les algorithmes et donc automatisée, il arrive également que l’équipe anti-spam de Google se penche sur certains cas litigieux manuellement;
  • Lorsqu’un spam est détecté, le propriétaire du site est toujours avisé afin qu’il ait la possibilité de régler le problème et avant que des actions irréversibles ne soient entreprises.

L’objectif de Google a toujours été le même: réussir à offrir aux utilisateurs l’information qu’ils recherchent le plus simplement possible. C’est la raison pour laquelle son moteur de recherche réfléchit de plus en plus à la manière d’un être humain, privilégiant le contenu utile et qui apporte une réelle valeur ajoutée au contenu pauvre et artificiellement optimisé. En résumé, si vous voulez être dans les petits papiers de Google, il n’existe qu’une seule solution : produisez régulièrement du contenu frais et de qualité !

Enfin, d’un point de vue SEO également, il est essentiel de pouvoir comprendre, du moins en surface, la manière dont fonctionnent les moteurs de recherche afin de pouvoir définir une stratégie de référencement efficace et adéquate… Surtout dans une démarche inbound marketing fortement axée sur la production de contenu comme nous le proposons à nos clients chez Markentive!

newsletter-markentive