Mille milliards de pages répertoriées sur le Web ?

le 28/07/2008 à 23:16
Mille milliards de pages répertoriées sur le Web ?
Mille milliards, soit un un suivi de douze zéros : c'est le nombre de pages Web identifiées par une adresse (URL) unique que Google affirme avoir détectées sur le Web : une gigantesque Toile, dont le rythme de croissance serait de plusieurs milliards de nouvelles pages chaque jour.

Le numéro un mondial de la recherche en ligne aurait-il l'intention de relancer la course à l'indexation ? Pendant plusieurs années, les différents acteurs du secteur ont en effet rivalisé d'annonces, visant à démontrer la supériorité de leur index par rapport à ceux de leurs concurrents. Ambitieux, mais pas mégalomane, Google rappelle qu'il revendique un index d'environ 40 milliards de pages.

Les ingénieurs qui travaillent à l'élaboration des algorithmes de recherche estiment toutefois que ce nombre de mille milliards de pages correspond assez bien à la réalité du Web d'aujourd'hui. En réalité, ils indiquent avoir découvert bien plus d'un billion de liens uniques sur le Web, mais nombreux sont les liens qui pointent vers des pages au contenu identique. Exemple à chaque billet d'un forum correspond le plus souvent une adresse unique, et pourtant chacun des liens concernés affiche la même page.

A l'occasion de cette communication, qui vise essentiellement à défendre et promouvoir le modèle de crawling utilisé par Google, la firme de Mountain View met une nouvelle fois sur le métier une vieille question : quelle est donc la taille du Web ?

Commentaires

Ecrire

Ecrire un message

Votre message vient d'être créé avec succès.
LoadingChargement en cours