Google ne peut indexer tout le web !
3 août 2007
Aussi surprenant que cela puisse paraître, Google, malgré tout son argent et tout ses ordinateurs, ne semble indexer qu’une petite fraction de l’Internet.
C’est Jonathan Hochman qui le dit dans son article daté d’hier.
Il explique et relate une conversation un peu « off » qu’il a eu avec Dan Crow, un des responsables « architecture » de Google.
Celui-ci lui explique que le web est trop grand et que même Google ne connait pas sa taille réelle… Mais il va encore plus loin: Google aura beau acheter tous les ordinateurs qu’il voudra, construire tous les « data center » que son immense cash peut lui permettre, il ne pourra indexer qu’une fraction de l’Internet !!!
Ce qui lui manque ? …
Deux choses qu’il ne peut se payer, car il n’y en a de toute façon pas assez sur la terre entière pour cela: de l’électricité et de la bande passante !!
Suprenant non ?!!
Jonathan Hochman:
« …the World Wide Web is very large, and Google is not even sure how large. We can only index a fraction of it. Google has plenty of capital to buy more computers, but there just isn’t enough bandwidth and electricity available in the world to index the entire Internet. »
D’aprés les premiers retours que l’on peut lire sur le web US, un code HTML simple et léger et un PageRank pas trop faiblard vous assurent une présence dans l’index de Google et donc une possibilité de positionnement dans les premières pages de Google.
Un petit mot rapide pour vous dire que j’ai découvert ce matin le blog de Gregory, Wizishop, qui traite lui aussi du ecommerce. Souhaitons lui longue vie, et voici déjà un petit lien sympa pour lui: blog ecommerce.
(Fin de l’article)
____________________________________________________
Plus d’infos:
1. Voici les prestations de l’agence Blog-Ecommerce.
2. Voici aussi notre logiciel de gestion de flux Shopping Flux.
3. Et voici enfin les sociétés partenaires de notre agence.


6 août 2007 à 17:17
Bonjour,
A mon avis, ce qui manque principalement à Google pour indexer tout le web n’est ni l’électricité ni la bande passante contrairement à ce qu’ils disent :)
Le web invisible est certainement des dizaine / des centaines de fois plus plus volumineux que l’index de Google. Le probleme est donc la technologie qui est limitée.
Des pages sur le web invisible :
http://www.google.fr/search?q=web+invisible&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:fr:official&client=firefox-a