Bienvenue sur www.netchercheur.com | Numéro 1 - Avril 2004 | Telécharger gratuitement le numéro 1

SOMMAIRE

Page d'accueil
Le fait du mois
Actus
L'expert du mois
Le test du mois
Méthodes
BDD-Web Invisible
Veille
Veille Sectorielle
Dossier du Mois
Système d'Info
Intelligence
Agenda A Lire
Qui sommes-nous?

 

 

 

 

LE FAIT du MOIS :

LA FIN DE GOOGLE ?

Qui n’a pas interrogé Google ces dernières 24 heures ? En 67 mois, il s’est imposé comme LE moteur de recherche sur Internet. Ce moteur né en septembre 98 revendique aujourd’hui plus de 4 milliards de pages web indexées, loin devant son outsider, Alltheweb et ses 3 milliards de documents HTML référencés. Côté français, seul Exalead pourrait techniquement rivaliser avec le moteur n°1. Ce moteur, conçu par l’ancienne équipe française d’Altavista, s’apprête à finaliser son premier milliard de pages web. Positionné sur le marché des moteurs pour Intranet, Exalead ne cherche pas à concurrencer Google et ce pour des raisons de coûts. Car, un expert américain a récemment évalué le coût du crawling de 50 millions de pages web à 100 000 $ par mois !

Le leadership de Google semble fait pour durer. Ce moteur issu de l’université de Standford a pris une telle ampleur - 76% des recherches américaines passent par lui - qu’on peut raisonnablement parler de Googlemania. Pour preuve, un énième livre est paru en mars : Tout sur Google. Il fait suite à l’ouvrage d’Olivier Andrieu portant exclusivement à ce moteur. L’an dernier, un prix Pullitzer du New York Times s’interrogeait même : Google était-il Dieu ? Il lui reconnaître un certain don d’ubiquité. Alors que d’autres moteurs se fourvoyaient dans la vogue des portails, Google s’est imposé en misant tout sur la technologie.

Après des années de collaboration, Yahoo a rompu officiellement avec Google le 10 mars et s’est doté d’une technologie maison provenant d’Inktomi. Avec son interface surchargée, le pionnier des portails Yahoo déconcerte les nouveaux internautes. A l’inverse, fort d’une page d’accueil dépouillée, Google a su séduire les néophytes de l’internet tandis que ses multiples options de recherche avancées réussissent à conquérir le public averti des professionnels de l’information, ces netchercheurs. Résultat : Google traite chaque jour plus de 200 millions de requêtes et compte en Europe 55 millions d’utilisateurs .

Fort de ce succès, le moteur américain creuse son écart et expérimente sans cesse de nouvelles fonctionnalités dans son Labs. C’est là que sont d’abord nés les alertes par mail, l’indexation des journaux français, les suggestions orthographiques, la barre de recherche et la presse personnalisée. Demain, des requêtes pourront être lancées à partir d’un téléphone portable. A son zénith, ces efforts de R&D retarderont-ils la chute de Google ?

Qui se souvient qu’Altavista était hier considéré comme le meilleur moteur? L’effet de mode est démultiplié sur Internet. Si Google semble aujourd’hui à son paroxy- sme tant il fait l’unanimité, demain les nouveaux internautes oublieront peut-être jusqu’à ce nom. Ce déclin pourrait provenir d’abord des tenants des libertés publiques. Déjà, des voix dénoncent les cookies de Google, valables 34 ans ! D’autres critiquent la base de données de géo-localisation de Google qui permet de tracer l’origine d’une requête. Cette association entre requête, IP et localisation géographi-que posera aussi problème aux professionnels de l’information, soucieux de discrétion. D’abord séduits par les milliards de pages indexés, ces netchercheurs sont ensuite exaspérés par le nombre de réponses, un volume humainement indi-geste même pour le meilleur des analystes. De plus, les enjeux commer-ciaux du référencement à Google faussent les résul-tats du moteur, en tout cas pour les premières dizaines de réponses, les plus consultées. Il y a quelques mois, un journal informa-tique a publié une méthode pour obtenir plus de 100 000 référencements sur Google. Un autre point noir du moteur résulte des 4 milliards de pages crawlés (pages rapatriées vers le serveur de Google). Dans cette marée d’information, la gestion de sa base d’index (où sont stockés toutes les références aux pages visités) pose un problème essentiel.

La mise à jour de cette base, surnommée la danse de Google, ne s’effectue qu’une fois par mois. L’an dernier, un spécialiste américain des moteurs avait relevé que cinq semaines pouvaient s’écouler entre deux visites d’un même site. En pratique, cela signifie qu’une page web affichée sur Google peut remonter à plus d’un mois. De ce fait, Google devra revoir, tôt ou tard l’architecture distribuée de son moteur, qui date quand même de 1990 !
Aujourd’hui, elle se partage entre 13 points (tous aux Etats-Unis sauf un en Irlande à Dublin) qui centralisent les données recueillies par une batterie de plus de 10 000 serveurs répartis sur toute la planète. Hier, Google avait détrôné Altavista avec une technologie plus performan-te générant des réponses plus pertinentes. De nom-breux prétendants, dotés de solutions innovantes, espè-rent devenir LE moteur du futur. Qui sera demain le nouveau Google ? D’ici là, les netchercheurs exploite-ront toutes les alternatives au moteur américain.

Demain, il y aura-t-il encore quelqu’un pour interroger Google ? EC

 

Copyright 2004 - EC PRESSES. All Rights reserved.

Netchercheur est une publication mensuelle de EC Presses, Sarl de presse. RCS : Paris 451 095 764
Commission paritaire : en cours. ISSN : en cours.
Directeur de la publication et Rédacteur en chef : Emmanuel CHANIAL,
ACTUS : Maxime Paulet, Zataz
Email : contact@netchercheur.com