|
SOMMAIRE
Page d'accueil
Le fait du mois
Actus
L'expert du mois
Le test du mois
Méthodes
BDD-Web Invisible
Veille
Veille Sectorielle
Dossier du Mois
Système d'Info
Intelligence
Agenda A Lire
Qui sommes-nous?
|
LE FAIT du MOIS :
LA FIN DE GOOGLE ?
Qui n’a pas interrogé Google ces dernières
24 heures ? En 67 mois, il s’est imposé comme LE moteur
de recherche sur Internet. Ce moteur né en septembre 98 revendique
aujourd’hui plus de 4 milliards
de pages web indexées, loin devant son outsider, Alltheweb
et ses 3 milliards de documents HTML référencés.
Côté français, seul Exalead pourrait techniquement
rivaliser avec le moteur n°1. Ce moteur, conçu par l’ancienne
équipe française d’Altavista, s’apprête
à finaliser son premier milliard de pages web. Positionné
sur le marché des moteurs pour Intranet, Exalead ne cherche
pas à concurrencer Google et ce pour des raisons de coûts.
Car, un expert américain a récemment évalué
le coût du crawling de 50 millions
de pages web à 100 000 $ par mois !
Le leadership de Google semble fait pour durer.
Ce moteur issu de l’université de Standford a pris
une telle ampleur - 76% des recherches américaines passent
par lui - qu’on peut raisonnablement parler de Googlemania.
Pour preuve, un énième livre est paru en mars : Tout
sur Google. Il fait suite à l’ouvrage d’Olivier
Andrieu portant exclusivement à ce moteur. L’an dernier,
un prix Pullitzer du New York Times s’interrogeait même
: Google était-il Dieu ? Il lui reconnaître un certain
don d’ubiquité. Alors que d’autres moteurs se
fourvoyaient dans la vogue des portails, Google s’est imposé
en misant tout sur la technologie.
Après des années de collaboration,
Yahoo a rompu officiellement avec Google le 10 mars et s’est
doté d’une technologie maison provenant d’Inktomi.
Avec son interface surchargée, le pionnier des portails Yahoo
déconcerte les nouveaux internautes. A l’inverse, fort
d’une page d’accueil dépouillée, Google
a su séduire les néophytes de l’internet tandis
que ses multiples options de recherche avancées réussissent
à conquérir le public averti des professionnels de
l’information, ces netchercheurs. Résultat : Google
traite chaque jour plus de 200 millions de requêtes et compte
en Europe 55 millions d’utilisateurs .
Fort de ce succès, le moteur américain
creuse son écart et expérimente sans cesse de nouvelles
fonctionnalités dans son Labs. C’est là que
sont d’abord nés les alertes par mail, l’indexation
des journaux français, les suggestions orthographiques, la
barre de recherche et la presse personnalisée. Demain, des
requêtes pourront être lancées à partir
d’un téléphone portable. A son zénith,
ces efforts de R&D retarderont-ils la chute de Google ?
Qui se souvient qu’Altavista était
hier considéré comme le meilleur moteur? L’effet
de mode est démultiplié sur Internet. Si Google semble
aujourd’hui à son paroxy- sme tant il fait l’unanimité,
demain les nouveaux internautes oublieront peut-être jusqu’à
ce nom. Ce déclin pourrait provenir d’abord des tenants
des libertés publiques. Déjà, des voix dénoncent
les cookies de Google, valables 34 ans ! D’autres critiquent
la base de données de géo-localisation de Google qui
permet de tracer l’origine d’une requête. Cette
association entre requête, IP et localisation géographi-que
posera aussi problème aux professionnels de l’information,
soucieux de discrétion. D’abord séduits par
les milliards de pages indexés, ces netchercheurs sont ensuite
exaspérés par le nombre de réponses, un volume
humainement indi-geste même pour le meilleur des analystes.
De plus, les enjeux commer-ciaux du référencement
à Google faussent les résul-tats du moteur, en tout
cas pour les premières dizaines de réponses, les plus
consultées. Il y a quelques mois, un journal informa-tique
a publié une méthode pour obtenir plus de 100 000
référencements sur Google. Un autre point noir du
moteur résulte des 4 milliards de pages crawlés (pages
rapatriées vers le serveur de Google). Dans cette marée
d’information, la gestion de sa base d’index (où
sont stockés toutes les références aux pages
visités) pose un problème essentiel.
La mise à jour de cette base, surnommée
la danse de Google, ne s’effectue qu’une fois par mois.
L’an dernier, un spécialiste américain des moteurs
avait relevé que cinq semaines pouvaient s’écouler
entre deux visites d’un même site. En pratique, cela
signifie qu’une page web affichée sur Google peut remonter
à plus d’un mois. De ce fait, Google devra revoir,
tôt ou tard l’architecture distribuée de son
moteur, qui date quand même de 1990 !
Aujourd’hui, elle se partage entre 13 points (tous aux Etats-Unis
sauf un en Irlande à Dublin) qui centralisent les données
recueillies par une batterie de plus de 10 000 serveurs répartis
sur toute la planète. Hier, Google avait détrôné
Altavista avec une technologie plus performan-te générant
des réponses plus pertinentes. De nom-breux prétendants,
dotés de solutions innovantes, espè-rent devenir LE
moteur du futur. Qui sera demain le nouveau Google ? D’ici
là, les netchercheurs exploite-ront toutes les alternatives
au moteur américain.
Demain, il y aura-t-il encore quelqu’un
pour interroger Google ? EC
|