ACTUS :
ETUDE SUR LES REQUETES
SUR LES MOTEURS
D'après une étude de Onestat, publiée
en février, plus de la moitié des internautes emploient
au moins 2 mots clés lors d'une recherche sur les moteurs.
Mieux, un quart des con-nectés (25,61%) formule leurs requêtes
avec 3 mots clés. Les netchercheurs se reconnaîtront
dans les 9% qui expriment leurs besoins avec plus de 4 mots-clés.
Depuis avril 2003, Onestat constate une augmentation de 3,36% des
requêtes de deux mots. Les recherches avec un seul mot clé
ont baissé de 5,74%. Ces néo-phytes représentent
aujour-d'hui encore près de 20% des connectés. Ces
statis-tiques ont été obtenues à partir d'un
échantillon de 2 millions d'internautes, pro-venant de 100
pays différents.
LE MOT DU MOIS : OPEN
WEB
L'Open web représente l'ensemble du web
indexé par les moteurs de recherche. Cette expression s'oppose
au désormais célè-bre web invisible. Depuis
quelques mois, un débat oppose aux Etats-Unis les tenants
des sources payan-tes aux partisans du web gratuit, accessible via
les moteurs. Une nouvelle génération de profession-nels
de l'information, cer-tains bardés de diplômes, considère
que le web ouvert (ou visible) suffit.
Les restrictions budgétaires d'un hôpital public de
Denver sont à l'origine de ce débat. La résiliation
des abonnements à des revues scientifiques a provoqué
un tollé dans le milieu de l'information. Des relais des
sources payantes mention-nent le cas d'un chercheur de l'université
Hopskin qui aurait réussi à éviter le décès
d'un patient si le médecin avait consulté les bases
spécialisées.
VOILA DU NOUVEAU
Le 15 mars, le site Secret2moteurs a annoncé
la nouvelle version de Voila. Le moteur de France Telecom/Wanadoo
a com- plètement revu son inter- face. Il abandonne son code
couleur jaune-orange au profit du bleu-orange, moins criard. La
nouvelle page d'accueil est plus aérée grâce
à une taille des caractères agrandie. Mais, ce lifting
s'avère superficiel. La technologie du moteur n'a pas été
modifiée. Aucune nouvelle fonction de recherche n'est apparue.
TEST DU MOIS : FLOW
PROTECTOR 3.0 CONTRE LES LOGICIELS ESPIONS
97% des ordinateurs sont contaminés par
des spywares, d’après l’éditeur Checkpoint.
Ces logiciels espions récupèrent des données
personnelles de l'internaute qu'ils transmet-tent à leur
insu à des tiers. Ce nouveau fléau, plus inquiétant
que le spam, constitue une véritable me-nace pour les professionnels
soucieux de préserver leur anonymat. On distingue habituellement
deux types d'espionciels : le spyware proprement dit, semblable
à un cheval de Troie, et les adwares, développés
à des fins publicitaires. Les pro-grammes de partage de fichiers
(peer to peer) pullulent d'adwares.
Il en existerait plus d'un millier. Aux Etats-Unis,
ces logiciels espions ont pris une telle ampleur qu'un projet de
loi, Spyblock (blocage d'espion), a été déposé
fin février au sénat.
C'est sur ce créneau porteur que se positionne l'éditeur
français Checkflow. A la différence des antivirus,
les solutions de Checkflow analysent les activités des programmes
installés et détectent les scripts java malicieux.
Netcherchercheur a pu tester avec succès une version d'évaluation
de 30 jours de Flowprotector 3.0, téléchargeable depuis
le site de Checkflow. Ce logiciel intègre trois grandes fonc-tions.
La sentinelle anti-espion scrute en perma-nence le disque dur et
la base de registre à la recherche d'espionciels. Une interface
intuitive facilite la configuration de cette senti-nelle. Flowprotector
peut aussi éliminer automa-tiquement toutes les traces laissées
par l'internaute (cookies et fichiers temp). Il scanne aussi tous
les ports ouverts lors d'un connexion.
Sa troisième fonction, le navigateur web
sécurisé, s'active dès qu'une page sécurisée
s'affiche. Ce browser permet aussi d'ef-facer l'historique des sites
visités et accepte la consultation d'un carnet de favoris
importés d'un autre navigateur.
Ce navigateur donne également accès, via le Flowclub,
à quatre moteurs de recherche (Google, Altavista, Excite
et Lycos). Une fonction de traduction de page web est aussi disponible
avec Systran.
Globalement, Flowprotector va beaucoup plus loin
que Spybot ou Adware qui ne détectent que les logiciels espions
recensés.
Fondé en 1999 par des ingénieurs du CNRS et du MIT
à Boston, Checkflow a signé un partenariat avec le
célèbre éditeur de logiciel anti-virus McAfee.
Ils com-mercialisent I-Munity PC.
FEEDSTER : LE GOOGLE
DES WEBLOGS

Depuis la fusion entre Feedster et RSS-Search
l'an dernier, Feedster s'impose comme le Google des Weblogs pour
reprendre l'expression du Wall Street Journal. Uniquement focalisé
sur les weblogs (alias blogs), Feedster se veut plus pertinent que
le moteur numéro 1. Il indexe quotidiennement les grands
services de blogs ce qui n'est pas le cas de Google.
Ses nombreuses fonctions avancées (fonctions boo-léennes,
recherche par date ou weblog ...) faciliteront l'exploitation de
l'univers des weblogs. Tout comme les forums de discussion et les
chats, les blogs véhiculent beaucoup de rumeurs. C'est aussi
là où fourmillent des experts, accessibles en quelques
clics.
www.feedster.com
L'ASTUCIEUX SOOPLE
Soople énumère en une page toutes
les fonctions avancées de Google. A par-tir d'une seule interface,
le netchercheur pourra inter-roger la presse, trouver des images,
voir les liens pointant sur un site, définir un terme….
A ce jour, Soople n’existe qu’en anglais, à intégrer
dans ses favoris. www.soople.com
YAHOO NEWS SEARCH 2.0
La guerre des moteurs rebondit sur les actualités.
Mi mars, Yahoo a lancé une nouvelle version de son moteur
sur les articles de presse. Yahoo News Search 2.0 traite désormais
chaque jour 7000 sources d'information contre 4500 journaux auparavant.
Il dé-passe donc largement Google et ses 4000 sour-ces. De
plus, le nouveau Yahoo News offre de meilleures fonctions de recherche.news.yahoo.com
DEUX ESCROCS DE GOOGLE
ARRETES
Le 16 mars, le FBI a arrêté un jeune
programmeur californien. Ce dernier avait tenté d'extorquer
100 000 $ à Google. Il menaçait de diffuser un logiciel
provo-quant des bugs lors des clics sur les bandeaux publicitaires
du moteur. En cas de refus du moteur, ce développeur voulait
vendre son programme aux sociétés de spam, jugement
le 8 avril.
Un Hollandais a été appréhendé par le
FBI à New York pour avoir vendu des fausses actions de Google,
le 5 mars. Le montant de l'escroquerie s'éleve à 2,8
millions de $. Il risque 30 ans de prison.
LE MOIS PROCHAIN : Nouvelles rubriques dans
NETCHERCHEUR : L’expert du mois et Veille sectorielle (concurrentielle
pharma, techno, juridique, sociétale…). 16 pages
LE WEB FOUNTAIN D'IBM
« Le fossé entre une entreprise et
les évène-ments en cours qui peu-vent l'affecter va
s'agran-dir… Il devient impératif pour les sociétés
de réduire ce fossé pour maintenir sa compétitivité
» explique le site du Web Fountain. Lancé il y a 4
ans, le programme de recherche Web Fountain d'IBM vient de se finaliser.
Une présentation des produits issus de cette R&D a été
effectuée en février 2004 dans le centre de recherche
d'Almaden.
Ce projet a permis la création d'outils de traitement des
informations du web: crawler, moteur d'indexation et outils de filtrage
de l'information. Aujourd'hui the Big Blue loue l'accès à
son moteur de recherche capable de rapatrier des térabits
de documents du web et de les organiser pour être intelligible
par l'entreprise.
En savoir plus www.almaden.ibm.com/webfountain
LES CHINOIS CONTRE GOOGLE
« Mon travail est de botter les fesses de
Google » expliquait au magazine Forbes Zhou Hongyi, créateur
du moteur chinois 3721 (filiale de Yahoo). Il s'est associé
à deux autres moteurs chinois, Baidu et Zhongsou, pour contrer
l'arrivée de Google dans l'Empire du milieu fin février.
L'EUROPE LANCE UN PROJET SUR LE WEB
SEMANTIQUE
La communauté européen-ne
a lancé le programme SEKT (Semantic Knowled-ge Technologies).
D'une durée de 36 mois, ce pro-gramme réunit 12 centres
de recherche en Angle-terre, Allemagne et Espa-gne. Annoncé
le 22 mars, le labo British Telecom Exact va coordonner ce projet
à 12 Millions d’Euros.
Sur le plan technique, SEKT vise à concevoir un moteur de
recherche plus pertinent que les moteurs plein texte de rigueur
sur le web. Il sera capable, grâce à la technologie
sémantique, de filtrer en temps réel les réponses
aux requêtes. En amont, un extracteur terminolo-gique pourra
reconnaître les noms de personnes, de produits ou de sociétés.
Ces données seront ensuite classées automatiquement
par concept.
|