
| Extraits du Livre "Intelligence Stratégique sur Internet" |
| Agents pour la recherche d'informations |
| Naturellement, eux aussi ont leurs limites. Comme les métamoteurs on-line, la quantité de «bruit» qu'ils rapatrient est parfois impressionnante. L'inconvénient ici est que toutes ces données non pertinentes risquent de saturer très vite votre ordinateur si vous ne pensez pas à faire le ménage régulièrement. Le «bruit» sera encore plus important si vous sélectionnez des outils de recherche dont vous ne connaissez pas les caractéristiques. Pour reprendre toujours le même exemple, quelqu'un qui ne connaît pas les spécificités d'AltaVista et de Yahoo! et décide avec un agent de les utiliser simultanément, risque d'obtenir beaucoup d'informations inutiles. Il faut donc bien connaître chaque répertoire et chaque moteur de recherche avant de l'utiliser au sein d'un agent. Il s'agit d'outils complémentaires et qui ne sont absolument pas concurrents. Un agent de recherche n'est qu'une «coquille vide» sans les différents instruments de recherche qu'il est censé interroger. Aussi, toujours pour éviter le risque d'enregistrer des pages inutiles, il est conseillé de choisir les mots clés avec beaucoup d'attention. Dans l'idéal, il faudrait tester l'efficacité de vos mots clés sur Internet avec un moteur comme HotBot ou AltaVista avant même de lancer un agent. Dans tous les cas, l'utilisation des agents doit être préparée et planifiée. Partir à l'aveuglette sera toujours décevant. Toutes les précautions méthodologiques que nous avons décrites pour mener efficacement des recherches sur Internet (voir p. 72) conservent toute leur valeur dans ce contexte. Un autre inconvénient est leur lenteur de fonctionnement. Pour une recherche complexe, un agent peut mettre plusieurs heures pour accomplir son travail puisqu'il doit interroger plusieurs moteurs, éliminer les doublons, se connecter aux différents sites web, enregistrer tous les documents et éventuellement les traiter informatiquement. Si la recherche d'informations est ponctuelle ou très urgente, il vaut mieux ne pas envisager les agents de recherche mais utiliser directement les outils classiques. Actuellement, on peut trouver de nombreux métamoteurs off-line sur le marché ( QueryN Metasearch, Web Ferret... )1. Quelques-uns sont décrits en annexe2, vous trouverez les autres dans notre laboratoire de test sur le web.
Certains agents de recherche présentent des fonctionnalités parfois très intéressantes. La fonction commune à tous les agents précédemment décrits consiste à interroger, à partir de mots clés choisis par l'utilisateur, uniquement les moteurs qui ont été sélectionnés. Cela dit, un certain nombre de sociétés ont développé des fonctions supplémentaires. - Personnalisation par secteur d'activité. Nous avons vu précédemment (voir p. 68) que les moteurs sectoriels sont des outils uniquement spécialisés dans un domaine précis (finance, assurance, éducation, littérature, etc.). Ce sont souvent des bases de données indépendantes très riches et qui ne peuvent pas être atteintes par les robots de recherche généralistes (il s'agit de ce que les spécialistes appellent The Invisible Web). Elles demeurent très utiles quand les outils traditionnels échouent. Cependant, leur éparpillement rend leur utilisation souvent assez longue et difficile. Pour cette raison, certains agents de recherche se sont spécialisés par secteur d'activité. Un des plus efficaces,WebSeeker, intègre plusieurs centaines de moteurs de recherche qu'il classe en de nombreuses catégories (art, automobile, business, ordinateurs, éducation, emploi, finance, loisirs, jeux, santé, maison, multimédia, etc.). Il permet également de créer des catégories personnalisées. 1. En général, ces différents agents de recherche peuvent être téléchargés à partir de la rubrique "search bots" d'un des sites de Tucows (http://tucows.wau.nl/searchbot95.html) |