spacer

Technologies Internationales 137  >>  1/09/2007

Tous les articles parus >>

spacer

Internet

Moteurs de recherche verticaux personnalisables : l'offre s'étoffe

http://www.bulletins-electroniques.com/ti/137_03.htm

Copyright © ADIT - Tous droits réservés

Eurekster et Rollyo ont ouvert la voie où se sont engouffrés Google, Yahoo! et Microsoft Live Search ; nombre de possibilités existent aujourd'hui de se créer un moteur spécialisé dans une thématique donnée, et ce pour une veille à long terme ou pour un besoin éphémère.

Article rédigé par Olivier Andrieu.

Pour recevoir les prochaines parutions, abonnez-vous à "Technologies Internationales" :

Abonnement par email (gratuit) >>

Abonnement version papier >>

Tout savoir sur
Technologies Internationales
 >>

Abonnés version papier :

Téléchargez ici la version pdf >>

Transmettre cet article
par email
 >>

Recommander ce site
à un collègue / ami
 >>

Les articles de "Technologies Internationales" classés par thèmes :

FAQ / foire aux questions >>

Conditions d'utilisation >>

Flux RSS >>


Depuis quelques mois, les grands acteurs de la recherche d'informations que sont Google, Yahoo! et Microsoft ont mis en place une offre de recherche verticale, donnant la possibilité de créer, en quelques minutes, un moteur taillé sur mesure, effectuant ses recherches sur un certain nombre de sites web ou sur une thématique donnée. Une façon extrêmement simple de se créer un moteur "perso" efficace pour une thématique donnée, voire un projet limité dans le temps.

Google, Yahoo!, Microsoft Live Search, vous connaissez, bien sûr. Mais ces outils proposent également depuis peu des fonctionnalités de création de moteurs verticaux, spécialisés "à la demande" sur un seul pan du Web. Ces outils peuvent, bien sûr, être utilisés dans le cadre de sites web publics, mais également dans le cadre de projets plus personnels, à court terme (nécessité de mener à bien une étude sur une thématique précise pendant quelques jours ou quelques semaines) ou à plus long terme (veille dans un domaine précis). Il est effectivement très simple de se bâtir en quelques minutes, grâce à ces outils, son propre système de veille, permettant d'effectuer des requêtes dans une thématique très spécifique, voire sur un petit nombre de sites web de référence sur une problématique donnée. Tour d'horizon des principaux outils disponibles sur le marché.

Google Custom Search Engine


L'outil de Google, qui nécessite d'avoir un compte - gratuit - auprès du moteur de recherche, est d'une utilisation extrêmement simple : sur la page d'accueil, l'utilisateur clique sur le bouton Create a search engine (voir ci-contre). Il définit en quelques minutes la "customisation" de son outil : son nom, sa description, des mots clés de recherche (qui permettront à Google d'affiner les requêtes), la langue utilisée, etc. Il est ensuite demandé une liste de sites web sur lesquels porteront les recherches futures (il est possible d'en ajouter d'autres par la suite), avec deux choix : soit les résultats futurs seront uniquement issus de ces sites web, soit les résultats seront issus de l'index global de Google, mais avec une préférence pour les pages issues des sites indiqués. Ainsi, selon les besoins, on peut opter pour l'une ou l'autre des solutions... Cependant, pour une recherche générale (non limitée à la liste de sites fournie), il est recommandé d'ajouter sur cette page une liste de mots clés en relation avec la thématique désirée dans le champ Search engine keywords afin d'affiner au mieux les résultats. Une autre solution très intéressante consiste à créer des filtres de recherche sur l'url : par exemple "*.gouv.fr" créera automatiquement un filtre sur tous les sites gouvernementaux français. Très utile...

De nombreuses syntaxes sont proposées et explicitées sur le site. En outre, rien n'empêche l'utilisateur de saisir uniquement l'adresse de son site web et de disposer ainsi, en quelques secondes, d'un moteur interne de bonne qualité avec la technologie de Google pour effectuer des requêtes sur ses pages. Avec une restriction toutefois : les recherches seront limitées aux pages du site indexées par Google, ce qui peut ne pas être exhaustif... Ce sera bien entendu le cas de tous les outils présentés dans cet article.

Après avoir testé que tout fonctionne bien grâce à un test de recherche, votre moteur est prêt à fonctionner. Durée de la création : moins de 5 minutes ! En fait, le plus long sera certainement de définir les mots clés et les sites sur lesquels porteront les recherches. Une interface d'administration vous permettra ensuite de récupérer le code HTML du formulaire pour l'intégrer à votre intranet ou à une page web personnelle, de modifier la charte graphique de l'outil, d'ajouter des thématiques (labels) de recherche, etc. Bref, une batterie assez complète d'outils de création et de management de votre moteur personnalisé. Vous aurez également à votre disposition un ensemble de statistiques simples, peu intéressantes pour une utilisation en solo du moteur mais qui peut avoir son importance dans le cadre d'un intranet par exemple.

L'avantage principal du système Google Custom Search Engine est son extrême simplicité. En quelques secondes, vous pouvez créer un moteur vertical sur un ou plusieurs site web, sur une thématique donnée ou une problématique précise et bénéficier d'un moteur utilisant la technologie de Google dont la pertinence n'est plus à démontrer... Et cela s'avère très utile pour de nombreux projets portant, par exemple, sur un ensemble de quelques gros sites web de référence.

Yahoo! Search Builder


Yahoo! propose également un outil assez similaire à celui de Google, également accessible à tout titulaire d'un compte (gratuit) sur le portail (voir encadré). L'outil proposé par Yahoo! laisse trois choix pour bâtir son moteur personnalisé : une recherche globale ou affinée sur le Web, une recherche sur un site donné et une recherche sur l'actualité (ce que ne propose pas Google). Il est bien sûr possible de modifier le "look and feel" (couleur, taille, boutons radios, etc.) du formulaire, ajouter un logo, définir une langue, etc. Mais le plus intéressant (et pourtant pas le plus visible, malheureusement) est le lien Customize the experience for your users qui permet d'indiquer les sites web sur lesquels on désire effectuer les recherches, d'ajouter des mots clés de recherche. On peut aussi ajouter des mots clés d'exclusion (équivalent de la syntaxe "SAUF" qui sera ainsi ajoutée par défaut à toutes vos recherches - à manipuler avec précaution donc) ou créer une liste noire de sites web que vous ne voulez pas voir s'afficher dans vos résultats.

Une interface extrêmement pratique, très "Web 2.0" vous permet, au fur et à mesure de la création de votre outil, de vérifier sur le moteur quels résultats sont fournis (voir encadré page 12, partie basse). L'outil est très bien fait et propose de nombreuses possibilités d'administration. Des statistiques sur les requêtes effectuées sur le moteur personnalisé sont également disponibles. Bref, un système proche de celui de Google au niveau des fonctionnalités mais plus étoffé de façon globale.

Live Search


Live Search, le moteur de recherche de Microsoft n'est pas en reste avec ses macros (toujours disponibles aux titulaires d'un compte Hotmail, Messenger ou Passport), accessibles depuis l'onglet "Plus" puis "Modifier des macros" sur les pages de résultats (voir encadré). Deux choix sont ensuite proposés : simple, où vous n'avez qu'à fournir une liste de sites sur lesquels porteront les recherches futures ; avancé, plus personnalisable. L'interface "simple" est très... simple :-) sans être simpliste. Très claire, rapide, elle permet d'ajouter jusqu'à 30 sites web pour créer un moteur personnalisé. L'interface avancée permet d'aller beaucoup plus loin en utilisant des syntaxes de recherche avancée (opérateurs booléens) et des opérateurs comme "inurl:", "feed:", "link:" ou autre (voir encadré). On peut donc aller beaucoup plus loin qu'avec les autres outils en termes de personnalisation. Par exemple, effectuer des requêtes sur les pages qui contiennent un lien vers un document au format Word, ou celles qui contiennent un mot donné dans le titre, etc.

L'outil est bien fait et rapide bien que largement moins "customisable" (couleurs, pages de résultats, etc.) que ses concurrents. Mais il peut très bien convenir à une utilisation personnelle de l'outil (à noter que les macros sont également partageables entre plusieurs utilisateurs ce qui peut avoir un intérêt certain sur un intranet par exemple...).

Les Swickis d'Eurekster


Le concept des Swickis, plus ancien que les outils vus précédemment, est identique à celui de ses principaux concurrents avec une interface permettant de créer de façon très complète son propre moteur de recherche vertical (voir encadré page 14). A noter que, en mode simple en mode avancé chez Eurekster, les possibilités de configuration sont excellentes : liste d'url à inclure ou à exclure, thématiques générales, mots clés, filtre sur les contenus adultes, recherches multimédia, ajout de nuages de requêtes, etc. La technologie de recherche utilisée est celle de Yahoo! (Yahoo! Search Technology).

Le système de Swikis d'Eurekster sera certainement à privilégier à Yahoo! Search Builder si l'on désire un outil personnalisé plus "pointu" que celui proposé par le portail américain. Il est surtout, en effet, remarquable de par le nombre d'options de configuration qu'il propose, au détriment d'une interface peut-être plus complexe à déchiffrer.

Rollyo


Enfin, dernier outil de ce vaste tour d'horizon de moteurs personnalisables, Rollyo, l'un des plus anciens également du domaine, est bâti sur le même concept de création de votre propre outil de recherche grâce à une interface simple et claire (voir encadré). Peu de choix ici mais le principal est là pour créer ses propres "Searchrolls" : lister des sites web sur lesquels porteront les réponses, choisir une catégorie, proposer des mots clés, etc. Là encore, la technologie de recherche prise en compte est celle de Yahoo!, tout comme pour Eurekster. Le "Searchroll" ainsi créé viendra ensuite s'ajouter à la liste de ceux créés par défaut sur la page d'accueil de l'outil. Une option (disponible pour les utilisateurs référencés) permet de rendre public ou privé un moteur personnalisé. Un service simple et basique mais qui peut amplement suffire selon les besoins.

En quelques mois, les outils de création de moteurs de recherche personnalisés ont fleuri sur le Web, de la part de start-up pionnières (Eurekster, Rollyo), rapidement suivies par les trois grands de la recherche d'information. Au-delà de la création de moteurs thématiques pour le Web dans le cadre de la mise en place d'un site public, un des grands intérêts de ces outils est bien la possibilité, en quelques minutes, de créer, au gré des besoins et des projets, des outils utilisables en solo au sein d'un service, voire d'une entreprise, pour effectuer rapidement des recherches au sein d'une thématique donnée. Des moteurs "verticaux éphémères" en quelque sorte...

Longtemps attendu, ce type d'outil permet aujourd'hui d'aller bien plus vite dans ses recherches et sa veille, même si elle est épisodique. Ce n'est pas là le moindre de leurs avantages... A chacun de tester ces cinq outils et d'utiliser celui ou ceux qui répondent le mieux à ses attentes !

spacer

spacer

Pour en savoir plus :

- Google Custom Search Engine, http://google.com/coop/cse
- Yahoo! Search Builder, http://builder.search.yahoo.com
- Live Search macros, http://search.live.com/macros/default.aspx?FORM=BJRE
- Eurekster, http://www.eurekster.com
- Rollyo, http://www.rollyo.com
- Abondance, http://www.abondance.com

spacer

spacer

Origine : Technologies Internationales 137 (1/09/2007 ) - ADIT - http://www.bulletins-electroniques.com/ti/137_03.htm
spacer

spacer

[  plan du site  |  données personnelles & politique de confidentialité  |  limites de responsabilité  |  faq  |  nous contacter  ]

spacer

[  page d'accueil  |  découvrir  |  consulter  |  recevoir  |  rechercher  |  utiliser  |  s'exprimer  ]

spacer

bulletins-electroniques.com tous droits réservés   -   votre contact : François Moille

4444444007 999920080703 6666666000 1010101020 1010101010