spacer

Technologies Internationales 147  >>  1/10/2008

Tous les articles parus >>

spacer

Recherche sur internet

Chunklt et SurfCanyon : deux outils pour améliorer les résultats des grands moteurs de recherche

http://www.bulletins-electroniques.com/ti/147_02.htm

Copyright © ADIT - Tous droits réservés

Chunklt et SurfCanyon s'appuient sur les moteurs de recherche traditionnels pour tenter de leur apporter des fonctionnalités supplémentaires : l'un explore le contenu des pages web proposées comme résultat par les moteurs, l'autre tente d'identifier d'autres pages pertinentes pour un même site web.

Cet article a été rédigé par Olivier Andrieu et Christophe Deschamps

Pour recevoir les prochaines parutions, abonnez-vous à "Technologies Internationales" :

Abonnement par email (gratuit) >>

Abonnement version papier >>

Tout savoir sur
Technologies Internationales
 >>

Abonnés version papier :

Téléchargez ici la version pdf >>

Transmettre cet article
par email
 >>

Recommander ce site
à un collègue / ami
 >>

Les articles de "Technologies Internationales" classés par thèmes :

FAQ / foire aux questions >>

Conditions d'utilisation >>

Flux RSS >>


ChunkIt et SurfCanyon sont deux outils qui s'appuient sur les moteurs de recherche traditionnels (Google, Yahoo!, Live...) pour tenter de leur apporter des fonctionnalités supplémentaires afin de nous aider à mieux chercher l'information sur le Web au quotidien. L'un explore le contenu des pages web proposées comme résultat par les moteurs, l'autre tente d'identifier d'autres pages pertinentes pour un même site web. Deux utilitaires à tester et qui pourraient vite devenir indispensables dans votre trousse à outil de chercheur web.


D'opérateurs booléens en fonctionnalités de filtrage avancées, on croyait avoir épuisé les ressources de nos moteurs de recherche favoris. Pourtant, à coup de traitement automatique du langage et d'amélioration de la lisibilité, deux sociétés viennent de lancer des outils permettant d'exploiter encore plus efficacement leurs résultats.

Chunklt, pour aller à l'essentiel

ChunkIt, de la société TigerLogic se présente comme une barre d'outils à installer dans votre navigateur (Firefox ou IE7). Elle propose deux fonctionnalités intéressantes : améliorer les résultats de recherche des moteurs classiques ou explorer le contenu d'une page web. ChunkIt fonctionne à partir des résultats de plusieurs moteurs pris un par un (il ne s'agit donc pas d'un métamoteur). Il peut s'agir de Google, de Yahoo!, de LiveSearch, d'AOL ou bien encore d'Ask.com, ce choix s'effectuant au moment de l'interrogation. Vous obtenez alors une page de résultats comme indiqué ci-dessous.


Améliorer les résultats de recherche des moteurs classiques


Ici, chaque page de résultat proposée par Google a été visitée par ChunkIt qui en a tiré les éléments les plus significatifs et replace vos mots-clés dans leur contexte (à gauche), un bon moyen pour ne plus perdre de temps à visiter des pages non pertinentes. Si vous cliquez sur l'un de ces icones orange et noir, vous faites apparaître l'extrait surligné dans son contexte sur la page d'origine (voir illustration ci-dessous). Vous avez ainsi la possibilité d'aller directement à ce qui vous intéresse.


Pour explorer le contenu d'une page web, nous utilisons tous la commande Ctrl+F qui permet de rechercher un mot-clé dans la page que vous avez à l'écran. ChunkIt permet désormais d'aller beaucoup plus loin avec cette fonctionnalité. Lorsque vous visitez une page proposant un contenu dense et souhaitez trouver un mot-clé particulier, il vous suffit de le taper dans la barre d'outils puis de cliquer sur "Chunk This Page". Si par exemple vous vous trouvez sur la page Wikipedia consacrée à l'"intelligence économique" et souhaitez lire ce qui concerne Alain Juillet, il vous suffit de taper son nom dans ChunkIt pour obtenir la page de résultats désirée (voir illustration ci-dessous).


Chaque occurrence du mot recherché apparaît à gauche surlignée et remise dans son contexte. En cliquant sur l'icone ChunkIt vous faites apparaître dans la page de droite le même extrait surligné dans la page originale. Il vous suffit alors de naviguer d'extrait en extrait pour ne lire que ceux qui vous intéressent.

Explorer le contenu d'une page web

Mais ChunkIt va plus loin. Si maintenant vous cliquez sur "Chunk Right-Page Links", l'outil va alors suivre chacun des liens présents dans votre page initiale et vous présenter des extraits de toutes les pages correspondantes dans lesquelles votre mot-clé apparaît. C'est comme si vous affiniez votre requête en interrogeant une sélection de pages potentiellement pertinentes puisque rattachées à votre page de démarrage par un lien hypertexte. Dans notre cas, nous obtenons sept autres pages liées citant le nom d'Alain Juillet dont l'article Wikipedia le concernant (voir illustration ci-dessous).


A noter que ChunkIt permet aussi de faire une recherche sur les mots de même famille (lemmatisation) et d'envoyer par email une page de résultats structurée. Cet outil est pour l'instant gratuit dans sa version bêta. Il faut s'inscrire sur le site et demander une invitation pour pouvoir le tester. A votre tour...

SurfCanyon fouille les pages de résultat en profondeur

Encore moins intrusif, SurfCanyon est une extension à ajouter à votre navigateur (Firefox, IE7) qui améliore la recherche d'informations sur les principaux moteurs généralistes (Google, Yahoo!, LiveSearch) de manière significative. Depuis Google, tous les moteurs proposent des listes de résultats basées notamment sur la popularité des pages web qu'ils indexent. Ils se distinguent les uns des autres par la manière dont ils calculent cette popularité mais se ressemblent tous en un point : leurs résultats peuvent s'étendre sur plusieurs dizaines de pages et rares sont les internautes qui dépasseront la troisième ou la quatrième. Résultat : nous utilisons les pages les plus connues de tous mais manquons celles qui sont pertinentes et pas encore suffisamment populaires pour être en tête de classement.

Découragés, nous passons parfois sans le savoir à un clic de la page qui répondait parfaitement à notre question et, de plus, nous en sommes conscients ! Frustrant. En mêlant le traitement sémantique de l'ensemble des résultats d'une requête et l'analyse de vos clics en temps réel, SurfCanyon vous permet de découvrir et d'exploiter ces pages profondes. Pour l'utiliser il suffit d'interroger votre moteur de prédilection, au hasard Google, comme vous le faites habituellement. Vous obtenez alors une page classique dans laquelle chaque résultat est suivi d'un icone en forme de cible (voir illustration ci-dessous).


En cliquant sur l'un de ces icones, vous donnez à SurfCanyon des indices sur ce qui vous intéresse vraiment. Si, dans notre exemple, vous cliquez sur le second résultat le système va analyser le contenu de la page correspondante avec celui des autres pages de résultats et vous recommander les trois dont le contenu est le plus proche (voir encadré). On voit dans cet exemple que si les deux premiers résultats étaient présents dès la seconde page de résultats, le troisième se trouvait sur la neuvième. Si vous n'êtes pas satisfait des réponses vous pouvez encore affiner ces résultats selon la même principe avec un second puis un troisième niveau de filtrage (voir illustration ci-dessous). De fait, plus vous cliquerez sur les cibles et plus SurfCanyon disposera d'éléments lui permettant de comprendre finement ce que vous recherchez.


A l'usage, SurfCanyon s'avère vite indispensable même si l'on peut regretter qu'il ne dispose pas (encore) d'un bouton de "débrayage" pour revenir à une page de résultats classique lorsque cela s'avère nécessaire. Détail d'importance, SurfCanyon, a été optimisé pour la langue française (son créateur a passé plusieurs années chez Hewlett-Packard à Grenoble).

Quoi qu'il en soit, ChunkIt et SurfCanyon ouvrent la voie à une nouvelle génération d'outils qui permettra de toujours mieux exploiter les ressources infinies indexées par les grands moteurs de recherche. Ceux-ci ont beau disposer de fonctionnalités avancées, la relative complexité de leur mise en oeuvre n'incite pas les internautes à les utiliser et ils restent alors souvent sur des expériences frustrantes. Dans ce contexte, des outils peu intrusifs et "user-friendly" tels que ceux présentés ici ont une réelle carte à jouer car de fait, même si les utilisateurs finaux ne comprennent pas bien comment SurfCanyon traite les pages (secret de fabrique oblige), ils obtiennent des résultats plus pertinents qu'auparavant. N'est-ce pas l'essentiel à leurs yeux ?

spacer

spacer

Pour en savoir plus :

- ChunkIt, http://www.tigerlogic.com/ChunkIt
- SurfCanyon, http://www.surfcanyon.com
- Abondance, Olivier Andrieu, http://www.abondance.com
- Outils Froids, Christophe Deschamps, http://www.outilsfroids.net

spacer

spacer

Origine : Technologies Internationales 147 (1/10/2008 ) - ADIT - http://www.bulletins-electroniques.com/ti/147_02.htm
spacer

spacer

[  plan du site  |  données personnelles & politique de confidentialité  |  limites de responsabilité  |  faq  |  nous contacter  ]

spacer

[  page d'accueil  |  découvrir  |  consulter  |  recevoir  |  rechercher  |  utiliser  |  s'exprimer  ]

spacer

bulletins-electroniques.com tous droits réservés   -   votre contact : François Moille

4444444007 6666666000 1010101020 1010101010