spacer

Technologies Internationales 150  >>  2/02/2009

Tous les articles parus >>

spacer

Internet

Référencement audio : parole donnée... aux moteurs de recherche !

http://www.bulletins-electroniques.com/ti/150_01.htm

Copyright © ADIT - Tous droits réservés

A l'occasion du lancement par Google, de GAUDI, un service de reconnaissance vocale à l'intérieur des vidéos, tour d'horizon des différentes technologies d'indexation disponibles pour l'audio et impact sur le référencement.

Article rédigé par MM. Olivier Andrieu et Guillaume Thavaud.

Abonnés version papier :

Téléchargez ici la version pdf >>

Transmettre cet article
par email
 >>

Recommander ce site
à un collègue / ami
 >>

Les articles de "Technologies Internationales" classés par thèmes :

FAQ / foire aux questions >>

Conditions d'utilisation >>

Flux RSS >>


Le 16 septembre 2008, Google annonce le lancement de son premier portail consacré à la recherche de documents audio, à l'adresse http://labs.google.com/gaudi. C'était l'occasion rêvée de faire le point sur les différentes technologies d'indexation audio et sur leur impact pour le référencement. Voici un tour d'horizon des différentes technologies disponibles à l'heure actuelle...


Déjà, en juillet 2008, Google avait frappé un grand coup en pleine période électorale américaine en proposant un service baptisé "Speech Recognition", destiné à rechercher des mots clés dans les discours des politiques américains (voir le communiqué : http://redirectix.bulletins-electroniques.com/nht1T). A l'époque, il s'agissait d'un gadget destiné aux possesseurs d'un compte Google et pouvant enrichir la recherche de vidéos YouTube. Ce module marquait la création de l'équipe Google Speech Team. Le service s'est désormais généralisé sur un portail vidéo dédié, sans que l'utilisateur ait besoin d'installer un module complémentaire. Baptisé GAUDI (Google Audio Indexing), ce portail fonctionne comme un moteur de recherche vidéo classique... sauf que les mots clés recherchés se trouvent à l'intérieur même de la vidéo, dans sa bande-son. Pour le moment le moteur de recherche interroge exclusivement les "YouTube political channels".

Comme souvent chez Google, l'interface est pensée en termes d'ergonomie et d'efficacité, et la présence de marqueurs temporels intégrés à la vidéo en rend l'utilisation immédiatement attrayante.


Les discours des hommes politiques ont été choisis comme terrain d'expérimentation, car des informations clés étaient transmises dans les élocutions. Mais, comme l'affirme Google, le domaine des élections américaines n'est qu'une première étape. A terme, on peut imaginer un système qui se généralise à de nombreuses chaînes YouTube. Sur le fonctionnement de la technologie et du classement des résultats, Google dit simplement qu'il utilise un outil de reconnaissance du langage parlé et que les résultats sont classés d'après le contenu audio, les métadonnées et la fraîcheur.

Parmi les remarques et les bugs relevés par les utilisateurs, on peut mentionner une sorte de bêtisier : il arrive souvent que Google comprenne mal les mots employés par les orateurs ce qui génère des lapsus assez amusants (voir http://redirectix.bulletins-electroniques.com/zwfce ). La technologie n'est pas encore très au point... Mais d'autres technologies, apparues ces dernières années, pourraient concurrencer ce nouvel outil dans les mois à venir.

Blinkx


Google n'est pas le seul à avoir pensé à la reconnaissance vocale, loin de là : le portail vidéo Blinkx (http://www.blinkx.com/) s'y est intéressé dès 2004. Ce pionnier de la recherche vidéo utilise en effet sa propre technologie pour rechercher des expressions clés dans n'importe quelle langue (voir à ce sujet un article sur 01net : http://www.01net.com/editorial/285297/blinkx.tv-le-moteur-de-recherche-qui-prend-tele-et-radio-aux-mots/). Par exemple la requête "référencement google" met en avant une vidéo où un artisan apporte son témoignage sur Internet et sur la façon dont il s'est positionné dans Google.

Blinkx propose une technologie qui a fait ses preuves et qui semble assez efficace... D'ailleurs, la société a noué des partenariats avec de nombreux diffuseurs tels que CNN ou la BBC et également avec Microsoft (voir article sur Abondance : http://actu.abondance.com/2006-41/microsoft-blinkx.php). Le point fort de Blinkx est sans contestation sa capacité à interpréter différentes langues (Blinkx gère l'anglais, l'allemand, le français et l'espagnol) et à trouver des vidéos basées non pas sur un mot clé mais sur une thématique, en explorant le champ sémantique.

Podscope / TVEyes

Podscope, disponible à l'adresse http://www.podscope.com, s'intéresse plus particulièrement aux flux audio présents dans les podcasts. Lancé en 2005 par TVEyes, il a fait preuve de son efficacité et a été retenu par AOL pour son portail radio http://music.aol.com/radioguide/podcasting, ainsi que par la société Evoca (http://www.evoca.com) consacrée à l'animation audio de sites Web (technique dite de phone-to-web). A noter que TVEyes connaît bien son affaire puisque cette société indexe les émissions radio et TV anglophones depuis 1999 (voir interview de David Ives de TVEyes : http://redirectix.bulletins-electroniques.com/wo98m).


Podscope se présente comme un moteur de recherche classique ; une liste d'émissions radio renfermant le mot clé est proposée à l'internaute, avec des marqueurs temporels. Par exemple, sur la requête "Spielberg", on obtient une sélection d'émissions où les projets du cinéaste sont évoqués. En théorie, la technologie peut s'appliquer à de nombreux domaines, et pas seulement aux flux audio. Ainsi, en avril 2008, TVEyes a annoncé que Podscope pouvait traiter les vidéos, ce qui va ouvrir de vastes possibilités en matière d'indexation. Il est fort possible que la technologie soit bientôt utilisée sur un portail vidéo, qui deviendrait alors un bon concurrent de Blinkx et YouTube.

L'avenir du référencement audio

Nous venons de voir trois technologies intéressantes en termes de reconnaissance audio et de transcription textuelle. Il en existe d'autres... Que faut-il en retirer pour le référencement ? Faudra-t-il bientôt optimiser une vidéo comme on le fait pour un contenu textuel ? Pour le moment il n'existe aucun guide permettant de faire de l'optimisation audio mais quelques test sur les outils vont permettre de faire ressortir des principes de base.

Tout d'abord, il est certain que la qualité de la bande son et l'absence de "bruit de fond" seront primordiales : plus le son est intelligible et la voix reconnaissable (imaginez un système de reconnaissance vocale tentant de comprendre ce que dit une personne située à côté d'un marteau-piqueur...), meilleures seront les chances de voir le contenu analysé avec efficacité... Pensez-y au moment de l'enregistrement de vos vidéos...

1 - Occurrences de mots clés

GAUDI est clairement basé sur les occurrences de mots clés dans la vidéo, comme le montre l'étude de plusieurs résultats de recherche. Il est clair que Google favorise tout simplement les résultats qui renferment le plus d'occurrences de mots clés. Il n'est pas pour autant vérifié que la vidéo renfermant le plus d'occurrences de mots clés soit placée systématiquement en première position : pour la requête "nuclear weapon", le premier résultat renferme quatre occurrences de mots clés, alors que le sixième résultat renferme pas moins de neuf occurrences.


En fait c'est tout simplement l'ancienneté qui détermine l'affichage des résultats. La vidéo la plus récente est placée en première position (et pour le moment ce système de classement n'est pas paramétrable alors qu'on peut le faire dans YouTube).

2 - Thématique du contenu

La technologie utilisée par Blinkx est un peu plus subtile que celle de Google : en effet, ce moteur ne prend pas seulement en compte les occurrences de mots clés mais évalue aussi la thématique de la vidéo et la présence de mots clés connexes. Par exemple, la première vidéo affichée sur la requête "auto industry" est un reportage sur l'industrie automobile en Thaïlande, et on y trouve des expressions comme "trucks manufacturing", "car manufacture", "automobile industry", qui sont fortement liées à la requête. C'est donc le champ sémantique qui doit être privilégié pour un contenu audio de qualité, du moins pour les moteurs "intelligents" capables de reconnaître de nombreux mots clés connexes. On peut imaginer qu'à terme, les vidéos renfermant du spam de mots clés risquent d'être moins bien notées, voire sanctionnées, par rapport à des vidéos utilisant le fameux langage naturel cher à Google.

3 - Optimisation du discours

Il est tout d'abord évident qu'un mot clé sera d'autant mieux pris en compte qu'il est facilement intelligible dans la vidéo. Si un mot ou une expression sont mal compris, il y a peu de chances d'obtenir des positions ! On ne connaît pas le fonctionnement des logiciels d'analyse, mais il est probable qu'il faut privilégier des expressions bien articulées, avec la prononciation adéquate et, pourquoi pas, un changement de ton permettant de mettre en relief telle ou telle expression. La gestion du phrasé aura sans doute le même effet que les balises <h1> ou <strong> dans un texte Web... Ce qui est sûr c'est qu'il faudra s'adapter au fonctionnement des logiciels de reconnaissance vocale. Les figures de style et jeux de mots risquent de ne pas être bien compris par les robots analyseurs, et que se passera-t-il si un orateur possède un accent prononcé ?

4 - L'internaute aura-t-il le dernier mot ?

Avant de se focaliser sur l'aspect purement technique, il faut aussi penser aux internautes.
Ce qui fait le succès d'une vidéo dans YouTube ce n'est pas sa qualité technique mais plutôt son originalité et la façon dont elle interpelle l'internaute.


On peut très bien imaginer un classement basé sur le comportement des internautes qui viendrait compléter l'optimisation technique d'une vidéo. Des portails comme Dailymotion ont déjà mis en place un système de vote, qui permet aux internautes d'intervenir eux-mêmes dans le classement. Dans ce cadre il ne faut pas imaginer l'indexation audio comme un nouveau système de classement à part entière mais plutôt comme un outil permettant de classer et identifier les vidéos. Ce sera ensuite l'internaute qui prendra le relais.

Conclusion

En définitive, il est vraisemblable que l'on va se retrouver avec la même approche que pour une page Web : proposer un contenu compréhensible pour les moteurs, optimisé en termes de mots clés et accrocheur pour l'internaute. Les méthodes ne changeront pas mais la modification du support fera intervenir de nouveaux spécialistes, tels que des ingénieurs sons, des comédiens, des réalisateurs... Le référencement a encore de beaux jours devant lui !

spacer

spacer

Pour en savoir plus :

- Abondance, Olivier Andrieu, http://www.abondance.com
- Brioude-Internet Référencement, Guillaume Thavaud, cellule de veille, http://www.referencement-2000.com

spacer

spacer

Origine : Technologies Internationales 150 (2/02/2009 ) - ADIT - http://www.bulletins-electroniques.com/ti/150_01.htm
spacer

spacer

[  plan du site  |  données personnelles & politique de confidentialité  |  limites de responsabilité  |  faq  |  nous contacter  ]

spacer

[  page d'accueil  |  découvrir  |  consulter  |  recevoir  |  rechercher  |  utiliser  |  s'exprimer  ]

spacer

bulletins-electroniques.com tous droits réservés   -   votre contact : François Moille

4444444007 999920090317 6666666000 1010101020 1010101010