Au sein de son "Analytics Solution Center" installé depuis 2009 [1] à deux pas de la Maison Blanche, IBM a présenté vendredi 4 novembre son projet Watson et ses applications potentielles, face à une audience fédérale.
L'ordinateur Watson, qui tient son nom du fondateur d'IBM il y a un siècle, est le fruit de 4 ans de travail du Projet DeepQA [2] d'IBM, dans la foulée de Deep Blue [3] qui avait battu Kasparov, champion du monde des échecs en 1997. Cette victoire d'alors était basée sur la puissance de calcul qui permettait d'intégrer une performance "combinatoire" (examen concurrent d'un grand nombre de cas possibles) et des "heuristiques" (parties pré-enregistrées de certains grands maitres d'échecs).
Le but de Watson est de démontrer qu'un ordinateur peut s'attaquer a des problèmes bien plus complexes et finalement battre les humains à un jeu comme Jeopardy! qui n'est pas lié a des règles déterminées et représentables par un nombre fini de contraintes, comme les échecs. Au contraire, dans Jeopardy! on utilise le langage naturel, dans toute sa complexité et ses ambigüités, en particulier avec des phrases ou questions qui peuvent avoir plusieurs sens ("twisted language").
Il ne s'agit plus donc d'un jeu de combinatoire et d'heuristiques, mais il s'agit de prendre en compte un grand volume de textes en langage naturel (des encyclopédies, des romans, etc.), de faciliter leur accès et d'intégrer des versions évoluées :
- du traitement du langage naturel (analyse syntaxique et sémantique)
- des méthodes d'accès au contenu
- de l'apprentissage automatique (méthodes de classification)
- de la représentation des connaissances et du raisonnement logique
- du calcul massivement parallèle.
Alors seulement, la technologie de réponse automatique à domaine ouvert (Open-domain automatic question answering) peut devenir capable de dépasser la meilleure performance humaine.
Watson complète et élargit l'analyse Crédits : MS&T, source des données : IBM
Pour le prouver, Watson a défié en février 2011 les deux meilleurs joueurs de Jeopardy! [4], un jeu télévisé américain très populaire dans lequel le joueur doit deviner une question à partir de sa réponse. La victoire de Watson a été écrasante.
Pour obtenir une réponse en moins de 3 secondes, durant lesquelles Watson explore approximativement 200 millions de documents, 10 armoires de serveurs IBM Power 750, totalisant 2880 coeurs et 15 To de mémoire vive, ont été nécessaires. Le coût du projet, qui n'a pas été officiellement communiqué par IBM, est estimé à 100 millions de dollars pour la fourchette la plus basse et entre 1 et 2 milliard de dollars pour la plus haute [5]. Le coût du matériel seul est estimé à 32 Millions de dollars5.
IBM Watson: Final Jeopardy! And the future of Watson Crédits : IBM
L'après Jeopardy!
Le défi qui se présente maintenant à IBM est de trouver des applications autres que Jeopardy!.
Deux domaines de prédilection ont été cités :
- Les centres d'appel : IBM serait en train de le mettre en oeuvre en interne [6]
- Le diagnostique clinique: une adaptation a déjà été mise au point et semble très prometteuse [7]. La compagnie d'assurance américaine Wellpoint a annoncé en septembre un partenariat avec IBM [8].
IBM a également évoqué des applications potentielles pour le secteur public via deux exemples concrets :
- le programme MedWatch de la "Federal Drug Administration" qui récolte sous forme de texte les divers problèmes matériels rencontrés par le personnel médical. Le système d'analyse d'IBM permet de repérer beaucoup plus rapidement les défauts de série pour lancer un rappel.
- le programme "Defects & Recalls" de la "National Highway Traffic Safety Administration" qui permet aux automobilistes de reporter les défauts de fabrication de leur véhicule. Comme dans le cas précédent, le système permet l'alerter un constructeur plus rapidement.
Toutefois, au-delà du succès, aussi impressionnant soit-il, de Watson, les ordinateurs sont encore très loin de passer le test de Turing [9], car, comme le soulignait le vice-président à la recherche d'IBM, ils sont généralement démasqués dès la 3ième ou la 4ième phrase. La recherche en informatique a encore de l'avenir.