Le programme e-Science au Royaume-Uni ou comment passer de la règle à calculs et des bibliothèques poussiéreuses à une science mondiale interconnectée.
Cet article a été préparé par Willy Marante à partir du rapport "Le programme e-Science au Royaume-Uni" réalisé par François-Xavier Desruelles, du service pour la Science et la Technologie de l'ambassade de France au Royaume-Uni, que nous remercions pour sa collaboration.
Télécharger ce rapport en version pdf (gratuit)>>
Focus :
Les projets pilotes du programme initial d'e-Science
- GridPP Collaboration entre les physiciens et informaticiens britanniques et le CERN. Le but est de subvenir aux besoins de traitement et de gestion de l'information du projet Large Hadron Collider (LHC) - collisionneur de hadrons - au CERN. Le LHC, la plus importante expérience mondiale de physique des particules inondera de données les physiciens du monde entier qui y collaboreront. Une infrastructure informatique doit donc être mise en place qui devra fournir suffisamment de ressources de calcul, de stockage pour exploiter totalement le potentiel scientifique du LHC.
- AstroGrid Projet open-source visant à créer un observatoire virtuel d'astronomie pour le Royaume-Uni et pour la communauté internationale.
- RealityGrid Ce projet a pour but de développer des solutions technologiques génériques pour la modélisation de structures complexes de la matière condensée et de découvrir de nouveaux matériaux.
- Comb-e-chem Le coeur de ce projet est la synthèse des nouveaux composants chimiques par méthodes combinatoire. Il est désormais possible d'établir une bibliothèque de plusieurs milliers de dérivés en quelques mois.
- DAME (Distributed Aircraft Maintenance Environment)
Projet visant à démontrer l'utilité du grid pour la maintenance des moteurs d'avion. En effet, en cas de problème, les ingénieurs doivent réaliser des tests diagnostics sur des avions qui volent sur différentes destinations autour du globe. Il est souvent difficile d'obtenir des données de vol sur ces moteurs.
- EODISE (Grid Enabled Optimisation and DesIgn Search for Engineering)
GEODISE ambitionne de bâtir un démonstrateur pour la conception et l'optimisation de modèles d'ingénierie impliquant la dynamique des fluides.
- Discovery Net Ce projet fournit un modèle informatique destiné à la découverte de connaissances dans le but de permettre aux scientifiques de planifier, gérer, partager et exécuter des recherches complexes et des procédures d'analyse de données à distance.
- MyGrid Il s'agit d'un projet bioinformatique. Objectif : représenter, développer et démontrer les hauts niveaux de fonctionnalité d'une infrastructure grid pour l'utilisation de ressources distribuées complexes.
Depuis les premiers projets pilotes, plus de 80 projets pilotes ont été mis en place par les conseils de recherche.
Au total plus de 200 projets ont été consacrés à l'e-Science.
Glossaire :
[1] Intergiciel : infrastructure logicielle servant d'intermédiaire entre d'autres logiciels.
[2] Grid : grille informatique, infrastructure virtuelle constituée d'un ensemble coordonné de ressources informatiques potentiellement partagées, distribuées, hétérogènes, externalisées et sans administration centralisée ; l'objet du grid est de rendre l'accès à la puissance de calcul, aux dépôts d'archives de donnés scientifique et aux installations expérimentales, aussi facile que l'accès à l'information pour le Web.
[3] Workflow : processus électronique de travail ; terme qualifiant la modélisation et la gestion informatique de l'ensemble des tâches à accomplir et des différents acteurs impliqués dans la réalisation d'un processus métier.
Pour recevoir les prochaines parutions, abonnez-vous à "Technologies Internationales" :
Acquisition de données et partage d'information ont fait un bond énorme depuis quelques décennies dans le domaine des sciences. Le chercheur isolé avec sa règle à calculs au fond d'une bibliothèque mal éclairée a laissé place à un cyber-chercheur interconnecté avec tous les grands centres scientifiques de la planète. Au Royaume-Uni, le programme e-Science se veut aujourd'hui la solution pragmatique pour interconnecter le monde scientifique, et ainsi révolutionner recherche et échanges d'informations.
Il y a à peine cinquante ans, la vie quotidienne du chercheur, c'était des heures en solitaire à collecter des informations dans les bibliothèques, un réseau de communication restreint à l'entourage et des calculs le plus souvent faits à la main. L'arrivée de l'ordinateur a bousculé la gestion de l'information. Les étagères fléchissant sous le poids des informations se sont allégées et réduites les heures à éplucher des monticules de brochures. Aujourd'hui, un ordinateur portable stocke davantage de données que toute une bibliothèque "papier" et il traite plusieurs milliers d'opérations en moins d'une seconde.
L'arrivée d'Internet a fait naître une deuxième révolution, avec une possibilité de mettre en commun ses résultats et de les échanger instantanément avec ses pairs dans le monde entier. Toutefois, avec Internet sont arrivés les soucis de compatibilité de formats et de logiciels ; qualité et pérennité ne sont pas toujours garanties sur le Web.
A la fin de l'année 2000, John Taylor, haut responsable de l'Office of Science and Innovation britannique (OSI) au sein du ministère du Commerce et de l'Industrie britannique, imagine le concept d'e-Science. Il remarque en effet que de nombreux domaines de la science deviennent de plus en plus dépendants de coopérations multidisciplinaires nationales et internationales. "L'e-Science, explique-t-il, va changer notre façon de faire la science. Le programme doit traiter de la collaboration mondiale dans les domaines clés de la science, et de la prochaine génération d'infrastructure qui permettra cette collaboration" (voir "Les projets pilotes du programme initial d'e-Science" ci-contre).
Rapidement, un financement de 180 millions d'euros est débloqué. Trente-cinq millions pour l'e-Science Core Programme dont la mission est de répondre aux besoins des projets pilotes en développant une infrastructure de communication plus robuste et standardisée. En outre, l'OSI répartit 145 millions d'euros entre les conseils de recherches et l'e-Science Core Programme pour mettre en place l'e-Science Research and Development Programme sur trois ans. Des industriels collaborant au projet y ajoutent 60 millions d'euros.
Des millions d'euros iront ainsi au lancement de plusieurs projets pilotes afin de couvrir tous les domaines de la science. A titre d'exemple : 12 millions d'euros pour le Biotechnology and Biological Science and Research Council, 25 millions d'euros pour l'Engineering and Physical Science Research Council, 38 millions d'euros pour le Particle Physics and Astronomy Research Council ou encore 7 millions d'euros pour le Council for the Central Laboratory of the Research Council.
L'objectif de l'e-Science Core Programme est d'identifier les besoins en termes de logiciels et d'intergiciels [1], nécessaires à la mise en place d'un grid [2] robuste. L'analyse des projets pilotes permet d'identifier ces besoins. Le directeur du Core Programme, Tony Hey, a été chargé de développer une structure destinée à promouvoir l'émergence de la puissance et de la robustesse du grid.
Des collaborations internationales vers une standardisation
Un grid isolé n'aurait aucun sens. Pour que la communauté e-Science britannique communique et collabore avec la communauté internationale, de nombreuses activités ont été mises en place, tel GridNet. Le développement de l'e-Science et des technologies grid est stimulé par des investissements gouvernementaux aux Etats-Unis et dans beaucoup de pays européens. Pour pouvoir tirer profit de cette montée rapide du grid, ces investissements nécessitent une coordination, une communication et plus particulièrement une standardisation, par exemple à travers les GGF (Global Grid Forum) et W3C (World Wide Web Consortium) utilisant l'IETF (Internet Engineering Task Force).
Le but de GridNet est de fournir une aide aux membres de la communauté britannique - membres du e-Science Core Programme, participants aux projets pilotes, chercheurs et développeurs travaillant sur le Grid, par exemple - afin de participer activement à la standardisation et à la coordination au plan international des technologies. Le projet GridNet s'est achevé en mars 2005, mais il a été remplacé par GridNet2 qui coure jusqu'en décembre 2007.
L'engagement du Royaume-Uni dans des grands projets internationaux permet à la fois d'accroître son niveau de recherche et de s'afficher comme un acteur majeur de l'e-Science. Le programme e-Science organise des appels aux candidatures afin d'offrir des bourses aux étudiants britanniques voulant étudier à l'étranger pour comprendre comment l'e-Science peut être utile dans les recherches. Des appels pour des projets avec le CERN et le VDGL (international Virtual Data Grid Laboratory aux Etats-Unis) ont déjà été annoncés.
Par ailleurs le Royaume-Uni organise beaucoup de réunions avec différents pays pour identifier les chercheurs du grid, et explorer des intérêts communs. Des rencontres ont déjà eu lieu avec le Japon, la France, la Chine, l'Australie et les Etats-Unis.
Premier bilan très positif
Beaucoup d'investissements ont été réalisés pendant la période 2001-2006, et plusieurs projets e-Science s'achèvent aujourd'hui, permettant ainsi d'évaluer les bénéfices scientifiques obtenus. Ainsi le lancement du LHC est prévu pour fin 2007 ou 2008 et son fonctionnement impliquera le GridPP. L'observatoire virtuel (AstroGrid) offre une importante collection d'archives de données interactives et d'outils logiciels pour la recherche scientifique ; les astronomes ont formé l'International Virtual Observatory Alliance (IVOA) en 2002, regroupant l'Allemagne, Australie, le Canada, la Chine, la Corée, les Etats-Unis, la France, la Hongrie, l'Inde, l'Italie, le Japon, le Royaume-Uni et la Russie dans le but de développer des standards internationaux.
Le projet RealityGrid utilise à la fois le National Grid Service et le Tera Grid américain. Pour améliorer de manière significative les simulations physiques, Discovery Net et MyGrid ont développé des workflows [3] qui permettent aux chercheurs de mieux utiliser la grande quantité d'informations qui les inonde. MyGrid est devenu l'outil du bioinformaticien pour extraire les informations et les connaissances réparties dans le monde entier, qui, souvent, posaient un problème d'incompatibilité. Discovery Net donne la possibilité aux chercheurs de faire face aux données en temps critiques générées par un flux haut débit. Enfin, le projet Comb-e-Chem a montré que le grid pouvait transformer la façon dont la chimie était pratiquée.
Au total, plus de 443 millions d'euros ont été investis dans l'e-Science programme lors des cinq dernières années. Une centaine d'entreprises sont impliquées, dont IBM, Oracle, Intel, Sun et un large nombre d'entreprises internationales dans différents domaines.
Enfin, le Royaume-Uni a étendu l'e-Science non seulement aux sciences et aux sciences de l'ingénieur, mais aussi aux sciences humaines et sociales. Plusieurs pays ont suivi l'initiative du Grid. En 2002, le ministère de l'Education chinois a lancé le projet ChinaGrid. Les projets existent aussi en Allemagne, au Japon, et aux Etats-Unis. En France le projet Grid5000 existe depuis 2003, avec neuf centres répartis dans tout le pays et devrait aboutir en 2008.