Suite de 3 milliards de bases azotées de quatre types différents, le génome contient les plans de fonctionnement de notre organisme. Son altération par des mutations entraine l'apparition de maladies ou de déficiences comme le cancer et les myopathies. Pouvoir déchiffrer le génome des individus permettrait de cibler ces mutations chez les malades afin de comprendre les altérations entrainant les maladies, de pouvoir effectuer des pronostics sur les prédispositions à certaines maladies, d'effectuer des détections précoces et de proposer des traitements ciblés. C'est la clé d'une médecine à la fois préventive et complètement personnalisée.
Cependant, ces promesses ne peuvent être tenues que si ce déchiffrement - le séquençage de l'ADN - est rapide et peu couteux. Sachant, qu'il a fallu 15 ans d'efforts, entre 1989 et 2004, et plus d'un milliard de dollars pour parvenir à déchiffrer complètement le génome humain dans le cadre du Human Genome Project (HUGO), il faut mettre en place des techniques réduisant les couts et les délais par un facteur 100.000. C'est l'objectif du programme "$ 1000 Genome" en place aux Etats-Unis depuis 2004 dans lequel les nanotechnologies jouent une place centrale [1,2]. 9,5 millions de dollars de financements ont été investis par le National Human Genome Research Institute (NHGRI) dans ce programme pour la Fiscal Year 2010.
L'ADN et les méthodes actuelles de séquençage
4 briques de base (Adénine, Thymine, Cytosine et Guanine - A, T, C et G) qui se succèdent sur deux brins complémentaires s'enroulant en double hélice, l'ADN peut se comparer à une longue suite de caractères. Dans le cas de l'homme, il faudrait 1000 livres de 700 pages pour pouvoir écrire l'ensemble des 3 milliards de lettres du génome. Séquencer l'ADN, c'est effectuer la lecture de ces 1000 livres, lettre après lettre. La méthode la plus efficace semble alors de commencer par la première page du premier livre et d'effectuer le déchiffrement lettre après lettre. Or la double hélice d'ADN a un diamètre de 4 nanomètres et les bases azotées qui en constituent l'enchainement sont espacées de 0.34 nanomètre. Aucun instrument ne permet jusqu'à présent d'aller "lire" la molécule à cette échelle. Les chercheurs ont du mettre au point des techniques macroscopiques avec les méthodes disponibles. L'analogie avec les livres permet d'avoir une idée de l'effort titanesque que cela représente.
Vous avez devant vous 1000 livres de 700 pages chacun. Sur chaque page, vous savez qu'il y a des caractères écris avec une encre invisible. Vous ne pouvez faire apparaître au hasard qu'un caractère à la fois sur la page et savoir si il s'agit d'un A, T, C ou G. Vous pouvez aussi faire un calque de la page qui vous permet de copier la position de la lettre que vous avez fait apparaître.
La méthode Sanger implique tout d'abord d'arracher une page dans un des livres. Vous faites apparaître une lettre sur la page et vous calquez la page. La lettre disparaît. Puis vous faites apparaître une seconde lettre et obtenez un nouveau calque. Le problème c'est que vous ne pouvez pas choisir la lettre que vous faites apparaître. Il faut donc faire des milliers de calques pour être sur d'avoir vu apparaître toutes les lettres de la page. L'étape suivante consiste à ordonner tous les calques obtenus afin de pouvoir reconstituer la séquence complète de caractères présents sur la page. Il ne vous reste plus qu'à répéter ce travail pour chacune des 700.000 pages à déchiffrer. La dernière étape consiste à remettre ces pages dans l'ordre. Cela n'est possible qu'en utilisant des supercalculateurs, capables de retrouver les chevauchements entre les différentes pages afin d'en reconstituer la succession.
Cette méthode, longue couteuse, fut celle employée dans le projet HUGO. Les copies des sections déchiffrées sont réalisées à l'aide d'enzymes dont la fiabilité n'est pas parfaite et qui produisent un certain nombre d'erreurs. La multiplication des portions à déchiffrer entraine aussi la multiplication des erreurs de lecture. Il faut ainsi répéter l'opération de déchiffrage plusieurs fois pour atteindre des taux d'erreurs de 1 pour 10.000 bases, fixés dans le cadre d'HUGO.
Le pyroséquençage constitue la seconde génération de méthodes et est aujourd'hui la technique la plus employée. Il s'agit d'un séquençage par synthèse. Une enzyme crée le brin complémentaire du brin à séquencer en ajoutant les nucléotides les uns après les autres. A chaque ajout, une suite de réactions chimiques entraine l'apparition d'un signal lumineux qui permet d'identifier la base azotée qui a été intégrée. Cette méthode présente l'avantage de ne pas nécessiter la multiple reproduction du brin d'ADN à séquencer. Elle permet de réduire les couts et les délais d'un facteur 3 par rapport à la méthode de Sanger.
Ces trois dernières années, une troisième génération de méthodes, le "Single Molecule Real Time Sequencing", a fait son apparition. Elle utilise déjà les progrès faits en nanotechnologies pour optimiser les méthodes de pyrosequençage. Il s'agit à nouveau de construire le brin complémentaire d'ADN à l'aide d'une enzyme. Cette fois-ci, les fluorophores sont directement attachés aux nucléotides. Une structure nanophotonique, appelée "zero-mode wave guide", composée de trous de 70 nm de diamètre et 100 nm de long dans une couche d'aluminium déposée sur un verre, assure une détection efficace des signaux lumineux et permet le séquençage en parallèle de nombreux brins. La companie Pacific Biosciences a reçu une bourse de 6.6 millions de dollars dans le cadre du programme du "$1000 genome" du NHGRI afin de commercialiser cette méthode développée à la Cornell University [3].
Les méthodes de seconde génération ne permettent de séquencer que des brins composés de quelques dizaines de bases azotées. La troisième génération améliore ce rendement permettant le séquençage de brins comprenant jusqu'à 1000 bases à une vitesse de 10 bases par seconde. Cependant, ces techniques sont limitées par la vitesse relativement faible avec laquelle les enzymes génèrent le brin complémentaire. Pour surpasser ces techniques, les chercheurs travaillent sur des méthodes ne nécessitant pas d'enzymes et basées sur les "solid state nanopores".
Les nanopores, outils clés du séquençage futur
Le développement des nanotechnologies permettent aujourd'hui d'envisager la simplification drastique des méthodes de séquençage. Le contrôle de la matière à l'échelle du nanomètre permet enfin de créer des moyens de lecture directs de la succession des bases azotées de l'ADN. Ces techniques sont basées sur la translocation d'un brin d'ADN à travers un nanopore.
Ces nanopores sont des trous d'un diamètre de quelques nanomètres qui sont effectués dans différents matériaux en fonction de la technique utilisée. Le matériau sépare deux milieux liquides. Le brin d'ADN, chargé négativement, est plongé dans un milieu chargé négativement et est attiré par la solution présente de l'autre coté du nanopore, chargée positivement. C'est lorsque le brin d'ADN défile par le nanopore que la lecture des bases azotées qui le constitue peut avoir lieu.
L'utilisation des nanopores permet la lecture de longues chaines d'ADN directement sans avoir à les dupliquer en quantité aussi importante que ce qui était exigé par les méthodes anciennes. La recombinaison des séquences décodées est aussi simplifiée du fait qu'elles sont beaucoup moins nombreuses.
Détection optique
Le groupe du Prof Amit Meller du Boston University College of Engineering a mis en place une méthode de détection optique [4]. La technique utilisée est une méthode indirecte de lecture de l'ADN. Le brin est tout d'abord converti, chaque base unique étant traduite comme un assemblage de deux oligonucléotides (séries de quelques bases), une méthode appelée Circular DNA Conversion. Ce brin simple d'ADN "étendu" est ensuite hybridé à l'aide d'oligonucléotides marqués par des fluorophores pour obtenir un brin en double hélice (figure 2).
En traversant le nanopore, percé dans une couche de nitrure de silicium de 50 nm d'épaisseur, la partie hybridée du brin se détache entrainant l'excitation des fluorophores et l'émission d'un signal lumineux caractéristique. L'enregistrement de la succession de ces signaux lumineux par une caméra CCD permet de remonter à la succession des oligonucléotides et donc des bases azotées du brin initial d'ADN [5,6].
La fréquence de lecture est comprise entre 50 et 250 bases par secondes. En améliorant la technique via l'utilisation de 4 fluorophores au lieu de 2 actuellement, les chercheurs espèrent atteindre des fréquences de 500 bases par seconde. La limitation de la technique est alors liée aux capacités d'acquisition de la caméra CCD qui devient le facteur limitant. En améliorant la caméra, il sera possible d'accélérer le processus puisque la vitesse de défilement du brin par le nanopore est contrôlée précisément.
Un calcul rapide permet de se rendre compte que même à un rythme ininterrompu de 500 bases lues par seconde, il faut 70 jours pour pouvoir déchiffrer l'ensemble du génome d'un individu. L'avantage principal de la détection optique réside dans le fait que la mise en parallèle de nanopores ne présente aucune difficulté. Ainsi, au lieu d'utiliser un seul pore, les chercheurs prévoient de construire des matrices de centaines nanopores faisant face à une matrice d'acquisition CCD (figure 3). Chaque pixel de la matrice CCD acquiert alors les signaux lumineux émis par un nanopore.
Ce net avantage compense l'inconvénient principal de la méthode qui est l'étape de conversion du brin d'ADN en une chaine d'oligonucléotides et son hybridation. La commercialisation de cette méthode est envisagée par la création d'une start-up, NobleGen Biosciences, Inc.
Détection électrique
Les autres méthodes développées sont basées sur la détection de variation du courant électrique au niveau du nanopore lors du passage des différentes bases azotées pendant la translocation. Ces techniques nécessitent d'immobiliser le brin d'ADN au niveau de chaque base azotée pour permettre l'acquisition de la mesure.
Pour effectuer ce contrôle, les chercheurs d'IBM ont mis au point un transistor ADN. Il s'agit d'une structure multicouche d'épaisseur nanométrique dans laquelle est creusé un nanopore. La succession de couches conductrices et isolantes de la structure permet de contrôler le passage du brin d'ADN dans le nanopore afin de pouvoir effectuer les mesures nécessaires à l'identification des bases azotées. Pour conduire ces travaux, les chercheurs d'IBM viennent de s'associer aux chercheurs de Roche afin d'allier les compétences en microélectronique, technologies de l'information et biologie computationnelle du premier aux compétences en séquençage du second. Roche est en effet le leader actuel des méthodes de séquençage automatique avec les appareils développés par sa firme 454 Life Sciences fondée en juin 2000 [7].
L'avantage principal de la détection électrique provient du fait que les brins d'ADN peuvent être analysés directement. Cependant, les bases azotées étant séparées de seulement 0,34 nm, cela implique d'obtenir une précision extrême dans la fabrication du multicouche du transistor ADN. Pour le moment, les modèles théoriques et les simulations numériques indiquent que cela est possible. La réalisation pratique de la structure reste à être démontrée. Une étape de conversion, identique à celle employée par l'équipe du Prof Miller, pourrait alors être nécessaire.
Ce besoin de précision pourrait être obtenu à l'aide du graphène. Une équipe de l'University of Pennsylvania a développé une structure comprenant un nanopore dans une couche de graphène (figure 1) [8]. La couche étant monoatomique, son épaisseur est inférieure à la distance séparant deux bases azotées. Cependant pour améliorer la robustesse du nanopore et améliorer le rapport signal sur bruit de la mesure du courant électrique, la couche de graphène est recouverte d'oxyde de titane. Si l'étape de détection est améliorée par la couche de graphène, l'équipe doit travailler sur le contrôle du défilement du brin d'ADN dans le nanopore.
Une équipe de chercheurs de l'Arizona State University a utilisé des nanotubes de carbone comme nanopores [9]. Les variations de courants dans les nanotubes enregistrées lors du passage des brins d'ADN suggèrent qu'il serait possible de contrôler et effectuer une lecture des bases azotées en utilisant les nanotubes. Cependant, des modélisations supplémentaires sont nécessaires pour comprendre les mécanismes d'interaction électroniques entre les nanotubes et les brins d'ADN.
La difficulté essentielle des techniques utilisant les nanopores réside dans le contrôle de la vitesse de migration de l'ADN. Les méthodes développées utilisent toutes des nanopores cylindriques. Une équipe de Sandia National Laboratories au Nouveau Mexique vient de développer un nanopore en dent de scie ralentissant la translocation de l'ADN d'un facteur 5 (figure 4) [10].
Une autre avancée a été publiée par des chercheurs de l'University of Washington [11]. L'équipe de Jens Gundlach a utilisé un nanopore d'origine organique. Il s'agit d'une protéine en forme de tonneau, la porine, qui permet d'assurer les échanges de certaines molécules dans les membranes des bactéries. Il a fallu modifier une de ces bactéries, M. smegmatis, afin de produire un nanopore adapté. Le passage de l'ADN dans ce nanopore produit une variation du courant ionique permettant la translocation du brin. Chaque base azotée induit une variation différente de ce courant ce qui permet de les identifier.
Seulement, il faut un millionième de seconde pour qu'une base azotée traverse le nanopore. Trop rapide pour assurer une lecture du brin. Pour contrôler la vitesse de translocation, les chercheurs ont eu recours à une méthode d'extension du génome. Ils ont ajouté une section d'ADN double brin entre chacune des bases azotées du simple brin à séquencer. Les doubles brins sont trop larges pour passer au travers du pore. Ils bloquent donc la translocation jusqu'à ce qu'ils se séparent. Les chercheurs ont ainsi créé un frein qui permet d'arrêter la translocation pour quelques millièmes de secondes, le temps de capter le signal de la base azotée à identifier.
Conclusion
En 10 ans, l'évolution des techniques de séquençage de l'ADN a été spectaculaire. La première génération de méthode est dépassée, la seconde est fortement utilisée, la troisième est en voie de commercialisation et, dans leurs laboratoires, les chercheurs préparent déjà la quatrième génération qui s'annonce révolutionnaire.
Les nanotechnologies vont bientôt permettre de "lire" l'ADN de la même manière qu'un faisceau laser vient lire la succession de sur un CD. Cependant, au-delà de la difficulté technique de développement d'un lecteur efficace, le séquençage de l'ADN entraine d'autres problèmes. Comment, par exemple, stocker et gérer la quantité colossale de données représentées par le séquençage de l'ADN de millions d'individus ? Comment protéger ces données ?
Si la connaissance du génome de chaque individu permettra d'apporter des réponses médicales individualisées, elle pourra aussi être la source de discriminations notamment de la part des polices d'assurance maladie. Pour pallier à ces problèmes éthiques, le Congrès a passé, à la quasi unanimité, le 21 mai 2008, le Genetic Information Nondiscrimination Act (GINA). Cette loi interdit toute discrimination basée sur le génome. Sera-t-elle suffisante pour garantir une utilisation bénéfique du séquençage du génome humain ?