Une équipe de chercheurs japonais, dirigée par les professeurs Taishi Umezawa et Tetsuya Sakurai du RIKEN, a assemblé une banque de données regroupant un grand nombre de séquences complètes de gènes du soja. Parmi celles-ci se trouvent des séquences dites "pleine longueur" qui présentent un intérêt particulier car elles incluent non seulement toute l'information codant pour une protéine donnée, mais aussi celle qui contrôle l'expression de ladite protéine par l'organisme.
Le soja est utilisé dans plusieurs domaines de l'activité humaine : c'est une source de protéines et d'huiles végétales, ainsi qu'une matière première pour la fabrication de produits aussi divers que l'encre, les plastiques, ou les biocarburants. Une meilleure connaissance de son vaste génome - 20 paires de chromosomes, environ 1.000 mégabases - est donc particulièrement importante pour l'élaboration de variétés plus résistantes ou mieux adaptées à un usage particulier de la plante.
L'équipe de recherche a cultivé plusieurs plants de soja sous des conditions variées - par exemple, défaut ou excès d'humidité, températures basses (15°C) ou très basses (4°C), salinité élevée - ce afin de provoquer l'expression d'un maximum de gènes différents. A partir de l'ARN obtenu dans les cellules de ces plants, les chercheurs ont synthétisé de l'ADN complémentaire (ou ADNc), obtenant près de 40.000 clones, i.e., des copies de molécules d'ADN. Ils ont ensuite effectué un tri pour éliminer les clones redondants ou de mauvaise qualité. Au final, sont restées environ 22.500 séquences non redondantes, une grande partie comprenant de l'information codant pour une protéine. Parmi ces dernières, les chercheurs ont identifié 6.570 séquences pleine longueur.
Les 22.500 séquences ont ensuite été comparées avec celles de végétaux dont le génome est bien connu, comme le riz ou Arabidopsis thaliana. Il en est ressorti qu'environ 500 d'entre elles n'ont pas d'équivalent connu chez d'autres espèces. Par ailleurs, un nombre important de séquences n'étaient pas répertoriées dans les autres bases de données consacrées au génome du soja.
Les chercheurs ont déposé leur résultats auprès du National BioResource Project, un organisme japonais dédié à la collecte et à la conservation de ressources utiles à la recherche dans les sciences du vivant ; ceci afin de permettre à la communauté scientifique d'y avoir largement accès. Les résultats obtenus présentent entre autres un intérêt certain pour l'étude de la réponse du soja à des conditions de stress environnemental, et ont d'ores et déjà permis la réalisation de puces à ADN destinées aux recherches sur cette question.
- "Building a soy gene catalogue" - RIKEN - 01/05/09 - "Sequencing and analysis of approximately 40.000 soybean cDNA clones from a full-length-enriched cDNA library" - UMEZAWA Taishi, SAKURAI Testsuya et al. - DNA Research 15 (6) - 16/10/08 - http://dnaresearch.oxfordjournals.org/cgi/content/full/15/6/333