RNA-Seq, l’expertise d’ACOBIOM pour réaliser l’analyse de l’ARN par séquençage
La transcriptomique, ou profilage de l’expression à l’échelle du génome, vise à cataloguer l’ensemble complet des transcrits d’ARN produits par le génome. La transcriptomique fournit de nouvelles informations biologiques et peut être utilisée pour déterminer la structure des gènes, leurs schémas d’épissage et d’autres modifications post-transcriptionnelles, pour détecter les transcrits rares et nouveaux, et pour quantifier les niveaux d’expression changeants de chaque transcrit au cours du développement et dans différentes conditions pathologiques.
Parmi les différentes approches, le RNA-Seq est une méthode puissante pour identifier et décoder quantitativement la population entière des ARN dans un échantillon, et est utilisée dans une grande variété d’applications.
APPLICATIONS DU RNA-SEQ
Le RNA-Seq est largement utilisé pour caractériser les schémas d’expression génique associés à l’identification de gènes liés à des maladies, à l’analyse des effets des médicaments sur les tissus et à la découverte de pistes dans les voies d’une maladie. Cette approche est également utilisée pour la :
- La détection d’événements de mutation tels que : de nouveaux événements d’épissage, des fusions de gènes, des SNP, ou d’autres mutations codantes spécifiques ;
- La détection de transcrits rares ou nouveaux ;
- Le profilage et la comparaison de l’expression du génome entier dans différentes espèces ou dans des échantillons biologiques différents.
AVANTAGES DU RNA-SEQ
Le RNA-seq fournit une vue plus complète du transcriptome en une seule expérience. Il permet de séquencer et de profiler toutes les espèces de transcrits dans les échantillons d’ARN total.
La technique RNA-Seq présente une gamme dynamique et une sensibilité accrues. Celle-ci permet de réaliser une analyse « numérique » de l’expression des transcrits, ce qui signifie que les données relatives au niveau d’expression sont basées sur chaque transcrit individuel qui est séquencé et compté. En augmentant la profondeur de séquençage, une gamme dynamique potentiellement illimitée peut être atteinte, ce qui fait du RNA-Seq un outil idéal pour la détection de transcrits rares.
Le RNA-Seq fournit des informations sur la variation de la séquence dans les transcrits. Il produit un ensemble de données riche, comprenant des informations sur les mutations post-transcriptionnelles et leur contexte génomique. Comme les données RNA-Seq fournissent des informations sur la façon dont les exons sont connectés, elles peuvent révéler des variations de séquence dans les transcrits dues à des événements d’épissage alternatif et fournir des informations sur l’expression génique spécifique à un allèle ou à une isoforme. De plus, le RNA-Seq explore la grande famille des ARN, avec les ARN codants (ARNm) et les ARN non codants comme les ARN non codants longs (ARNr, ARNsi, pseudogènes, …) ou les petits ARN (miRNA, snoRNA, piRNA, …). En outre, les données RNA-Seq sont utiles pour les fonctions de cartographie des gènes telles que la description de la longueur des UTR et des limites des exons.
La technique RNA-Seq ne dépend pas nécessairement d’une connaissance préalable des séquences. Il n’est pas nécessaire de concevoir des sondes qui doivent être basées sur des informations préalables sur la séquence ou la structure secondaire. Par conséquent, le profilage du transcriptome de n’importe quelle espèce est possible, ce qui rend cette méthode particulièrement intéressante pour les espèces non modèles. En outre, les données RNA-Seq peuvent être utilisées pour construire des modèles génétiques de novo.
Étant donné que le RNA-Seq fournit des valeurs absolues et ne nécessite aucun étalonnage avec des normes arbitraires, les résultats peuvent être comparés à tout moment avec d’autres données, même relevées par des laboratoires indépendants. Une fois collectées, ces données peuvent être numérisées puis comparées in silico de manière simple et fiable avec la bibliothèque croissante de bases de données RNA-Seq générées pour des situations normales et pathologiques dans d’autres laboratoires du monde entier. Par exemple, ACOBIOM a développé la base de données RNA-Seq MaRS pour fournir et centraliser des données standardisées utilisées dans une grande variété d’applications comme l’identification de gènes liés à des maladies, l’analyse des effets des médicaments sur les tissus ou la compréhension des voies d’une maladie.
BIOINFORMATIQUE ET SCIENCE DE LA DONNEE
Le traitement de la masse de millions de données générées par le RNA-Seq nécessite un catalogue d’outils bioinformatiques et biostatistiques. Ainsi, pour analyser les données de séquençage générées par cette approche, il est nécessaire de :
- Contrôler la qualité des données de séquençage ;
- Nettoyer les données de séquençage ;
- Cartographier ces données sur un génome de référence ;
- Compter les séquences cartographiées ;
- Standardiser les données ;
- Comparer les données avec d’autres profils RNA-Seq ;
- Annoter et analyser les données ;
- Visualiser et valider statistiquement les résultats.
Comme ces profils transcriptomiques peuvent être facilement réalisés par séquençage, les données peuvent être comparées à tout profil RNA-Seq généré par la communauté scientifique ou d’autres laboratoires. Le RNA-Seq peut être utilisé dans la découverte et le développement de nouveaux médicaments, traitements ou diagnostics.
Depuis sa création, ACOBIOM étudie les molécules d’ARN et effectue l’analyse de l’ARN par séquençage parce que les gènes (ADN) peuvent être considérés comme un « schéma directeur », pas un « destin ». En effet, contrairement à l’ADN, qui est établi à la naissance et ne change pas beaucoup au cours de notre vie, l’ARN est en constante évolution, reflétant la santé globale minute par minute. L’ARN est un messager qui transmet les instructions de l’ADN pour contrôler la synthèse des protéines et d’autres activités, transformant ainsi la feuille de route de l’ADN en réalité.