Bioinformatique

Médecine de Précision - Biomarqueurs et Diagnostics

Bioinformatique et biostatistique pour l’analyse des données génomiques et transcriptomiques

Forte de ses 20 ans d’expériences, Acobiom a acquis une expertise unique dans l’analyse bioinformatique de l’expression des gènes et dans l’identification de biomarqueurs ARN spécifiques de la pathologie ou de la question biologique étudiée. Les partenaires ou clients de la société pourront ainsi bénéficier de méthodes, de process et d’outils bioinformatiques et biostatistiques fiables et efficaces, éprouvés et validés dans le cadre de publications scientifiques et le développement de diagnostics in-vitro.

Des analyses bioinformatiques et biostatistiques adaptées à chaque projet

Bioinformatique et biostatistique pour l’analyse des données de séquençage

Acobiom a développé des méthodes statistiques et des outils bioinformatiques dédiés aux analyses et à la gestion des quantités massives de données génomiques et transcriptomiques générées par séquençage.

L’équipe technique adapte ses outils, logiciels et algorithmes aux spécifications de chaque analyse et traitement spécifique.


L’équipe d’Acobiom utilise ainsi des pipelines et des algorithmes personnalisés pour :
> l’étude du transcriptome, comprenant l’expression de gènes (codant ou non codant) ou de variants d’épissage,
> l’étude du génome, comprenant l’analyse de génome et de métagénome, de l’exome, du méthylome ou encore du dégradome.

Ainsi, pour chacune des analyses et chacune des étapes constituant ces analyses, Acobiom choisit et adapte les outils et paramètres pour répondre le plus précisément à la question biologique étudiée.

Analyse du Transcriptome

Dans l’analyse des ARN, plusieurs types d’ARN et processus peuvent être analysés séparément ou conjointement.

En effet, la famille des ARN est une famille très importante comprenant les ARNm (ARN messagers codant pour les protéines), et les ARN non-codants de type miRNA (micro-ARN) ou de type lncRNA (ARN long non-codant).

Les outils d’analyse et/ou les paramètres utilisés dans les analyses sont spécifiques de chaque type d’ARN.

De même, dans l’analyse d’un processus tel que l’épissage, la démarche bioinformatique requiert une analyse plus profonde, c’est-à-dire qu’il ne faut plus considérer un ARN comme une seule entité, mais analyser, identifier et compter l’ensemble des exons qui le composent.

Il faut ainsi savoir que chez l’homme, ce sont près de 1,2 million d’exons qui sont aujourd’hui cartographiés.

L’approche proposée pour étudier ces transcriptomes est le RNA-Seq : le séquençage haut débit (NGS) de tous les ARN messagers présents dans une condition déterminée.

Le pipeline d’analyse du transcriptome est constitué des principales étapes suivantes :
a) Contrôle de la qualité et nettoyage des séquences,
b) Cartographie sur le génome de référence,
c) Comptage des séquences cartographiées,
d) Normalisation et comparaison,
e) Annotation des séquences,
f) Étude des gènes exprimés : analyse différentielle, visualisation et validation statistique.

Analyse du Génome

De la même manière que pour l’analyse du transcriptome, l’analyse de génome peut être appréhendée de différentes manières : l’analyse des régions codantes pour les ARN (Exome), la recherche des sites de méthylation sur l’ADN (Methylome) ou la recherche de variants de séquences représentatives de mutations sur l’ADN de type somatique (non héréditaire) ou constitutionnelles (héréditaire), caractérisés par des insertions/délétions (InDels) ou par des mutations d’un nucléotide (SNV) sur l’ADN.

Étudier l’exome d’un individu consiste à étudier les variations génétiques de la partie codante du génome dans une condition définie.

L’analyse de l’exome est constituée des principales étapes suivantes :
a) Contrôle de la qualité et nettoyage des séquences,
b) Cartographie sur le génome de référence,
c) Détection précise des InDels (Insertions/Délétions),
d) Détection précise des SNVs (Single Nucleotide Variants),
e) Annotation des séquences,
f) Analyse différentielle, visualisation et validation statistique,
g) Comparaison aux données existantes, type COSMIC pour les mutations somatiques (https://cancer.sanger.ac.uk/cosmic).

Analyse du métagénome et étude du microbiome (composition microbienne)

La métagénomique est l’étude de l’ensemble des génomes présents dans un milieu complexe et dans une condition donnée.

Étudier le microbiote d’un individu consiste à identifier les génomes des bactéries ou virus présents dans un échantillon salivaire, intestinal ou sur la peau.
Cette analyse peut considérer des génomes complets ou cibler des régions spécifiques, comme l’analyse de l’ARN 16S (ex V3-V5) dans les études du microbiote intestinal humain.

L’analyse du microbiome est constitué des principales étapes suivantes :
a) Contrôle de la qualité des séquences,
b) Nettoyage et regroupement des séquences représentatives en OTU (Operational Taxonomic Units),
c) Comptage des populations,
d) Analyse taxonomique des échantillons (détection des espèces),
e) Analyse de la population et de la diversité (diversité Alpha, Beta),
f) Analyse différentielle, visualisation et validation statistique.

MaRS (Matrice RNA-Seq) : une base de données de 21.000 profils RNA-Seq humains

Acobiom a rassemblé dans une même base de données, dénommée MaRS, 21.000 analyses d’expression de gènes humains, de type RNA-Seq.

MaRS se concentre sur la méthode RNA-Seq, qui reflète l’expression des gènes dans une condition déterminée. Générés par le séquençage de nouvelle génération (NGS), tous ces profils ont été analysés de manière standardisée sur des Calculateurs Haute-Performance (machine HPC du CINES).

La matrice MaRS permet ainsi la comparaison directe de ces 21.000 profils RNA-Seq et des données transcriptomiques associées.

MaRS contient des profils portant sur des pathologies humaines (cancers, infections, maladies génétiques…) et sur de nombreux organes (sang, sein, poumon, foie, pancréas…).
Ainsi, Acobiom utilise MaRS pour explorer et identifier de nouveaux biomarqueurs, mais également pour combiner ces données organisées et hierarchisées avec des données nouvellement générées..

De plus, MaRS permet de qualifier et/ou d’identifier de nouveaux gènes de référence (“housekeeping genes”) tout aussi importants que les gènes/biomarqueurs ciblés pour la réalisation de nouvelles analyses par PCR (qPCR, RT-qPCR).

La base de données MaRS est un formidable outil de développement interne pour Acobiom.
La société propose aussi l’accès à cette base de données à ses partenaires par le biais de services et/ou de collaborations scientifiques.