Témoinage Client

Approfondir les analyses autour d’un problème de santé publique majeur

Une équipe de recherche de la NYU Abu Dhabi fait appel à des outils d’analyse avancés pour mieux comprendre l’interaction des génomes et de l’environnement

NYU Abu Dhabi

New York University Abu Dhabi

Défi
Traiter des jeux de données extrêmement volumineux pour percer le mystère de la transmission du paludisme.
SolutionLes workflows et les fonctionnalités graphiques de JMP Genomics permettent aux chercheurs de la New York University Abu Dhabi d’interpréter plus rapidement et plus efficacement leurs données.
Résultats
Ils font des découvertes qui pourraient bien leur permettre d’endiguer, voire d’éradiquer, le paludisme.

D’après les centres de prévention et contrôle des maladies, les premières références au paludisme remontent à 2 700 ans avant J-C, avec la description des symptômes dans le plus ancien ouvrage médical : le Nei Ching. Hippocrate évoqua plus tard les symptômes d’une maladie parasitaire qui fit des ravages dans la Grèce antique.

Le paludisme est donc une maladie très ancienne que Youssef Idaghdour, chercheur et maître de conférences en biologie à la New York University Abu Dhabi, souhaite contribuer à éradiquer. Ses travaux de recherche passent par l’étude de la base génétique de caractères complexes et de leur influence sur la santé humaine. « Nous savons que les caractères complexes ne sont pas fondés uniquement sur les gènes ou l’environnement, mais sur la combinaison des deux, et que les effets peuvent être interactifs », explique Youssef Idaghdour.

Youssef Idaghdour

Youssef Idaghdour, maître de conférences en biologie à New York University Abu Dhabi.

Accélérer les découvertes dans des jeux de données extrêmement volumineux via les workflows

Le paludisme est une maladie particulièrement complexe qui demande aux chercheurs comme Youssef Idaghdour d’étudier les génomes des parasites, des moustiques et des individus, mais aussi l’environnement. Les membres de l’équipe de la NYU Abu Dhabi collectent des échantillons de sang auprès d’enfants du Burkina Faso avant et pendant la période d’infection, et après le traitement. Ils rassemblent toutes les informations nécessaires (âge, région, nombre de parasites présents dans le sang, etc.) pour réaliser de solides analyses statistiques. L’équipe extrait l’ADN et l’ARN à partir de chaque échantillon, et procède ensuite au profilage génomique des deux molécules des individus et des parasites.

« Nous examinons le génome dans son intégralité », déclare Youssef Idaghdour. « Imaginez un peu toutes les données qu’il faut traiter. Pour le séquençage du génome complet, nous devons nous pencher sur environ 10 millions de variantes d’ADN par individu et plusieurs dizaines de milliers de points de données correspondant aux niveaux d’expression de l’ARNm des individus et des parasites. » Outre les variantes d’ADN et l’ARNm, il y a également plusieurs milliers de micro-ARN et 866 000 marqueurs épigénétiques à prendre en compte.

JMP® Genomics permet d’aller à l’essentiel. Étroitement intégré avec le serveur SAS dédié du laboratoire, le logiciel offre des workflows spécialement conçus pour la recherche génomique, ce qui optimise les capacités de découverte statistique de l’équipe. Grâce à cette intégration entre SAS et JMP Genomics, Youssef Idaghdour et ses collègues peuvent effectuer des analyses génétiques et d’expression génétique avancées, tout en bénéficiant des puissants outils de test statistique propres aux solutions SAS.

Heatmap

Pairwise matrice de connexité.

Créer des wokflows pour répondre à des besoins précis

L’analyse des données de sources génomiques multiples et de l’interaction de l’environnement est si complexe que « nous devons nous appuyer sur de solides pipelines statistiques », confie Youssef Idaghdour. « JMP Genomics offre plusieurs workflows validés et testés, ainsi que de puissantes fonctions et méthodes statistiques. Associé à SAS, il accélère réellement le processus. »

Toutes les données font l’objet d’un contrôle qualité dans JMP Genomics. Les données épigénétiques et d’expression sont examinées via diverses méthodes, telles que la normalisation, l’analyse des distributions et l’analyse en composantes principales. Le contrôle qualité est suivi d’une analyse supervisée, reposant principalement sur des modèles mixtes linéaires. Pour les donnés de génotypage, l’équipe génère les propriétés de marqueur, puis réalise une cartographie des associations et une analyse eQTL.

Pour Youssef Idaghdour et ses collègues, le principal atout du logiciel, c’est qu’il leur permet de créer des workflows adaptés à leurs besoins. « Nous pouvons partager ces workflows avec nos collaborateurs et étudiants, et adapter très facilement l’outil en fonction de nos besoins », souligne-t-il. Par ailleurs, l’équipe est totalement séduite par les fonctionnalités graphiques de JMP Genomics. Les recherches de Youssef Idaghdour englobent les phases exploratoire et analytique, le passage de l’une à l’autre étant facilité par des options graphiques.

« Compte tenu de la quantité de données à analyser, il est très facile de passer à côté de modèles intéressants », confie Youssef Idaghdour. « Nous démarrons nos recherches par une analyse exploratoire ou non supervisée. » JMP Genomics permet ensuite de sélectionner dans les sorties graphiques des groupes de gènes ou de marqueurs en vue d’une analyse ciblée. Le processus est à la fois simple et efficace ; les tables et les graphiques sont liés, et l’équipe peut sélectionner des caractéristiques, les mettre en évidence et les placer dans des sousgroupes à des fins d’analyse approfondie.

« Supposons que je veuille examiner l’évolution dans le temps des niveaux des expressions génétiques des individus et des parasites. La tâche est relativement complexe, car il y a des dizaines de milliers de transcrits humains et plus de 5 000 transcrits dans les parasites. » Grâce aux fonctionnalités graphiques de JMP Genomics, l’équipe peut visualiser la dynamique de ces dizaines de milliers de gènes.

L’équipe fait appel à la fonction de corrélation croisée de JMP Genomics pour analyser les données de l’hôte humain et celles du parasite. « La corrélation croisée se révèle très utile pour nous qui générons divers jeux de données à partir des mêmes individus », explique Youssef Idaghdour. « Ce type d’analyse nous permet de tester les corrélations entre les données épigénétiques et d’expression génétique, ainsi que d’autres données quantitatives », précise-t-il.

Les prélèvements sanguins ayant été effectués dans deux villages présentant de forts degrés de parenté, l’équipe utilise la technique d’analyse du modèle mixte Q-K pour tester les associations entre la parenté et les caractères quantitatifs dans les données. Elle applique également la méthode des K-means pour détecter des modèles de changement cohérents dans le temps, à la fois au niveau de l’hôte et du parasite.

Pairwise Relatedness Matrix

Heatmap créé avec JMP Genomics.

Avancer face à un problème de santé publique majeur

« En maîtrisant les processus [comme la réponse immunitaire sur la durée] », explique Youssef Idaghdour, « nous devrions cerner les principaux facteurs de modulation du cours de l’infection. Il est très important de pouvoir identifier les gènes à activer ou désactiver pour limiter la multiplication du parasite. »

L’équipe examinera, par exemple, si les enfants particulièrement exposés à la maladie développent certaines résistances aux antipaludéens. Les mutations observées pourront alors être surveillées, et des stratégies seront élaborées pour déterminer les médicaments à administrer. Enfin, « si nous parvenons à identifier les enfants présentant une réponse immunitaire efficace, nous détiendrons une information extrêmement précieuse. Nous pourrons alors approfondir l’analyse et repérer, dans le système immunitaire, les cellules contenant les anticorps capables de neutraliser le parasite. À partir de là, il sera possible d’élaborer des stratégies pour mettre au point des vaccins. Un enjeu de taille puisqu’il n’existe à ce jour aucun vaccin efficace contre le paludisme. »

« Ce problème de santé publique suscite de nombreuses questions auxquelles nous essayons de trouver des réponses. »

Back to Top