PreciDIAB

Prof. Inga Prokopenko

Prof. Inga Prokopenko, PhD, directrice du département Statistique Multi-Omics de l’Université de Surrey, chercheuse associée à l’Université de Lille, et responsable du projet « études des liens entre diabètes et risques de cancers » au sein du Centre National PreciDIAB.

Aujourd’hui, le Professeur Inga Prokopenko nous parle de ses projets de recherche au sein de PreciDIAB et de la randomisation mendélienne qui pourrait changer le monde la recherche en génétique humaine.

Retrouvez l’interview complète en anglais ici

“Avant d’aborder votre sujet de recherche sur l’étude des liens causaux entre diabètes et cancers par la méthode dite de randomisation mendélienne, pourriez-vous nous expliquer ce qui vous a conduit vers ce domaine de recherche si particulier ?”

Ma décision de travailler dans le domaine de la génétique date de l’école secondaire, époque à laquelle j’ai découvert la beauté mathématique des lois de Mendel (NB : lois qui gouvernent l’hérédité). J’ai été littéralement fascinée par les connaissances interdisciplinaires requises pour mener à bien les recherches sur la génétique humaine.

Après un Master en Biologie et Chimie, spécialité Génétique Humaine en Ukraine, j’ai réalisé ma thèse à Pavia en Italie lors de laquelle j’ai contribué à plusieurs travaux dont l’étude de pathologies communes dans des populations isolées comme en Sardaigne, et l’étude de formes familiales de sclérose en plaques qui nécessite des tests statistiques spécifiques . Par la suite, au sein de l’entreprise GlaxoSmithKline R&D, j’ai étudié les liens entre la psychiatrie et la génétique. Pour la première fois, j’ai réalisé des cartographies génétiques détaillées à très large échelle (plusieurs milliers de personnes avec et sans dépression) qui ont conduit à l’une des toutes premières études multi-métaboliques sur le lien entre dépression et niveau sanguin d’insuline. En tant que statisticienne spécialisée en génétique, je savais au fond de moi-même que ce domaine d’expertise été en train d’apporter des avancées inestimables pour la recherche génétique de demain.

J’ai ensuite poursuivi avec un postdoctorat à l’Université d’Oxford sur des études à large échelle de susceptibilité génétique au diabète de type 2. Au sein du consortium mondial MAGIC nous avons mis en place une approche innovante pour permettre l’évaluation quantitative de traits liés au risque de survenue de diabète de type 2 (comme par exemple la glycémie) par des études d’association pangénomique. Ma première publication de ce type dans Nature Genetics a démontré une association entre un variant du gène d’un récepteur à la mélatonine (MTNR1B), hormone clé du sommeil, et la variabilité de la glycémie à jeun chez une population non-diabétique. Nous avons ainsi révélé pour la 1ère fois le lien entre le rythme circadien et diabète de type 2, sous-tendant un nombre important de dysfonctions métaboliques, et ouvrant ainsi la voie à de nombreuses études complémentaires.

J’ai ensuite obtenu un poste de chercheuse en génétique humaine à l’Imperial College de Londres puis, depuis 2019, je suis Professeur à l’Université de Surrey, directrice d’un département de statistique spécialisé dans les analyses multi-omiques (génomiques, métabolomiques…) et je suis fière d’être aussi chercheuse associée de l’Université de Lille au sein du programme PreciDIAB. Depuis août 2021, je suis également co-directrice de l’Institut « People-Centered AI Institut » de l’Université de Surrey portant sur le développement de l’intelligence artificielle dans les maladies cardiométaboliques. Mon domaine de recherche est en pleine effervescence au niveau mondial et je participe activement à plusieurs consortia internationaux (DIAGRAM, MAGIC, EGG GWAS, European Human Exposome network EU H2020 program).

“Pouvez-vous nous expliquer en quoi consiste les analyses par randomisation mendélienne et en quoi cette méthode est une réelle avancée pour la recherche en génétique humaine ?”

Ma recherche est centrée sur le développement de méthodes d’analyses des données multi-omiques multidimensionnelles et leurs applications à de grand ensemble de données par des approches innovantes utilisant « l’apprentissage machine » (deep learning en anglais) et l’intelligence artificielle. Concrètement, l’objectif est d’améliorer la caractérisation et l’évaluation des trajectoires des maladies humaines tout au long de la vie afin d’améliorer leurs préventions et leurs suivis, tout particulièrement dans le domaine des maladies métaboliques, des diabètes et de leurs comorbidités telles que les cancers ou les traits psychiatriques.

Pour cela, nous utilisons la méthode innovante de randomisation mendélienne qui permet d’étudier les liens de causalités entre des expositions (obésité ou adiposité par exemple) et leurs effets sur des traits complexes et leurs phénotypes (cancer du sein par exemple). Cette méthode définie un cadre théorique permettant l’évaluation des relations causales à partir d’études observationnelles utilisant les variants génétiques comme variables instrumentales. Postulant la distribution aléatoire des variants génétiques au sein de la population, la randomisation mendélienne nous permet de mimer sur nos bases de données le même principe que la randomisation lors des essais cliniques (méthode qui attribue au hasard le médicament supposé actif ou le placebo dans une étude médicamenteuse). Lorsque les variants génétiques sont associés à des expositions, ils peuvent représenter des « instruments génétiques ». La présence de mutations de l’ADN peut être associée par exemple à la fréquence de cancer du sein, uniquement par leurs effets sur l’obésité sans corrélation avec d’autres facteurs dits de confusion car faussement associés à la maladie. Nous avons par exemple utilisé les variants du locus FTO (associé au risque d’obésité) comme instrument pour démontrer l’effet causal de l’adiposité sur la résistance à l’insuline chez des personnes non diabétiques (Fall et al., PLOS Medicine, 2013)1.

Récemment, les scores de risques polygénétiques (NB : prise en compte de l’ensemble des variants génétiques combinés) ont également été utilisés comme de puissants instruments sur de nombreuses questions étiologiques, comme par exemple l’étude du lien causal entre l’adiposité et de multiples complications cardiovasculaires.

“Cette méthode ouvre donc de nouvelles perspectives dans la compréhension des liens causaux entre la génétique et de multiples facteurs. Comment allez-vous appliquer cela dans PreciDIAB et quelles sont les retombées attendues de vos projets ?”

Au sein de PreciDIAB, je suis responsable de la tâche sur l’étude des marqueurs de risque entre diabètes et cancers . Deux étudiants en thèse, Jared Gichohi Maina et Vincent Pascat, travaillent conjointement avec moi sur les analyses des liens génétiques entre les maladies métaboliques et les cancers (pancréatiques, colorectaux, du sein et prostatiques en particulier).

De plus en plus de preuves observationnelles et expérimentales suggèrent que le diabète, l’obésité et les cancers pourraient partager des voies biologiques identiques au cours de leur développement pathologique. Pour élucider les composantes génétiques communes entre ces pathologies et établir les facteurs de risque génétiques causaux, nous combinons l’analyse globale des scores de risques polygénétiques avec le regroupement hiérarchisé des effets des variants génétiques. Cette approche est couplée à la randomisation mendélienne ainsi qu’à des études d’associations pangénomiques multi-phénotypiques (MPGWAS, prenant en compte simultanément de nombreuses variables cliniques et biologiques) afin d’augmenter fortement la puissance de nos résultats et permettre la détection de variants communs entre les comorbidités. De la même manière, nous étudions les relations entre les métabolites sanguins, le diabètes et les cancers.
Au sein de PreciDIAB, mes travaux ont déjà conduit à la publication de 4 articles dont un paru dans Nature Communication 4,5,6,7

Ces analyses multi-facteurs sont complexes mais extrêmement passionnantes car elles visent à répondre à de grandes questions de santé publique afin de mieux comprendre les comorbidités entre les pathologies et ainsi développer une prise en charge médicale plus personnalisée et prédictive du risque de complications.

References

  1. Fall, T. et al. The role of adiposity in cardiometabolic traits: a Mendelian randomization analysis. PLoS Med 10, e1001474 (2013).
  2. Fall, T. et al. Age- and sex-specific causal effects of adiposity on cardiovascular risk factors. Diabetes 64, 1841-52 (2015).
  3. Hagg, S. et al. Adiposity as a cause of cardiovascular disease: a Mendelian randomization study. Int J Epidemiol 44, 578-86 (2015).
  4. Lagou V, […], et al. Sex-dimorphic genetic effects and novel loci for fasting glucose and insulin variability. Nat Commun. 12(1):24 (2021).
    doi: 10.1038/s41467-020-19366-9.
  5. Balkhiyarova Z, et al. Relationship between glucose homeostasis and obesity in early life-A study of Italian children and adolescents. Hum Mol Genet. ddab287 (2021)
  6. Nouwen A, et al. Measurement invariance testing of the patient health questionnaire-9 (PHQ-9) across people with and without diabetes mellitus from the NHANES, EMHS and UK Biobank datasets. J Affect Disord. 292:311-318 (2021)
  7. Rayevsky A, et al. Functional Effects In Silico Prediction for Androgen Receptor Ligand-Binding Domain Novel I836S Mutation. Life. 11:659 (2021)