@meanymooCC BY-NC-ND
Richard Frontière, Université de Californie, Los Angeles et Noé Zaitlen, Université de Californie, Los Angeles
L’idée que la corrélation n’implique pas la causalité est une mise en garde fondamentale dans la recherche épidémiologique. Un exemple classique implique un lien hypothétique entre les ventes de crème glacée et les noyades – au lieu d’une consommation accrue de crème glacée provoquant la noyade de plus de personnes, il est plausible qu’une troisième variable, le temps estival, augmente l’appétit pour la crème glacée et la natation, et donc les opportunités pour noyer.
Mais qu’en est-il des corrélations impliquant des gènes ? Comment les chercheurs peuvent-ils être sûrs qu’un trait ou une maladie en particulier est vraiment génétiquement lié et non causé par quelque chose d’autre ?
Nous sommes des généticiens statistiques qui étudions les facteurs génétiques et non génétiques qui influencent la variation humaine. Dans nos recherches récemment publiées, nous avons constaté que les liens génétiques entre les traits trouvés dans de nombreuses études pourraient ne pas être liés du tout par des gènes. Au lieu de cela, beaucoup sont le résultat de la façon dont les humains s’accouplent.
Des études d’association à l’échelle du génome tentent de lier les gènes aux traits
Étant donné que les gènes que vous héritez de vos parents restent inchangés tout au long de votre vie, à de rares exceptions près, il est logique de supposer qu’il existe une relation causale entre certains traits que vous avez et votre génétique.
Cette logique est à la base des études d’association à l’échelle du génome, ou GWAS. Ces études recueillent l’ADN de nombreuses personnes pour identifier les positions dans le génome qui pourraient être corrélées avec un trait d’intérêt. Par exemple, si vous avez certaines formes de BRCA1 et BRCA2 gènes, vous pouvez avoir un risque accru de certains types de cancer.
De même, il peut y avoir des variantes génétiques qui jouent un rôle dans le fait qu’une personne soit ou non atteinte de schizophrénie. L’espoir est d’apprendre quelque chose sur les mécanismes complexes qui lient la variation au niveau moléculaire aux différences individuelles. Avec une meilleure compréhension de la base génétique des différents traits, les scientifiques seraient mieux en mesure de déterminer les facteurs de risque des maladies apparentées.
Les chercheurs ont exécuté des milliers de GWAS à ce jour, identifiant des variantes génétiques associées à une myriade de maladies et de traits liés à la maladie. Dans de nombreux cas, les chercheurs ont identifié des variantes génétiques qui affectent plus d’un trait. Cette forme de chevauchement biologique, dans laquelle on pense que les mêmes gènes influencent plusieurs traits apparemment sans rapport, est connue sous le nom de pléiotropie. Par exemple, certaines variantes du HAP peut avoir plusieurs effets distincts, notamment modifier la pigmentation de la peau et provoquer des convulsions.
L’analyse de corrélation génétique est l’une des façons dont les scientifiques évaluent la pléiotropie. Ici, les généticiens étudient si les gènes associés à un trait donné sont associés à d’autres traits ou maladies en analysant statistiquement de grands échantillons de données génétiques. Au cours de la dernière décennie, l’analyse de corrélation génétique est devenue la principale méthode d’évaluation de la pléiotropie potentielle dans des domaines aussi divers que la médecine interne, les sciences sociales et la psychiatrie.
Les scientifiques utilisent les résultats des analyses de corrélation génétique pour déterminer les causes communes potentielles de ces traits. Par exemple, si les gènes associés aux troubles bipolaires
prédisent également les troubles anxieux, peut-être que les deux conditions peuvent impliquer partiellement certains des mêmes circuits neuronaux ou répondre à des traitements similaires.
Accouplement assorti et corrélation génétique
Cependant, ce n’est pas parce qu’un gène est corrélé à deux traits ou plus qu’il en est nécessairement la cause.
Pratiquement toutes les méthodes statistiques que les chercheurs utilisent couramment pour évaluer les corrélations génétiques supposent que l’accouplement est aléatoire. Autrement dit, ils supposent que les partenaires d’accouplement potentiels décident avec qui ils auront des enfants en fonction d’un lancer de dés. En réalité, de nombreux facteurs influencent probablement qui s’accouple avec qui. L’exemple le plus simple en est la géographie – les personnes vivant dans différentes parties du monde sont moins susceptibles de se retrouver ensemble que les personnes vivant à proximité.
Nous voulions savoir dans quelle mesure l’hypothèse d’un accouplement aléatoire affecte la précision des analyses de corrélation génétique. En particulier, nous nous sommes concentrés sur les effets de confusion potentiels de l’accouplement assorti, ou sur la façon dont les gens ont tendance à s’accoupler avec ceux qui partagent des caractéristiques similaires avec eux. L’accouplement assorti est un phénomène largement documenté observé à travers un large éventail de traits, d’intérêts, de mesures et de facteurs sociaux, y compris la taille, l’éducation et les conditions psychiatriques.
Dans notre étude, nous avons examiné l’accouplement assorti entre traits, dans lequel les personnes ayant un trait (par exemple, être grand) ont tendance à s’accoupler avec des personnes ayant un trait complètement différent (par exemple, être riches). À partir de notre base de données de 413 980 paires de partenaires au Royaume-Uni et au Danemark, nous avons trouvé des preuves d’accouplements croisés pour de nombreux traits – par exemple, le temps passé par un individu dans l’enseignement formel était corrélé non seulement avec le niveau d’instruction de son compagnon, mais aussi avec de nombreux d’autres caractéristiques, y compris la taille, les habitudes tabagiques et le risque de différentes maladies.
Nous avons constaté que la prise en compte des similitudes entre les partenaires pouvait fortement prédire quels traits seraient considérés comme génétiquement liés. En d’autres termes, en se basant uniquement sur le nombre de caractéristiques partagées par une paire de partenaires, nous pourrions identifier environ 75% des liens génétiques présumés entre ces traits – le tout sans échantillonner d’ADN.
La corrélation génétique n’implique pas la causalité
L’accouplement assorti entre traits façonne le génome. Si les personnes ayant un trait héréditaire ont tendance à s’accoupler avec des personnes ayant un autre trait héréditaire, alors ces deux caractéristiques distinctes deviendront génétiquement corrélées l’une à l’autre dans les générations suivantes. Cela se produira indépendamment du fait que ces traits soient vraiment génétiquement liés les uns aux autres.
L’accouplement assorti entre traits signifie que les gènes dont vous héritez d’un parent seront corrélés avec ceux que vous héritez de l’autre. La façon dont les gens s’accouplent n’est pas aléatoire, ce qui viole l’hypothèse clé derrière les analyses de corrélation génétique. Cela gonfle l’association génétique entre des traits qui ne sont pas vraiment liés entre eux par des gènes.

Aaqilah MCC BY-NC-ND
Des études récentes corroborent nos conclusions. Plus tôt cette année, les chercheurs ont calculé les corrélations génétiques en utilisant une méthode qui examine l’association entre les traits et les gènes des frères et sœurs. Les liens génétiques entre les caractères influencés par l’accouplement assorti entre caractères croisés ont été considérablement affaiblis.
Mais sans tenir compte de l’accouplement assorti de caractères croisés, l’utilisation d’estimations de corrélation génétique pour étudier les voies biologiques à l’origine de la maladie peut être trompeuse. Les gènes qui n’affectent qu’un seul trait sembleront influencer plusieurs conditions différentes. Par exemple, un test génétique conçu pour évaluer le risque d’une maladie peut détecter à tort la vulnérabilité à un grand nombre de conditions non liées.
La capacité de mesurer la variation entre les individus au niveau génétique et moléculaire est vraiment un exploit de la science moderne. Cependant, l’épidémiologie génétique reste une entreprise d’observation, soumise aux mêmes mises en garde et défis auxquels sont confrontées d’autres formes de recherche non expérimentale. Bien que nos résultats ne négligent pas toutes les recherches en épidémiologie génétique, il sera essentiel de comprendre ce que les études génétiques mesurent réellement pour traduire les résultats de la recherche en de nouvelles façons de traiter et d’évaluer la maladie.
Richard Border, chercheur postdoctoral en génétique statistique, Université de Californie, Los Angeles et Noah Zaitlen, professeur de neurologie et de génétique humaine, Université de Californie, Los Angeles
Cet article est republié de The Conversation sous une licence Creative Commons. Lire l’article d’origine.