Présentation
Depuis les années 1970, la génétique a profondément renouvelé la manière de comprendre et pratiquer la médecine. Elle participe à une transformation du soin et de la prévention, mais aussi à une reconfiguration de l’organisation de la médecine (autour de Plateformes telles qu’Auragen ou Sequoia dans le cadre de Plan France génomique, impliquant des collaborations entre instituts, hôpitaux, biotechs, consortiums, biobanques) justifiée au nom d’une modernité thérapeutique d’État caractérisée par une montée en puissance de la médecine des preuves et de l’intelligence artificielle, une bioéconomie et une éthique procédurale.
Cette transformation ne résulte pas seulement d’un déploiement de connaissances biologiques nouvelles, mais aussi de la mise en œuvre de méthodes, structures et projets de recherche, où les flux de données – big data jouent un rôle structurant. Largement portée par la rhétorique de la promesse technoscientifique, la montée en puissance de la génomique tend néanmoins à rendre invisible le travail de valorisation des données génétiques pour mettre en lumière seulement leur fonction informative et prédictive en tant que données scientifiques et produire ainsi une illusion d’objectivité de l’information portée par la donnée. Ainsi l’OCDE définit les données scientifiques ou research data comme « des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. » (Principes et lignes directrices pour l’accès aux données de la recherche financée sur fonds public. Voir : OCDE 2007). En étudiant le cas des données génétiques, cette session analyse et critique précisément le statut « factuel » et la fonction de « source » pour la recherche scientifique, en montrant comment elles sont construites.
En effet, la génétique humaine fabrique les données en conjuguant deux types d’opérations. D’une part, elle obtient ces données grâce au recueil de matériel biologique auprès des individus avec leur consentement éclairé, le séquençage à haut débit du génome, le stockage dans des banques de données, le traitement bio-informatique par analyses statistiques. D’autre part, elle cible et recherche ces données dans le cadre d’un travail épidémiologique et clinique contextualisé qui conduit à classifier les résultats selon trois types (données primaires, secondaires, accidentelles), qui seul permet de conférer à la donnée génétique sa valeur d’information et de critère de décision. Cette double opération s’effectue à travers une organisation complexe d’acteurs (patients, médecins, chercheurs, associations, instituts, hôpitaux, biotechs, consortiums, biobanques, État, Europe) qui alternent des régimes de gratuité et des logiques de capitalisation, en créant de l’anonymat, en garantissant la continuité et la massification des dons, en stockant, agrégeant, analysant, distribuant et recevant. Or l’invisibilisation des processus de construction des données génétiques crée un décalage entre les représentations citoyennes, la réalité du travail scientifique et les enjeux scientifiques embarqués par les données génétiques.