Les résultats d’une étude multicentrique, menée par Gustave Roussy et Lifen, sur l’extraction automatisée de données médicales, viennent d’être publiés cette semaine dans Annals of Oncology. Ils montrent que l’IA a surpassé l’approche manuelle sur l’ensemble des 31 variables cliniques testées, dans les 10 centres participants. Cette recherche s’inscrit dans le cadre de la cohorte LUCC (Large & Unified Cancer Cohort), une initiative France 2030 portée par Gustave Roussy et Lifen, qui regroupe près de 15 000 patients et compte une vingtaine d’établissements partenaires. L’étude a porté sur 311 patients atteints de cancer du poumon, tirés au sort parmi les 10 000 dossiers disponibles au moment de l’étude. L’essai a été mené en aveugle, avec une attribution des valeurs correcte par un professionnel senior supervisé par des oncologues en cas de divergence entre l’IA et l’approche manuelle (attachés de recherche clinique). L’IA de Lifen (issue du fine-tuning d’un modèle Mistral en open-source) a travaillé sur les mêmes documents pseudonymisés et avec les mêmes règles d’extraction que les professionnels manuels. Ces résultats valident qu’une IA peut extraire des données cliniques de manière plus fiable que des professionnels expérimentés, sur des dossiers réels et hétérogènes. L’IA réduit de moitié les erreurs par rapport à la saisie manuelle (7 contre 14,2 %) et, surtout, homogénéise les données entre établissements. Cela ouvre la voie à l’inclusion de centres plus petits dans les études multicentriques, souvent exclus faute de ressources suffisantes pour structurer leurs données.
MC d’après le communiqué de Gustave Roussy et Lifen du 19 décembre 2025.
