Projet MACADAMIA

Contexte

Environ 20 000 fœtus sont diagnostiqués avec une anomalie congénitale chaque année en France. Parmi eux, 30% bénéficient d’une évaluation diagnostique, pronostique ou d’un traitement médico-chirurgical en Ile de France, dont la moitié à l’Hôpital Necker-Enfants malades .

Les données concernant le devenir à long terme des enfants porteurs de malformations congénitales complexes sont assez limitées, et issues de petites séries, qui ne prennent souvent pas en compte la période fœtale. L’influence de la qualité de la prise en charge périnatale (anté et néonatale, médico-chirurgicale) sur le devenir à long terme des enfants (morbidité, développement psychomoteur, qualité de vie, impact sur la vie familiale) est insuffisamment évaluée, l’analyse étant souvent limitée à la mortalité et la morbidité précoces, et l’entreprise d’essais thérapeutique étant complexe en raison de la rareté des pathologies concernées.

Le développement et la possibilité d’utiliser les bases de données en périnatologie se heurtent au manque de moyens humains pour compléter les données et maintenir ces bases à jour sur le long terme. En effet, les informations cliniques pertinentes en néonatologie sont contenues dans les dossiers patients constitués principalement de documents textuels faiblement structurés comme des comptes rendus d’hospitalisation ou de consultation ce qui ne facilite pas l'extraction automatique. De plus, la collecte de données ne peut être superviée que par des opérateurs ayant des connaissances médicales voire en néonatologie compte-tenu de la spécificité des pathologies.

Objectifs du stage

L’objectif du stage est de participer au développement d’un outil d’extraction semi-automatique d’informations cliniques dans les comptes rendus patient par des méthodes de machine learning. Cet outil est développé depuis févier 2021 en collaboration entre l'Hôpital Necker et TEKLIA. Grace à une interface de validation basée sur LabelStudio et Arkindex, cet outil permet d'entraîner des modèles basés sur des technologies de traitement automatique de la langue et de machine learning capables d’extraire automatiquement des données de comptes rendus de néonatologie . L’objectif est donc de poursuivre le développement de la plateforme et l'amélioration des modèles d'extraction.

Environnement technique

  • développement logiciel sous linux en python, avec docker, git et gitlabCI, utilisation d'API Rest.
  • Machine Learning en python avec scikit-learn, spacy/flair, MLFlow

Partenaires et organisation

  • Société TEKLIA, spécialisée en intelligence artificielle pour la compréhension du langage naturel et le traitement automatique des documents : mise au point des modèles d’extraction d’information, intégration des modèles de machine learning et adaptation de la plateforme de traitement de documents pour les besoins du projet.
  • Equipe Sciences de l’information au service de la médecine personnalisée, UMRS 1138, Pr Anita Burgun : data management/integration.
  • Laboratoire de Traitement et Communication de l’Information à Telecom ParisTech, Pr Florence d’Alché-Buc (titulaire de la chaire Data Science & Artificial Intelligence for Digitalized Industry & Services) et Dr. Matthieu Labeau (MCF, spécialisé en machine learning appliqué au traitement du langage naturel)
  • Service de Médecine et Réanimation Néonatales, service d’Obstétrique et de Médecine Fœtale de l’hôpital Necker-Enfants malades et équipe PACT EHU 7328 : Pr E. Kermorvant (coordination), Pr A. Lapillonne, Pr Y. Ville, Pr L. Salomon, Dr J. Stirnemann : sélection des cohortes et des paramètres d’intérêt, analyse des données.

Conditions administratives

  • Durée : 6 mois à partir de février 2022 (date à définir à la signature de la convention)
  • Encadrement scientifique : Dr. Christopher Kermorvant (TEKLIA), Pr. Florence d'Alché-Buc , Dr. Matthieu Labeau (Telecom ParisTech), Pr. Elsa Kermorvant (APHP)
  • Etablissement d'accueil : Université de Paris
  • Gratification : 1000 euros nets par mois.
  • Lieux de travail : TEKLIA Paris, Université de Paris (hôpital Necker), télétravail partiel possible.