TEKLIA a le plaisir de vous inviter à la soutenance de thèse de Mélodie Boillet qui se déroulera le mardi 10 janvier à 14h00 dans l'amphithéâtre Sophie Germain (D) de l'UFR Sciences et Techniques, au campus du Madrillet à Saint-Étienne-du-Rouvray.
Cette thèse a été réalisée dans le cadre d'une collaboration CIFRE entre TEKLIA et l'équipe Apprentissage du LITIS (Université de Rouen-Normandie) et porte sur la "Détectiοn d'Objets dans les Dοcuments Numérisés par Réseaux de Neurοnes Prοfοnds".
La soutenance aura lieu devant un jury composé de :
- Andreas Fischer, Professeur à l'Institute of Artificial Intelligence and Complex Systems à Fribourg (Suisse), Rapporteur
- Harold Mouchère, Professeur à l'Université de Nantes, Rapporteur
- Laurence Likforman, Maître de conférences (HDR) à Télécom ParisTech, Examinatrice
- Caroline Petitjean, Professeure à l'Université de Rouen Normandie, Examinatrice
- Thierry Paquet, Professeur à l'Université de Rouen Normandie, Directeur de thèse
- Christopher Kermorvant, Président de Teklia, Co-encadrant de thèse
La soutenance publique se déroulera sous un format hybride. Les personnes qui souhaitent assister à la soutenance à distance sont invitées via le lien Zoom suivant :
Participer à la réunion Zoom:
- https://cnrs.zoom.us/j/94350259642?pwd=bHlkbHZESzVybWxVU3hBT3VaQWp0Zz09
- ID de réunion : 943 5025 9642
Merci de nous contacter à contact@teklia.com pour obtenir le code d'accès.
Vous êtes également chaleureusement conviés au pot de thèse qui suivra (salle de convivialité du LITIS, à l'Université).
Résumé
Les documents constituent un ensemble précieux d'informations souvent difficilement accessible dans leur forme originale. La transformation de ces documents en documents digitaux est désormais possible grâce à l'extraction automatique de leurs contenus. Celle-ci nécessite la détection de différents éléments tels que les lignes de texte, éléments cruciaux afin d'obtenir la transcription du texte présent dans les images.
Dans cette thèse, nous étudions différentes tâches liées à l'analyse de la mise en page de documents telles que la détection de lignes de texte, du support d'écriture, ou encore la séparation en actes. Notre objectif est de proposer des modèles permettant de détecter les objets en tenant compte des difficultés liées au traitement de documents et aux contraintes liées à leur utilisation dans un cadre industriel. Nous proposerons une étude complète de la tâche de détection d'objets dans les images de documents en analysant les annotations, différentes stratégies de sélection des données ainsi que les protocoles d'évaluation.