En collaboration avec Teklia, les Archives de la Ville de Belfort ont lancé un projet pilote consistant à réaliser la transcription automatique de l'ensemble des registres de délibérations des conseils municipaux de la commune. Le projet vise à traiter automatiquement 18 500 pages de comptes rendus divers, rédigés entre 1790 et 1946, et poursuit un double objectif.

belfort
Old town - Belfort Tourism

L'Intelligence Artificielle pour permettre la recherche en plein texte

A travers ce projet innovant, Teklia déploie sa technologie d'HTR (Handwritten Text Recognition) et d'OCR (Optical Character Recognition) pour les traitements des documents numérisés.

Les délibérations du conseil municipal sont une source importante pour l'histoire de la ville. Ces documents sont constitués des textes des comptes rendus de délibérations du conseil municipal, mais aussi des listes de conseillers, des convocations ou encore des ordres du jour, établis sur plus de 150 and.

sample_registres

Les modèles HTR et OCR sont deux modèles de reconnaissances conçus respectivement pour les documents manuscrits et imprimés. Pour fonctionner correctement sur des documents historiques manuscrits, ils doivent être entraînés sur des transcriptions obtenues par l'annotation manuelle d'un échantillon de différentes pages de documents. Cet entraînement permet ensuite au modèle de traiter de nouvelles pages, de détecter les lignes de textes et d'effectuer une transcription automatique.

sample_reco
Line detection on one of the scanned pages and handwriting recognition

Une fois la transcription de l'ensemble des pages de délibérations du conseil municipal validée, celles-ci seront publiées en accès libre sur le site des Archives de la Ville, et une recherche de texte en pleine page pourra être realisée. Ainsi, chacun pourra non seulement consulter ces pages, mais sera également en measure de rechercher des information précises.

Les citoyens au coeur du processus

Au-delà de son aspect technique innovant, ce projet donne l'occasion aux citoyens de s'impliquer dans la vie locale.

La mise en place d'une campagne participative

Pour que le processus de reconnaissance d'écriture soit plus efficace, l'entraînement des modèles HTR sur des données de bonne qualité est essentiel. La collecte de ces dernières pour ce projet sera réalisée grâce à la plateforme participative Callico, sur laquelle les volontaires pourront transcrire manuellement des parties de documents, puis corriger et valider les transcriptions automatiques obtenues après entrainement des modèles.

La découverte de l'histoire de la Ville de Belfort

La vocation de ce projet est avant tout de permettre aux citoyens de, non seulement, prendre part à sa mise en oeuvre, mais surtout de découvrir le fonctionnement d'un conseil municipal, ainsi que l'évolution de la Ville de Belfort à travers les siècles.

Nous espérons que cette initiative pilote suscitera l'intérêt d'autres communes.

Responsable d'Archives municipales, si vous avez déjà numérisé les pages de délibérations du conseil municipal, confiez nous-en la transcription automatique, que les textes soient manuscrits ou bien imprimés !

Contactez-nous avec le formulaire de contact.


Crédit Photo:

Belfort Tourisme, Ville de Belfort - www.belfort-tourisme.com/