Proposition de sujet de PFE
Titre : Recherche d’information dans une base d’images de documents manuscrits numérisés
La préservation du patrimoine culturel a depuis fort longtemps imposé une certaine limitation des accès aux biens. L’évolution des technologies numériques permet d’envisager aujourd’hui des campagnes de numérisation des collections à grande échelle. Pour le grand public, il deviendra dès lors possible dans un avenir proche d’accéder aux fonds numérisés dans un but de consultation d’archives ou de parcours culturel. Pour un public de spécialistes, la numérisation facilitera également l’accès aux archives. Ces orientations font émerger de nouvelles problématiques en ce qui concerne l’indexation des biens numérisés, la réutilisation des contenus, l’interopérabilité, la certification, etc.
Dans ce sujet, nous nous intéressons plus particulièrement à la problématique de navigation et d’accès à des collections de documents manuscrits. Naturellement, s’agissant de numérisation du patrimoine, les données initiales sont constituées d’images numérisées de documents manuscrits. Pour ces documents on peut globalement distinguer deux types d’utilisation auxquels on peut associer des requêtes de nature très différente : Les archives de documents manuscrits peuvent être vues sous l’angle de leurs contenus textuels ou de leurs contenus graphique. Pour notre cas, nous considérons les documents manuscrits numérisés de point de vue de leurs contenus textuel et nous nous intéressons à la problématique de recherche d’information dans ces documents.
Travail à faire :
1. Faire une étude bibliographique sur la numérisation des documents manuscrits anciens.
2. Etudier et citer les approches développées pour l’accès à ces documents (reconnaissance de caractères OCR, Technique de segmentation « Word spotinge »,…)
3. Développer une application qui permettra d’interroger une base d’images de documents manuscrits numérisés et de sélectionner les documents pertinents.
Pour plus de détail contacter : [email protected]