Proposition d’un projet de fin d’études
Intitulé : Conception d’une plateforme de traitement d’images pour les documents anciens
Directeur de mémoire: Mr Abdenour SEHAD, Ecole Nationale d’Informatique, Oued Smar,
Co-directeur de mémoire : Prof. Youcef CHIBANI, Equipe de Traitement Automatique de Document, Département Télécommunication, Faculté d’Electronique et d’Informatique, USTHB. E-Mail : [email protected]; [email protected]
Introduction:
Les documents anciens, de part leurs valeurs et leur importance, attirent de plus en plus l’intérêt des chercheurs. Ces derniers s’intéressent à ces documents dans tous leurs aspects ; à savoir : l’archivage, l’indexation, le stockage, le traitement physique et chimique, le traitement d’images, etc.…Les documents anciens subissent des altérations très complexes de sorte que les traitements classiques des images ne suffisent toujours pas. A cela s’ajoute le problème lié à la gestion générale du document ancien qui nécessite des manipulations réduites, de grands espaces de stockage fiables et sécurisés, des outils de traitement adéquats, et des outils de recherche et d’indexations rigoureux.
Motivation :
La bibliothèque Nationale d’Algérie a engagé ces dernières années, la numérisation de documents anciens pour un meilleur accès et pour la recherche d’informations. Cette opération consiste en premier lieu, à scanner chaque page d’un document ancien pour le sauvegarder sous un format spécifique (TIFF ou JPEG..).
La consultation de ces documents soulève cependant deux problèmes majeurs. D’une part, la consultation des images documents se fait actuellement d’une manière non conviviale, rendant la lecture difficile. Le deuxième problème est la mauvaise qualité des images de documents anciens. En effet, les documents sont souvent dégradés à cause de leurs conservations (humidité, tâches de poussière, diffusion de l’encre, …).
La motivation de ce projet est la conception d’une plateforme de traitement d’images dédiée aux documents anciens pour une consultation aisée du lecteur.
Objectif :
L’objectif du projet est la conception d’une plateforme de lecture des images de documents images en utilisant les outils de traitements. On s’intéressera en particulier aux outils fondés sur l’analyse de données comme l’Analyse en Composantes Principales.
Plan de travail et échéance :
1. Etude bibliographique sur les méthodes de traitement appliquées sur les documents anciens (1 mois)
2. Implantation d’une plateforme de lecture des images documents anciens en utilisant le langage XML et C++ (2 mois).
3. Etude et évaluation de deux méthodes de restauration de documents anciens fondées sur l’Analyse en Composantes Principales et l’Analyse en Composantes Indépendantes (4 mois).
4. Rédaction et soutenance du mémoire (1 mois)