Thèses proposées > Proposition de thèse (2011)
Sujet de la thèse :
Modèle de dégradation d’images de documents anciens pour la génération de données synthétiques et analyse de complexité des bases d’images.
Mots clés :
Analyse d’images de documents anciens, génération d’images synthétiques, indicateurs de complexité des bases d’images.
Descriptif :
La thèse proposée s’effectuera dans le cadre de l’ANR Digidoc (Document Image diGitisation with Interactive DescriptiOn Capability du programme « Contenu et interaction», 2011-2014). Ce projet national, financé par le ministère, regroupe plusieurs partenaires publiques et privés : LABRI, LI Tours, LIRIS, LITIS, L3I, BNF, Arkhenum, I2S. Il se situe dans le contexte général de la numérisation notamment de documents précieux et anciens (valorisation du patrimoine écrit).
Les nombreuses campagnes de numérisation de documents patrimoniaux mises en place ces dernières années ont permis de constituer, un peu partout dans le monde, des entrepôts de données présentés sous la forme de collection d’images. Cette numérisation
massive de documents soulève une problématique liée à l’indexation de grosses quantités d’images.
Cette masse de documents constitue le plus souvent une simple version numérique des ouvrages originaux. En effet, rares sont les images ayant été enrichies de méta-données.
Ainsi, on ne dispose pas à ce jour d’une base annotée qui soit commune à l’ensemble de la communauté. Les méthodes proposées dans la littérature sont généralement testées sur des bases dont quelques exemplaires sont annotés manuellement.
Quelques équipes de recherche appartenant notamment à la communauté scientifique liée à l’analyse et la reconnaissance de symboles graphiques ont d’ores et déjà adopté l’utilisation de bases synthétiques pour une évaluation fine des performances de leurs
méthodes. L’avantage des bases synthétiques est en effet double.
Premièrement, c’est le seul moyen de tester les méthodes proposées sur des images synthétiques dont on maîtrise quantitativement et qualitativement tous les paramètres de génération (type de bruit,
type d’arrière plan, nombre de couleurs, type de courbure et l’inclinaison, résolution, ...).
Deuxièmement, cela permet de s’affranchir de la subjectivité qu’induirait une étape d’évaluation réalisée sur des données annotées manuellement (subjectivité d’autant plus problématique que cette annotation est le plus souvent réalisée par l’auteur de la méthode
lui-même). Ce module permettra de générer un grand nombre de documents au contenu extrêmement varié et totalement contrôlé tout en diminuant significativement l’intervention d’un opérateur humain dans le processus d’évaluation.
Enjeux scientifiques et objectifs de la thèse:
Nous souhaitons donc mener à bien des travaux scientifiques permettant la mise en place d’une plateforme dédiée à la génération d’images synthétiques de documents anciens. Ce
logiciel intégrera des modèles de dégradation (encre, fond, papier,...) permettant de générer des images de documents les plus visuellement crédibles possible. L’ambition est de pouvoir, en s’aidant de l’observation des données réelles issues des bases d’images
naturelles, simuler l’apparition de l’encre du recto sur le verso, l’érosion de caractères, l’apparition de pliures ou de trous, ...
Les enjeux scientifiques liés à la mise en place d’une telle plate-forme sont triples :
- Proposer des modèles de déformation permettant, sur la base d’exemples réels, de reproduire à volonté divers défauts.
- Proposer des métriques permettant de mesurer la complexité de la base ainsi générée :
a) Vis-à-vis de l’objectif de l’étude (classification, indexation…)
b) D’une manière plus générale, être capable de quantifier la complexité d’une base d’images synthétiques ou naturelles à partir d’indices tels que le nombre d’images qu’elle contient et la variabilité de celles-ci, dans un contexte plus général d’analyse d’images - Proposer un ensemble de fonctionnalités permettant à un utilisateur
a) d’alimenter le système afin qu’il puisse intégrer de nouveaux exemples de documents (comment apprendre une nouvelle fonte, une nouvelle mise en page,...)
b) de pouvoir générer de grosses quantités de documents synthétiques "à la carte".
Laboratoires et équipes de recherche :
L’encadrement sera réalisé conjointement par le LaBRI de Bordeaux (équipe Image et Son) et le L3I de La Rochelle.
Direction scientifique :
– Domenger Jean Philippe
– Visani Muriel
– Mullot Remy
– Journet nicholas
Modalités de la thèse :
- Contrat plein-temps de 3 ans, à partir de septembre 2011
- Salaire : environ 1700€ bruts / mois
Compétences souhaitées :
- Le candidat doit avoir un niveau Master en Informatique ;
- De bonnes capacités de communication avec un niveau de français et d’anglais
corrects sont nécessaires. - Une expérience en reconnaissance de formes et/ou analyse d’images est souhaitée;
- Une expérience en apprentissage et des bases en statistiques serait un plus ;
Comment candidater :
- Envoyez un CV détaillé, une lettre de motivation et des lettres de recommandation
à l’ensemble des encadrants (par courriel). - Date limite de candidature : 1er juin 2011
Références bibliographiques en relation avec ce sujet de thèse :
[1] N. Journet, A. Vialard, J.P. Domenger. Analyse de fontes anciennes : de la génération
de données synthétiques à la reconnaissance. Colloque International Francophone sur
l’Ecrit et le Document (CIFED2010), Tunisie (2010).
[2] R.F. Moghaddam, M. Cheriet, “Low quality document image modeling and
enhancement”, Int. J. Doc. Anal. Recognit, vol 11(4), pp. 183-201, Mars 2009.
[3] H.S. Baird, “The State of the Art of Document Image Degradation Modeling”, Proc. of 4
th IAPR International Workshop on Document Analysis Systems, pp 1-6, 2000.
[4]Rao, Srihari, Zhu, and Zhang, A method for measuring the complexity of image database
s. IEEE Transactions on Multimedia, vol. 4, n.2, Juin 2002, pp. 160173
[5] Valveny, E., Tabbone, S., Terrades, O.R., Philippot, E.: Performance characterization
of shape descriptors for symbol representation. In: Liu, W., Lladós, J., Ogier, J.-M. (eds.)
Graphics Recognition. Recent Advances and New Opportunities. LNCS vol. 5046, pp. 278–
287. Springer (2008).
[6] M. Visani, O. Terrades, S. Tabbone, “A protocol to characterize the descriptive power
and the complementarity of shape descriptors”, International Journal on Document
Analysis and Recognition, ISSN 1433-2833, pp. 1-14, Septembre 2010.