Projets > DIGIDOC

Projet ANR CONTINT, 2011-2014

Responsable

  • Coordinateur : Laboratoire LaBRI, Bordeaux
  • Responsable au L3I : Rémy Mullot et Muriel Visani

Titre complet

DIGIDOC : Document Image diGitisation with Interactive DescriptiOn Capability

Lien

Site DIGIDOC

Mots clés

Scanner cognitif, documents anciens

Résumé du projet

Le projet DIGIDOC se situe dans le contexte général de la numérisation de documents et plus précisément celui des documents précieux et anciens. Dans un contexte général où se multiplient les grands projets d’acquisition et de valorisation du patrimoine écrit, le projet DIGIDOC se focalise sur l’étape d’acquisition des images de documents pour améliorer et simplifier leur utilisation ultérieure (archivage, reconnaissance de texte, extraction de document, etc). Les coûts de numérisation et la fragilité des documents précieux rendent pratiquement impossible une deuxième numérisation, il est donc impératif de maîtriser la qualité de la numérisation en fonction de l’image. De plus, la prise en compte de l’usage des documents numérisés s’exprime nécessairement en termes de connaissances et contraintes métier.

Notre objectif est donc de conditionner la phase de production des images en considérant à la fois des connaissances a priori sur les caractéristiques des documents à numériser et des connaissances sur l’utilisation qui en sera faite. Pour cela, nous proposons d’intégrer au sein des scanners un module supplémentaire qui fournira en plus de l’image numérisée un ensemble de descripteurs de niveau intermédiaire calculés sur cette image. Ces descripteurs dédiés à l’acquisition, au stockage, à l’analyse et à l’indexation de documents numérisés devront permettre de quantifier l’adéquation entre la numérisation d’un document et son usage ultérieur. La définition d’un tel ensemble de descripteurs et son intégration dans un nouveau format de document numérisé est l’objectif central de ce projet. Ce nouveau format permettra de développer de nouveaux modes d’interaction avec les scanners ainsi que de nouveaux outils d’analyse de documents. Une première application visera à simplifier le paramétrage des scanners (numérisation et prétraitements) en déterminant de manière semi-automatique les meilleurs paramètres de réglage, réglages qui pourront alors évoluer d’une image à l’autre, voire même d’une partie d’image à une autre. Une seconde application sera d’évaluer la qualité de jeux d’images de documents obtenus lors d’anciennes campagnes de numérisation. Un élément important de ce projet est la volonté du consortium de livrer des logiciels de niveau « quasi-industriel » pour pouvoir les valoriser très rapidement.

Les objectifs de ce projet s’insèrent parfaitement dans la thématique de l’appel « Contenu et interaction » puisqu’ils visent à concevoir un nouveau format de description des contenus de documents numérisés afin de simplifier et d’améliorer leur archivage, leur traitement, leur comparaison et leur indexation. Ce projet rassemble des laboratoires de recherche (LaBRI Bordeaux, LI Tours, L3I La Rochelle, LITIS Rouen), des industriels (I2S Bordeaux, Arkhenum Bordeaux) et des utilisateurs finaux (BNF).

Début

Février 2011

Fin

Août 2014

Financement

Agence Nationale pour la Recherche (ANR, programme CONTINT)

Partenaires

  • Arkhênum
  • Bibliotheque Nationale de France (BNF)
  • i2S
  • LaBRI, Université de Bordeaux I
  • L3I, Université de La Rochelle
  • LITIS, Université de Rouen
  • LI, Université de Tours

Chercheurs associés

Rémy Mullot, Muriel Visani, Petra Gomez, Maroua Mehri, Kieu Van Cuong

Résultats

Liste des publications multipartenaires (résultant d’un travail mené en commun) :

  • 1 article de revue internationale
  • 12 articles de conférences internationales avec comité de lecture publiés
  • 2 articles de conférences nationales avec comité de lecture publiés (+1 soumis)

Création et mise à disposition de la communauté de bases de documents :

  • base benchmark de documents présentant différents types de difficultés pour les OCRs
  • bases semi-synthétiques pour l’évaluation des algorithmes d’analyse et de reconnaissance d’images de documents

Briques logicielles :

  • Modélisation de défauts fréquemment rencontrés dans des documents anciens
  • Classification de fragments d’images
  • Extraction d’indices de la qualité des OCR
publie le mercredi 27 janvier 2016