Publications > Structuration de système de classification ; Découverte de motifs communs dans des applications de Traitements d’images et aide à la capitalisation de savoir-faire

Sujet

Structuration de système de classification ; Découverte de motifs communs dans des applications de Traitements d’images et aide à la capitalisation de savoir-faire

Doctorant

Nicolas Grosdenier

Mots clés

Classification, classement, Analyse de données, Modélisation, Programmation Objet, Traitement d’images, arbre des suffixes, découverte de connaissances, fouilles de données, graphes d’opérateurs

Résumé

  • Structuration de système de classification

L’analyse des méthodes de classification et de classement a permis de dresser différentes
taxonomies selon le point de vue choisi. Par exemple, les méthodes peuvent être classifiés
selon la nature des mathématiques qu’elles utilisent, de leurs types de sorties (rang, mesure ou classe), du niveau d’intervention de l’utilisateur (supervisé, automatique). Le processus de décision peut lui-même être subdivisé en étapes : étiquetage et affectation facilitant la mise en oeuvre d’options de rejets en conservant un aspect générique. Dans les stratégies multi-classifieurs, on peut distinguer la combinaison (parallélisme) de la coopération (enchaînement) de classifieurs. Il en va de même pour les nombreux critères d’évaluations de performance, les méthodes de sélection de primitives, etc.

Notre premier objectif est de tirer partie de ces différentes structurations du domaine de la
reconnaissance des formes pour bâtir un cadre logiciel (framework) facilitant l’intégration et
l’utilisation des différentes techniques. Ce cadre logiciel se présente sous la forme d’une
bibliothèque de composants orientés Objet de haut niveau. Notre second objectif fait également office de validation. Il consiste à implémenter un moteur complet de classification
de défauts dans un système de contrôle qualité i2S FlawScan déjà existant.

  • Découverte de motifs communs dans des applications de Traitements d’images et aide à la capitalisation de savoir-faire

Actuellement, il existe que quelques outils permettant de capitaliser des applications de
traitement d’images et d’en réutiliser des fragments pour faciliter la conception de nouvelles applications. En revanche, aucun outil ne s’intéresse à la découverte de connaissances à partir d’un ensemble d’applications, comme le fait l’expert pour construire son modèle en analysant, par résumé de cas, une collection d’exemples.

L’idée clé de notre approche réside dans une meilleure exploitation des données de bas
niveau que constituent les programmes de TI. En effet, les programmes encapsulent
implicitement un certain nombre de connaissances reflétant les objectifs, les contraintes,
etc. De plus, les programmes admettent des similarités structurelles représentatives des
savoir-faire utilisés lors leur écriture. Nous pensons qu’au travers de la recherche
automatique de motifs communs entre programmes et de leur analyse par l’expert, il devient possible d’une part de renforcer la base d’opérateurs par la découverte d’opérateurs de plus haut niveau, et d’autre part de renforcer la base de connaissances par le raffinement ou la découverte de nouvelles connaissances.

Dans ce contexte, nous proposons une méthode originale de découverte de régularités
structurelles entre programmes de traitement d’images. Nous adoptons le point de vue
courant en TI qui consiste à représenter les programmes sous la forme de graphes
d’opérateurs. La nature fortement séquentielle de ces graphes d’opérateurs, nous permet de les transformer en un ensemble de sous chaînes de liens entre d’opérateurs. La recherche de similarités structurelles entre graphes est ainsi équivalente à la recherche de similarités entre leurs sous chaînes. Pour mener à bien ce type de recherche, nous avons choisi d’utiliser des algorithmes spécialisés dans le traitement de données séquentielles, en particulier ceux exploitant l’arbre des suffixes. nous proposons actuellement différentes applications de l’algorithme pour la gestion d’une base de graphes d’opérateurs de TI, la recherche approchée qui permet de retrouver des graphes à partir de peu d’informations, et la mise en correspondance selon les catégories qui offre des perspectives intéressantes
pour la découverte de connaissances stratégiques.

Financement

I2S – Bourse CIFRE

publie le mercredi 30 janvier 2013