Objectifs scientifiques > Verrous scientifiques
Nous avons identifié quatre verrous scientifiques:
- Extraction d’informations dans des contextes complexes, multi-source, dégradés ou fortement déstructurés. En effet, l’acquisition des données dans le cas spécifique d’observation de scènes complexes et/ou dynamiques introduisent des difficultés supplémentaires : suivi multi-cibles avec occultations, analyse de séquence d’images, répartition de données très faiblement structurées (image) dans un espace fortement structuré (document), fusion d’information et association de données, prise en compte du contexte de la scène et des comportements complexes des objets, interactions avec l’environnement et/ou l’utilisateur, … Ces contextes soulignent les contraintes à imposer aux systèmes : acquisition multi-capteurs, présence ou absence de marqueur, prise en compte des spécificités de différents domaines d’expertises.
- Gestion de la complexité pour le passage à l’échelle (grand volume). La problématique liée au passage à l’échelle est double : multiplication des enregistrements considérés d’une part, et multiplication des attributs associés à ces enregistrements d’autre part. Tandis que la multiplication des enregistrements impose la conception de méthodes efficaces et robustes pour indexer et structurer ces masses de données comme préalable à la recherche d’information, la multiplication des attributs pose le problème de la malédiction de la dimensionnalité (liés au fait que les espaces en grandes dimensions sont presque vides). Ce problème se retrouve en aval de l’extraction de signatures, lors des phases d’indexation puis d’analyse ou de recherche d’image et nous impose de concevoir des solutions adaptées (réduction de la dimensionnalité, sélection de variables, rééchantillonnage...).
- Gestion de données numériques/logiques/« sémantiques ». La gestion mixte de données numériques / logiques/sémantiques reste un verrou sur lequel peu de propositions ont été faites dans la communauté. Si de grandes avancées ont eu lieu durant la dernière décennie sur l’expression de traitements numériques des données complexes (en particulier grâce aux équations aux dérivées partielles), peu de propositions intègrent à la fois des données numériques et logiques. Or, le niveau de structuration variable des données que manipule le laboratoire nécessite l’utilisation de méthodes hybrides tirant parti à la fois de ces approches numérique, logique et sémantique.
- Lien entre la sémantique d’un problème et les méthodes d’extraction des connaissances des données brutes. En effet, les connaissances extraites automatiquement depuis les données complexes restent généralement d’un niveau sémantique intermédiaire, en-deça du niveau sémantique des concepts de haut niveau sémantiques manipulée par l’utilisateur. Plus classiquement appelé « fossé sémantique », le lien n’existe pas à ce jour sauf dans le cas de problématiques très spécifiques pour lesquelles la formalisation de l’expertise reste simplifiée. Une extension de l’approche à des domaines d’expression de connaissances métier (expertes) plus larges en relation avec des données complexes (images, image de documents) reste un problème scientifique ouvert.
publie le dimars 17 de mai de 2011