Stages Master 2 (2009) > Stage proposé n°16
Sujet Stage :
Négociation automatique entre agents spécialisés texte et image pour la recherche de documents riches.
Résumé du travail proposé :
La récupération d’informations sur Internet devient de plus en plus complexe vue la nature distribuée des informations et leur nombre de plus en plus important. Dans des travaux précédents, nous avons proposé d’utiliser des agents mobiles (inspirés des colonies de fourmis) pour parcourir le réseau et collecter les informations soit texte, soit image de manière séparée. Dans ce stage, on se propose, d’étudier les possibilités de coopération d’agents faisant des recherches sur un même concept mais sur des types de données différents (images, musique, vidéos, textes, etc.). L’idées sous-jacente et que si l’un des agents est mieux informé sur un concept, dans son référentiel (texte ou image), il pourrait en faire profiter l’autre agent de manière à accélérer ses performance en apprentissage.
Mots clés :
Systèmes multi-agents, indexation de données multi-media par le contenu, apprentissage actif et distribué, ant colonie optimization
Informations complémentaires :
Encadrants: M.H. Verrons et A. Revel
Axe thématique : Systèmes interactifs et image
Axe stratégique : Pertinence Contenu-Interaction
Cadre de coopération :éventuellement => international, industriel, ..
Date de début du stage : Février 2011
Durée du contrat : 5 mois
Contexte de l’étude:
Dans sa thèse, D.Picard, co-encadré par M.Cord et A.Revel, a développé un système multi-agents pour la recherche d’images dans des bases de données distribuées sur un réseau. De son coté, M-.H. Verrons a développé des travaux autour de la négociation de contrats entre agents. Le contexte de ce stage se situe donc à l’intersection de ces 2 thèmes : l’idée est de faire collaborer de manière dynamique des agents de recherche spécialisés afin d’améliorer les performances de recherche.
Description du sujet :
L’idée majeure de ce projet est de mettre en place un système de négociation entre agents de recherches utilisant des modalités différentes (texte ou image). L’enjeu principal est de pouvoir créer une synergie entre les agents afin d’accélérer la recherche d’informations :
1- au niveau de l’individu au cours d’une session de recherche et entre ces sessions
2- au niveau d’un groupe d’individus recherchant le même concept
Considérons par exemple une base de données contenant des documents riches possédants des attributs à la fois image et texte. Chaque agent de recherche ne voit donc de ces données que la partie pour laquelle il est spécialiste (texte ou image). Les moteurs de recherche image actuels tels que Google Image s’appuient principalement sur les méta-données associées aux images sans puiser dans les caractéristiques images. Leurs résultats sont souvent très vagues par rapport au concept précis que peut rechercher un utilisateur.
Dans ce stage, on considère que nous disposons d’agents spécialisés sur le texte ou l’image apprenant à raffiner progressivement leur recherche par interaction avec l’utilisateur (bouclage de pertinence). Pour ce faire, les agents effectuent un classement des résultats de recherche trouvés sur les bases distantes en fonction d’un critère de pertinence par rapport au modèle estimé de la catégorie recherchée. Ce classement est ensuite soumis à l’utilisateur qui peut annoter positivement ou négativement les résultats, ce qui permet aux agents de raffiner leur mesure de pertinence.
Dans le cas où 2 agents utilisent des modalités distinctes sur les mêmes données, chacun va pouvoir proposer un classement différent. Dans le projet, on aimerait introduire une capacité de négociation des agents au niveau de l’étape de classement afin qu’ils puissent "se mettre d’accord" sur une liste consensuelle à présenter à l’utilisateur. Ainsi, on pourrait tenir compte, dans une modalité, d’éléments pouvant être intéressant selon la seconde modalité. Cette technique est à rapprocher des systèmes d’apprentissage semi-supervisés, qui cherchent à trouver un classifieur qui soit bon au niveau de la base d’apprentissage mais qui ait aussi de bonnes capacités de généralisation.
Pré requis et contraintes particulières :
Formation en informatique.
Bonnes connaissances en Java nécessaires. Connaissances de plateformes de développement multi-agent appréciées…
Références bibliographiques :
M-.H. Verrons, GeNCA : un modèle général de négociation de contrats entre agents, Thèse de l’université des sciences et technologies de Lille - nov. 2004
D. Picard, Recherche d’images sur un réseau à l’aide d’un système multi-agents, Thèse de l’Université de Cergy-Pontoise - déc. 2008
Chapelle, O., B. Schölkopf and A. Zien: Semi-Supervised Learning. MIT Press, Cambridge, MA (2006).