Stages Master 2 (2009) > Stage proposé n°12

Campagne 2011

Sujet Stage :

Recherche d’information par requête et navigation dans une base de données Joomla

Résumé du travail proposé :

Joomla! est un système de gestion de contenus à base d’algèbre relationnelle implantés sur une base de données MySQL. L’objectif de ce stage sera d’implémenter une nouvelle approche de recherche d’information dans Joomla intégrant requête SQL, mais aussi navigation dans l’espace de recherche sous-jacents dont les propriétés fondamentales sont celles d’un treillis de concepts.

Mots clés :

Recherche d’information, base de données, Joomela, treillis des concepts.

Informations complémentaires :

Encadrants: Christophe Demko, Karell Bertet
Axe thématique : Données complexes, Images et Documents
Axe stratégique : Pertinence Contenu-Interaction
Cadre de coopération : industriel
Date de début du stage : Avril 2011
Durée du contrat : 6 mois

Contexte de l’étude:

Joomla est un système de gestion de contenu (en anglais, CMS, pour Content Management system) Open Source distribué sous license GNU/GPL qui permet de mettre en ligne du contenu, mais également de mettre à disposition des services (forum, boutique en ligne, galerie photos, etc.), le tout sans connaissance technique particulière. Joomla! est un système de gestion de contenus à base d’algèbre relationnelle implantés sur une base de données MySQL.
Les données sont stockées sous forme base d’algèbre relationnelle implantés sur une base de données MySQL. Un des principaux atouts de Joomla réside dans la mise en place d’algorithmes efficaces de recherche d’information dans ces bases, algorithmes qui intègrent à la fois une gestion optimisée du cache, ainsi qu’une limitation du nombre d’accès aux données.
Il s’agit d’une recherche d’information classique par requête SQL dont le raffinement amène à des requêtes de plus en plus complexes. A l’inverse, la recherche d’information par navigation, où des liens de navigation sont proposés pour affiner la recherche, offre une meilleure lisibilité, mais repose sur une structure de navigation qui se doit d’être prédéfinie, pré-calculée, et donc rigide.
C’est pourquoi des techniques de recherche d’information intégrant requêtes et navigation ont fait l’objet de travaux ces dernières années.
L’équipe du LIS (Irisa, Rennes) a proposé des systèmes d’information logiques où la recherche d’information se fait à la fois par requête et par navigation [2]. Les fondements de cette approche résident sur l’exploitation de la connexion de Galois portée par toute table de données. La structure de navigation sous-jacente se définit de façon unique par un graphe, appelé treillis de Galois, ou encore treillis des concepts, qui possède la propriété de treillis et dons les nœuds sont appelés des concepts. Il s’agit là d’une structure de navigation non rigide, à la fois complète (tout noeud peut être atteint) et flexible (l’ordre de navigation importe peu) : toute requête pointe sur un nœud du treillis ; tout nœud est décrit par une requête et un ensemble d’objet maximal vérifiant la requête (réponse). Il est ainsi possible :
 d’affiner la réponse en considérant un nouveau concept successeur dans le graphe ;
 d’élargir la réponse en considérant un nouveau concept prédécesseur dans le graphe.

Figure 1: Noeud de navigation (Ferré, 2002)

Description du sujet :

L’objectif du stage sera de mettre en place une recherche d’information par requête et par navigation sous Joomla, à savoir :
 Associer à chaque requête Joomla un concept de la structure de navigation sous-jacente.
 Proposer des fonctions successeur et prédécesseur pour affiner ou élargir la réponse
Pour une meilleure efficacité, ces algorithmes devront à la fois optimiser la gestion du cache, mais aussi limiter le nombre d’accès aux données.

Pré requis et contraintes particulières :

 master informatique
 base de données relationnelles (MySQL)
 PHP

Références bibliographiques :

[2] Ferré, S. and Ridoux, O., An Introduction to Logical Information Systems, Information Processing & Management, 3(40), 383—419, 2004.

Contacts – liens :

Email : karell.bertet univ-lr.fr, christophe.demko univ-lr.fr

publie le dimecres 1r de decembre de 2010