Actualités > Séminaire de José Guillermo Moreno Franco
José Guillermo Moreno Franco
Université de Caen
Le 09/04/2015 à 15h30, salle 018, RDC bâtiment PASCAL, Pôle Sciences et Technologie, Université de La Rochelle.
Titre : Regroupement des résultats Web : une approche textuelle
Résumé : Cet exposé s’intéresse à l’analyse et au regroupement des documents Web obtenus à partir d’une requête. Nous présenterons nos méthodes permettant d’extraire les intentions implicites d’une requête Web à partir de la représentation et du regroupement de mots. Ces méthodes ont été validées avec des expériences dans lesquelles de nombreuses caractéristiques sont évaluées. Premièrement, la qualité de regroupement est évaluée en utilisant à la fois des métriques d’évaluation classiques, mais aussi des métriques plus récentes. Deuxièmement, la qualité de l’étiquetage de chaque groupe de documents est évaluée pour s’assurer que toutes les intentions des requêtes sont couvertes. Finalement, nous évaluons nos méthodes dans un cadre applicatif, celui de la recherche d’images Web sur des smartphones. Notre algorithme, Dual $C$-means, basé sur des mesures d’association lexical est capable à la fois de regrouper correctement les documents Web, de sélectionner des étiquettes appropriées pour chaque groupe mais aussi de présenter les résultats Web dans une distribution compacte.