Actualités > Soutenance de thèse de Madame Chloé ARTAUD


 

AVIS DE PRÉSENTATION DE THÈSE EN SOUTENANCE POUR L’OBTENTION DU DIPLÔME NATIONAL DE DOCTEUR
 

 

Madame Chloé ARTAUD présentera ses travaux intitulés :

« Détection des fraudes : de l’image à la sémantique du contenu »

Spécialité : Informatique et applications
Le 6 février 2019 à 14h00

Lieu : Université de La Rochelle
Pôle Communication, Multimédia et Réseaux
Amphithéâtre
44 Av. Albert Einstein
17000 LA ROCHELLE

Composition du jury :

M. BELLOT Patrice, Professeur, Université Aix Marseille
M. CLAVEAU Vincent, Chargé de recherche, CNRS, IRISA
Mme DAILLE Béatrice, Professeure, Université de Nantes
M. DOUCET Antoine, Professeur, la Rochelle Université
Mme GOMEZ KRÄMER Petra, Maître de conférences, la Rochelle Université
M. OGIER Jean-Marc, Professeur, la Rochelle Université
Mme SERFATY Véronique (Invitée), Responsable de domaine scientifique, DGA
Mme VINCENT Nicole, Professeure, Université Paris Descartes

Résumé :

Les entreprises, les administrations, et parfois les particuliers, doivent faire face à de nombreuses fraudes sur les documents qu’ils reçoivent de l’extérieur ou qu’ils traitent en interne. Les factures, les notes de frais, les justificatifs... tout document servant de preuve peut être falsifié dans le but de gagner plus d’argent ou de ne pas en perdre. En France, on estime les pertes dues aux fraudes à plusieurs milliards d’euros par an. Etant donné que le flux de documents échangés, numériques ou papiers, est très important, il serait extrêmement coûteux en temps et en argent de les faire tous vérifier par des experts de la détection des fraudes. C’est pourquoi nous proposons dans notre thèse un système de détection automatique des faux documents.
Si la plupart des travaux en détection automatique des faux documents se concentrent sur des indices graphiques, nous cherchons quant à nous à vérifier les informations textuelles du document afin de détecter des incohérences ou des invraisemblances. Pour cela, nous avons tout d’abord constitué un corpus de tickets de caisse que nous avons numérisés et dont nous avons extrait le texte. Après avoir corrigé les sorties de l’OCR et fait falsifier une partie des documents, nous en avons extrait les informations et nous les avons modélisées dans une ontologie, afin de garder les liens sémantiques entre elles. Les informations ainsi extraites, et augmentées de leurs possibles expansions, peuvent être vérifiées les unes par rapport aux autres au sein du document et à travers la base de connaissances constituée. Les liens sémantiques de l’ontologie permettent également de chercher l’information dans d’autres sources de connaissances, et notamment sur Internet.

https://www.univ-larochelle.fr/recherche/doctorat-et-hdr/soutenances-de-theses/soutenances-de-theses/

publie le mercredi 30 janvier 2019