Développement d'un système de recherche d'information sémantique pour la langue arabe dans un environnement distribué
Développement d'un système de recherche d'information sémantique pour la langue arabe dans un environnement distribué
Fichiers
Date
2017-01-25
Auteurs
ABBACHE Ahmed
Nom de la revue
ISSN de la revue
Titre du volume
Éditeur
Université Oran 1 Ahmed Ben Bella
Résumé
Les travaux de cette thèse s'articulent autour de deux axes : (1) la recherche d'information sémantique dans la langue arabe et (2) la recherche d'information distribuée. Dans notre première contribution, nous avons étudié l'impact du WordNet Arabe dans la recherche d'information, pour cela nous proposons (i) deux techniques globales d'expansion de requête: automatique et interactive, la première technique essaye d'enrichir la requête originale avec tous les synonymes extraits par le biais de WordNet Arabe. La deuxième technique utilise les catégories grammaticales du terme. L'utilisateur sélectionne la catégorie appropriée de chaque terme dans la requête originale, cette catégorie permettra au système de faire une expansion avec une liste appropriée de synonymes. (ii) De développer une nouvelle technique de sélection basée sur une combinaison de WordNet Arabe et des règles d'associations. Les résultats montrent que par utilisation d'une méthode de sélection appropriée, WordNet Arabe peut améliorer la recherche d'information en Arabe. Dans notre deuxième contribution, nous proposons d'utiliser la classe de stockage à haute vitesse RAMCloud pour représenter l'index dans un environnement distribué ce qui permettra de bénéficier au mieux des propriétés des Structures de Données Distribuées et Scalable.
Description
Mots-clés
Recherche d'Information; Système de Recherche d'Information; WordNet Arabe; Sémantique; Règles d'Associations; Expansion de Requête Automatique; Expansion de Requête Interactive; Lucene; Structure de Données Distribuée et Scalable; Environnement Distribué.