Application de la théorie des fonctions de croyance à la fouille de données imparfaites : des données binaires aux données évidentielles

Vignette d'image
Date
2024-10-07
Auteurs
CHALABI Ahlem
Nom de la revue
ISSN de la revue
Titre du volume
Éditeur
Résumé
Ces dernières années, une croissance exponentielle de la production de données a été observée, un phénomène qui devrait non seulement se maintenir mais également s’accélérer. Il est devenu impératif de pouvoir les traiter efficacement afin de tirer le meilleur parti des connaissances qu’elles renferment. Néanmoins, de nombreux défis persistent, notamment le nombre important de règles d’association produites par les algorithmes de fouille de données, ainsi que la qualité de ces connaissances produites. D’autre part, il est crucial de prendre en compte l’incertitude des données à traiter, car les algorithmes traditionnels ne prennent pas en charge l’imperfection. Dans ce contexte, nous proposons dans ce manuscrit deux nouvelles méthodes d’extraction de connaissances : -(1) Une méthode d’extraction de connaissances à partir de données binaires, basée sur les algorithmes Apriori et FP-growth. Cette méthode garantit une qualité et une pertinence des règles produites en utilisant la programmation par contrainte. Les métriques sont modélisées comme des contraintes dans le système du solveur. -(2) une seconde méthode sera proposée où sera pris en compte les imperfections des données et extrayant les items fréquents évidentiels en utilisant une structure arborescente en moins de temps. Pour se faire, dans nos tests, nous prenons en considération plusieurs paramètres tels que la consommation de mémoire, le temps d’exécution et le nombre d’items extraits.
Description
Mots-clés
Fouille de données ; Théorie de Dempster-Shafer ; Règles d’association ; Programmation par contraintes ; Données incertaine ;Donnéesévidentielles ;Métriques ; Items évidentiels ; PPC ; Pestinance des règles d’association.
Citation