Elaboration de modèle de de thèmes logiciels automatiquement étiqueté : Approche Al-STM

dc.contributor.authorBOUZIANE Youcef
dc.date.accessioned2022-10-24T09:54:48Z
dc.date.available2022-10-24T09:54:48Z
dc.date.issued2021-01-13
dc.description.abstractLes entrepôts publics de logiciels contiennent une quantité importante de données précieuses qui sont en constante croissance et qui offrent des opportunités pour soutenir le génie logiciel (GL). Les chercheurs ont appliqué des techniques de recherche d'information (IR) pour fouiller les entrepôts de logiciels (MSR). Le modèle de thème, avec sa capacité d'extraction non supervisée des structures sémantiques latentes, est l'une des techniques d' IR permettant de donner un sens aux données non structurées dans les entrepôts de logiciels en les regroupant par thème et par domaine. Cependant, cette technique ne donne aucune interprétation ni étiquette aux thèmes extraits et nécessite une analyse manuelle de leur distribution de mots pour les identifier. Certaines approches ont été proposées pour étiqueter automatiquement les thèmes à l'aide de tags issus des entrepôts de logiciels. Mais ils ne prennent pas en compte l'existence de tags spams et ils ont des difficultés à évoluer et s'adapter avec les grands espaces de tags. Dans cette thèse, nous présentons une nouvelle approche appelée modèle de thèmes logiciels automatiquement étiqueté (Al-stm). Al-stm étiquette les thèmes sur la base de tags observés sur les entrepôts de logiciel. Il atténue le problème de l'étiquetage manuel et automatique des modèles de thèmes dans le domaine du GL. Al-stm a été implémenté et entraîné sur 22K projets GitHub et évalué dans deux tâches GL. Les résultats empiriques suggèrent que Al-stm est plus robuste en termes des métriques F-mesure et nDCG (pour Normalised Discounted Cumulative Gain) et s'adapte mieux aux grands espaces d'étiquettes par rapport aux techniques actuellement utilisées
dc.formatpdf
dc.identifier.urihttps://dspace.univ-oran1.dz/handle/123456789/140
dc.language.isofr
dc.publisherUniversité Oran1 Ahmed Ben Bella
dc.subjectModèle de thèmes logiciels
dc.subjectLa fouille des entrepôts de logiciels
dc.subjectGénie logiciel
dc.subjectEtiquettes logicielles
dc.subjectLogiciels open source
dc.subjectNormalised Discounted Cumulative Gain
dc.subjectAl-stm
dc.subjectNER
dc.subjectMSR
dc.titleElaboration de modèle de de thèmes logiciels automatiquement étiqueté : Approche Al-STM
dc.typeThesis
grade.Co-rapporteurSADOU Salah, Professeur, Université Bretagne Sud
grade.ExaminateurBENMOHAMED Mohamed, Professeur, Université de Constantine 2 AM
grade.ExaminateurKOUNINEF Belkacem, Professeur, INTTIC - Oran
grade.ExaminateurSEKHRI Larbi, Professeur, Université Oran 1
grade.OptionMODELE DE DONNEES AVANCES ET RESEAUX EMERGENTS
grade.PrésidentBELALEM Ghalem, Professeur, Université Oran 1
grade.RapporteurABDI Mustapha Kamel, Professeur, Université Oran 1
l'article.1.DateParutionJanvier 2020
l'article.1.RevueInternational Journal of Open Source Software and Processes
l'article.1.RéférenceVolume 11 • Issue 1 • January-March 2020
l'article.1.TitreAutomatically Labelled Software Topic Model
la.MentionTrès Honorables
la.coteTH5186
Fichiers
Bundle original
Voici les éléments 1 - 1 sur 1
Vignette d'image
Nom :
TH5186.pdf
Taille :
4.16 MB
Format :
Adobe Portable Document Format
Description :
Bundle de license
Voici les éléments 1 - 1 sur 1
Pas de vignette d'image disponible
Nom :
license.txt
Taille :
1.71 KB
Format :
Item-specific license agreed to upon submission
Description :