Elaboration de modèle de de thèmes logiciels automatiquement étiqueté : Approche Al-STM
Elaboration de modèle de de thèmes logiciels automatiquement étiqueté : Approche Al-STM
| dc.contributor.author | BOUZIANE Youcef | |
| dc.date.accessioned | 2022-10-24T09:54:48Z | |
| dc.date.available | 2022-10-24T09:54:48Z | |
| dc.date.issued | 2021-01-13 | |
| dc.description.abstract | Les entrepôts publics de logiciels contiennent une quantité importante de données précieuses qui sont en constante croissance et qui offrent des opportunités pour soutenir le génie logiciel (GL). Les chercheurs ont appliqué des techniques de recherche d'information (IR) pour fouiller les entrepôts de logiciels (MSR). Le modèle de thème, avec sa capacité d'extraction non supervisée des structures sémantiques latentes, est l'une des techniques d' IR permettant de donner un sens aux données non structurées dans les entrepôts de logiciels en les regroupant par thème et par domaine. Cependant, cette technique ne donne aucune interprétation ni étiquette aux thèmes extraits et nécessite une analyse manuelle de leur distribution de mots pour les identifier. Certaines approches ont été proposées pour étiqueter automatiquement les thèmes à l'aide de tags issus des entrepôts de logiciels. Mais ils ne prennent pas en compte l'existence de tags spams et ils ont des difficultés à évoluer et s'adapter avec les grands espaces de tags. Dans cette thèse, nous présentons une nouvelle approche appelée modèle de thèmes logiciels automatiquement étiqueté (Al-stm). Al-stm étiquette les thèmes sur la base de tags observés sur les entrepôts de logiciel. Il atténue le problème de l'étiquetage manuel et automatique des modèles de thèmes dans le domaine du GL. Al-stm a été implémenté et entraîné sur 22K projets GitHub et évalué dans deux tâches GL. Les résultats empiriques suggèrent que Al-stm est plus robuste en termes des métriques F-mesure et nDCG (pour Normalised Discounted Cumulative Gain) et s'adapte mieux aux grands espaces d'étiquettes par rapport aux techniques actuellement utilisées | |
| dc.format | ||
| dc.identifier.uri | https://dspace.univ-oran1.dz/handle/123456789/140 | |
| dc.language.iso | fr | |
| dc.publisher | Université Oran1 Ahmed Ben Bella | |
| dc.subject | Modèle de thèmes logiciels | |
| dc.subject | La fouille des entrepôts de logiciels | |
| dc.subject | Génie logiciel | |
| dc.subject | Etiquettes logicielles | |
| dc.subject | Logiciels open source | |
| dc.subject | Normalised Discounted Cumulative Gain | |
| dc.subject | Al-stm | |
| dc.subject | NER | |
| dc.subject | MSR | |
| dc.title | Elaboration de modèle de de thèmes logiciels automatiquement étiqueté : Approche Al-STM | |
| dc.type | Thesis | |
| grade.Co-rapporteur | SADOU Salah, Professeur, Université Bretagne Sud | |
| grade.Examinateur | BENMOHAMED Mohamed, Professeur, Université de Constantine 2 AM | |
| grade.Examinateur | KOUNINEF Belkacem, Professeur, INTTIC - Oran | |
| grade.Examinateur | SEKHRI Larbi, Professeur, Université Oran 1 | |
| grade.Option | MODELE DE DONNEES AVANCES ET RESEAUX EMERGENTS | |
| grade.Président | BELALEM Ghalem, Professeur, Université Oran 1 | |
| grade.Rapporteur | ABDI Mustapha Kamel, Professeur, Université Oran 1 | |
| l'article.1.DateParution | Janvier 2020 | |
| l'article.1.Revue | International Journal of Open Source Software and Processes | |
| l'article.1.Référence | Volume 11 • Issue 1 • January-March 2020 | |
| l'article.1.Titre | Automatically Labelled Software Topic Model | |
| la.Mention | Très Honorables | |
| la.cote | TH5186 |
Fichiers
Bundle original
1 - 1 sur 1
Bundle de license
1 - 1 sur 1
Pas de vignette d'image disponible
- Nom :
- license.txt
- Taille :
- 1.71 KB
- Format :
- Item-specific license agreed to upon submission
- Description :