Module 10 - Plan d’apprentissage
STT-1100 Introduction à la science des données
Objectifs du module
À la fin de ce module, vous devriez être capable de :
- Nettoyer et analyser des données textuelles.
- Construire un lexique de sentiment simple en français.
- Visualiser les tendances lexicales et émotionnelles dans le temps.
- Utiliser TF-IDF pour repérer les mots distinctifs.
- Créer un tableau de bord interactif avec
flexdashboardetshiny.
Lectures
Pour vous préparer, consultez les ressources suivantes :
- Tidytext Text Mining – Chapitres 1 à 3 - Ce livre vous introduit aux bases du traitement de texte avec R.
- Flexdashboard documentation (RStudio) - ce document vous guide dans la création de tableaux de bord interactifs avec
flexdashboard. - Shiny for dashboards - Ce guide vous montre comment intégrer des éléments interactifs dans vos tableaux de bord avec
shiny.
Aventure
Vous êtes analyste d’affaires junior engagé par la Faculté des sciences et de génie de l’Université Laval. Votre mandat : analyser les commentaires anonymes des étudiant·es sur le cours STT-1100 et produire un tableau de bord interactif pour la direction du programme.
Aventure 10 — Au-delà des données : texte et tableau de bord
Défi — Tableau de bord déployé
Vous devez construire un tableau de bord interactif à partir du modèle fourni. Ce tableau de bord devra :
- Afficher un score de sentiment par semaine ;
- Identifier les mots distinctifs (TF-IDF) ou un nuage de mots ;
- Analyser les variables numériques (
plaisir,engagement,difficulte) ; - Être personnalisé (filtrage, couleurs, résumé) ;
- Être déployé et partagé à Anne-Sophie.
Grille d’évaluation
Chaque équipe doit remettre un tableau de bord interactif basé sur les commentaires des étudiant·es du cours. Voici la grille utilisée pour l’évaluation :
| Critère | Description | Points |
|---|---|---|
| Nettoyage du texte | Texte bien transformé, tokenisé, stopwords retirés | /10 |
| Lexique et score de sentiment | Construction claire du lexique FR, application correcte par semaine | /15 |
| TF-IDF ou nuage de mots | Analyse de mots distinctifs claire et bien illustrée | /15 |
| Analyse des variables numériques | Moyennes ou tendances bien explorées (plaisir, difficulte, etc.) |
/15 |
| Visualisations | Graphiques lisibles, pertinents, esthétiques | /15 |
| Tableau de bord interactif (Shiny) | Utilisation efficace de filtres et composants dynamiques | /15 |
| Personnalisation / effort créatif | Adaptation du modèle fourni, effort visuel et rédactionnel | /10 |
| Déploiement et accessibilité | Dashboard fonctionnel, lien valide partagé dans les temps | /5 |
Total : /100