Module 10 - Plan d’apprentissage
STT-1100 Introduction à la science des données
🎯 Objectifs du module
À la fin de ce module, vous devriez être capable de :
- Nettoyer et analyser des données textuelles.
- Construire un lexique de sentiment simple en français.
- Visualiser les tendances lexicales et émotionnelles dans le temps.
- Utiliser TF-IDF pour repérer les mots distinctifs.
- Créer un tableau de bord interactif avec
flexdashboardetshiny.
📚 Lectures
Pour vous préparer, consultez les ressources suivantes :
- 📘 Tidytext Text Mining – Chapitres 1 à 3 - Ce livre vous introduit aux bases du traitement de texte avec R.
- 📘 Flexdashboard documentation (RStudio) - ce document vous guide dans la création de tableaux de bord interactifs avec
flexdashboard. - 📘 Shiny for dashboards - Ce guide vous montre comment intégrer des éléments interactifs dans vos tableaux de bord avec
shiny.
🧭 Aventure
Vous êtes analyste d’affaires junior engagé par la Faculté des sciences et de génie de l’Université Laval. Votre mandat : analyser les commentaires anonymes des étudiant·es sur le cours STT-1100 et produire un tableau de bord interactif pour la direction du programme.
👉 Aventure 10 — Au-delà des données : texte et tableau de bord
💡 Défi — Tableau de bord déployé
Vous devez construire un tableau de bord interactif à partir du modèle fourni. Ce tableau de bord devra :
- Afficher un score de sentiment par semaine ;
- Identifier les mots distinctifs (TF-IDF) ou un nuage de mots ;
- Analyser les variables numériques (
plaisir,engagement,difficulte) ; - Être personnalisé (filtrage, couleurs, résumé) ;
- Être déployé et partagé à Anne-Sophie.
📊 Grille d’évaluation
Chaque équipe doit remettre un tableau de bord interactif basé sur les commentaires des étudiant·es du cours. Voici la grille utilisée pour l’évaluation :
| Critère | Description | Points |
|---|---|---|
| Nettoyage du texte | Texte bien transformé, tokenisé, stopwords retirés | /10 |
| Lexique et score de sentiment | Construction claire du lexique FR, application correcte par semaine | /15 |
| TF-IDF ou nuage de mots | Analyse de mots distinctifs claire et bien illustrée | /15 |
| Analyse des variables numériques | Moyennes ou tendances bien explorées (plaisir, difficulte, etc.) |
/15 |
| Visualisations | Graphiques lisibles, pertinents, esthétiques | /15 |
| Tableau de bord interactif (Shiny) | Utilisation efficace de filtres et composants dynamiques | /15 |
| Personnalisation / effort créatif | Adaptation du modèle fourni, effort visuel et rédactionnel | /10 |
| Déploiement et accessibilité | Dashboard fonctionnel, lien valide partagé dans les temps | /5 |
Total : /100