Module 10 - Plan d’apprentissage

STT-1100 Introduction à la science des données

🎯 Objectifs du module

À la fin de ce module, vous devriez être capable de :

  • Nettoyer et analyser des données textuelles.
  • Construire un lexique de sentiment simple en français.
  • Visualiser les tendances lexicales et émotionnelles dans le temps.
  • Utiliser TF-IDF pour repérer les mots distinctifs.
  • Créer un tableau de bord interactif avec flexdashboard et shiny.

📚 Lectures

Pour vous préparer, consultez les ressources suivantes :

  • 📘 Tidytext Text Mining – Chapitres 1 à 3 - Ce livre vous introduit aux bases du traitement de texte avec R.
  • 📘 Flexdashboard documentation (RStudio) - ce document vous guide dans la création de tableaux de bord interactifs avec flexdashboard.
  • 📘 Shiny for dashboards - Ce guide vous montre comment intégrer des éléments interactifs dans vos tableaux de bord avec shiny.

🧭 Aventure

Vous êtes analyste d’affaires junior engagé par la Faculté des sciences et de génie de l’Université Laval. Votre mandat : analyser les commentaires anonymes des étudiant·es sur le cours STT-1100 et produire un tableau de bord interactif pour la direction du programme.

👉 Aventure 10 — Au-delà des données : texte et tableau de bord

💡 Défi — Tableau de bord déployé

Vous devez construire un tableau de bord interactif à partir du modèle fourni. Ce tableau de bord devra :

  • Afficher un score de sentiment par semaine ;
  • Identifier les mots distinctifs (TF-IDF) ou un nuage de mots ;
  • Analyser les variables numériques (plaisir, engagement, difficulte) ;
  • Être personnalisé (filtrage, couleurs, résumé) ;
  • Être déployé et partagé à Anne-Sophie.

📊 Grille d’évaluation

Chaque équipe doit remettre un tableau de bord interactif basé sur les commentaires des étudiant·es du cours. Voici la grille utilisée pour l’évaluation :

Critère Description Points
Nettoyage du texte Texte bien transformé, tokenisé, stopwords retirés /10
Lexique et score de sentiment Construction claire du lexique FR, application correcte par semaine /15
TF-IDF ou nuage de mots Analyse de mots distinctifs claire et bien illustrée /15
Analyse des variables numériques Moyennes ou tendances bien explorées (plaisir, difficulte, etc.) /15
Visualisations Graphiques lisibles, pertinents, esthétiques /15
Tableau de bord interactif (Shiny) Utilisation efficace de filtres et composants dynamiques /15
Personnalisation / effort créatif Adaptation du modèle fourni, effort visuel et rédactionnel /10
Déploiement et accessibilité Dashboard fonctionnel, lien valide partagé dans les temps /5

Total : /100