Prérequis et objectifs
Résultats attendus
Attestation de formation
Prérequis de la formation
Aucun
Objectifs de la formation
Apprendre à identifier les différents types de données manquantes,
connaître les méthodes de traitement disponibles, mettre en œuvre des
applications pratiques dans R.
Objectifs de sortie
- Appréhender la problématique des données manquantes en balayant les impacts sur les analyses
- Distinguer les différents types de données manquantes
- Savoir mener un état des lieux des données manquantes
- Connaître les différents stratégies à mettre à œuvre pour traiter le problème
- Examiner différentes méthodes telles l’exclusion, l’imputation simple ou multiple
Domaines
Contenu
- Problématique générale
- Origine des données manquantes
- Impact sur les analyses
- Les grands types de données manquantes
- MCAR (Missing Completely At Random)
- MAR (Missing At Random)
- MNAR (Missing Not At Random)
- État des lieux des données manquantes
- Détecter, synthétiser, lister les individus ou variables avec données manquantes
- Pattern de données manquantes
- Panorama des différentes stratégies de traitement des données manquantes
- L’exclusion
- L’imputation simple
- Par la moyenne
- A l’aide d’un modèle
- Par les k plus proches voisins
- L’imputation multiple
- Bilan