Objectifs

Résultats attendus

Résultats attendus

Attestation de formation

Objectifs de la formation

Objectifs de la formation

Apprendre à utiliser le logiciel R pour analyser des données.Mettre en œuvre dans R les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.

Domaines

Domaine(s)
Statistique appliquée
Statistique descriptive
Statistique inférentielle

Contenu

Contenu

- Statistiques descriptives

  • Gestion d’un jeu de données - dataframe
    Importation, caractérisation, sélection, sous-ensembles
  • Premières analyses d’un jeu de données
    Premières vérifications, valeurs manquantes, recodage
  • Résumé d’une variable quantitative – numeric
  • Résumé d’une variable qualitative – factor

- Intervalle de confiance

  • Le raisonnement à partir d’un échantillon
    Généralités, échantillonnage, estimation d’un paramètre
  • Intervalle de confiance d’une moyenne, d’une proportion, d’une variance

- Tests d’hypothèses

  • Qu’est-ce qu’un test d’hypothèse ?
    Généralités, règle de décision, risques d’erreur, puissance
  • Les tests de conformité ou de comparaison à une norme
  • Les tests de comparaison de deux populations
  • Test d’ajustement à une loi de probabilité normale
  • Introduction aux tests non paramétriques

- Liaisons entre deux variables

  • Liaison entre deux variables quantitatives
    Nuage de points, intensité de la liaison, significativité
  • Liaison entre deux variables qualitatives
    Tableau de contingence, intensité et significativité du lien de dépendance : test du khi2
  • Liaison entre une variable qualitative et quantitative
    Comparaison de plusieurs populations, le rapport de corrélation
  • Liaisons entre plusieurs variables
    Approches graphiques : matrice de nuages de points, treillis
    Caractériser des sous-populations par plusieurs variables

- L’analyse de la variance – Anova

  • Analyse de la variance à un facteur
    Variabilité inter, intra, totale – Rapport de corrélation - Le test de Fisher
  • Comparaisons multiples de moyennes
    Analyses post hoc, la procédure de Tukey
  • Analyse de la variance à deux facteurs et interaction
  • Extensions de l’Anova
    Modèle à effet fixe ou aléatoire, modèle hiérarchisé

- Régression linéaire simple et multiple

  • De la corrélation à la régression
    L’intérêt d’un modèle - Variables à expliquer, explicatives, erreur
  • La régression linéaire simple
    Ajustement par la méthode des moindres carrés - Tests et validation du modèle
  • La régression linéaire multiple
  • Choix d’un modèle de régression
    Pourquoi sélectionner un sous-ensemble de variables explicatives ?
    Les différentes approches et critères de sélection d’un modèle

- Analyse de données multidimensionnelles

  • Un panorama des méthodes mult