Objectifs

Résultats attendus

Résultats attendus

Attestation de formation

Objectifs de la formation

Objectifs de la formation

Apprendre à utiliser le langage Python et ses principales librairies scientifiques pour traiter, visualiser et modéliser les données en Data Science

Domaines

Domaine(s)
Mathématiques informatiques
Analyse de données

Contenu

Contenu

- L'écosystème scientifique Python

  • Les incontournables: Numpy, Scipy, Pandas, Matplotlib et iPython qui sont le ciment de toutes les autres librairies scientifiques
  • Panorama des librairies et logiciels scientifiques par domaine
  • Les critères permettant de juger de la qualité d'une librairie

- Calculer avec des nombres réels: comprendre les erreurs de calculs

  • La représentation des nombres réels
  • Comprendre les erreurs de calculs et les contourner

- La scipy stack

  • Manipuler des tableaux de nombres: Numpy
    • Différences avec les listes Python
    • Création, sélection, filtres et principales fonctions
  • Visualiser ses données: Matplotlib
    • Les concepts de la librairie
    • Principaux graphiques: nuages de points, courbes, histogrammes, boxplot, ...
    • Fonctionnalités avancées: 3D, légendes, colorbar, manipuler les axes, annotations, ...
  • Analyse de données: Pandas
    • Les fondements de la librairie: Manipuler des données de type CSV et Excel
    • Séries et Dataframes
    • Index, sélection de données, filtres/recherche, agrégations, jointures et fonctions avancées
    • Manipuler des séries temporelles
  • Les fonctions mathématiques avancées: Scipy
    • Statistiques, optimisation, interpolations/régressions, traitement d'images

- Visualisation de données

  • Présentation de l'écosystème de visualisation de données de Python
  • Les librairies orientées Web: Bokeh, Altair et Plotly
  • Les "écosystèmes" PyViz et HoloViz
  • La visualisation de données volumineuses/big data avec DataShader
  • Les statistiques avec Seaborn


- Visualiser des données géospatiales

  • Convertir ses données d'un système de coordonnées à l'autre
  • Cartographie interactive "à la Open Street Map/Google Maps" avec Folium/iPyleaflet
  • Cartographie statique avec Cartopy
  • Autres librairies géospatiales

- Manipulation de données volumineuses

  • Les librairies h5py, pytables, netcdf4, xarray, iris, parquet permettant de lire vos fichiers scientifiques
  • Paralléliser ses calculs avec Dask
  • Paralléliser ses calculs avec CuDF
  • Manipuler des dataframes gigantesques avec Dask

- Personnalisation
Sous réserve de contraintes techniques ou de confidentialité, nous vous pr