Retour à la liste des formations

Big Data - Le développement d'applications et la Data visualisation

Prérequis et objectifs

Résultats attendus

Certification M2I Expertises Big Data

Prérequis de la formation

Avoir des connaissances mathématiques avancées, pour pouvoir interpréter les algorithmes à mettre en oeuvre, et maîtriser Java ou Python.

Objectifs de la formation

Développer des applications avec Spark Streaming

Utiliser la programmation parallèle sur un cluster

Exploiter des données avec Spark SQL

Comprendre et exploiter les algorithmes standard de Machine Learning et permettre une visualisation avec Graphx.

Objectifs de sortie

Développer des applications avec Spark Streaming
Utiliser la programmation parallèle sur un cluster
Exploiter des données avec Spark SQL
Comprendre et exploiter les algorithmes standard de Machine Learning et permettre une visualisation avec Graphx.

Diplôme(s)

Expertises Big Data

Niveau d'entrée

Sans niveau spécifique

Niveau de sortie

Sans niveau spécifique

Type de certification

Habilitation

Contenu

Big Data overview
Introduction au Big Data : de quoi s'agit-il ?
Exemples pratiques
Les technologies concernées
Les outils
Les langages :
Hortonworks
MapR
Cloudera
IBM Watson...
Démystification du Big Data
Les acteurs principaux
Les différents métiers du Big Data
Rappel
Le langage Python (application de la MapReduce)
Les mathématiques de base (algèbre, statistiques, probabilités)
Le langage SQL
Les algorithmes et analyse de données
Les concepts du Machine Learning
Les données supervisées ou non supervisées ? Quelles différences ?
Régression
Modèles linéaires
Classification
Naive Bayes
K-NN
K-Means clustering
Réseaux de neurones
Arbres de décisions et de régression
Support vector machines
Méthodes ensemblistes
Machine Learning avec : Spark et Spark Streaming
Introduction à Apache Spark
Faire du Machine learning avec Apache Spark MLlib
Traiter les données en temps réel avec Apache Spark Streaming
Faire des requêtes en format SQL avec Apache Spark SQL
Créer des graphes avec Apache Spark GraphX
Stockage basé sur les graphes
Visualisation
La valeur de la visualisation
Modèles de données et images
Données multidimensionnelles
Principes de design
Perception graphique
Restitution et pilotage
Couleurs
Itérations sur la perception
Techniques d'interactions
Exemples d'analyses : efficacité des antibiotiques
Visualisation Big Data
Certification (en option)
Nos tests de validation des compétences font partie intégrante du processus d'apprentissage car ils permettent de développer différents niveaux d'abstractions.
Solliciter l'apprenant à l'aide de nos QCM, c'est lui permettre d'étayer sa réflexion en mobilisant sa mémoire pour choisir la bonne réponse. Nous sommes bien dans une technique d'ancrage mémoriel.
L'examen sera passé à la fin de la formation.

Modalités et informations complémentaires

Public visé :
Tout public
Modalités :
En centre de formation
Domaines :
Data Warehouse
Accessible par la VAE :
Non

Contact :
Sandrine NEBOUT 0467828181
Adresse e-mail :
s.nebout@m2iformation.fr

Pour savoir si cette formation est accessible à d'autres publics et selon d'autres modalités, n'hésitez pas à prendre directement contact avec l'organisme ou votre conseiller

Accessibilité

Capacité d'accueil (nb indicatif) :
8 places
Durée totale :
35h
Durée en centre :
35h
Accès handicapé :
Oui
Restauration sur place :
Non
Accessibilité transports en commun :
Oui

Conditions spécifiques :

Pour les dates de session, prenez contact directement avec l'organisme

Toutes les sessions

Date de la session : 01/01/2019 - 31/07/2020

Lieu de formation : 34000 MONTPELLIER

Voir le détail de la session

Date de la session : 01/01/2019 - 31/07/2020

Lieu de formation : 31200 TOULOUSE

Voir le détail de la session

Eligibilité au compte personnel de formation

  • Code CPF :
    235758 (Caisse des dépôts)
    Début de validité :
    02.01.2019

Ces informations vous intéressent ? Vous souhaitez les conserver ?

Imprimer cette page Mémoriser cette page