Analyse de données en environnement Hadoop

Objectifs
Domaines
Contenu
Sessions

Objectifs

Résultats attendus

Attestation de formation

Objectifs de la formation

Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce
Savoir explorer HDFS et suivre l’exécution d’une application YARN
Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données

Domaines

Statistique appliquée

Analyse de données

Data Warehouse

Contenu

- Hadoop

Comprendre Hadoop et son écosystème
Quels impacts de l’arrivée d’Hadoop dans un SI traditionnel ?
Le Hadoop Distributed File System (HDFS)
Introduction aux données dans HDFS
MapReduce Framework et YARN

- Pig

Introduction à Pig
Programmation Pig avancée
Troubleshooting et optimisation avec Pig
Résolution des problèmes avec Pig
Utiliser l’UI Web d’Hadoop
Démo optionnelle : résolution d’un « Failed Job » avec l’UI Web
Echantillonnage de données et débogage
Vue d’ensemble des performances
Comprendre le plan d’exécution
Astuces pour améliorer la performance de vos « Pig Jobs »

- Hive

Programmation Hive
Utilisation de HCatalog
Programmation Hive avancée
Etendre Hive
Transformation de données avec des Scripts personnalisés
Fonctions définies par l’utilisateur
Paramétrer les requêtes
Exercices « Hands-On » : transformation de données avec Hive
Programmation Hive avancée (suite)
Analyse de données et statistiques

- Sqoop

Import/Export avec Sqoop (SGBDR <-> HDFS)
Sqoop, fonctions avancées
Définition de workflow avec Oozie

- Optionnel : (sous réserve de temps)

Introduction à H-Base
Exemple d’ingestion de données avec l’ETL Talend
Créer son propre cluster Hadoop (plateforme de test)

Sessions

Session

01/01/2025 au 31/12/2026

Ajouter à mes favoris

Analyse de données en environnement Hadoop - Session de Formation 807479

Entrée/Sortie permanente

A distance

Session

LABEGE 20/05/2026 au 22/05/2026

Ajouter à mes favoris

Analyse de données en environnement Hadoop - Session de Formation 807481

Session

LABEGE 21/10/2026 au 23/10/2026

Ajouter à mes favoris

Analyse de données en environnement Hadoop - Session de Formation 807482

Organisme / Etablissement

Data Value

Ajouter à mes favoris

Data Value

Adresse

41 rue de la Découverte - 31676 LABEGE

Mail

cedric.calas@datavalue.fr

Téléphone

0972567567

Site

https://www.datavalue.fr

sessions

430

Contact

Nom

CALAS Cédric

Téléphone

09 72 56 75 67

E-mail

cedric.calas@datavalue.fr

Niveau d'entrée

Sans niveau spécifique

Niveau de sortie

Sans niveau spécifique

Dispositif de financement

AIF, entreprise , individuel...

Ajouter à mes favoris

AIF, entreprise , individuel...

Aides au financement qui peuvent prendre en charge soit la totalité du coût d'une formation soit être en complément d'autres financements.

Pour savoir si cette formation est accessible à d'autres publics et selon d'autres modalités, n'hésitez pas à prendre directement contact avec l'organisme ou votre conseiller.

Analyse de données en environnement Hadoop - Formation

Objectifs

Résultats attendus

Objectifs de la formation

Domaines

Contenu

- Hadoop

- Pig

- Hive

- Sqoop

- Optionnel : (sous réserve de temps)

Sessions

01/01/2025 au 31/12/2026

LABEGE 20/05/2026 au 22/05/2026

LABEGE 21/10/2026 au 23/10/2026

Data Value

Contact

AIF, entreprise , individuel...