Analyse de données en environnement Hadoop

Prérequis et objectifs

Résultats attendus

Attestation de formation

Prérequis de la formation

Aucun

Objectifs de la formation

Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce
Savoir explorer HDFS et suivre l’exécution d’une application YARN
Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données

Objectifs de sortie

Comprendre ce que sont Hadoop et YARN
Connaître les différents outils et les Framework dans un environnement Hadoop 2.0
Appréhender MapReduce
Comprendre comment exécuter une tâche de MapReduce sur YARN
Exécuter des modifications en masse avec PIG
Savoir écrire des requêtes pour HIVE afin d’analyser ses données
Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle
Découverte d’autres briques : automatiser vos process avec Oozie
Utiliser une base de données No-SQL (HBase)

Domaines

Statistique appliquée

Data Warehouse

Contenu

- Hadoop

Comprendre Hadoop et son écosystème
Quels impacts de l’arrivée d’Hadoop dans un SI traditionnel ?
Le Hadoop Distributed File System (HDFS)
Introduction aux données dans HDFS
MapReduce Framework et YARN

- Pig

Introduction à Pig
Programmation Pig avancée
Troubleshooting et optimisation avec Pig
Résolution des problèmes avec Pig
Utiliser l’UI Web d’Hadoop
Démo optionnelle : résolution d’un « Failed Job » avec l’UI Web
Echantillonnage de données et débogage
Vue d’ensemble des performances
Comprendre le plan d’exécution
Astuces pour améliorer la performance de vos « Pig Jobs »

- Hive

Programmation Hive
Utilisation de HCatalog
Programmation Hive avancée
Etendre Hive
Transformation de données avec des Scripts personnalisés
Fonctions définies par l’utilisateur
Paramétrer les requêtes
Exercices « Hands-On » : transformation de données avec Hive
Programmation Hive avancée (suite)
Analyse de données et statistiques

- Sqoop

Import/Export avec Sqoop (SGBDR <-> HDFS)
Sqoop, fonctions avancées
Définition de workflow avec Oozie

- Optionnel : (sous réserve de temps)

Introduction à H-Base
Exemple d’ingestion de données avec l’ETL Talend
Créer son propre cluster Hadoop (plateforme de test)

Sessions

Session

LABEGE CEDEX 01/01/2024 au 31/07/2025

Ajouter à mes favoris

Supprimer de mes favoris

Entrée/Sortie permanente

A distance

Session

LABEGE CEDEX 26/05/2025 au 28/05/2025

Ajouter à mes favoris

Supprimer de mes favoris

Capacité d'accueil

Session

LABEGE CEDEX 01/01/2025 au 31/07/2026

Ajouter à mes favoris

Supprimer de mes favoris

Entrée/Sortie permanente

A distance

Voir plus (1)

Session

LABEGE CEDEX 22/10/2025 au 24/10/2025

Ajouter à mes favoris

Supprimer de mes favoris

Capacité d'accueil

Organisme / Etablissement

Data Value

Ajouter à mes favoris

Supprimer de mes favoris

Adresse

41 rue de la Découverte - 31676 LABEGE CEDEX

Mail

cedric.calas@datavalue.fr

Téléphone

0972567567

Site

https://www.datavalue.fr

sessions

552

Contact

Nom

CALAS Cédric

Téléphone

0972567567

E-mail

cedric.calas@datavalue.fr

Niveau d'entrée

Sans niveau spécifique

Niveau de sortie

Sans niveau spécifique

Pour savoir si cette formation est accessible à d'autres publics et selon d'autres modalités, n'hésitez pas à prendre directement contact avec l'organisme ou votre conseiller.

Analyse de données en environnement Hadoop - Formation

Prérequis et objectifs

Résultats attendus

Prérequis de la formation

Objectifs de la formation

Objectifs de sortie

Domaines

Contenu

- Hadoop

- Pig

- Hive

- Sqoop

- Optionnel : (sous réserve de temps)

Sessions

LABEGE CEDEX 01/01/2024 au 31/07/2025

LABEGE CEDEX 26/05/2025 au 28/05/2025

LABEGE CEDEX 01/01/2025 au 31/07/2026

Data Value

Contact