Prérequis et objectifs

Résultats attendus

Résultats attendus

Concepteur développeur en intelligence artificielle et analyse big data

Prérequis de la formation

Prérequis de la formation

Niveau d’anglais : on demande un niveau B2, il faut être à l’aise avec la compréhension !
Etre à l’aise avec un tableur (Excel, GS...) sur la partie tableaux croisés dynamiques
Expériences professionnelles (stage ou alternance inclus)

Objectifs de la formation

Objectifs de la formation
  • Concevoir un processus de collecte de données en évaluant et choisissant des outils adaptés pour faciliter l'accessibilité, la sécurité et l'intégrité des données centralisées dans le respect de la réglementation en vigueur (RGPD).
  • Créer un système automatisé de collecte de données en intégrant des solutions ETL (comme Fivetran ou Stitch) et/ou en développant des scripts informatiques en Python ou SQL pour une agrégation rapide et exacte des données correspondant aux besoins métier.
  • Développer des stratégies de nettoyage de données, en analysant le contexte spécifique des données pour assurer un traitement approprié et sécurisé des données qui réponde aux besoins métier de l?entreprise.
  • Extraire des données en développant des scripts personnalisés (par exemple en Python ou SQL) pour récupérer des informations précises et pertinentes depuis une ou plusieurs bases de données.
  • Mener des analyses exploratoires en calculant des techniques statistiques descriptives (comme la moyenne ou l?analyse des fréquences) pour comprendre la distribution des données et écarter les valeurs anormales.
  • Identifier et interpréter des tendances en utilisant des langages de programmation (par exemple Python) et/ou des outils métiers adaptés (par exemple un tableur) pour comprendre finement le contexte et la nature des données analysées.
  • Sélectionner l?algorithme d?apprentissage le plus adapté en comparant les performances et les caractéristiques des différentes familles d?algorithmes afin d'apporter une réponse pertinente à la problématique métier rencontrée.
  • Préparer et transformer des données en utilisant des techniques de prétraitement (preprocessing) pour les adapter aux spécificités du modèle d'apprentissage automatique choisi.
  • Entraîner un modèle d'apprentissage automatique en optimisant une loss function (fonction de coût) à partir des données d?entraînement afin de permettre à l?algorithme d?effectuer le moins d?erreurs possibles selon des indicateurs de succès clairement définis.
  • Identifier les évolutions clés en IA et Big Data en analysant des sources d'information spécialisées pour rester à la pointe des dernières innovations et alimenter les stratégies de projet.
  • Élaborer et évaluer la problématique métier en utilisant des approches analytiques, pour créer un cahier des charges qui reflète précisément les besoins et les objectifs du projet data.
  • Évaluer les risques inhérents au projet IA et Big Data concernant l?impact éthique, le respect du RGPD ou encore la conformité aux normes environnementales, en proposant des méthodes d?audit pour garantir une conformité globale du projet.
  • Planifier et coordonner les ressources humaines et matérielles de manière efficace, en structurant un calendrier des activités qui garantit le respect des délais et des budgets du projet data.
  • Piloter une équipe multidisciplinaire en mettant en place des mécanismes d'évaluation et de feedback continus, assurant ainsi une progression fluide et coordonnée du projet data.
  • Présenter les résultats de projets IA et Big Data en adaptant le contenu et la forme aux différentes parties prenantes, y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG pour garantir une compréhension claire et inclusive.
  • Préparer des données non structurées en les convertissant en données numériques et sous forme tabulaires pour servir de données d'entraînement à un algorithme d?apprentissage profond.
  • Sélectionner l?algorithme d?apprentissage profond le plus adapté en comparant les performances et les caractéristiques des différentes familles d?algorithmes afin d'apporter une réponse pertinente adaptée à la problématique métier rencontrée.
  • Entraîner un modèle d'apprentissage profond en optimisant une loss function (fonction de coût) à partir des données d?entraînement afin de permettre à l?algorithme d?effectuer le moins d?erreurs possibles selon des indicateurs de succès clairement définis.
  • Déployer efficacement un modèle d'apprentissage profond en utilisant des outils et plateformes de production adaptés (MLOps), pour assurer une accessibilité et une performance optimale des prédictions de l'algorithme aux utilisateurs finaux.
  • Identifier les indicateurs clés à calculer en interrogeant les besoins métier afin de structurer les tableaux de bords nécessaires à des prises de décisions stratégiques.
  • Choisir des visualisations pertinentes en prenant en considération la nature massive des données et le profil des usagers y compris les personnes en situation de handicap, en suivant les directives d'accessibilité du WCAG afin de faciliter la compréhension des informations obtenues grâce à l?IA et au Big Data.
  • Créer des tableaux de bord en utilisant des outils de BI (comme PowerBI ou Looker Studio) afin de rendre accessibles et interactives les analyses prédictives aux autres membres de l'entreprise.

Objectifs de sortie

Objectifs de sortie

Secteurs d?activités :

  • pour les entreprises qui innovent et imaginent les cas d'usages de l'intelligence artificielle : les industries, les startup, les TPE, les PME, et les majors du numériques
  • pour les entreprises qui vendent des services d'intelligence artificielle : les agence web, les ESN, les majors du numériques, les éditeurs de services
  • pour les entreprises qui exploitent l'intelligence artificielle pour leur développement ou leur stratégie : les grands comptes, les banques et assurances, la grande distribution et le transport

Type d'emplois accessibles :

  • Développeur en intelligence artificielle (IA)
  • Développeur Machine learning (ML)
  • Développeur Python
  • Lead développeur IA

Domaines

Domaine(s)
Data science
Intelligence artificielle
Data Warehouse

Contenu

Contenu

Partie I : Maîtrisez le data sourcing : Comprenez les KPIs des entreprises, collectez des données depuis différentes sources pour mener des analyses les plus emblématiques
Analysez avec Google Sheets : Découvrez les analyse produit, sales, marketing et finance.Dashboard Google Sheets : Construisez des dashboard automatisés avec Google Sheets.Partie II : Apprenez à extraire et transformer la data via des API, des outils d'automatisation ou du tracking sur Google Tag Manager. Maîtrisez SQL et construisez des data warehouse structurés avec les techniques de software engineering.Apprenez l'extraction et le nettoyage automatique de données : Comprenez le fonctionnement des APIs avec Postman et automatisez des process avec les outils phares comme Zapier & n8n. Vous utiliserez Fivetran, le leader mondial des ELT et la nouvelle version de Google Analytics, GA 4.Maîtrisez le langage des data analysts : Apprenez toutes les techniques pour centraliser et transformer vos données dans un data warehouse. Réalisez des dashboards efficaces et menez des analyses poussées pour les équipes métiers. Apprenez à utiliser les requêtes SQLPartie III : Business Intelligence et data visualization : Communiquez clairement vos résultats en utilisant les bonnes visualisations et en créant des tableaux de bord automatisés sur des millions de données avec les outils de BI les plus utilisés.Apprenez la data visualization : apprenez à construire les graphiques et les tableaux de bord les plus clairs et les plus interactifs possibles pour vos équipes. Faites ressortir des insights de vos données en adoptant la bonne méthodologie d'analyse.
Partie IV : Python pour l'analyse et la prédiction : Exécutez des analyses sur de gros jeux de données grâce à Python et Jupiter notebook.Collaborez mieux avec les équipes data scientists et engineers : Découvrez le format Jupiter Notebook et gérer vos environnements sur Jupyterhub.Apprenez à manipuler les données : Créer des clusters à partir de vos données, automatiser l'exécution de vos scripts avec Airflow et apprenez à prédire le futur avec les librairies Python sklearn, prophet.

Sessions