Mini Master BIG DATA en télé-présentielle
Mini Master BIG DATA couvre deux modules: BIG DATA et SPARK:
Certifications du MiniMaster:
- Certification « Mini Master en BIG DATA ».
- Certification « BIG DATA Engineer »
- Certification « Spark Developer »
- Possibilité de passer une certification de EMC2 en machine learning et BIG data Analytics (Dell).
- Possibilité de passer des certifications d’IBM en BIG data et Machine Learning.
Module BIG DATA:
- Formation (type tronc commun) pour la préparation aux certificats professionnels type : IBM, Cloudera, Hortonworks et Databricks.
Objectifs du module BIG DATA:
- Comprendre le phénomène Big Data et les notions qu’il recouvre.
- Comprendre pourquoi tout le monde parle du Big Data et son impact dans l’entreprise.
- Comment faire du Big Data ? Sur quelle plateforme technologique s’appuyer ?
- Identifier et s’approprier les outils de l’écosystème Hadoop pour chaque cas d’usage.
- Faire des labs pour maîtriser les composants du hadoop ecosystème: sqoop, hive, pig, flume…
- Maîtriser le Spark.
Module Spark:
- Utilisation d’un grand nombre d’algorithmes de traitement des données et de Machine Learning (classification, régression, clustering), ainsi que de nombreuses étapes de pré-processing des données (Feature Engineering).
Objectifs du module Spark:
- Assimiler les notions fondamentales de Spark et son fonctionnement sur Hadoop.
- Charger, explorer et analyser des données provenant de diverses sources.
- Préparer et transformer des données puis utiliser des algorithmes de Machine Learning avec Spark.