Réservez les formations disponibles partout en France !

location-dot
location-dot
location-dot
À partir de
location-dot
image OF
  1. Accueil
  2. Numérique
  3. Informatique
  4. AWS
  5. Building Batch Data Analytics Solutions on AWS
Building Batch Data Analytics Solutions on AWS

Building Batch Data Analytics Solutions on AWS

Qualiopi
En centre
Non éligible CPF
Sélectionnez une session :
Visio :

Choisissez une date pour pouvoir réserver !

Objectifs
Programme
  • Comparer les fonctionnalités et les avantages des entrepôts de données, des lacs de données et des architectures de données modernes
  • Concevoir et mettre en œuvre une solution d’analyse de données par lots
  • Identifier et appliquer les techniques appropriées, y compris la compression, pour optimiser le stockage des données
  • Sélectionner et déployer les options appropriées pour ingérer, transformer et stocker des données
  • Choisir les types d’instance et de nœud, les clusters, la mise à l’échelle automatique et la topologie de réseau appropriés pour un cas d’utilisation métier particulier
  • Comprendre comment le stockage et le traitement des données affectent les mécanismes d’analyse et de visualisation nécessaires pour obtenir des informations commerciales exploitables
  • Sécuriser les données au repos et en transit
  • Surveiller les charges de travail analytiques pour identifier et résoudre les problèmes
  • Appliquer les meilleures pratiques de gestion des coûts

Dans ce cours, vous apprendrez à créer des solutions d’analyse de données par lots à l’aide d’Amazon EMR, un service géré Apache Spark et Apache Hadoop de niveau entreprise. Vous apprendrez comment Amazon EMR s’intègre à des projets open source tels qu’Apache Hive, Hue et HBase, et à des services AWS tels qu’AWS Glue et AWS Lake Formation.

Le cours aborde les composants de collecte, d’ingestion, de catalogage, de stockage et de traitement des données dans le contexte de Spark et Hadoop. Vous apprendrez à utiliser les blocs-notes EMR pour prendre en charge les charges de travail d’analyse et d’apprentissage automatique. Vous apprendrez également à appliquer les meilleures pratiques en matière de sécurité, de performances et de gestion des coûts au fonctionnement d’Amazon EMR.

Module A : Présentation de l’analyse des données et du pipeline de données

  • Cas d’utilisation de l’analyse de données

Utilisation du pipeline de données pour l’analyse

Module 1 : Présentation d’Amazon EMR

  • Utilisation d’Amazon EMR dans les solutions d’analyse
  • Architecture de cluster Amazon EMR
  • Stratégies de gestion des coûts

Module 2 : Pipeline d’analyse de données à l’aide d’Amazon EMR : ingestion et stockage

  • Optimisation du stockage avec Amazon EMR
  • Techniques d’ingestion de données

Module 3 : Analyse de données par lots hautes performances à l’aide d’Apache Spark sur Amazon EMR

  • Cas d’utilisation d’Apache Spark sur Amazon EMR
  • Pourquoi Apache Spark sur Amazon EMR
  • Concepts de Spark
  • Transformation, traitement et analytique
  • Utilisation de blocs-notes avec Amazon EMR
  • Mise en pratique 1 : Analyse de données à faible latence à l’aide d’Apache Spark sur Amazon EMR

Module 4 : Traitement et analyse des données de lot avec Amazon EMR et Apache Hive

  • Utilisation d’Amazon EMR avec Hive pour traiter les données par lots
  • Transformation, traitement et analytique
  • Introduction à Apache HBase sur Amazon EMR
  • Mise en pratique 2 : traitement de données par lots à l’aide d’Amazon EMR avec Hive
Public visé
  • Ingénieurs plateformes de données
  • Architectes et opérateurs qui construisent et gèrent des pipelines d’analyse de données
Prérequis

Les participants ayant au moins un an d’expérience dans la gestion de frameworks de données open source tels qu’Apache Spark ou Apache Hadoop bénéficieront de ce cours.
Nous suggérons le cours AWS Hadoop Fundamentals pour ceux qui ont besoin d’un rappel sur Apache Hadoop.

Nous recommandons aux participants de ce cours d’avoir suivi les cours suivants :

Choisissez une date pour pouvoir réserver !

Autres formation Building Batch Data Analytics Solutions on AWS

Autres formations disponibles :
Prochaines sessions disponibles :22 nov.20 déc.
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :25 nov.25 nov.23 déc.23 déc.
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :27 nov.11 déc.11 mars19 mai
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :02 déc.02 déc.11 févr.14 avr.
Qualiopi
En centre
Non éligible CPF
Prochaines sessions disponibles :03 déc.
Qualiopi
En centre
Non éligible CPF
logo ouformer
Réalisation :Definima
Utilisation des cookies

Nous utilisons des cookies pour vous fournir l'ensemble de nos services, notamment la recherche et les alertes. En acceptant, vous consentez à notre utilisation de ces cookies.

Refuser
Accepter