Ce cours enseigne aux participants des techniques de surveillance et d’amélioration des performances de l’infrastructure et des applications dans Google Cloud.
À l’aide d’une combinaison de présentations, de démonstrations, de laboratoires pratiques et d’études de cas réels, les participants acquièrent de l’expérience dans la surveillance complète de la pile, la gestion et l’analyse des journaux en temps réel, le débogage du code en production, le traçage des goulots d’étranglement des performances des applications et le profilage du processeur. et l’utilisation de la mémoire.
Module 1: Introduction à la suite Google Cloud Operations
-
Décrire l’objectif et les fonctionnalités de la suite d’opérations de Google Cloud.
-
Expliquer l’objectif de l’outil Cloud Monitoring.
-
Expliquer l’objectif des outils Cloud Logging et Error Reporting.
-
Expliquer l’objectif des outils Application Performance Management.
Activités:
Module 2: Surveillance des systèmes critiques
-
Utiliser Cloud Monitoring pour afficher les métriques de plusieurs projets cloud.
-
Expliquer les différents types de tableaux de bord et de graphiques pouvant être construits.
-
Créer un contrôle de disponibilité.
-
Expliquer l’architecture des opérations cloud.
-
Expliquer et démontrer le but de l’utilisation du langage de requête de surveillance (MQL) pour la surveillance.
Activités:
Module 3: Politiques d’alerte
-
Expliquer les stratégies d’alerte.
-
Expliquer les politiques d’alerte.
-
Expliquer le budget d’erreur.
-
Expliquer pourquoi les indicateurs de niveau serveur (SLI), les objectifs de niveau de service (SLO) et les accords de niveau de service (SLA) sont importants.
-
Identifier les types d’alertes et les utilisations courantes pour chacune d’entre elles.
-
Utiliser Cloud Monitoring pour gérer les services.
Activités:
Module 4: Journalisation et analyse avancées
-
Utiliser les fonctionnalités du Log Explorer
-
Expliquer les fonctionnalités et les avantages des métriques basées sur les logs.
-
Définir les récepteurs de logs (filtres d’inclusion) et les filtres d’exclusion.
-
Expliquer comment BigQuery peut être utilisé pour analyser les logs.
-
Exporter les logs vers BigQuery pour analyse.
-
Utiliser l’analyse des logs sur Google Cloud.
Activités:
Module 5: Utilisation des journaux d’audit
-
Expliquer les journaux d’audit cloud.
-
Répertorier et expliquer les différents journaux d’audit
-
Expliquer les caractéristiques et fonctionnalités des différents journaux d’audit.
-
Répertorier les meilleures pratiques pour mettre en œuvre les journaux d’audit.
Activités:
Module 6: Configuration des services Google Cloud pour l’observabilité
-
Utiliser l’ Ops Agent avec Compute Engine.
-
Activer et utiliser la surveillance Kubernetes.
-
Expliquer les avantages de l’utilisation de Google Cloud Managed Service pour Prometheus.
-
Expliquer l’utilisation de PromQL pour interroger les métriques Cloud Monitoring.
-
Expliquer les utilisations de la télémétrie ouverte.
-
Expliquer les mesures personnalisées.
Activités:
Module 7: Surveillance du réseau Google Cloud et de l’accès aux données
-
Collecter et analyser les journaux de flux VPC et les journaux de règles de pare-feu.
-
Activer et surveiller la mise en miroir de paquets.
-
Expliquer les capacités du Network Intelligence Center.
Activités:
Module 8: Enquête sur les problèmes de performances des applications
-
Expliquer les fonctionnalités et les avantages de Error Reporting, Cloud Trace et Cloud Profiler.
-
Expliquer les fonctionnalités de Error Reporting, Cloud Trace et Cloud Profiler.
Activités:
Module 9: Optimisation des coûts pour Operations Suite
-
Analyser le coût d’utilisation des ressources pour surveiller les composants associés dans Google Cloud.
-
Mettre en œuvre les meilleures pratiques pour contrôler le coût de la surveillance au sein
Google Cloud.
Activités: