Le pilier d'excellence opérationnelle du Google Cloud Well-Architected Framework fournit des recommandations pour exploiter efficacement les charges de travail sur Google Cloud. L'excellence opérationnelle dans le cloud implique la conception, l'implémentation et la gestion de solutions cloud qui offrent valeur, performances, sécurité et fiabilité. Les recommandations de ce pilier vous aident à améliorer et à adapter en permanence les charges de travail pour répondre aux besoins dynamiques et en constante évolution du cloud.
Le pilier d'excellence opérationnelle s'adresse aux publics suivants :
- Responsables et dirigeants : un framework pour établir et maintenir l'excellence opérationnelle dans le cloud, et pour s'assurer que les investissements dans le cloud apportent de la valeur et soutiennent les objectifs commerciaux.
- Équipes d'opérations cloud : conseils pour gérer les incidents et les problèmes, planifier la capacité, optimiser les performances et gérer les changements.
- Ingénieurs en fiabilité des sites (SRE) : bonnes pratiques qui vous aident à atteindre des niveaux élevés de fiabilité des services, y compris la surveillance, la réponse aux incidents et l'automatisation.
- Architectes et ingénieurs cloud : exigences opérationnelles et bonnes pratiques pour les phases de conception et d'implémentation, afin de garantir que les solutions sont conçues pour l'efficacité opérationnelle et l'évolutivité.
- Équipes DevOps : conseils sur l'automatisation, les pipelines CI/CD et la gestion des changements, afin de permettre une livraison de logiciels plus rapide et plus fiable.
Pour atteindre l'excellence opérationnelle, vous devez adopter l'automatisation, l'orchestration et les insights basés sur les données. L'automatisation permet d'éliminer les tâches répétitives. Elle simplifie également les tâches répétitives et met en place des garde-fous. L'orchestration permet de coordonner des processus complexes. Les insights basés sur les données permettent de prendre des décisions fondées sur des preuves. En utilisant ces pratiques, vous pouvez optimiser les opérations cloud, réduire les coûts, améliorer la disponibilité des services et renforcer la sécurité.
L'excellence opérationnelle dans le cloud va au-delà des compétences techniques en opérations cloud. Elle inclut un changement culturel qui encourage l'apprentissage et l'expérimentation continus. Les équipes doivent être en mesure d'innover, d'itérer et d'adopter un état d'esprit de croissance. Une culture d'excellence opérationnelle favorise un environnement collaboratif dans lequel les individus sont encouragés à partager des idées, à remettre en question des hypothèses et à stimuler l'amélioration.
Pour connaître les principes et les recommandations d'excellence opérationnelle spécifiques aux charges de travail d'IA et de ML, consultez la section Perspective IA et ML : excellence opérationnelle dans le Well-Architected Framework.
Principes de base
Les recommandations du pilier d'excellence opérationnelle du Well-Architected Framework sont associées aux principes de base suivants :
- Assurer la préparation et les performances opérationnelles à l'aide de CloudOps : assurez-vous que les solutions cloud répondent aux exigences opérationnelles et de performances en définissant des objectifs de niveau de service (SLO), et en effectuant une surveillance complète, des tests de performances et une planification de la capacité.
- Gérer les incidents et les problèmes: Minimisez l'impact des incidents cloud et évitez qu'ils ne se reproduisent grâce à une observabilité complète, des procédures claires de réponse aux incidents, des rétrospectives approfondies et des mesures préventives.
- Gérer et optimiser les ressources cloud: optimisez et gérez les ressources cloud grâce à des stratégies telles que le dimensionnement approprié, l'autoscaling et l'utilisation d'outils efficaces de surveillance des coûts.
- Automatiser et gérer le changement: automatisez les processus, simplifiez la gestion du changement et allégez la charge de travail manuelle.
- Améliorer et innover en permanence: concentrez-vous sur les améliorations continues et l'introduction de nouvelles solutions pour rester compétitif.
Contributeurs
Auteurs :
- Ryan Cox | Architecte principal
- Hadrian Knotz | Architecte d'entreprise
Autres contributeurs :
- Daniel Lees | Architecte en sécurité cloud
- Dr Filipe Gracio | Ingénieur client, spécialiste en IA/ML
- Gary Harmson | Architecte principal
- Jose Andrade | Ingénieur client, spécialiste en SRE
- Kumar Dhanagopal | Développeur de solutions multiproduits
- Nicolas Pintaux | Ingénieur client, spécialiste en modernisation d'applications
- Radhika Kanakam | Responsable de programme, Google Cloud Well-Architected Framework
- Samantha He | Rédactrice technique
- Zach Seils | Spécialiste en gestion des réseaux
- Wade Holmes | Directeur des solutions mondiales