Die Säule „Operative Exzellenz“ im Google Cloud Well-Architected Framework enthält Empfehlungen für den effizienten Betrieb von Arbeitslasten Google Cloud. Operative Exzellenz in der Cloud umfasst das Entwerfen, Implementieren und Verwalten von Cloud-Lösungen, die Wert, Leistung, Sicherheit und Zuverlässigkeit bieten. Die Empfehlungen in dieser Säule helfen Ihnen, Arbeitslasten kontinuierlich zu verbessern und an die dynamischen und sich ständig weiterentwickelnden Anforderungen in der Cloud anzupassen.
Die Säule „Operative Exzellenz“ ist für die folgenden Zielgruppen relevant:
- Manager und Führungskräfte: Ein Framework zum Einrichten und Aufrechterhalten von operativer Exzellenz in der Cloud und zum Sicherstellen, dass Cloud-Investitionen einen Mehrwert bieten und Geschäftsziele unterstützen.
- Cloud-Betriebsteams: Anleitung zum Verwalten von Vorfällen und Problemen, Planen von Kapazitäten, Optimieren der Leistung und Verwalten von Änderungen.
- Site Reliability Engineers (SREs): Best Practices, mit denen Sie ein hohes Maß an Zuverlässigkeit von Diensten erreichen können, einschließlich Monitoring, Reaktion auf Vorfälle und Automatisierung.
- Cloud-Architekten und -Engineers: Betriebliche Anforderungen und Best Practices für die Design- und Implementierungsphasen, um sicherzustellen, dass Lösungen auf betriebliche Effizienz und Skalierbarkeit ausgelegt sind.
- DevOps-Teams: Anleitung zu Automatisierung, CI/CD-Pipelines und Änderungs management, um eine schnellere und zuverlässigere Softwarebereitstellung zu ermöglichen.
Um operative Exzellenz zu erreichen, sollten Sie Automatisierung, Orchestrierung und datengestützte Erkenntnisse nutzen. Automatisierung trägt dazu bei, manuelle Aufgaben zu eliminieren. Außerdem werden sich wiederholende Aufgaben optimiert und es werden Schutzmaßnahmen für sie eingerichtet. Die Orchestrierung hilft, komplexe Prozesse zu koordinieren. Datengestützte Erkenntnisse ermöglichen eine evidenzbasierte Entscheidungsfindung. Durch die Anwendung dieser Praktiken können Sie den Cloud-Betrieb optimieren, Kosten senken, die Verfügbarkeit von Diensten verbessern und die Sicherheit erhöhen.
Operative Exzellenz in der Cloud geht über die technischen Fähigkeiten im Cloud-Betrieb hinaus. Sie umfasst einen kulturellen Wandel, der kontinuierliches Lernen und Experimentieren fördert. Teams müssen in die Lage versetzt werden, Innovationen zu entwickeln, zu iterieren und eine Wachstumsmentalität anzunehmen. Eine Kultur der operativen Exzellenz fördert eine kollaborative Umgebung, in der Einzelpersonen ermutigt werden, Ideen auszutauschen, Annahmen zu hinterfragen und Verbesserungen voranzutreiben.
Prinzipien und Empfehlungen zur operativen Exzellenz, die speziell auf KI- und ML-Arbeitslasten zugeschnitten sind, finden Sie unter KI- und ML-Perspektive: Operative Exzellenz im Well-Architected Framework.
Grundprinzipien
Die Empfehlungen in der Säule „Operative Exzellenz“ des Well-Architected Framework sind den folgenden Grundprinzipien zugeordnet:
- Betriebsbereitschaft und Leistung mit CloudOps sicherstellen: Stellen Sie sicher, dass Cloud-Lösungen die betrieblichen und Leistungsanforderungen erfüllen, indem Sie Service Level Objectives (SLOs) definieren und umfassendes Monitoring, Leistungstests und Kapazitätsplanung durchführen.
- Vorfälle und Probleme verwalten: Minimieren Sie die Auswirkungen von Cloud-Vorfällen und verhindern Sie ein erneutes Auftreten durch umfassende Beobachtbarkeit, klare Incident Response-Verfahren, gründliche Retrospektiven und Präventivmaßnahmen.
- Cloud-Ressourcen verwalten und optimieren: Optimieren und verwalten Sie Cloud-Ressourcen mit Strategien wie Right-Sizing, Autoscaling und effektiven Tools zur Kostenüberwachung.
- Änderungen automatisieren und verwalten: Automatisieren Sie Prozesse, optimieren Sie das Änderungsmanagement und reduzieren Sie den Aufwand für manuelle Arbeit.
- Kontinuierlich verbessern und innovieren: Konzentrieren Sie sich auf kontinuierliche Verbesserungen und die Einführung neuer Lösungen, um wettbewerbsfähig zu bleiben.
Beitragende
Autor*innen:
- Ryan Cox | Principal Architect
- Hadrian Knotz | Enterprise Architect
Weitere Beitragende:
- Daniel Lees | Cloudsicherheitsarchitekt
- Filipe Gracio, PhD | Customer Engineer, KI/ML-Experte
- Gary Harmson | Principal Architect
- Jose Andrade | Customer Engineer, SRE-Experte
- Kumar Dhanagopal | Cross-Product Solution Developer
- Nicolas Pintaux | Customer Engineer, Spezialist für Anwendungsmodernisierung
- Radhika Kanakam | Program Lead, Google Cloud Well-Architected Framework
- Samantha He | Technical Writer
- Zach Seils | Networking Specialist
- Wade Holmes | Global Solutions Director