Il pilastro dell'eccellenza operativa del Google Cloud Well-Architected Framework fornisce consigli per gestire i carichi di lavoro in modo efficiente su Google Cloud. L'eccellenza operativa nel cloud prevede la progettazione, l'implementazione e la gestione di soluzioni cloud che offrono valore, prestazioni, sicurezza e affidabilità. I consigli di questo pilastro ti aiutano a migliorare continuamente e ad adattare i carichi di lavoro per soddisfare le esigenze dinamiche e in continua evoluzione nel cloud.
Il pilastro dell'eccellenza operativa è pertinente per i seguenti segmenti di pubblico:
- Manager e leader: un framework per stabilire e mantenere l'eccellenza operativa nel cloud e per garantire che gli investimenti nel cloud generino valore e supportino gli obiettivi aziendali.
- Team di operazioni cloud: indicazioni per gestire incidenti e problemi, pianificare la capacità, ottimizzare le prestazioni e gestire il cambiamento.
- Site Reliability Engineer (SRE): best practice che ti aiutano a raggiungere livelli elevati di affidabilità del servizio, tra cui monitoraggio, risposta agli incidenti e automazione.
- Cloud architect e ingegneri: requisiti operativi e best practice per le fasi di progettazione e implementazione, per contribuire a garantire che le soluzioni siano progettate per l'efficienza operativa e la scalabilità.
- Team DevOps: indicazioni su automazione, pipeline CI/CD e gestione delle modifiche per contribuire a una distribuzione del software più rapida e affidabile.
Per raggiungere l'eccellenza operativa, devi adottare l'automazione, l'orchestrazione e gli approfondimenti basati sui dati. L'Automation contribuisce a eliminare il lavoro manuale. Inoltre, semplifica e crea misure di salvaguardia per le attività ripetitive. L'orchestrazione consente di coordinare processi complessi. Gli approfondimenti basati sui dati consentono un processo decisionale basato sulle evidenze. Utilizzando queste pratiche, puoi ottimizzare le operazioni cloud, ridurre i costi, migliorare la disponibilità dei servizi e rafforzare la sicurezza.
L'eccellenza operativa nel cloud va oltre la competenza tecnica nelle operazioni cloud. Include un cambiamento culturale che incoraggia l'apprendimento continuo e la sperimentazione. I team devono avere la possibilità di innovare, eseguire l'iterazione e adottare una mentalità di crescita. Una cultura dell'eccellenza operativa promuove un ambiente collaborativo in cui le persone sono incoraggiate a condividere idee, mettere in discussione i presupposti e promuovere il miglioramento.
Per principi e consigli di eccellenza operativa specifici per i workload di AI e ML, consulta Prospettiva AI e ML: eccellenza operativa nel framework Well-Architected.
Principi fondamentali
I consigli del pilastro dell'eccellenza operativa del Well-Architected Framework sono mappati ai seguenti principi fondamentali:
- Garantisci la preparazione operativa e le prestazioni utilizzando CloudOps: assicurati che le soluzioni cloud soddisfino i requisiti operativi e di prestazioni definendo gli obiettivi del livello di servizio (SLO) ed eseguendo un monitoraggio completo, test delle prestazioni e pianificazione della capacità.
- Gestisci incidenti e problemi: riduci al minimo l'impatto degli incidenti cloud e previeni la ricorrenza tramite un'osservabilità completa, procedure di risposta agli incidenti chiare, retrospettive approfondite e misure preventive.
- Gestisci e ottimizza le risorse cloud: ottimizza e gestisci le risorse cloud tramite strategie come il dimensionamento corretto, lo scalabilità automatica e l'utilizzo di strumenti efficaci di monitoraggio dei costi.
- Automatizza e gestisci i cambiamenti: automatizza i processi, semplifica la gestione dei cambiamenti e riduci il carico di lavoro manuale.
- Migliorare e innovare continuamente: concentrati sui miglioramenti continui e sull'introduzione di nuove soluzioni per rimanere competitivo.
Collaboratori
Autori:
- Ryan Cox | Principal Architect
- Hadrian Knotz | Enterprise Architect
Altri collaboratori:
- Daniel Lees | Cloud Security Architect
- Filipe Gracio, PhD | Customer Engineer, specialista di AI/ML
- Gary Harmson | Principal Architect
- Jose Andrade | Customer Engineer, SRE Specialist
- Kumar Dhanagopal | Cross-Product Solution Developer
- Nicolas Pintaux | Customer Engineer, Application Modernization Specialist
- Radhika Kanakam | Program Lead, Google Cloud Well-Architected Framework
- Samantha He | Technical Writer
- Zach Seils | Networking Specialist
- Wade Holmes | Global Solutions Director