Un'infrastruttura affidabile è un requisito fondamentale per i carichi di lavoro nel cloud. In qualità di Cloud Architect, per progettare un'infrastruttura affidabile per i tuoi carichi di lavoro, devi avere una buona conoscenza delle funzionalità di affidabilità del tuo fornitore di servizi cloud preferito. Questo documento descrive i componenti di base dell'affidabilità in Google Cloud (risorse con ambito di zona, regione e località) e i livelli di disponibilità che forniscono. Questo documento fornisce anche linee guida per valutare i requisiti di affidabilità dei tuoi carichi di lavoro e presenta consigli sull'architettura per la creazione e la gestione di un'infrastruttura affidabile in Google Cloud.
Questo documento è suddiviso nelle seguenti parti:
- Panoramica dell'affidabilità (questa parte)
- Componenti di base dell'affidabilità in Google Cloud
- Valuta i requisiti di affidabilità per i carichi di lavoro cloud
- Progetta un'infrastruttura affidabile per i tuoi carichi di lavoro in Google Cloud
- Gestisci il traffico e il carico per i tuoi carichi di lavoro in Google Cloud
- Gestisci e monitora la tua Google Cloud infrastruttura
Se hai già letto questa guida e vuoi vedere cosa è cambiato, consulta le Note di rilascio.
Panoramica dell'affidabilità
Un'applicazione o un carico di lavoro è affidabile quando soddisfa i tuoi obiettivi attuali di disponibilità e resilienza agli errori.
La disponibilità (o tempo di attività) è la percentuale di tempo in cui un'applicazione è utilizzabile. Ad esempio, per un'applicazione con un obiettivo di disponibilità del 99,99%, il tempo di inattività totale non deve superare 8,64 secondi in un periodo di 24 ore. A volte, la disponibilità viene misurata come la proporzione di richieste che l'applicazione gestisce correttamente in un determinato periodo. Ad esempio, per un'applicazione con un obiettivo di disponibilità del 99,99%, per ogni 100.000 richieste ricevute, non possono fallire più di dieci richieste. La disponibilità viene spesso espressa come il numero di nove nella percentuale. Ad esempio, la disponibilità del 99,99% viene espressa come "4 nove".
A seconda dello scopo dell'applicazione, potresti avere diversi set di indicatori per l'affidabilità dell'applicazione. Di seguito sono riportati alcuni esempi di indicatori di affidabilità:
- Per le applicazioni che pubblicano contenuti, la disponibilità, la latenza e la velocità effettiva sono indicatori di affidabilità importanti. Indicano se l'applicazione può rispondere alle richieste, quanto tempo impiega l'applicazione a rispondere alle richieste e quante richieste l'applicazione può elaborare correttamente in un determinato periodo.
- Per i database e i sistemi di archiviazione, la latenza, la velocità effettiva, la disponibilità e la durabilità (quanto bene i dati sono protetti da perdite o danneggiamenti) sono indicatori di affidabilità. Indicano quanto tempo impiega il sistema a leggere o scrivere i dati e se è possibile accedere ai dati on demand.
- Per i carichi di lavoro di big data e analisi, come le pipeline di elaborazione dei dati, le prestazioni coerenti della pipeline (velocità effettiva e latenza) sono essenziali per garantire la freschezza dei prodotti di dati e sono un indicatore di affidabilità importante. Indica la quantità di dati che possono essere elaborati e il tempo necessario per la pipeline per passare dall'importazione dati all'elaborazione dei dati.
- La maggior parte delle applicazioni ha la correttezza dei dati come indicatore di affidabilità essenziale.
Per ulteriori linee guida per definire gli obiettivi di affidabilità per le tue applicazioni, consulta Valuta i requisiti di affidabilità per i carichi di lavoro cloud.
Fattori che influiscono sull'affidabilità delle applicazioni
L'affidabilità di un'applicazione di cui è stato eseguito il deployment in Google Cloud dipende dai seguenti fattori:
- La progettazione interna dell'applicazione.
- Le applicazioni o i componenti secondari da cui dipende l'applicazione.
- Google Cloud Risorse dell'infrastruttura come computing, networking, storage, database e sicurezza su cui viene eseguita l'applicazione e come l'applicazione utilizza l'infrastruttura.
- La capacità dell'infrastruttura di cui esegui il provisioning e la scalabilità della capacità.
- I processi e gli strumenti DevOps che utilizzi per creare, eseguire il deployment e gestire l'applicazione, le relative dipendenze e l' Google Cloud infrastruttura.
Questi fattori sono riassunti nel seguente diagramma:
Come mostrato nel diagramma precedente, l'affidabilità di un'applicazione di cui è stato eseguito il deployment in dipende da più fattori. Google Cloud L'obiettivo di questa guida è l'affidabilità dell' Google Cloud infrastruttura.
Passaggi successivi
- Componenti di base dell'affidabilità in Google Cloud
- Valuta i requisiti di affidabilità per i carichi di lavoro cloud
- Progetta un'infrastruttura affidabile per i tuoi carichi di lavoro in Google Cloud
- Gestisci il traffico e il carico per i tuoi carichi di lavoro in Google Cloud
- Gestisci e monitora la tua Google Cloud infrastruttura
Collaboratori
Autori:
- Nir Tarcic | Cloud Lifecycle SRE UTL
- Kumar Dhanagopal | Cross-Product Solution Developer
Altri collaboratori:
- Alok Kumar | Distinguished Engineer
- Andrew Fikes | Engineering Fellow, Reliability
- Chris Heiser | SRE TL
- David Ferguson | Director, Site Reliability Engineering
- Joe Tan | Senior Product Counsel
- Krzysztof Duleba | Principal Engineer
- Narayan Desai | Principal SRE
- Sailesh Krishnamurthy | VP, Engineering
- Steve McGhee | Reliability Advocate
- Sudhanshu Jain | Product Manager
- Yaniv Aknin | Software Engineer