Questo principio del pilastro dell'affidabilità del Google Cloud Well-Architected Framework fornisce consigli per aiutarti a progettare i tuoi Google Cloud workload in modo che non si interrompano bruscamente.
Questo principio è pertinente all'area di interesse della risposta dell'affidabilità.
Panoramica del principio
La riduzione controllata è un approccio di progettazione in cui un sistema che subisce un carico elevato continua a funzionare, possibilmente con prestazioni o accuratezza ridotte. La riduzione controllata garantisce la disponibilità continua del sistema e impedisce un guasto completo, anche se il lavoro del sistema non è ottimale. Quando il carico torna a un livello gestibile, il sistema riprende la funzionalità completa.
Ad esempio, durante i periodi di carico elevato, la Ricerca Google assegna la priorità ai risultati delle pagine web con un ranking più alto, sacrificando potenzialmente una certa accuratezza. Quando il carico diminuisce, la Ricerca Google ricalcola i risultati di ricerca.
Consigli
Per progettare i sistemi per la riduzione controllata, tieni presente i suggerimenti nelle seguenti sottosezioni.
Implementa la limitazione
Assicurati che le repliche possano gestire in modo indipendente i sovraccarichi e limitare le richieste in entrata durante gli scenari di traffico elevato. Questo approccio ti aiuta a prevenire guasti a cascata causati da spostamenti di traffico in eccesso tra le zone.
Utilizza strumenti come Apigee per controllare la frequenza delle richieste API durante i periodi di traffico elevato. Puoi configurare le regole dei criteri in modo che riflettano il modo in cui vuoi ridurre le richieste.
Elimina le richieste in eccesso in anticipo
Configura i sistemi in modo che eliminino le richieste in eccesso nel livello frontend per proteggere i componenti backend. L'eliminazione di alcune richieste impedisce guasti globali e consente al sistema di ripristinarsi in modo più graduale.Con questo approccio, alcuni utenti potrebbero riscontrare errori. Tuttavia, puoi ridurre al minimo l'impatto delle interruzioni, a contrasto di un approccio come l'interruzione del circuito, in cui tutto il traffico viene eliminato durante un sovraccarico.
Gestisci gli errori parziali e i tentativi
Crea le applicazioni in modo che gestiscano senza problemi gli errori parziali e i tentativi. Questo design contribuisce a garantire che venga gestito il maggior traffico possibile durante gli scenari di carico elevato.
Testa gli scenari di sovraccarico
Per verificare che i meccanismi di limitazione e di eliminazione delle richieste funzionino in modo efficace, simula regolarmente le condizioni di sovraccarico nel sistema. I test contribuiscono a garantire che il sistema sia preparato per i picchi di traffico reali.
Monitora i picchi di traffico
Utilizza strumenti di analisi e monitoraggio per prevedere e rispondere ai picchi di traffico prima che si trasformino in sovraccarichi. Il rilevamento e la risposta tempestivi possono contribuire a mantenere la disponibilità del servizio durante i periodi di forte domanda.