Esta página fornece detalhes sobre a resiliência da aplicação Google Cloud NetApp Volumes.
Considerações sobre a resiliência das aplicações
Embora os volumes NetApp tenham elevada disponibilidade, os eventos de manutenção planeada, como atualizações da plataforma, atualizações de serviços, atualizações de software ou falhas de componentes não planeadas no serviço, podem levar a breves pausas nas operações de entrada e saída (E/S).
Pausas de E/S
O software cliente do Sistema de Arquivos de Rede (NFS), do Bloco de Mensagens do Servidor (SMB) e do iSCSI no seu sistema operativo processa pausas curtas de E/S. O cliente aguarda e repete as operações de I/O sem apresentar o problema à aplicação. Estas pausas curtas são consideradas não disruptivas porque, embora os utilizadores da aplicação possam ver tempos de resposta mais longos, a aplicação não comunica erros de E/S.
Para pausas de E/S mais longas, o comportamento depende do cliente NFS, SMB ou iSCSI do seu sistema operativo e dos potenciais limites de tempo configurados na aplicação. As secções seguintes abordam detalhes específicos do protocolo para pausas de E/S.
Pausas de E/S de NFS
Todas as chamadas para uma partilha NFS montada de forma rígida e indisponível são bloqueadas no cliente NFS e aguardam indefinidamente até o servidor NFS responder novamente. Enquanto o cliente NFS aguarda, aparecem mensagens nos registos do cliente que indicam que o servidor NFS não está a responder.
Do ponto de vista da aplicação, as operações de I/O, como leitura ou escrita, são bloqueadas e permanecem pendentes até que a partilha NFS seja devolvida com êxito. Durante as pausas de I/O, nenhuma operação de I/O é perdida e os volumes NetApp garantem a consistência dos dados, a menos que pare forçosamente as operações de I/O pendentes do lado do cliente.
Use aplicações de software de cluster para automatizar as comutações por falha
Se usar aplicações de software de cluster, como o Pacemaker, nas VMs do cliente para automatizar a comutação por falha da sua aplicação, configure os limites de tempo para partilhas NFS de modo a resistir a eventos de manutenção de volumes NetApp. Estas comutações por falha anulam as operações de I/O pendentes no cliente e podem resultar em transações perdidas. Recomendamos os seguintes limites de tempo:
| Tipo de protocolo | Tempo limite recomendado | Notas |
|---|---|---|
| Partilhas NFSv3 | 60 segundos (para níveis de serviço Standard, Premium e Extreme)
120 segundos (para o nível de serviço Flex) |
Recomendamos que use um método de vedação, que usa a opção de montagem nolock, em vez de depender de bloqueios NFS. |
| NFSv4.1 | 105 segundos (para níveis de serviço Standard, Premium e Extreme)
165 segundos (para o nível de serviço Flex) |
O protocolo NFSv4.1 adiciona automaticamente um bloqueio fiável sobre o NFSv3 (NFSv4.x RFC, secção 9.6.2), que pode usar como um mecanismo de restrição. A recuperação do estado de bloqueio adiciona 45 segundos. |
Pausas de E/S de partilha do SMB
Ao contrário do NFS, as sessões SMB usam uma ligação que pode expirar. Na maioria dos casos, os volumes do NetApp permanecem abaixo dos limites de tempo.
Limites de tempo da sessão
O tempo limite da sessão é definido no cliente. O limite de tempo predefinido para clientes Windows é de 60 segundos. Pode executar o comando
Get-SmbClientConfiguration/Set-SmbClientConfiguration usando o parâmetro
SessionTimeout para ler ou alterar o limite de tempo da sessão.
Se ocorrer um limite de tempo da sessão, a sessão SMB é interrompida e é comunicado um erro de E/S à aplicação que está a fazer a E/S. O Explorador de ficheiros ou as aplicações do Microsoft 365 voltam a ligar-se assim que o utilizador acede novamente à partilha SMB. Quando ocorrem erros de E/S, algumas aplicações tentam restabelecer a ligação e repetir a operação de E/S com falha, enquanto outras não o fazem. Consulte a documentação do fornecedor da aplicação para saber como a aplicação processa os limites de tempo do SMB e pode funcionar de forma resiliente em partilhas SMB.
As partilhas continuamente disponíveis (CA) são uma funcionalidade do SMB3.x que melhora a resiliência da comutação por falha para aplicações semelhantes a bases de dados. Os volumes NetApp suportam partilhas disponíveis continuamente para o Microsoft SQL Server e o FSLogix.
A recuperação de falhas melhora com cada nova versão do SMB. Os volumes NetApp suportam SMB 2.1, 3.0 e 3.1.1. Se possível, use a versão SMB suportada mais recente. O Windows 10/Server 2016 e versões posteriores suportam a versão 3.1.1 mais recente do SMB.
Precauções baseadas em aplicações para PMEs
Determinadas aplicações baseadas em SMB requerem a funcionalidade de comutação em caso de falha transparente de SMB. A funcionalidade de comutação por falha transparente do SMB permite operações de manutenção em volumes SMB nos volumes NetApp sem interromper a conetividade com aplicações de servidor que armazenam e acedem a dados. Os volumes NetApp suportam a opção de partilhas SMB continuamente disponíveis para garantir que aplicações específicas suportam a comutação em caso de falha transparente do SMB. A utilização de partilhas disponíveis continuamente de SMB suporta apenas as seguintes cargas de trabalho:
Contentores de perfis de utilizadores do FSLogix
Microsoft SQL Server (não Linux SQL Server)
As partilhas SMB continuamente disponíveis não suportam aplicações personalizadas.
Pausas de E/S iSCSI
Em ambientes Linux e Windows, os clientes iSCSI (iniciadores) processam as pausas de E/S repetindo os comandos até que o destino (volumes NetApp) fique disponível. Durante eventos de manutenção curtos, o iniciador iSCSI tenta restabelecer a ligação e retomar as operações de E/S pendentes, o que ajuda a manter a resiliência da aplicação.
Tempos limite de iSCSI
A configuração adequada dos limites de tempo iSCSI é essencial para manter a resiliência da aplicação durante eventos de manutenção ou interrupções inesperadas do serviço.
Para sistemas Linux, os volumes NetApp usam as predefinições do iniciador iSCSI. Estas definições incluem configurações específicas da NetApp no mapeamento de dispositivos multipath do Linux predefinido, que gere automaticamente os requisitos de tempo limite durante os eventos de manutenção de volumes da NetApp.
No entanto, para sistemas Windows, modifique as definições de MPIO do Windows com o seguinte comando para processar os eventos de manutenção de volumes NetApp.
Set-MPIOSetting -NewPathVerificationState Enabled ` -NewPDORemovePeriod 130 ` -NewRetryCount 6 ` -CustomPathRecovery Enabled ` -NewPathRecoveryInterval 30 `
Durante as pausas de E/S, o iniciador iSCSI tenta novamente os comandos e mantém a E/S pendente durante o período de limite de tempo. Se o tempo limite for excedido, o sistema operativo pode comunicar erros de E/S à aplicação, o que pode resultar em transações perdidas ou exigir a recuperação ao nível da aplicação.
Considerações sobre a aplicação e o cluster
Se usar software de clustering ou aplicações que automatizam a comutação por falha, configure os limites de tempo limite iSCSI para acomodar eventos de manutenção de volumes NetApp. A comutação por falha prematura pode anular as operações de I/O pendentes e pode resultar na perda de dados ou transações. Consulte sempre a documentação da aplicação e do sistema operativo para conhecer as práticas recomendadas sobre as definições de limite de tempo do iSCSI.
Interrupções da aplicação relacionadas com eventos de manutenção
Os eventos de manutenção planeados, como atualizações da plataforma e atualizações de software de serviço, podem ocorrer ocasionalmente. Os eventos de manutenção são considerados não disruptivos do ponto de vista de um protocolo de ficheiros (NFS ou SMB), desde que a aplicação consiga processar as pausas de E/S que possam ocorrer durante estes eventos.
Para os níveis de serviço Standard, Premium e Extreme, as pausas de E/S são normalmente curtas e variam entre alguns segundos e 30 segundos.
Para o nível de serviço Flex, as pausas de E/S podem durar até 70 segundos.
O que se segue?
Leia acerca das considerações de segurança do Google Cloud NetApp Volumes.