Modelos de aprovisionamento de instâncias do Compute Engine

Este documento descreve os modelos de aprovisionamento para instâncias do Compute Engine.

Quando cria uma instância, tem de definir o método, denominado modelo de aprovisionamento, que quer usar para obter os recursos pedidos. Cada modelo de aprovisionamento determina a disponibilidade, a duração e os preços das suas instâncias. Compreender estes modelos permite-lhe escolher a melhor opção para a sua carga de trabalho.

Modelos de aprovisionamento disponíveis

Quando cria uma instância de computação, pode especificar um dos seguintes modelos de aprovisionamento. Se não especificar um modelo de aprovisionamento, o Compute Engine usa o modelo de aprovisionamento padrão por predefinição.

  • Standard

  • Espaço

  • Flex-start

  • Associado a reserva

A tabela seguinte ajuda a comparar os exemplos de utilização e os preços de cada modelo de aprovisionamento:

Standard Espaço Flex-start Associado a reserva
Resumo
  • Com base na disponibilidade de recursos, pode criar imediatamente instâncias.
  • Pode controlar quando parar ou eliminar instâncias.
  • Com base na disponibilidade de recursos, pode criar imediatamente instâncias.
  • Pode controlar quando parar ou eliminar instâncias. No entanto, também permite que o Compute Engine pare ou elimine instâncias em qualquer altura para reaver capacidade.
  • Com base na disponibilidade de recursos, pode criar instâncias num tempo de espera especificado. Para uma instância autónoma, pode especificar um tempo de espera de até duas horas. Para um pedido de redimensionamento de MIG, o tempo de espera é indefinido.
  • Pode controlar quando parar ou eliminar instâncias. No entanto, não pode suspender nem recriar os mesmos. As instâncias são executadas durante um mínimo de 10 minutos e um máximo de sete dias. Quando as instâncias atingem a duração de execução, o Compute Engine para ou elimina as instâncias com base na respetiva ação de encerramento.
  • Pode pedir para reservar capacidade numa data futura para criar instâncias com GPUs anexadas. Se a Google Google Cloud aprovar o seu pedido, o Compute Engine cria uma reserva. No início do período de reserva, pode consumir a reserva criando instâncias de GPU que correspondam à reserva.
  • Durante o período de reserva aprovado, pode parar, reiniciar, eliminar e recriar instâncias para consumir a reserva conforme necessário. Quando o período de reserva termina, o Compute Engine elimina a reserva e para ou elimina todas as instâncias que consomem a reserva com base na respetiva ação de rescisão.
Exemplos de utilização

Ideais para cargas de trabalho que requerem estabilidade e funcionamento contínuo, como as seguintes cargas de trabalho:

  • Servidores Web
  • Bases de dados
  • Aplicações empresariais
  • Desenvolvimento e testes

Ideais para cargas de trabalho que podem tolerar interrupções, como as seguintes cargas de trabalho:

  • Processamento em lote
  • Informática de elevado desempenho (HPC)
  • Integração contínua e implementação contínua (CI/CD)
  • Análise de dados
  • Codificação de multimédia
  • Inferência online

Cargas de trabalho que requerem estabilidade e têm de ser executadas durante, no máximo, sete dias, como as seguintes cargas de trabalho:

  • Pré-treino de modelos pequenos
  • Ajuste do modelo
  • Simulação de HPC
  • Inferência em lote

Ideal para cargas de trabalho que requerem estabilidade e um tempo de execução específico, como as seguintes:

  • Para cargas de trabalho com duração máxima de 90 dias:

    • Tarefas de pré-treino de modelos
    • Tarefas de ajuste do modelo
    • Cargas de trabalho de simulação de HPC
    • Aumentos esperados a curto prazo nas cargas de trabalho de inferência
  • Para cargas de trabalho com mais de 90 dias:

    • Cargas de trabalho de preparação
    • Cargas de trabalho de inferência
Preços
  • Incorre em preços padrão para instâncias. Veja os preços das instâncias de VM.
  • Incorre em custos com base no método que usa para criar instâncias:

    • Se criar instâncias imediatamente, paga à medida que usa (PAYG).
    • Se criar instâncias através de uma reserva a pedido ou uma reserva criada automaticamente para uma reserva futura, então é-lhe cobrado o valor até a reserva existir. Para mais informações, consulte a faturação de reservas.
  • Com base na série de máquinas que as suas instâncias usam, recebe um desconto da seguinte forma:

    • Para as séries de máquinas A4, A3 e A2, recebe um desconto de 53% nas vCPUs, na memória e nas GPUs.
    • Para a série de máquinas H4D, recebe um desconto de 25% nas vCPUs e na memória.
    Outras séries de máquinas suportadas não são elegíveis para descontos. Para mais informações, consulte os preços do Dynamic Workload Scheduler (DWS).
  • Paga à medida que usa.
Quota Quando cria uma instância, é consumida a quota padrão. Quando cria uma instância, é consumida a quota de instâncias preemptíveis . Se o seu projeto não tiver quota preemptível, é consumida a quota padrão. Google Cloud Os créditos do nível gratuito não se aplicam a VMs do Spot. Quando o MIG adiciona instâncias ao grupo, a quota preemptível é consumida. Se o seu projeto não tiver quota preemptível, a quota padrão é consumida. A quota não se aplica ao modelo de aprovisionamento associado a reservas.

Disponibilidade e duração das instâncias

A tabela seguinte mostra a disponibilidade e a duração das instâncias de computação para cada modelo de aprovisionamento:

Standard Espaço Flex-start Associado a reserva
Pré-requisitos de criação Não existem pré-requisitos de criação. Não existem pré-requisitos de criação. Não existem pré-requisitos de criação.

Para criar instâncias, primeiro tem de reservar capacidade através de um dos seguintes métodos:

Na data e hora de entrega escolhidas, o Compute Engine aprovisiona a capacidade pedida. Em seguida, pode consumir a capacidade criando instâncias.

Séries de máquinas suportadas Pode usar qualquer série de máquinas, exceto A4X, A4 e A3 Ultra. Pode usar qualquer série de máquinas, exceto instâncias A4X, X4 e bare metal.

Só pode usar as seguintes séries de máquinas:

Com base na forma como reserva capacidade para criar VMs, só pode usar as seguintes séries de máquinas:

Disponibilidade da instância Pode criar instâncias em qualquer altura, desde que os recursos pedidos estejam disponíveis. Pode criar instâncias em qualquer altura, desde que os recursos pedidos estejam disponíveis.

Pode criar instâncias da seguinte forma:

O Compute Engine usa o DWS para agendar o aprovisionamento da capacidade pedida com base na disponibilidade de recursos. O DWS ajuda a obter recursos de elevada procura, como GPUs.

Só pode criar instâncias depois de reservar capacidade para uma data futura. Na data pedida, o Compute Engine fornece a capacidade pedida, que pode usar para criar instâncias. Se reservar recursos através de reservas futuras no modo de calendário, o Compute Engine usa o DWS para aprovisionar a capacidade pedida. O DWS ajuda a obter recursos de elevada procura, como GPUs.
Garantia de capacidade Com base no método de criação. A garantia de capacidade varia consoante o método que usa para criar instâncias, da seguinte forma:
  • Se criar instâncias imediatamente, o Compute Engine faz tentativas da melhor forma possível para aprovisionar a capacidade pedida.
  • Se criar instâncias consumindo uma reserva a pedido ou uma reserva criada automaticamente para uma reserva futura, tem uma garantia muito elevada de que o Compute Engine aprovisiona a capacidade pedida se a reserva tiver capacidade reservada disponível.
Melhor esforço. Quando cria VMs Spot, o Compute Engine faz tentativas de melhor esforço para aprovisionar a capacidade pedida. Melhor esforço. Quando cria um pedido de redimensionamento de MIG, o Compute Engine faz tentativas de melhor esforço para agendar o aprovisionamento da capacidade pedida. Muito elevado. Se o Google Cloud Platform aprovar o seu pedido de reserva, tem uma garantia muito elevada de que o Compute Engine aprovisiona a sua capacidade reservada na data e hora de entrega escolhidas. Google Cloud Tem acesso exclusivo à capacidade reservada durante o período de reserva.
Ciclo de vida da instância Pode controlar quando parar ou eliminar uma instância. No entanto, se o tipo de máquina que a instância usa não suportar a migração em direto, o Compute Engine para a instância durante os eventos de manutenção do anfitrião.

Pode controlar quando parar ou eliminar uma instância, exceto nos seguintes casos:

  • O Compute Engine para ou elimina a instância para recuperar a capacidade. Este processo é denominado preempção.
  • Se o tipo de máquina que a instância usa não suportar a migração em direto, o Compute Engine para a instância durante os eventos de manutenção do anfitrião.

Antes de uma instância atingir o fim da respetiva duração de execução, pode fazer o seguinte:

  • Parar a instância: pode parar a instância em qualquer altura apenas se tiver sido criada como uma instância autónoma.
  • Eliminar a instância: pode eliminar a instância em qualquer altura.

Quando uma instância atinge o fim da duração da execução, o Compute Engine elimina-a.

Pode controlar quando parar ou eliminar uma instância, exceto nos seguintes casos:

  • O Compute Engine para a instância durante os eventos de manutenção do anfitrião.
  • A reserva criada automaticamente para aprovisionar a capacidade pedida atinge o fim do respetivo período de reserva comprometido. Nessa altura, o Compute Engine elimina a reserva e para ou elimina todas as instâncias que consomem a reserva com base na ação de rescisão especificada na respetiva configuração.

Modelos de aprovisionamento para implementações densas

Para implementar cargas de trabalho de computação de elevado desempenho (HPC), inteligência artificial (IA) e aprendizagem automática (AA) no Google Cloud, os recursos de computação têm de estar fisicamente próximos uns dos outros para minimizar os saltos de rede e otimizar para a latência mais baixa. O Compute Engine oferece métodos de aprovisionamento que lhe permitem reservar grupos de anfitriões fortemente acoplados interligados por uma estrutura de rede de alta velocidade num único centro de dados.

Para mais informações sobre os métodos de aprovisionamento para implementações densas, consulte o seguinte:

O que se segue?