Neste documento, descrevemos os modelos de provisionamento para instâncias do Compute Engine.
Ao criar uma instância, é necessário definir o método, chamado de modelo de provisionamento, que você quer usar para receber os recursos solicitados. Cada modelo de provisionamento determina a disponibilidade, o ciclo de vida e o preço das suas instâncias. Ao entender esses modelos, você pode escolher a melhor opção para sua carga de trabalho.
Modelos de provisionamento disponíveis
Ao criar uma instância de computação, é possível especificar um dos seguintes modelos de provisionamento. Se você não especificar um modelo de provisionamento, o Compute Engine usará o modelo padrão por padrão.
Padrão
Spot
Início flexível
Vinculada à reserva
A tabela a seguir ajuda a comparar os casos de uso e os preços de cada modelo de provisionamento:
| Padrão | Spot | Início flexível | Vinculada à reserva | |
|---|---|---|---|---|
| Resumo |
|
|
|
|
| Casos de uso |
Ideal para cargas de trabalho que exigem estabilidade e operação contínua, como:
|
Ideal para cargas de trabalho que toleram interrupções, como as seguintes:
|
Cargas de trabalho que exigem estabilidade e precisam ser executadas por no máximo sete dias, como:
|
Ideal para cargas de trabalho que exigem estabilidade e um tempo de execução específico, como:
|
| Preços |
|
|
|
|
| Cota | Quando você cria uma instância, a cota padrão é consumida. | Quando você cria uma instância, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida. Os créditos do Nível gratuito doGoogle Cloud não se aplicam às VMs do Spot. | Quando o MIG adiciona instâncias ao grupo, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida. | A cota não se aplica ao modelo de provisionamento vinculado à reserva. |
Disponibilidade e vida útil da instância
A tabela a seguir mostra a disponibilidade e o ciclo de vida das instâncias de computação para cada modelo de provisionamento:
| Padrão | Spot | Início flexível | Vinculada à reserva | |
|---|---|---|---|---|
| Pré-requisitos de criação | Não há pré-requisitos de criação. | Não há pré-requisitos de criação. | Não há pré-requisitos de criação. |
Para criar instâncias, primeiro reserve capacidade usando um dos métodos a seguir:
Na data e hora de entrega escolhidas, o Compute Engine provisiona a capacidade solicitada. Em seguida, você pode consumir a capacidade criando instâncias. |
| Série de máquinas compatível | Você pode usar qualquer série de máquinas, exceto A4X, A4 e A3 Ultra. | É possível usar qualquer série de máquinas, exceto A4X, X4 e instâncias bare metal. |
Só é possível usar as seguintes séries de máquinas: |
Dependendo de como você reserva capacidade para criar VMs, só é possível usar as seguintes séries de máquinas:
|
| Disponibilidade da instância | É possível criar instâncias a qualquer momento, desde que os recursos solicitados estejam disponíveis. | É possível criar instâncias a qualquer momento, desde que os recursos solicitados estejam disponíveis. | É possível criar instâncias da seguinte maneira: O Compute Engine usa o DWS para programar o provisionamento da capacidade solicitada com base na disponibilidade de recursos. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs. |
Só é possível criar instâncias depois de reservar capacidade para uma data futura. Na data solicitada, o Compute Engine entrega a capacidade pedida, que pode ser usada para criar instâncias. Se você reservar recursos usando reservas adiantadas no modo de calendário, o Compute Engine usará o DWS para provisionar a capacidade solicitada. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs. |
| Garantia de capacidade | Com base no método de criação. A garantia de capacidade varia de acordo com o método usado para criar instâncias, da seguinte forma:
|
Melhor esforço. Ao criar Spot VMs, o Compute Engine faz o possível para provisionar a capacidade solicitada. | Melhor esforço. Quando você cria uma solicitação de redimensionamento de MIG, o Compute Engine faz o possível para programar o provisionamento da capacidade solicitada. | Muito alto. Se o Google Cloud aprovar sua solicitação de reserva, você terá uma garantia muito alta de que o Compute Engine vai provisionar a capacidade reservada na data e hora de entrega escolhidas. Você tem acesso exclusivo à capacidade reservada durante o período da reserva. |
| Vida útil da instância | Você pode controlar quando interromper ou excluir uma instância. No entanto, se o tipo de máquina usado pela instância não for compatível com a migração em tempo real, o Compute Engine vai interromper a instância durante os eventos de manutenção do host. |
Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
|
Antes que uma instância chegue ao fim da duração da execução, você pode fazer o seguinte:
Quando uma instância atinge o fim da duração da execução, o Compute Engine a exclui. |
Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
|
Modelos de provisionamento para implantações densas
Para implantar cargas de trabalho de computação de alto desempenho (HPC), inteligência artificial (IA) e machine learning (ML) no Google Cloud, os recursos de computação precisam estar fisicamente próximos uns dos outros para minimizar os saltos de rede e otimizar a menor latência. O Compute Engine oferece métodos de provisionamento que permitem reservar grupos de hosts fortemente acoplados interconectados por uma estrutura de rede de alta velocidade em um único data center.
Para mais informações sobre métodos de provisionamento para implantações densas, consulte:
- Instâncias H4D: Visão geral da criação de clusters de HPC
- Instâncias de GPU: Visão geral da capacidade na documentação do Hipercomputador de IA.
A seguir
Leia uma visão geral da criação de instâncias do Compute Engine.
Saiba mais sobre VMs spot.
Saiba mais sobre as VMs de início flexível.
Saiba mais sobre VMs que usam o modelo de provisionamento vinculado à reserva.