Tem de implementar os seus recursos personalizados de previsão no cluster de previsão que o operador de infraestrutura (IO) cria para si. O operador cria cargas de trabalho de previsão neste mesmo cluster.
Para criar o cluster de previsão, trabalhe com o IO para associar o seu projeto de previsão e alocar os conjuntos de nós necessários para previsões online no Google Distributed Cloud (GDC) air-gapped.
Para criar um cluster de previsão, siga estes passos:
Identifique o projeto na sua organização que quer associar ao novo cluster para previsões online.
Para criar um projeto, consulte o artigo Configure um projeto para o Vertex AI. Precisa do ID do projeto quando faz chamadas API.
Na lista de tipos de máquinas disponíveis no Distributed Cloud, escolha o tipo de máquina para os nós de que as suas cargas de trabalho precisam no cluster.
O tipo de máquina que escolher depende do tamanho e da complexidade do modelo de previsão e determina os recursos de computação e da unidade de processamento gráfico (GPU) que o IO fornece ao cluster. Siga as recomendações de seleção de nós quando selecionar o tipo de máquina para os seus nós.
Envie o IO por email através do modelo de registo de previsão de agrupamentos para abrir um registo e encaminhar o seu pedido de criação do agrupamento.
Se necessário, comunique com o IO até que este termine de criar o cluster de previsão associado ao seu projeto e de atribuir os conjuntos de nós adequados no cluster.
Após a conclusão do aprovisionamento do cluster, o cluster de previsão está pronto para previsões online.
Recomendações de seleção de nós
Quando a IO cria pools de nós num cluster, atribui um dos tipos de máquinas disponíveis na nuvem distribuída para fornecer um conjunto predefinido de recursos para os nós de trabalho. Consoante a dimensão e a complexidade do modelo, precisa de diferentes desempenhos de computação e, consequentemente, de uma quantidade específica de CPU, memória e GPU. Tem de fornecer estes detalhes na sua comunicação com a IO quando quiser criar um cluster de previsão.
Quando determina com a IO o tipo de máquina para os conjuntos de nós de que precisa no cluster de previsão, tem de seguir as seguintes práticas:
- A nuvem distribuída adiciona sobrecarga de computação aos nós para componentes do sistema obrigatórios. Por conseguinte, tem de escolher um tipo de máquina maior para os seus conjuntos de nós do que o que pretende usar no conjunto de recursos para os seus modelos.
- Escolha a solução que oferece os recursos de memória e computação mínimos necessários para os seus requisitos. Por exemplo, se o seu modelo precisar de oito vCPUs, escolha o tipo de máquina
n2-highcpu-8-gdc
, a solução mais pequena com oito vCPUs e 8 GB de memória na nuvem distribuída. - À medida que avança, considere soluções de maior desempenho apenas se as soluções mais pequenas não forem adequadas para as suas necessidades e para o tamanho e a complexidade do modelo. É fundamental seguir o princípio do menor privilégio, usando apenas os recursos de que precisa para executar o seu fluxo de trabalho específico. Esta abordagem responsável garante uma utilização ponderada dos recursos no ambiente da nuvem distribuída.
- Escolha apenas soluções com GPUs se as precisar para o seu modelo.
- Se o seu modelo precisar de GPUs, considere o
a2-highgpu-1g-gdc
tipo de máquina, a solução mais pequena que fornece GPUs.
Modelo de registo de cluster de previsão
Use o seguinte modelo para enviar um email à sua OI. O email abre um registo para criar o cluster de previsão de que precisa para as previsões online.
Good day,
I need to create a prediction cluster and associate it with a project in my organization to use online predictions.
Please use the following information for the creation of the cluster:
- **Cluster name:** vtx-ai-prediction
- **Name of the organization:** [Specify your organization's name.]
- **Project name:** [Specify the name of your project to associate with the prediction cluster.]
- **Machine type for the node pool:** [Specify the machine type you chose from the list of available machine types for the cluster nodes based on node selection recommendations. Please note that the IO can respond with a different suggestion based on your needs.]
- **Compute resources:** [Optionally, if you know how many compute resources your workloads need, describe them in this field.]
- **Memory resources:** [Optionally, if you know how many memory resources your workloads need, describe them in this field.]
- **GPU resources:** [Optionally, if you know how many GPU resources your workloads need, describe them in this field.]
**Note for IO:** Review the instructions to create the prediction cluster in the following section of the documentation: Operator > Configure the deployment > Create the Prediction cluster
Thank you,
[Your name]