A IA generativa no Vertex AI (também conhecida como IA gen ou IA generativa) dá-lhe acesso aos modelos de IA generativa da Google para várias modalidades (texto, código, imagens e voz). Pode testar e otimizar estes modelos de linguagem (conteúdo extenso) (MDLs/CE) e, em seguida, implementá-los para utilização nas suas aplicações com tecnologia de IA. Para mais informações, consulte a vista geral da IA generativa no Vertex AI.
O Vertex AI tem uma variedade de modelos base da IA generativa que são acessíveis através de uma API, incluindo os modelos usados neste guia. Para mais informações sobre como escolher um modelo, consulte Modelos Google.
Cada modelo é exposto através de um ponto final do publicador específico do seu Google Cloud projeto, pelo que não é necessário implementar o modelo base, a menos que precise de o otimizar para um caso de utilização específico. Pode enviar um comando para o ponto final do publicador. Um comando é um pedido de linguagem natural enviado a um MDG para obter uma resposta.
Este tutorial demonstra fluxos de trabalho que geram respostas a partir de modelos da Vertex AI através do envio de comandos de texto para os pontos finais do publicador usando um conetor do Workflows ou um pedido HTTP POST
. Para mais informações, consulte a
vista geral do conetor da API Vertex AI
e faça um pedido HTTP.
Tenha em atenção que pode implementar e executar cada fluxo de trabalho de forma independente.
Implemente um fluxo de trabalho que descreva uma imagem
Implemente um fluxo de trabalho que use um método de conector (generateContent
) para fazer um pedido a um ponto final do publicador do modelo. O método oferece suporte para a geração de conteúdo com entradas multimodais.
O fluxo de trabalho fornece um comando de texto e o URI de uma imagem que está disponível publicamente num contentor do Cloud Storage. Pode ver a imagem e, na Google Cloud consola, pode ver os detalhes do objeto.
O fluxo de trabalho devolve uma descrição da imagem a partir da resposta gerada pelo modelo.
Para mais informações sobre os parâmetros do corpo do pedido HTTP usados quando pede ao MDG, e os elementos do corpo da resposta, consulte a referência da API Gemini.
Consola
Na Google Cloud consola, aceda à página Fluxos de trabalho.
Clique em
Criar.Introduza um nome para o novo fluxo de trabalho:
describe-image
.Na lista Região, selecione us-central1 (Iowa).
Para a conta de serviço, selecione a conta de serviço que criou anteriormente.
Clicar em Seguinte.
No editor de fluxos de trabalho, introduza a seguinte definição para o seu fluxo de trabalho:
Clique em Implementar.
gcloud
Crie um ficheiro de código-fonte para o seu fluxo de trabalho:
touch describe-image.yaml
Num editor de texto, copie o seguinte fluxo de trabalho para o ficheiro de código-fonte:
Implemente o fluxo de trabalho introduzindo o seguinte comando:
gcloud workflows deploy describe-image \ --source=describe-image.yaml \ --location=us-central1 \ --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Execute o fluxo de trabalho
A execução de um fluxo de trabalho executa a definição do fluxo de trabalho atual associada ao fluxo de trabalho.
Consola
Na Google Cloud consola, aceda à página Fluxos de trabalho.
Na página Fluxos de trabalho, selecione o fluxo de trabalho describe-image para aceder à respetiva página de detalhes.
Na página Detalhes do fluxo de trabalho, clique em play_arrow Executar.
Para a Entrada, introduza o seguinte:
{"image_url":"gs://generativeai-downloads/images/scones.jpg"}
Clique novamente em Executar.
Veja os resultados do fluxo de trabalho no painel Saída.
O resultado deve ser semelhante ao seguinte:
{ "image_description": "There are three pink peony flowers on the right side of the picture[]...]There is a white napkin on the table.", "image_url": "gs://generativeai-downloads/images/scones.jpg" }
gcloud
Abra um terminal.
Execute o fluxo de trabalho:
gcloud workflows run describe-image \ --data='{"image_url":"gs://generativeai-downloads/images/scones.jpg"}'
Os resultados da execução devem ser semelhantes aos seguintes:
Waiting for execution [258b530e-a093-46d7-a4ff-cbf5392273c0] to complete...done. argument: '{"image_url":"gs://generativeai-downloads/images/scones.jpg"}' createTime: '2024-02-09T13:59:32.166409938Z' duration: 4.174708484s endTime: '2024-02-09T13:59:36.341118422Z' name: projects/1051295516635/locations/us-central1/workflows/describe-image/executions/258b530e-a093-46d7-a4ff-cbf5392273c0 result: "{\"image_description\":\"The picture shows a rustic table with a white surface,\ \ on which there are several scones with blueberries, as well as two cups of coffee\ [...] \ on the table. The background of the table is a dark blue color.\",\"image_url\"\ :\"gs://generativeai-downloads/images/scones.jpg\"}" startTime: '2024-02-09T13:59:32.166409938Z' state: SUCCEEDED
Implemente um fluxo de trabalho que gere históricos de países
Implemente um fluxo de trabalho que percorre uma lista de entrada de países em paralelo e usa um método de conetor (generateContent
) para fazer um pedido a um ponto final do publicador do modelo. O método oferece suporte para a geração de conteúdo com entradas multimodais.
O fluxo de trabalho devolve os históricos de países gerados pelo modelo, combinando-os num mapa.
Para mais informações sobre os parâmetros do corpo do pedido HTTP usados quando pede ao MDG, e os elementos do corpo da resposta, consulte a referência da API Gemini.
Consola
Na Google Cloud consola, aceda à página Fluxos de trabalho.
Clique em
Criar.Introduza um nome para o novo fluxo de trabalho:
gemini-pro-country-histories
.Na lista Região, selecione us-central1 (Iowa).
Para a conta de serviço, selecione a conta de serviço que criou anteriormente.
Clicar em Seguinte.
No editor de fluxos de trabalho, introduza a seguinte definição para o seu fluxo de trabalho:
Clique em Implementar.
gcloud
Crie um ficheiro de código-fonte para o seu fluxo de trabalho:
touch gemini-pro-country-histories.yaml
Num editor de texto, copie o seguinte fluxo de trabalho para o ficheiro de código-fonte:
Implemente o fluxo de trabalho introduzindo o seguinte comando:
gcloud workflows deploy gemini-pro-country-histories \ --source=gemini-pro-country-histories.yaml \ --location=us-central1 \ --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Execute o fluxo de trabalho
A execução de um fluxo de trabalho executa a definição do fluxo de trabalho atual associada ao fluxo de trabalho.
Consola
Na Google Cloud consola, aceda à página Fluxos de trabalho.
Na página Fluxos de trabalho, selecione o fluxo de trabalho gemini-pro-country-histories para aceder à respetiva página de detalhes.
Na página Detalhes do fluxo de trabalho, clique em play_arrow Executar.
Para a Entrada, introduza o seguinte:
{"countries":["Argentina", "Bhutan", "Cyprus", "Denmark", "Ethiopia"]}
Clique novamente em Executar.
Veja os resultados do fluxo de trabalho no painel Saída.
O resultado deve ser semelhante ao seguinte:
{ "Argentina": "The history of Argentina is a complex and fascinating one, marked by periods of prosperity and decline, political [...] "Bhutan": "The history of Bhutan is a rich and fascinating one, dating back to the 7th century AD. Here is a brief overview: [...] "Cyprus": "The history of Cyprus is a long and complex one, spanning over 10,000 years. The island has been ruled by a succession [...] "Denmark": "1. **Prehistory and Early History (c. 12,000 BC - 800 AD)**\\n - The earliest evidence of human habitation in Denmark [...] "Ethiopia": "The history of Ethiopia is a long and complex one, stretching back to the earliest human civilizations. The country is [...] }
gcloud
Abra um terminal.
Execute o fluxo de trabalho:
gcloud workflows run gemini-pro-country-histories \ --data='{"countries":["Argentina", "Bhutan", "Cyprus", "Denmark", "Ethiopia"]}' \ --location=us-central1
Os resultados da execução devem ser semelhantes aos seguintes:
Waiting for execution [7ae1ccf1-29b7-4c2c-99ec-7a12ae289391] to complete...done. argument: '{"countries":["Argentina","Bhutan","Cyprus","Denmark","Ethiopia"]}' createTime: '2024-02-09T16:25:16.742349156Z' duration: 12.075968673s endTime: '2024-02-09T16:25:28.818317829Z' name: projects/1051295516635/locations/us-central1/workflows/gemini-pro-country-histories/executions/7ae1ccf1-29b7-4c2c-99ec-7a12ae289391 result: "{\"Argentina\":\"The history of Argentina can be traced back to the arrival\ [...] n* 2015: Argentina elects Mauricio Macri as president.\",\"Bhutan\":\"The history\ [...] \ natural beauty, ancient monasteries, and friendly people.\",\"Cyprus\":\"The history\ [...] ,\"Denmark\":\"The history of Denmark can be traced back to the Stone Age, with\ [...] \ a high standard of living.\",\"Ethiopia\":\"The history of Ethiopia is long and\ [...] startTime: '2024-02-09T16:25:16.742349156Z' state: SUCCEEDED
Implemente um fluxo de trabalho que resuma um documento grande
Implemente um fluxo de trabalho que divida um documento grande em partes mais pequenas, fazendo pedidos http.post
a um ponto final do publicador de modelos em paralelo para que o modelo possa resumir cada parte em simultâneo. Por fim, o fluxo de trabalho combina todos os resumos parciais num resumo completo.
Para mais informações sobre os parâmetros do corpo do pedido HTTP usados quando pede ao MDG, e os elementos do corpo da resposta, consulte a referência da API Gemini.
A definição do fluxo de trabalho pressupõe que criou um contentor do Cloud Storage para o qual pode carregar um ficheiro de texto. Para mais informações
acerca do conetor Workflows (googleapis.storage.v1.objects.get
)
usado para obter objetos do contentor do Cloud Storage, consulte a
referência de conetores.
Depois de implementar o fluxo de trabalho, pode executá-lo criando um acionador do Eventarc adequado e, em seguida, carregando um ficheiro para o contentor. Para mais informações, consulte o artigo Encaminhe eventos do Cloud Storage para fluxos de trabalho.
Tenha em atenção que têm de ser ativadas APIs adicionais e concedidas funções adicionais, incluindo a concessão à sua conta de serviço da função de utilizador do objeto de armazenamento (roles/storage.objectUser
) que suporta a utilização de objetos do Cloud Storage. Para mais informações, consulte a secção
Prepare-se para criar um acionador.
Consola
Na Google Cloud consola, aceda à página Fluxos de trabalho.
Clique em
Criar.Introduza um nome para o novo fluxo de trabalho:
gemini-pro-summaries
.Na lista Região, selecione us-central1 (Iowa).
Para a conta de serviço, selecione a conta de serviço que criou anteriormente.
Clicar em Seguinte.
No editor de fluxos de trabalho, introduza a seguinte definição para o seu fluxo de trabalho:
Clique em Implementar.
gcloud
Crie um ficheiro de código-fonte para o seu fluxo de trabalho:
touch gemini-pro-summaries.yaml
Num editor de texto, copie o seguinte fluxo de trabalho para o ficheiro de código-fonte:
Implemente o fluxo de trabalho introduzindo o seguinte comando:
gcloud workflows deploy gemini-pro-summaries \ --source=gemini-pro-summaries.yaml \ --location=us-central1 \ --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com