Configurazione di un progetto e di un ambiente di sviluppo

Questa guida descrive come configurare un progetto Google Cloud per iniziare a utilizzare Gemini Enterprise Agent Platform Vision.

Configura il progetto

  1. Accedi al tuo account Google Cloud . Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
  2. Installa Google Cloud CLI.

  3. Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.

  4. Per inizializzare gcloud CLI, esegui questo comando:

    gcloud init
  5. Crea o seleziona un Google Cloud progetto.

    Ruoli richiesti per selezionare o creare un progetto

    • Seleziona un progetto: la selezione di un progetto non richiede un ruolo IAM specifico. Puoi selezionare qualsiasi progetto per il quale ti è stato concesso un ruolo.
    • Crea un progetto: per creare un progetto, devi disporre del ruolo Autore progetto (roles/resourcemanager.projectCreator), che contiene l'autorizzazione resourcemanager.projects.create. Scopri come concedere i ruoli.
    • Creare un progetto Google Cloud :

      gcloud projects create PROJECT_ID

      Sostituisci PROJECT_ID con un nome per il progetto Google Cloud che stai creando.

    • Seleziona il progetto Google Cloud che hai creato:

      gcloud config set project PROJECT_ID

      Sostituisci PROJECT_ID con il nome del progetto Google Cloud .

  6. Verifica che la fatturazione sia abilitata per il tuo progetto Google Cloud .

  7. Abilita l'API Vertex AI Vision:

    Ruoli richiesti per abilitare le API

    Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (roles/serviceusage.serviceUsageAdmin), che include l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

    gcloud services enable visionai.googleapis.com
  8. Configura l'autenticazione:

    1. Assicurati di disporre del ruolo IAM Creazione account di servizio (roles/iam.serviceAccountCreator) e del ruolo Amministratore IAM progetto (roles/resourcemanager.projectIamAdmin). Scopri come concedere i ruoli.
    2. Crea l'account di servizio:

      gcloud iam service-accounts create SERVICE_ACCOUNT_NAME

      Sostituisci SERVICE_ACCOUNT_NAME con un nome per il account di servizio.

    3. Concedi il ruolo IAM roles/visionai.editor al account di servizio:

      gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=roles/visionai.editor

      Sostituisci quanto segue:

      • SERVICE_ACCOUNT_NAME: il nome del account di servizio
      • PROJECT_ID: l'ID progetto in cui hai creato il account di servizio
    4. Genera il file della chiave:

      gcloud iam service-accounts keys create FILE_NAME.json --iam-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com

      Sostituisci quanto segue:

      • FILE_NAME: un nome per il file della chiave
      • SERVICE_ACCOUNT_NAME: il nome del account di servizio
      • PROJECT_ID: l'ID progetto in cui hai creato il account di servizio
  9. Imposta la variabile di ambiente GOOGLE_APPLICATION_CREDENTIALS sul percorso del file JSON contenente le tue credenziali. Questa variabile si applica solo alla sessione di shell corrente, quindi se apri una nuova sessione, imposta di nuovo la variabile.

  10. Installa Google Cloud CLI.

  11. Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.

  12. Per inizializzare gcloud CLI, esegui questo comando:

    gcloud init
  13. Crea o seleziona un Google Cloud progetto.

    Ruoli richiesti per selezionare o creare un progetto

    • Seleziona un progetto: la selezione di un progetto non richiede un ruolo IAM specifico. Puoi selezionare qualsiasi progetto per il quale ti è stato concesso un ruolo.
    • Crea un progetto: per creare un progetto, devi disporre del ruolo Autore progetto (roles/resourcemanager.projectCreator), che contiene l'autorizzazione resourcemanager.projects.create. Scopri come concedere i ruoli.
    • Creare un progetto Google Cloud :

      gcloud projects create PROJECT_ID

      Sostituisci PROJECT_ID con un nome per il progetto Google Cloud che stai creando.

    • Seleziona il progetto Google Cloud che hai creato:

      gcloud config set project PROJECT_ID

      Sostituisci PROJECT_ID con il nome del progetto Google Cloud .

  14. Verifica che la fatturazione sia abilitata per il tuo progetto Google Cloud .

  15. Abilita l'API Vertex AI Vision:

    Ruoli richiesti per abilitare le API

    Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (roles/serviceusage.serviceUsageAdmin), che include l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

    gcloud services enable visionai.googleapis.com
  16. Configura l'autenticazione:

    1. Assicurati di disporre del ruolo IAM Creazione account di servizio (roles/iam.serviceAccountCreator) e del ruolo Amministratore IAM progetto (roles/resourcemanager.projectIamAdmin). Scopri come concedere i ruoli.
    2. Crea l'account di servizio:

      gcloud iam service-accounts create SERVICE_ACCOUNT_NAME

      Sostituisci SERVICE_ACCOUNT_NAME con un nome per il account di servizio.

    3. Concedi il ruolo IAM roles/visionai.editor al account di servizio:

      gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=roles/visionai.editor

      Sostituisci quanto segue:

      • SERVICE_ACCOUNT_NAME: il nome del account di servizio
      • PROJECT_ID: l'ID progetto in cui hai creato il account di servizio
    4. Genera il file della chiave:

      gcloud iam service-accounts keys create FILE_NAME.json --iam-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com

      Sostituisci quanto segue:

      • FILE_NAME: un nome per il file della chiave
      • SERVICE_ACCOUNT_NAME: il nome del account di servizio
      • PROJECT_ID: l'ID progetto in cui hai creato il account di servizio
  17. Imposta la variabile di ambiente GOOGLE_APPLICATION_CREDENTIALS sul percorso del file JSON contenente le tue credenziali. Questa variabile si applica solo alla sessione di shell corrente, quindi se apri una nuova sessione, imposta di nuovo la variabile.

Per alcune attività devi utilizzare prodotti Google Cloud aggiuntivi oltre ad Agent Platform Vision. Potresti dover eseguire ulteriori attività di configurazione per utilizzare altri Google Cloud prodotti.

SDK Vision di Gemini Enterprise Agent Platform

L'Agent Platform Vision Software Development Kit (SDK) contiene strumenti e librerie per sviluppare programmi e flussi di lavoro personalizzati con Agent Platform Vision.

Questi strumenti si riferiscono a un insieme di file di origine binari che ti aiutano a migliorare la produttività quando utilizzi o sviluppi soluzioni utilizzando Agent Platform Vision. Puoi anche aggiungere questi file sorgente binari ai tuoi script per gestire implementazioni su larga scala. L'interfaccia a riga di comando (CLI) vaictl è un esempio in questa categoria.

Le librerie si riferiscono a un insieme di API di programmazione che puoi utilizzare per gestire, controllare ed eseguire operazioni di I/O di diversi moduli in modo programmatico con Agent Platform Vision. L'API di programmazione C++ è un esempio in questa categoria.

Il codice di strumenti e librerie è open source e invitiamo gli sviluppatori a crearli direttamente. Per gli strumenti, offriamo anche file binari precompilati su piattaforme specifiche che puoi scaricare per l'utilizzo diretto. Offriamo anche immagini Docker per i casi in cui la tua piattaforma non è supportata direttamente.

Prerequisiti

Considera questi prerequisiti prima di utilizzare l'SDK Gemini Enterprise Agent Platform Vision.

Piattaforme supportate

Supportiamo direttamente solo le macchine x86 che eseguono una distribuzione Linux basata su Debian. Se utilizzi una piattaforma diversa, offriamo anche un'immagine Docker con strumenti già creati e installati.

Requisiti software aggiuntivi

La maggior parte delle dipendenze software di terze parti richieste dall'SDK Vision di Gemini Enterprise Agent Platform vengono gestite automaticamente quando installi i file binari precompilati. Tuttavia, per utilizzare determinati aspetti delle funzionalità e dei flussi di lavoro dell'SDK, devi installare dipendenze aggiuntive. Questa sezione elenca queste eccezioni e spiega come scaricarle e installarle.

SDK Python

Il pacchetto Python pip installa automaticamente tutte le sue dipendenze. Tuttavia, l'installazione di base di Python deve soddisfare le seguenti condizioni:

  • Python >= 3.8.

Crea dipendenze dall'origine

La maggior parte degli utenti può utilizzare i file binari dell'SDK precompilati per il proprio flusso di lavoro. Se vuoi sviluppare e creare l'SDK dall'origine, devi anche assicurarti che il tuo sistema soddisfi i seguenti requisiti.

  • Installa Bazel. Per istruzioni di installazione, consulta la documentazione di Bazel.
  • Su Ubuntu 20.04, sono necessarie anche diverse dipendenze di sistema. Puoi installarli con il seguente comando:

    apt-get install -y --no-install-recommends \
        autoconf \
        automake \
        build-essential \
        ca-certificates \
        flex \
        bison \
        python3 \
        nasm \
        libjpeg-dev
    

Ottenere i programmi binari precompilati

Lo strumento vaictl è lo strumento binario pronto all'uso che può essere utilizzato per controllare Agent Platform Vision, nonché per inviare e ricevere i dati che elabora.

Questa sezione mostra i modi per scaricare e installare questo strumento.

Installa il pacchetto Debian

Hai due opzioni per utilizzare lo strumento a riga di comando vaictl, necessario per lavorare con I/O (dati di flusso):

  • Installa lo strumento a riga di comando localmente (sistema operativo: Debian GNU/Linux, architettura della CPU: x86_64) o
  • Esegui i comandi in un'immagine Docker in cui sono installate tutte le dipendenze.

Per ottenere lo strumento a riga di comando vaictl, segui questi passaggi:

Download pacchetto

Per le installazioni dirette, supportiamo solo le distribuzioni Debian/Ubuntu.

Puoi anche scaricare questo pacchetto Debian dalla pagina delle release di Gemini Enterprise Agent Platform Vision SDK su GitHub.

  1. (Facoltativo) Rimuovi le versioni precedenti di vaictl.

    Per installare lo strumento a riga di comando vaictl, devi eliminare eventuali versioni precedenti dello strumento sul tuo computer:

    sudo apt-get remove visionai
  2. Scarica il pacchetto richiesto. Puoi scaricare il pacchetto dalla pagina delle release di GitHub o utilizzare il seguente comando:
    wget https://github.com/google/visionai/releases/download/v0.0.5/visionai_0.0-5_amd64.deb
  3. Dopo aver scaricato il pacchetto, esegui questo comando nella directory in cui hai scaricato il file:
    sudo apt install ./visionai_0.0-5_amd64.deb
  4. Verifica l'installazione:
    vaictl --help

Scarica Docker

Puoi ottenere un'immagine Docker con l'SDK Vision di Gemini Enterprise Agent Platform e tutte le relative dipendenze già preinstallate. Questa immagine Docker è disponibile all'indirizzo gcr.io/visionai-public-images/vaictl.

  1. Scarica l'immagine da Container Registry:
    docker pull gcr.io/visionai-public-images/vaictl
  2. Esegui un terminale del container interattivo.
    docker run -it --rm gcr.io/visionai-public-images/vaictl /bin/bash
  3. Verifica la funzionalità:
    vaictl --help

Recupera il codice sorgente

L'SDK Vision di Gemini Enterprise Agent Platform è open source e disponibile pubblicamente su GitHub.

Sebbene l'SDK dipenda dalle definizioni delle API di servizio, questa dipendenza è già gestita automaticamente da Bazel e non devi acquisirla esplicitamente. Tuttavia, se hai bisogno dell'accesso diretto alle API di servizio, puoi ottenerle nel repository GitHub googleapis.

SDK di programmazione Python

Agent Platform Vision supporta anche un SDK Python. Per programmare con questo SDK, assicurati di aver soddisfatto i requisiti di base delle dipendenze dell'SDK Python prima di installare l'SDK Python.

Per informazioni di riferimento sull'SDK, consulta il riferimento per l'SDK Python.

Per esempi di codice che utilizzano l'SDK Python, consulta l'articolo Sfocatura dei volti con l'SDK Python o alcuni esempi nella distribuzione di origine nella directory visionai/python/examples/.

Scarica il pacchetto Python SDK

L'SDK Gemini Enterprise Agent Platform Vision contiene anche una libreria Python. Scarica e installa la versione precompilata dell'SDK Python seguendo queste istruzioni.

  1. Scarica il pacchetto.

    Puoi scaricare il pacchetto SDK Python dalla pagina delle release dell'SDK Vision di Gemini Enterprise Agent Platform su GitHub oppure puoi eseguire il comando:

    wget https://github.com/google/visionai/releases/download/v0.0.5/visionai-0.0.5-py3-none-any.whl
    
  2. Facoltativo. Crea e attiva un nuovo ambiente virtuale:

    python3 -m venv vaivenv
    source vaivenv/bin/activate
    
  3. Installa il pacchetto:

    pip3 install visionai-0.0.5-py3-none-any.whl
    
  4. Facoltativo. Verifica che l'installazione sia andata a buon fine:

    python3
    
    import visionai
    
  5. Facoltativo. Disattiva l'ambiente virtuale:

    deactivate
    

SDK di programmazione C++

C++ è il primo SDK di programmazione che supportiamo. L'SDK C++ pubblico si trova in visionai/public/streams.h. Per informazioni di riferimento, consulta la documentazione di riferimento.

Passaggi successivi