Questa guida descrive come configurare un progetto Google Cloud per iniziare a utilizzare Gemini Enterprise Agent Platform Vision.
Configura il progetto
- Accedi al tuo account Google Cloud . Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
-
Installa Google Cloud CLI.
-
Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
-
Per inizializzare gcloud CLI, esegui questo comando:
gcloud init -
Crea o seleziona un Google Cloud progetto.
Ruoli richiesti per selezionare o creare un progetto
- Seleziona un progetto: la selezione di un progetto non richiede un ruolo IAM specifico. Puoi selezionare qualsiasi progetto per il quale ti è stato concesso un ruolo.
-
Crea un progetto: per creare un progetto, devi disporre del ruolo Autore progetto
(
roles/resourcemanager.projectCreator), che contiene l'autorizzazioneresourcemanager.projects.create. Scopri come concedere i ruoli.
-
Creare un progetto Google Cloud :
gcloud projects create PROJECT_ID
Sostituisci
PROJECT_IDcon un nome per il progetto Google Cloud che stai creando. -
Seleziona il progetto Google Cloud che hai creato:
gcloud config set project PROJECT_ID
Sostituisci
PROJECT_IDcon il nome del progetto Google Cloud .
-
Verifica che la fatturazione sia abilitata per il tuo progetto Google Cloud .
Abilita l'API Vertex AI Vision:
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (
roles/serviceusage.serviceUsageAdmin), che include l'autorizzazioneserviceusage.services.enable. Scopri come concedere i ruoli.gcloud services enable visionai.googleapis.com
-
Configura l'autenticazione:
-
Assicurati di disporre del ruolo IAM Creazione account di servizio
(
roles/iam.serviceAccountCreator) e del ruolo Amministratore IAM progetto (roles/resourcemanager.projectIamAdmin). Scopri come concedere i ruoli. -
Crea l'account di servizio:
gcloud iam service-accounts create SERVICE_ACCOUNT_NAME
Sostituisci
SERVICE_ACCOUNT_NAMEcon un nome per il account di servizio. -
Concedi il ruolo IAM
roles/visionai.editoral account di servizio:gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=roles/visionai.editor
Sostituisci quanto segue:
SERVICE_ACCOUNT_NAME: il nome del account di servizioPROJECT_ID: l'ID progetto in cui hai creato il account di servizio
-
Genera il file della chiave:
gcloud iam service-accounts keys create FILE_NAME.json --iam-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Sostituisci quanto segue:
FILE_NAME: un nome per il file della chiaveSERVICE_ACCOUNT_NAME: il nome del account di servizioPROJECT_ID: l'ID progetto in cui hai creato il account di servizio
-
Assicurati di disporre del ruolo IAM Creazione account di servizio
(
-
Imposta la variabile di ambiente
GOOGLE_APPLICATION_CREDENTIALSsul percorso del file JSON contenente le tue credenziali. Questa variabile si applica solo alla sessione di shell corrente, quindi se apri una nuova sessione, imposta di nuovo la variabile. -
Installa Google Cloud CLI.
-
Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
-
Per inizializzare gcloud CLI, esegui questo comando:
gcloud init -
Crea o seleziona un Google Cloud progetto.
Ruoli richiesti per selezionare o creare un progetto
- Seleziona un progetto: la selezione di un progetto non richiede un ruolo IAM specifico. Puoi selezionare qualsiasi progetto per il quale ti è stato concesso un ruolo.
-
Crea un progetto: per creare un progetto, devi disporre del ruolo Autore progetto
(
roles/resourcemanager.projectCreator), che contiene l'autorizzazioneresourcemanager.projects.create. Scopri come concedere i ruoli.
-
Creare un progetto Google Cloud :
gcloud projects create PROJECT_ID
Sostituisci
PROJECT_IDcon un nome per il progetto Google Cloud che stai creando. -
Seleziona il progetto Google Cloud che hai creato:
gcloud config set project PROJECT_ID
Sostituisci
PROJECT_IDcon il nome del progetto Google Cloud .
-
Verifica che la fatturazione sia abilitata per il tuo progetto Google Cloud .
Abilita l'API Vertex AI Vision:
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (
roles/serviceusage.serviceUsageAdmin), che include l'autorizzazioneserviceusage.services.enable. Scopri come concedere i ruoli.gcloud services enable visionai.googleapis.com
-
Configura l'autenticazione:
-
Assicurati di disporre del ruolo IAM Creazione account di servizio
(
roles/iam.serviceAccountCreator) e del ruolo Amministratore IAM progetto (roles/resourcemanager.projectIamAdmin). Scopri come concedere i ruoli. -
Crea l'account di servizio:
gcloud iam service-accounts create SERVICE_ACCOUNT_NAME
Sostituisci
SERVICE_ACCOUNT_NAMEcon un nome per il account di servizio. -
Concedi il ruolo IAM
roles/visionai.editoral account di servizio:gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=roles/visionai.editor
Sostituisci quanto segue:
SERVICE_ACCOUNT_NAME: il nome del account di servizioPROJECT_ID: l'ID progetto in cui hai creato il account di servizio
-
Genera il file della chiave:
gcloud iam service-accounts keys create FILE_NAME.json --iam-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Sostituisci quanto segue:
FILE_NAME: un nome per il file della chiaveSERVICE_ACCOUNT_NAME: il nome del account di servizioPROJECT_ID: l'ID progetto in cui hai creato il account di servizio
-
Assicurati di disporre del ruolo IAM Creazione account di servizio
(
-
Imposta la variabile di ambiente
GOOGLE_APPLICATION_CREDENTIALSsul percorso del file JSON contenente le tue credenziali. Questa variabile si applica solo alla sessione di shell corrente, quindi se apri una nuova sessione, imposta di nuovo la variabile.
Per alcune attività devi utilizzare prodotti Google Cloud aggiuntivi oltre ad Agent Platform Vision. Potresti dover eseguire ulteriori attività di configurazione per utilizzare altri Google Cloud prodotti.
SDK Vision di Gemini Enterprise Agent Platform
L'Agent Platform Vision Software Development Kit (SDK) contiene strumenti e librerie per sviluppare programmi e flussi di lavoro personalizzati con Agent Platform Vision.
Questi strumenti si riferiscono a un insieme di file di origine binari che ti aiutano a migliorare la produttività
quando utilizzi o sviluppi soluzioni utilizzando Agent Platform Vision. Puoi anche aggiungere
questi file sorgente binari ai tuoi script per gestire implementazioni
su larga scala. L'interfaccia a riga di comando (CLI) vaictl è un esempio in questa
categoria.
Le librerie si riferiscono a un insieme di API di programmazione che puoi utilizzare per gestire, controllare ed eseguire operazioni di I/O di diversi moduli in modo programmatico con Agent Platform Vision. L'API di programmazione C++ è un esempio in questa categoria.
Il codice di strumenti e librerie è open source e invitiamo gli sviluppatori a crearli direttamente. Per gli strumenti, offriamo anche file binari precompilati su piattaforme specifiche che puoi scaricare per l'utilizzo diretto. Offriamo anche immagini Docker per i casi in cui la tua piattaforma non è supportata direttamente.
Prerequisiti
Considera questi prerequisiti prima di utilizzare l'SDK Gemini Enterprise Agent Platform Vision.
Piattaforme supportate
Supportiamo direttamente solo le macchine x86 che eseguono una distribuzione Linux basata su Debian. Se utilizzi una piattaforma diversa, offriamo anche un'immagine Docker con strumenti già creati e installati.
Requisiti software aggiuntivi
La maggior parte delle dipendenze software di terze parti richieste dall'SDK Vision di Gemini Enterprise Agent Platform vengono gestite automaticamente quando installi i file binari precompilati. Tuttavia, per utilizzare determinati aspetti delle funzionalità e dei flussi di lavoro dell'SDK, devi installare dipendenze aggiuntive. Questa sezione elenca queste eccezioni e spiega come scaricarle e installarle.
SDK Python
Il pacchetto Python pip installa automaticamente tutte le sue dipendenze. Tuttavia, l'installazione di base di Python deve soddisfare le seguenti condizioni:
- Python >= 3.8.
Crea dipendenze dall'origine
La maggior parte degli utenti può utilizzare i file binari dell'SDK precompilati per il proprio flusso di lavoro. Se vuoi sviluppare e creare l'SDK dall'origine, devi anche assicurarti che il tuo sistema soddisfi i seguenti requisiti.
- Installa Bazel. Per istruzioni di installazione, consulta la documentazione di Bazel.
Su Ubuntu 20.04, sono necessarie anche diverse dipendenze di sistema. Puoi installarli con il seguente comando:
apt-get install -y --no-install-recommends \ autoconf \ automake \ build-essential \ ca-certificates \ flex \ bison \ python3 \ nasm \ libjpeg-dev
Ottenere i programmi binari precompilati
Lo strumento vaictl è lo strumento binario pronto all'uso che può essere utilizzato per
controllare Agent Platform Vision, nonché per inviare e ricevere i dati che elabora.
Questa sezione mostra i modi per scaricare e installare questo strumento.
Installa il pacchetto Debian
Hai due opzioni per utilizzare lo strumento a riga di comando vaictl, necessario per lavorare con I/O (dati di flusso):
- Installa lo strumento a riga di comando localmente (sistema operativo: Debian GNU/Linux, architettura della CPU: x86_64) o
- Esegui i comandi in un'immagine Docker in cui sono installate tutte le dipendenze.
Per ottenere lo strumento a riga di comando vaictl, segui questi passaggi:
Download pacchetto
Per le installazioni dirette, supportiamo solo le distribuzioni Debian/Ubuntu.
Puoi anche scaricare questo pacchetto Debian dalla pagina delle release di Gemini Enterprise Agent Platform Vision SDK su GitHub.
(Facoltativo) Rimuovi le versioni precedenti di
vaictl.Per installare lo strumento a riga di comando
vaictl, devi eliminare eventuali versioni precedenti dello strumento sul tuo computer:sudo apt-get remove visionai
- Scarica il pacchetto richiesto. Puoi scaricare il pacchetto dalla
pagina delle release di GitHub
o utilizzare il seguente comando:
wget https://github.com/google/visionai/releases/download/v0.0.5/visionai_0.0-5_amd64.deb
- Dopo aver scaricato il pacchetto, esegui questo comando nella directory
in cui hai scaricato il file:
sudo apt install ./visionai_0.0-5_amd64.deb
- Verifica l'installazione:
vaictl --help
Scarica Docker
Puoi ottenere un'immagine Docker con l'SDK Vision di Gemini Enterprise Agent Platform e tutte le relative
dipendenze già preinstallate. Questa immagine Docker è disponibile all'indirizzo
gcr.io/visionai-public-images/vaictl.
- Scarica l'immagine da Container Registry:
docker pull gcr.io/visionai-public-images/vaictl
- Esegui un terminale del container interattivo.
docker run -it --rm gcr.io/visionai-public-images/vaictl /bin/bash
- Verifica la funzionalità:
vaictl --help
Recupera il codice sorgente
L'SDK Vision di Gemini Enterprise Agent Platform è open source e disponibile pubblicamente su GitHub.
Sebbene l'SDK dipenda dalle definizioni delle API di servizio, questa dipendenza
è già gestita automaticamente da Bazel e non
devi acquisirla esplicitamente. Tuttavia, se hai bisogno dell'accesso diretto alle API di servizio, puoi ottenerle nel repository GitHub googleapis.
SDK di programmazione Python
Agent Platform Vision supporta anche un SDK Python. Per programmare con questo SDK, assicurati di aver soddisfatto i requisiti di base delle dipendenze dell'SDK Python prima di installare l'SDK Python.
Per informazioni di riferimento sull'SDK, consulta il riferimento per l'SDK Python.
Per esempi di codice che utilizzano l'SDK Python, consulta l'articolo
Sfocatura dei volti con l'SDK Python
o alcuni esempi nella distribuzione di origine nella directory
visionai/python/examples/.
Scarica il pacchetto Python SDK
L'SDK Gemini Enterprise Agent Platform Vision contiene anche una libreria Python. Scarica e installa la versione precompilata dell'SDK Python seguendo queste istruzioni.
Scarica il pacchetto.
Puoi scaricare il pacchetto SDK Python dalla pagina delle release dell'SDK Vision di Gemini Enterprise Agent Platform su GitHub oppure puoi eseguire il comando:
wget https://github.com/google/visionai/releases/download/v0.0.5/visionai-0.0.5-py3-none-any.whlFacoltativo. Crea e attiva un nuovo ambiente virtuale:
python3 -m venv vaivenv source vaivenv/bin/activateInstalla il pacchetto:
pip3 install visionai-0.0.5-py3-none-any.whlFacoltativo. Verifica che l'installazione sia andata a buon fine:
python3import visionaiFacoltativo. Disattiva l'ambiente virtuale:
deactivate
SDK di programmazione C++
C++ è il primo SDK di programmazione che supportiamo. L'SDK C++ pubblico si trova in
visionai/public/streams.h. Per informazioni di riferimento, consulta la documentazione di
riferimento.
Passaggi successivi
- (Facoltativo) Scopri come creare e testare utilizzando l'SDK C++.
- Scopri come importare dati in un'app e scopri i componenti di elaborazione che puoi aggiungere in Creazione di un'app.
- Per saperne di più sulle opzioni di archiviazione ed elaborazione degli output, consulta Collegare l'output dell'app a una destinazione di dati .
- Scopri come cercare i dati di Search Warehouse nella console.