Questa pagina aiuta gli sviluppatori a configurare un progetto Google Distributed Cloud (GDC) con air gap per utilizzare il servizio di riconoscimento ottico dei caratteri (OCR). Questa procedura include la creazione di un progetto, l'abilitazione dell'API OCR, l'installazione delle librerie client, la definizione delle variabili di ambiente e l'autenticazione delle credenziali. Se non hai mai utilizzato Vertex AI, scopri di più sulle funzionalità di riconoscimento dei caratteri.
Configura un progetto di riconoscimento dei caratteri utilizzando la console GDC e gcloud CLI come segue:
- Console GDC: abilita l'API OCR e visualizza lo stato e l'endpoint del servizio.
- gcloud CLI: configura gli account di servizio per interagire con l'API OCR, installa le librerie client e autentica le richieste API.
Crea un progetto
La creazione di un progetto di riconoscimento dei caratteri all'interno della gerarchia delle risorse di Distributed Cloud organizza le risorse OCR, che includono collaboratori, API abilitate, strumenti di monitoraggio, informazioni di fatturazione, credenziali di autenticazione e controlli dell'accesso.
Per creare il progetto, consulta Configura un progetto per Vertex AI. L'ID progetto è necessario per effettuare chiamate API.
Richiedere le autorizzazioni sviluppatore
Per accedere alle funzionalità di riconoscimento ottico dei caratteri e generare un token API per l'autenticazione e l'autorizzazione delle richieste, devi disporre del ruolo di sviluppatore AI OCR nel tuo progetto.
Chiedi all'amministratore IAM del progetto di concedere il ruolo Sviluppatore AI OCR
(ai-ocr-developer) al tuo utente o account di servizio
all'interno dello spazio dei nomi del progetto. Per informazioni su questo ruolo, consulta
Prepara le autorizzazioni IAM.
Abilita l'API OCR
Devi abilitare l'API preaddestrata OCR per il tuo progetto. Se abilitata, puoi visualizzare lo stato del servizio e l'endpoint per l'API pre-addestrata OCR.
Installazione delle librerie client
Le librerie client sono disponibili per il linguaggio di programmazione Python. Ti consigliamo di utilizzare queste librerie client per effettuare chiamate all'API OCR perché semplificano l'accesso alle API.
Il metodo consigliato per installare questa libreria è all'interno di un ambiente virtuale, utilizzando venv.
L'utilizzo di venv offre diversi vantaggi chiave:
- Crea ambienti Python isolati per ospitare versioni diverse dei pacchetti.
- Evita conflitti tra le dipendenze del progetto e le installazioni a livello di sistema.
- Consente l'installazione di librerie senza richiedere autorizzazioni a livello di sistema.
Installa la libreria client OCR e segui questi passaggi per assicurarti di avere la versione corretta:
Controlla se la libreria client OCR è installata e ottieni il numero di versione:
pip freeze | grep visionSe la libreria client è già installata, l'output è simile al seguente esempio:
google-cloud-vision==3.0.0Il numero di versione ottenuto deve corrispondere alla libreria client nel seguente endpoint:
https://GDC_URL/.well-known/static/client-librariesSostituisci
GDC_URLcon l'URL della tua organizzazione in GDC.Se i numeri di versione non corrispondono, disinstalla la libreria client:
pip uninstall google-cloud-visionSe hai disinstallato la libreria client OCR, devi reinstallarla specificando il nome file corrispondente al tuo sistema operativo.
Imposta le variabili di ambiente
Dopo aver installato la libreria client OCR, puoi interagire con l'API da uno script Python.
Se configuri un service account nel tuo progetto per effettuare chiamate API autorizzate in modo programmatico, puoi definire variabili di ambiente nello script Python per accedere a valori come le chiavi del service account durante l'esecuzione.
Segui questi passaggi per impostare le variabili di ambiente richieste in uno script Python:
Crea un notebook JupyterLab per interagire con l'API preaddestrata OCR.
Crea uno script Python nel notebook JupyterLab.
Aggiungi il seguente codice allo script Python:
import os os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"Sostituisci
APPLICATION_DEFAULT_CREDENTIALS_FILENAMEcon il nome del file JSON che contiene le chiavi account di servizio che hai creato nel progetto, ad esempiomy-service-key.json.Salva lo script Python con un nome, ad esempio
vision.py.Esegui lo script Python per impostare le variabili di ambiente:
python SCRIPT_NAMESostituisci
SCRIPT_NAMEcon il nome che hai dato allo script Python, ad esempiovision.py.
Configura l'autenticazione
Prima di poter iniziare a utilizzare l'API OCR, devi autenticare le credenziali client e richiedere l'accesso all'account alle risorse del progetto. Per saperne di più, consulta Autenticare le richieste API.