Auf dieser Seite werden die ersten Schritte mit den Cloud-Clientbibliotheken für die Document AI Toolbox API beschrieben. Clientbibliotheken erleichtern den Zugriff auf Google Cloud APIs mit einer unterstützten Sprache. Sie können APIs vonGoogle Cloud direkt verwenden, indem Sie Rohanfragen an den Server senden. Clientbibliotheken bieten jedoch Vereinfachungen, die den zu schreibenden Code erheblich reduzieren.
Weitere Informationen zu den Cloud-Clientbibliotheken und den älteren Google API-Clientbibliotheken finden Sie unter Erläuterung zu Clientbibliotheken.
Clientbibliothek installieren
Python
pip install --upgrade google-cloud-documentai-toolbox
Weitere Informationen finden Sie unter Python-Entwicklungsumgebung einrichten.
Authentifizierung einrichten
Zur Authentifizierung von Aufrufen an APIs von Google Cloud unterstützen Clientbibliotheken Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC). Die Bibliotheken suchen nach Anmeldedaten an einer Reihe von definierten Speicherorten und verwenden diese, um Anfragen an die API zu authentifizieren. Mit ADC können Sie Anmeldedaten für Ihre Anwendung in verschiedenen Umgebungen bereitstellen, z. B. in der lokalen Entwicklung oder Produktion, ohne den Anwendungscode ändern zu müssen.In Produktionsumgebungen hängt die Art der Einrichtung von ADC vom Dienst und Kontext ab. Weitere Informationen finden Sie unter Standardanmeldedaten für Anwendungen einrichten.
Für eine lokale Entwicklungsumgebung können Sie ADC mit den Anmeldedaten einrichten, die Ihrem Google-Konto zugeordnet sind:
-
Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
gcloud initWenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
-
Wenn Sie eine lokale Shell verwenden, erstellen Sie lokale Anmeldedaten zur Authentifizierung für Ihr Nutzer konto:
gcloud auth application-default login
Wenn Sie Cloud Shell verwenden, ist dies nicht erforderlich.
Wenn ein Authentifizierungsfehler zurückgegeben wird und Sie einen externen Identitätsanbieter (IdP) verwenden, prüfen Sie, ob Sie sich mit Ihrer föderierten Identität in der gcloud CLI angemeldet haben.
Ein Anmeldebildschirm wird angezeigt. Nach der Anmeldung werden Ihre Anmeldedaten in der lokalen Anmeldedatendatei für ADC gespeichert.
Clientbibliothek verwenden
Die Document AI Toolbox ist ein SDK für Python, das Hilfsfunktionen
zum Verwalten, Bearbeiten und Extrahieren von Informationen aus der Dokumentantwort bietet.
Es erstellt ein "eingebettetes" Dokumentobjekt aus einer verarbeiteten Dokumentantwort aus JSON-Dateien in
Cloud Storage, lokalen JSON-Dateien oder der Ausgabe direkt aus der process_document()
Methode.
Folgende Aktionen sind möglich:
- Kombinieren Sie fragmentierte
Document-JSON-Dateien aus der Batchverarbeitung zu einem einzigen „eingebetteten“ Dokument. - Exportieren Sie Shards als einheitliches
Document. -
Document-Ausgabe abrufen aus: - Auf Text aus
Pages,Lines,Paragraphs,FormFieldsundTableszugreifen, ohneLayout-Informationen zu verarbeiten. - Nach
Pagessuchen, die einen Zielstring enthalten oder einem regulären Ausdruck entsprechen. - Nach
FormFieldsanhand des Namens suchen. - Nach
Entitiesanhand des Typs suchen. Tablesin ein Pandas Dataframe oder eine CSV-Datei konvertieren.EntitiesundFormFieldsin eine BigQuery-Tabelle einfügen.- Eine PDF-Datei basierend auf der Ausgabe eines Splitter-/Classifier-Prozessors aufteilen.
- Bild-
EntitiesausDocumentBegrenzungsrahmen extrahieren. -
Documentsin und aus gängigen Formaten konvertieren:- Cloud Vision API
AnnotateFileResponse - hOCR
- Formate für die Dokumentverarbeitung von Drittanbietern
- Cloud Vision API
- Batches von Dokumenten zur Verarbeitung aus einem Cloud Storage-Ordner erstellen.
Codebeispiele
Die folgenden Codebeispiele zeigen, wie die Document AI Toolbox verwendet wird.
Kurzanleitung
Tabellen
BigQuery Export
PDF aufteilen
Bildextraktion
Vision-Konvertierung
hOCR-Konvertierung
Konvertierung von Drittanbietern
Dokument-Batches
Dokument-Shards zusammenführen
Zusätzliche Ressourcen
Python
Die folgende Liste enthält Links zu weiteren Ressourcen im Zusammenhang mit der Clientbibliothek für Python: