Vorbereitung
Auf dieser Seite werden die Voraussetzungen für die Bereitstellung von Inhalten der Cortex Framework Data Foundation-Lösung beschrieben. Nehmen Sie sich etwas Zeit, um sich mit diesen Ressourcen vertraut zu machen, bevor Sie fortfahren.
Geschäftliche Anforderungen verstehen
Berücksichtigen Sie Ihre Geschäftsziele und -anforderungen sowie die Datenquellen, die dafür erforderlich sind. Wenn Sie Cortex Framework-Inhalte bereitstellen, sollten Sie wissen, welche Datenquellen und Arbeitslasten erforderlich sind, um Ihre geschäftlichen Anforderungen zu erfüllen und für die Bereitstellung relevant sind.
Verfügbare Arbeitslasten und Datenquellen prüfen
Kompatible Arbeitslasten und Datenquellen anzeigen, die von Cortex Framework unterstützt werden, in Datenquellen und Arbeitslasten. Machen Sie sich mit der Art der Daten vertraut, mit denen Sie arbeiten möchten, z. B. Daten aus Salesforce, SAP oder anderen Datenquellen.
Grundlagen auffrischen
Machen Sie sich mit einigen wichtigen Google Cloud Diensten und Komponenten vertraut, die erforderlich sind:
- Google Cloud Console
- Cloud Shell
- Cloud Shell-Editor
- BigQuery
- Cloud Build
- Identity and Access Management
- Managed Service for Apache Airflow
- Apache Airflow
- Dataflow
- Workflows
- Colab Enterprise
Informationen zu Change Data Capture (CDC) zum Nachverfolgen von Aktualisierungen Ihrer Daten. Weitere Informationen finden Sie im CDC-Leitfaden.
Repository entdecken
Die auf dieser Seite beschriebenen Voraussetzungen sind speziell für die Bereitstellung von Cortex Framework Data Foundation-Inhalten aus dem offiziellen GitHub-Repository vorgesehen. Dieses Repository enthält wichtige Ressourcen für die Bereitstellung von Cortex Framework, einschließlich Konfigurationsdateien, Entity-Relationship-Diagrammen (ERD) und vordefinierten Datenmodellen.
Projekt auswählen oder erstellen
Für die Bereitstellung von Inhalten der Cortex Framework Data Foundation-Lösung sind die folgenden Projekte erforderlich:
- Quellprojekt:Das Projekt, in dem sich Ihre Rohdaten befinden. Sie benötigen mindestens einGoogle Cloud -Projekt, um Daten zu speichern und den Bereitstellungsprozess auszuführen.
- Zielprojekt (optional): Projekt, in dem die verarbeiteten Datenmodelle der Cortex Framework Data Foundation gespeichert werden. Das kann je nach Bedarf dasselbe wie das Quellprojekt oder ein anderes Projekt sein.
Wenn Sie für jede Arbeitslast separate Gruppen von Projekten und Datasets haben möchten (z. B. eine Gruppe von Quell- und Zielprojekten für SAP und eine andere Gruppe von Ziel- und Quellprojekten für Salesforce), führen Sie für jede Arbeitslast separate Bereitstellungen aus. Weitere Informationen finden Sie im Abschnitt „Optionale Schritte“ unter Zugriff durch Verwendung verschiedener Projekte trennen.
So wählen Sie ein Projekt aus oder erstellen ein Projekt:
-
Rufen Sie in der Google Cloud Console die Seite für die Projektauswahl auf.
-
Wählen Sie ein Google Cloud Projekt aus oder erstellen Sie eines.
Rollen, die zum Auswählen oder Erstellen eines Projekts erforderlich sind
- Projekt auswählen: Für die Auswahl eines Projekts ist keine bestimmte IAM-Rolle erforderlich. Sie können jedes Projekt auswählen, für das Ihnen eine Rolle zugewiesen wurde.
-
Projekt erstellen: Zum Erstellen eines Projekts benötigen Sie die Rolle „Projektersteller“ (
roles/resourcemanager.projectCreator), die die Berechtigungresourcemanager.projects.createenthält. Weitere Informationen zum Zuweisen von Rollen
Erforderliche Rollen abrufen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihr Quell- und Zielprojekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Bereitstellen von Cortex Framework Data Foundation-Lösungsinhalten benötigen:
-
BigQuery Job User (
roles/bigquery.jobUser) -
BigQuery Data Editor (
roles/bigquery.dataEditor) -
Dienstkonten erstellen (
roles/iam.serviceAccountCreator) -
Projekt-IAM-Administrator (
roles/resourcemanager.projectIamAdmin) -
Projektleser (
roles/reader) -
Service Usage Admin (
roles/serviceusage.serviceUsageAdmin) -
Storage Object Viewer (
roles/storage.objectViewer) -
Storage-Administrator (
roles/storage.admin) -
Cloud Build-Bearbeiter (
roles/cloudbuild.builds.editor)
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Nächste Schritte
Nachdem Sie diese Voraussetzungen geprüft haben, können Sie mit der Bereitstellung fortfahren:
- Arbeitslasten einrichten:
- Repository klonen
- Integrationsmechanismus festlegen:
- Komponenten einrichten
- Bereitstellung konfigurieren
- Bereitstellung ausführen