Wenn Sie einen Dataproc Metastore-Dienst erstellen, müssen Sie entweder den MySQL- oder den Spanner-Datenbanktyp auswählen.
Diese Auswahl wirkt sich auf die Funktionen aus, die Sie in Ihren Dataproc Metastore-Dienst einbinden und mit ihm verwenden können. Beachten Sie, dass Sie den Datenbanktyp nach dem Erstellen eines Dataproc Metastore-Dienstes nicht mehr aktualisieren können. Wählen Sie den Datenbanktyp aus, der Ihren Anforderungen entspricht.
Auf dieser Seite werden die Unterschiede zwischen diesen Datenbanktypen erläutert und Sie erfahren, wie Sie einen für Ihren Dienst auswählen.
Unterschiede zwischen MySQL und Spanner
MySQL
Der MySQL-Datenbanktyp von Dataproc Metastore ist eine Implementierung von Cloud SQL. Beachten Sie Folgendes, wenn Sie eine MySQL-Datenbank verwenden:
- MySQL ist der Standarddatenbanktyp beim Erstellen eines Dataproc Metastores.
- MySQL wird von allen Hive-Versionen unterstützt.
- MySQL unterstützt alle Dataproc Metastore-Funktionen.
- MySQL unterstützt die Dataproc Metastore-Verschlüsselung, z. B. die Verwendung von kundenverwalteten Verschlüsselungsschlüsseln (Customer-Managed Encryption Keys, CMEK).
Spanner
Der Spanner-Datenbanktyp von Dataproc Metastore ist eine Implementierung von Spanner. Beachten Sie Folgendes, wenn Sie eine Spanner-Datenbank verwenden:
- Spanner wird nur in Hive-Version 2.3.6 und 3.1.2 unterstützt.
- Spanner unterstützt nur Avro-Importe.
- Die maximal unterstützte Anzahl von Spalten in einer Tabelle beträgt 5.000.
Weitere Informationen
In der folgenden Tabelle finden Sie weitere Informationen zu diesen Unterschieden.
| MySQL | Spanner | |
|---|---|---|
| Zuverlässigkeit (Betriebszeit) | Cloud SQL-SLO 99,95%* | Spanner-SLO 99,99%* |
| Wartungsfenster | Erforderlich | Nicht erforderlich |
Hinweise:
- *Die Cloud SQL- und Spanner-SLOs lassen sich nicht direkt in Dataproc Metastore-SLOs übersetzen. Dataproc Metastore: Die Auswahl des Datenbanktyps hat keine Auswirkungen auf die Dataproc Metastore-SLOs.
- Es gibt keinen Preisunterschied zwischen den beiden Datenbanktypen.
Hinweis
- Aktivieren Sie Dataproc Metastore in Ihrem Projekt.
- Machen Sie sich mit den Netzwerkanforderungen vertraut , die für Ihr Projekt gelten.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgende IAM-Rolle für Ihr Projekt zuzuweisen, um die Berechtigung zum Erstellen eines Dataproc Metastore zu erhalten. Dabei gilt das Prinzip der geringsten Berechtigung:
- Vollständige Kontrolle über Dataproc Metastore-Ressourcen gewähren (
roles/metastore.editor) - Vollständigen Zugriff auf alle Dataproc Metastore-Ressourcen gewähren, einschließlich der Verwaltung von IAM-Richtlinien (
roles/metastore.admin)
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierte Rolle enthält die
metastore.services.create
Berechtigung,
die zum Erstellen eines Dataproc Metastores erforderlich ist.
Sie können diese Berechtigung auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Weitere Informationen zu bestimmten Dataproc Metastore-Rollen und Berechtigungen finden Sie unter Zugriff auf den verwalteten Dienst für Apache Spark mit IAM verwalten.Datenbanktyp auswählen
Sie wählen den Datenbanktyp aus, wenn Sie zum ersten Mal einen Dataproc Metastore-Dienst erstellen.
Im folgenden Beispiel wird eine verkürzte Version der Schritte zum Auswählen eines Datenbanktyps gezeigt. Eine vollständige Schritt-für-Schritt-Anleitung finden Sie unter Dataproc Metastore-Dienst erstellen.
Console
Öffnen Sie in der Google Cloud Console- die Seite „Dataproc Metastore“:
Klicken Sie in der Navigationsleiste auf Erstellen.
Die Seite Dienst erstellen wird geöffnet.
Wählen Sie für Datenbanktyp entweder MySQL oder Spanner aus.
MySQL ist der Standarddatenbanktyp.
Wählen Sie nach Bedarf die restlichen Konfigurationen für Ihren Dienst aus.
Klicken Sie auf Senden.
gcloud CLI
Führen Sie den folgenden
gcloud metastore services createBefehl aus:gcloud metastore services create SERVICE_ID \ --location=LOCATION \ --database-type=DATABASE_TYPE; default="mysql"
Ersetzen Sie Folgendes:
SERVICE_ID: der Name oder die ID Ihres Dataproc Metastore-Dienstes.LOCATION: die Region, in der sich Ihr Dataproc Metastore-Dienst befindet.DATABASE_TYPE: der Datenbanktyp, den Sie für Ihren Dataproc Metastore-Dienst festlegen möchten. Zulässige Werte sindmysqlundspanner. Der Standardwert istmysql.