"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Managed Service for Apache Spark in Clustern – Übersicht

Mit Managed Service for Apache Spark in Clustern können Sie Open-Source-Datentools für Batchverarbeitung, Abfragen, Streaming und maschinelles Lernen nutzen. Mithilfe der Automatisierung von Managed Service for Apache Spark auf Clustern lassen sich Cluster schnell erstellen, einfach verwalten und Kosten senken, da Sie nicht benötigte Cluster deaktivieren können. Sie benötigen weniger Zeit und Geld für die Verwaltung und können sich auf Ihre Arbeit und Ihre Daten konzentrieren.

Vorteile von Managed Service for Apache Spark in Clustern

Im Vergleich zu herkömmlichen lokalen Produkten und konkurrierenden Cloud-Diensten bietet Managed Service for Apache Spark eine Reihe einzigartiger Vorteile für Cluster mit drei bis Hunderten von Knoten:

Kostengünstig – Bei Managed Service for Apache Spark in Clustern fallen zusätzlich zu den Gebühren für die anderen von Ihnen genutzten Google Cloud Ressourcen Kosten von lediglich 1 Cent pro virtueller CPU im Cluster pro Stunde an. Zusätzlich zu diesem niedrigen Preis können Managed Service for Apache Spark-Cluster Instanzen auf Abruf mit niedrigeren Berechnungspreisen umfassen. Somit sind weitere Kosteneinsparungen möglich. Statt auf die nächste Stunde aufzurunden, berechnet Managed Service for Apache Spark auf Clustern lediglich die tatsächliche Nutzung. Die Abrechnung erfolgt pro Sekunde bei einem Mindestzeitraum von einer Minute.
Super schnell – Ohne die Verwendung von Managed Service for Apache Spark in Clustern kann es zwischen fünf und 30 Minuten dauern, bis Spark- und Hadoop-Cluster vor Ort oder über IaaS-Anbieter erstellt werden. Im Vergleich dazu lassen sich Managed Service for Apache Spark-Cluster schnell starten, skalieren und herunterfahren. Jeder dieser Vorgänge nimmt im Durchschnitt weniger als 90 Sekunden in Anspruch. So verbringen Sie weniger Zeit mit dem Warten auf Cluster und haben mehr Zeit für die Bearbeitung Ihrer Daten.
Integriert: Managed Service for Apache Spark in Clustern ist in andere Google Cloud Dienste wie BigQuery, Cloud Storage, Bigtable, Cloud Logging und Cloud Monitoring integriert. Sie erhalten also mehr als nur einen Spark- oder Hadoop-Cluster – Sie erhalten eine vollständige Datenplattform. Sie können beispielsweise Managed Service for Apache Spark auf Clustern verwenden, um ETL-Terabyte von Log-Rohdaten mühelos und direkt in BigQuery für die Geschäftsberichterstattung zu importieren.
Verwaltet – Nutzen Sie Spark- und Hadoop-Cluster ohne die Unterstützung eines Administrators oder spezieller Software. Sie können über die Google Cloud Console, das Cloud SDK oder die REST API des Managed Service for Apache Spark in Clustern mit Clustern und Spark- oder Hadoop-Jobs interagieren. Wenn Sie mit einem Cluster fertig sind, können Sie ihn deaktivieren, sodass Sie kein Geld für einen inaktiven Cluster ausgeben. Sie müssen sich keine Sorgen über Datenverluste machen, da Managed Service for Apache Spark in Cloud Storage, BigQuery und Bigtable eingebunden ist.
Einfach und vertraut: Sie müssen keine neuen Tools oder APIs erlernen, um Managed Service for Apache Spark in Clustern zu verwenden. So können Sie vorhandene Projekte ganz einfach ohne Neuentwicklung in Managed Service for Apache Spark in Clustern verschieben. Spark, Hadoop, Pig und Hive werden häufig aktualisiert, sodass Sie schneller produktiv sein können.

Was ist im Managed Service for Apache Spark für Cluster enthalten?

Eine Liste der von Managed Service for Apache Spark auf Clustern unterstützten Open-Source- (Hadoop, Spark, Hive und Pig) und Google Cloud-Connector-Versionen finden Sie in den Versionslisten für Managed Service for Apache Spark-Clusterimages.

Erste Schritte

Weitere Informationen finden Sie in den Kurzanleitungen für Managed Service for Apache Spark in Clustern. Sie haben folgende Möglichkeiten, auf Managed Service for Apache Spark in Clustern zuzugreifen:

Managed Service for Apache Spark in Clustern – Übersicht Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Vorteile von Managed Service for Apache Spark in Clustern

Was ist im Managed Service for Apache Spark für Cluster enthalten?

Erste Schritte

Managed Service for Apache Spark in Clustern – Übersicht