L'installazione del componente HBase facoltativo è limitata ai cluster Managed Service for Apache Spark creati con la versione dell'immagine 1.5 o 2.0.
Sebbene Google Cloud fornisca molti servizi che consentono di eseguire il deployment di Apache HBase, Bigtable è spesso l'opzione migliore in quanto fornisce un'API aperta con HBase e la portabilità dei carichi di lavoro. Le tabelle di database HBase possono essere migrate a Bigtable per la gestione dei dati sottostanti, mentre le applicazioni che in precedenza interagivano con HBase, come Spark, possono rimanere su Managed Service for Apache Spark e connettersi in modo sicuro a Bigtable. In questa guida, forniamo i passaggi di alto livello per iniziare a utilizzare Bigtable e forniamo riferimenti per la migrazione dei dati a Bigtable dai deployment HBase di Managed Service for Apache Spark.
Inizia a utilizzare Bigtable
Cloud Bigtable è una piattaforma NoSQL altamente scalabile e performante che fornisce la compatibilità del client API Apache HBase e la portabilità per i carichi di lavoro HBase. Il client è compatibile con le versioni 1.x e 2.x dell'API HBase e può essere incluso nell'applicazione esistente per leggere e scrivere in Bigtable. Le applicazioni HBase esistenti possono aggiungere la libreria client HBase di Bigtable per leggere e scrivere i dati archiviati in Bigtable.
Per ulteriori informazioni sulla configurazione dell'applicazione HBase con Bigtable, consulta Bigtable e l'API HBase.
Crea un cluster Bigtable
Puoi iniziare a utilizzare Bigtable creando un cluster e tabelle per archiviare i dati precedentemente archiviati in HBase. Segui i passaggi descritti nella documentazione di Bigtable per creare un'istanza, un cluster e tabelle con lo stesso schema delle tabelle HBase. Per la creazione automatica di tabelle da DDL di tabelle HBase, consulta lo strumento di conversione dello schema.
Apri l'istanza Bigtable in Google Cloud console per visualizzare i grafici di monitoraggio delle tabelle e lato server, tra cui righe al secondo, latenza e throughput, per gestire la tabella di cui è stato eseguito il provisioning di recente. Per ulteriori informazioni, consulta Monitoraggio.
Migra i dati da Managed Service for Apache Spark a Bigtable
Dopo aver creato le tabelle in Bigtable, puoi importare e convalidare i dati seguendo le indicazioni riportate in Migrazione offline dei dati da HBase a Bigtable. Dopo aver eseguito la migrazione dei dati, puoi aggiornare le applicazioni per inviare letture e scritture a Bigtable.
Passaggi successivi
- Consulta gli esempi di Wordcount Spark per l'esecuzione di Spark con Bigtable.
- Esamina le opzioni di migrazione online con replica live da HBase a Bigtable.
- Guarda Come Box ha modernizzato i suoi database NoSQL per comprendere altri vantaggi.