Bigtable com o Managed Service para Apache Spark

O Bigtable é o serviço de banco de dados de Big Data NoSQL do Google. É o mesmo banco de dados que alimenta muitos serviços principais do Google, incluindo Pesquisa, Analytics, Maps e Gmail. O Bigtable foi projetado para lidar com cargas de trabalho enormes a uma latência consistentemente baixa e alta capacidade de processamento. Isso o torna uma ótima opção para aplicativos operacionais e analíticos, incluindo IoT, análise de usuários e análise de dados financeiros.

O Bigtable é uma excelente opção para qualquer uso do Apache Spark ou do Hadoop que exija o Apache HBase. O Bigtable é compatível com as APIs 1.0+ e 2.0+ do Apache HBase e oferece um cliente HBase Bigtable no Maven para usar o Bigtable com o Serviço gerenciado para Apache Spark.

Usar o conector do Bigtable Spark

Com o conector do Bigtable para Spark, é possível ler e gravar dados do e para o Bigtable. Você pode ler dados no aplicativo Spark usando o Spark SQL e os DataFrames. Para jobs somente leitura, use a computação sem servidor do Data Boost, que foi projetada para os requisitos de desempenho de jobs e consultas de alta capacidade de processamento. Assim, você evita afetar o tráfego do cluster de serviço de aplicativos quando esses jobs e consultas são executados.

Para mais informações, consulte Usar o conector do Bigtable Spark.

A seguir

  • Para mais informações sobre como usar o Bigtable, consulte a documentação do Bigtable.