Pode instalar componentes adicionais, como o Solr, quando cria um cluster do Dataproc através da funcionalidade Componentes opcionais. Esta página descreve o componente Solr.
O componente Apache Solr é uma plataforma de pesquisa empresarial de código aberto. O servidor Solr e a IU Web estão disponíveis na porta 8983
nos nós principais do cluster.
Persistência de ficheiros Solr: por predefinição, o Solr escreve e lê os ficheiros de índice e de registo de transações no HDFS.
Para persistir os ficheiros do Solr, use um caminho do Cloud Storage como o diretório principal do Solr definindo a dataproc:solr.gcs.path
propriedade do cluster quando instalar o componente.
Instale o componente
Instale o componente quando criar um cluster do Dataproc. Pode adicionar componentes a clusters criados com o Dataproc versão 1.3 e posterior.
Consulte as versões do Dataproc suportadas para ver a versão do componente incluída em cada lançamento de imagem do Dataproc.
comando gcloud
Para criar um cluster do Dataproc que inclua o componente Solr,
use o comando
gcloud dataproc clusters create cluster-name
com a flag --optional-components
. O comando de exemplo abaixo usa a flag properties
opcional para definir um caminho do Cloud Storage como o diretório inicial do Solr.
gcloud dataproc clusters create cluster-name \ --region=region \ --optional-components=SOLR \ --enable-component-gateway \ ... other flags
--properties="dataproc:solr.gcs.path=gs://bucket-name/"
cluster ao comando gcloud dataproc clusters create
para definir um contentor do Cloud Storage onde os documentos do Solr vão ser armazenados
(diretório inicial do Solr).API REST
O componente Solr pode ser especificado através da API Dataproc com SoftwareConfig.Component como parte de um pedido clusters.create.
Consola
- Ative o componente e o gateway de componentes.
- Na Google Cloud consola, abra a página do Dataproc Criar um cluster. O painel Configurar cluster está selecionado.
- Na secção Componentes:
- Em Componentes opcionais, selecione o Solr e outros componentes opcionais para instalar no cluster.
- Em Component Gateway, selecione Enable component gateway (consulte Ver e aceder aos URLs do Component Gateway).