Provisionar recursos do catálogo do Knowledge com o Terraform

Hashicorp Terraform é uma ferramenta de infraestrutura como código (IaC, na sigla em inglês) que permite provisionar e gerenciar infraestrutura em nuvem. O Terraform fornece plug-ins chamados provedores, que permitem interagir com provedores de nuvem e outras APIs. É possível usar o provedor Terraform para Google Cloud para provisionar e gerenciar recursos do Google Cloud , incluindo o Knowledge Catalog.

Esta página apresenta o uso do Terraform com o Knowledge Catalog, incluindo uma introdução a como o Terraform funciona e alguns recursos para ajudar você a começar a usar o Terraform com o Google Cloud. Você também vai encontrar links para documentos de referência do Terraform para o Knowledge Catalog, exemplos de código e guias para usar o Terraform no provisionamento de recursos do Knowledge Catalog.

Para instruções sobre como começar a usar o Terraform para Google Cloud, consulte Instalar e configurar o Terraform ou o Início rápido do Terraform para Google Cloud .

Como o Terraform funciona

O Terraform tem uma sintaxe declarativa e orientada pela configuração, que pode ser usada para descrever a infraestrutura que você quer provisionar no projeto Google Cloud . Depois de criar essa configuração em um ou mais arquivos de configuração do Terraform, use a CLI do Terraform para aplicá-la aos recursos do Knowledge Catalog.

As etapas a seguir explicam como o Terraform funciona:

  1. Você descreve a infraestrutura que quer provisionar em um arquivo de configuração do Terraform. Não é preciso escrever código descrevendo como provisionar a infraestrutura. O Terraform provisiona a infraestrutura para você.
  2. Você executa o comando terraform plan, que avalia sua configuração e gera um plano de execução. É possível analisar o plano e fazer alterações conforme necessário.
  3. Você executará o comando terraform apply, que realiza as seguintes ações:

    1. Ele provisiona sua infraestrutura com base no plano de execução invocando as APIs correspondentes do Knowledge Catalog em segundo plano.
    2. Ele cria um arquivo de estado do Terraform, que é um arquivo JSON que mapeia os recursos no arquivo de configuração aos recursos na infraestrutura do mundo real. O Terraform usa esse arquivo para manter um registro do estado mais recente da sua infraestrutura e determinar quando criar, atualizar e destruir recursos.
    3. Ao executar terraform apply, o Terraform usa o mapeamento no arquivo de estado para comparar a infraestrutura atual com o código e fazer atualizações conforme necessário:

      • Se um objeto de recurso for definido no arquivo de configuração, mas não existir no arquivo de estado, o Terraform o criará.
      • Se há um objeto de recurso no arquivo de estado, mas tem uma configuração diferente do arquivo de configuração, o Terraform atualiza o recurso para corresponder ao arquivo de configuração.
      • Se um objeto de recurso no arquivo de estado corresponder ao seu arquivo de configuração, o Terraform deixará o recurso inalterado.

Recursos do Terraform para o Catálogo de Conhecimento

Recursos são os elementos fundamentais da linguagem do Terraform. Cada no bloco "resource", que descreve um ou mais objetos de infraestrutura, como ou instâncias de computação.

A tabela a seguir lista os recursos do Terraform disponíveis para o Catálogo de dados:

Serviço Recursos do Terraform Fontes de dados
Catálogo de Conhecimento

Guias baseados no Terraform para o Catálogo de Conhecimento

A tabela a seguir lista os guias e tutoriais do Terraform para o Knowledge Catalog:

Guia Detalhes
Gerenciar regras de qualidade de dados como código com o Terraform Neste tutorial, explicamos como gerenciar regras de qualidade de dados do catálogo de dados como código com o Terraform, o Cloud Build e o GitHub.
Codelab: criar a base de dados com metadados do Knowledge Catalog Este codelab explica como criar a base de dados com metadados do Knowledge Catalog.

Módulos e blueprints do Terraform para o Knowledge Catalog

Os módulos e modelos ajudam a automatizar o provisionamento e o gerenciamento de recursos do Google Cloud em escala. Um módulo é um conjunto reutilizável de arquivos de configuração do Terraform que cria uma abstração lógica dos recursos do Terraform. Um blueprint é um pacote de módulos implantáveis e reutilizáveis e uma política que implementa e documenta uma solução específica.

A tabela a seguir lista módulos e blueprints relacionados ao Knowledge Catalog:

Módulo ou blueprint Detalhes
dataplex-auto-data-quality Este módulo mostra como implantar regras de qualidade de dados em tabelas do BigQuery em ambientes de desenvolvimento e produção usando o Cloud Build.

A seguir