このドキュメントでは、Knowledge Catalog コネクタを使用して、MySQL から Knowledge Catalog(以前の Dataplex Universal Catalog)にメタデータをインポートする方法について説明します。
このコネクタは、オンプレミス、Cloud SQL、または他のクラウド環境でホストされている MySQL インスタンスをサポートしています。
始める前に
IAM のロールと権限
Knowledge Catalog コネクタ ジョブを作成して管理するには、Knowledge Catalog と BigQuery Data Transfer Service の権限を付与する Identity and Access Management(IAM)ロールが必要です。
MySQL コネクタの構成に必要な権限を取得するには、管理者に次の IAM ロールを付与するよう依頼してください。
- エントリ グループを作成して管理するには: プロジェクトに対する Dataplex Catalog 管理者(
roles/dataplex.catalogAdmin)、Dataplex Catalog 編集者(roles/dataplex.catalogEditor)、または Dataplex エントリ グループ オーナー(roles/dataplex.entryGroupOwner)。 - BigQuery Data Transfer Service 転送ジョブを作成して管理する: プロジェクトに対する BigQuery 管理者(
roles/bigquery.admin)。 - Cloud Logging でログを表示するには: プロジェクトに対するログビューア(
roles/logging.viewer)。
また、BigQuery Data Transfer Service サービス エージェント(service-PROJECT_NUMBER@gcp-sa-bigquerydatatransfer.iam.gserviceaccount.com)に dataplex.entryGroups.import 権限または Dataplex エントリ グループのインポーター(roles/dataplex.entryGroupImporter)ロールを付与する必要があります。このロールは、プロジェクト レベルまたはエントリ グループ レベルで付与できます。
ロールの付与の詳細については、アクセスの管理をご覧ください。
API を有効にする
Knowledge Catalog API と BigQuery Data Transfer Service API を有効にします。
MySQL の前提条件
MySQL 転送の前提条件を満たしていることを確認します。詳細については、BigQuery Data Transfer Service のドキュメントの MySQL の前提条件をご覧ください。
ネットワーキングの前提事項
プライベート ネットワーク内のプライベート IP アドレスを使用して外部データベースまたはサードパーティのクラウド データソースに安全に接続し、BigQuery Data Transfer Service がデータベースにアクセスできるようにするには、Private Service Connect を介した接続用のネットワーク アタッチメントが必要です。
パブリック IP アドレスを使用してオンプレミス環境またはクラウドホスト型インスタンスに接続する場合は、ネットワーク アタッチメントは必要ありません。
MySQL コネクタを構成する
Google Cloud コンソールで、[Knowledge Catalog] ページに移動します。
ナビゲーション メニューの [管理] セクションで、[コネクタ] をクリックします。
[Add connection] をクリックします。
[コネクタ] リストで、[MySQL] カードを選択します。
[データソースの詳細] セクションで、MySQL インスタンスの接続の詳細を指定します。
- [ネットワーク アタッチメント] で、必要に応じて既存のネットワーク アタッチメントを選択するか、作成します。
- ホスト、ポート、データベース名、ユーザー名、パスワードを入力します。
- TLS を使用する場合は、[TLS Mode] を選択し、[Trusted PEM Certificate] を指定します。
- [MySQL metadata objects to import] で、[参照] をクリックしてオブジェクトを選択します。
[宛先の設定] セクションで、次の操作を行います。
- [参照] をクリックし、インポートしたメタデータを保存する既存の Knowledge Catalog エントリ グループを選択するか、[新しいエントリ グループを作成] をクリックします。
- エントリ グループの権限を今すぐ設定するか、後で設定するかを選択します。ユーザーがインポートされたメタデータを表示できるように権限を設定することをおすすめします。プロジェクト レベルで BigQuery Data Transfer Service サービス エージェント(
service-PROJECT_NUMBER@gcp-sa-bigquerydatatransfer.iam.gserviceaccount.com)に Dataplex エントリ グループ インポーター(roles/dataplex.entryGroupImporter)ロールまたはdataplex.entryGroups.import権限を付与していない場合は、エントリ グループ レベルで付与する必要があります。
[コネクタ構成名] セクションの [表示名] に、メタデータ インポート ジョブの名前を入力します。
[スケジュール オプション] セクションで、メタデータ インポート ジョブの頻度を構成します。[オンデマンド] を選択した場合、ジョブは手動でトリガーしたときにのみ実行されます。
省略可: [通知オプション] セクションで、ジョブの失敗に関するメール通知または Pub/Sub 通知を構成します。
省略可: [詳細オプション] セクションで、暗号化の設定を行います。顧客管理の暗号鍵(CMEK)を選択した場合、この鍵は Knowledge Catalog メタデータ インポート ジョブの開始前にステージングされた一時データの暗号化に使用されます。宛先の Knowledge Catalog エントリ グループのメタデータの暗号化には使用されません。
[保存] をクリックします。
ジョブを作成すると、Knowledge Catalog は構成に従って最初の実行をスケジュールします。または、手動で開始することもできます。
次のステップ
- コネクタ ジョブを管理する方法を学習する。