複数の Microsoft SQL Server テーブルから読み取る

このページでは、Microsoft SQL Server データベースから複数のテーブルを読み取る方法について説明します。使用するソースは、マルチテーブル ソースです。パイプラインで複数のテーブルから読み取る場合は、マルチテーブル ソースを使用します。パイプラインで単一のテーブルから読み取る場合は、 SQL Server テーブルからの読み取りをご覧ください。

マルチテーブル ソースは、複数のスキーマを使用してデータを出力し、データの取得元のテーブルを示すテーブル名フィールドを含みます。マルチテーブル ソースを使用する場合は、マルチテーブル シンクBigQuery マルチテーブルGCS マルチファイルのいずれかを使用します。

始める前に

  1. アカウントにログインします。 Google Cloud を初めて使用する場合は、 アカウントを作成して、実際のシナリオで Google プロダクトのパフォーマンスを評価してください。 Google Cloud新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Verify that billing is enabled for your Google Cloud project.

  6. Cloud Data Fusion API、Cloud Storage API、BigQuery API、Dataproc API を有効にします。

    API を有効にするために必要なロール

    API を有効にするには、serviceusage.services.enable 権限を含む Service Usage 管理者 IAM ロール(roles/serviceusage.serviceUsageAdmin)が必要です。詳しくは、ロールを付与する方法をご覧ください。

    API を有効にする

  7. Cloud Data Fusion インスタンスを作成します。
  8. SQL Server データベースが Cloud Data Fusion からの接続を受け入れられることを確認します。安全に接続するためには、プライベート Cloud Data Fusion インスタンスを作成することをおすすめします。

Cloud Data Fusion インスタンスを表示する

Cloud Data Fusion を使用する際は、 Google Cloud コンソール と個別の Cloud Data Fusion UI の両方を使用します。 Google Cloud コンソールでは、 プロジェクトの作成、Cloud Data Fusion インスタンスの作成と削除を行うことができます。 Google Cloud Cloud Data Fusion UI では、 **Studio** や **Wrangler** などのさまざまなページを使用して Cloud Data Fusion の機能を使用できます。

  1. Google Cloud コンソールで、Cloud Data Fusion のページに移動します。

  2. Cloud Data Fusion Studio でインスタンスを開くには、[インスタンス]、[インスタンスを表示] の順にクリックします。

    [インスタンス] に移動

SQL Server のパスワードをセキュリティ キーとして保存する

SQL Server のパスワードを Cloud Data Fusion インスタンスでの暗号化に使用するセキュリティ キーとして追加します。このガイドの後の部分で、Cloud KMS を使用してパスワードを取得されるようにします。

  1. Cloud Data Fusion ページの右上隅にある [SYSTEM ADMIN] をクリックします。

  2. [Configuration] タブをクリックします。

  3. [Make HTTP Calls] をクリックします。

    [Configuration] タブ。

  4. プルダウン メニューで [PUT] を選択します。

  5. [Path] フィールドに「namespaces/NAMESPACE_ID/securekeys/PASSWORD」と入力します。

  6. [Body] フィールドに「{"data":"SQL_SERVER_PASSWORD"}」と入力します。

  7. [送信] をクリックします。

    パスワード。

レスポンスとしてステータス コード「200」が返されることを確認します。

SQL Server の JDBC ドライバを取得する

Hub の使用

  1. Cloud Data Fusion UI で [Hub] をクリックします。

  2. 検索バーに「Microsoft SQL Server JDBC Driver」と入力します。

  3. [Microsoft SQL Server JDBC Driver] をクリックします。

  4. [ダウンロード] をクリックします。表示されたダウンロード手順に沿って操作します。

  5. [Deploy] をクリックします。前の手順で作成した Jar ファイルをアップロードします。

  6. [完了] をクリックします。

Studio の使用

  1. Microsoft.com にアクセスします。

  2. ダウンロードするファイルを選択して、[ダウンロード] をクリックします。

  3. Cloud Data Fusion UI で、 メニューをクリックし、[Studio] ページに移動します。

  4. [追加] をクリックします。

  5. [ドライバ] で [アップロード] をクリックします。

  6. ステップ 2 でダウンロードした Jar ファイルをアップロードします。

  7. [Next(次へ)] をクリックします。

  8. [名前] を入力して、ドライバを構成します。

  9. [Class Name] フィールドに「com.microsoft.sqlserver.jdbc.SQLServerDriver」と入力します。

  10. [完了] をクリックします。

Multiple Table Plugins をデプロイする

  1. Cloud Data Fusion ウェブ UI で [HUB] をクリックします。

  2. 検索バーに「Multiple table plugins」と入力します。

  3. [Multiple Table Plugins] をクリックします。

    パスワード。
  4. [デプロイ] をクリックします。

  5. [Finish] をクリックします。

  6. [Create a Pipeline] をクリックします。

SQL Server に接続する

  1. Cloud Data Fusion UI で、 メニューをクリックし、[Studio] ページに移動します。

  2. [Studio] で、[ソース] メニューを開きます。

  3. [Multiple Database Tables] をクリックします。

    複数のテーブル。
  4. [Multiple Database Tables] ノードの上にポインタを置き、[プロパティ] をクリックします。

    プロパティ
  5. [参照名] フィールドに、SQL Server ソースの識別に使用する参照名を指定します。

  6. [JDBC 接続文字列] フィールドに、JDBC 接続文字列を入力します。例: jdbc:sqlserver://mydbhost:1433詳細については、 接続 URL の作成をご覧ください。

  7. [JDBC Plugin Name]、[Database User Name]、および [Database User Password] を入力します。

  8. [検証] をクリックします。

  9. [閉じる] をクリックします。

BigQuery または Cloud Storage に接続する

  1. Cloud Data Fusion UI で、 メニューをクリックし、[Studio] ページに移動します。

  2. [Sink] を開きます。

  3. [BigQuery Multi Table] または [GCS Multi File] をクリックします。

  4. [Multiple Database Tables] ノードを [BigQuery Multi Table] または [GCS Multi File] に接続します。

    シンクを接続します。
  5. [BigQuery Multi Table] または [GCS Multi File] ノードの上にポインタを置き、[プロパティ] をクリックして、シンクを構成します。

    詳細については、Google BigQuery マルチテーブル シンクGoogle Cloud Storage マルチファイル シンクをご覧ください。

  6. [検証] をクリックします。

  7. [閉じる] をクリックします。

パイプラインのプレビューを実行する

  1. Cloud Data Fusion UI で、 メニューをクリックし、[Studio] ページに移動します。

  2. [プレビュー] をクリックします。

  3. [実行] をクリックします。プレビューが正常に完了するまで待ちます。

パイプラインをデプロイする

  1. Cloud Data Fusion UI で、 メニューをクリックし、[Studio] ページに移動します。

  2. [デプロイ] をクリックします。

パイプラインを実行する

  1. Cloud Data Fusion UI で [メニュー] をクリックします。

  2. [リスト] をクリックします。

  3. パイプラインをクリックします。

  4. パイプラインの詳細ページで [実行] をクリックします。

次のステップ