データポータルでのブレンドの仕組み

データを統合すると、複数のデータソースに基づくグラフ、テーブル、コントロールを作成できます。データポータルまたは Looker レポートでは、最大 5 つのデータソースのデータを統合できます。

たとえば、異なる BigQuery テーブル(例: 顧客情報と注文詳細)のデータを統合して、データポータルで 1 つのテーブルを作成して情報を視覚化できます。別の例として、Google 広告アカウントと Google アナリティクス アカウントのデータを組み合わせて時系列で表示して、マーケティング キャンペーンのパフーマンスの全体像を把握することも可能です。

統合とデータソースの違い

データを統合すると、「統合 」と呼ばれるリソースが作成されます。統合は、レポートのグラフとコントロールにデータを提供するという点で、データソースと似ています。ただし、結合とデータソースにはいくつかの重要な違いがあります。

  • 結合は、複数のデータソースから情報を取得します。
  • 結合は、作成元のレポートに常に埋め込まれます。他のレポートで統合を再利用することはできません。ただし、レポートをコピーすると、新しいレポートに統合もコピーされるため、統合データがグラフに引き続き反映されます。
  • 基となるデータソースの指標は、統合では数値ディメンションとなり、集計されません。詳しくは、データの統合のヒントと高度なコンセプトのドキュメント ページをご覧ください。
  • 統合では、独自のデータの更新速度や認証情報を設定できません。この設定は基となるデータソースから継承されます。

統合の仕組み

データベースのプログラミングでは、異なるテーブルのデータを統合するために SQL の JOIN ステートメントを使用しますが、データポータルでは、コードを記述することなくデータを統合できます。代わりに統合エディタを使用するため、コードを記述することなくデータを統合することができます(以下のスクリーンショット参照)。

テーブルとフィールドのオプションを選択すると、統合エディタに統合オプションが表示されます。

凡例:

  1. テーブル
  2. 結合の設定
  3. [別のテーブルを結合] ボタン
  4. 統合名
  5. 含まれているディメンションと指標
  6. 指標、期間、フィルタを追加する
  7. [繰り返し結合フィールドを非表示にする] オプションと [保存] ボタン

テーブル

統合は複数のテーブル で構成されます。統合を編集または作成すると、管理画面にテーブルが表示されます。各テーブルには、基になるデータソースから抽出された一連のフィールドが含まれています。1 つの統合に、テーブルは最大 5 つまで追加できます。

テーブルを結合する前に、データポータルは各テーブルの行をグループ化し、そのテーブルに含まれるディメンションに基づいて集計します。選択したディメンションに各レコードの一意の識別子が含まれていない場合、この事前グループ化フェーズで同一の行が折りたたまれます。この折りたたみにより、同じデータに対して SQL 結合クエリを直接実行した場合よりも行数が少なくなることがあります。行が早すぎるタイミングで折りたたまれないようにするには、統合内の各テーブルのディメンション リストに一意の識別子フィールド(主キーや一意の行 ID など)を追加します。

テーブルにデータを追加するには、[ディメンションを追加] または [指標を追加] をクリックします。

結合条件で使用されるフィールドは、リンクアイコン 結合条件のフィールドを示すために使用されるリンクアイコン 付きで表示されます。

結合の設定

「結合の設定」 で、テーブルのペアを結合して統合します。「結合の設定」は、演算子(テーブルのペアから一致するレコードと一致しないレコードの組み合わせ方法を定義する)と、条件(テーブルの相互関連を定義するフィールドのセット)で構成されています。

たとえば、次のスクリーンショットでは、「Grades (成績)」テーブルが「Students (学生)」テーブルの student_id フィールドと、「Classes (クラス)」テーブルの class_id フィールドに結合されています。どちらの「結合の設定」でも、左外部演算子が使用されています。

左外部結合演算子が選択され、結合条件が student_id(Grades)と student_id(Students)のフィールド間に設定されている結合設定。

結合演算子

結合演算子は、統合内のテーブルの一致する行と一致しない行の結合方法を定義します。データポータルは、次の結合演算子をサポートしています。

  • 内部結合: 左右両方のテーブルの条件が一致した行のみを返します。
  • 左外部結合: 右側のテーブルの条件が一致した行と、左側のテーブルの条件が一致しない行を返します。
  • 右外部結合: 左側のテーブルの条件が一致した行と、右側のテーブルの条件が一致しない行を返します。
  • 完全外部結合: 左右両方のテーブルからすべての行を返します。
  • クロス結合: 左右両方のテーブルから考えられるすべての行の組み合わせを返します。

結合演算子について詳しくは、BigQuery のドキュメントをご覧ください。

結合条件

「結合条件」とは、各テーブルにある 1 つ以上のフィールドのことで、テーブルのレコードを結合するために使用されます。たとえば、Google アナリティクスと Google 広告のグラフの統合で、抽出された両方のテーブルにキャンペーン名 が存在する場合、データポータルはそのフィールドを使用してデータを結合できます。

統合のテーブルごとに、条件に使用するフィールドを選択します。すべてのテーブルに同じフィールドを使用する必要はありません。また、各フィールドのデータが同じであれば、同じ名前である必要もありません。たとえば、顧客、注文、商品を 1 つのグラフで視覚化するとします。これらのテーブルには次のようなフィールドがあります。

顧客 テーブル

  • customer_ID
  • customer_name

注文 テーブル

  • cust_id
  • order_number
  • order_total

商品 テーブル

  • order_number
  • SKU

これらのテーブルを統合するには、customer_ID フィールドと cust_id フィールドを結合条件として使用して顧客 テーブルと注文 テーブルを結合します。order_number を結合条件として注文 テーブルを商品 テーブルと結合します。

含まれているディメンションと指標

統合の結合条件で使用されるフィールドと、統合に追加するディメンションまたは指標は、[含まれているディメンションと指標] セクションに一覧表示されます。これらは、統合に基づくグラフで使用できるフィールドです。

繰り返し結合フィールドを非表示にする

[繰り返し結合フィールドを非表示にする] オプションを選択すると、結合条件で使用されている重複したフィールドが除外されます。繰り返し結合フィールドを含めるには、このオプションをオフにします。

たとえば、結合設定で student_id フィールドと class_id フィールドを使用して、GradesStudentsClasses の 3 つのテーブルを結合するとします。[繰り返し結合フィールドを非表示にする] オプションをオンにすると、統合には student_idclass_id のインスタンスが 1 つだけ含まれます。

成績、生徒、クラスのテーブルをブレンドしたもので、student_id フィールドと class_id フィールドが 1 つずつ含まれています。

同じ統合設定で、[繰り返し結合フィールドを非表示にする] オプションをオフにすると、統合には student_idclass_id の複数のインスタンスと、そのフィールドが表示されるテーブルの名前(class_id(Grades)、class_id(Classes)、student_id(Grades)、student_id(Students)など)が含まれます。

複数の student_id フィールドと複数の class_id フィールドを含む、成績、生徒、クラスのテーブルのブレンド。

期間とフィルタ

1 つ以上のテーブルに期間またはフィルタを適用することで、統合内のデータを制限できます。

統合の例

クラス、生徒、成績の統合の例では、質問に対する答えを得るための、データ統合の典型的なユースケースを学びます。