データをモデル化する

データ モデリングは、データポータルでデータを整形して、有益で的を絞ったレポートを作成するのに役立ちます。このプロセスでは、データポータルがデータをディメンション、指標、計算フィールドに整理する方法を調整して、ビジネス目標に沿ってデータとメタデータを構成します。これらのモデリング手法は、レポート内、データソース内、基になるデータセット内で直接という 3 つの異なるレベルで適用できます。

データ モデリング機能を使用して、フィールド プロパティの調整、計算フィールドの作成、フィルタの適用を行います。これらの機能により、生データを変換して新しい分析情報を導き出し、データアクセスを制御することで、データポータル レポートの関連性と明瞭さを高めることができます。

始める前に

このページを最大限に活用するには、次のトピックについて理解しておく必要があります。

データポータルでのデータの整理方法

データ モデリングの詳細に入る前に、データポータルでデータがどのように整理されるかを理解しておくと便利です。 データポータルで作成するすべてのグラフとテーブルは、列と行で構成される表形式のデータ構造に基づいて作成されます。 列(フィールド)は、各行に含まれるデータを定義します。データを定義する情報はメタデータと呼ばれます。

データポータルには次の 2 種類のフィールドがあります。

  • ディメンション はカテゴリまたはラベルです。ディメンションは測定対象を表します。 次に例を示します。
    • プロダクト名
    • 日付
  • 指標 は測定値です。指標は、あるものがどれだけあるかを表します。 次に例を示します。
    • セールス
    • ページビュー数
    • クリック数

データソースを作成すると、基になるデータセットへの接続に使用したコネクタによって提供されるディメンションと指標が表示されます。これらのデフォルト フィールドに加えて、次の種類のフィールドを作成できます。

  • 計算フィールド は、数式を使用して、データから派生した新しい指標またはディメンションを作成します。次に例を示します。

    • Price * Discount
    • TODAY() - 7
    • IF(FINAL GRADE > 35, "PASS", "FAIL")

    詳しくは、計算フィールドについてをご覧ください

  • パラメータ変数 を使用すると、ユーザー入力に基づいてレポートをパーソナライズできます。パラメータの詳細

これらのフィールド(ディメンション、指標、計算フィールド、パラメータ、変数)は、レポートの構成要素です。データ モデリングを使用すると、これらの構成要素を微調整して、有益なデータポータル レポートを作成できます。

データをモデリングできる場所

データは次の 3 つのレベルでモデリングできます。

  • レポート内
  • データソース内
  • 基になるデータセット内

    これらのモデリング レベルは、逆ピラミッドのように考えることができます。これらのレベルを組み合わせて使用できます。 データをモデリングする場所は、必要なものによって異なります。

データ モデリングのレベルを逆ピラミッドで表した図。上からレポート、データソース、データセット。下向きの矢印は、データソース レベルでモデリングを行う場合に制御性が高くなることを示しています。上向きの矢印は、レポートレベルでの柔軟性が高いことを示します。

データセット レベルでのデータ モデリングは、データポータルの外部で行われます。 ここでは、柔軟性と制御のバランスを取ることから、データとメタデータがデータポータルに到達する前に、意図したとおりになっていることを確認することに重点が置かれます。

以降のセクションでは、これらのモデリング レベルについて詳しく説明します。

レポートレベルのモデリング

レポートレベルでデータをモデリングすると、レポートの編集者は、構成要素を自由に操作するのと同じように、必要に応じてデータを変更して探索できます。

レポートレベルでデータをモデリングする場合は、次の点に注意してください。

  • レポートの編集時に適用されるモデリング機能は、そのレポート内にのみ存在するため、同じデータソースを使用している場合でも、レポートによって異なる分析情報が表示されることがあります。
  • レポートレベルのモデリングでは、データを制御できる範囲が最も小さくなります。 レポートの編集者は、埋め込みデータソースのフィールドを表示して編集できます。
  • レポートの閲覧者は、特定のモデリング構成を表示できます。詳しくは、データ モデリングとデータアクセスをご覧ください。

データソース レベルのモデリング

データソース レベルでデータをモデリングすると、データをより細かく制御できます。データソースを編集できるユーザーを制限し、レポート内のフィールドを変更できないようにすることができます。 データソース レベルのモデリングは、すべてのレポートが信頼できる単一の情報源に基づいていることを保証するのに役立ちます。

データソース レベルでデータをモデリングする場合は、次の点に注意してください。

  • データソースの編集時に適用されるモデリング機能は、そのデータソース内に存在します。
  • データソース レベルのモデリングにより、モデルを使用するすべてのグラフとレポートでモデルを使用できるようになります。
  • 一部のデータ モデリング機能は、データソース レベルでのみ使用できます。たとえば、フィールドの説明はデータソースにのみ追加できます。一方、 Looker コネクタを使用するレポートを除き、フィルタは レポートレベルでのみ適用できます。
  • レポートの閲覧者は、特定のデータソース レベルのモデリング構成を表示できます。詳しくは、データ モデリングとデータ アクセスをご覧ください。

基になるデータセットでデータをモデリングする

基になるデータセットでデータをモデリングすると、接続されているすべてのデータソースが、必要な正確なデータを受け取ることができます。この方法は、データがデータポータルに到達する前に準備する場合によく使用されます。

たとえば、複雑なデータ変換にデータポータルの関数やフィルタを使用するよりも、BigQuery コネクタで SQL クエリを直接記述する方が効率的で効果的な場合があります。

データセット レベルのモデリングは、データのセキュリティを最大限に高めます。 データソースの編集者は、直接権限が明示的に付与されていない限り、基になるデータセットにアクセスできません。

データをモデリングする方法

次の機能を使用してデータをモデリングできます。

  • 名前、データ型、集計などのフィールド プロパティを調整する
  • ベースデータを拡張または変換する計算フィールドを作成する
  • 特定の値を含めるか除外するフィルタをデータに適用する

フィールド プロパティを調整する

データソースのフィールドには、次の表に示すように、そのデータソースの作成に使用されるコネクタによって提供されるデフォルトのプロパティ セットがあります。

編集可能なフィールド プロパティを確認する

プロパティ 説明
フィールド名 フィールド名は、データソースの [フィールド] 列と、レポートのプロパティ パネルのフィールド チップの [表示名] に表示されます。
データの種類 データ型は、データソースの [Type] 列と、レポートのプロパティ パネルのフィールド チップの [Data type] に表示されます。

データ型プロパティは、フィールドの処理時に想定されるデータの種類をデータポータルに示します。データ型によって、データがレポートにどのように表示されるか、データに対して許可されるオペレーションと許可されないオペレーションが決まります。たとえば、算術関数を [テキスト] フィールドに適用したり、[数値] フィールドをレポートの期間として使用したりすることはできません。

データ型の詳細

集計 集計は、データソースの [デフォルトの集計] 列と、レポートのプロパティ パネルのフィールド チップの [集計] 列に表示されます。

集計は、フィールドのデータを要約します。データのソースと、データセットでの定義方法に応じて、次の 3 つのデフォルトの方法を使用できます。

  1. [なし] は、数値以外のデータを含むすべてのディメンションに対するデフォルトの集計です。集計が [なし] のフィールドは、データポータルでディメンションとして扱われます。
  2. [合計] は、ディメンションの生数を結合するデフォルトの方法です。Google スプレッドシート、CSV ファイル、BigQuery テーブルなどのデータテーブルの数値列に適用されます。[合計] に設定されたフィールドは、データポータルでディメンションまたは指標として使用できます。
  3. [自動] は、データセット、コネクタ、または計算フィールドからの指標に適用されます。[自動] は、 フィールドの集計方法が固定されており、変更できないことを意味します。[自動] に設定されたフィールドは、データポータルで常に指標として扱われます。
説明 データソースの [説明] 列では、個々のフィールドにアノテーションを追加できます。レポートレベルでフィールドの説明を変更することはできません。

Looker検索広告 360 など、一部のコネクタでは、フィールドの説明が自動的に提供されます。

表グラフにフィールドの説明を表示するには、テーブルのプロパティで [フィールドの説明を表示する] スタイル オプションを有効にします。[フィールドの説明を表示する] は、Looker または 検索広告 360 のデータソースに接続されているグラフで自動的に有効になります。

表示形式 [表示形式] プロパティを使用すると、数値フィールドまたは日付フィールドをグラフに表示する方法を変更できます。[Display format] は、レポートのプロパティ パネルのフィールド チップにのみ表示されます。
比較計算 [比較計算] プロパティを使用すると、各行のデータをフィールドの合計値と比較できます。[比較計算] は、レポートのプロパティ パネルのフィールド チップにのみ表示されます。

比較計算の詳細

関数 [関数] プロパティを使用すると、データの累積結果を計算できます。[関数] は、レポートのプロパティ パネルのフィールド チップにのみ表示されます。

関数の詳細

データソース レベルでフィールド プロパティを変更するには、データソースを編集します

レポートレベルでフィールド プロパティを変更する手順は次のとおりです。

  1. レポートを編集してグラフを選択します。
  2. グラフのプロパティ パネルで、フィールドのデータ型アイコンにカーソルを合わせます。データ型アイコンが編集鉛筆アイコンに変わります。
  3. 編集鉛筆アイコンをクリックします
  4. 表示されるダイアログで、フィールド プロパティを編集します。

レポートの編集者がフィールド プロパティを変更できないようにするには、データソースを編集して [レポートのフィールド編集] をオフにします。詳しくは、フィールドを編集するをご覧ください。

計算フィールドを使用してデータをモデリングする

計算フィールドでは、データから派生した新しいフィールドを作成できます。計算フィールドは、フィールド リストに fx という記号付きで表示されます。

データソースで作成した計算フィールドは、そのデータソースを使用するすべてのレポートで使用できます。レポートのグラフで作成した計算フィールドは、そのグラフでのみ使用できます。

詳しくは、計算フィールドについてをご覧ください。

フィルタを適用

レポートにフィルタを適用して、閲覧者に表示される情報を絞り込むことで、レポート内のデータを制限できます。フィルタを使用すると、最も重要なデータに焦点を当てることができ、レポートの内容を閲覧者にとってより有益なものに整えることができます。

フィルタは、1 つのコンポーネント、コンポーネントのグループ、1 つのページ、またはレポート全体に適用できます。

フィルタ プロパティの詳細

データ モデリングとデータアクセス

レポートのメタデータには、フィルタ構成などのレポートレベルのモデリング機能の表示設定や、プロパティ パネルから作成された計算フィールドの名前が含まれます。 レポートのメタデータは、レポートの閲覧権限を持つユーザーがレポートのネットワーク リクエストを確認するか、レポートのコピーを作成すると表示されます。

データソースの編集者のみが、フィールドの説明などのデータソース レベルのモデリング機能の表示設定や、データソース内で作成された計算フィールドの名前を表示できます。ただし、コネクタの種類やデータソース スキーマの列名など、データソース モデルの一部の要素には、常にユーザーがアクセスできます。