集計は、表形式のデータを整理 および要約 するプロセスです。たとえば、次の数値のリストについて考えてみましょう。
100、200、300、400、500
この例を基にして、次のように事実と集計の考え方を確認できます。
| 事実 | 集計 |
|---|---|
| 数値は 5 つある。 | 数 |
| 最小値は 100 | 最小 |
| 最大値は 500 | 最大 |
| 数値の平均値は 300 | 平均 |
| 合計は 1500 | 合計 |
データの集計方法は、この他に「中央値」「個別件数」「四分位」「百分位」などがあります。
ディメンションと集計
上記の例は 1 つの数値セットに基づいたものですが、実際のデータはこのような単純なものではありません。そして、データは通常ディメンションと指標に整理されます。ディメンションはデータを分類してグループ化し、指標はそのデータを測定します。
データポータルでは、集計は常に ディメンションのセットに対して行われます。ディメンションのセットには、次のものがあります。
- すべてのディメンション: 元データを表示できます。
- ディメンションのサブセット: 選択したディメンション別に分類(グループ化)してデータを表示できます。
- 空のセット: データセット全体の概要を表示できます。
たとえば、次の 5 つの数値は、ある 1 日の株価を表しています。日付とティッカーはディメンションで、価格は指標です。
| 日付 | ティッカー | 価格 |
| 1 月 1 日 | GOOG | 100 |
| 1 月 1 日 | AAPL | 200 |
| 1 月 2 日 | GOOG | 300 |
| 1 月 2 日 | AAPL | 400 |
| 1 月 3 日 | GOOG | 500 |
ディメンションを使用することで、データをさまざまに分類してグループ化できます。次に例を示します。
ティッカー別
| ティッカー | 価格 |
| GOOG | ? |
| AAPL | ? |
日付別
| 日付 | 価格 |
| 1 月 1 日 | ? |
| 1 月 2 日 | ? |
| 1 月 3 日 | ? |
これらの例では、指標の値は、データについて知りたい内容によって異なります。たとえば、各会社の平均価格を計算するには、平均の集計方法とティッカーのディメンションを組み合わせて適用します。
| ティッカー | 価格の平均 |
| GOOG | (100 + 300 + 500) / 3 = 300 |
| AAPL | (200 + 400) / 2 = 300 |
ある 1 日の株式情報を公開している会社数を確認するには、日付のディメンションと件数の集計方法を使用します。
| 日付 | 株価の件数 |
| 1 月 1 日 | 2 |
| 1 月 2 日 | 2 |
| 1 月 3 日 | 1 |
次に、株価表で日付とティッカーの両方のディメンションを使用した場合の処理について考えてみましょう。
| 日付 | ティッカー | AVG(価格) | SUM(価格) |
| 1 月 1 日 | GOOG | 100 | 100 |
| 1 月 1 日 | AAPL | 200 | 200 |
| 1 月 2 日 | GOOG | 300 | 300 |
| 1 月 2 日 | AAPL | 400 | 400 |
| 1 月 3 日 | GOOG | 500 | 500 |
使用可能なすべてのディメンションを含むグループを作成すると、結果は元のデータと同じになります。すべての集計結果が同じになるため、興味深い内容ではありませんが、これも集計値です 。データポータルでは、表を作成してすべてのディメンションを表示した場合でも集計方法を設定できますが、何も起きません。
データポータルの集計
データポータルのデータに集計メソッドを適用する方法はいくつかあります。
データソース内で適用する。フィールドのデフォルトの集計により、グラフでの指標の表示方法が決まります。詳しくは、デフォルトの集計をご覧ください。
グラフ内で適用する 。レポートの編集者は、デフォルトの集計をオーバーライドして、グラフごとに別の集計を指標に適用できます。グラフにデータを追加、編集する方法をご覧ください。
計算フィールド内で適用する 。計算フィールドの数式内の特定の集計関数を使用して集計指標を作成できます。詳しくは、関数のリストをご確認ください。
デフォルトの集計
データソースのフィールドには、次のデフォルトの集計を適用できます。
| 集計方法 | 略語 | 説明 |
|---|---|---|
| 合計 | SUM | フィールド値はまとめて加算されます。 |
| 平均 | AVG | フィールド値が平均化されます。 |
| 数 | CT | それぞれのフィールドの値がカウントされます。 |
| 個別件数 | CTD | 一意のフィールド値のみカウントされます。 |
| 最小値 | MIN | フィールドに最小値が表示されます。 |
| 最大値 | MAX | フィールドに最大値が表示されます。 |
| 自動モード | AUT | この方法を直接適用することはできません。集計方法は、基になるデータセットまたは計算フィールドの結果として指定されます。 自動集計方法は変更できません。 |
| なし | 集計は適用されません。このフィールドは、数値データが含まれていてもディメンションとして扱われます。 |
集計方法を変更する
フィールドの集計方法を変更するには、データソースを編集し、[デフォルトの集計] プルダウン メニューを使用します。
自動集計
Google アナリティクスや Google 広告など一部のデータソースでは、自動集計が指標に対して使用可能な唯一の集計方法として表示されます。これらのデータはすでに集計されているため、大量の数値のリストが 1 つの値にまとめられます。使用される集計方法には、「SUM」や「件数」などのシンプルなものや、「パーセンタイル」などの複雑なものがあります。自動集計された指標を別の集計方法に変更することはできません。変更には、データポータルが未集計の元データにアクセスする必要があるためです。
また、自動集計は、スプレッドシートなどの他のデータソースに基づく計算フィールドに適用されます。この場合、集計は AVG(Price) などの集計関数を使用した結果になります。前述のとおり、AVG 関数の結果と競合するため、自動集計を変更することはできませんのでご注意ください。