CSV ファイルをデータポータルにアップロードする

ほとんどのソースのデータは、CSV(カンマ区切り値)形式でアップロードすることでデータポータルに取り込み可能です。ファイルのアップロードを使用すると、特定のコネクタでサポートされていないデータに関するレポートを作成できます。

ファイルのアップロードの仕組み

ファイルをアップロードするときは、そのファイルを「データセット」に追加します。これにより、そのデータセットを基にしたデータソースを作成できます。

データセットは、作成したユーザーによって所有されるため、共有することはできませんが、データセットを基に作成されたデータソースは、他のどのユーザーも共有したり編集したりできます。つまり、共有データソースやレポート内でデータセットを使用することはできますが、データセット自体にアクセスできるのは作成したユーザーに限られます。

データセットには複数のファイルをアップロードできます。新しいファイルを追加すると、そのファイルのデータがデータセットの末尾に追加されます。

アップロードしたデータは、Cloud Storage に保存されます。クラウドからデータにアクセスしてダウンロードできる、他の Google Cloud サービスでデータを使用できるなど、多くのメリットがあります。

Cloud Storage の詳細を確認する

CSV ファイルのデータソースを作成する

データポータルは、アップロードされた CSV ファイルをデータセットに保存します。データセットには、同じ列ヘッダーを持つ 1 つ以上の CSV ファイルを含めることができます。CSV ファイルのデータソースには、1 つ以上のデータセットを含めることができます。

新しい CSV ファイルのデータソースを作成する手順は次のとおりです。

  1. データポータルにログインします。
  2. [作成] ボタンをクリックし、[データソース] を選択します。
  3. [CSV ファイルのアップロード] Google コネクタを選択します。
  4. [データセットを追加] ボタンをクリックして、新しいデータセットを作成します。
    • 1 つ以上の CSV ファイルを [使用可能なデータセット] セクションにドラッグすることもできます。アップロードしたファイルを含む新しいデータセットがデータポータルによって作成されます。
  5. ファイルのアップロードが完了したら、[接続] ボタンをクリックします。

アップロードしたデータは、Cloud Storage に保存されます。クラウドからデータにアクセスしてダウンロードできる、他の Google Cloud サービスでデータを使用できるなど、このストレージ設定には多くのメリットがあります。

Cloud Storage の詳細を確認する

データセットに CSV ファイルを追加する

列ヘッダーが一致していれば、データセットに複数のファイルをアップロードできます。新しいファイルを追加すると、そのファイルのデータがデータセットの末尾に追加されます。これにより、時間の経過とともにデータを更新できます。

データセットに CSV ファイルを追加する手順は次のとおりです。

  1. データポータルにログインします。
  2. [データソース] タブをクリックします。
  3. CSV ファイルを含むデータソースを選択します。
  4. [接続を編集] をクリックします。
  5. [使用可能なデータセット] セクションで、ファイルの追加元となるデータセットを選択します。
  6. [ファイルを追加] ボタンをクリックします。
    • 1 つ以上の CSV ファイルを [データセット内のファイル] セクションにドラッグすることもできます。
  7. ファイルのアップロードが完了したら、[再接続] ボタンをクリックします。

データセットを共有する

データセットは、作成したユーザーによって所有されるため、共有することはできません。ただし、データセットを基に作成したデータソースは、他のユーザーと共有できます。つまり、共有データソースやレポート内でデータセットを使用することはできますが、データセット自体にアクセスできるのは作成したユーザーに限られます。

アップロードするファイルの形式

アップロードするファイルが正しくフォーマットされていることを確認してください。そうしないと、アップロード中にエラーが発生したり、レポートでデータが正しく表示されなかったりする可能性があります。

コンテンツ エラーが発生する最もよくある原因として、アップロードしたデータ内で区切り文字、引用符、改行文字が誤って使用されていることが考えられます。ファイルのアップロードでこれらの文字がどのように処理されるかを理解しておくと、後で問題が発生するのを防ぐことができます。

UTF-8 エンコード

アップロードするファイルのエンコードは UTF-8 にする必要があります。これは、ウェブ上のほとんどのアプリケーションで標準的に使用されているエンコードです。

ただし、一部のデスクトップ製品(たとえば Microsoft Excel)からエクスポートしたデータは、データポータルによるアップロードの前に、UTF-8 への変換が必要となることがあります。それ以外の場合は、データポータルで Invalid characters in the file. Only UTF-8 encoded characters are supported. などのエラー メッセージが返されることがあります。

表形式データのみ

ファイルのアップロードでは、表形式のデータのファイルのみをインポートできます。つまり、ファイルは行と列の規則的な構造を持っている必要があります。表の特定のセルにデータがない場合でも、各行の列数は同じにする必要があります。結合されたセルを含むファイルや、異なる構造を持つファイルをアップロードしようとすると、アップロード エラーが発生します。

区切り文字(セパレータ)

データに含まれるすべてのフィールドは、それぞれカンマで区切る必要があります。

アップロードするフィールドの実際のデータ内にカンマが含まれている場合は、そのフィールドを引用符で囲む必要があります。データに二重引用符が含まれている場合は、単一引用符でフィールドを囲むことができます。

ヘッダー行

ファイルの 1 行目は、見出し行にする必要があります。この行では、データポータルで使用するフィールドの名前を指定します。フィールド名は重複しないようにする必要があるため、見出し行で重複する値を指定することはできません。

列名は次の条件を満たす必要があります。

  • アルファベット、数字、アンダースコアのみを使用する。その他の句読点や特殊文字は使用できません。
  • 文字またはアンダースコアで始まる
  • 128 文字以下にする

見出し行も、区切り文字に関する規則に沿ったものにします。

改行

ファイルの各行は改行で終わる必要があります。引用符でエスケープされている場合でも、データの改行はサポートされていません。

トラブルシューティング

次のセクションでは、CSV ファイルのアップロード時に表示される一般的なエラーについて説明します。

エラー: ファイルが無効です

CSV ファイルをアップロードしようとした後にデータポータルに File is Invalid エラーが表示された場合は、次の原因が考えられます。

  • ファイルに無効な UTF-8 文字が含まれている。
  • ファイルが実際には CSV ファイルではない。たとえば、PDF ファイルの名前を変更して拡張子を「.csv」にすると、データポータルでファイルを正しく解析できません。

ファイルのアップロードに関する制限事項

ファイルのアップロードには以下の制限が適用されます。

  • データセットはユーザー 1 人あたり 1,000 個まで
  • ユーザーあたりの合計ストレージ容量は 2 GB まで
  • データセットあたりのアップロード数は 1 日 100 回まで
  • ファイルサイズはデータセットあたり 100 MB まで

データソースについて