ほとんどのソースのデータは、CSV(カンマ区切り値)形式でアップロードすることでデータポータルに取り込み可能です。ファイルのアップロードを使用すると、特定のコネクタでサポートされていないデータに関するレポートを作成できます。
ファイルのアップロードの仕組み
ファイルをアップロードするときは、そのファイルを「データセット」に追加します。これにより、そのデータセットを基にしたデータソースを作成できます。
データセットは、作成したユーザーによって所有されるため、共有することはできませんが、データセットを基に作成されたデータソースは、他のどのユーザーも共有したり編集したりできます。つまり、共有データソースやレポート内でデータセットを使用することはできますが、データセット自体にアクセスできるのは作成したユーザーに限られます。
データセットには複数のファイルをアップロードできます。新しいファイルを追加すると、そのファイルのデータがデータセットの末尾に追加されます。
アップロードしたデータは、Cloud Storage に保存されます。クラウドからデータにアクセスしてダウンロードできる、他の Google Cloud サービスでデータを使用できるなど、多くのメリットがあります。
CSV ファイルのデータソースを作成する
データポータルは、アップロードされた CSV ファイルをデータセットに保存します。データセットには、同じ列ヘッダーを持つ 1 つ以上の CSV ファイルを含めることができます。CSV ファイルのデータソースには、1 つ以上のデータセットを含めることができます。
新しい CSV ファイルのデータソースを作成する手順は次のとおりです。
- データポータルにログインします。
- [作成] ボタンをクリックし、[データソース] を選択します。
- [CSV ファイルのアップロード] Google コネクタを選択します。
- [データセットを追加] ボタンをクリックして、新しいデータセットを作成します。
- 1 つ以上の CSV ファイルを [使用可能なデータセット] セクションにドラッグすることもできます。アップロードしたファイルを含む新しいデータセットがデータポータルによって作成されます。
- ファイルのアップロードが完了したら、[接続] ボタンをクリックします。
アップロードしたデータは、Cloud Storage に保存されます。クラウドからデータにアクセスしてダウンロードできる、他の Google Cloud サービスでデータを使用できるなど、このストレージ設定には多くのメリットがあります。
データセットに CSV ファイルを追加する
列ヘッダーが一致していれば、データセットに複数のファイルをアップロードできます。新しいファイルを追加すると、そのファイルのデータがデータセットの末尾に追加されます。これにより、時間の経過とともにデータを更新できます。
データセットに CSV ファイルを追加する手順は次のとおりです。
- データポータルにログインします。
- [データソース] タブをクリックします。
- CSV ファイルを含むデータソースを選択します。
- [接続を編集] をクリックします。
- [使用可能なデータセット] セクションで、ファイルの追加元となるデータセットを選択します。
- [ファイルを追加] ボタンをクリックします。
- 1 つ以上の CSV ファイルを [データセット内のファイル] セクションにドラッグすることもできます。
- ファイルのアップロードが完了したら、[再接続] ボタンをクリックします。
データセットを共有する
データセットは、作成したユーザーによって所有されるため、共有することはできません。ただし、データセットを基に作成したデータソースは、他のユーザーと共有できます。つまり、共有データソースやレポート内でデータセットを使用することはできますが、データセット自体にアクセスできるのは作成したユーザーに限られます。
アップロードするファイルの形式
アップロードするファイルが正しくフォーマットされていることを確認してください。そうしないと、アップロード中にエラーが発生したり、レポートでデータが正しく表示されなかったりする可能性があります。
コンテンツ エラーが発生する最もよくある原因として、アップロードしたデータ内で区切り文字、引用符、改行文字が誤って使用されていることが考えられます。ファイルのアップロードでこれらの文字がどのように処理されるかを理解しておくと、後で問題が発生するのを防ぐことができます。
UTF-8 エンコード
アップロードするファイルのエンコードは UTF-8 にする必要があります。これは、ウェブ上のほとんどのアプリケーションで標準的に使用されているエンコードです。
ただし、一部のデスクトップ製品(たとえば Microsoft Excel)からエクスポートしたデータは、データポータルによるアップロードの前に、UTF-8 への変換が必要となることがあります。それ以外の場合は、データポータルで Invalid characters in the file. Only UTF-8 encoded characters are supported. などのエラー メッセージが返されることがあります。
表形式データのみ
ファイルのアップロードでは、表形式のデータのファイルのみをインポートできます。つまり、ファイルは行と列の規則的な構造を持っている必要があります。表の特定のセルにデータがない場合でも、各行の列数は同じにする必要があります。結合されたセルを含むファイルや、異なる構造を持つファイルをアップロードしようとすると、アップロード エラーが発生します。
区切り文字(セパレータ)
データに含まれるすべてのフィールドは、それぞれカンマで区切る必要があります。
アップロードするフィールドの実際のデータ内にカンマが含まれている場合は、そのフィールドを引用符で囲む必要があります。データに二重引用符が含まれている場合は、単一引用符でフィールドを囲むことができます。
ヘッダー行
ファイルの 1 行目は、見出し行にする必要があります。この行では、データポータルで使用するフィールドの名前を指定します。フィールド名は重複しないようにする必要があるため、見出し行で重複する値を指定することはできません。
列名は次の条件を満たす必要があります。
- アルファベット、数字、アンダースコアのみを使用する。その他の句読点や特殊文字は使用できません。
- 文字またはアンダースコアで始まる
- 128 文字以下にする
見出し行も、区切り文字に関する規則に沿ったものにします。
改行
ファイルの各行は改行で終わる必要があります。引用符でエスケープされている場合でも、データの改行はサポートされていません。
トラブルシューティング
次のセクションでは、CSV ファイルのアップロード時に表示される一般的なエラーについて説明します。
エラー: ファイルが無効です
CSV ファイルをアップロードしようとした後にデータポータルに File is Invalid エラーが表示された場合は、次の原因が考えられます。
- ファイルに無効な UTF-8 文字が含まれている。
- ファイルが実際には CSV ファイルではない。たとえば、PDF ファイルの名前を変更して拡張子を「.csv」にすると、データポータルでファイルを正しく解析できません。
ファイルのアップロードに関する制限事項
ファイルのアップロードには以下の制限が適用されます。
- データセットはユーザー 1 人あたり 1,000 個まで
- ユーザーあたりの合計ストレージ容量は 2 GB まで
- データセットあたりのアップロード数は 1 日 100 回まで
- ファイルサイズはデータセットあたり 100 MB まで