サポートされる機能

このページでは、Document AI Warehouse でサポートされている機能と制限事項について説明します。

主な機能

機能 説明 サポート対象
アクセス制御を管理する Document AI Warehouse のどのリソースに、誰がアクセスできるのか、またその人にどのレベルのアクセス権を持たせるのかを制御します。
ドキュメント スキーマを管理する ドキュメント スキーマは、Document AI ウェアハウス内でのドキュメント タイプ(請求書や給与明細書など)の構造を定義します。管理者はここでさまざまなデータタイプのプロパティ(テキスト | 数値 | 日付 | 列挙値)を指定します。
ドキュメントを管理する ドキュメントの作成、取得、更新、削除を行うオペレーションを提供します。Document AI ウェアハウスは、ドキュメントをデータモデルとして使用して、実世界のドキュメント(PDF や .txt など)とその関連プロパティを整理します。
ドキュメントをフォルダで整理する フォルダは、ドキュメントをグループ化してラベル付けするためのコンテナとして機能します。ユーザーはドキュメントを複数のフォルダに添付でき、フォルダには複数のドキュメントを含めることができます。
ドキュメントを検索する
  • 全文検索(テキスト検索)
    • クエリを満たす自然言語ドキュメントを特定し、必要に応じてクエリとの関連性で並べ替える機能を提供します。Document AI Warehouse を使用すると、検索リクエストでクエリを文字列形式で指定できます。
  • プロパティ フィルタリング(顧客メタデータ フィルタリング)
    • 検索でドキュメントの一部を含めるか除外するためにプロパティを使用する場合は、そのプロパティをフィルタ可能としてマークします。たとえば、ユーザーが特定のベンダーの請求書を検索できるように、「ベンダー」を表すプロパティをフィルタ可能にすることができます。
検索オプション Document AI Warehouse には、「カスタム シノニム」という機能があります。この機能を使用すると、お客様は特定のドメインの独自のシノニムを指定できます。

サポートされているファイル

サポートされている形式MIME タイプの詳細。

形式 API がサポートされている UI 手動アップロード UI レンダリング raw_document_file_type / content_category used
Joint Photographic Experts Group(jpeg/jpg) CONTENT_CATEGORY_IMAGE
Tag Image File Format(tif/tiff) ファイルは TIFF ファイルとして手動でアップロードする必要があります RAW_DOCUMENT_FILE_TYPE_TIFF
Microsoft Word(doc/docx) ファイルは docx ファイルとして手動でアップロードする必要があります。 RAW_DOCUMENT_FILE_TYPE_DOCX
Microsoft Excel ファイル(xls/xlsx) RAW_DOCUMENT_FILE_TYPE_XLSX
Microsoft PowerPoint ファイル(.ppt / .pptx) RAW_DOCUMENT_FILE_TYPE_PPTX
Portable Document Format(pdf) RAW_DOCUMENT_FILE_TYPE_PDF
書式なしテキスト(txt) RAW_DOCUMENT_FILE_TYPE_TEXT
Portable Network Graphics(png) CONTENT_CATEGORY_IMAGE
ビットマップ(bmp) CONTENT_CATEGORY_IMAGE
Graphics Interchange Format(gif) CONTENT_CATEGORY_IMAGE
ハイパーテキスト(html) RAW_DOCUMENT_FILE_TYPE_TEXT
XML(xml) RAW_DOCUMENT_FILE_TYPE_TEXT
リッチテキスト形式(rtf) RAW_DOCUMENT_FILE_TYPE_UNSPECIFIED

プロビジョニング

機能 Stable 標準 Rapid
UI サービス
Google Cloud コンソール

ドキュメントの操作

機能 Stable 標準 Rapid
UI を使用してドキュメントをアップロードする
一括アップロード

API クライアント ライブラリ

Document AI Warehouse のクライアント ライブラリは、 Google Cloudと統合するカスタムコードの作成をサポートします。すべてのサービスにクライアント ライブラリからアクセスできます。

ライブラリ Stable 標準 Rapid
Java
Python