支援的功能

本頁說明 Document AI Warehouse 支援的功能和限制。

主要功能與特色

功能 說明 支援
管理存取權控管 控管哪些使用者有權存取 Document AI 倉儲中的資源,以及這些使用者的存取層級。
管理文件結構定義 文件結構定義會在 Document AI 倉儲中定義文件類型 (例如月結單或薪資單) 的結構,管理員可以在其中指定不同資料類型 (文字 | 數字 | 日期 | 列舉) 的屬性。
管理文件 提供建立、擷取、更新及刪除文件的作業。 Document AI Warehouse 會使用文件做為資料模型,整理實體文件 (例如 PDF 或 .txt 檔案) 及其相關聯的屬性。
將文件整理到資料夾中 您可以將資料夾當做分類文件的容器,並視需要為文件加上標籤。使用者可以將文件附加至多個資料夾,而一個資料夾可以包含多份文件。
搜尋文件
  • 全文搜尋 (文字搜尋)
    • 這項功能可識別符合查詢條件的自然語言文件,並視需要依與查詢的相關性排序。客戶可使用 Document AI Warehouse,在搜尋要求中以字串格式指定查詢。
  • 屬性篩選 (客戶中繼資料篩選)
    • 如要使用屬性納入或排除部分文件以供搜尋,請將該屬性標示為可篩選。舉例來說,您可能會建立代表「供應商」的屬性,並將其設為可篩選,因為使用者想搜尋特定供應商的月結單。
進階搜尋 Document AI Warehouse 提供「自訂同義字」功能,可讓客戶為特定領域提供自己的同義字

支援的檔案

如需完整詳細資料,請參閱支援的格式MIME 類型

格式 支援 API 透過 UI 手動上傳 UI 轉譯 raw_document_file_type/content_category used
聯合圖像專家組 (JPEG/JPG) CONTENT_CATEGORY_IMAGE
標記圖片檔案格式 (tif/tiff) 檔案應以 TIFF 檔案格式手動上傳 RAW_DOCUMENT_FILE_TYPE_TIFF
Microsoft Word (doc/docx) 檔案應以 docx 格式手動上傳。 RAW_DOCUMENT_FILE_TYPE_DOCX
Microsoft Excel 檔案 (xls/xlsx) RAW_DOCUMENT_FILE_TYPE_XLSX
Microsoft PowerPoint 檔案 (ppt/pptx) RAW_DOCUMENT_FILE_TYPE_PPTX
可攜式文件格式 (pdf) RAW_DOCUMENT_FILE_TYPE_PDF
純文字 (txt) RAW_DOCUMENT_FILE_TYPE_TEXT
可攜式網路圖形 (png) CONTENT_CATEGORY_IMAGE
點陣圖 (bmp) CONTENT_CATEGORY_IMAGE
Graphics Interchange Format (gif) CONTENT_CATEGORY_IMAGE
超文字 (HTML) RAW_DOCUMENT_FILE_TYPE_TEXT
XML (xml) RAW_DOCUMENT_FILE_TYPE_TEXT
RTF 格式 (.rtf) RAW_DOCUMENT_FILE_TYPE_UNSPECIFIED

佈建中

功能 穩定 一般 快速
UI 服務
Google Cloud console

處理文件

功能 穩定 一般 快速
透過使用者介面上傳文件
大量上傳

API 用戶端程式庫

Document AI 倉儲的用戶端程式庫可協助您編寫與 Google Cloud整合的自訂程式碼。所有服務都可透過用戶端程式庫存取。

程式庫 穩定 一般 快速
Java
Python