- リソース: DataStore
- メソッド
リソース: DataStore
DataStore は、グローバル設定と構成を DataStore レベルでキャプチャします。
JSON 表現 |
---|
{ "name": string, "displayName": string, "industryVertical": enum ( |
フィールド | |
---|---|
name |
変更不可。ID。データストアの完全なリソース名。形式: このフィールドは、長さの上限が 1,024 文字の UTF-8 でエンコードされた文字列にする必要があります。 |
displayName |
必須。データストアの表示名。 このフィールドは、長さの上限が 128 文字の UTF-8 でエンコードされた文字列にする必要があります。それ以外の場合は、INVALID_ARGUMENT エラーが返されます。 |
industryVertical |
変更不可。データストアが登録する業種。 |
solutionTypes[] |
データストアが登録するソリューション。各
|
defaultSchemaId |
出力専用。このデータストアに関連付けられているデフォルトの |
contentConfig |
変更不可。データストアのコンテンツ構成。このフィールドが設定されていない場合、サーバーの動作はデフォルトで |
createTime |
出力専用。 RFC 3339 を使用します。生成された出力は常に Z 正規化され、小数点以下は 0、3、6、または 9 桁になります。「Z」以外のオフセットも使用できます。例: |
advancedSiteSearchConfig |
省略可。高度なサイト内検索の設定。 |
kmsKeyName |
入力専用。作成時にこの DataStore の保護に使用される KMS 鍵。 CMEK 組織のポリシーの保護に準拠する必要があるリクエストに設定する必要があります。 このフィールドが設定され、正常に処理されると、cmekConfig フィールドで示されているように、DataStore は KMS 鍵で保護されます。 |
cmekConfig |
出力専用。DataStore の CMEK 関連情報。 |
billingEstimation |
出力専用。お支払いのためのデータサイズの見積もり。 |
aclEnabled |
変更不可。
現在、ACL は |
workspaceConfig |
ワークスペース データのデータストア タイプ構成を保存する構成。 |
documentProcessingConfig |
ドキュメントの理解と拡充の構成。 |
startingSchema |
この このフィールドは 提供されたスキーマは、スキーマに関する特定のルールに対して検証されます。詳しくは、こちらのドキュメントをご覧ください。 |
healthcareFhirConfig |
省略可。 |
servingConfigDataStore |
省略可。DataStore レベルでサービング構成を保存します。 |
identityMappingStore |
変更不可。関連付けられた |
isInfobotFaqDataStore |
省略可。設定されている場合、この DataStore は Infobot FAQ DataStore です。 |
configurableBillingApproach |
省略可。構成可能な課金アプローチの構成。見る |
ContentConfig
データストアのコンテンツ構成。
列挙型 | |
---|---|
CONTENT_CONFIG_UNSPECIFIED |
デフォルト値。 |
NO_CONTENT |
Document.content のないドキュメントのみが含まれます。 |
CONTENT_REQUIRED |
Document.content を含むドキュメントのみが含まれます。 |
PUBLIC_WEBSITE |
データストアは、一般公開ウェブサイトの検索に使用されます。 |
GOOGLE_WORKSPACE |
データストアはワークスペース検索に使用されます。ワークスペース データストアの詳細は、WorkspaceConfig で指定します。 |
AdvancedSiteSearchConfig
高度なサイト内検索の構成データ。
JSON 表現 |
---|
{ "disableInitialIndex": boolean, "disableAutomaticRefresh": boolean } |
フィールド | |
---|---|
disableInitialIndex |
true に設定すると、DataStore の初期インデックス作成が無効になります。 |
disableAutomaticRefresh |
true に設定すると、DataStore の自動更新が無効になります。 |
BillingEstimation
データストアあたりのデータサイズの推定。
JSON 表現 |
---|
{ "structuredDataSize": string, "unstructuredDataSize": string, "websiteDataSize": string, "structuredDataUpdateTime": string, "unstructuredDataUpdateTime": string, "websiteDataUpdateTime": string } |
フィールド | |
---|---|
structuredDataSize |
構造化データのデータサイズ(バイト単位)。 |
unstructuredDataSize |
非構造化データのデータサイズ(バイト単位)。 |
websiteDataSize |
ウェブサイトのデータサイズ(バイト単位)。 |
structuredDataUpdateTime |
構造化データの最終更新タイムスタンプ。 RFC 3339 を使用します。生成された出力は常に Z 正規化され、小数点以下は 0、3、6、または 9 桁になります。「Z」以外のオフセットも使用できます。例: |
unstructuredDataUpdateTime |
非構造化データの最終更新タイムスタンプ。 RFC 3339 を使用します。生成された出力は常に Z 正規化され、小数点以下は 0、3、6、または 9 桁になります。「Z」以外のオフセットも使用できます。例: |
websiteDataUpdateTime |
ウェブサイトの最終更新日時のタイムスタンプ。 RFC 3339 を使用します。生成された出力は常に Z 正規化され、小数点以下は 0、3、6、または 9 桁になります。「Z」以外のオフセットも使用できます。例: |
WorkspaceConfig
ワークスペース データのデータストア タイプ構成を保存する構成
JSON 表現 |
---|
{
"type": enum ( |
フィールド | |
---|---|
type |
Google Workspace データソース。 |
dasherCustomerId |
難読化された Dasher のお客様 ID。 |
superAdminServiceAccount |
省略可。アクセス トークンの生成に使用されるワークスペースの特権管理者サービス アカウント。現時点では、ネイティブの Google ドライブ コネクタのデータ取り込みにのみ使用されます。 |
superAdminEmailAddress |
省略可。アクセス トークンの生成に使用されるワークスペースの特権管理者メールアドレス。現時点では、ネイティブの Google ドライブ コネクタのデータ取り込みにのみ使用されます。 |
タイプ
この DataStore でサポートされている Workspace アプリのタイプを指定します
列挙型 | |
---|---|
TYPE_UNSPECIFIED |
デフォルトは、指定されていない Workspace タイプです。 |
GOOGLE_DRIVE |
Workspace データストアにドライブのデータが含まれている |
GOOGLE_MAIL |
Workspace データストアにメールデータが含まれている |
GOOGLE_SITES |
Workspace データストアに Google サイトのデータが含まれている |
GOOGLE_CALENDAR |
Workspace データストアにカレンダー データが含まれている |
GOOGLE_CHAT |
Workspace データストアに Chat データが含まれている |
GOOGLE_GROUPS |
Workspace データストアにグループのデータが含まれている |
GOOGLE_KEEP |
Workspace データストアに Keep データが含まれている |
GOOGLE_PEOPLE |
Workspace データストアにユーザーデータが含まれている |
DocumentProcessingConfig
DataStore
のシングルトン リソース。DataStore
の作成時に空で、DataStore
が DataStore.ContentConfig.CONTENT_REQUIRED
に設定されている場合、デフォルトのパーサーはデジタル パーサーにデフォルト設定されます。
JSON 表現 |
---|
{ "name": string, "chunkingConfig": { object ( |
フィールド | |
---|---|
name |
ドキュメント処理構成の完全なリソース名。形式: |
chunkingConfig |
チャンク モードが有効かどうか。 |
defaultParsingConfig |
デフォルトのドキュメント パーサーの構成。指定しない場合、デフォルトの DigitalParsingConfig として構成され、デフォルトの解析構成がドキュメント解析のすべてのファイル形式に適用されます。 |
parsingConfigOverrides |
ファイル形式からマッピングして、ファイル形式に基づいてデフォルトの解析構成をオーバーライドします。サポートされているキー:
|
ChunkingConfig
チャンク化構成の構成。
JSON 表現 |
---|
{ // Union field |
Fields | |
---|---|
共用体フィールド chunk_mode 。チャンクの動作を定義する追加の構成。chunk_mode は次のいずれかになります。 |
|
layoutBasedChunkingConfig |
レイアウト ベースのチャンクの構成。 |
LayoutBasedChunkingConfig
レイアウト ベースのチャンクの構成。
JSON 表現 |
---|
{ "chunkSize": integer, "includeAncestorHeadings": boolean } |
フィールド | |
---|---|
chunkSize |
各チャンクのトークン サイズの上限。 サポートされている値: 100 ~ 500(両端を含む)。デフォルト値: 500。 |
includeAncestorHeadings |
コンテキストの損失を防ぐため、ドキュメントの途中部分からチャンクに異なるレベルの見出しを追加するかどうか。 デフォルト値: False。 |
ParsingConfig
特定のタイプのドキュメント パーサーに適用される関連構成。
JSON 表現 |
---|
{ // Union field |
Fields | |
---|---|
共用体フィールド type_dedicated_config 。ドキュメント処理タイプの構成。type_dedicated_config は次のいずれかになります。 |
|
digitalParsingConfig |
デジタル パーサーに適用された構成。 |
ocrParsingConfig |
OCR パーサーに適用された構成。現在、これは PDF にのみ適用されます。 |
layoutParsingConfig |
レイアウト パーサーに適用された構成。 |
DigitalParsingConfig
この型にはフィールドがありません。
ドキュメントのデジタル解析構成。
OcrParsingConfig
ドキュメントの OCR 解析構成。
JSON 表現 |
---|
{ "enhancedDocumentElements": [ string ], "useNativeText": boolean } |
フィールド | |
---|---|
enhancedDocumentElements[] |
[非推奨] このフィールドは非推奨になりました。追加の拡張ドキュメント要素処理を使用するには、 |
useNativeText |
true の場合、ネイティブ テキストを含むページで OCR テキストの代わりにネイティブ テキストを使用します。 |
LayoutParsingConfig
ドキュメントのレイアウト解析構成。
JSON 表現 |
---|
{ "enableTableAnnotation": boolean, "enableImageAnnotation": boolean, "structuredContentTypes": [ string ], "excludeHtmlElements": [ string ], "excludeHtmlClasses": [ string ], "excludeHtmlIds": [ string ], "enableGetProcessedDocument": boolean } |
フィールド | |
---|---|
enableTableAnnotation |
省略可。true の場合、解析中に LLM ベースのアノテーションが表に追加されます。 |
enableImageAnnotation |
省略可。true の場合、解析中に LLM ベースのアノテーションが画像に追加されます。 |
structuredContentTypes[] |
省略可。ドキュメントから抽出する必要な構造タイプが含まれています。サポートされる値:
|
excludeHtmlElements[] |
省略可。解析されたコンテンツから除外する HTML 要素のリスト。 |
excludeHtmlClasses[] |
省略可。解析されたコンテンツから除外する HTML クラスのリスト。 |
excludeHtmlIds[] |
省略可。解析されたコンテンツから除外する HTML ID のリスト。 |
enableGetProcessedDocument |
省略可。true の場合、処理されたドキュメントは GetProcessedDocument API で使用できるようになります。 |
HealthcareFhirConfig
HEALTHCARE_FHIR
業種のデータストアの構成。
JSON 表現 |
---|
{ "enableConfigurableSchema": boolean, "enableStaticIndexingForBatchIngestion": boolean } |
フィールド | |
---|---|
enableConfigurableSchema |
|
enableStaticIndexingForBatchIngestion |
|
ServingConfigDataStore
DataStore レベルでサービング構成に関する情報を保存します。
JSON 表現 |
---|
{ "disabledForServing": boolean } |
フィールド | |
---|---|
disabledForServing |
省略可。true に設定すると、DataStore は検索リクエストの処理に使用できなくなります。 |
ConfigurableBillingApproach
構成可能な課金アプローチの構成。
列挙型 | |
---|---|
CONFIGURABLE_BILLING_APPROACH_UNSPECIFIED |
デフォルト値。Spark と非 Spark の構成不可の課金アプローチの場合。 |
CONFIGURABLE_SUBSCRIPTION_INDEXING_CORE |
エンベディング以外のストレージのインデックス コアには、サブスクリプションの基本料金 + 超過料金の請求を使用します。 |
CONFIGURABLE_CONSUMPTION_EMBEDDING |
ストレージ アドオンの埋め込みには、従量課金制の課金を使用します。 |
メソッド |
|
---|---|
|
指定されたユーザー入力をキーワード候補で補完します。 |
|
DataStore を作成します。 |
|
DataStore を削除します。 |
|
DataStore を取得します。 |
|
SiteSearchEngine を取得します。 |
|
プロジェクトに関連付けられているすべての DataStore を一覧表示します。 |
|
DataStore を更新します |
|
カスタムモデルをトレーニングします。 |