REST Resource: projects.locations.dataStores.servingConfigs

Ressource: ServingConfig

Konfiguriert Metadaten, die verwendet werden, um Ergebnisse zur Bereitstellungszeit zu generieren, z. B. Suchergebnisse oder Empfehlungsvorhersagen. Die ServingConfig wird in der Such- und Vorhersageanfrage übergeben und generiert Ergebnisse.

JSON-Darstellung
{
  "name": string,
  "displayName": string,
  "solutionType": enum (SolutionType),
  "modelId": string,
  "diversityLevel": string,
  "embeddingConfig": {
    object (EmbeddingConfig)
  },
  "rankingExpression": string,
  "guidedSearchSpec": {
    object (GuidedSearchSpec)
  },
  "customFineTuningSpec": {
    object (CustomFineTuningSpec)
  },
  "createTime": string,
  "updateTime": string,
  "filterControlIds": [
    string
  ],
  "boostControlIds": [
    string
  ],
  "redirectControlIds": [
    string
  ],
  "synonymsControlIds": [
    string
  ],
  "onewaySynonymsControlIds": [
    string
  ],
  "dissociateControlIds": [
    string
  ],
  "replacementControlIds": [
    string
  ],
  "ignoreControlIds": [
    string
  ],
  "promoteControlIds": [
    string
  ],
  "personalizationSpec": {
    object (PersonalizationSpec)
  },
  "answerGenerationSpec": {
    object (AnswerGenerationSpec)
  },

  // Union field vertical_config can be only one of the following:
  "mediaConfig": {
    object (MediaConfig)
  },
  "genericConfig": {
    object (GenericConfig)
  }
  // End of list of possible types for union field vertical_config.
}
Felder
name

string

Nicht veränderbar. Voll qualifizierter Name projects/{project}/locations/{location}/collections/{collectionId}/engines/{engineId}/servingConfigs/{servingConfigId}

displayName

string

Erforderlich. Der menschenlesbare Anzeigename der Bereitstellungskonfiguration. Wird in der Discovery-UI verwendet.

Dieses Feld muss einen UTF-8-codierten String mit maximal 128 Zeichen enthalten. Andernfalls wird der Fehler INVALID_ARGUMENT zurückgegeben.

solutionType

enum (SolutionType)

Erforderlich. Nicht veränderbar. Gibt den Lösungstyp an, mit dem eine Bereitstellungskonfiguration verknüpft werden kann.

modelId

string

Die ID des Modells, das zur Bereitstellungszeit verwendet werden soll. Derzeit werden nur RecommendationModels unterstützt. Es kann geändert werden, aber nur in ein kompatibles Modell (z. B. „Was Ihnen sonst noch gefallen könnte“-CTR zu „Was Ihnen sonst noch gefallen könnte“-CVR).

Erforderlich, wenn der SolutionType SOLUTION_TYPE_RECOMMENDATION ist.

diversityLevel

string

Gibt an, wie vielfältig die Ergebnisse des Empfehlungsmodells sein sollen, z. B. medium-diversity oder high-diversity. Derzeit unterstützte Werte:

  • no-diversity
  • low-diversity
  • medium-diversity
  • high-diversity
  • auto-diversity

Falls nicht angegeben, wird der Standardwert für den Empfehlungsmodelltyp ausgewählt. Standardwert: no-diversity.

Kann nur festgelegt werden, wenn der SolutionType SOLUTION_TYPE_RECOMMENDATION ist.

embeddingConfig

object (EmbeddingConfig)

Konfiguration für die Verwendung einer eigenen Einbettung. Die Konfiguration wird für die semantische Suche verwendet. Der Abruf basiert auf dem Skalarprodukt von SearchRequest.EmbeddingSpec.EmbeddingVector.vector und den Dokumenteinbettungen, die von dieser EmbeddingConfig bereitgestellt werden. Wenn SearchRequest.EmbeddingSpec.EmbeddingVector.vector angegeben ist, wird ServingConfig.embedding_config damit überschrieben.

rankingExpression

string

Mit dem Rankingausdruck wird das benutzerdefinierte Ranking beim Abrufen von Dokumenten gesteuert. Hierfür ist das Einbetten von Dokumenten erforderlich. Die Einstellung für den Rankingausdruck in der ServingConfig gilt für alle Suchanfragen, die von der Bereitstellungskonfiguration verarbeitet werden. Wenn SearchRequest.ranking_expression angegeben ist, wird der Rankingausdruck der ServingConfig jedoch überschrieben.

Der Rankingausdruck besteht aus einer einzigen Funktion oder mehreren Funktionen, die durch „+“ verbunden sind.

  • rankingExpression = function, { " + ", function };

Unterstützte Funktionen:

  • double * relevanceScore
  • double * dotProduct(embedding_field_path)

Funktionsvariablen:

  • relevanceScore: Vordefinierte Keywords, die verwendet werden, um die Relevanz zwischen Anfrage und Dokument zu messen.
  • embedding_field_path: Das Dokumenteinbettungsfeld, das mit dem Anfrage-Einbettungsvektor verwendet wird.
  • dotProduct: Die Einbettungsfunktion zwischen „embedding_field_path“ und dem Anfrage-Einbettungsvektor.

Beispiel für einen Rankingausdruck:

Wenn ein Dokument das Einbettungsfeld „doc_embedding“ hat, könnte der Rankingausdruck 0.5 * relevanceScore + 0.3 * dotProduct(doc_embedding) lauten.

guidedSearchSpec

object (GuidedSearchSpec)

Konfigurationen für die geführte Suche.

customFineTuningSpec

object (CustomFineTuningSpec)

Benutzerdefinierte Konfigurationen für das Fine-Tuning. Wenn SearchRequest.custom_fine_tuning_spec festgelegt ist, hat dies eine höhere Priorität als die hier festgelegten Konfigurationen.

createTime

string (Timestamp format)

Nur Ausgabe. Zeitstempel der Erstellung der ServingConfig.

Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" oder "2014-10-02T15:01:23+05:30".

updateTime

string (Timestamp format)

Nur Ausgabe. Zeitstempel der Aktualisierung der ServingConfig.

Verwendet RFC 3339, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Nachkommastellen verwendet. Andere Offsets als „Z“ werden ebenfalls akzeptiert. Beispiele: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" oder "2014-10-02T15:01:23+05:30".

filterControlIds[]

string

Filtersteuerungen, die im Bereitstellungspfad verwendet werden sollen. Alle ausgelösten Filtersteuerungen werden angewendet. Die Filtersteuerungen müssen sich im selben Datenspeicher wie die Bereitstellungskonfiguration befinden. Maximal 20 Filtersteuerungen.

boostControlIds[]

string

Boost-Steuerelemente, die im Bereitstellungspfad verwendet werden sollen. Alle ausgelösten Boost-Steuerelemente werden angewendet. Die Boost-Steuerelemente müssen sich im selben Datenspeicher wie die Bereitstellungskonfiguration befinden. Maximal 20 Boost-Steuerelemente.

redirectControlIds[]

string

IDs der Weiterleitungssteuerelemente. Es wird nur die erste ausgelöste Weiterleitungsaktion angewendet, selbst wenn mehrere zutreffen. Es sind maximal 100 Spezifikationen zulässig.

Kann nur festgelegt werden, wenn der SolutionType SOLUTION_TYPE_SEARCH ist.

synonymsControlIds[]

string

Spezifikationen für bedingte Synonyme. Wenn mehrere Synonymbedingungen zutreffen, werden alle zutreffenden Synonymsteuerelemente in der Liste ausgeführt. Es sind maximal 100 Spezifikationen zulässig.

Kann nur festgelegt werden, wenn der SolutionType SOLUTION_TYPE_SEARCH ist.

onewaySynonymsControlIds[]

string

Spezifikationen für bedingte unidirektionale Synonyme. Wenn mehrere Bedingungen für unidirektionale Synonyme zutreffen, werden alle zutreffenden Steuerelemente für unidirektionale Synonyme in der Liste ausgeführt. Es sind maximal 100 Spezifikationen zulässig.

Kann nur festgelegt werden, wenn der SolutionType SOLUTION_TYPE_SEARCH ist.

dissociateControlIds[]

string

Spezifikationen für bedingte Nicht-Zuordnungen. Wenn mehrere Bedingungen für die Nicht-Zuordnung zutreffen, werden alle zutreffenden Steuerelemente für Nicht-Zuordnungen in der Liste ausgeführt. Die Reihenfolge spielt keine Rolle. Es sind maximal 100 Spezifikationen zulässig.

Kann nur festgelegt werden, wenn der SolutionType SOLUTION_TYPE_SEARCH ist.

replacementControlIds[]

string

Spezifikationen für bedingtes Ersetzen. Diese werden nach der Reihenfolge in der Liste angewendet. Ein bereits ersetzter Begriff kann nicht noch einmal ersetzt werden. Es sind maximal 100 Spezifikationen zulässig.

Kann nur festgelegt werden, wenn der SolutionType SOLUTION_TYPE_SEARCH ist.

ignoreControlIds[]

string

Spezifikationen für bedingtes Ignorieren. Wenn mehrere Bedingungen für das Ignorieren zutreffen, werden alle zutreffenden Steuerelemente für das Ignorieren in der Liste ausgeführt. Die Reihenfolge spielt keine Rolle. Es sind maximal 100 Spezifikationen zulässig.

promoteControlIds[]

string

Spezifikationen für bedingtes Hochstufen.

Es sind maximal 100 Spezifikationen zulässig.

personalizationSpec

object (PersonalizationSpec)

Die Spezifikation für die Personalisierung.

Wenn sowohl ServingConfig.personalization_spec als auch SearchRequest.personalization_spec festgelegt sind, überschreibt SearchRequest.personalization_spec ServingConfig.personalization_spec.

answerGenerationSpec

object (AnswerGenerationSpec)

Optional. Die Spezifikation für die Antwortgenerierung.

Union-Feld vertical_config. Branchenspezifische Konfiguration. Für vertical_config ist nur einer der folgenden Werte zulässig:
mediaConfig

object (MediaConfig)

Die MediaConfig der Bereitstellungskonfiguration.

genericConfig

object (GenericConfig)

Die GenericConfig der Bereitstellungskonfiguration.

Methoden

answer

Methode zum Beantworten von Anfragen.

create

Erstellt eine ServingConfig.

delete

Löscht eine ServingConfig.

get

Ruft eine ServingConfig ab.

list

Listet alle ServingConfigs auf, die mit diesem DataStore verknüpft sind.

patch

Aktualisiert eine ServingConfig.

recommend

Gibt eine Empfehlung ab, für die ein kontextbezogenes Nutzerereignis erforderlich ist.
Führt eine Suche aus.

searchLite

Führt eine Suche aus.

streamAnswer

Methode zum Beantworten von Anfragen (Streaming).