BigQuery-Kosten für Conversational Analytics API-Agenten verwalten

Auf dieser Seite wird beschrieben, wie Sie die BigQuery-Kosten für Ihre Conversational Analytics API-Agenten überwachen und verwalten. Diese Kosten entstehen durch das Ausführen von Abfragen für Ihre BigQuery-Daten. Die folgenden Methoden helfen Ihnen dabei, Ausgaben zu kontrollieren und unerwartete Kosten zu vermeiden:

Hinweis

Bevor Sie die auf dieser Seite beschriebenen Kostenkontrollen implementieren, müssen die folgenden Voraussetzungen erfüllt sein:

  • Sie benötigen ein Google Cloud -Projekt mit aktivierter Abrechnung.
  • Sie benötigen die erforderlichen IAM-Berechtigungen (Identity and Access Management), um Kontingente und Abrechnungen für Ihr Google Cloud -Projekt zu verwalten.

Kontingente für Projekte und Nutzer festlegen

Sie können für ein Google Cloud -Projekt oder einzelne Nutzer Ausgabenlimits festlegen, indem Sie die standardmäßigen BigQuery-Kontingente anwenden. Diese Limits helfen dabei, die Gesamtkosten zu kontrollieren und verhindern, dass einzelne Nutzer zu hohe Kosten verursachen.

Für KI-Agenten, die hohe Kosten verursachen können, z. B. KI-Agenten, die auf einer sehr großen oder nicht partitionierten Tabelle basieren, empfiehlt es sich, den Agenten zuerst in einem eigenen Projekt zu isolieren. Anschließend können Sie ein Kontingent auf Projektebene anwenden, um die täglichen Kosten des Projekts zu begrenzen. Außerdem können Sie ein Kontingent auf Nutzerebene anwenden, um eine angemessene Nutzung durch die Nutzer zu gewährleisten, oder beides.

Dediziertes Projekt für Ihren KI-Agenten einrichten

So richten Sie ein dediziertes Projekt für Ihre(n) Conversational Analytics API-Agenten ein:

  1. Erstellen Sie in der Google Cloud Console ein neues Google Cloud -Projekt. Dieses Projekt ist für Ihre(n) KI-Agenten vorgesehen.
  2. Sie müssen für das neue Projekt die Abrechnung aktivieren.
  3. Vergewissern Sie sich, dass der KI-Agent für die Abrechnung mit diesem neuen Projekt konfiguriert ist. Bei der Konfiguration des KI-Agenten müssen Sie die Projekt-ID des neuen Projekts angeben.

Kontingent für das Projekt festlegen

Nachdem Sie ein dediziertes Google Cloud -Projekt eingerichtet haben, können Sie ein Kontingent anwenden, um die Kosten für das gesamte Projekt zu kontrollieren. So legen Sie ein Kontingent auf Projektebene fest:

  1. Rufen Sie im Google Cloud -Projekt für Ihren KI-Agenten IAM und Verwaltung > Kontingente auf.

    Kontingente aufrufen

  2. Filtern Sie nach dem Dienst „BigQuery API“ und wählen Sie das Kontingent Abfragenutzung pro Tag aus.

  3. Ändern Sie das Kontingent auf das gewünschte tägliche Limit (z. B. 10 TiB). Dieses Limit sorgt dafür, dass die angegebenen täglichen Kosten für das Projekt nicht überschritten werden.

Kontingent für Nutzer festlegen

So legen Sie ein Kontingent pro Nutzer fest, um zu verhindern, dass einzelne Nutzer hohe Kosten verursachen:

  1. Rufen Sie im Google Cloud -Projekt für Ihren KI-Agenten IAM und Verwaltung > Kontingente auf.

    Kontingente aufrufen

  2. Filtern Sie nach dem Dienst BigQuery API und wählen Sie das Kontingent Abfragenutzung pro Tag und Nutzer aus.

  3. Ändern Sie das Kontingent auf das gewünschte tägliche Limit (z. B. 1 TiB pro Nutzer und Tag). Dieses Limit verhindert, dass ein einzelner Nutzer übermäßig viele Ressourcen verbraucht.

Kosten für einzelne Abfragen begrenzen

Damit die Kosten für einzelne Nutzerabfragen nicht unerwartet hoch ausfallen, können Sie pro Abfrage ein Kostenlimit festlegen. Konfigurieren Sie hierfür einen KI-Agenten mit dem Parameter big_query_max_billed_bytes.

Vor der eigentlichen Abfrage führt der KI-Agent einen Testlauf durch, um die Abfragekosten zu schätzen. Wenn die geschätzte Anzahl der zu scannenden Bytes den big_query_max_billed_bytes-Wert überschreitet, blockiert der KI-Agent die Abfrage und sendet eine Fehlermeldung an den Nutzer.

Wenn Sie einen KI-Agenten mit HTTP oder dem Python SDK erstellen oder konfigurieren, können Sie den Parameter big_query_max_billed_bytes im Feld published_context festlegen. Das folgende Beispiel im textproto-Format veranschaulicht die Anfragestruktur, mit der ein Limit von 100 MB für einen KI-Agenten, der Fragen zu Straßenbäumen in San Francisco beantwortet, konfiguriert wird:

parent: "projects/sample-project-name/locations/global"
data_agent_id: "sample-agent-id"
data_agent {
  name: "projects/sample-project-name/locations/global/dataAgents/sample-agent-id"
  data_analytics_agent {
    published_context {
      system_instruction: "This agent provides information about street trees in San Francisco, including their species, location, and planting date."
      options {
        datasource {
          big_query_max_billed_bytes {
            value: 104857600 #100MB
          }
        }
      }
      datasource_references {
        bq {
          table_references {
            project_id: "bigquery-public-data"
            dataset_id: "san_francisco"
            table_id: "street_trees"
          }
        }
      }
    }
  }
}

In diesem Beispiel ist der Parameter big_query_max_billed_bytes auf 104857600 Byte (100 MB) festgelegt. Mit diesem Wert wird ein Limit für alle Abfragen festgelegt, die vom sample-agent-id-Agenten für die BigQuery-Tabelle bigquery-public-data.san_francisco.street_trees ausgeführt werden.

Interaktive Beispiele zum Erstellen und Konfigurieren von KI-Agenten finden Sie in den Colaboratory-Notebooks. Ausführliche Informationen zu API-Feldern finden Sie in der API-Referenz.

Beschränkungen

Beachten Sie bei der Kostenverwaltung für Ihre Conversational Analytics API-Agenten die folgenden Einschränkungen:

  • Die Tools zur Kostenverwaltung können nur für Projekte mit On-Demand-Abrechnung und nicht für Projekte mit Slot-Reservierungen angewendet werden.
  • Für einzelne KI-Agenten können keine Kontingente festgelegt werden. Wie unter Kontingente für Projekte und Nutzer festlegen beschrieben, empfiehlt es sich, den KI-Agenten in einem eigenen Projekt zu isolieren und dann Kontingente auf Projekt- oder Nutzerebene auf das Projekt anzuwenden.
  • Es ist nicht möglich, die Kosten für einzelne KI-Agenten mithilfe von BigQuery-Labels zu erfassen.