Gemini Cloud Assist verwenden

In diesem Dokument wird beschrieben, wie Sie Gemini Cloud Assist, ein Produkt aus dem Gemini für Google Cloud -Portfolio, verwenden können, um Ihre Metadaten, Jobs und Abfragen in BigQuery besser zu verstehen und damit zu arbeiten. Es enthält unterstützte Anwendungsfälle und Beispielprompts, die Sie in Gemini Cloud Assist verwenden können.

Hinweis

Bevor Sie Gemini Cloud Assist verwenden können, muss Ihr Administrator die Schritte zum Einrichten von Gemini Cloud Assist für das Projekt oder den Ordner ausführen, in dem Sie arbeiten.

Damit Gemini Cloud Assist Fragen und Anfragen zu Ihren Google Cloud Ressourcen beantworten kann, benötigt es die entsprechenden Berechtigungen für Identitäts- und Zugriffsverwaltung (Identity and Access Management, IAM) für diese Ressourcen. Gemini Cloud Assist übernimmt Ihre Berechtigungen, wenn Sie es auffordern, Ihre BigQuery-Daten abzufragen. In vielen Fällen sind die erforderlichen IAM-Berechtigungen daher bereits erteilt. Weitere Informationen finden Sie unter IAM-Anforderungen für die Verwendung von Gemini Cloud Assist.

Gemini Cloud Assist verwenden

  1. Rufen Sie die Seite BigQuery auf.

    BigQuery aufrufen

  2. Klicken Sie in der Google Cloud Symbolleiste auf spark Gemini-KI-Chat öffnen oder schließen, um den Gemini Cloud Assist-Chat zu öffnen.

    Button „Gemini Cloud Assist“ in der BigQuery-Symbolleiste

  3. Geben Sie im Feld Prompt eingeben Ihren Prompt ein.

  4. Klicken Sie auf Senden Senden.

In den folgenden Abschnitten finden Sie Beispiele für Aufgaben, die Sie mit Gemini Cloud Assist ausführen können, sowie Beispielprompts.

Ressourcen entdecken

Sie können in einem einzelnen Projekt oder in mehreren Projekten nach Datasets und Tabellenressourcen suchen und Informationen dazu abrufen. Gemini Cloud Assist verwendet Knowledge Catalog, um nach Ihren BigQuery-Ressourcen zu suchen. Die Suchvorgänge werden mit Ihren Berechtigungen ausgeführt. Wenn Sie beispielsweise keine Berechtigung zum Aufrufen der Metadaten einer Ressource haben, wird sie in den Ergebnissen nicht angezeigt. Unterstützte Anwendungsfälle sind:

  • Nach einer Ressource anhand des Namens suchen. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    Habe ich Datasets mit dem Namen „ecommerce“?

  • Nach den Metadaten einer Tabelle fragen. Sie können nach einer Tabelle anhand des Namens fragen oder Gemini Cloud Assist anhand Ihres Chatverlaufs oder der Tabelle, auf die im aktiven Abfragetab verwiesen wird, ableiten lassen, welche Tabelle Sie meinen. Wenn Sie eine Tabelle anhand des Namens angeben, müssen Sie den vollqualifizierten Namen verwenden. Sie können nach dem Schema einer Tabelle oder anderen Metadaten wie Partitionierung und Clustering fragen. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    Wie lautet das Schema für PROJECT_NAME.DATASET_NAME.TABLE_NAME?

  • Fragen, wo bestimmte Informationen zu finden sind. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    Wo finde ich demografische Daten wie Alter und Standort für neue Nutzer aus dem letzten Jahr?

Code erstellen

Mit Gemini Cloud Assist können Sie SQL- und Python-Code generieren, um Ihre Daten abzufragen und zu analysieren.

SQL generieren

Generieren Sie eine SQL-Abfrage, indem Sie beschreiben, was die Abfrage tun soll. Geben Sie für optimale Ergebnisse den Namen der Tabelle an, die Sie abfragen möchten. Geben Sie beispielsweise im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

Generiere eine SQL-Abfrage, die mir die Dauer und den Abonnententyp für die zehn längsten Fahrten anzeigt. Verwende die bigquery-public-data.san_francisco_bikeshare.bikeshare_trips Tabelle.

Python-Code generieren

Generieren Sie Python-Code, indem Sie beschreiben, was er tun soll. Im Bereich Cloud Assist können Sie beispielsweise den folgenden Prompt eingeben, um Gemini aufzufordern, die Tabelle penguins aus einem öffentlichen Dataset mit der BigQuery-Magics-Syntax abzufragen:

Generiere Python-Code, um die Tabelle bigquery-public-data.ml_datasets.penguins mit magischen Befehlen in BigQuery abzufragen.

Abfrage planen

Planen Sie eine Abfrage, indem Sie in Ihrem Prompt die folgenden Details angeben:

  • Zeitplan, z. B. jeden Montag um 17:00 Uhr oder jeden zweiten Dienstag um 2:00 Uhr
  • Anzeigename
  • Zieltabellen-ID und Ziel-Dataset-ID
  • Beginn
  • Ende
  • Schreibanordnung, z. B. WRITE_EMPTY, WRITE_APPEND oder WRITE_TRUNCATE

Geben Sie beispielsweise im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

Schedule the query open in the editor to run daily. The display name
should be "test query". Write the results to a new table in mydataset
called scheduled_results. Use WRITE_APPEND. Start it now.

Datenherkunft verfolgen

Mit Gemini Cloud Assist können Sie die Datenherkunft untersuchen und analysieren. Es kann Ihnen helfen, Datenabhängigkeiten zu verstehen, die Auswirkungen von Strukturänderungen zu bewerten und komplexe Datenflüsse zusammenzufassen. Um die Herkunft zu analysieren, können Sie Gemini Cloud Assist Fragen zu den folgenden Funktionsbereichen stellen:

  • Herkunftsstatistiken abrufen. Fragen Sie Gemini Cloud Assist nach quantitativen Daten zu einem Herkunftsgraphen, z. B. nach der Gesamtzahl der beteiligten Assets, Datasets oder Projekte. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    • Wie viele Upstream-Assets hat „Customer_Master“?
    • Wie viele BigQuery-Datasets sind an der Upstream-Herkunft von „Customer_Interaction_Summary“ beteiligt?
    • Gib die Anzahl aller eindeutigen Assets im Upstream-Graphen von „Marketing_Interaction“ an.
  • Unmittelbare Abhängigkeiten analysieren. Ermitteln Sie die direkten übergeordneten (Quellen) oder direkten untergeordneten (Nutzer) Elemente eines bestimmten Assets, indem Sie Beziehungen mit einem Hop analysieren. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    • Was sind die unmittelbaren Quellen von „Customer_Master“?
    • Was sind die direkten Nutzer der Tabelle „Card_Master“?
    • Was sind die direkten Quellen von „Web_Session_Validated“?
  • Downstream-Auswirkungen bewerten. Verstehen Sie die Downstream-Folgen des Änderns oder Löschens eines Assets. Sie können diese Prompts nach Tiefe (Anzahl der Hops) oder bestimmten Projektgrenzen eingrenzen. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    • Welche Assets sind betroffen, wenn ich „Customer_Master“ lösche?
    • Zeige mir die Assets, die sich innerhalb von zwei Hops nach „Customer_Master“ befinden.
    • Wirkt sich die Änderung von „Customer_Master“ auf Assets im Projekt „data-lineage-manual-tests“ aus?
  • Quellen und endgültige Ziele identifizieren. Ermitteln Sie die endgültigen Quellen oder Ziele Ihrer Daten, ohne Zwischenschritte zur Transformation zu berücksichtigen. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    • Was sind alle endgültigen Datenquellen für „Customer_Master“?
    • Was sind die ursprünglichen Datenquellen für „Transaction_Data_Enriched“, ohne Zwischentabellen?
    • Was sind die endgültigen Ziele der Daten aus „Card_Data_Validated“?
  • Datenfluss zwischen Assets verfolgen. Bitten Sie Gemini Cloud Assist, die spezifische Verbindung, den Pfad oder den Datenfluss zwischen zwei bekannten Assets zu erklären. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    • Wie hängt „Customer_Master“ von „Customer_Data_Raw“ ab?
    • Wie fließen die Daten von „Customer_Data_Raw“ zu „Customer_Profile_Snapshot“?
    • Wie viele Hops gibt es zwischen „Customer_Data_Raw“ und „Alert_Fact“?
  • Herkunft nach Asset-Typ oder -Name filtern. Suchen Sie nach bestimmten Arten von verbundenen Assets (z. B. BigQuery-Ansichten oder Looker-Dashboards) oder Assets, die einem bestimmten Benennungsmuster entsprechen. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    • Wird „Customer_Master“ in BigQuery-Ansichten verwendet?
    • Gibt es Looker-Dashboards, die von „Customer_Master“ abhängen?
    • Welche Upstream-Tabellen von „Customer_Master“ enthalten „Country“ im Namen?
  • Herkunftsgraphen zusammenfassen. Fordern Sie eine Übersicht in natürlicher Sprache über die Herkunft eines Assets an, anstatt eine bestimmte Liste oder Anzahl. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    • Gib mir eine Zusammenfassung der Assets, die von „Web_Session_Validated“ abhängen.
    • Fasse die Downstream-Herkunft dieser Tabelle zusammen.
    • Wie lautet die Herkunft von „bigquery:PROJECT_NAME.DATASET_NAME“?

Jobs analysieren

Weitere Informationen zu Jobs, die in Ihrem Projekt ausgeführt wurden, einschließlich Ihres persönlichen Jobverlaufs und des Jobverlaufs des Projekts, können Sie für die folgenden Anwendungsfälle nutzen:

  • Fehler in zeitaufwendigen Abfragen beheben. Informieren Sie sich über den aktuellen Status eines Jobs und die Gründe, warum er länger als erwartet dauern könnte, z. B. Slot-Konflikte, eine große Anzahl gescannter Zeilen oder ein hohes Datenvolumen. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    Warum dauert dieser Job so lange? JOB_ID

  • Ursache eines fehlgeschlagenen Jobs analysieren. Informieren Sie sich, warum eine bestimmte Abfrage fehlgeschlagen ist. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    Warum ist JOB_ID fehlgeschlagen?

  • Ressourcenintensive Abfragen finden. Informieren Sie sich anhand der geschätzten Anzahl der verarbeiteten Byte über Ihre teuersten Abfragen. Geben Sie im Bereich Cloud Assist einen Prompt ähnlich dem folgenden ein:

    Was sind die drei teuersten Abfragen, die ich in den letzten zwei Tagen ausgeführt habe?

BigQuery verwalten

Im Job-Explorer können Sie mit Gemini Cloud Assist chatten, um die Leistung zu beobachten, die Kapazität zu analysieren und die Kosten zu optimieren. Sie können Gemini Cloud Assist beispielsweise für die folgenden Aufgaben verwenden:

  • Reservierungen und Kapazität analysieren. Beobachten Sie die Compute-Auslastung und ermitteln Sie Engpässe in natürlicher Sprache. Geben Sie im Bereich Cloud Assist Prompts ähnlich den folgenden ein:

    • Analysiere die Leistung meiner Reservierung für die letzten 24 Stunden.
    • Zeige die wichtigsten Projekte und Nutzer, die meine „production“-Reservierung verwenden.
    • Reicht meine aktuelle Kapazität für unsere Spitzenlast aus?
  • Jobs beobachten und vergleichen. Vergleichen Sie Arbeitslasten, um Leistungsänderungen zu erkennen. Sie können eine Leistungsübersicht der Jobleistung mit Engpässen und Optimierungsmöglichkeiten abrufen oder die Ausführungsdetails verschiedener Jobs direkt vergleichen, um Regressionen oder Verbesserungen zu erkennen.

  • Konfiguration der Arbeitslastverwaltung. Prüfen und verwalten Sie Ihre BigQuery-Reservierungseinstellungen, einschließlich Zuweisungen und Zusicherungen, in natürlicher Sprache. Diese Funktion bietet Einblick in Autoscaling-Konfigurationen, die Verwaltung inaktiver Slots und versionsspezifische Details. Geben Sie im Bereich Cloud Assist Prompts ähnlich den folgenden ein:

    • Liste meine Reservierungen mit Autoscaling auf.
    • Rufe meine Zuweisungen für PROJECT_ID ab.
    • Wie lautet die Konfiguration für meine Reservierung RESERVATION_NAME?
    • Liste meine Zusicherungen auf.
    • Für wie viele Reservierungen ist „Inaktive Slots ignorieren“ konfiguriert?
    • Liste alle Reservierungen nach der Version „Enterprise“ auf.
    • Liste alle aktuellen Reservierungen auf und zeige für jede die Werte für „slot_capacity“ und „autoscale_max_slots“ an.
  • Wichtigste Ressourcen identifizieren. Ermitteln Sie die Hauptnutzer von BigQuery-Ressourcen. Der Assistent kann die wichtigsten Nutzer und Jobs basierend auf der Slot-Auslastung in bestimmten Projekten oder Reservierungen ermitteln. Diese Unterstützung bietet umfassende administrative Unterstützung für wichtige BigQuery-Ressourcen, einschließlich Jobs, Nutzern, Projekten und Reservierungen. Durch die Analyse wichtiger Leistungsmesswerte wie Slot-Auslastung und Jobdauer liefert der Assistent umsetzbare Informationen, um das Monitoring zu optimieren und die Ressourcenzuweisung zu optimieren. Geben Sie im Bereich Cloud Assist Prompts ähnlich den folgenden ein:

    • Wer sind die wichtigsten Nutzer mit der höchsten Slot-Auslastung in meinem Projekt?
    • Zeige mir die wichtigsten Jobs, die in der letzten Stunde die meisten Slots in der Reservierung RESERVATION_NAME verbraucht haben.

Nächste Schritte