BigLake-Daten mit natürlicher Sprache abfragen

In diesem Leitfaden erfahren Sie, wie Sie konversationelle Analysen in BigQuery verwenden, um Daten in Ihren BigLake-Tabellen mit Prompts in natürlicher Sprache abzufragen. MitGoogle CloudBigLake können Sie mit Ihren eigenen Daten in BigLake interagieren, als wären sie eine BigQuery-Standardtabelle.

So funktioniert die konversationelle Analyse

Bei der Konversationsanalyse werden Large Language Models (LLMs) verwendet, um Ihre Fragen in natürlicher Sprache zu verstehen und dem Schema Ihrer BigLake-Tabellen zuzuordnen. Der Prozess umfasst die folgenden Schritte:

  1. Schemaerkennung: Das System ruft Metadaten aus dem BigLake-Metastore ab, um Tabellenstrukturen, Spaltennamen und Datentypen zu ermitteln.
  2. SQL-Generierung: Das LLM generiert eine SQL-Abfrage, die mit der BigQuery-Engine und dem zugrunde liegenden Datenformat kompatibel ist.
  3. Ausführung: BigQuery führt die generierte SQL-Abfrage direkt für die Daten im offenen Format in BigLake aus.
  4. Antwort: Die Ergebnisse werden an die Konversationsschnittstelle zurückgegeben, oft zusammen mit einer Zusammenfassung oder Visualisierung.

Weitere Informationen zur konversationellen Analyse, z. B. zum Verwalten von KI-Datenagenten, zu Preisen oder zu Best Practices, finden Sie unter Konversationelle Analyse – Übersicht.

Unterstützte Formate

Bei der konversationellen Analyse werden Ihre Fragen in natürlicher Sprache in SQL-Abfragen übersetzt. Es unterstützt die offenen Tabellenformate, die vom BigLake Metastore unterstützt werden, z. B. Apache Iceberg-Tabellen.

Hinweis

Bevor Sie Ihre Daten abfragen können, müssen Sie Ihre externen Tabellen im BigLake-Metastore registrieren. Der BigLake-Metastore dient als zentraler Hub, über den BigQuery Studio mit Ihren externen Daten im offenen Format verbunden wird. Nach der Verbindung werden die Tabellen zu auffindbaren Assets in BigQuery.

Tabellen mit konversationeller Analyse abfragen

  1. Rufen Sie in der Google Cloud Console den BigQuery Studio Agents Hub auf.

    Zum Agents Hub

  2. Erstellen Sie einen KI-Datenagenten oder starten Sie eine direkte Unterhaltung mit einem vorhandenen KI-Datenagenten.

  3. BigLake-Tabellen auswählen

    Da im BigLake Metastore alle diese verschiedenen Formate zusammengeführt werden, ist die Suche identisch mit der Suche nach Standard-BigQuery-Tabellen.

    1. Suchen: Wenn Sie Ihre Wissensquelle hinzufügen, suchen Sie in der Benutzeroberfläche für die Tabellensuche und -auswahl nach Ihren Tabellennamen. Sie können Suchbegriffe verwenden, um Ergebnisse zu filtern, z. B.:

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Quelle prüfen: Achten Sie auf den Dataset-Teil des voll qualifizierten Namens. BigLake-Tabellen, die von externen Quellen erstellt und vom BigLake Metastore verwaltet werden, folgen in der Regel einem Format, in dem Katalog und Namespace kombiniert werden. Beispiel: PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table oder PROJECT_ID.sap_catalog.sales.delta_table

    3. Auswählen: Die ausgewählte BigLake-Tabelle wird Ihrem aktiven Konversationskontext hinzugefügt.

  4. Fragen in natürlicher Sprache stellen Das System übersetzt Ihren Prompt automatisch in eine föderierte SQL-Abfrage.

Genauigkeit von Anfragen verbessern

Mit den Konfigurationsoptionen für Datenagenten können Sie die Conversational Analytics-Funktion dabei unterstützen, Ihre BigLake-Schemas und Ihre Terminologie besser zu verstehen. Zu diesen Optionen gehören Unternehmensglossare, geprüfte SQL-Abfragen und Systemanweisungen.

Nächste Schritte