Lakehouse-Tabellen mit natürlicher Sprache abfragen

Mit der konversationellen Analyse in BigQuery können Sie Ihre Daten im offenen Format mithilfe von Prompts in natürlicher Sprache abfragen. Diese Funktion basiert auf dem Lakehouse-Laufzeitkatalog in Lakehouse für Apache Iceberg, um Ihre Fragen automatisch den zugrunde liegenden Tabellenschemas zuzuordnen. So können Sie SQL-Abfragen generieren und ausführen, ohne den Code manuell schreiben zu müssen.

Beim Einrichten Ihrer Abfragen können Sie Datenagenten verwenden, um Unternehmensglossare und Systemanweisungen für eine höhere Genauigkeit bereitzustellen.

So funktioniert die konversationelle Analyse

Bei der konversationellen Analyse werden Large Language Models (LLMs) verwendet, um Ihre Fragen in natürlicher Sprache zu verstehen und dem Schema Ihrer Tabellen zuzuordnen. Der Prozess umfasst die folgenden Schritte:

  1. Schemaermittlung: Das System ruft Metadaten aus dem Lakehouse-Laufzeitkatalog ab, um Tabellenstrukturen, Spaltennamen und Datentypen zu ermitteln.
  2. SQL-Generierung: Das LLM generiert eine SQL-Abfrage, die mit der BigQuery-Engine und dem zugrunde liegenden Datenformat kompatibel ist.
  3. Ausführung: BigQuery führt die generierte SQL-Abfrage direkt für die Daten im offenen Format im *Lakehouse* von Google Cloud aus.
  4. Antwort: Die Ergebnisse werden an die Konversationsschnittstelle zurückgegeben, oft zusammen mit einer Zusammenfassung oder Visualisierung.

Weitere Informationen zur konversationellen Analyse, z. B. zum Verwalten von KI-Datenagenten, zu Preisen oder zu Best Practices, finden Sie unter Konversationelle Analyse – Übersicht.

Unterstützte Formate

Bei der konversationellen Analyse werden Ihre Fragen in natürlicher Sprache in SQL-Abfragen übersetzt. Er unterstützt die offenen Tabellenformate, die vom Lakehouse-Laufzeitkatalog unterstützt werden, z. B. Apache Iceberg-Tabellen.

Hinweis

Bevor Sie Ihre Daten abfragen können, müssen Sie Ihre externen Tabellen im Lakehouse-Laufzeitkatalog registrieren. Der Lakehouse-Laufzeitkatalog dient als einheitlicher Hub, über den BigQuery Studio mit Ihren externen Daten im offenen Format verbunden wird. Nach der Verbindung werden die Tabellen zu auffindbaren Assets in BigQuery.

Tabellen mit konversationeller Analyse abfragen

  1. Rufen Sie in der Google Cloud Console den BigQuery Studio Agents Hub auf.

    Zum Agents Hub

  2. Erstellen Sie einen KI-Datenagenten oder starten Sie eine direkte Unterhaltung mit einem vorhandenen KI-Datenagenten.

  3. Tabellen auswählen

    Da im Lakehouse-Laufzeitkatalog alle diese verschiedenen Formate zusammengeführt werden, ist die Suche identisch mit der Suche nach Standard-BigQuery-Tabellen.

    1. Suchen: Wenn Sie Ihre Wissensquelle hinzufügen, suchen Sie in der Benutzeroberfläche für die Tabellensuche und -auswahl nach Ihren Tabellennamen. Sie können Suchbegriffe verwenden, um Ergebnisse zu filtern, z. B.:

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Quelle prüfen: Achten Sie auf den Dataset-Teil des voll qualifizierten Namens. Tabellen, die von externen Quellen erstellt und vom Lakehouse-Laufzeitkatalog verwaltet werden, folgen in der Regel einem Format, in dem Katalog und Namespace kombiniert werden. Beispiel: PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table oder PROJECT_ID.sap_catalog.sales.delta_table

    3. Auswählen: Die ausgewählte Tabelle wird Ihrem aktiven Konversationskontext hinzugefügt.

  4. Fragen in natürlicher Sprache stellen Das System übersetzt Ihren Prompt automatisch in eine föderierte SQL-Abfrage.

Genauigkeit von Anfragen verbessern

Mit den Konfigurationsoptionen für KI-Datenagenten können Sie die konversationelle Analyse dabei unterstützen, Ihre Schemas und Terminologie besser zu verstehen. Zu diesen Optionen gehören Unternehmensglossare, geprüfte SQL-Abfragen und Systemanweisungen.

Nächste Schritte