Lakehouse-Tabellen mit natürlicher Sprache abfragen

Mit der konversationellen Analyse in BigQuery können Sie Ihre Daten im offenen Format mithilfe von Prompts in natürlicher Sprache abfragen. Diese Funktion basiert auf dem Lakehouse-Laufzeitkatalog in Lakehouse für Apache Iceberg. Ihre Fragen werden automatisch den zugrunde liegenden Tabellenschemas zugeordnet, sodass Sie SQL-Abfragen generieren und ausführen können, ohne den Code manuell schreiben zu müssen.

Beim Einrichten Ihrer Abfragen können Sie Datenagenten verwenden, um Unternehmensglossare und Systemanweisungen für eine höhere Genauigkeit bereitzustellen.

Funktionsweise der konversationellen Analyse

Bei der konversationellen Analyse werden Large Language Models (LLMs) verwendet, um Ihre Fragen in natürlicher Sprache zu verstehen und sie dem Schema Ihrer Tabellen zuzuordnen. Der Prozess umfasst die folgenden Schritte:

  1. Schemaerkennung: Das System ruft Metadaten aus dem Lakehouse Laufzeitkatalog ab, um Tabellenstrukturen, Spaltennamen und Datentypen zu verstehen.
  2. SQL-Generierung: Das LLM generiert eine SQL-Abfrage, die mit der BigQuery-Engine und dem zugrunde liegenden Datenformat kompatibel ist.
  3. Ausführung: BigQuery führt die generierte SQL-Abfrage direkt für die Daten im offenen Format im Lakehouse von Google Cloud aus.
  4. Antwort: Die Ergebnisse werden an die konversationelle Benutzeroberfläche zurückgegeben, oft begleitet von einer Zusammenfassung oder Visualisierung.

Weitere Informationen zur konversationellen Analyse, z. B. zum Verwalten von Daten agenten, zu Preisen oder zu Best Practices, finden Sie unter Übersicht über die konversationelle Analyse.

Unterstützte Formate

Bei der konversationellen Analyse werden Ihre Fragen in natürlicher Sprache in SQL-Abfragen übersetzt. Sie unterstützt die offenen Tabellenformate, die vom Lakehouse-Laufzeit katalog unterstützt werden, z. B. Apache Iceberg-Tabellen.

Hinweis

Bevor Sie Ihre Daten abfragen können, müssen Sie Ihre externen Tabellen im Lakehouse-Laufzeitkatalog registrieren. Der Lakehouse-Laufzeitkatalog dient als einheitlicher Hub, der BigQuery Studio mit Ihren externen Daten im offenen Format verbindet. Nach der Verbindung werden die Tabellen in BigQuery als auffindbare Assets angezeigt.

Tabellen mit der konversationellen Analyse abfragen

  1. Öffnen Sie in der Google Cloud Console den BigQuery Studio Agents Hub.

    Zum Agents Hub

  2. Erstellen Sie einen KI-Datenagenten oder starten Sie eine direkte Unterhaltung mit einem vorhandenen KI-Datenagenten.

  3. Wählen Sie Ihre Tabellen aus.

    Da der Lakehouse-Laufzeitkatalog alle diese verschiedenen Formate vereint, ist die Erkennungserfahrung identisch mit der Suche nach Standard-BigQuery-Tabellen.

    1. Suchen: Wenn Sie Ihre Wissensquelle hinzufügen, suchen Sie in der Benutzeroberfläche für die Tabellensuche und -auswahl nach Ihren Tabellennamen. Sie können Suchbegriffe verwenden, um die Ergebnisse zu filtern, z. B.:

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. Quelle prüfen: Achten Sie auf den Dataset-Teil des vollständig qualifizierten Namens. Tabellen, die von externen Quellen erstellt und vom Lakehouse-Laufzeitkatalog verwaltet werden, folgen in der Regel einem Format, das den Katalog und den Namespace kombiniert. Beispiel: PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table oder PROJECT_ID.sap_catalog.sales.delta_table.

    3. Auswählen: Fügen Sie die ausgewählte Tabelle Ihrem aktiven konversationellen Kontext hinzu.

  4. Stellen Sie Fragen in natürlicher Sprache. Das System übersetzt Ihren Prompt automatisch in eine föderierte SQL-Abfrage.

Genauigkeit der Abfrage verbessern

Damit die konversationelle Analyse Ihre Schemas und Terminologie besser versteht, können Sie die Konfigurationsoptionen für KI-Datenagenten verwenden. Zu diesen Optionen gehören Geschäftsglossare, geprüfte SQL-Abfragen und Systemanweisungen.

Nächste Schritte