In dieser Anleitung erfahren Sie, wie Sie mit der konversationellen Analyse in BigQuery Daten in Ihren Google Cloud Lakehouse Tabellen mit Prompts in natürlicher Sprache abfragen.
Funktionsweise der konversationellen Analyse
Bei der konversationellen Analyse werden Large Language Models (LLMs) verwendet, um Ihre Fragen in natürlicher Sprache zu verstehen und sie dem Schema Ihrer Tabellen zuzuordnen. Der Prozess umfasst die folgenden Schritte:
- Schemaerkennung: Das System ruft Metadaten aus dem Lakehouse Laufzeitkatalog ab, um Tabellenstrukturen, Spaltennamen und Datentypen zu verstehen.
- SQL-Generierung: Das LLM generiert eine SQL-Abfrage, die mit der BigQuery-Engine und dem zugrunde liegenden Datenformat kompatibel ist.
- Ausführung: BigQuery führt die generierte SQL-Abfrage direkt für die Daten im offenen Format im Google Cloud Lakehouse aus.
- Antwort: Die Ergebnisse werden an die konversationelle Oberfläche zurückgegeben, oft begleitet von einer Zusammenfassung oder Visualisierung.
Weitere Informationen zur konversationellen Analyse, z. B. zum Verwalten von Daten agenten, zu Preisen oder zu Best Practices, finden Sie unter Übersicht über die konversationelle Analyse.
Unterstützte Formate
Bei der konversationellen Analyse werden Ihre Fragen in natürlicher Sprache in SQL-Abfragen übersetzt. Sie unterstützt die offenen Tabellenformate, die vom Lakehouse-Laufzeit katalog unterstützt werden, z. B. Apache Iceberg-Tabellen.
Hinweis
Bevor Sie Ihre Daten abfragen können, müssen Sie Ihre externen Tabellen im Lakehouse-Laufzeitkatalog registrieren. Der Lakehouse-Laufzeitkatalog dient als einheitlicher Hub, der BigQuery Studio mit Ihren externen Daten im offenen Format verbindet. Nach der Verbindung werden die Tabellen in BigQuery als auffindbare Assets angezeigt.
Tabellen mit der konversationellen Analyse abfragen
Öffnen Sie in der Google Cloud Console den BigQuery Studio Agents Hub.
Erstellen Sie einen KI-Datenagenten oder starten Sie eine direkte Unterhaltung mit einem vorhandenen KI-Datenagenten.
Wählen Sie Ihre Tabellen aus.
Da der Lakehouse-Laufzeitkatalog alle diese verschiedenen Formate vereint, ist die Erkennung identisch mit der Suche nach Standard-BigQuery-Tabellen.
Suchen: Wenn Sie Ihre Wissensquelle hinzufügen, suchen Sie in der Oberfläche für die Tabellensuche und -auswahl nach Ihren Tabellennamen. Sie können Suchbegriffe verwenden, um die Ergebnisse zu filtern, z. B.:
TABLE_NAMEcatalog: CATALOG_NAMEproject: PROJECT_IDnamespace: NAMESPACE_NAME
Quelle prüfen: Achten Sie auf den Dataset-Teil des vollständig qualifizierten Namens. Tabellen, die von externen Quellen erstellt und vom Lakehouse-Laufzeitkatalog verwaltet werden, folgen in der Regel einem Format, das den Katalog und den Namespace kombiniert. Beispiel:
PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_tableoderPROJECT_ID.sap_catalog.sales.delta_table.Auswählen: Fügen Sie die ausgewählte Tabelle Ihrem aktiven konversationellen Kontext hinzu.
Stellen Sie Fragen in natürlicher Sprache. Das System übersetzt Ihren Prompt automatisch in eine föderierte SQL-Abfrage.
Genauigkeit der Abfrage verbessern
Damit die konversationelle Analyse Ihre Schemas und Terminologie besser versteht, verwenden Sie die Konfigurationsoptionen für KI-Datenagenten. Zu diesen Optionen gehören Business-Glossare, geprüfte SQL-Abfragen und Systemanweisungen.
Nächste Schritte
- Weitere Informationen zur konversationellen Analyse in BigQuery.
- Informationen zum Registrieren externer Tabellen im Lakehouse-Laufzeitkatalog
- Weitere Informationen zu KI-Datenagenten.