Generative KI – Übersicht

In diesem Dokument werden die Funktionen für generative künstliche Intelligenz (KI) beschrieben, die von BigQuery unterstützt werden. Diese Funktionen akzeptieren Eingaben in natürlicher Sprache und verwenden vortrainierte Vertex AI-Modelle und integrierte BigQuery-Modelle.

Übersicht

BigQuery bietet eine Vielzahl von KI-Funktionen, die bei Aufgaben wie den folgenden helfen:

  • Kreative Inhalte erstellen
  • Text oder unstrukturierte Daten wie Bilder analysieren, Stimmungen erkennen und Fragen dazu beantworten.
  • Fassen Sie die wichtigsten Ideen oder Eindrücke zusammen, die durch die Inhalte vermittelt werden.
  • Strukturierte Daten aus Text extrahieren
  • Text oder unstrukturierte Daten in nutzerdefinierte Kategorien einteilen.
  • Einbettungen generieren, um nach ähnlichen Texten, Bildern und Videos zu suchen
  • Bewerten Sie Eingaben, um sie nach Qualität, Ähnlichkeit oder anderen Kriterien zu sortieren.

Es gibt zwei Hauptkategorien von KI-Funktionen, die Ihnen bei diesen Aufgaben helfen:

  • Allgemeine KI-Funktionen:Mit diesen Funktionen haben Sie die volle Kontrolle und Transparenz bei der Auswahl von Modell, Prompt und Parametern.

    • Inferenz ausführen, um beispielsweise Fragen zu Ihren Daten zu beantworten

      • AI.GENERATE ist die flexibelste Inferenzfunktion. Damit können Sie beliebige Kombinationen aus Text und unstrukturierten Daten analysieren und strukturierte Daten ausgeben, die Ihrem benutzerdefinierten Schema entsprechen.
      • Wenn Sie eine Ausgabe eines bestimmten Typs benötigen, wählen Sie eine der folgenden spezialisierten Inferenzfunktionen aus:

        • AI.GENERATE_BOOL
        • AI.GENERATE_DOUBLE
        • AI.GENERATE_INT
    • Strukturierte Ausgabe generieren, z. B. Namen und Adressen aus unstrukturiertem Text extrahieren

      • AI.GENERATE, wenn Sie eine output_schema angeben
      • AI.GENERATE_TABLE
    • Text generieren mit einer Tabellenwertfunktionsversion von AI.GENERATE

      • AI.GENERATE_TEXT
    • Einbettungen generieren für semantische Suche und Clustering

      • AI.EMBED
      • AI.GENERATE_EMBEDDING
      • AI.SIMILARITY
  • Verwaltete KI-Funktionen:Diese Funktionen haben eine optimierte Syntax und sind für Kosten und Qualität optimiert. BigQuery wählt ein Modell für Sie aus.

    • Daten mit Bedingungen in natürlicher Sprache filtern

      • AI.IF
    • Eingabe bewerten, z. B. nach Qualität oder Stimmung

      • AI.SCORE
    • Eingaben in benutzerdefinierte Kategorien einteilen

      • AI.CLASSIFY

KI-Funktionen mit allgemeinem Verwendungszweck

Mit KI-Funktionen für allgemeine Zwecke haben Sie die volle Kontrolle und Transparenz bei der Auswahl von Modell, Prompt und Parametern. Die Ausgabe enthält detaillierte Informationen zum Aufruf des Modells, einschließlich des Status und der vollständigen Modellantwort, die Informationen zur Sicherheitsbewertung oder zu Quellenangaben enthalten kann.

Strukturierte Daten generieren

Die Generierung strukturierter Daten ähnelt der Textgenerierung sehr, mit dem Unterschied, dass Sie die Antwort des Modells formatieren können, indem Sie ein SQL-Schema angeben. Sie können beispielsweise aus dem Transkript eines Telefonanrufs eine Tabelle mit dem Namen, der Telefonnummer, der Adresse, der Anfrage und dem Preisangebot eines Kunden erstellen.

Es gibt zwei Möglichkeiten, strukturierte Daten zu generieren:

Werte eines bestimmten Typs zeilenweise generieren

Sie können skalare generative KI-Funktionen mit Gemini-Modellen verwenden, um Daten in BigQuery-Standardtabellen zu analysieren. Die Daten enthalten sowohl Textdaten als auch unstrukturierte Daten aus Spalten mit ObjectRef-Werten. Für jede Zeile in der Tabelle wird mit diesen Funktionen eine Ausgabe mit einem bestimmten Typ generiert. Sie können beispielsweise Bilder von Einrichtungsgegenständen analysieren, um Text für eine design_type-Spalte zu generieren. So erhält die SKU des Einrichtungsgegenstands eine zugehörige Beschreibung wie mid-century modern oder farmhouse.

Die folgenden KI-Funktionen sind verfügbar:

Wenn Sie die Funktion AI.GENERATE mit unterstützten Gemini-Modellen verwenden, können Sie bereitgestellten Durchsatz von Vertex AI verwenden, um einen gleichbleibend hohen Durchsatz für Anfragen zu erzielen. Weitere Informationen finden Sie unter Vertex AI Provisioned Throughput verwenden.

Text mit einer TVF generieren

Sie können generative KI-Aufgaben mit der tabellarischen Funktion GENERATE_TEXT ausführen. Dabei werden Remote-Modelle in BigQuery ML verwendet, um auf Modelle zu verweisen, die in Vertex AI bereitgestellt oder gehostet werden. Sie können die folgenden Arten von Remote-Modellen erstellen:

Nachdem Sie ein Remote-Modell erstellt haben, können Sie über die Funktion AI.GENERATE_TEXT mit diesem Modell interagieren.

  • Für Remote-Modelle, die auf Gemini-Modellen basieren, haben Sie folgende Möglichkeiten:

    • Mit der Funktion AI.GENERATE_TEXT können Sie Text aus einem Prompt generieren, den Sie in einer Abfrage angeben oder aus einer Spalte in einer Standardtabelle abrufen. Wenn Sie den Prompt in einer Abfrage angeben, können Sie im Prompt auf die folgenden Arten von Tabellenspalten verweisen:

    • Mit der Funktion AI.GENERATE_TEXT können Sie Text-, Bild-, Audio-, Video- oder PDF-Inhalte aus einer Objekttabelle mit einem Prompt analysieren, den Sie als Funktionsargument angeben.

  • Bei allen anderen Arten von Remote-Modellen können Sie die AI.GENERATE_TEXT-Funktion mit einem Prompt verwenden, den Sie in einer Abfrage oder aus einer Spalte in einer Standardtabelle angeben.

In den folgenden Themen können Sie die Textgenerierung in BigQuery ML ausprobieren:

Sie können Fundierung und Sicherheitsattribute verwenden, wenn Sie Gemini-Modelle mit der Funktion AI.GENERATE_TEXT verwenden, wenn Sie eine Standardtabelle als Eingabe verwenden. Mit der Fundierung kann das Gemini-Modell beim Generieren einer Antwort zusätzliche Informationen aus dem Internet verwenden, um spezifischere und faktischere Antworten zu erstellen. Mit Sicherheitsattributen kann das Gemini-Modell die Antworten, die es zurückgibt, anhand der von Ihnen angegebenen Attribute filtern.

Bei einigen Modellen können Sie optional die überwachte Abstimmung konfigurieren. Damit können Sie das Modell mit Ihren eigenen Daten trainieren, um es besser an Ihren Anwendungsfall anzupassen. Alle Inferenzen treten in Vertex AI auf. Die Ergebnisse werden in BigQuery gespeichert.

Für unterstützte Gemini-Modelle können Sie bereitgestellten Durchsatz von Vertex AI verwenden, um einen gleichbleibend hohen Durchsatz für Anfragen zu erzielen. Weitere Informationen finden Sie unter Vertex AI Provisioned Throughput verwenden.

Einbettungen generieren

Eine Einbettung ist ein hochdimensionaler numerischer Vektor, der eine bestimmte Entität darstellt, z. B. einen Text oder eine Audiodatei. Durch das Generieren von Einbettungen können Sie die Semantik Ihrer Daten so erfassen, dass sie leichter zu analysieren und zu vergleichen sind.

Im Folgenden sind einige gängige Anwendungsfälle für die Generierung von Einbettungen aufgeführt:

  • Mit Retrieval-Augmented Generation (RAG) werden Modellantworten auf Nutzeranfragen durch Verweisen auf zusätzliche Daten aus einer vertrauenswürdigen Quelle ergänzt. RAG bietet eine bessere faktische Richtigkeit und Konsistenz der Antworten und ermöglicht auch den Zugriff auf Daten, die neuer sind als die Trainingsdaten des Modells.
  • Multimodale Suche durchführen Zum Beispiel, wenn Sie mit Texteingabe nach Bildern suchen.
  • Semantische Suche nach ähnlichen Elementen für Empfehlungen, Ersetzungen und die Deduplizierung von Datensätzen.
  • Einbettungen erstellen, die mit einem k-Means-Modell für das Clustering verwendet werden.

Weitere Informationen zum Generieren von Einbettungen und zur Verwendung von Einbettungen für diese Aufgaben finden Sie unter Einführung in Einbettungen und Vektorsuche.

Verwaltete KI-Funktionen

Verwaltete KI-Funktionen wurden speziell für die Automatisierung von Routineaufgaben wie Klassifizierung, Sortierung oder Filterung entwickelt. Diese Funktionen nutzen Gemini und müssen nicht angepasst werden. BigQuery verwendet Prompt Engineering und wählt das geeignete Modell und die entsprechenden Parameter für die jeweilige Aufgabe aus, um die Qualität und Konsistenz Ihrer Ergebnisse zu optimieren. Jede Funktion gibt einen skalaren Wert zurück, z. B. BOOL, FLOAT64 oder STRING, und enthält keine zusätzlichen Statusinformationen aus dem Modell. Die folgenden verwalteten KI-Funktionen sind verfügbar:

  • AI.IF: Text oder multimodale Daten filtern, z. B. in einer WHERE- oder JOIN-Klausel, basierend auf einem Prompt. Sie können beispielsweise Produktbeschreibungen nach Artikeln filtern, die sich gut als Geschenk eignen.
  • AI.SCORE: Bewerten Sie Eingaben basierend auf einem Prompt, um Zeilen nach Qualität, Ähnlichkeit oder anderen Kriterien zu sortieren. Sie können diese Funktion in einer ORDER BY-Klausel verwenden, um die K Elemente mit der höchsten Punktzahl zu extrahieren. So können Sie beispielsweise die zehn positivsten oder negativsten Nutzerrezensionen für ein Produkt finden.
  • AI.CLASSIFY: Text in benutzerdefinierte Kategorien klassifizieren. Sie können diese Funktion in einer GROUP BY-Klausel verwenden, um Eingaben entsprechend den von Ihnen definierten Kategorien zu gruppieren. Sie können Supporttickets beispielsweise danach klassifizieren, ob sie sich auf die Abrechnung, den Versand, die Produktqualität oder etwas anderes beziehen.

Eine Anleitung mit Beispielen für die Verwendung dieser Funktionen finden Sie unter Semantische Analyse mit verwalteten KI-Funktionen durchführen.

Ein Notebook-Tutorial zur Verwendung von verwalteten und allgemeinen KI-Funktionen finden Sie unter Semantische Analyse mit KI-Funktionen.

Standorte

Die unterstützten Standorte für Textgenerierungs- und Einbettungsmodelle variieren je nach Modelltyp und ‑version. Weitere Informationen finden Sie unter Standorte.

Preise

Ihnen werden die Rechenressourcen in Rechnung gestellt, die Sie zum Ausführen von Anfragen für Modelle verwenden. Remote-Modelle rufen Vertex AI-Modelle auf. Daher fallen für Anfragen an Remote-Modelle auch Gebühren von Vertex AI an.

Weitere Informationen finden Sie unter BigQuery ML-Preise.

Kosten im Blick behalten

Die generativen KI-Funktionen in BigQuery funktionieren, indem Anfragen an Vertex AI gesendet werden, was Kosten verursachen kann. So verfolgen Sie die Vertex AI-Kosten, die durch einen Job anfallen, den Sie in BigQuery ausführen:

  1. Abrechnungsberichte in Cloud Billing ansehen
  2. Verwenden Sie Filter, um die Ergebnisse einzugrenzen.

    Wählen Sie für Dienste Vertex AI aus.

  3. Wenn Sie die Gebühren für einen bestimmten Job sehen möchten, filtern Sie nach Label.

    Legen Sie den Schlüssel auf bigquery_job_id_prefix und den Wert auf die Job-ID Ihres Jobs fest. Wenn Ihre Job-ID länger als 63 Zeichen ist, verwenden Sie nur die ersten 63 Zeichen. Wenn Ihre Job-ID Großbuchstaben enthält, ändern Sie sie in Kleinbuchstaben. Alternativ können Sie Jobs mit einem benutzerdefinierten Label verknüpfen, um sie später leichter zu finden.

Es kann bis zu 24 Stunden dauern, bis einige Gebühren in Cloud Billing angezeigt werden.

Nächste Schritte