Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Generative KI – Übersicht

In diesem Dokument werden die Funktionen für generative künstliche Intelligenz (KI) beschrieben, die von BigQuery unterstützt werden. Diese Funktionen akzeptieren Eingaben in natürlicher Sprache und verwenden vortrainierte Vertex AI-Modelle und integrierte BigQuery-Modelle.

BigQuery bietet eine Vielzahl von KI-Funktionen, die bei Aufgaben wie den folgenden helfen:

Kreative Inhalte erstellen.
Text oder unstrukturierte Daten wie Bilder analysieren, Stimmungen erkennen und Fragen dazu beantworten
Fassen Sie die wichtigsten Ideen oder Eindrücke zusammen, die durch die Inhalte vermittelt werden.
Strukturierte Daten aus Text extrahieren
Text oder unstrukturierte Daten in benutzerdefinierte Kategorien klassifizieren.
Einbettungen generieren, um nach ähnlichen Texten, Bildern und Videos zu suchen
Bewerten Sie Eingaben, um sie nach Qualität, Ähnlichkeit oder anderen Kriterien zu sortieren.

KI-Funktionen sind in die folgenden Kategorien unterteilt, um Sie bei diesen Aufgaben zu unterstützen:

Allgemeine KI-Funktionen:Mit diesen Funktionen haben Sie die volle Kontrolle und Transparenz bei der Auswahl von Modell, Prompt und Parametern.
- LLM-Inferenz ausführen, z. B. um Fragen zu Ihren Daten zu beantworten
  - AI.GENERATE ist die flexibelste Inferenzfunktion, mit der Sie beliebige strukturierte oder unstrukturierte Daten analysieren können.
  - AI.GENERATE_TEXT ist eine tabellarische Version von AI.GENERATE, die auch Partnermodelle und offene Modelle unterstützt.
- Strukturierte Ausgabe generieren, z. B. Namen, Adressen oder Objektbeschreibungen aus Text, Dokumenten oder Bildern extrahieren.
  - AI.GENERATE, wenn Sie ein Ausgabeschema angeben.
  - AI.GENERATE_TABLE ist eine tabellenwertige Version von AI.GENERATE, die ein Remote-Modell aufruft und Ihnen die Angabe eines benutzerdefinierten Ausgabeschemas ermöglicht.
  - Wenn Ihr Ausgabeschema nur ein Feld hat, können Sie eine der folgenden spezialisierten Funktionen verwenden: AI.GENERATE_BOOL, AI.GENERATE_DOUBLE oder AI.GENERATE_INT.
- Einbettungen generieren für semantische Suche und Clustering
  - AI.EMBED: Erstellt eine Einbettung aus Text- oder Bilddaten.
  - AI.GENERATE_EMBEDDING: Eine tabellarische Funktion, mit der Ihrer Tabelle eine Spalte mit eingebetteten Text-, Bild-, Audio-, Video- oder Dokumentdaten hinzugefügt wird.
Verwaltete KI-Funktionen:Diese Funktionen haben eine optimierte Syntax und sind auf Kosten und Qualität ausgelegt. Im optimierten Modus (Vorabversion) können diese Funktionen auf Millionen oder Milliarden von Zeilen skaliert werden.
- Daten mit Bedingungen in natürlicher Sprache filtern
  - AI.IF
- Eingabe bewerten, z. B. nach Qualität oder Stimmung
  - AI.SCORE
- Eingaben in benutzerdefinierte Kategorien klassifizieren
  - AI.CLASSIFY
Hilfsfunktionen:Mit der AI.COUNT_TOKENS-Funktion können Sie die Anzahl der Tokens in einem Eingabe-Prompt schätzen, bevor Sie eine Anfrage ausführen.
Aufgabenspezifische Funktionen:Diese Funktionen verwenden Cloud AI-APIs, um Sie bei Aufgaben wie der Verarbeitung natürlicher Sprache, der maschinellen Übersetzung, der Dokumentenverarbeitung, der Audiotranskription und Computer Vision zu unterstützen.

KI-Funktionen mit allgemeinem Verwendungszweck

Mit Allzweck-KI-Funktionen haben Sie die volle Kontrolle und Transparenz bei der Auswahl von Modell, Prompt und Parametern. Die Ausgabe enthält detaillierte Informationen zum Aufruf des Modells, einschließlich des Status und der vollständigen Modellantwort, die Informationen zur Sicherheitsbewertung oder zu Quellenangaben enthalten kann.

LLM-Inferenz durchführen

Die AI.GENERATE-Funktion ist eine flexible Inferenzfunktion, die Anfragen an ein Vertex AI Gemini-Modell sendet und die Antwort des Modells zurückgibt. Mit dieser Funktion können Sie Text-, Bild-, Audio-, Video- oder PDF-Daten analysieren. Sie können beispielsweise Bilder von Einrichtungsgegenständen analysieren, um Text für eine design_type-Spalte zu generieren. So erhält die SKU des Einrichtungsgegenstands eine zugehörige Beschreibung wie mid-century modern oder farmhouse.

Sie können generative KI-Aufgaben ausführen, indem Sie Remote-Modelle in BigQuery ML verwenden, um mit der tabellenwertigen Funktion AI.GENERATE_TEXT auf Modelle zu verweisen, die in Vertex AI bereitgestellt oder gehostet werden. Sie können die folgenden Typen von Remote-Modellen verwenden:

Remote-Modelle für alle allgemein verfügbaren oder Vorschaumodelle von Gemini zum Analysieren von Text-, Bild-, Audio-, Video- oder PDF-Inhalten aus Standardtabellen oder Objekttabellen mit einem Prompt, den Sie als Funktionsargument angeben.
Remote-Modelle über Anthropic Claude-, Mistral AI - oder Llama-Partnermodelle oder unterstützte offene Modelle verwenden, um einen Prompt zu analysieren, den Sie in einer Abfrage oder aus einer Spalte in einer Standardtabelle angeben.

In den folgenden Themen erfahren Sie, wie Sie die Textgenerierung in BigQuery ML ausprobieren können:

Bei einigen Modellen können Sie optional die überwachte Abstimmung konfigurieren. Damit können Sie das Modell mit Ihren eigenen Daten trainieren, um es besser an Ihren Anwendungsfall anzupassen. Alle Inferenzen treten in Vertex AI auf. Die Ergebnisse werden in BigQuery gespeichert.

Strukturierte Daten generieren

Die Generierung strukturierter Daten ähnelt der Textgenerierung sehr, mit dem Unterschied, dass Sie die Antwort des Modells formatieren können, indem Sie ein SQL-Schema angeben. Sie können beispielsweise aus dem Transkript eines Telefonanrufs eine Tabelle mit dem Namen, der Telefonnummer, der Adresse, der Anfrage und dem Preisangebot eines Kunden erstellen.

Sie haben folgende Möglichkeiten, strukturierte Daten zu generieren:

Die AI.GENERATE-Funktion ruft einen Vertex AI-Endpunkt auf und kann mit Ihrem benutzerdefinierten Schema einen STRUCT-Wert generieren.

Hier erfahren Sie, wie Sie strukturierte Ausgaben verwenden, wenn Sie die Funktion AI.GENERATE aufrufen.
Die AI.GENERATE_TABLE Funktion ruft ein Remote-Modell auf und ist eine Tabellenwertfunktion, die eine Tabelle mit Ihrem benutzerdefinierten Schema generiert.

Informationen zum Erstellen strukturierter Daten finden Sie unter Strukturierte Daten mit der Funktion AI.GENERATE_TABLE generieren.
Für ein einzelnes Ausgabefeld können Sie eine der folgenden speziellen Inferenzfunktionen verwenden:

Einbettungen generieren

Eine Einbettung ist ein hochdimensionaler numerischer Vektor, der eine bestimmte Entität darstellt, z. B. einen Text oder eine Audiodatei. Durch das Generieren von Einbettungen können Sie die Semantik Ihrer Daten so erfassen, dass sie leichter zu analysieren und zu vergleichen sind.

Im Folgenden sind einige gängige Anwendungsfälle für die Generierung von Einbettungen aufgeführt:

Mit Retrieval-Augmented Generation (RAG) werden Modellantworten auf Nutzeranfragen durch Verweisen auf zusätzliche Daten aus einer vertrauenswürdigen Quelle ergänzt. RAG bietet eine bessere sachliche Richtigkeit und Konsistenz der Antworten und ermöglicht auch den Zugriff auf Daten, die neuer sind als die Trainingsdaten des Modells.
Multimodale Suche durchführen Zum Beispiel, wenn Sie mit Texteingabe nach Bildern suchen.
Semantische Suche nach ähnlichen Elementen für Empfehlungen, Ersetzungen und die Deduplizierung von Datensätzen.
Einbettungen erstellen, die mit einem K-Means-Modell für das Clustering verwendet werden können.

Weitere Informationen zum Generieren von Einbettungen und zur Verwendung von Einbettungen für diese Aufgaben finden Sie unter Einführung in Einbettungen und Vektorsuche.

Verwaltete KI-Funktionen

Verwaltete KI-Funktionen vereinfachen Routineaufgaben wie Filtern, Klassifizieren oder Aggregieren. Mit diesen Funktionen können Text-, Bild-, Audio-, Video- oder PDF-Daten analysiert werden. Diese Funktionen nutzen Gemini und erfordern keine Anpassung. BigQuery verwendet Prompt-Engineering und kann das geeignete Modell und die entsprechenden Parameter für die jeweilige Aufgabe auswählen, um die Qualität und Konsistenz Ihrer Ergebnisse zu optimieren. Jede Funktion gibt einen skalaren Wert zurück, z. B. BOOL, FLOAT64 oder STRING, und enthält keine zusätzlichen Statusinformationen aus dem Modell. Die folgenden verwalteten KI-Funktionen sind verfügbar:

AI.IF: Text oder multimodale Daten, z. B. in einer WHERE- oder JOIN-Klausel, basierend auf einem Prompt filtern. Sie können beispielsweise Produktbeschreibungen nach Artikeln filtern, die sich gut als Geschenk eignen.
AI.SCORE: Bewerten Sie Eingaben basierend auf einem Prompt, um Zeilen nach Qualität, Ähnlichkeit oder anderen Kriterien zu sortieren. Sie können diese Funktion in einer ORDER BY-Klausel verwenden, um die Top-K-Elemente mit der höchsten Punktzahl zu extrahieren. So können Sie beispielsweise die zehn positivsten oder negativsten Nutzerrezensionen für ein Produkt finden.
AI.CLASSIFY: Text in benutzerdefinierte Kategorien klassifizieren. Sie können diese Funktion in einer GROUP BY-Klausel verwenden, um Eingaben entsprechend den von Ihnen definierten Kategorien zu gruppieren. Sie können Supporttickets beispielsweise danach klassifizieren, ob sie sich auf die Abrechnung, den Versand, die Produktqualität oder etwas anderes beziehen.

Eine Anleitung mit Beispielen für die Verwendung dieser Funktionen finden Sie unter Semantische Analyse mit verwalteten KI-Funktionen durchführen.

Ein Notebook-Tutorial zur Verwendung von verwalteten und allgemeinen KI-Funktionen finden Sie unter Semantische Analyse mit KI-Funktionen.

Aufgabenspezifische Funktionen

Zusätzlich zu den allgemeineren Funktionen, die in den vorherigen Abschnitten beschrieben werden, können Sie in BigQuery ML aufgabenspezifische Lösungen mit Cloud AI APIs entwickeln. Zu den unterstützten Aufgaben gehören folgende:

Weitere Informationen finden Sie unter Aufgabenspezifische Lösungen – Übersicht.

Standorte

Die unterstützten Standorte für Textgenerierungs- und Einbettungsmodelle variieren je nach verwendetem Modelltyp und ‑version. Weitere Informationen finden Sie unter Standorte.

Preise

Ihnen werden die Rechenressourcen in Rechnung gestellt, die Sie zum Ausführen von Anfragen für Modelle verwenden. Remote-Modelle rufen Vertex AI-Modelle auf. Daher fallen für Anfragen an Remote-Modelle auch Gebühren von Vertex AI an.

Weitere Informationen finden Sie unter BigQuery ML-Preise.

Tokennutzung verfolgen

Wenn Sie eine KI-Funktion für generative KI aufrufen, die ein anderes Gemini-Modell als ein Einbettungsmodell verwendet, können Sie die Gesamtzahl der einzelnen Tokentypen sehen, die von der Abfrage verarbeitet werden. Klicken Sie im Bereich Abfrageergebnisse auf Jobinformationen. Die folgenden Zählungen werden angezeigt, ggf. aufgeschlüsselt nach Modalität:

Anzahl der Eingabetokens:Die Gesamtzahl der Eingabetokens für alle generativen KI-Funktionen, die in der Abfrage aufgerufen werden.
Anzahl der Ausgabetokens: Die Gesamtzahl der Tokens in allen Kandidatenantworten, die durch die Anfrage generiert wurden.
Tokenanzahl der Gedanken: Die Gesamtzahl der Tokens, die Teil der vom Modell generierten Gedanken waren, sofern zutreffend.
Tokenanzahl des Cache: Die Gesamtzahl der Eingabetokens, die von der Abfrage implizit im Cache gespeichert wurden.

Kosten im Blick behalten

Die Funktionen für generative KI in BigQuery funktionieren, indem Anfragen an Vertex AI gesendet werden. Dadurch können Kosten entstehen. Mit der Funktion AI.COUNT_TOKENS können Sie die Anzahl der Eingabetokens schätzen, bevor Sie eine Abfrage ausführen. So verfolgen Sie die Vertex AI-Kosten, die durch einen Job anfallen, den Sie in BigQuery ausführen:

Abrechnungsberichte in Cloud Billing ansehen
Verwenden Sie Filter, um die Ergebnisse einzugrenzen.

Wählen Sie für Dienste Vertex AI aus.
Wenn Sie die Gebühren für einen bestimmten Job sehen möchten, filtern Sie nach Label.

Legen Sie den Schlüssel auf bigquery_job_id_prefix und den Wert auf die Job-ID Ihres Jobs fest. Wenn Ihre Job-ID länger als 63 Zeichen ist, verwenden Sie nur die ersten 63 Zeichen. Wenn Ihre Job-ID Großbuchstaben enthält, ändern Sie diese in Kleinbuchstaben. Alternativ können Sie Jobs mit einem benutzerdefinierten Label verknüpfen, um sie später leichter zu finden.

Es kann bis zu 24 Stunden dauern, bis einige Gebühren in Cloud Billing angezeigt werden.

Monitoring

Wenn Sie das Verhalten von KI-Funktionen, die Sie in BigQuery aufrufen, besser nachvollziehen möchten, können Sie die Protokollierung von Anfragen und Antworten aktivieren. So protokollieren Sie die gesamte Anfrage und Antwort, die an Vertex AI gesendet und von Vertex AI empfangen wurde:

Anfrage-/Antwort-Logs in Vertex AI aktivieren Die Logs werden in BigQuery gespeichert. Sie müssen die Protokollierung für jedes Foundation Model und jede Region separat aktivieren. Wenn Sie Abfragen protokollieren möchten, die in der Region us ausgeführt werden, geben Sie die Region us-central1 in Ihrer Anfrage an. Wenn Sie Abfragen protokollieren möchten, die in der Region eu ausgeführt werden, geben Sie in Ihrer Anfrage die Region europe-west4 an.
Führen Sie eine Abfrage mit einer KI-Funktion aus, die einen Aufruf an Vertex AI mit dem Modell ausführt, für das Sie im vorherigen Schritt die Protokollierung aktiviert haben.
Wenn Sie die vollständige Vertex AI-Anfrage und -Antwort aufrufen möchten, fragen Sie Ihre Logging-Tabelle nach Zeilen ab, in denen das Feld labels.bigquery_job_id_prefix der Spalte full_request mit den ersten 63 Zeichen Ihrer Job-ID übereinstimmt. Optional können Sie ein benutzerdefiniertes Abfragelabel verwenden, um die Abfrage in den Logs zu finden.

Sie können beispielsweise eine ähnliche Abfrage wie die folgende verwenden:
```
SELECT *
FROM `my_project.my_dataset.request_response_logging`
WHERE JSON_VALUE(full_request, '$.labels.bigquery_job_id_prefix') = 'bquxjob_123456...';
```

Fehlermanagement

Fehler auf Zeilenebene, z. B. RESOURCE_EXHAUSTED, können auftreten, wenn eine KI-Funktion das Kontingent oder die Limits des Remotedienstes überschreitet. Wenn ein Fehler auf Zeilenebene auftritt, gibt die Funktion für diese Zeile NULL zurück, was zu unvollständigen Abfrageergebnissen führen kann.

Diese Fehler können bei allen KI-Funktionen auftreten. Die verwalteten KI-Funktionen (AI.IF, AI.CLASSIFY und AI.SCORE) unterstützen jedoch das max_error_ratio-Argument, damit Sie sie verwalten können. Mit diesem Argument legen Sie einen Fehlerschwellenwert fest, der es ermöglicht, dass die Abfrage trotz Fehlern auf Zeilenebene erfolgreich ausgeführt wird.

Der Standardwert für max_error_ratio ist 1.0. Wenn Sie die Fehlertoleranz verringern möchten, legen Sie einen kleineren Wert fest (z. B. 0.2). In diesem Fall schlägt die Abfrage fehl, anstatt mit Teilausfällen erfolgreich zu sein. Weitere Informationen zur Syntax finden Sie in der Referenzdokumentation für AI.IF, AI.CLASSIFY oder AI.SCORE.

Wenn die Abfrage mit teilweisen Fehlern erfolgreich ausgeführt wird, gibt BigQuery eine Warnung zurück. Weitere Informationen zu den Funktionsfehlern finden Sie in der Google Cloud Console auf dem Tab Jobinformationen im Feld Fehler bei Funktionen der generativen KI in den Abfrageergebnissen.

Wenn Ihre Abfrage eine LIMIT-Klausel enthält, wird das Limit nach der Verarbeitung eines Batches von Zeilen durch das Modell angewendet. Daher kann der Anteil der NULL-Werte in Ihrem endgültigen Ergebnis höher als der angegebene max_error_ratio sein.

Angenommen, Ihre Abfrage enthält eine LIMIT 10-Klausel und einen max_error_ratio von 0.2. Das Modell verarbeitet möglicherweise 20 Zeilen, bevor das Limit angewendet wird. Wenn 3 der 20 Zeilen fehlschlagen, beträgt das Fehlerverhältnis 0.15 (15%), was innerhalb des Grenzwerts von 20 % liegt. Wenn die durch die LIMIT-Klausel ausgewählte Teilmenge der Zeilen jedoch alle drei fehlgeschlagenen Zeilen enthält, enthält die sichtbare Ausgabe 30% NULL-Werte.

Nächste Schritte

Eine Einführung in KI und ML in BigQuery finden Sie unter Einführung in KI und ML in BigQuery.
Weitere Informationen zum Ausführen von Inferenzen für Modelle von maschinellem Lernen finden Sie unter Modellinferenz – Übersicht.
Weitere Informationen zu den unterstützten SQL-Anweisungen und -Funktionen für generative KI-Modelle finden Sie unter End-to-End-Nutzerpfade für generative KI-Modelle.