Generative KI – Übersicht
In diesem Dokument werden die Funktionen für generative künstliche Intelligenz (KI) beschrieben, die von BigQuery unterstützt werden. Diese Funktionen akzeptieren Eingaben in natürlicher Sprache und verwenden vortrainierte Vertex AI-Modelle und integrierte BigQuery-Modelle.
Übersicht
BigQuery bietet eine Vielzahl von KI-Funktionen, die bei Aufgaben wie den folgenden helfen:
- Kreative Inhalte erstellen
- Text oder unstrukturierte Daten wie Bilder analysieren, Stimmungen erkennen und Fragen dazu beantworten.
- Fassen Sie die wichtigsten Ideen oder Eindrücke zusammen, die durch die Inhalte vermittelt werden.
- Strukturierte Daten aus Text extrahieren
- Text oder unstrukturierte Daten in nutzerdefinierte Kategorien einteilen.
- Einbettungen generieren, um nach ähnlichen Texten, Bildern und Videos zu suchen
- Bewerten Sie Eingaben, um sie nach Qualität, Ähnlichkeit oder anderen Kriterien zu sortieren.
Es gibt zwei Hauptkategorien von KI-Funktionen, die Ihnen bei diesen Aufgaben helfen:
Allgemeine KI-Funktionen:Mit diesen Funktionen haben Sie die volle Kontrolle und Transparenz bei der Auswahl von Modell, Prompt und Parametern.
Inferenz ausführen, um beispielsweise Fragen zu Ihren Daten zu beantworten
AI.GENERATEist die flexibelste Inferenzfunktion. Damit können Sie beliebige Kombinationen aus Text und unstrukturierten Daten analysieren und strukturierte Daten ausgeben, die Ihrem benutzerdefinierten Schema entsprechen.Wenn Sie eine Ausgabe eines bestimmten Typs benötigen, wählen Sie eine der folgenden spezialisierten Inferenzfunktionen aus:
AI.GENERATE_BOOLAI.GENERATE_DOUBLEAI.GENERATE_INT
Strukturierte Ausgabe generieren, z. B. Namen und Adressen aus unstrukturiertem Text extrahieren
AI.GENERATE, wenn Sie eineoutput_schemaangebenAI.GENERATE_TABLE
Text generieren mit einer Tabellenwertfunktionsversion von
AI.GENERATEAI.GENERATE_TEXT
Einbettungen generieren für semantische Suche und Clustering
AI.EMBEDAI.GENERATE_EMBEDDINGAI.SIMILARITY
Verwaltete KI-Funktionen:Diese Funktionen haben eine optimierte Syntax und sind für Kosten und Qualität optimiert. BigQuery wählt ein Modell für Sie aus.
Daten mit Bedingungen in natürlicher Sprache filtern
AI.IF
Eingabe bewerten, z. B. nach Qualität oder Stimmung
AI.SCORE
Eingaben in benutzerdefinierte Kategorien einteilen
AI.CLASSIFY
KI-Funktionen mit allgemeinem Verwendungszweck
Mit KI-Funktionen für allgemeine Zwecke haben Sie die volle Kontrolle und Transparenz bei der Auswahl von Modell, Prompt und Parametern. Die Ausgabe enthält detaillierte Informationen zum Aufruf des Modells, einschließlich des Status und der vollständigen Modellantwort, die Informationen zur Sicherheitsbewertung oder zu Quellenangaben enthalten kann.
Strukturierte Daten generieren
Die Generierung strukturierter Daten ähnelt der Textgenerierung sehr, mit dem Unterschied, dass Sie die Antwort des Modells formatieren können, indem Sie ein SQL-Schema angeben. Sie können beispielsweise aus dem Transkript eines Telefonanrufs eine Tabelle mit dem Namen, der Telefonnummer, der Adresse, der Anfrage und dem Preisangebot eines Kunden erstellen.
Es gibt zwei Möglichkeiten, strukturierte Daten zu generieren:
Die
AI.GENERATE-Funktion ruft einen Vertex AI-Endpunkt auf und kann mit Ihrem benutzerdefinierten Schema einenSTRUCT-Wert generieren.Hier erfahren Sie, wie Sie strukturierte Ausgaben verwenden, wenn Sie die Funktion
AI.GENERATEaufrufen.Die Funktion
AI.GENERATE_TABLEruft ein Remote-Modell auf und ist eine Tabellenwertfunktion, die eine Tabelle mit Ihrem benutzerdefinierten Schema generiert.Informationen zum Erstellen strukturierter Daten finden Sie unter Strukturierte Daten mit der Funktion
AI.GENERATE_TABLEgenerieren.
Werte eines bestimmten Typs zeilenweise generieren
Sie können skalare generative KI-Funktionen mit Gemini-Modellen verwenden, um Daten in BigQuery-Standardtabellen zu analysieren. Die Daten enthalten sowohl Textdaten als auch unstrukturierte Daten aus Spalten mit ObjectRef-Werten.
Für jede Zeile in der Tabelle wird mit diesen Funktionen eine Ausgabe mit einem bestimmten Typ generiert. Sie können beispielsweise Bilder von Einrichtungsgegenständen analysieren, um Text für eine design_type-Spalte zu generieren. So erhält die SKU des Einrichtungsgegenstands eine zugehörige Beschreibung wie mid-century modern oder farmhouse.
Die folgenden KI-Funktionen sind verfügbar:
Wenn Sie die Funktion AI.GENERATE mit unterstützten Gemini-Modellen verwenden, können Sie bereitgestellten Durchsatz von Vertex AI verwenden, um einen gleichbleibend hohen Durchsatz für Anfragen zu erzielen. Weitere Informationen finden Sie unter Vertex AI Provisioned Throughput verwenden.
Text mit einer TVF generieren
Sie können generative KI-Aufgaben mit der tabellarischen Funktion GENERATE_TEXT ausführen. Dabei werden Remote-Modelle in BigQuery ML verwendet, um auf Modelle zu verweisen, die in Vertex AI bereitgestellt oder gehostet werden. Sie können die folgenden Arten von Remote-Modellen erstellen:
- Remote-Modelle für alle allgemein verfügbaren oder Vorschau-Gemini-Modelle.
Remote-Modelle über den folgenden Partnermodellen:
Nachdem Sie ein Remote-Modell erstellt haben, können Sie über die Funktion AI.GENERATE_TEXT mit diesem Modell interagieren.
Für Remote-Modelle, die auf Gemini-Modellen basieren, haben Sie folgende Möglichkeiten:
Mit der Funktion
AI.GENERATE_TEXTkönnen Sie Text aus einem Prompt generieren, den Sie in einer Abfrage angeben oder aus einer Spalte in einer Standardtabelle abrufen. Wenn Sie den Prompt in einer Abfrage angeben, können Sie im Prompt auf die folgenden Arten von Tabellenspalten verweisen:STRINGSpalten für Textdaten.STRUCT-Spalten, in denen unstrukturierte Daten imObjectRef-Format angegeben werden. Sie müssen dieOBJ.GET_ACCESS_URL-Funktion im Prompt verwenden, um dieObjectRef-Werte inObjectRefRuntime-Werte zu konvertieren.
Mit der Funktion
AI.GENERATE_TEXTkönnen Sie Text-, Bild-, Audio-, Video- oder PDF-Inhalte aus einer Objekttabelle mit einem Prompt analysieren, den Sie als Funktionsargument angeben.
Bei allen anderen Arten von Remote-Modellen können Sie die
AI.GENERATE_TEXT-Funktion mit einem Prompt verwenden, den Sie in einer Abfrage oder aus einer Spalte in einer Standardtabelle angeben.
In den folgenden Themen können Sie die Textgenerierung in BigQuery ML ausprobieren:
- Text über ein Gemini-Modell und die Funktion
AI.GENERATE_TEXTgenerieren - Text mit einem Gemma-Modell und der Funktion
AI.GENERATE_TEXTgenerieren - Bilder mit einem Gemini-Modell analysieren
- Text mit der Funktion
AI.GENERATE_TEXTund Ihren Daten generieren - Modell mit Ihren Daten abstimmen
Sie können Fundierung und Sicherheitsattribute verwenden, wenn Sie Gemini-Modelle mit der Funktion AI.GENERATE_TEXT verwenden, wenn Sie eine Standardtabelle als Eingabe verwenden. Mit der Fundierung kann das Gemini-Modell beim Generieren einer Antwort zusätzliche Informationen aus dem Internet verwenden, um spezifischere und faktischere Antworten zu erstellen. Mit Sicherheitsattributen kann das Gemini-Modell die Antworten, die es zurückgibt, anhand der von Ihnen angegebenen Attribute filtern.
Bei einigen Modellen können Sie optional die überwachte Abstimmung konfigurieren. Damit können Sie das Modell mit Ihren eigenen Daten trainieren, um es besser an Ihren Anwendungsfall anzupassen. Alle Inferenzen treten in Vertex AI auf. Die Ergebnisse werden in BigQuery gespeichert.
Für unterstützte Gemini-Modelle können Sie bereitgestellten Durchsatz von Vertex AI verwenden, um einen gleichbleibend hohen Durchsatz für Anfragen zu erzielen. Weitere Informationen finden Sie unter Vertex AI Provisioned Throughput verwenden.
Einbettungen generieren
Eine Einbettung ist ein hochdimensionaler numerischer Vektor, der eine bestimmte Entität darstellt, z. B. einen Text oder eine Audiodatei. Durch das Generieren von Einbettungen können Sie die Semantik Ihrer Daten so erfassen, dass sie leichter zu analysieren und zu vergleichen sind.
Im Folgenden sind einige gängige Anwendungsfälle für die Generierung von Einbettungen aufgeführt:
- Mit Retrieval-Augmented Generation (RAG) werden Modellantworten auf Nutzeranfragen durch Verweisen auf zusätzliche Daten aus einer vertrauenswürdigen Quelle ergänzt. RAG bietet eine bessere faktische Richtigkeit und Konsistenz der Antworten und ermöglicht auch den Zugriff auf Daten, die neuer sind als die Trainingsdaten des Modells.
- Multimodale Suche durchführen Zum Beispiel, wenn Sie mit Texteingabe nach Bildern suchen.
- Semantische Suche nach ähnlichen Elementen für Empfehlungen, Ersetzungen und die Deduplizierung von Datensätzen.
- Einbettungen erstellen, die mit einem k-Means-Modell für das Clustering verwendet werden.
Weitere Informationen zum Generieren von Einbettungen und zur Verwendung von Einbettungen für diese Aufgaben finden Sie unter Einführung in Einbettungen und Vektorsuche.
Verwaltete KI-Funktionen
Verwaltete KI-Funktionen wurden speziell für die Automatisierung von Routineaufgaben wie Klassifizierung, Sortierung oder Filterung entwickelt. Diese Funktionen nutzen Gemini und müssen nicht angepasst werden. BigQuery verwendet Prompt Engineering und wählt das geeignete Modell und die entsprechenden Parameter für die jeweilige Aufgabe aus, um die Qualität und Konsistenz Ihrer Ergebnisse zu optimieren.
Jede Funktion gibt einen skalaren Wert zurück, z. B. BOOL, FLOAT64 oder STRING, und enthält keine zusätzlichen Statusinformationen aus dem Modell.
Die folgenden verwalteten KI-Funktionen sind verfügbar:
AI.IF: Text oder multimodale Daten filtern, z. B. in einerWHERE- oderJOIN-Klausel, basierend auf einem Prompt. Sie können beispielsweise Produktbeschreibungen nach Artikeln filtern, die sich gut als Geschenk eignen.AI.SCORE: Bewerten Sie Eingaben basierend auf einem Prompt, um Zeilen nach Qualität, Ähnlichkeit oder anderen Kriterien zu sortieren. Sie können diese Funktion in einerORDER BY-Klausel verwenden, um die K Elemente mit der höchsten Punktzahl zu extrahieren. So können Sie beispielsweise die zehn positivsten oder negativsten Nutzerrezensionen für ein Produkt finden.AI.CLASSIFY: Text in benutzerdefinierte Kategorien klassifizieren. Sie können diese Funktion in einerGROUP BY-Klausel verwenden, um Eingaben entsprechend den von Ihnen definierten Kategorien zu gruppieren. Sie können Supporttickets beispielsweise danach klassifizieren, ob sie sich auf die Abrechnung, den Versand, die Produktqualität oder etwas anderes beziehen.
Eine Anleitung mit Beispielen für die Verwendung dieser Funktionen finden Sie unter Semantische Analyse mit verwalteten KI-Funktionen durchführen.
Ein Notebook-Tutorial zur Verwendung von verwalteten und allgemeinen KI-Funktionen finden Sie unter Semantische Analyse mit KI-Funktionen.
Standorte
Die unterstützten Standorte für Textgenerierungs- und Einbettungsmodelle variieren je nach Modelltyp und ‑version. Weitere Informationen finden Sie unter Standorte.
Preise
Ihnen werden die Rechenressourcen in Rechnung gestellt, die Sie zum Ausführen von Anfragen für Modelle verwenden. Remote-Modelle rufen Vertex AI-Modelle auf. Daher fallen für Anfragen an Remote-Modelle auch Gebühren von Vertex AI an.
Weitere Informationen finden Sie unter BigQuery ML-Preise.
Kosten im Blick behalten
Die generativen KI-Funktionen in BigQuery funktionieren, indem Anfragen an Vertex AI gesendet werden, was Kosten verursachen kann. So verfolgen Sie die Vertex AI-Kosten, die durch einen Job anfallen, den Sie in BigQuery ausführen:
- Abrechnungsberichte in Cloud Billing ansehen
Verwenden Sie Filter, um die Ergebnisse einzugrenzen.
Wählen Sie für Dienste Vertex AI aus.
Wenn Sie die Gebühren für einen bestimmten Job sehen möchten, filtern Sie nach Label.
Legen Sie den Schlüssel auf
bigquery_job_id_prefixund den Wert auf die Job-ID Ihres Jobs fest. Wenn Ihre Job-ID länger als 63 Zeichen ist, verwenden Sie nur die ersten 63 Zeichen. Wenn Ihre Job-ID Großbuchstaben enthält, ändern Sie sie in Kleinbuchstaben. Alternativ können Sie Jobs mit einem benutzerdefinierten Label verknüpfen, um sie später leichter zu finden.
Es kann bis zu 24 Stunden dauern, bis einige Gebühren in Cloud Billing angezeigt werden.
Nächste Schritte
- Eine Einführung in KI und ML in BigQuery finden Sie unter Einführung in KI und ML in BigQuery.
- Weitere Informationen zum Ausführen von Inferenzen für Modelle von maschinellem Lernen finden Sie unter Modellinferenz – Übersicht.
- Weitere Informationen zu den unterstützten SQL-Anweisungen und -Funktionen für generative KI-Modelle finden Sie unter End-to-End-Nutzerpfade für generative KI-Modelle.