Auf dieser Seite wird AlloyDB Omni-Version 15.5.5 mit der Kubernetes-Bereitstellungsoption dokumentiert. Wählen Sie eine andere Bereitstellungsoption aus.

Remote-KI-Modelle in AlloyDB Omni registrieren und aufrufen

Wählen Sie eine Dokumentationsversion aus:

Auf dieser Seite wird eine Vorschau beschrieben, mit der Sie das Registrieren eines KI-Modellendpunkts und das Aufrufen von Vorhersagen mit der Modellendpunktverwaltung in AlloyDB Omni testen können. Informationen zur Verwendung von KI-Modellen in Produktionsumgebungen finden Sie unter Generative KI-Anwendungen mit AlloyDB AI erstellen und Mit Vektoreinbettungen arbeiten.

Informationen zum Registrieren von Remote-Modellendpunkten mit AlloyDB finden Sie unter Remote-KI-Modelle in AlloyDB registrieren und aufrufen.

Übersicht

Mit der Verwaltung von Modellendpunkten können Sie einen Modellendpunkt registrieren, Metadaten für Modellendpunkte in Ihrem Datenbankcluster verwalten und dann mit den Modellen über SQL-Abfragen interagieren. Sie bietet die Erweiterung google_ml_integration, die Funktionen zum Hinzufügen und Registrieren der Modellendpunkt-Metadaten für die Modelle enthält. Anschließend können Sie die Modelle verwenden, um Vektoreinbettungen zu generieren oder Vorhersagen aufzurufen.

Einige Beispiele für Modelltypen, die Sie mit der Modellendpunktverwaltung registrieren können:

Vertex AI-Modelle zur Texteinbettung
Embedding-Modelle von Drittanbietern wie Anthropic, Hugging Face oder OpenAI.
Benutzerdefinierte Texteinbettungsmodelle
Allgemeine Modelle mit einer JSON-basierten API, z. B. das auf Hugging Face gehostete Modell facebook/bart-large-mnli oder das Modell gemini-pro aus Vertex AI Model Garden

Funktionsweise

Mit der Modellendpunktverwaltung können Sie einen Modellendpunkt registrieren, der den folgenden Anforderungen entspricht:

Die Modell-Ein- und -Ausgabe unterstützt das JSON-Format.
Das Modell kann über das REST-Protokoll aufgerufen werden.

Wenn Sie einen Modellendpunkt bei der Modellendpunktverwaltung registrieren, wird jeder Endpunkt mit einer eindeutigen Modell-ID registriert, die Sie als Referenz für das Modell angegeben haben. Sie können diese Modell-ID verwenden, um Modelle abzufragen:

Einbettungen generieren, um Text-Prompts in numerische Vektoren zu übersetzen Sie können generierte Einbettungen als Vektordaten speichern, wenn die pgvector-Erweiterung in der Datenbank aktiviert ist. Weitere Informationen finden Sie unter Einbettungen mit pgvector abfragen und indexieren.
Vorhersagen aufrufen, um ein Modell mithilfe von SQL innerhalb einer Transaktion aufzurufen.

Ihre Anwendungen können über die Erweiterung google_ml_integration auf die Verwaltung von Modellendpunkten zugreifen. Diese Erweiterung bietet die folgenden Funktionen:

Die SQL-Funktion google_ml.create_model(), mit der der Modellendpunkt registriert wird, der in der Vorhersage- oder Einbettungsfunktion verwendet wird.
Die SQL-Funktion google_ml.create_sm_secret(), die Secrets im Secret Manager Google Cloudverwendet, in dem die API-Schlüssel gespeichert sind.
Die SQL-Funktion google_ml.embedding(), eine Vorhersagefunktion, die Texteinbettungen generiert.
Die SQL-Funktion google_ml.predict_row(), mit der Vorhersagen generiert werden, wenn Sie generische Modelle aufrufen, die das JSON-Ein- und -Ausgabeformat unterstützen.
Andere Hilfsfunktionen, die das Generieren benutzerdefinierter URLs, das Generieren von HTTP-Headern oder das Übergeben von Transformationsfunktionen für Ihre generischen Modelle übernehmen.
Funktionen zum Verwalten der registrierten Modellendpunkte und Secrets.

Wichtige Konzepte

Bevor Sie mit der Verwaltung von Modellendpunkten beginnen, sollten Sie die Konzepte kennen, die für die Verbindung zu den Modellen und deren Verwendung erforderlich sind.

Modellanbieter

Unter Modellanbieter sind die unterstützten Anbieter für das Modell-Hosting aufgeführt. In der folgenden Tabelle sehen Sie den Wert für den Modellanbieter, den Sie basierend auf dem von Ihnen verwendeten Modellanbieter festlegen müssen:

Modellanbieter	In Funktion festgelegt als…
Vertex AI	`google`
Hugging Face-Modelle	`custom`
Anthropic-Modelle	`custom`
Andere Modelle	`custom`
OpenAI	`open_ai`

Der Standardanbieter für Modelle ist custom.

Die unterstützte Authentifizierungsmethode hängt vom Anbietertyp ab. Die Vertex AI-Modelle verwenden das AlloyDB-Dienstkonto zur Authentifizierung, während andere Anbieter Secret Manager zur Authentifizierung verwenden können. Weitere Informationen finden Sie unter Authentifizierung einrichten.

Modelltyp

Modelltyp gibt den Typ des KI-Modells an. Die Erweiterung unterstützt Texteinbettung sowie alle generischen Modelltypen. Die unterstützten Modelltypen, die Sie beim Registrieren eines Modellendpunkts festlegen können, sind text-embedding und generic. Das Festlegen des Modelltyps ist optional, wenn allgemeine Modellendpunkte registriert werden, da generic der Standardmodelltyp ist.

Texteinbettungsmodelle mit integrierter Unterstützung: Die Modellendpunktverwaltung bietet integrierte Unterstützung für alle Versionen des Modells textembedding-gecko von Vertex AI und des Modells text-embedding-ada-002 von OpenAI. Verwenden Sie die Funktion google_ml.create_model(), um diese Modellendpunkte zu registrieren. AlloyDB richtet automatisch Standardtransformationsfunktionen für diese Modelle ein.; Der Modelltyp für diese Modelle ist text-embedding.
Andere Modelle zur Texteinbettung: Für andere Modelle zur Texteinbettung müssen Sie Transformationsfunktionen erstellen, um die vom Modell unterstützten Ein- und Ausgabeformate zu verarbeiten. Optional können Sie die HTTP-Header-Generierungsfunktion verwenden, mit der benutzerdefinierte Header generiert werden, die für Ihr Modell erforderlich sind.; Der Modelltyp für diese Modelle ist text-embedding.
Allgemeine Modelle: Die Modellendpunktverwaltung unterstützt auch die Registrierung aller anderen Modelltypen außer Modelle für Texteinbettungen. Verwenden Sie die Funktion google_ml.predict_row(), um Vorhersagen für generische Modelle aufzurufen. Sie können Metadaten für Modellendpunkte festlegen, z. B. einen Anfrageendpunkt und HTTP-Header, die für Ihr Modell spezifisch sind.; Sie können keine Transformationsfunktionen übergeben, wenn Sie einen generischen Modellendpunkt registrieren. Achten Sie darauf, dass die Eingabe für die Funktion im JSON-Format vorliegt, wenn Sie Vorhersagen aufrufen, und dass Sie die JSON-Ausgabe parsen, um die endgültige Ausgabe zu erhalten.; Der Modelltyp für diese Modelle ist generic.

Authentifizierung

Auth types (Authentifizierungstypen) gibt den Authentifizierungstyp an, den Sie verwenden können, um mit der google_ml_integration-Erweiterung eine Verbindung zur Modellendpunktverwaltung herzustellen. Die Authentifizierung ist optional und nur erforderlich, wenn Sie sich authentifizieren müssen, um auf Ihr Modell zuzugreifen.

Bei Vertex AI-Modellen wird das AlloyDB-Dienstkonto zur Authentifizierung verwendet. Für andere Modelle kann ein API-Schlüssel oder Inhabertoken, das als Secret in Secret Manager gespeichert ist, mit der SQL-Funktion google_ml.create_sm_secret() verwendet werden.

In der folgenden Tabelle sind die Authentifizierungstypen aufgeführt, die Sie festlegen können:

Authentifizierungsmethode	In Funktion festgelegt als…	Modellanbieter
AlloyDB-Dienst-Agent	`alloydb_service_agent_iam`	Vertex AI-Anbieter
Secret Manager	`secret_manager`	Drittanbieter wie Anthropic, Hugging Face oder OpenAI

Vorhersagefunktionen

Die google_ml_integration-Erweiterung enthält die folgenden Vorhersagefunktionen:

google_ml.embedding(): Wird verwendet, um einen registrierten Modellendpunkt zur Texteinbettung aufzurufen und Einbettungen zu generieren. Sie bietet integrierte Unterstützung für das Modell textembedding-gecko von Vertex AI und das Modell text-embedding-ada-002 von OpenAI.; Bei Texteinbettungsmodellen ohne integrierte Unterstützung sind die Ein- und Ausgabeparameter für ein Modell eindeutig und müssen transformiert werden, damit die Funktion das Modell aufrufen kann. Erstellen Sie eine Funktion zum Transformieren der Eingabe, um die Eingabe der Vorhersagefunktion in die modellspezifische Eingabe zu transformieren, und eine Funktion zum Transformieren der Ausgabe, um die modellspezifische Ausgabe in die Ausgabe der Vorhersagefunktion zu transformieren.
google_ml.predict_row(): Wird verwendet, um einen registrierten generischen Modellendpunkt aufzurufen, sofern dieser eine JSON-basierte API unterstützt, um Vorhersagen zu generieren.

Transformationsfunktionen

Transformationsfunktionen ändern die Eingabe in ein Format, das das Modell versteht, und wandeln die Modellantwort in das Format um, das die Vorhersagefunktion erwartet. Die Transformationsfunktionen werden verwendet, wenn der Modellendpunkt text-embedding ohne integrierte Unterstützung registriert wird. Die Signatur der Transformationsfunktionen hängt von der Vorhersagefunktion für den Modelltyp ab.

Sie können keine Transformationsfunktionen verwenden, wenn Sie einen generic-Modellendpunkt registrieren.

Unten sehen Sie die Signaturen für die Vorhersagefunktion für Modelle zur Texteinbettung:

// define custom model specific input/output transform functions.
CREATE OR REPLACE FUNCTION input_transform_function(model_id VARCHAR(100), input_text TEXT) RETURNS JSON;

CREATE OR REPLACE FUNCTION output_transform_function(model_id VARCHAR(100), response_json JSON) RETURNS real[];

Weitere Informationen zum Erstellen von Transformationsfunktionen finden Sie unter Beispiel für Transformationsfunktionen.

Funktion zum Generieren von HTTP-Headern

Die Funktion zum Generieren von HTTP-Headern generiert die Ausgabe in JSON-Schlüssel/Wert-Paaren, die als HTTP-Header verwendet werden. Die Signatur der Vorhersagefunktion definiert die Signaturen der Funktion zum Generieren von Headern.

Das folgende Beispiel zeigt die Signatur für die Vorhersagefunktion google_ml.embedding().

CREATE OR REPLACE FUNCTION generate_headers(model_id VARCHAR(100), input TEXT) RETURNS JSON;

Für die Vorhersagefunktion google_ml.predict_row() lautet die Signatur so:

CREATE OR REPLACE FUNCTION generate_headers(model_id VARCHAR(100), input JSON) RETURNS JSON;

Weitere Informationen zum Erstellen einer Funktion zum Generieren von Headern finden Sie unter Beispiel für eine Funktion zum Generieren von Headern.