テキストエンベディングを生成する

google_ml_integration 拡張機能には、public と google_ml の 2 つの異なる Namespace にエンベディング関数が含まれています。このページでは、これらの Namespace の関数を使用してテキストエンベディングを生成する方法について説明します。

public スキーマの embedding() 関数は、エンドポイントを登録せずに任意の Vertex AI エンベディングモデルで使用できます。タスクタイプなどのカスタム情報を渡す場合は、エンドポイントを登録してから、google_ml スキーマで google_ml.embedding() 関数を使用します。エンドポイントの登録の詳細については、モデルを登録するをご覧ください。

エンベディングの仕組み

AlloyDB で次の特長を満たすデータベースを実行します。

データベースに items というテーブルが存在する。このテーブルの各行には、販売する商品が記録されています。
items テーブルに complaints という列がある。この TEXT 列には、各商品について記録された購入者からの苦情が保存されます。
データベースが Vertex AI Model Garden と統合され、gemini-embedding-001 の英語モデルにアクセスできる。

このデータベースには商品に関する苦情が記録されていますが、苦情は書式なしテキストとして保存されているため、クエリで照会するのは容易ではありません。たとえば、色違いの商品を受け取った顧客からの苦情が最も多い商品を確認したい場合は、テーブルに対して通常の SQL クエリを実行し、さまざまなキーワードで照合を行います。ただし、この方法では、指定したキーワードが含まれている行のみが一致します。

たとえば、SELECT * FROM item WHERE complaints LIKE "%wrong color%" などの基本的な SQL クエリでは、complaints フィールドに The picture shows a blue one, but the one I received was red のみが含まれる行は返されません。

LLM ベースのエンベディングを使用する SQL クエリは、このようなクエリに対して意味的に類似したレスポンスを返すのに役立ちます。エンベディングを適用すると、この例のテーブルで、苦情が特定のテキストプロンプト（It was the wrong color など）と意味的に類似している項目をクエリできます。

注: Google Cloud コンソールで使用量と割り当てをモニタリングする際は、モデル名がドキュメントで使用されているものと異なる場合があるので注意してください。

text-embedding-005 モデルの場合、 Google Cloud コンソールの base_model ディメンションは textembedding-gecko です。

関連する割り当ては Regional online prediction requests per base model per minute per region per base_model です。
gemini-embedding-001 モデルの場合、base_model ディメンションは gemini-embedding です。

関連する割り当ては Embed content input tokens per minute per region per base_model と Regional online prediction requests per base model per minute per region per base_model です。

基本的なエンベディング生成には、次のいずれかのスキーマを選択します。

テキスト エンベディングを生成する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

エンベディングの仕組み

次のステップ

テキストエンベディングを生成する