发送反馈
生成文本嵌入
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
google_ml_integration 扩展程序包含两个不同命名空间(public 和 google_ml)中的嵌入函数。本页面介绍了如何使用这些命名空间中的函数生成文本嵌入。
public 架构中的 embedding() 函数可与任何 Vertex AI 嵌入模型搭配使用,而无需注册端点。如果您想传递任何自定义信息(例如任务类型),请注册端点,然后在 google_ml 架构中使用 google_ml.embedding() 函数。如需详细了解如何注册端点,请参阅注册模型 。
注意 :如需使用最新功能和模型(包括 Gemini 嵌入模型),您必须先运行 upgrade_to_preview_version 过程来安装预览版功能:
CALL google_ml.upgrade_to_preview_version();
嵌入工作原理
假设某个数据库在 AlloyDB 上运行,具有以下特点:
该数据库包含一个表:items。此表中的每一行描述了您的企业销售的商品。
items 表包含一列:complaints。此 TEXT 列会存储针对每件商品记录的买家投诉。
该数据库与 Vertex AI Model Garden 集成,因而可访问 gemini-embedding-001 英语模型。
尽管此数据库存储了与商品相关的投诉,但这些投诉以纯文本形式存储,因此很难进行查询。例如,如需查看哪些商品因为客户收到错误的商品颜色而受到最多投诉,则可以对表执行普通 SQL 查询,查找各种关键字匹配项。但是,此方法仅匹配包含这些精确关键字的行。
例如,SELECT * FROM item WHERE complaints LIKE
"%wrong color%" 等基本 SQL 查询不会返回 complaints 字段仅包含 The picture shows a blue one, but the one I received was red 的行。
使用 LLM 支持的嵌入的 SQL 查询可以帮助针对此类查询返回语义上相似的回答。通过应用嵌入,您可以在此示例的表中查询其投诉与给定文本提示(例如 It was the
wrong color)具有语义相似度的商品。
注意: 在 Google Cloud 控制台中监控用量和配额时,请注意模型名称可能与文档中使用的名称不同。
对于 text-embedding-005 模型, Google Cloud 控制台中的 base_model 维度为 textembedding-gecko。
相关配额为 Regional online prediction requests per base model per minute per region per base_model。
对于 gemini-embedding-001 模型,base_model 维度为 gemini-embedding。
相关配额为 Embed content input tokens per minute per region per base_model 和 Regional online prediction requests per base model per minute per region per base_model。
如需生成基本嵌入,请选择以下架构之一。
google_ml 架构
公共架构
后续步骤
发送反馈
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可 获得了许可,并且代码示例已根据 Apache 2.0 许可 获得了许可。有关详情,请参阅 Google 开发者网站政策 。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-12-03。
需要向我们提供更多信息?
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-12-03。"],[],[]]