Gere incorporações de texto

A extensão google_ml_integration inclui funções de incorporação em dois espaços de nomes diferentes: public e google_ml. Esta página descreve como gerar incorporações de texto através de funções destes espaços de nomes.

A função embedding() no esquema public pode ser usada com qualquer modelo de incorporação do Vertex AI sem registar o ponto final. Se quiser transmitir informações personalizadas, como o tipo de tarefa, registe o ponto final e, em seguida, use a função google_ml.embedding() no esquema google_ml. Para mais informações sobre o registo de um ponto final, consulte o artigo Registe um modelo.

Como funcionam as incorporações

Imagine uma base de dados em execução no AlloyDB com as seguintes caraterísticas:

  • A base de dados contém uma tabela, items. Cada linha nesta tabela descreve um item que a sua empresa vende.

  • A tabela items contém uma coluna, complaints. Esta coluna TEXT armazena as queixas dos compradores registadas sobre cada artigo.

  • A base de dados integra-se com o Model Garden do Vertex AI, o que lhe dá acesso aos modelos gemini-embedding-001em inglês.

Apesar de esta base de dados armazenar queixas sobre artigos, estas queixas são armazenadas como texto simples, o que dificulta a consulta. Por exemplo, para ver que artigos têm mais reclamações de clientes que receberam a cor errada da mercadoria, pode executar consultas SQL normais na tabela que procuram várias correspondências de palavras-chave. No entanto, esta abordagem só corresponde a linhas que contenham essas palavras-chave exatas.

Por exemplo, uma consulta SQL básica, como SELECT * FROM item WHERE complaints LIKE "%wrong color%", não devolve uma linha cujo campo complaints contenha apenas The picture shows a blue one, but the one I received was red.

As consultas SQL que usam incorporações com tecnologia de GML podem ajudar a devolver respostas semanticamente semelhantes para essas consultas. Ao aplicar incorporações, pode consultar a tabela neste exemplo para itens cujas reclamações tenham semelhança semântica com um comando de texto específico, como It was the wrong color.

Para a geração de incorporações básicas, selecione um dos seguintes esquemas.

O que se segue?