예측 호출

이 페이지에서는 public 및 google_ml 네임스페이스의 함수를 사용하여 예측을 호출하는 방법을 설명합니다. google_ml_integration 확장 프로그램에는 이러한 네임스페이스의 예측 함수가 포함되어 있습니다.

엔드포인트를 등록하지 않고 Vertex AI에서 호스팅되는 일반 모델과 함께 public 스키마의 ml_predict_row() 함수를 사용할 수 있습니다. google_ml 스키마의 google_ml.predict_row() 함수는 모델 엔드포인트 관리에 등록된 모든 모델과 함께 사용할 수 있습니다.

예측을 호출하려면 다음 스키마 중 하나를 선택합니다.

시작하기 전에

AlloyDB가 예측을 호출하도록 하려면 다음을 수행하세요.

Vertex AI의 생성형 AI를 사용할 수 있는 리전에서 예측을 호출할 수 있습니다. 리전 목록은 Vertex AI의 생성형 AI 위치를 참조하세요.
psql 또는 PostgreSQL용 AlloyDB Studio를 사용하여 데이터베이스에 연결합니다.
google_ml_integration 확장 프로그램이 설치되어 있는지 확인합니다.
google_ml_integration.enable_model_support 플래그가 on으로 설정되어 있는지 확인합니다.
AlloyDB 데이터베이스에서 예측을 호출하려면 먼저 Vertex AI과 함께 작동하도록 AlloyDB를 구성해야 합니다. 자세한 내용은 Vertex AI와 데이터베이스 통합을 참고하세요.
액세스할 수 있는 Identity and Access Management(IAM) 권한이 있는 활성 엔드포인트가 포함된 활성 Vertex AI 모델이 있어야 합니다. AlloyDB는 온라인 예측 수행을 위해 비공개 엔드포인트를 지원하지 않습니다.
데이터베이스 사용자에게 예측 함수를 실행하여 예측을 호출할 수 있는 권한을 부여합니다.
```
\c DB_NAME;
GRANT EXECUTE ON FUNCTION ml_predict_row TO USER_NAME;
```
다음을 바꿉니다.
- DB_NAME: 권한을 부여해야 하는 데이터베이스의 이름
- USER_NAME: 권한을 부여해야 하는 사용자의 이름

온라인 예측 호출

ml_predict_row() SQL 함수를 사용하여 데이터에 대해 온라인 예측을 호출합니다.

이 함수의 초기 인수 형식은 사용하려는 ML 모델이 Vertex AI Model Garden에 있는지 또는 Google Cloud 프로젝트에서 실행되는 엔드포인트인지 여부에 따라 달라집니다.

Vertex AI Model Garden에서 모델 사용

Vertex AI Model Garden에서 실행되는 ML 모델을 사용하여 온라인 예측을 호출하려면 google_ml.predict_row() SQL 함수의 다음 구문을 사용합니다.

SELECT ml_predict_row('projects/PROJECT_ID/locations/REGION_ID/publishers/google/models/MODEL_ID', '{ CONTENTS }');

다음을 바꿉니다.

PROJECT_ID: Google Cloud 프로젝트 ID입니다.
REGION_ID: 모델이 있는 Google Cloud 리전의 ID입니다(예: Gemini Pro의 경우 us-central1).
MODEL_ID: 사용할 ML 모델의 ID입니다(예: Gemini Pro).
CONTENTS: 예측 호출에 대한 입력입니다(JSON 형식).

ML 모델이 AlloyDB 클러스터와 동일한 프로젝트와 리전에 저장된 경우 이 함수의 첫 번째 인수를 다음과 같이 약식으로 지정할 수 있습니다.

SELECT ml_predict_row('publishers/google/models/MODEL_ID', '{ CONTENTS }');

모델의 JSON 응답 메시지에 대한 자세한 내용은 생성형 AI 파운데이션 모델 참조를 확인하세요.

예시를 보려면 호출 예시를 참조하세요.

Vertex AI 모델 엔드포인트 사용

Vertex AI 모델 엔드포인트를 사용하여 온라인 예측을 호출하려면 ml_predict_row() SQL 함수의 다음 구문을 사용합니다.

SELECT ml_predict_row('projects/PROJECT_ID/locations/REGION_ID/endpoints/ENDPOINT_ID', '{ CONTENTS }');

다음을 바꿉니다.

PROJECT_ID: 모델이 있는 Google Cloud 프로젝트의 ID입니다.
REGION_ID: 모델이 있는 Google Cloud 리전의 ID(예: us-central1)
ENDPOINT_ID: 모델 엔드포인트의 ID
CONTENTS: 예측 호출에 대한 입력입니다(JSON 형식).

엔드포인트가 AlloyDB 클러스터와 동일한 프로젝트와 리전에 있는 경우 이 함수의 첫 번째 인수를 다음과 같이 약식으로 지정할 수 있습니다.

SELECT ml_predict_row('endpoints/ENDPOINT_ID', '{ CONTENTS }');

모델의 JSON 응답 메시지에 대한 자세한 내용은 PredictResponse를 참조하세요.

호출 예시

다음 예시에서는 Model Garden에서 제공되는 Gemini Pro를 사용하여 ml_predict_row()에 대한 리터럴 인수로 제공되는 짧은 프롬프트를 기반으로 텍스트를 생성합니다.

SELECT
  json_array_elements(ml_predict_row('publishers/google/models/gemini-1.5-pro:streamGenerateContent',
      '{ "contents": [ { "role": "user", "parts": [ { "text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find all supplier names which are located in the India nation."
} ] } ] }'))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text';

응답은 JSON 객체입니다. 객체 형식에 대한 자세한 내용은 응답 본문을 참조하세요.

다음 예시에서는 다음 방법으로 이전 항목을 수정합니다.

이 예시에서는 현재 데이터베이스의 messages.message 열 콘텐츠를 입력으로 사용합니다.
이 예시에서는 함수 파라미터 형식을 지정하는 보조 도구로 json_build_object() 함수를 사용하는 방법을 보여줍니다.


select ml_predict_row('projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-1.5-pro:generateContent', json_build_object('contents', json_build_object('text', message))) from messages;

이제 반환된 JSON 객체에는 messages 테이블에 있는 행마다 predictions 배열의 항목 하나가 포함됩니다.

응답이 JSON 객체이기 때문에 PostgreSQL 화살표 연산자를 사용해서 특정 필드를 가져올 수 있습니다.

select ml_predict_row('projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-1.5-pro:generateContent', json_build_object('contents', json_build_object('text', message)))->'predictions'->0->'content' FROM messages;

ml_predict_row()에 대한 인수 예시는 Vertex AI API를 사용한 빠른 시작을 참조하세요.

다음 단계

AlloyDB, pgvector, 모델 엔드포인트 관리로 스마트 쇼핑 어시스턴트를 빌드하는 방법 알아보기