예측 호출

이 페이지에서는 publicgoogle_ml 네임스페이스의 함수를 사용하여 예측을 호출하는 방법을 설명합니다. google_ml_integration 확장 프로그램에는 이러한 네임스페이스의 예측 함수가 포함되어 있습니다.

엔드포인트를 등록하지 않고 Vertex AI에서 호스팅되는 일반 모델과 함께 public 스키마의 ml_predict_row() 함수를 사용할 수 있습니다. google_ml 스키마의 google_ml.predict_row() 함수는 모델 엔드포인트 관리에 등록된 모든 모델과 함께 사용할 수 있습니다.

예측을 호출하려면 다음 스키마 중 하나를 선택합니다.

시작하기 전에

AlloyDB가 예측을 호출하도록 하려면 다음을 수행하세요.

온라인 예측 호출

ml_predict_row() SQL 함수를 사용하여 데이터에 대해 온라인 예측을 호출합니다.

이 함수의 초기 인수 형식은 사용하려는 ML 모델이 Vertex AI Model Garden에 있는지 또는 Google Cloud 프로젝트에서 실행되는 엔드포인트인지 여부에 따라 달라집니다.

Vertex AI Model Garden에서 모델 사용

Vertex AI Model Garden에서 실행되는 ML 모델을 사용하여 온라인 예측을 호출하려면 google_ml.predict_row() SQL 함수의 다음 구문을 사용합니다.

SELECT ml_predict_row('projects/PROJECT_ID/locations/REGION_ID/publishers/google/models/MODEL_ID', '{ CONTENTS }');

다음을 바꿉니다.

  • PROJECT_ID: Google Cloud 프로젝트 ID입니다.

  • REGION_ID: 모델이 있는 Google Cloud 리전의 ID입니다(예: Gemini Pro의 경우 us-central1).

  • MODEL_ID: 사용할 ML 모델의 ID입니다(예: Gemini Pro).

  • CONTENTS: 예측 호출에 대한 입력입니다(JSON 형식).

ML 모델이 AlloyDB 클러스터와 동일한 프로젝트와 리전에 저장된 경우 이 함수의 첫 번째 인수를 다음과 같이 약식으로 지정할 수 있습니다.

SELECT ml_predict_row('publishers/google/models/MODEL_ID', '{ CONTENTS }');

모델의 JSON 응답 메시지에 대한 자세한 내용은 생성형 AI 파운데이션 모델 참조를 확인하세요.

예시를 보려면 호출 예시를 참조하세요.

Vertex AI 모델 엔드포인트 사용

Vertex AI 모델 엔드포인트를 사용하여 온라인 예측을 호출하려면 ml_predict_row() SQL 함수의 다음 구문을 사용합니다.

SELECT ml_predict_row('projects/PROJECT_ID/locations/REGION_ID/endpoints/ENDPOINT_ID', '{ CONTENTS }');

다음을 바꿉니다.

  • PROJECT_ID: 모델이 있는 Google Cloud 프로젝트의 ID입니다.

  • REGION_ID: 모델이 있는 Google Cloud 리전의 ID(예: us-central1)

  • ENDPOINT_ID: 모델 엔드포인트의 ID

  • CONTENTS: 예측 호출에 대한 입력입니다(JSON 형식).

엔드포인트가 AlloyDB 클러스터와 동일한 프로젝트와 리전에 있는 경우 이 함수의 첫 번째 인수를 다음과 같이 약식으로 지정할 수 있습니다.

SELECT ml_predict_row('endpoints/ENDPOINT_ID', '{ CONTENTS }');

모델의 JSON 응답 메시지에 대한 자세한 내용은 PredictResponse를 참조하세요.

호출 예시

다음 예시에서는 Model Garden에서 제공되는 Gemini Pro를 사용하여 ml_predict_row()에 대한 리터럴 인수로 제공되는 짧은 프롬프트를 기반으로 텍스트를 생성합니다.

SELECT
  json_array_elements(ml_predict_row('publishers/google/models/gemini-1.5-pro:streamGenerateContent',
      '{ "contents": [ { "role": "user", "parts": [ { "text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find all supplier names which are located in the India nation."
} ] } ] }'))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text';

응답은 JSON 객체입니다. 객체 형식에 대한 자세한 내용은 응답 본문을 참조하세요.

다음 예시에서는 다음 방법으로 이전 항목을 수정합니다.

  • 이 예시에서는 현재 데이터베이스의 messages.message 열 콘텐츠를 입력으로 사용합니다.

  • 이 예시에서는 함수 파라미터 형식을 지정하는 보조 도구로 json_build_object() 함수를 사용하는 방법을 보여줍니다.


select ml_predict_row('projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-1.5-pro:generateContent', json_build_object('contents', json_build_object('text', message))) from messages;

이제 반환된 JSON 객체에는 messages 테이블에 있는 행마다 predictions 배열의 항목 하나가 포함됩니다.

응답이 JSON 객체이기 때문에 PostgreSQL 화살표 연산자를 사용해서 특정 필드를 가져올 수 있습니다.

select ml_predict_row('projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-1.5-pro:generateContent', json_build_object('contents', json_build_object('text', message)))->'predictions'->0->'content' FROM messages;

ml_predict_row()에 대한 인수 예시는 Vertex AI API를 사용한 빠른 시작을 참조하세요.

다음 단계