エンドポイントの作成と管理

このページでは、Gemini on Google Distributed Cloud コネクテッド API エンドポイントを作成して管理する方法について説明します。

前提条件

このセクションでは、Gemini on GDC connected API エンドポイントをデプロイする前に完了する必要があるワンタイムの手順について説明します。ターンアップ マシンで手順を完了します。

このセクションの手順は、 Edge Container Zone Viewer ロールを持つ IT 管理者アカウントを使用して完了する必要があります。 このセクションの手順を完了したら、収集した情報( CA 証明書や DNS サーバーの IP アドレスなど)を、 Google Cloud エンドポイントをデプロイする プロジェクト管理者に提供します。デプロイについては、Gemini on GDC connected API エンドポイントのデプロイで説明されています。

ハードウェアのターンアップを完了する

このページの手順を完了する前に、次の操作を行う必要があります。

必要なロールを付与する

次の必要なロールを構成する必要があります。

ターゲットの Distributed Cloud コネクテッド ゾーンに関する情報を取得する

ターゲットの Distributed Cloud コネクテッド ゾーンの名前を取得するには、次の操作を行います。

  1. ターゲットの Google Cloud 組織 ID の名前を取得します。

    gcloud organizations list
    
  2. 組織内の Distributed Cloud コネクテッド ゾーンを一覧表示します。 Google Cloud

    gcloud alpha zone-management zones list \
       --organization ORGANIZATION_ID \
       --location REGION
    

    次のように置き換えます。

    • ORGANIZATION_ID: ターゲットの Google Cloud 組織の ID。
    • REGION: ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン。一般提供前のプレビュー期間中は、us-west2 リージョンのみがサポートされます。
  3. ターゲット ゾーンの詳細情報を取得します。

    gcloud alpha zone-management zones describe ZONE \
       --organization ORGANIZATION_ID \
       --location REGION
    

    次のように置き換えます。

    • ZONE: ターゲットの Distributed Cloud コネクテッド ゾーン。
    • ORGANIZATION_ID: ターゲットの Google Cloud 組織の ID。
    • REGION: ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン。一般提供前のプレビュー期間中は、us-west2 リージョンのみがサポートされます。

Distributed Cloud コネクテッド ゾーン内の認定マシンに関する情報を取得する

Distributed Cloud コネクテッド ゾーン内のターゲット認定マシンの名前を取得するには、次の操作を行います。

  1. ゾーン内のマシンを一覧表示するの説明に従って、ターゲットの Distributed Cloud コネクテッド ゾーン内の Distributed Cloud コネクテッド マシンを一覧表示します。

  2. マシンの情報を取得する の説明に従って、ターゲット マシンの詳細情報を取得します。

ローカル AI Platform API と Vertex AI API サービスを有効にする

このセクションの手順を完了するには、 Edge Container Zonal Project Admin ロール を持つ IT 管理者アカウントを使用します。

  1. ターゲットの Distributed Cloud コネクテッド ゾーンでターゲット Google Cloud プロジェクトを有効にします。

    gcloud alpha zone-management projects enable PROJECT_ID \
       --organization ORGANIZATION_ID \
       --location REGION \
       --zone ZONE
    

    次のように置き換えます。

    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • ORGANIZATION_ID: ターゲットの Google Cloud 組織の ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • ZONE: ターゲットの Distributed Cloud コネクテッド ゾーン。
  2. ターゲット Google Cloud プロジェクトで AI Platform サービスを有効にします。

    gcloud services enable aiplatform.googleapis.com --project PROJECT_ID
    

    PROJECT_ID をターゲット Google Cloud プロジェクトの ID に置き換えます。

  3. Distributed Cloud コネクテッド ゾーンで Vertex AI API サービスを有効にします。

    gcloud alpha zone-management services enable vertex --project PROJECT_ID \
       --location REGION \
       --zone ZONE
    

    次のように置き換えます。

    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • ZONE: ターゲットの Distributed Cloud コネクテッド ゾーン。

DNS の解決のエンドポイントを構成する

  1. ターゲットの Distributed Cloud コネクテッド ゾーンのマネージド DNS アドレス、トップレベル ドメイン(TLD)、認証局(CA)証明書を取得します。

    gcloud alpha zone-management zones describe ZONE \
      --organization ORGANIZATION_ID \
      --location REGION \
      --format="value(certificateAuthorities)" \
      > CA_CERTIFICATE_FILE
    

    次のように置き換えます。

    • ORGANIZATION_ID: ターゲットの Google Cloud 組織の ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • ZONE: ターゲットの Distributed Cloud コネクテッド ゾーン。
    • CA_CERTIFICATE_FILE: コマンドによって出力された証明書ペイロードが保存されるファイル。このファイルは、後でサービス アカウント キーを生成するために使用します。

    コマンドは、次のような出力がファイルに保存されます。

    -----BEGIN CERTIFICATE-----
    MIIDATCCAemgAwIBAgIRAOsIG15loHwPBpjQe9FZYUAwDQYJKoZIhvcNAQELBQAw
    GjEYMBYGA1UEAxMPZ2RjZS1jbHVzdGVyLWNhMB4XDTI1MDcyOTEyMTAwNloXDTQ5
    MDcyMzEyMTAwNlowGjEYMBYGA1UEAxMPZ2RjZS1jbHVzdGVyLWNhMIIBIjANBgkq
    hkiG9w0BAQEFAAOCAQ8AMIIBCgKCAQEA3YdoASubyzHdgZ0vIU5g1dxdFRT1T4wc
    o9FaRXftSTDfiNVNKj/vC+De9EZokpyLZkdZNep6p0TLJAsPZYq+yiTCiaJ6Ihwy
    3LBn8j2PessSIte2LUhkft1yCQqfkgpYfKcjM3IauIXETS961m0uJb4sntgLJ4nM
    Scb5vpW1f70D1V27bqnEsE7+rbxzeFTosHC+DGBcLqIE0ptdionm/4xoltH7yv2O
    qKfcc/46TyPwGRzxifEdNzjKZ1kRdTThESfW+L7TQNv6VF5TC4FPksYX/ID/X7Fz
    G9BRey0mikvc4J7qQIeyMRlpIKqRh/1FCdRDC9vVEQipT2Ls0MwwTwIDAQABo0Iw
    QDAOBgNVHQ8BAf8EBAMCAYYwDwYDVR0TAQH/BAUwAwEB/zAdBgNVHQ4EFgQUmES2
    pyMLOnnsKug8amFmenOaTr8wDQYJKoZIhvcNAQELBQADggEBADn71zo7cNFZ0kQE
    C2lS6b0DLz4Nd1yCz5fGDvxzcTRdOT60wyq/TAx1YlYse33cGk/cQ7RkVsM56UX1
    T8RMvi09UcEQG3wFrYuU62ZjXF1a3RrOnHxyvVdyvbUYAO5gvzBQrj4tMZYX9kL3
    6H/9FwXuHVyqWAm0xpWvZfszwJjY4C1VxoDwmRiZPYzTrWI6/rY0QmORgcZXLnPL
    OVufbAX30aRGdTRnVXxE0fKmXwzbtbSHilU5hJT7EQWMvV5hJfyNqdXG0gbrhrsk
    sB0yRjk5PHQd9pOMcXcYIgfNnUEcQl4qeSll3g5cZ+cRrcTO1USFLRo8dcbQpJ6Y
    6ykzvKs=
    -----END CERTIFICATE-----
    createTime: '2025-08-25T20:46:50.269384028Z'
    dnsServers:
    - ipAddress: DNS_SERVER_ADDRESS
    tld: TOP_LEVEL_DOMAIN
    name: organizations/ORGANIZATION_ID/locations/REGION/zones/ZONE
    state: STATE_RUNNING
    
  2. 前の手順で取得した DNS サーバーの IP アドレスとトップレベル ドメイン(TLD)名を使用して、エンドポイントの DNS 構成を次のように作成します。このコマンドは、Gemini on GDC connected API 認定マシンと同じローカル ネットワーク上のマシンから実行する必要があります。

    mkdir /etc/systemd/resolved.conf.d
    echo '[Resolve]
    DNS=DNS_SERVER_ADDRESS
    Domains=~TOP_LEVEL_DOMAIN' > /etc/systemd/resolved.conf.d/dns.conf
    sudo systemctl restart systemd-resolved
    

    次のように置き換えます。

    • DNS_SERVER_ADDRESS: DNS サーバーの IP アドレス。
    • TOP_LEVEL_DOMAIN: エンドポイントのトップレベル ドメイン。

Gemini on GDC connected API エンドポイントをデプロイする

Gemini on GDC connected API エンドポイントをデプロイするには、 Google Cloud プロジェクト 管理者アカウントを使用して次の操作を行います。

  1. エンドポイントを作成します。

    gcloud beta ai endpoints create \
       --project=PROJECT_ID \
       --region=REGION \
       --gdc-zone=ZONE \
       --display-name=ENDPOINT_NAME \
       --endpoint-id=ENDPOINT_ID
    

    次のように置き換えます。

    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • ZONE: ターゲットの Distributed Cloud コネクテッド ゾーン。
    • ENDPOINT_NAME: このエンドポイントのわかりやすい名前。
    • ENDPOINT_ID: (省略可)このエンドポイントの一意の識別子。 省略すると、ランダムな識別子が生成されます。
  2. モデルをデプロイします。

    gcloud beta ai endpoints deploy-model ENDPOINT_ID \
      --display-name=ENDPOINT_NAME \
      --model=MODEL_PUBLIC_ID \
      --region=REGION
    

    次のように置き換えます。

    • ENDPOINT_ID: ターゲット エンドポイントの ID。
    • ENDPOINT_NAME: ターゲット エンドポイントの名前。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • MODEL_PUBLIC_ID: モデルの公開 ID。サポートされているモデルの一覧については、サポートされているモデルをご覧ください。
  3. デプロイされたエンドポイントを一覧表示します。

    gcloud beta ai endpoints list \
      --project=PROJECT_ID \
      --region=REGION
    

    次のように置き換えます。

    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。

    ターゲット エンドポイントの ID をメモします。

  4. エンドポイント アドレスを取得します。

    gcloud beta ai endpoints describe ENDPOINT_ID \
      --project=PROJECT_ID \
      --region=REGION
    

    次のように置き換えます。

    • ENDPOINT_ID: ターゲット エンドポイントの ID。
    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
  5. ターゲットの Distributed Cloud コネクテッド ゾーンにエンドポイントのサービス アカウントを作成します。

    gcloud alpha zone-management service-accounts create SERVICE_ACCOUNT \
      --project PROJECT_ID \
      --location REGION \
      --zone ZONE
    

    次のように置き換えます。

    • SERVICE_ACCOUNT: このサービス アカウントを一意に識別するわかりやすい名前。 この名前は、小文字、数字、「-」、「.」のみで構成し、英数字で始まり英数字で終わる必要があります。大文字は使用できません。
    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • ZONE: ターゲットの Distributed Cloud コネクテッド ゾーン。
  6. ターゲットの Distributed Cloud コネクテッド ゾーンの Identity and Access Management ポリシーを取得します。

    gcloud alpha zone-management zones get-iam-policy ZONE \
      --project PROJECT_ID \
      --location REGION
    

    次のように置き換えます。

    • ZONE: ターゲットの Distributed Cloud コネクテッド ゾーン。
    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
  7. サービス アカウントに AI Platform デベロッパー ロールを割り当てます。

    gcloud alpha zone-management zones set-iam-policy POLICY_FILE \
      --project PROJECT_ID \
      --location REGION \
      --zone ZONE
    

    次のように置き換えます。

    • POLICY_FILE: ロールの割り当てポリシーを含む JSON または YAML ファイル。
    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • ZONE: ターゲットの Distributed Cloud コネクテッド ゾーン。

    JSON 形式のポリシーの例を次に示します。

    "bindings": [
       {
          "role": "roles/aiplatform.geminiDeveloper",
          "members": [
          "serviceAccount": "projects/PROJECT_ID/locations/REGION/serviceAccounts/SERVICE_ACCOUNT"
          ]
       }
    ]
    "etag": ""
    

    YAML 形式のポリシーの例を次に示します。

    bindings:
    - role: roles/aiplatform.geminiDeveloper
    members:
    - serviceAccount: projects/PROJECT_ID/locations/REGION/serviceAccounts/SERVICE_ACCOUNT
    etag: ""
    

    次のように置き換えます。

    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • SERVICE_ACCOUNT: このサービス アカウントを一意に識別するわかりやすい名前。
  8. サービス アカウントのキーを生成します。

    gcloud alpha zone-management service-accounts keys create SA_KEY_FILE \
      --service-account SERVICE_ACCOUNT \
      --project PROJECT_ID \
      --location REGION \
      --ca-cert-path CA_CERTIFICATE_FILE
    

    次のように置き換えます。

    • SA_KEY_FILE: 生成されたサービス アカウント キーを保存するファイル。
    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • CA_CERTIFICATE_FILE: 先ほど作成した CA 証明書ファイル。
  9. エンドポイントの完全修飾 URL を取得します。

    gcloud beta ai endpoints describe ENDPOINT_ID \
      --project=PROJECT_ID \
      --region=REGION
    
  10. サービス アカウントの ID トークンを出力します。このコマンドは、Gemini on GDC connected API 認定マシンと同じローカル ネットワーク上のマシンから実行する必要があります。

    gcloud alpha zone-management auth print-identity-token \
      --cred-file=SA_KEY_FILE \
      --audience=ENDPOINT_URL
    

    次のように置き換えます。

    • SA_KEY_FILE: 先ほど作成したサービス アカウント キーファイル。
    • ENDPOINT_URL: TLD サフィックスを含むエンドポイントの完全修飾された URL。

デプロイされた Gemini on GDC connected API エンドポイントを一覧表示する

デプロイされた Gemini on GDC connected API エンドポイントを一覧表示するには、次の操作を行います。

gcloud beta ai endpoints list \
    --project=PROJECT_ID \
    --region=REGION \
    --gdc-zone=ZONE

次のように置き換えます。

  • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
  • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
  • ZONE: ターゲットの Distributed Cloud コネクテッド ゾーン。

Gemini on GDC connected API エンドポイントに関する情報を取得する

デプロイされた Gemini on GDC connected API エンドポイントに関する情報を取得するには、次の操作を行います。

gcloud beta ai endpoints describe ENDPOINT_ID \
    --project=PROJECT_ID \
    --region=REGION
   

次のように置き換えます。

  • ENDPOINT_ID: ターゲット エンドポイントの ID。
  • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
  • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。

Google Distributed Cloud コネクテッド API エンドポイントで Gemini とやり取りする

Gemini on GDC connected API エンドポイントは、ChatCompletions API と ListAvailableModels API を介したインタラクションをサポートしています。これらの API を使用して、エンドポイントとプログラムでやり取りします。

ChatCompletions API を使用したリクエストの例を次に示します。このリクエストで生成された署名なしトークンは 12 時間有効です。

  1. シェル環境で次の変数を設定します。

    MODEL_NAME="MODEL_NAME"
    USER_CONTENT="Who invented the light bulb?"
    PROJECT="PROJECT_ID"
    LOCATION="REGION"
    IG_FQDN="inference-gateway.vai.ZONE.google.private.goog"
    CRED_FILE="SA_KEY_FILE"
    API_ENDPOINT="https://${IG_FQDN}/v1/projects/${PROJECT}/locations/${LOCATION}/chat/completions"
    

    次のように置き換えます。

    • MODEL_PROMPT_ID: ターゲット モデルのプロンプト ID。これは、エンドポイントとのやり取りに使用される ID です。このリリースでサポートされている値は gemini-2.5-flash-ggc のみです。これは、モデルの公開 ID とは異なります。
    • PROJECT_ID: ターゲットの Google Cloud プロジェクトの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • SA_KEY_FILE: 先ほど作成したサービス アカウント キーファイル。
  2. 署名なしトークンを出力します。このコマンドは、Gemini on GDC connected API 認定マシンと同じローカル ネットワーク上のマシンから実行する必要があります。

    BEARER_TOKEN=$(gcloud alpha zone-management auth print-identity-token --cred-file="${CRED_FILE}" --audience="https://${IG_FQDN}")
    echo $BEARER_TOKEN
    
  3. ペイロードを作成します。

    REQUEST_BODY=$(cat <<EOF
    {
    "model": "${MODEL_NAME}",
    "messages": [
       {
          "role": "system",
          "content": "Pizza for everyone!"
       },
       {
          "role": "user",
          "content": "${USER_CONTENT}"
       }
    ],
    "stream": false
    }
    EOF
    )
    
  4. リクエストをエンドポイントに送信します。このコマンドは、Gemini on GDC connected API 認定マシンと同じローカル ネットワーク上のマシンから実行する必要があります。

    curl -k -X POST \
    "${API_ENDPOINT}" \
    -d "${REQUEST_BODY}" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer ${BEARER_TOKEN}" \
    -H "x-goog-user-project: projects/${PROJECT}"
    

JPEG 画像ペイロードを使用したマルチモーダル ChatCompletions API リクエストの例

入力として JPEG 画像を使用するマルチモーダル ChatCompletions API リクエストのペイロードの例を次に示します。

  1. ペイロードを作成します。

    BASE64_IMAGE=$(base64 -w 0 JPEG_FILE)
    REQUEST_BODY=$(cat <<EOF
    {
    "model": "${MODEL_NAME}",
    "messages": [
       {
          "role": "user",
          "content": [
                {
                   "type": "text",
                   "text": "What is this image?"
                },
                {
                   "type": "image_url",
                   "image_url": {
                      "url": "data:image/jpeg;base64,${BASE64_IMAGE}"
                   }
                }
          ]
       }
    ]
    }
    EOF
    
    )
    
  2. リクエストをエンドポイントに送信します。このコマンドは、Gemini on GDC connected API 認定マシンと同じローカル ネットワーク上のマシンから実行する必要があります。

    curl -k -X POST \
    "${API_ENDPOINT}" \
    -d "${REQUEST_BODY}" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer ${BEARER_TOKEN}" \
    -H "x-goog-user-project: projects/${PROJECT}"
    

PDF ドキュメント ペイロードを使用したマルチモーダル ChatCompletions API リクエストの例

入力として PDF ドキュメントを使用するマルチモーダル ChatCompletions API リクエストのペイロードの例を次に示します。

  1. ペイロードを作成します。

    BASE64_PDF=$(base64 -w 0 PDF_FILE)
    REQUEST_BODY=$(cat <<EOF
    {
    "model": "${MODEL_NAME}",
    "messages": [
       {
          "role": "user",
          "content": [
                {
                   "type": "text",
                   "text": "Please summarize this document."
                },
                {
                   "type": "input_document",
                   "input_document": {
                      "data": "data:application/pdf;base64,${BASE64_PDF}",
                      "format": "pdf"
                   }
                }
          ]
       }
    ]
    }
    EOF
    
    )
    
  2. リクエストをエンドポイントに送信します。このコマンドは、Gemini on GDC connected API 認定マシンと同じローカル ネットワーク上のマシンから実行する必要があります。

    curl -k -X POST \
    "${API_ENDPOINT}" \
    -d "${REQUEST_BODY}" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer ${BEARER_TOKEN}" \
    -H "x-goog-user-project: projects/${PROJECT}"
    

音声ペイロードを使用したマルチモーダル ChatCompletions API リクエストの例

入力として音声ファイルを使用するマルチモーダル ChatCompletions API リクエストのペイロードの例を次に示します。

  1. ペイロードを作成します。

    BASE64_AUDIO=$(base64 -w 0 AUDIO_FILE)
    REQUEST_BODY=$(cat <<EOF
    {
    "model": "${MODEL_NAME}",
    "messages": [
       {
          "role": "user",
          "content": [
                {
                   "type": "text",
                   "text": "Transcribe this speech for me."
                },
                {
                   "type": "input_audio",
                   "input_audio": {
                      "data": "data:audio/mp3;base64,${BASE64_AUDIO}",
                      "format": "mp3"
                   }
                }
          ]
       }
    ]
    }
    EOF
    
    )
    
  2. リクエストをエンドポイントに送信します。このコマンドは、Gemini on GDC connected API 認定マシンと同じローカル ネットワーク上のマシンから実行する必要があります。

    curl -k -X POST \
    "${API_ENDPOINT}" \
    -d "${REQUEST_BODY}" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer ${BEARER_TOKEN}" \
    -H "x-goog-user-project: projects/${PROJECT}"
    

動画ペイロードを使用したマルチモーダル ChatCompletions API リクエストの例

入力として動画ファイルを使用するマルチモーダル ChatCompletions API リクエストのペイロードの例を次に示します。

  1. ペイロードを作成します。

    BASE64_VIDEO=$(base64 -w 0 VIDEO_FILE)
    REQUEST_BODY=$(cat <<EOF
    {
    "model": "${MODEL_NAME}",
    "messages": [
       {
          "role": "user",
          "content": [
                {
                   "type": "text",
                   "text": "Could you summarize this video for me?"
                },
                {
                   "type": "input_video",
                   "input_video": {
                      "data": "data:video/wmv;base64,${BASE64_VIDEO}",
                      "format": "wmv"
                   }
                }
          ]
       }
    ]
    }
    EOF
    
    )
    
  2. リクエストをエンドポイントに送信します。このコマンドは、Gemini on GDC connected API 認定マシンと同じローカル ネットワーク上のマシンから実行する必要があります。

    curl -k -X POST \
    "${API_ENDPOINT}" \
    -d "${REQUEST_BODY}" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer ${BEARER_TOKEN}" \
    -H "x-goog-user-project: projects/${PROJECT}"
    

ListAllAvailableModels API リクエストの例

ListAllAvailableModels API リクエストの例を次に示します。

BEARER_TOKEN=$(gcloud alpha zone-management auth print-identity-token --cred-file="${CRED_FILE}" --audience="https://${IG_FQDN}")
# The request body -d parameter is intentionally omitted.
grpcurl -insecure \
  -H "Authorization: Bearer ${BEARER_TOKEN}" \
  -H "x-goog-user-project: projects/${PROJECT}" \
  "${IG_FQDN}" \
  cloud.gdc.ai.inference.inferencegateway.GeminiMetadataService.ListAvailableModels

Google Distributed Cloud コネクテッド の Gemini API エンドポイントを削除する

Gemini on GDC connected API エンドポイントを削除するには、次の操作を行います。

  1. モデルのデプロイを解除します。

    gcloud beta ai endpoints undeploy-model ENDPOINT_ID \
      --region=REGION \
      --gdc-zone=ZONE \
      --model=MODEL_PUBLIC_ID
    

    次のように置き換えます。

    • ENDPOINT_ID: ターゲット エンドポイントの ID。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。
    • ZONE: ターゲットの Distributed Cloud コネクテッド ゾーン。
    • MODEL_PUBLIC_ID: モデルの公開 ID。サポートされているモデルの一覧については、サポートされているモデルをご覧ください。
  2. エンドポイントを削除します。

    gcloud beta ai endpoints delete ENDPOINT_ID \
       --project=PROJECT_ID \
       --region=REGION
    

    次のように置き換えます。

    • ENDPOINT_ID: ターゲット エンドポイントの ID。
    • PROJECT_ID: ターゲット エンドポイントの名前。
    • REGION:ターゲットの Distributed Cloud コネクテッド ゾーンが作成された Google Cloud リージョン 。

エンドポイントのトラブルシューティング

Gemini on GDC connected API エンドポイントがダウンした場合は、Google の担当者にお問い合わせください。