Anula la implementación de un modelo y borra el extremo

Usa uno de los siguientes métodos para anular la implementación de un modelo y borrar el extremo.

Consola de Google Cloud

  1. Anula la implementación del modelo de la siguiente manera:

    1. En la Google Cloud consola, en la sección Agent Platform, ve a la página Endpoints.

      Ir a la página Estremos

    2. Haz clic en el nombre y el ID de la versión del modelo que deseas implementar para abrir su página de detalles.

    3. En la fila de tu modelo, haz clic en Acciones y, luego, en Anular la implementación del modelo en el extremo.

    4. En el cuadro de diálogo Anular la implementación del modelo desde el extremo, haz clic en Anular la implementación.

    5. Para borrar modelos adicionales, repite los pasos anteriores.

  2. Opcional: Borra el extremo de inferencia en línea de la siguiente manera:

    1. En la consola de Google Cloud , en la sección Plataforma de agentes de Gemini Enterprise, ve a la página Predicción en línea.

      Ir a Predicción en línea

    2. Selecciona el extremo.

    3. Para borrar el extremo, haz clic en Acciones y, luego, en Borrar extremo.

gcloud

  1. Enumera los IDs de los extremos de todos los extremos de tu proyecto:

    gcloud ai endpoints list \
        --project=PROJECT_ID \
        --region=LOCATION_ID
    

    Reemplaza PROJECT_ID por el nombre de tu proyecto y LOCATION_ID por la región en la que usas Gemini Enterprise Agent Platform.

  2. Enumera los IDs de los modelos que se implementan en un extremo:

    gcloud ai endpoints describe ENDPOINT_ID \
        --project=PROJECT_ID \
        --region=LOCATION_ID
    

    Reemplaza ENDPOINT_ID por el ID del extremo.

  3. Anula la implementación de un modelo desde el extremo:

    gcloud ai endpoints undeploy-model ENDPOINT_ID \
        --project=PROJECT_ID \
        --region=LOCATION_ID \
        --deployed-model-id=DEPLOYED_MODEL_ID
    

    Reemplaza DEPLOYED_MODEL_ID por el ID del modelo.

  4. Opcional: Borra el extremo de inferencia en línea:

    gcloud ai endpoints delete ENDPOINT_ID \
        --project=PROJECT_ID \
        --region=LOCATION_ID