En este documento se explica cómo crear una instancia de máquina virtual (VM) de inicio flexible. Las VMs de inicio flexible se ejecutan durante un máximo de siete días y te ayudan a adquirir recursos de alta demanda, como GPUs, a un precio con descuento. Estas funciones convierten a las VMs de inicio flexible en una solución rentable para ejecutar cargas de trabajo de corta duración, como el ajuste de modelos y la inferencia por lotes.
Para obtener más información sobre las características principales de las VMs de inicio flexible, incluidos los requisitos y las limitaciones que se aplican al crearlas, consulta el artículo Acerca de las VMs de inicio flexible.
Antes de empezar
-
En función del tipo de máquina que quieras usar, consulta uno de los siguientes requisitos de configuración:
- Para un tipo de máquina optimizada para aceleradores (excepto A4X Max o A4X), consulta la descripción general de la creación de una instancia con GPUs conectadas.
- Para un tipo de máquina H4D, consulta Crear una instancia que use Cloud RDMA.
-
Si aún no lo has hecho, configura la autenticación.
La autenticación verifica tu identidad para acceder a Google Cloud servicios y APIs. Para ejecutar código o ejemplos desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
gcloud initSi utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.
- Set a default region and zone.
REST
Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.
Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
gcloud initSi utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.
Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre Google Cloud autenticación.
Roles obligatorios
Para obtener los permisos que necesitas para crear VMs de inicio flexible, pide a tu administrador que te conceda el rol de gestión de identidades y accesos Administrador de instancias de Compute (v. 1) (
roles/compute.instanceAdmin.v1) en el proyecto. Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar acceso a proyectos, carpetas y organizaciones.Este rol predefinido contiene los permisos necesarios para crear máquinas virtuales de inicio flexible. Para ver los permisos exactos que se necesitan, despliega la sección Permisos necesarios:
Permisos obligatorios
Para crear VMs de inicio flexible, se necesitan los siguientes permisos:
-
compute.instances.createdel proyecto -
Para usar una imagen personalizada para crear la VM, sigue estos pasos:
compute.images.useReadOnlyen la imagen -
Para usar una captura para crear la VM, sigue estos pasos:
compute.snapshots.useReadOnlyen la captura -
Para usar una plantilla de instancia para crear la VM, haz lo siguiente:
compute.instanceTemplates.useReadOnlyen la plantilla de instancia -
Para especificar una subred para tu VM, haz lo siguiente:
compute.subnetworks.useen el proyecto o en la subred elegida -
Para especificar una dirección IP estática para la máquina virtual, haz lo siguiente:
compute.addresses.useen el proyecto -
Para asignar una dirección IP externa a la VM cuando se usa una red de VPC, haz lo siguiente:
compute.subnetworks.useExternalIpen el proyecto o en la subred elegida -
Para asignar una red antigua a la VM, sigue estos pasos:
compute.networks.useen el proyecto -
Para asignar una dirección IP externa a la VM cuando se usa una red antigua, haz lo siguiente:
compute.networks.useExternalIpen el proyecto -
Para definir los metadatos de la instancia de VM:
compute.instances.setMetadataen el proyecto -
Para definir etiquetas en la VM, haz lo siguiente:
compute.instances.setTagsen la VM -
Para definir etiquetas en la VM, sigue estos pasos:
compute.instances.setLabelsen la VM -
Para definir una cuenta de servicio que use la VM, sigue estos pasos:
compute.instances.setServiceAccounten la VM -
Para crear un disco para la VM, sigue estos pasos:
compute.disks.createen el proyecto -
Para adjuntar un disco en modo de solo lectura o de lectura y escritura, sigue estos pasos:
compute.disks.useen el disco -
Para adjuntar un disco en modo de solo lectura:
compute.disks.useReadOnlyen el disco
También puedes obtener estos permisos con roles personalizados u otros roles predefinidos.
Crear una VM de inicio flexible
Para crear una VM de inicio flexible, selecciona una de las siguientes opciones:
Consola
En la Google Cloud consola, ve a la página Crear una instancia.
En el panel Configuración de la máquina, sigue estos pasos:
En el campo Name (Nombre), introduce un nombre para la máquina virtual Flex-start.
Especifica la región y la zona en las que quieras crear tu VM. Para consultar las regiones y zonas en las que está disponible el tipo de máquina que quieres usar, consulta Regiones y zonas disponibles.
En función de la carga de trabajo que quieras ejecutar, especifica un tipo de máquina de la siguiente manera:
Para especificar un tipo de máquina optimizada para aceleradores, haz lo siguiente:
Haz clic en la pestaña GPUs.
En la lista Tipo de GPU, selecciona un tipo de GPU, excepto NVIDIA GB200 192 GB (A4X).
En la lista Número de GPUs, selecciona el número de GPUs que quieras asociar a tu VM.
Opcional: Si tu modelo de GPU es compatible con estaciones de trabajo virtuales (vWS) NVIDIA RTX para cargas de trabajo de gráficos y tienes previsto ejecutar cargas de trabajo que utilizan un gran número de gráficos, selecciona Habilitar estación de trabajo virtual (NVIDIA GRID).
Para especificar un tipo de máquina H4D, siga estos pasos:
Haz clic en la pestaña Optimizado para computación.
En la columna Serie, selecciona H4D.
En el menú de navegación, haga clic en Opciones avanzadas. En el panel Avanzado que aparece, sigue estos pasos:
En la sección Modelo de aprovisionamiento, en la lista Modelo de aprovisionamiento de la VM, selecciona Inicio flexible.
En el campo Introduce el número de horas, indica el tiempo máximo que quieres que se ejecute la VM. El valor debe estar entre
0.01(36 segundos) y168(168 horas o siete días).Seleccione la casilla Definir un tiempo de espera para la creación de la VM. A continuación, en función de los requisitos zonales de tu carga de trabajo, especifica una de las siguientes duraciones para aumentar las probabilidades de que se cree tu máquina virtual:
Si tu carga de trabajo requiere que crees la VM en una zona específica, indica una duración de entre 90 segundos y 2 horas. Cuanto más dure la misión, más probabilidades tendrás de obtener recursos.
Si la máquina virtual puede ejecutarse en cualquier zona de la región, especifica una duración de 0 segundos o desmarca la casilla Definir un tiempo de espera para la creación de la máquina virtual. Esta acción especifica que Compute Engine solo asigna recursos si están disponibles de inmediato. Si la solicitud de creación de la VM falla porque no hay recursos disponibles, vuelve a intentarlo en otra zona.
En el campo Al finalizar la VM, seleccione si quiere detener o eliminar la VM de inicio flexible al final de su duración:
Para eliminar la máquina virtual, selecciona Eliminar.
Para detener la VM, selecciona Detener.
Para crear la VM de inicio flexible, haz clic en Crear.
gcloud
Para crear una VM de inicio flexible, usa el comando
gcloud compute instances createcon las siguientes marcas:Bandera de
--request-valid-for-durationBandera de
--provisioning-model=FLEX_STARTBandera de
--instance-termination-actionBandera de
--max-run-durationBandera de
--maintenance-policy=TERMINATEBandera de
--reservation-affinity=none
Para crear una VM de inicio flexible, ejecuta el siguiente comando:
gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --zone=ZONE \ --request-valid-for-duration=VALID_FOR_DURATION \ --provisioning-model=FLEX_START \ --instance-termination-action=TERMINATION_ACTION \ --max-run-duration=RUN_DURATION \ --maintenance-policy=TERMINATE \ --reservation-affinity=noneHaz los cambios siguientes:
VM_NAME: el nombre de la nueva VM.MACHINE_TYPE: el tipo de máquina que se va a usar en la máquina virtual de inicio flexible. Si especificas un tipo de máquina G4, G2 o N1, ten en cuenta lo siguiente:En los tipos de máquinas G4 o G2, puedes especificar de forma opcional una estación de trabajo virtual (vWS) NVIDIA RTX para cargas de trabajo que requieran muchos gráficos. Para ello, incluye la marca
--acceleratoren el comando de la siguiente manera:--accelerator=count=VWS_ACCELERATOR_COUNT,type=VWS_ACCELERATOR_TYPEHaz los cambios siguientes:
VWS_ACCELERATOR_COUNT: el número de estaciones de trabajo virtuales NVIDIA RTX que requiere tu carga de trabajo. Este número debe coincidir con el número de GPUs conectadas al tipo de máquina G4 o G2 que quieras usar.VWS_ACCELERATOR_TYPE: el tipo de acelerador NVIDIA RTX vWS que se va a usar. Se debe utilizar uno de los valores indicados a continuación.- En el caso de los tipos de máquinas G2:
nvidia-l4-vws - En el caso de los tipos de máquinas G4:
nvidia-rtx-pro-6000-vws
- En el caso de los tipos de máquinas G2:
En el caso de los tipos de máquinas N1, debes especificar el número y el tipo de GPUs que quieres conectar a tu VM. De lo contrario, no se podrá crear la VM. Para adjuntar GPUs a una VM N1, incluye la marca
--acceleratoren el comando de la siguiente manera:--accelerator=count=NUMBER_OF_ACCELERATORS,type=ACCELERATOR_TYPEHaz los cambios siguientes:
NUMBER_OF_ACCELERATORS: número de GPUs que se van a asociar a tu máquina virtual N1.ACCELERATOR_TYPE: un modelo de GPU compatible con máquinas virtuales N1.
ZONE: la zona en la que quieres crear la VM. Para comprobar que el tipo de máquina que has especificado está disponible en la zona en la que quieres crear la VM, consulta Regiones y zonas disponibles.VALID_FOR_DURATION: tiempo máximo que se espera para aprovisionar los recursos solicitados. Debes dar formato al valor como el número de días, horas, minutos o segundos seguido ded,h,mys, respectivamente. Por ejemplo, especifica30mpara 30 minutos o1h2m3spara una hora, dos minutos y tres segundos. En función de los requisitos zonales de tu carga de trabajo, especifica una de las siguientes duraciones para aumentar las probabilidades de que se complete tu solicitud de creación de una VM:Si tu carga de trabajo requiere que crees la VM en una zona específica, especifica una duración de entre 90 segundos (
90s) y dos horas (2h). Cuanto mayor sea la duración, más probabilidades tendrás de obtener recursos.Si la VM puede ejecutarse en cualquier zona de la región, especifica una duración de cero segundos (
0s). Este valor indica que Compute Engine solo asigna recursos si están disponibles de inmediato. Si la solicitud de creación falla porque los recursos no están disponibles, vuelve a intentarlo en otra zona.
TERMINATION_ACTION: indica si se debe detener o eliminar la VM al final de su duración. Especifica uno de los siguientes valores:Para detener la VM, haz lo siguiente:
STOPPara eliminar la VM, haz lo siguiente:
DELETE
RUN_DURATION: tiempo máximo que la VM se ejecuta antes de que Compute Engine la detenga o elimine automáticamente. Debes dar formato al valor como el número de días, horas, minutos o segundos seguido ded,h,mys, respectivamente. El valor debe estar comprendido entre 10 minutos y 7 días.
REST
Para crear una VM de inicio flexible, envía una solicitud
POSTal métodoinstances.insert. En el cuerpo de la solicitud, incluye los siguientes campos:El campo
params.requestValidForDuration.El campo
scheduling.provisioningModelse ha definido comoFLEX_START.El campo
scheduling.instanceTerminationAction.El campo
scheduling.maxRunDuration.El campo
scheduling.onHostMaintenancese ha definido comoTERMINATE.El valor de
reservationAffinity.consumeReservationTypeesNO_RESERVATION.
Para crear una VM de inicio flexible, haz una solicitud
POSTde la siguiente manera:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "name": "VM_NAME", "machineType": "zones/ZONE/machineTypes/MACHINE_TYPE", "disks": [ { "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE" }, "boot": true } ], "networkInterfaces": [ { "network": "global/networks/default" } ], "params": { "requestValidForDuration": { "seconds": VALID_FOR_DURATION } }, "scheduling": { "provisioningModel": "FLEX_START", "instanceTerminationAction": "TERMINATION_ACTION", "maxRunDuration": { "seconds": RUN_DURATION }, "onHostMaintenance": "TERMINATE" }, "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" } }Haz los cambios siguientes:
PROJECT_ID: el ID del proyecto en el que se va a crear la VM.ZONE: la zona en la que quieres crear la VM. Para comprobar que un tipo de máquina está disponible en la zona en la que quieres crear la VM, consulta Regiones y zonas disponibles.VM_NAME: el nombre de la nueva VM.MACHINE_TYPE: el tipo de máquina que se va a usar en la máquina virtual de inicio flexible. Si especificas un tipo de máquina G4, G2 o N1, ten en cuenta lo siguiente:En los tipos de máquinas G4 o G2, puedes especificar de forma opcional una estación de trabajo virtual (vWS) NVIDIA RTX para cargas de trabajo que requieran muchos gráficos. Para ello, incluye el campo
guestAcceleratorsen el cuerpo de la solicitud de la siguiente manera:"guestAccelerators": [ { "acceleratorCount": VWS_ACCELERATOR_COUNT, "acceleratorType": "projects/PROJECT_ID/zones/ZONE/acceleratorTypes/VWS_ACCELERATOR_TYPE" } ]Haz los cambios siguientes:
VWS_ACCELERATOR_COUNT: el número de estaciones de trabajo virtuales NVIDIA RTX que requiere tu carga de trabajo. Este número debe coincidir con el número de GPUs conectadas al tipo de máquina G4 o G2 que quieras usar.VWS_ACCELERATOR_TYPE: el tipo de acelerador de NVIDIA RTX vWS que se va a usar. Especifica uno de los siguientes valores:- En el caso de los tipos de máquinas G2:
nvidia-l4-vws - En el caso de los tipos de máquinas G4:
nvidia-rtx-pro-6000-vws
- En el caso de los tipos de máquinas G2:
En el caso de los tipos de máquinas N1, debes especificar el número y el tipo de GPUs que quieres conectar a tu VM. De lo contrario, no se podrá crear la VM. Para adjuntar GPUs a una VM N1, incluye el campo
guestAcceleratorsen el cuerpo de la solicitud de la siguiente manera:"guestAccelerators": [ { "acceleratorCount": ACCELERATOR_COUNT, "acceleratorType": "projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE" } ]Haz los cambios siguientes:
NUMBER_OF_ACCELERATORS: número de GPUs que se van a asociar a tu máquina virtual N1.ACCELERATOR_TYPE: un modelo de GPU compatible con máquinas virtuales N1.
IMAGE_PROJECT: el proyecto de imagen que contiene la imagen (por ejemplo,debian-cloud). Para obtener más información sobre los proyectos de imágenes admitidos, consulta Imágenes públicas.IMAGE: especifica una de las siguientes opciones:Una versión específica de la imagen del SO, por ejemplo,
debian-12-bookworm-v20240617.Una familia de imágenes, que debe tener el formato
family/IMAGE_FAMILY. Este valor especifica que se debe usar la imagen del SO más reciente que no esté obsoleta. Por ejemplo, si especificasfamily/debian-12, se usará la versión más reciente de la familia de imágenes de Debian 12. Para obtener más información sobre cómo usar familias de imágenes, consulta Prácticas recomendadas para familias de imágenes.
VALID_FOR_DURATION: tiempo máximo en segundos que se debe esperar a que se aprovisione la VM. En función de los requisitos zonales de tu carga de trabajo, especifica una de las siguientes duraciones para aumentar las probabilidades de que se cree la VM:Si tu carga de trabajo requiere que crees la VM en una zona específica, especifica una duración de entre 90 segundos (
90) y dos horas (7200). Cuanto mayor sea la duración, más probabilidades tendrás de obtener recursos.Si la VM puede ejecutarse en cualquier zona de la región, especifica una duración de cero segundos (
0). Este valor indica que Compute Engine solo asigna recursos si están disponibles de inmediato. Si la solicitud de creación falla porque no hay recursos disponibles, vuelve a intentarlo en otra zona.
TERMINATION_ACTION: indica si se debe detener o eliminar la VM al final de su duración. Especifica uno de los siguientes valores:Para detener la VM, haz lo siguiente:
STOPPara eliminar la VM, haz lo siguiente:
DELETE
RUN_DURATION: el tiempo máximo, en segundos, que la VM se ejecuta antes de que Compute Engine la detenga o elimine automáticamente. El valor debe estar entre600(600 segundos o 10 minutos) y604800(604.800 segundos o siete días).
Siguientes pasos
Pruébalo
Si es la primera vez que utilizas Google Cloud, crea una cuenta para evaluar el rendimiento de en situaciones reales. Los nuevos clientes también reciben 300 USD en crédito sin coste económico para ejecutar, probar y desplegar cargas de trabajo.
Probar Compute Engine sin coste económicoA menos que se indique lo contrario, el contenido de esta página está sujeto a la licencia Reconocimiento 4.0 de Creative Commons y las muestras de código están sujetas a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio web de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2026-01-14 (UTC).
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Es difícil de entender","hardToUnderstand","thumb-down"],["La información o el código de muestra no son correctos","incorrectInformationOrSampleCode","thumb-down"],["Me faltan las muestras o la información que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2026-01-14 (UTC)."],[],[]] -