En esta página, se describe cómo importar datos de un archivo CSV almacenado en un bucket de Cloud Storage a un clúster de AlloyDB para PostgreSQL.
Puedes cancelar la importación de datos a clústeres de AlloyDB. Para obtener más información, consulta Cancela una operación de importación.
Antes de comenzar
Antes de comenzar una operación de importación, haz lo siguiente:
- Asegúrate de que tu base de datos tenga suficiente espacio libre.
- Las operaciones de importación usan recursos de bases de datos, pero no interfieren en las operaciones normales de la base de datos, a menos que el clúster no cuente con el aprovisionamiento suficiente.
Roles y permisos obligatorios para la importación a clústeres de AlloyDB
Para importar datos de Cloud Storage a AlloyDB, el usuario que inicia la importación debe tener uno de los siguientes roles:
- El rol de administrador de AlloyDB
- Un rol personalizado,
que incluya los siguientes permisos:
alloydb.clusters.getalloydb.clusters.import
Además, la cuenta de servicio para el clúster de AlloyDB debe tener uno de los siguientes roles:
- El rol de IAM
storage.objectViewer - Un rol personalizado que incluya los siguientes permisos:
storage.objects.get
Para obtener ayuda con los roles de IAM, consulta Identity and Access Management.
Importa datos de un archivo CSV a clústeres de AlloyDB
- La base de datos y la tabla a las que importas deben existir en tu clúster de AlloyDB. Para obtener ayuda para crear una base de datos, consulta Crea una base de datos.
- Los archivos CSV deben tener una línea por cada fila de datos y usar campos separados por comas.
Para importar datos a un clúster de AlloyDB con un archivo CSV, sigue estos pasos:
Console
Ve a la página Clústeres.
Haz clic en el nombre de un clúster para abrir la página Descripción general de ese clúster.
Haz clic en Importar.
En Formato del archivo, selecciona CSV.
En Seleccionar archivo fuente, elige si deseas subir archivos desde tu computadora o seleccionar un archivo de una ubicación de Cloud Storage.
Para subir un archivo desde tu computadora, haz lo siguiente:
- Selecciona Subir archivos de tu computadora.
- Haz clic en Explorar junto a Seleccionar archivo local para seleccionar un archivo CSV de tu máquina local.
- Haz clic en Explorar junto a Seleccionar ubicación de Cloud Storage para seleccionar una ubicación de Cloud Storage en la que se almacenará el archivo local subido.
- Haz clic en Subir para subir el archivo.
Para seleccionar un archivo CSV que existe en un bucket de Cloud Storage, haz lo siguiente:
- Selecciona Seleccionar archivo de Google Cloud Storage.
- Haz clic en Explorar junto a bucket-name/file-name para seleccionar un archivo CSV de un bucket de Cloud Storage.
Selecciona la base de datos a la que deseas importar los datos en el menú desplegable Base de datos.
Selecciona la tabla dentro de la base de datos en el menú desplegable Tabla.
Es opcional. Para especificar un usuario para la operación de importación, haz clic en Mostrar opciones de usuario y, luego, ingresa el nombre de usuario en el campo Usuario.
Para iniciar la operación de importación, haz clic en Importar.
gcloud
- Crea buckets de Cloud Storage.
- Sube el archivo CSV al bucket. Para obtener ayuda con la carga de archivos en buckets, consulta Sube objetos.
Usa gcloud storage buckets add-iam-policy-binding para otorgar el
storage.objectViewerrol de IAM a la cuenta de servicio de AlloyDB para el bucket.service-PROJECT_NUMBER@gcp-sa-alloydb.iam.gserviceaccount.comImporta el archivo:
gcloud alloydb clusters import CLUSTER_NAME --region=REGION --gcs-uri=gs://BUCKET_NAME/FILE_NAME --database=DATABASE_NAME --user=USER --csv --table=TABLE_NAMERealiza los siguientes reemplazos:
- CLUSTER_NAME: el nombre del clúster
- REGION: la región en la que se implementa el clúster de AlloyDB
- BUCKET_NAME: el nombre del bucket de Cloud Storage
- FILE_NAME: el nombre del archivo CSV
- DATABASE_NAME: el nombre de una base de datos dentro del clúster
- USER: el usuario para la operación de importación
- TABLE_NAME: la tabla dentro de la base de datos
Para obtener más información sobre el uso del
importcomando, consulta laalloydb importpágina de referencia del comando.Si no necesitas conservar los permisos de IAM que configuraste anteriormente, quítalos con
gcloud storage buckets remove-iam-policy-binding.
REST v1
- Crea buckets de Cloud Storage.
- Sube el archivo CSV al bucket. Para obtener ayuda con la carga de archivos en buckets, consulta Sube objetos.
Otorga permisos a la cuenta de servicio al bucket de Cloud Storage para la operación de importación. Usa el formato de la cuenta de servicio para identificar la cuenta de servicio del proyecto al que importas. El formato de la cuenta de servicio es el siguiente:
service-PROJECT_NUMBER@gcp-sa-alloydb.iam.gserviceaccount.comUsa gcloud storage buckets add-iam-policy-binding para otorgar el
storage.objectViewerrol de IAM a la cuenta de servicio del clúster de AlloyDB para el bucket. Para obtener ayuda con la configuración de permisos de IAM, consulta la sección sobre cómo usar permisos de IAM.Importa el archivo.
Usa el siguiente método y URL HTTP:
POST https://alloydb.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/clusters/CLUSTER_ID:importAntes de usar cualquiera de los datos de la solicitud, realiza los siguientes reemplazos:
- PROJECT_ID: Es el ID del proyecto.
- LOCATION_ID: la región en la que se implementa el clúster de AlloyDB
- CLUSTER_ID: el ID del clúster
- BUCKET_NAME: el nombre del bucket de Cloud Storage
- PATH_TO_CSV_FILE: la ruta de acceso al archivo CSV
- USER: el usuario para la operación de importación
- DATABASE_NAME: el nombre de una base de datos dentro del clúster de AlloyDB
- TABLE_NAME: la tabla dentro de la base de datos
- COLUMNS (opcional): las columnas para importar
- ESCAPE_CHARACTER (opcional): el carácter que debe
aparecer antes de un carácter de datos que debe escaparse El valor de este argumento debe ser un carácter en el código ASCII de Hex. Por ejemplo,
22representa una comilla doble. - QUOTE_CHARACTER (opcional): el carácter
que encierra valores de columnas que tienen un tipo de datos de string
El valor de este argumento debe ser un carácter en el código ASCII de Hex.
Por ejemplo,
22representa una comilla doble. - FIELD_DELIMITER (opcional): el carácter
que divide los valores de las columnas El valor de este argumento debe ser un carácter en el código ASCII de Hex. Por ejemplo,
2Crepresenta una coma.
Cuerpo JSON de la solicitud:
{ "gcsUri": "gs://BUCKET_NAME/PATH_TO_CSV_FILE", "database": "DATABASE_NAME", "user": "USER", "csvImportOptions": { "table": "TABLE_NAME", "columns": ["COLUMN1", "COLUMN2"], "fieldDelimiter": "FIELD_DELIMITER", "quoteCharacter": "QUOTE_CHARACTER", "escapeCharacter": "ESCAPE_CHARACTER" } }Para enviar tu solicitud, expande una de estas opciones:
curl (Linux, macOS o Cloud Shell)
Guarda el cuerpo de la solicitud en un archivo llamado
request.jsony ejecuta el siguiente comando:curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -d @request.json \ "https://alloydb.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/clusters/CLUSTER_ID:import"PowerShell (Windows)
Guarda el cuerpo de la solicitud en un archivo llamado
request.jsony ejecuta el siguiente comando:$cred = gcloud auth print-access-token $headers = @{ "Authorization" = "Bearer $cred" } Invoke-WebRequest ` -Method POST ` -Headers $headers ` -ContentType: "application/json; charset=utf-8" ` -InFile request.json ` -Uri "https://alloydb.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/clusters/CLUSTER_ID:import"| Select-Object -Expand ContentRecibirás una respuesta JSON similar a la siguiente:
Respuesta
{ "name": "projects/PROJECT_ID/locations/LOCATION_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.alloydb.v1.OperationMetadata", "createTime": "2024-09-17T06:05:31.244428646Z", "target": "projects/project-id/locations/location-id/clusters/target-cluster", "verb": "import", "requestedCancellation": false, "apiVersion": "v1" }, "done": false }Si no necesitas conservar los permisos de IAM que configuraste anteriormente, quítalos ahora.
Para obtener la lista completa de parámetros de la solicitud, consulta
clusters:import.
Personaliza el formato CSV y, luego, importa el archivo
Puedes personalizar el formato CSV y, luego, importar el archivo cuando el archivo CSV contiene un delimitador de campo, o comillas o caracteres de escape no predeterminados. Para importar un archivo CSV con un formato no predeterminado, debes proporcionar las mismas opciones de formato en la solicitud.
Usa los siguientes ejemplos de gcloud CLI y la API de REST para personalizar el formato de tu archivo CSV.
gcloud
gcloud alloydb clusters import CLUSTER_NAME --region=REGION --database=DATABASE_NAME --gcs-uri='gs://BUCKET_NAME/PATH_TO_CSV_FILE' --user=USERNAME --table=TABLE_NAME --columns=COLUMNS --field-delimiter='2C' --quote-character='22' --escape-character='5C' --csvREST v1
El cuerpo de la solicitud a la API de REST equivalente es similar al siguiente:
{
"gcsUri": "gs://BUCKET_NAME/PATH_TO_CSV_FILE",
"database": "DATABASE_NAME",
"user": "USER",
"csvImportOptions": {
"table": "TABLE_NAME",
"columns": ["COLUMN1", "COLUMN2"],
"escapeCharacter": "5C",
"quoteCharacter": "22",
"fieldDelimiter": "2C",
}
}
Si quieres ver cómo se crea la solicitud a la API de REST subyacente para esta tarea, consulta el Explorador de API en la página de underlying REST API request APIs Explorer on the clusters:import page.
Si recibes un error como INVALID_ARGUMENT, asegúrate de que la tabla exista. Si la tabla existe, confirma que tienes los permisos correctos en el bucket.
Para obtener ayuda para configurar el control de acceso en Cloud Storage, consulta
Crea y administra Listas de control de acceso.
Verifica el estado de una operación de importación
Para verificar el estado de una operación de importación, sigue estos pasos:
gcloud
Ejecuta lo siguiente con el gcloud alloydb operations describe comando:
gcloud alloydb operations describe OPERATION_ID --region=REGIONEl estado de estas operaciones está en el campo STATUS.
También puedes enumerar detalles de una operación específica o cancelar una operación específica. Para obtener más información sobre este comando, consulta la
gcloud alloydb operations
página de referencia del comando.
REST v1
Usa el método GET y la siguiente URL:
GET https://alloydb.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/operations/OPERATION_ID
Para obtener más información, consulta get.
Antes de usar cualquiera de los datos de la solicitud, realiza los siguientes reemplazos:
- REGION: la región en la que se implementa el clúster de AlloyDB
- PROJECT_ID: Es el ID del proyecto.
- OPERATION_ID: el ID de la operación de importación Para obtener más información, consulta Antes de comenzar.
Para enviar tu solicitud, expande una de estas opciones:
curl (Linux, macOS o Cloud Shell)
Ejecuta el siguiente comando:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://alloydb.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/operations/OPERATION_ID
PowerShell (Windows)
Ejecuta el siguiente comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://alloydb.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/operations/OPERATION_ID | Select-Object -Expand Content
Recibirás una respuesta JSON similar a la siguiente:
Si se ejecuta correctamente, el cuerpo de la respuesta contiene una instancia de operación.
¿Qué sigue?
- Obtén información para importar un archivo SQL.
- Obtén información para cancelar una operación de importación.