- Solicitud HTTP
- Parámetros de ruta
- Cuerpo de la solicitud
- Cuerpo de la respuesta
- Permisos de autorización
- OrganicCrawlRateTimeSeries
- CrawlRateTimeSeries
- DedicatedCrawlRateTimeSeries
- Estado
Obtiene los datos de series temporales de la frecuencia de rastreo orgánica o dedicada para la supervisión. Cuando no se establece una frecuencia de rastreo dedicada, se devolverá la serie temporal de la frecuencia de rastreo orgánica de Vertex AI. El rastreo orgánico significa que Google rastrea automáticamente Internet cuando le resulta conveniente. Cuando se establece una frecuencia de rastreo dedicada, se mostrará la serie temporal de la frecuencia de rastreo dedicada de Vertex AI.
Solicitud HTTP
POST https://discoveryengine.googleapis.com/v1beta/{location=projects/*/locations/*}:obtainCrawlRate
La URL usa la sintaxis de la transcodificación gRPC.
Parámetros de ruta
| Parámetros | |
|---|---|
location |
Obligatorio. Es el recurso de ubicación en el que se realizará la administración de la frecuencia de rastreo. Formato: |
Cuerpo de la solicitud
El cuerpo de la solicitud contiene datos con la siguiente estructura:
| Representación JSON |
|---|
{ "crawlRateScope": string } |
| Campos | |
|---|---|
crawlRateScope |
Obligatorio. Es el alcance de la frecuencia de rastreo que el usuario desea supervisar. Actualmente, solo se admiten el dominio y el nombre de host. Un ejemplo de nombre de dominio es |
Cuerpo de la respuesta
Mensaje de respuesta para el método CrawlRateManagementService.ObtainCrawlRate. La respuesta contiene datos de series temporales de la frecuencia de rastreo orgánica o dedicada para la supervisión, según si se configuró una frecuencia de rastreo dedicada.
Si se ejecuta correctamente, el cuerpo de la respuesta contiene datos con la siguiente estructura:
| Representación JSON |
|---|
{ "state": enum ( |
| Campos | |
|---|---|
state |
Solo salida. Es el estado de la respuesta. |
error |
Son los errores del servicio cuando se controla la solicitud. |
Campo de unión crawl_rate_time_series. Una vez que el usuario establece la frecuencia de rastreo dedicada, se devolverá la serie temporal de la frecuencia de rastreo dedicada. De lo contrario, se devolverá la serie temporal de la frecuencia de rastreo orgánica. crawl_rate_time_series puede ser solo uno de los parámetros siguientes: |
|
organicCrawlRateTimeSeries |
Son los datos de series temporales históricos de la frecuencia de rastreo orgánico, que se usan para la supervisión. |
dedicatedCrawlRateTimeSeries |
Son los datos históricos de series temporales de la frecuencia de rastreo dedicada, que se usan para la supervisión. |
Permisos de autorización
Se necesita uno de los siguientes permisos de OAuth:
https://www.googleapis.com/auth/cloud-platformhttps://www.googleapis.com/auth/discoveryengine.readwritehttps://www.googleapis.com/auth/discoveryengine.serving.readwrite
Para obtener más información, consulta Authentication Overview.
OrganicCrawlRateTimeSeries
Son los datos de series temporales históricos de la frecuencia de rastreo orgánico, que se utilizan para la supervisión. Google determina automáticamente el rastreo orgánico para rastrear el sitio web del usuario cuando no se establece un rastreo dedicado. La frecuencia de rastreo es la QPS de solicitudes de rastreo que Google envía al sitio web del usuario.
| Representación JSON |
|---|
{ "googleOrganicCrawlRate": { object ( |
| Campos | |
|---|---|
googleOrganicCrawlRate |
Serie temporal de la frecuencia de rastreo orgánica de Google, que es la suma de la frecuencia de rastreo de todos los Googlebots. Consulta https://developers.google.com/search/docs/crawling-indexing/overview-google-crawlers para obtener más detalles sobre los Googlebots. |
vertexAiOrganicCrawlRate |
Es la serie temporal de la frecuencia de rastreo orgánica de Vertex AI, que es la frecuencia de rastreo de Google-CloudVertexBot cuando no se establece el rastreo dedicado. Consulta https://developers.google.com/search/docs/crawling-indexing/google-common-crawlers#google-cloudvertexbot para obtener más detalles sobre Google-CloudVertexBot. |
CrawlRateTimeSeries
Son los datos de series temporales del historial de la frecuencia de rastreo, que se usan para la supervisión.
| Representación JSON |
|---|
{
"qpsTimeSeries": {
object ( |
| Campos | |
|---|---|
qpsTimeSeries |
Es la QPS de la frecuencia de rastreo. |
DedicatedCrawlRateTimeSeries
Son los datos históricos de series temporales de la frecuencia de rastreo dedicada, que se usan para la supervisión. Vertex AI usa el rastreo dedicado para rastrear el sitio web del usuario cuando se configura el rastreo dedicado.
| Representación JSON |
|---|
{ "userTriggeredCrawlRate": { object ( |
| Campos | |
|---|---|
userTriggeredCrawlRate |
Es la serie temporal de la frecuencia de rastreo dedicada de Vertex AI del rastreo activado por el usuario, que es la frecuencia de rastreo de Google-CloudVertexBot cuando se establece el rastreo dedicado, y la frecuencia de rastreo activado por el usuario es para casos de uso determinísticos, como rastrear URLs o mapas del sitio especificados por los usuarios. |
autoRefreshCrawlRate |
Es la serie temporal de la frecuencia de rastreo dedicada de Vertex AI de actualización automática, que es la frecuencia de rastreo de Google-CloudVertexBot cuando se establece el rastreo dedicado. La frecuencia de rastreo es para casos de uso de mejor esfuerzo, como la actualización periódica de URLs. |
userTriggeredCrawlErrorRate |
Es la serie temporal de la tasa de error de Vertex AI del rastreo dedicado activado por el usuario. |
autoRefreshCrawlErrorRate |
Es la serie temporal de la tasa de errores de Vertex AI del rastreo dedicado a la actualización automática. |
Estado
Son los diferentes estados de la respuesta.
| Enums | |
|---|---|
STATE_UNSPECIFIED |
El estado no se especifica. |
SUCCEEDED |
El estado es correcto. |
FAILED |
El estado es failed. |