El endpoint count-tokens te permite determinar el número de tokens de un mensaje antes de enviarlo a Claude, lo que te ayuda a tomar decisiones fundamentadas sobre tus peticiones y tu uso.
El endpoint count-tokens no tiene ningún coste.
Modelos de Claude admitidos
Los siguientes modelos admiten el recuento de tokens:
- Claude Opus 4.5
- Claude Opus 4.1
- Claude Opus 4
- Claude Sonnet 4.5
- Claude Sonnet 4
- Claude Haiku 4.5
- Claude 3.5 Haiku
- Claude 3 Haiku
Regiones disponibles
Las siguientes regiones admiten tokens de recuento:
us-east5europe-west1asia-east1asia-southeast1us-central1europe-west4
Contar tokens en mensajes básicos
Para contar tokens, envía una solicitud rawPredict al endpoint count-tokens. El cuerpo de la solicitud debe contener el ID del modelo con el que quieres contar los tokens.
REST
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- LOCATION: Una región que admita los modelos Claude de Anthropic. Para usar el endpoint global, consulta Especificar el endpoint global.
- MODEL: el modelo con el que se van a contar los tokens.
- ROLE: el rol asociado a un mensaje. Puedes especificar un
usero unassistant. El primer mensaje debe usar el roluser. Los modelos de Claude funcionan con turnos alternos deuseryassistant. Si el mensaje final usa el rolassistant, el contenido de la respuesta continúa inmediatamente después del contenido de ese mensaje. Puedes usarlo para restringir parte de la respuesta del modelo. - CONTENT: el contenido, como el texto, del mensaje
useroassistant.
Método HTTP y URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict
Cuerpo JSON de la solicitud:
{
"model": "MODEL",
"messages": [
{
"role": "user",
"content":"how many tokens are in this request?"
}
],
}
Para enviar tu solicitud, elige una de estas opciones:
curl
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict"
PowerShell
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict" | Select-Object -Expand Content
Deberías recibir una respuesta JSON similar a la siguiente.
Para obtener información sobre cómo contar tokens en mensajes con herramientas, imágenes y PDFs, consulta la documentación de Anthropic.
Cuotas
De forma predeterminada, la cuota del endpoint count-tokens es de 2000 solicitudes por minuto.