Cuenta tokens para modelos de Claude

El extremo count-tokens te permite determinar la cantidad de tokens en un mensaje antes de enviarlo a Claude, lo que te ayuda a tomar decisiones fundamentadas sobre tus instrucciones y tu uso.

No se aplican cargos por usar el extremo de count-tokens.

Modelos de Claude compatibles

Los siguientes modelos admiten el recuento de tokens:

Regiones admitidas

Las siguientes regiones admiten el recuento de tokens:

us-east5
europe-west1
asia-east1
asia-southeast1
us-central1
europe-west4

Cómo contar tokens en mensajes básicos

Para contar tokens, envía una solicitud rawPredict al extremo count-tokens. El cuerpo de la solicitud debe contener el ID del modelo con el que deseas contar los tokens.

REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

LOCATION: Es una región que admite modelos de Claude Anthropic. Para usar el extremo global, consulta Cómo especificar el extremo global.
MODEL: El modelo con el que se comparará el recuento de tokens.
ROLE: El rol asociado a un mensaje. Puedes especificar un user o un assistant. El primer mensaje debe usar el rol user. Los modelos de Claude operan con turnos alternativos de user y assistant. Si el mensaje final usa el rol assistant, el contenido de la respuesta continúa inmediatamente desde el contenido de ese mensaje. Puedes usar esto para restringir parte de la respuesta del modelo.
CONTENT: el contenido, como texto, del mensaje user o assistant.

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict

Cuerpo JSON de la solicitud:

{
  "model": "MODEL",
  "messages": [
    {
      "role": "user",
      "content":"how many tokens are in this request?"
    }
  ],
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Nota: Con el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login, o a través del uso de Cloud Shell, que accede de forma automática a la CLI de gcloud. Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict"

PowerShell

Nota: En el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login . Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/anthropic/models/count-tokens:rawPredict" | Select-Object -Expand Content

Deberías recibir una respuesta JSON similar a la que se muestra a continuación:

Respuesta

{ "input_tokens": 14 }

Para obtener información sobre cómo contar tokens en mensajes con herramientas, imágenes y PDFs, consulta la documentación de Anthropic.

Cuotas

De forma predeterminada, la cuota para el extremo count-tokens es de 2,000 solicitudes por minuto.

Cuenta tokens para modelos de Claude Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Modelos de Claude compatibles

Regiones admitidas

Cómo contar tokens en mensajes básicos

REST

curl

PowerShell

Respuesta

Cuotas

Cuenta tokens para modelos de Claude