Gemini 2.0 Flash-Lite

O Gemini 2.0 Flash-Lite é nosso modelo mais rápido do Gemini 2.0, otimizado para eficiência de custo e baixa latência.

Teste na Agent Platform no Model Garden (prévia) Implantar app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto na nuvem do Google Cloud com faturamento e a API Agent Platform ativada.
ID do modelo gemini-2.0-flash-lite
Entradas e saídas compatíveis
  • Entradas:
    texto, código, imagens, áudio, vídeo
  • Saídas:
    Texto
Limites de tokens
  • Máximo de tokens de entrada: 1.048.576
  • Máximo de tokens de saída: 8.192 (padrão)
Recursos
Opções de consumo
Consulte Opções de consumo para mais informações.
Limite de tamanho da entrada 500 MB
Especificações técnicas
Imagens
  • Máximo de imagens por comando: 3.000
  • Tamanho máximo do arquivo para dados inline ou uploads diretos pelo console: 7 MB
  • Tamanho máximo do arquivo por arquivo do Google Cloud Storage: 30 MB
  • Máximo de tokens por minuto (TPM):
    • Resolução de mídia alta/média/padrão:
      • EUA/Ásia: 6,7 milhões
      • UE: 2,6 milhões
    • Resolução de mídia baixa:
      • EUA/Ásia: 2,6 milhões
      • UE: 2,6 milhões
  • Tipos MIME com suporte:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documentos
  • Número máximo de arquivos por comando: 3.000
  • Número máximo de páginas por arquivo: 1.000
  • Tamanho máximo do arquivo por arquivo para a API ou importações do Cloud Storage: 50 MB(application/pdf) ou 7 MB(text/plain)
  • Tamanho máximo do arquivo por arquivo para uploads diretos pelo console: 7 MB
  • Máximo de tokens por minuto (TPM) por projeto1:
    • EUA/Ásia: 3,4 milhões
    • UE: 3,4 milhões
  • Tipos MIME com suporte:
Vídeo
  • Duração máxima do vídeo (com áudio): aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Máximo de tokens por minuto (TPM):
    • Resolução de mídia alta/média/padrão:
      • EUA/Ásia: 6,3 milhões
      • UE: 3,2 milhões
    • Resolução de mídia baixa:
      • EUA/Ásia: 3,2 milhões
      • UE: 3,2 milhões
  • Tipos MIME com suporte:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por solicitação: Aproximadamente 8,4 horas ou até 1 milhão de tokens
  • Número máximo de arquivos de áudio por comando: 1
  • Entendimento de fala para: resumo, transcrição e tradução de áudio
  • Máximo de tokens por minuto (TPM):
    • EUA/Ásia: 3,5 milhões
    • UE: 3,5 milhões
  • Tipos MIME com suporte:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Padrões de parâmetros
  • Temperatura: 0,0 a 2,0 (padrão 1,0)
  • topP: 0,0 a 1,0 (padrão 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (padrão 1)
Regiões compatíveis

Disponibilidade do modelo

  • Global
    • global
  • Estados Unidos
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

Processamento de ML

  • Estados Unidos
    • Multirregional
  • Europa
    • Multirregional
Consulte Implantações e endpoints para mais informações.
Data limite de conhecimento Junho de 2024
Versões
  • gemini-2.0-flash-lite-001
    • Etapa de lançamento: descontinuado
    • Data de lançamento: 25 de fevereiro de 2025
    • Data de descontinuação: 1º de junho de 2026
Idiomas compatíveis Consulte Idiomas compatíveis.
Preços Consulte a seção "Preços".