Gemini 2.0 Flash

O Gemini 2.0 Flash oferece funcionalidades de próxima geração e capacidades melhoradas concebidas para a era dos agentes, incluindo velocidade superior, utilização de ferramentas incorporadas, geração multimodal e uma capacidade de resposta de 1 milhão de tokens. O Gemini 2.0 Flash melhora o nosso modelo Flash anterior e oferece uma qualidade melhorada a velocidades semelhantes.

2.0 Flash

Experimentar na Vertex AI Ver no Model Garden (Pré-visualização) Implementar app de exemplo

Nota: para usar a funcionalidade "Implementar app de exemplo", precisa de um projeto do Google Cloud com a faturação e a API Vertex AI ativadas.
ID do modelo gemini-2.0-flash
Entradas e saídas suportadas
  • Entradas:
    Texto, Código, Imagens, Áudio, Vídeo
  • Saídas:
    Texto
Limites de tokens
  • Número máximo de tokens de entrada: 1 048 576
  • Número máximo de tokens de saída: 8192 (predefinição)
Capacidades
Tipos de utilização
Limite de tamanho da entrada 500 MB
Especificações técnicas
Imagens
  • Número máximo de imagens por comando: 3000
  • Tamanho máximo da imagem: 7 MB
  • Máximo de tokens por minuto (TPM) por projeto:
    • Resolução de multimédia alta/média/predefinida:
      • US/Asia: 40 M
      • UE: 10 M
    • Resolução de multimédia baixa:
      • US/Asia: 10 M
      • UE: 2,6 M
  • Tipos MIME suportados:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de ficheiros por comando: 3000
  • Número máximo de páginas por ficheiro: 1000
  • Tamanho máximo do ficheiro por ficheiro para as importações da API ou do Cloud Storage: 50 MB
  • Tamanho máximo do ficheiro por ficheiro para carregamentos diretos através da consola: 7 MB
  • Máximo de tokens por minuto (TPM) por projeto1:
    • US/Asia: 3,4 M
    • UE: 3,4 M
  • Tipos MIME suportados:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Máximo de tokens por minuto (TPM):
    • Resolução de multimédia alta/média/predefinida:
      • US/Asia: 38 M
      • UE: 10 M
    • Resolução de multimédia baixa:
      • US/Asia: 10 M
      • UE: 2,5 M
  • Tipos MIME suportados:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de ficheiros de áudio por comando: 1
  • Compreensão da fala para: Resumo, transcrição e tradução de áudio
  • Máximo de tokens por minuto (TPM):
    • US/Asia: 3,5 M
    • UE: 3,5 M
  • Tipos MIME suportados:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1–8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

(Inclui a quota partilhada dinâmica e o débito aprovisionado)

  • Global
    • Global
  • Estados Unidos
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

Processamento de ML

  • Estados Unidos
    • Multirregião
  • Europa
    • Multirregião
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Junho de 2024
Versões
  • gemini-2.0-flash-001
    • Fase de lançamento: disponível de forma geral
    • Data de lançamento: 5 de fevereiro de 2025
    • Data de descontinuação: 5 de fevereiro de 2026
Controlos de segurança
Previsão online
  • Residência dos dados (em repouso) Compatível
  • Chaves de encriptação geridas pelo cliente (CMEK) Compatível
  • VPC Service Controls Compatível
  • Transparência de acesso (AXT) Suportada
Previsão em lote
  • Residência dos dados (em repouso) Compatível
  • Chaves de encriptação geridas pelo cliente (CMEK) Não suportado
  • VPC Service Controls Compatível
  • Transparência de acesso (AXT) Não suportada
Ajuste
  • Residência dos dados (em repouso) Compatível
  • Chaves de encriptação geridas pelo cliente (CMEK) Compatível
  • VPC Service Controls Compatível
  • Transparência de acesso (AXT) Não suportada
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.

Geração de imagens

Experimentar no Vertex AI

ID do modelo gemini-2.0-flash-preview-image-generation
Entradas e saídas suportadas
  • Entradas:
    Texto, Código, Imagens, Áudio, Vídeo
  • Resultados:
    Texto e imagem
Limites de tokens
  • Máximo de tokens de entrada: 32 768
  • Número máximo de tokens de saída: 8192 (predefinição)
Capacidades
Tipos de utilização
Limite de tamanho da entrada 500 MB
Especificações técnicas
Imagens
  • Número máximo de imagens por comando: 3000
  • Tamanho máximo da imagem: 7 MB
  • Número máximo de imagens de saída por comando: 10
  • Máximo de tokens por minuto (TPM) por projeto:
    • Resolução de multimédia alta/média/predefinida:
      • US/Asia: 40 M
      • UE: 10 M
    • Resolução de multimédia baixa:
      • US/Asia: 10 M
      • UE: 3 M
  • Tipos MIME suportados:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de ficheiros por comando: 3000
  • Número máximo de páginas por ficheiro: 1000
  • Tamanho máximo do ficheiro: 50 MB
  • Tipos MIME suportados:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Máximo de tokens por minuto (TPM):
    • Resolução de multimédia alta/média/predefinida:
      • EUA/Ásia: 37,9 M
      • UE: 9,5 M
    • Resolução de multimédia baixa:
      • US/Asia: 1 G
      • UE: 2,5 M
  • Tipos MIME suportados:
Áudio
  • Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de ficheiros de áudio por comando: 1
  • Compreensão da fala para: Resumo, transcrição e tradução de áudio
  • Máximo de tokens por minuto (TPM):
    • US/Asia: 1,7 M
    • UE: 0,4 M
  • Tipos MIME suportados:
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1–8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

(Inclui a quota partilhada dinâmica e o débito aprovisionado)

  • Global
    • Global
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Agosto de 2024
Versões
  • gemini-2.0-flash-preview-image-generation
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 6 de maio de 2025
    • Data de descontinuação: 31 de outubro de 2025
Controlos de segurança
Previsão online
  • Residência dos dados (em repouso) Não suportado
  • Chaves de encriptação geridas pelo cliente (CMEK) Não suportado
  • VPC Service Controls Compatível
  • Transparência de acesso (AXT) Suportada
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.

API Live

Experimentar no Vertex AI

ID do modelo gemini-2.0-flash-live-preview-04-09
Entradas e saídas suportadas
  • Entradas:
    Áudio, Vídeo
  • Saídas:
    Áudio
Limites de tokens
  • Máximo de tokens de entrada: 32 768
  • Número máximo de tokens de saída: 8192 (predefinição)
Capacidades
Tipos de utilização
Limite de tamanho da entrada 500 MB
Especificações técnicas
Vídeo
  • Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): Aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Máximo de tokens por minuto (TPM):
    • Resolução de multimédia alta/média/predefinida:
      • EUA/Ásia: 37,9 M
      • UE: 9,5 M
    • Resolução de multimédia baixa:
      • US/Asia: 1 G
      • UE: 2,5 M
  • Tipos MIME suportados:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por comando: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de ficheiros de áudio por comando: 1
  • Compreensão da fala para: Resumo, transcrição e tradução de áudio
  • Máximo de tokens por minuto (TPM):
    • US/Asia: 1,7 M
    • UE: 0,4 M
  • Tipos MIME suportados:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Predefinições de parâmetros
  • Temperatura: 0,0 a 2,0 (predefinição: 1,0)
  • topP: 0,0 a 1,0 (predefinição: 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1–8 (predefinição: 1)
Regiões suportadas

Disponibilidade do modelo

  • Estados Unidos
    • us-central1
Consulte o artigo Residência de dados para mais informações.
Data do limite de conhecimento Junho de 2024
Versões
  • gemini-2.0-flash-live-preview-04-09
    • Fase de lançamento: pré-visualização pública
    • Data de lançamento: 9 de abril de 2025
Controlos de segurança
Previsão online
  • Residência dos dados (em repouso) Não suportado
  • Chaves de encriptação geridas pelo cliente (CMEK) Não suportado
  • VPC Service Controls Compatível
  • Transparência de acesso (AXT) Suportada
Consulte os Controlos de segurança para mais informações.
Idiomas suportados Consulte os idiomas suportados.
Preços Consulte os preços.