Suspensão de uso de modelos (MaaS)

Depois de um período, os modelos de MaaS são descontinuados e substituídos por versões mais recentes. Para que você tenha tempo de testar e migrar para modelos mais recentes, esta página lista todos os modelos descontinuados e a data de desativação deles.

Claude 3.7 Sonnet

O Claude 3.7 Sonnet será descontinuado em 11 de novembro de 2025 e encerrado em 11 de maio de 2026. O Claude 3.7 Sonnet está disponível apenas para clientes atuais.

O Claude 3.7 Sonnet é um modelo de ponta para tarefas de engenharia de software e recursos de agente do mundo real.

ID do modelo claude-3-7-sonnet@20250219
Etapa do lançamento obsoleto
Entradas e saídas compatíveis
  • Entradas:
    Texto, Código, Imagens
  • Saídas:
    Texto
Limites de tokens
  • Máximo de tokens de entrada: 200.000
  • Máximo de tokens de saída: 128.000
Recursos
Tipos de uso
Especificações técnicas
Imagens
  • Limitações e especificações:consulte Vision na documentação da Anthropic.
Documentos
  • Limitações e especificações:consulte Suporte a PDF na documentação da Anthropic.
Data do limite de conhecimento Novembro de 2024
Versões
  • claude-3-7-sonnet@20250219
    • Estágio de criação:descontinuado
    • Data de lançamento:20 de março de 2025
Regiões compatíveis

Disponibilidade do modelo

(Inclui cota fixa e capacidade de processamento provisionada)

  • Estados Unidos
    • us-east5
  • Europa
    • europe-west1
  • Global
    • global endpoint

Processamento de ML

  • Estados Unidos
    • Multi-region
  • Europa
    • Multi-region
Limites de cotas

us-east5:

  • QPM: 55
  • TPM: 500.000 (entrada e saída sem cache)
  • Tamanho do contexto: 200.000

europe-west1:

  • QPM: 40
  • TPM: 300.000 (entrada e saída sem cache)
  • Tamanho do contexto: 200.000

endpoint global:

  • QPM: 35
  • TPM: 300.000 (entrada e saída sem cache)
  • Tamanho do contexto: 200.000

Preços Consulte a seção Preços.

Codestral (25.01)

O Codestral (25.01) será descontinuado em 23 de outubro de 2025 e encerrado em 23 de janeiro de 2026. O Codestral (25.01) está disponível apenas para clientes atuais.

Um modelo de ponta projetado para geração de código, incluindo preenchimento no meio e preenchimento de código.

Ver o card de modelo no Model Garden

ID do modelo codestral-2501
Etapa do lançamento obsoleto
Entradas e saídas compatíveis
  • Entradas:
    Texto, Código
  • Saídas:
    Texto
Tipos de uso
Versões
  • codestral-2501
    • Estágio de lançamento:disponibilidade geral
    • Data de lançamento:13 de janeiro de 2025
Regiões compatíveis

Disponibilidade do modelo

  • Estados Unidos
    • us-central1
  • Europa
    • europe-west4

Processamento de ML

  • Estados Unidos
    • Multi-region
  • Europa
    • Multi-region
Limites de cotas

us-central1:

  • QPM: 60
  • TPM: 400.000
  • Tamanho do contexto: 32.000

europe-west4:

  • QPM: 60
  • TPM: 400.000
  • Tamanho do contexto: 32.000

Preços Consulte a seção Preços.

Mistral Large (24.11)

O Mistral Large (24.11) será descontinuado em 23 de outubro de 2025 e desativado em 23 de janeiro de 2026. O Mistral Large (24.11) está disponível apenas para clientes atuais.

O Mistral Large (24.11) é uma versão do modelo Large da Mistral com recursos aprimorados de raciocínio e chamada de função.

Ver o card de modelo no Model Garden

ID do modelo mistral-large-2411
Etapa do lançamento obsoleto
Entradas e saídas compatíveis
  • Entradas:
    Texto, Código
  • Saídas:
    Texto
Tipos de uso
Versões
  • mistral-large-2411
    • Estágio de lançamento:disponibilidade geral
    • Data de lançamento:21 de novembro de 2024
Regiões compatíveis

Disponibilidade do modelo

  • Estados Unidos
    • us-central1
  • Europa
    • europe-west4

Processamento de ML

  • Estados Unidos
    • Multi-region
  • Europa
    • Multi-region
Limites de cotas

us-central1:

  • QPM: 60
  • TPM: 400.000
  • Tamanho do contexto: 128.000

europe-west4:

  • QPM: 60
  • TPM: 400.000
  • Tamanho do contexto: 128.000

Preços Consulte a seção Preços.

Claude 3.5 Sonnet v2

A versão 2 do Claude 3.5 Sonnet será descontinuada em 20 de agosto de 2025 e desativada em 19 de fevereiro de 2026. O Claude 3.5 Sonnet v2 está disponível apenas para clientes atuais.

O Claude 3.5 Sonnet v2 é um modelo de ponta para tarefas de engenharia de software e recursos de agente do mundo real.

Testar na Vertex AI

ID do modelo claude-3-5-sonnet-v2@20241022
Etapa do lançamento GA
Entradas e saídas compatíveis
  • Entradas:
    Texto, Código, Imagens
  • Saídas:
    Texto
Limites de tokens
  • Máximo de tokens de entrada: 200.000
  • Máximo de tokens de saída: 8.000
Recursos
Tipos de uso
Especificações técnicas
Imagens
  • Limitações e especificações:consulte Vision na documentação da Anthropic.
Documentos
  • Limitações e especificações:consulte Suporte a PDF na documentação da Anthropic.
Data do limite de conhecimento Agosto de 2024
Versões
  • claude-3-5-sonnet-v2@20241022
    • Estágio de lançamento:disponibilidade geral
    • Data de lançamento:22 de outubro de 2024
Regiões compatíveis

Disponibilidade do modelo

(Inclui cota fixa e capacidade de processamento provisionada)

  • Estados Unidos
    • us-east5
  • Europa
    • europe-west1
  • Global
    • global endpoint

Processamento de ML

  • Estados Unidos
    • Multi-region
  • Europa
    • Multi-region
Limites de cotas

us-east5:

  • QPM: 90
  • TPM: 540.000 (entrada e saída)
  • Tamanho do contexto: 200.000

europe-west1:

  • QPM: 55
  • TPM: 330.000 (entrada e saída)
  • Tamanho do contexto: 200.000

endpoint global:

  • QPM: 25
  • TPM: 140.000 (entrada e saída)
  • Tamanho do contexto: 200.000

Preços Consulte a seção Preços.

Claude 3.5 Sonnet

O Claude 3.5 Sonnet será descontinuado em 20 de agosto de 2025 e será desativado em 19 de fevereiro de 2026. O Claude 3.5 Sonnet está disponível apenas para clientes atuais.

O Claude 3.5 Sonnet supera o Claude 3 Opus da Anthropic em uma ampla variedade de avaliações da Anthropic com a velocidade e o custo do modelo de nível médio da Anthropic, o Claude 3 Sonnet.

ID do modelo claude-3-5-sonnet@20240620
Etapa do lançamento GA
Entradas e saídas compatíveis
  • Entradas:
    Texto, Código, Imagens
  • Saídas:
    Texto
Limites de tokens
  • Máximo de tokens de entrada: 200.000
  • Máximo de tokens de saída: 8.000
Recursos
Tipos de uso
Especificações técnicas
Imagens
  • Limitações e especificações:consulte Vision na documentação da Anthropic.
Documentos
  • Limitações e especificações:consulte Suporte a PDF na documentação da Anthropic.
Data do limite de conhecimento Abril de 2024
Versões
  • claude-3-5-sonnet@20240620
    • Estágio de lançamento:disponibilidade geral
    • Data de lançamento:20 de junho de 2024
Regiões compatíveis

Disponibilidade do modelo

(Inclui cota fixa e capacidade de processamento provisionada)

  • Estados Unidos
    • us-east5
  • Europa
    • europe-west1
  • Ásia-Pacífico
    • asia-southeast1

Processamento de ML

  • Estados Unidos
    • Multi-region
  • Europa
    • Multi-region
  • Ásia-Pacífico
    • asia-southeast1
Limites de cotas

us-east5:

  • QPM: 80
  • TPM: 350.000 (entrada e saída)
  • Tamanho do contexto: 200.000

europe-west1:

  • QPM: 130
  • TPM: 600.000 (entrada e saída)
  • Tamanho do contexto: 200.000

asia-southeast1:

  • QPM: 35
  • TPM: 150.000 (entrada e saída)
  • Tamanho do contexto: 200.000

Preços Consulte a seção Preços.

Jamba 1.5 Large

O Jamba 1.5 Large será descontinuado em 27 de agosto de 2025 e desativado em 27 de fevereiro de 2026. O Jamba 1.5 Large está disponível apenas para clientes atuais.

O Jamba 1.5 Large da AI21 Labs tem equilíbrio entre qualidade, capacidade de processamento e custo.

Ver o card de modelo no Model Garden

ID do modelo jamba-1.5-large
Etapa do lançamento Visualizar
Entradas e saídas compatíveis
  • Entradas:
    Texto, Documentos
  • Saídas:
    Texto
Tipos de uso
Data do limite de conhecimento Março de 2024
Versões
  • jamba-1.5-large
    • Estágio de lançamento:prévia
    • Data de lançamento:22 de agosto de 2024
Regiões compatíveis

Disponibilidade do modelo

  • Estados Unidos
    • us-central1
  • Europa
    • europe-west4

Processamento de ML

  • Estados Unidos
    • Multi-region
Limites de cotas

us-central1:

  • QPM: 20
  • TPM: 20.000
  • Tamanho do contexto: 256.000

europe-west4:

  • QPM: 20
  • TPM: 20.000
  • Tamanho do contexto: 256.000

Preços Consulte a seção Preços.

Jamba 1.5 Mini

O Jamba 1.5 Mini será descontinuado em 27 de agosto de 2025 e encerrado em 27 de fevereiro de 2026. O Jamba 1.5 Mini está disponível apenas para clientes atuais.

O Jamba 1.5 Mini da AI21 Labs tem equilíbrio entre qualidade, capacidade de processamento e custo.

Ver o card de modelo no Model Garden

ID do modelo jamba-1.5-mini
Etapa do lançamento Visualizar
Entradas e saídas compatíveis
  • Entradas:
    Texto, Documentos
  • Saídas:
    Texto
Tipos de uso
Data do limite de conhecimento Março de 2024
Versões
  • jamba-1.5-mini
    • Estágio de lançamento:prévia
    • Data de lançamento:22 de agosto de 2024
Regiões compatíveis

Disponibilidade do modelo

  • Estados Unidos
    • us-central1
  • Europa
    • europe-west4

Processamento de ML

  • Estados Unidos
    • Multi-region
Limites de cotas

us-central1:

  • QPM: 50
  • TPM: 60.000
  • Tamanho do contexto: 256.000

europe-west4:

  • QPM: 50
  • TPM: 60.000
  • Tamanho do contexto: 256.000

Preços Consulte a seção Preços.

Claude 3 Opus

O Claude 3 Opus da Anthropic foi descontinuado em 30 de junho de 2025 e será desativado em 1º de agosto de 2025. O Claude 3 Opus está disponível apenas para clientes atuais.

O Claude 3 Opus da Anthropic é um modelo de IA poderoso com desempenho de alto nível em tarefas altamente complexas. Ele é capaz de lidar com comandos abertos e cenários não vistos com fluência notável e de compreensão semelhante à humana. O Claude 3 Opus é otimizado para os seguintes casos de uso:

  • Automação de tarefas, como programação e planejamento interativos, ou execução de ações complexas em APIs e bancos de dados.

  • Tarefas de pesquisa e desenvolvimento, como revisão de pesquisa, brainstorming, geração de hipóteses e teste de produtos.

  • Tarefas estratégicas, como análise avançada de gráficos, finanças e tendências de mercado, e previsões.

  • Tarefas de visão, como processar imagens para retornar saídas de texto. Além disso, análise de tabelas, gráficos, diagramas técnicos, relatórios e outros conteúdos visuais.

ID do modelo claude-3-opus@20240229
Etapa do lançamento obsoleto
Entradas e saídas compatíveis
  • Entradas:
    Texto, Código, Imagens
  • Saídas:
    Texto
Limites de tokens
  • Máximo de tokens de entrada: 200.000
  • Máximo de tokens de saída: 8.000
Recursos
Tipos de uso
Especificações técnicas
Imagens
  • Limitações e especificações:consulte Vision na documentação da Anthropic.
Documentos
  • Limitações e especificações:consulte Suporte a PDF na documentação da Anthropic.
Data do limite de conhecimento Agosto de 2023
Versões
  • claude-3-opus@20240229
    • Estágio de criação:descontinuado
    • Data de lançamento:31 de maio de 2024
Regiões compatíveis

Disponibilidade do modelo

(Inclui cota fixa e capacidade de processamento provisionada)

  • Estados Unidos
    • us-east5

Processamento de ML

  • Estados Unidos
    • Multi-region
Limites de cotas

us-east5:

  • QPM: 20
  • TPM: 105.000 (entrada e saída)
  • Tamanho do contexto: 200.000

Preços Consulte a seção Preços.