Os modelos DeepSeek estão disponíveis para utilização como APIs geridas e modelos implementados autonomamente no Vertex AI. Pode transmitir as suas respostas para reduzir a perceção de latência do utilizador final. Uma resposta transmitida usa eventos enviados pelo servidor (SSE) para transmitir a resposta de forma incremental.
Modelos DeepSeek geridos
Os modelos DeepSeek oferecem modelos totalmente geridos e sem servidor como APIs. Para usar um modelo DeepSeek no Vertex AI, envie um pedido diretamente para o ponto final da API Vertex AI. Quando usa os modelos DeepSeek como uma API gerida, não tem de aprovisionar nem gerir a infraestrutura.
Os seguintes modelos estão disponíveis na DeepSeek para utilização no Vertex AI. Para aceder a um modelo DeepSeek, aceda ao respetivo cartão de modelo do Model Garden.
DeepSeek-OCR
O DeepSeek-OCR é um modelo de reconhecimento ótico de carateres (OCR) abrangente que analisa e compreende documentos complexos. É excelente em tarefas de OCR desafiantes, incluindo o reconhecimento de fórmulas matemáticas e o processamento de texto curvo, rodado ou sobreposto.
Aceda ao cartão do modelo DeepSeek-OCR
DeepSeek-V3.2
O DeepSeek-V3.2 é um modelo que harmoniza a elevada eficiência computacional com um raciocínio e um desempenho do agente superiores. A abordagem da DeepSeek baseia-se em três avanços técnicos importantes: DeepSeek Sparse Attention (DSA), framework de aprendizagem por reforço escalável e pipeline de síntese de tarefas de agentes em grande escala.
Aceda ao cartão do modelo DeepSeek-V3.2
DeepSeek-V3.1
O DeepSeek-V3.1 é um modelo híbrido que suporta o modo de raciocínio e o modo sem raciocínio. Em comparação com a versão anterior, esta atualização traz melhorias nos modos de raciocínio híbrido, na chamada de ferramentas e na eficiência do raciocínio.
Aceda ao cartão do modelo DeepSeek-V3.1
DeepSeek R1 (0528)
O DeepSeek R1 (0528) é a versão mais recente do modelo DeepSeek R1. Em comparação com o DeepSeek-R1, melhorou significativamente a profundidade do raciocínio e as capacidades de inferência. O DeepSeek R1 (0528) destaca-se numa vasta gama de tarefas, como escrita criativa, resposta a perguntas gerais, edição e resumo.
Considerações
- Para uma segurança pronta para produção, integre o DeepSeek R1 (0528) com o Model Armor, que analisa as respostas e os comandos dos MDIs para vários riscos de segurança.
Aceda ao cartão do modelo DeepSeek R1 (0528)
Use modelos DeepSeek
Para modelos geridos, pode usar comandos curl para enviar pedidos para o endpoint do Vertex AI com os seguintes nomes de modelos:
- Para o DeepSeek-OCR, use
deepseek-ocr-maas - Para o DeepSeek-V3.2, use
deepseek-v3.2-maas - Para o DeepSeek-V3.1, use
deepseek-v3.1-maas - Para o DeepSeek R1 (0528), use
deepseek-r1-0528-maas
Para saber como fazer chamadas de streaming e não streaming para os modelos DeepSeek, consulte o artigo Chame APIs de modelos abertos.
Para usar um modelo do Vertex AI implementado autonomamente:
- Navegue para a consola do Model Garden.
- Encontre o modelo do Vertex AI relevante.
- Clique em Ativar e preencha o formulário fornecido para obter as licenças de utilização comercial necessárias.
Para mais informações sobre a implementação e a utilização de modelos de parceiros, consulte o artigo Implemente um modelo de parceiro e faça pedidos de previsão.
Disponibilidade regional e quotas do modelo DeepSeek
Para os modelos DeepSeek, aplica-se uma quota a cada região onde o modelo está disponível. A quota é especificada em consultas por minuto (QPM).
| Modelo | Região | Quotas | Comprimento do contexto |
|---|---|---|---|
| DeepSeek-OCR | |||
us-central1 |
|
8192 | |
| DeepSeek-V3.2 | |||
global |
|
163 840 | |
| DeepSeek-V3.1 | |||
us-west2 |
|
163 840 | |
| DeepSeek R1 (0528) | |||
us-central1 |
|
163 840 |
Se quiser aumentar alguma das suas quotas para a IA generativa no Vertex AI, pode usar a Google Cloud consola para pedir um aumento da quota. Para saber mais sobre as quotas, consulte a vista geral das quotas do Google Cloud.
O que se segue?
- Saiba como chamar APIs de modelos abertos.