Esta página fornece pré-requisitos e instruções detalhadas para o ajuste fino do Gemini em dados de documentos através da aprendizagem supervisionada.
Exemplos de utilização
A otimização permite-lhe personalizar modelos de linguagem avançados para as suas necessidades específicas. Seguem-se alguns exemplos de utilização importantes em que a otimização com o seu próprio conjunto de PDFs pode melhorar significativamente o desempenho de um modelo:
- Base de conhecimentos interna: converta os seus documentos internos numa base de conhecimentos com tecnologia de IA que fornece respostas e estatísticas instantâneas. Por exemplo, um representante de vendas pode aceder instantaneamente às especificações dos produtos e aos detalhes dos preços de materiais de formação anteriores.
- Assistente de investigação: crie um assistente de investigação capaz de analisar uma coleção de artigos de investigação, artigos e livros. Um investigador que estuda as alterações climáticas pode analisar rapidamente artigos científicos para identificar tendências no aumento do nível do mar ou avaliar a eficácia de diferentes estratégias de mitigação.
- Conformidade legal ou regulamentar: a otimização em documentos legais pode ajudar a automatizar a revisão de contratos, sinalizando potenciais inconsistências ou áreas de risco. Isto permite que os profissionais jurídicos se concentrem em tarefas de nível superior, ao mesmo tempo que garantem a conformidade.
- Geração de relatórios automatizada: automatize a análise de relatórios financeiros complexos, extraindo indicadores essenciais de desempenho e gerando resumos para as partes interessadas. Isto pode poupar tempo e reduzir o risco de erros em comparação com a análise manual.
- Resumo e análise de conteúdo: resuma documentos PDF longos, extraia estatísticas importantes e analise tendências. Por exemplo, uma equipa de pesquisa de mercado pode analisar uma coleção de inquéritos aos clientes para identificar temas e sentimentos importantes.
- Comparação de documentos e controlo de versões: compare diferentes versões de um documento para identificar alterações e acompanhar revisões. Isto pode ser particularmente útil em ambientes de colaboração onde vários autores contribuem para um documento.
Limitações
Modelos Gemini 2.5
Especificação | Valor |
---|---|
Máximo de páginas PDF por exemplo | 300 |
Número máximo de ficheiros PDF por exemplo | 4 |
Tamanho máximo do ficheiro PDF | 20 MB |
Gemini 2.0 Flash
Gemini 2.0 Flash-Lite
Especificação | Valor |
---|---|
Máximo de páginas PDF por exemplo | 300 |
Número máximo de ficheiros PDF por exemplo | 4 |
Tamanho máximo do ficheiro PDF | 20 MB |
Para saber mais sobre os requisitos de compreensão de documentos, consulte o artigo Compreensão de documentos.
Formato do conjunto de dados
O fileUri
do conjunto de dados pode ser o URI de um ficheiro num contentor do Cloud Storage ou pode ser um URL HTTP ou HTTPS disponível publicamente.
Para ver o exemplo de formato genérico, consulte o Exemplo de conjunto de dados para o Gemini.
Segue-se um exemplo de um conjunto de dados de documentos.
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist. Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
O que se segue?
- Para saber mais sobre a capacidade de compreensão de documentos dos modelos Gemini, consulte a vista geral da compreensão de documentos.
- Para começar a otimizar, consulte o artigo Otimize os modelos do Gemini através da otimização precisa supervisionada
- Para saber como a otimização precisa supervisionada pode ser usada numa solução que cria uma base de conhecimentos de IA generativa, consulte o artigo Solução de arranque rápido: base de conhecimentos de IA generativa.