Ajuste de documentos

Esta página fornece pré-requisitos e instruções detalhadas para o ajuste fino do Gemini em dados de documentos através da aprendizagem supervisionada.

Exemplos de utilização

A otimização permite-lhe personalizar modelos de linguagem avançados para as suas necessidades específicas. Seguem-se alguns exemplos de utilização importantes em que a otimização com o seu próprio conjunto de PDFs pode melhorar significativamente o desempenho de um modelo:

  • Base de conhecimentos interna: converta os seus documentos internos numa base de conhecimentos com tecnologia de IA que fornece respostas e estatísticas instantâneas. Por exemplo, um representante de vendas pode aceder instantaneamente às especificações dos produtos e aos detalhes dos preços de materiais de formação anteriores.
  • Assistente de investigação: crie um assistente de investigação capaz de analisar uma coleção de artigos de investigação, artigos e livros. Um investigador que estuda as alterações climáticas pode analisar rapidamente artigos científicos para identificar tendências no aumento do nível do mar ou avaliar a eficácia de diferentes estratégias de mitigação.
  • Conformidade legal ou regulamentar: a otimização em documentos legais pode ajudar a automatizar a revisão de contratos, sinalizando potenciais inconsistências ou áreas de risco. Isto permite que os profissionais jurídicos se concentrem em tarefas de nível superior, ao mesmo tempo que garantem a conformidade.
  • Geração de relatórios automatizada: automatize a análise de relatórios financeiros complexos, extraindo indicadores essenciais de desempenho e gerando resumos para as partes interessadas. Isto pode poupar tempo e reduzir o risco de erros em comparação com a análise manual.
  • Resumo e análise de conteúdo: resuma documentos PDF longos, extraia estatísticas importantes e analise tendências. Por exemplo, uma equipa de pesquisa de mercado pode analisar uma coleção de inquéritos aos clientes para identificar temas e sentimentos importantes.
  • Comparação de documentos e controlo de versões: compare diferentes versões de um documento para identificar alterações e acompanhar revisões. Isto pode ser particularmente útil em ambientes de colaboração onde vários autores contribuem para um documento.

Limitações

Modelos Gemini 2.5

Especificação Valor
Máximo de páginas PDF por exemplo 300
Número máximo de ficheiros PDF por exemplo 4
Tamanho máximo do ficheiro PDF 20 MB

Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

Especificação Valor
Máximo de páginas PDF por exemplo 300
Número máximo de ficheiros PDF por exemplo 4
Tamanho máximo do ficheiro PDF 20 MB

Para saber mais sobre os requisitos de compreensão de documentos, consulte o artigo Compreensão de documentos.

Formato do conjunto de dados

O fileUri do conjunto de dados pode ser o URI de um ficheiro num contentor do Cloud Storage ou pode ser um URL HTTP ou HTTPS disponível publicamente.

Para ver o exemplo de formato genérico, consulte o Exemplo de conjunto de dados para o Gemini.

Segue-se um exemplo de um conjunto de dados de documentos.

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
            }
        },
        {
          "text": "You are a very professional document summarization specialist. Please summarize the given document."
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
        }
      ]
    }
  ]
}

O que se segue?