Esta página foi traduzida pela API Cloud Translation.

API MedLM

Exclusão de responsabilidade: o MedLM no Vertex AI está geralmente disponível (GA) nos EUA, no Brasil e em Singapura para um grupo limitado de clientes, e está disponível em pré-visualização para um grupo limitado de clientes fora dos EUA. Esta versão foca-se na utilização de Perg e Resp médicas e Resumo médico. Ao usar a API MedLM, aceita a Política de Utilização Proibida da IA Generativa e os Termos Específicos do Serviço da Google Cloud Platform, e aceita notificar e coordenar com a Google de boa-fé para resolver quaisquer consultas regulamentares relativas à sua utilização do MedLM. Para este produto, pode tratar dados pessoais conforme descrito nos Termos de Segurança de Tratamento de Dados, sujeito às restrições descritas nos Termos de Utilização da Google Cloud Platform. Para mais informações, consulte as descrições das fases de lançamento. Desde que celebre um Contrato de Associado Comercial com a Google que abranja a sua utilização dos serviços da Google Cloud Platform, a API MedLM pode ser utilizada para processar informações de saúde protegidas sujeitas à Lei de Portabilidade e Responsabilidade dos Seguros de Saúde (HIPAA) de 1996 e/ou quaisquer alterações ou regulamentos ao abrigo da HIPAA.

Atenção:

Antes de ativar a utilização em produção do MedLM, os clientes têm de contactar a equipa de produtos da Google para debater a utilização.
O MedLM não foi concebido nem desenvolvido para ser utilizado como um dispositivo médico. Qualquer resultado deve ser validado por um profissional de saúde (HCP) e não deve ser reivindicado nenhum diagnóstico direto.
Os resultados gerados podem nem sempre ser totalmente fiáveis. Devido à natureza dos GMLs e da IA generativa, os resultados podem ter informações incorretas ou tendenciosas (por exemplo, estereótipos ou outro conteúdo prejudicial) e devem ser revistos. Todos os resumos ou respostas devem ser considerados rascunhos e não finais.
Se a Vertex AI detetar conteúdo que viole as nossas políticas, incluindo a Política de Utilização Aceitável da Google Cloud Platform e a Política de Utilização Proibida da IA Generativa, não é devolvida uma resposta.
Quando usado por profissionais de saúde para fins de perguntas e respostas, o MedLM destina-se apenas a ser usado como uma ferramenta educativa para formação médica ou para reforçar a formação anterior do profissional de saúde.
A saída do MDI/CE pode não seguir o formato exato apresentado no comando. O design do comando para extrair informações de cada campo deve ter em conta que o formato pode desviar-se do original (por exemplo, travessões nos nomes dos campos, utilização exata de maiúsculas e minúsculas).

O MedLM é uma família de modelos de base ajustados para a indústria de cuidados de saúde. O Med-PaLM 2 é um dos modelos baseados em texto desenvolvidos pela Google Research que alimenta o MedLM e foi o primeiro sistema de IA a atingir o nível de especialista humano na resposta a perguntas no estilo do Exame de Licenciamento Médico nos EUA (USMLE). O desenvolvimento destes modelos foi informado por necessidades específicas dos clientes, como responder a perguntas médicas e criar resumos.

Cartão do modelo MedLM

A ficha do modelo MedLM descreve os detalhes do modelo, como a utilização pretendida do MedLM, a vista geral dos dados e as informações de segurança. Clique no seguinte link para transferir uma versão PDF do cartão do modelo MedLM:

Transfira o cartão do modelo MedLM

Exemplos de utilização

Respostas a perguntas: fornecer rascunhos de respostas a perguntas relacionadas com medicina, apresentadas como texto.
Resumo: crie um rascunho de uma versão mais curta de um documento (como um resumo pós-consulta ou uma nota de histórico e exame físico) que incorpore informações pertinentes do texto original.

Para mais informações sobre a conceção de comandos de texto, consulte o artigo Vista geral das estratégias de comandos.

Pedido HTTP

MedLM-medium (medlm-medium):

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-medium:predict

MedLM-large (medlm-large):

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-large:predict

Consulte o método predict para mais informações.

Versões do modelo

O MedLM oferece os seguintes modelos:

MedLM-medium (medlm-medium)
MedLM-large (medlm-large)

A tabela seguinte contém as versões estáveis do modelo disponíveis:

Modelo medlm-medium	Data de lançamento
`medlm-medium`	13 de dezembro de 2023

Modelo medlm-large	Data de lançamento
`medlm-large`	13 de dezembro de 2023

O MedLM-medium e o MedLM-large têm pontos finais separados e oferecem aos clientes flexibilidade adicional para os respetivos exemplos de utilização. O MedLM-medium oferece aos clientes melhores rendimentos e inclui dados mais recentes. O MedLM-large é o mesmo modelo da fase de pré-visualização. Ambos os modelos vão continuar a ser atualizados ao longo do ciclo de vida do produto. Nesta página, "MedLM" refere-se a ambos os modelos.

Para mais informações, consulte o artigo Versões e ciclo de vida dos modelos.

Filtros e atributos de segurança do MedLM

O conteúdo processado através da API MedLM é avaliado em função de uma lista de atributos de segurança, incluindo "categorias prejudiciais" e tópicos que podem ser considerados sensíveis. Se estiver a ver uma resposta alternativa, como "Não posso ajudar com isso, uma vez que sou apenas um modelo de linguagem", significa que o comando ou a resposta está a acionar um filtro de segurança.

Limites de segurança

Quando usa o Vertex AI Studio, pode usar um limite de filtro de segurança ajustável para determinar a probabilidade de ver respostas que possam ser prejudiciais. As respostas do modelo são bloqueadas com base na probabilidade de conterem assédio, incitamento ao ódio, conteúdo perigoso ou conteúdo sexualmente explícito. A definição do filtro de segurança encontra-se no lado direito do campo de comando no Vertex AI Studio. Pode escolher entre três opções: block most, block some e block few.

Console-image

Testar os limites de confiança e gravidade

Pode testar os filtros de segurança da Google e definir limites de confiança adequados para a sua empresa. Ao usar estes limites, pode tomar medidas abrangentes para detetar conteúdo que viole as políticas de utilização ou os termos de serviço da Google e tomar as medidas adequadas.

As pontuações de confiança são apenas previsões e não deve depender das pontuações para fiabilidade ou precisão. A Google não é responsável pela interpretação nem pela utilização destas classificações para decisões empresariais.

Práticas recomendadas

Para utilizar esta tecnologia de forma segura e responsável, é importante considerar outros riscos específicos do seu exemplo de utilização, utilizadores e contexto empresarial, além das salvaguardas técnicas incorporadas.

Recomendamos que siga os seguintes passos:

Avalie os riscos de segurança da sua aplicação.
Considere fazer ajustes para mitigar os riscos de segurança.
Realize testes de segurança adequados ao seu exemplo de utilização.
Solicitar feedback dos utilizadores e monitorizar o conteúdo.

Para saber mais, consulte as recomendações da Google para IA responsável.

Corpo do pedido

{
  "instances": [
    {
      "content": string
    }
  ],
  "parameters": {
    "temperature": number,
    "maxOutputTokens": integer,
    "topK": integer,
    "topP": number
  }
}

Use os seguintes parâmetros para os modelos medlm-medium e medlm-large. Para mais informações, consulte o artigo Crie comandos de texto.

Parâmetro	Descrição	Valores aceitáveis
`content`	Introdução de texto para gerar a resposta do modelo. Os comandos podem incluir preâmbulos, perguntas, sugestões, instruções ou exemplos.	Texto
`temperature`	A temperatura é usada para a amostragem durante a geração de respostas, que ocorre quando são aplicados os parâmetros `topP` e `topK`. A temperatura controla o grau de aleatoriedade na seleção de tokens. As temperaturas mais baixas são adequadas para comandos que requerem uma resposta menos aberta ou criativa, enquanto as temperaturas mais altas podem gerar resultados mais diversos ou criativos. Uma temperatura de `0` significa que os tokens de maior probabilidade são sempre selecionados. Neste caso, as respostas a um determinado comando são maioritariamente determinísticas, mas ainda é possível uma pequena variação. Se o modelo devolver uma resposta demasiado genérica, demasiado curta ou uma resposta alternativa, experimente aumentar a temperatura. Se o modelo entrar na geração infinita, aumentar a temperatura para, pelo menos, `0.1` pode levar a melhores resultados. `1.0` é o valor inicial recomendado para a temperatura.	`0.0–1.0` `Default: 0.2`
`maxOutputTokens`	Número máximo de tokens que podem ser gerados na resposta. Um token tem aproximadamente quatro carateres. 100 tokens correspondem a cerca de 60 a 80 palavras. Especifique um valor inferior para respostas mais curtas e um valor superior para respostas potencialmente mais longas.	`1–8192` para medlm-medium `1–1024` para medlm-large
`topK`	O Top-K altera a forma como o modelo seleciona tokens para a saída. Um top-K de `1` significa que o token selecionado seguinte é o mais provável entre todos os tokens no vocabulário do modelo (também denominado descodificação gananciosa), enquanto um top-K de `3` significa que o token seguinte é selecionado entre os três tokens mais prováveis através da temperatura. Para cada passo de seleção de tokens, são selecionados os K principais tokens com as probabilidades mais elevadas. Em seguida, os tokens são filtrados com base no top-P, com o token final selecionado através da amostragem de temperatura. Especifique um valor inferior para respostas menos aleatórias e um valor superior para respostas mais aleatórias.	`1–40` `Default: 40`
`topP`	O Top-P altera a forma como o modelo seleciona tokens para a saída. Os tokens são selecionados do mais provável para o menos provável até que a soma das respetivas probabilidades seja igual ao valor de Top-P. Por exemplo, se os tokens A, B e C tiverem uma probabilidade de 0,3, 0,2 e 0,1 e o valor de top-P for `0.5`, o modelo seleciona A ou B como o token seguinte através da temperatura e exclui C como um candidato. Especifique um valor inferior para respostas menos aleatórias e um valor superior para respostas mais aleatórias.	`0.0–1.0` `Default: 0.8`

Exemplo de pedido

Quando usar a API MedLM, é importante incorporar a engenharia de comandos. Por exemplo, recomendamos vivamente que forneça instruções adequadas e específicas da tarefa no início de cada comando. Para mais informações, consulte o artigo Introdução aos comandos.

REST

Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:

PROJECT_ID: o seu ID do projeto.
MEDLM_MODEL: o modelo MedLM, medlm-medium ou medlm-large.

Método HTTP e URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict

Corpo JSON do pedido:

{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}

Para enviar o seu pedido, escolha uma destas opções:

curl

Nota: O comando seguinte pressupõe que tem sessão iniciada na CLI gcloud com a sua conta de utilizador executando gcloud init ou gcloud auth login, ou usando o Cloud Shell, que inicia sessão automaticamente na CLI gcloud. Pode verificar a conta atualmente ativa executando o comando gcloud auth list.

Guarde o corpo do pedido num ficheiro denominado request.json. Execute o seguinte comando no terminal para criar ou substituir este ficheiro no diretório atual:

cat > request.json << 'EOF'
{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}
EOF

Em seguida, execute o seguinte comando para enviar o seu pedido REST:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict"

PowerShell

Nota: O comando seguinte pressupõe que iniciou sessão na CLI do Google Ads com a sua conta de utilizador executando gcloud init ou gcloud auth login.gcloud Pode verificar a conta atualmente ativa executando o comando gcloud auth list.