Interpreta i risultati delle previsioni dei modelli di rilevamento di oggetti immagine

Se richiedi una previsione, Gemini Enterprise Agent Platform restituisce i risultati in base all'obiettivo del modello. Le risposte di previsione del rilevamento di oggetti immagine AutoML restituiscono tutti gli oggetti trovati in un'immagine. Ogni oggetto trovato ha un'annotazione (etichetta e riquadro di delimitazione normalizzato) con un punteggio di confidenza corrispondente. Il riquadro di delimitazione è scritto come segue:

"bboxes": [ [xMin, xMax, yMin, yMax], ...]

dove xMin, xMax sono i valori minimi e massimi di x e yMin, yMax sono i valori minimi e massimi di y, rispettivamente.

Esempio di output di previsioni in batch

Le risposte di previsione del rilevamento di oggetti immagine AutoML batch vengono archiviate come file JSON Lines nei bucket Cloud Storage. Ogni riga del file JSON Lines contiene tutti gli oggetti trovati in un singolo file immagine. Ogni oggetto trovato ha un'annotazione (etichetta e riquadro di delimitazione normalizzato) con un punteggio di confidenza corrispondente.

Importante: i riquadri di selezione sono specificati come:

"bboxes": [ [xMin, xMax, yMin, yMax], ...]

dove xMin e xMax sono i valori x minimo e massimo e yMin e yMax sono i valori y minimo e massimo rispettivamente.

{
  "instance": {"content": "gs://bucket/image.jpg", "mimeType": "image/jpeg"},
  "prediction": {
    "ids": [1, 2],
    "displayNames": ["cat", "dog"],
    "bboxes":  [
      [0.1, 0.2, 0.3, 0.4],
      [0.2, 0.3, 0.4, 0.5]
    ],
    "confidences": [0.7, 0.5]
  }
}