Interpretare i risultati delle previsioni dai modelli di rilevamento di oggetti immagine

Se richiedi una previsione, Gemini Enterprise Agent Platform restituisce i risultati in base all'obiettivo del tuo modello. Le risposte di previsione del rilevamento di oggetti di immagini AutoML restituiscono tutti gli oggetti trovati in un'immagine. Ogni oggetto trovato ha un'annotazione (etichetta e riquadro di delimitazione normalizzato) con un punteggio di confidenza corrispondente. Il riquadro di delimitazione è scritto come segue:

"bboxes": [ [xMin, xMax, yMin, yMax], ...]

Dove xMin, xMax sono i valori x minimo e massimo e yMin, yMax sono i valori y minimo e massimo rispettivamente.

Esempio di output di previsioni in batch

Le risposte di previsione batch del rilevamento di oggetti di immagini AutoML vengono archiviate come file JSON Lines nei bucket Cloud Storage. Ogni riga del file JSON Lines file contiene tutti gli oggetti trovati in un singolo file immagine. Ogni oggetto trovato ha un'annotazione (etichetta e riquadro di delimitazione normalizzato) con un punteggio di confidenza corrispondente.

Importante : i riquadri di delimitazione sono specificati come segue:

"bboxes": [ [xMin, xMax, yMin, yMax], ...]

Dove xMin e xMax sono i valori x minimo e massimo e yMin e yMax sono i valori y minimo e massimo rispettivamente.

{
  "instance": {"content": "gs://bucket/image.jpg", "mimeType": "image/jpeg"},
  "prediction": {
    "ids": [1, 2],
    "displayNames": ["cat", "dog"],
    "bboxes":  [
      [0.1, 0.2, 0.3, 0.4],
      [0.2, 0.3, 0.4, 0.5]
    ],
    "confidences": [0.7, 0.5]
  }
}