解讀圖片物件偵測模型的預測結果

提出預測要求後,Gemini Enterprise Agent Platform 會根據模型的目標傳回結果。AutoML 圖片物件偵測預測回應會傳回圖片中找到的所有物件。每個找到的物件都有註解 (標籤和標準化定界框),以及相應的可信度分數。定界框的寫法如下:

"bboxes": [ [xMin, xMax, yMin, yMax], ...]

其中 xMin, xMax 分別是 x 值的最小值和最大值, yMin, yMax 分別是 y 值的最小值和最大值。

批次預測輸出內容範例

批次 AutoML 圖片物件偵測預測回應會以 JSON Lines 檔案的形式,儲存在 Cloud Storage 值區中。JSON Lines 檔案的每一行都包含單一圖片檔案中找到的所有物件。每個找到的物件都有註解 (標籤和標準化邊界方塊),以及對應的信賴分數。

重要事項: 指定的邊界框格式如下:

"bboxes": [ [xMin, xMax, yMin, yMax], ...]

其中 xMinxMax 分別是 x 值的最小值和最大值, yMinyMax 則是 y 值的最小值和最大值。

{
  "instance": {"content": "gs://bucket/image.jpg", "mimeType": "image/jpeg"},
  "prediction": {
    "ids": [1, 2],
    "displayNames": ["cat", "dog"],
    "bboxes":  [
      [0.1, 0.2, 0.3, 0.4],
      [0.2, 0.3, 0.4, 0.5]
    ],
    "confidences": [0.7, 0.5]
  }
}