הודעות שגיאה

כאן מוסבר איך לפתור חלק מהשגיאות שמוצגות ב-Document AI. במאמר הזה נסביר על שגיאות שפתרונן דורש יותר שלבים מאלה שאפשר לתאר בהודעת שגיאה.

במאמרי העזרה של Cloud API מפורטות שיטות מומלצות לטיפול בשגיאות.

הרשאות

כדי לפתור את הבעיה, צריך לבצע כמה שלבים שמתוארים בהודעת השגיאה.

פרטי הכניסה שמוגדרים כברירת מחדל לאפליקציה לא זמינים

אם קיבלתם את ההודעה הזו:

The Application Default Credentials are not available. They are
available if running in Compute Engine. Otherwise, the
environment variable GOOGLE_APPLICATION_CREDENTIALS must be defined
pointing to a file defining the credentials.
See https://developers.google.com/accounts/docs/application-default-credentials
for more information.

‫Document AI משתמש ב-Application Default Credentials לאימות.

צריך ליצור חשבון שירות לפרויקט, להוריד את המפתח (קובץ JSON) של חשבון השירות לסביבת הפיתוח, ואז להגדיר את המיקום של קובץ ה-JSON הזה למשתנה סביבה בשם GOOGLE_APPLICATION_CREDENTIALS.

בנוסף, משתנה הסביבה GOOGLE_APPLICATION_CREDENTIALS צריך להיות זמין בהקשר שבו קוראים ל-Document AI API. לדוגמה, אם מגדירים את המשתנה מתוך סשן של מסוף, אבל מריצים את הקוד במאגר הבאגים של סביבת הפיתוח המשולבת, יכול להיות שלא תהיה לקוד גישה למשתנה בהקשר הביצוע שלו. במקרה כזה, יכול להיות שהבקשה שלך ל-Document AI תיכשל בגלל חוסר אימות מתאים.

מידע נוסף על הגדרת משתנה הסביבה GOOGLE_APPLICATION_CREDENTIALS זמין במדריך לתחילת העבודה עם Document AI או במאמר בנושא שימוש ב-Application Default Credentials.

ההרשאה נדחתה

אם קיבלתם את ההודעה הזו:

ERROR: (gcloud.auth.application-default.print-access-token) File
(pointed by GOOGLE_APPLICATION_CREDENTIALS environment variable) does not exist!
{
  "error": {
    "code": 403,
    "message": "The request is missing a valid API key.",
    "status": "PERMISSION_DENIED"
  }
}

מוודאים שיש לכם קובץ JSON תקין של מפתח חשבון שירות במיקום שמאוחסן במשתנה הסביבה GOOGLE_APPLICATION_CREDENTIALS, ושהמשתנה מצביע על המיקום הנכון.

כדי לאבחן את השגיאה הזו, נסו לפתוח את קובץ המפתח של חשבון השירות מהתיקייה שממנה אתם מנסים לקרוא ל-Document AI API.

cat $GOOGLE_APPLICATION_CREDENTIALS

הגישה נדחתה: לא נעשה שימוש ב-POST API עם קוד 403 או שהוא מושבת

אם קיבלתם את ההודעה:

Forbidden: 403 POST Document AI API has not been used in
project # before or it is disabled.
Enable it by visiting [url], then retry.
If you enabled this API recently, wait a few minutes for the action to
propagate and retry.
  1. עוברים לקישור שצוין בהודעת השגיאה ומפעילים את Document AI API. מחכים כמה דקות ומנסים שוב.
  2. מוודאים שיש לכם קובץ JSON תקין של מפתח חשבון שירות שמאוחסן במשתנה הסביבה GOOGLE_APPLICATION_CREDENTIALS. כדי לאבחן את השגיאה הזו, נסו לפתוח את קובץ המפתח של חשבון השירות מהתיקייה שממנה אתם מנסים לקרוא ל-Document AI API.
    cat $GOOGLE_APPLICATION_CREDENTIALS
    

שגיאה בכתיבת הפלט הסופי

אם תקבלו הודעה כמו הבאה כשמקבלים את התוצאות של בקשה לעיבוד אצווה:

{
  "name": "projects/project-name/operations/operation-id",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.document.v1beta1.OperationMetadata",
    "state": "SUCCEEDED",
    "createTime": "2019-09-19T02:02:15.885267760Z",
    "updateTime": "2019-09-19T02:02:31.896425001Z"
  },
  "done": true,
  "error": {
    "code": 5,
    "message": "Error writing final output to: gs://bucket-name/filename.json"
  }
}

יכול להיות שלחשבון השירות אין את ההרשאות המתאימות ליצירת אובייקטים בקטגוריה של Cloud Storage. חשוב לוודא שהקציתם לחשבון השירות את ההרשאות הנכונות, כמו שמתואר במדריך לתחילת העבודה.

יכול להיות שגם טעיתם באיות של שם הקטגוריה של Cloud Storage. מוודאים שהבאקט שאליו מנסים לגשת קיים.

ל-P4SA אין גישה ל-Cloud Storage

כשאין לחשבון השירות לכל מוצר (P4SA) של Document AI הרשאה לגשת למשאבים מסוימים ב-Cloud Storage.

message: "Cloud DocumentAI P4SA doesn't have access to this Cloud Storage resource:"

לחשבון השירות אין אפשרות ליצור אובייקט ב-Cloud Storage

כשאין לחשבון שירות לכל מוצר (P4SA) של Document AI הרשאה ליצור אובייקט ב-Cloud Storage.

message: "Service account service-123@gcp-sa-prod-dai-core.iam.gserviceaccount.com
         does not have permission storage.objects.create to create
         Google Cloud Storage object in bucket gs://foo."

יכול להיות שלחשבון השירות של Document AI אין את ההרשאות המתאימות ליצירת אובייקטים בקטגוריה של Cloud Storage. חשוב לוודא שהקציתם את ההרשאות הנכונות לחשבון השירות של Document AI, כמו שמתואר בהגדרת גישה לקבצים בין פרויקטים.

יכול להיות שגם טעיתם באיות של שם הקטגוריה של Cloud Storage. מוודאים שהבאקט שאליו מנסים לגשת קיים.

למבצע הקריאה אין אפשרות לקבל אובייקטים ב-Cloud Storage

כשלקורא של Document AI API אין הרשאה לקבל אובייקטים ב-Cloud Storage.

message: "The caller does not have permission storage.objects.get to get Google
         Cloud Storage objects in bucket gs://foo."

יכול להיות שלמשתמש שקורא ל-API אין את ההרשאות הנכונות כדי לקבל אובייקטים בקטגוריה שלכם ב-Cloud Storage. חשוב לוודא שהקציתם למבצע הקריאה את ההרשאות הנכונות.

יכול להיות שגם טעיתם באיות של שם הקטגוריה של Cloud Storage. מוודאים שהבאקט שאליו מנסים לגשת קיים.

ארגומנטים לא חוקיים

כדי לפתור את הבעיה, צריך לבצע כמה שלבים שמתוארים בהודעת השגיאה.

גרסת ה-API לא נתמכת

כששולחים בקשה לגרסת API שלא תומכת בפעולה.

message: "The requested operation is unsupported for the API version."

סוג המעבד לא נתמך

כשמבצעים בקשה לשיטת API שלא תומכת בסוג המעבד שצוין.

message: "The requested operation is unsupported for the processor type: ${PROCESSOR_TYPE}."

בקשה פגומה

כשמתבצעת בקשת API אבל בשדות הבקשה יש הפרה אחת או יותר. כל הפרה מתועדת כfield_violations בפרטים של google.rpc.BadRequest.

message: "Request contains an invalid argument."
details {
  [type.googleapis.com/google.rpc.BadRequest] {
    field_violations { field: "foo" description: "bar" }
  }
}

עיבוד באצווה של כל המסמכים נכשל

כשעיבוד של כל המסמכים בבקשה לעיבוד ברצף נכשל.

message: "Failed to process all documents."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "FAILED_TO_PROCESS_ALL_DOCUMENTS"
    domain: "documentai.googleapis.com"
  }
}

אין מסמכים

כשנדרשים או מצופים מסמכים אבל לא מסופקים מסמכים, למשל כשמייבאים מסמכים באמצעות URI של Cloud Storage.

message: "No valid documents found in ${training|test} directory. Ensure files are in a supported MIME type. For details, see https://cloud.google.com/document-ai/docs/file-types."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "NO_DOCUMENTS"
    domain: "documentai.googleapis.com"
  }
}

הפרמטרים gcsUriPrefix ו-gcsOutputConfig.gcsUri צריכים להתחיל ב-gs:// ולהסתיים בתו נטוי הפוך (/). כדאי לבדוק את ההגדרה של כתובות ה-URI של דלי הנתונים.

לדוגמה: gs://bucket/directory/

אין תמיכה בהדרכה

כשמבצעים בקשה לאימון גרסת מעבד מסוג מעבד שלא תומך באימון.

message: "Training is not supported on processor type: ${DOCUMENT_TYPE}_PROCESSOR."

לא נבחרו מסמכים

כשמצפים למסמכים, אבל לא נבחרו מסמכים במערך הנתונים, למשל כשיוצרים משימות של תיוג נתונים.

message: No documents selected. Please select at least one document."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "NO_DOCUMENTS_SELECTED"
    domain: "documentai.googleapis.com"
  }
}

לא נמצא סוג המסמך

כשהסיווג של מסמך (כמו רישיון, דרכון או חשבונית) לא תואם לסיווג שנדרש לסוג המעבד. דוגמה לכך היא כששלב הסיווג במנתח W2 לא מוצא רכיבים מחשבונית.

יכול להיות שההגדרה הזו תופיע גם כCouldn't preview the document: Unable to find a document of type: 'foo' במסוף Google Cloud . הודעת השגיאה הזו רלוונטית למעבדים מדור קודם.

message: "Unable to find a document of type: 'foo'"
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DOCUMENT_OF_TYPE_NOT_FOUND"
    domain: "documentai.googleapis.com"
  }
}

הייתה חריגה ממגבלת גודל המסמך

אם חורגים מהמגבלה העליונה של גודל הקובץ של מסמך בזמן ייבוא של מערך נתונים או בזמן הפעלת חיזוי.

message: "Document size (2) exceeds limit: 1 (bytes)."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DOCUMENT_SIZE_LIMIT_EXCEEDED"
    domain: "documentai.googleapis.com"
    metadata { key: "limit" value: "1" }
    metadata { key: "size" value: "2" }
  }
}

חרגת ממגבלת המסמכים

כשחורגים מהגבול העליון של מספר המסמכים.

message: "Document count exceed the limit: 5 got 6"
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DOCUMENT_LIMIT_EXCEEDED"
    domain: "documentai.googleapis.com"
    metadata { key: "document_limit" value: "5" }
    metadata { key: "documents" value: "6" }
  }
}

סוג MIME לא נתמך

כשסופק סוג MIME שלא נתמך. המערכת מאמתת את פורמט הקובץ (סוג MIME) כשמייבאים מערך נתונים או כשמבצעים קריאה לחיזוי. בקטע קבצים נתמכים (ובקטע Layout Parser) מפורטים סוגי הקבצים הזמינים. אם פורמט הקובץ לא נתמך, מוצגת הודעת השגיאה הבאה:

message: "INVALID_ARGUMENT: Unsupported MIME type: 'foo'."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "UNSUPPORTED_MIME_TYPE"
    domain: "documentai.googleapis.com"
    metadata { key: "mime_type" value: "foo" }
  }
}

אין דפים

כשמספקים מסמך ללא דפים, אבל נדרש דף אחד או יותר.

message: "No pages were found in the document."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "NO_PAGES"
    domain: "documentai.googleapis.com"
  }
}

מספר עמוד שלילי

כאשר במסמך מופיע ערך שלילי לאחד ממספרי העמודים.

message: "Page number cannot be negative."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "NEGATIVE_PAGE_NUMBER"
    domain: "documentai.googleapis.com"
  }
}

מספרי דפים כפולים

כשמסמך מציג את אותו מספר דף פעם אחת או יותר.

message: "Duplicate page number detected (page numbers to indices): [{1, [1, 2]}, {4, [4, 5]}]."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DUPLICATE_PAGE_NUMBERS"
    domain: "documentai.googleapis.com"
    metadata {
      key: "page_number_to_indices"
      value: "[{1, [1, 2]}, {4, [4, 5]}]"
    }
  }
}

חריגה ממגבלת העמודים

כשיש חריגה מהמגבלה העליונה של המספר הכולל של הדפים במסמך. השגיאה הזו מופיעה במהלך ייבוא של מערך נתונים או חיזוי, כשבמסמך במערך הנתונים יש יותר מדי דפים, מעבר למגבלות של המעבד.

message: "Document pages exceed the limit: 5 got 6"
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PAGE_LIMIT_EXCEEDED"
    domain: "documentai.googleapis.com"
    metadata { key: "page_limit" value: "5" }
    metadata { key: "pages" value: "6" }
  }
}

חריגה ממגבלת הדפים במצב ללא תמונות

השגיאה הזו מופיעה במהלך ייבוא של מערך נתונים או חיזוי, כשמסמך במערך הנתונים מכיל יותר מדי דפים, מעבר למגבלות של המעבד. אתם יכולים לבקש להוסיף את הפרויקט שלכם לרשימת ההיתרים כדי להפעיל מצב ללא תמונות. כך תוכלו להגדיל את מגבלת הדפים ל-30.

message: "Document pages in non-imageless mode exceed the limit: 15 got 16. Try using imageless mode to increase the limit to 30."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PAGE_LIMIT_EXCEEDED_IN_IMAGELESS_MODE"
    domain: "documentai.googleapis.com"
    metadata { key: "page_limit" value: "15" }
    metadata { key: "pages" value: "16" }
    metadata { key: "imageless_page_limit" value: "30" }
  }
}

שינוי במצב של גרסת מעבד שאומן מראש

כשמונפקת בקשה לשינוי המצב של גרסה של מעבד שעבר אימון מראש. השגיאה הזו מופיעה כשמנסים למחוק גרסה של מעבד שאומן מראש.

message: "ProcessorVersion with id 'xyz' is pretrained by Google and cannot change states."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PRETRAINED_PROCESSOR_VERSION_STATE_CHANGE"
    domain: "documentai.googleapis.com"
    metadata { key: "processor_id" value: "abc" }
    metadata { key: "target_state" value: "DELETING" }
    metadata { key: "version_id" value: "xyz" }
  }
}

אימות מערך נתונים

אם מערך נתונים לא עומד בקריטריוני האימות, למשל בגלל עוגנים חסרים בדף, נתונים שגויים או פרטים חסרים בחלק מהמאפיינים של אובייקט הפרוטו של המסמך.

message: "Invalid dataset. See operation metadata for specific errors."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "INVALID_DATASET"
    domain: "documentai.googleapis.com"
  }
}

מסמך לבדיקה שלא מוטמע בתוך הטקסט (Human in the loop)

כשמתחילים בדיקה אנושית של מסמך שלא הוגדר בתוך השורה.

message: "The document for review must be provided inline."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "HUMAN_REVIEW_NON_INLINED_DOCUMENT"
    domain: "documentai.googleapis.com"
  }
}

סוג המסמך לא תקין

כאשר סוג המסמך לא תקין או לא נתמך על ידי מעבד המידע. סוג המסמך מתייחס לקטגוריה של המסמך (למשל, W2), ולא לפורמט הקובץ או לסוג ה-MIME שלו, כמו PDF או JPEG.

message: "Invalid document type: 'foo'."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "INVALID_DOCUMENT_TYPE"
    domain: "documentai.googleapis.com"
    metadata { key: "type" value: "foo" }
  }
}

הטווח של המסמך חורג מהגבולות

message: "Text span [1, 5) is out of bounds: [1, 3)."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DOCUMENT_SPAN_OUT_OF_BOUNDS"
    domain: "documentai.googleapis.com"
    metadata { key: "bounds" value: "[1, 3)" }
    metadata { key: "span" value: "[1, 5)" }
    metadata { key: "type" value: "Text" }
  }
}

טווח מסמכים לא תקין

כשמספקים טווח מסמכים לא תקין, למשל כשתאריך ההתחלה מאוחר מתאריך הסיום.

message: "Character span is invalid. Ensure the max is greater than the min."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DOCUMENT_SPAN_INVALID"
    domain: "documentai.googleapis.com"
    metadata { key: "span" value: "Character" }
  }
}

מסמך UTF-8 לא תקין

כשמספקים מסמך שכולל UTF-8 לא תקין.

message: "Document contains invalid UTF-8 text."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DOCUMENT_INVALID_UTF_8"
    domain: "documentai.googleapis.com"
    metadata { key: "bytes" value: "[2, 3)" }
  }
}

הסכימה של מערך הנתונים לא תקינה

כשמעבד לא כולל סכימת איחוד תקינה או כשסכימת מערך הנתונים שצוינה לא תקינה.

message: "The processor has an empty or invalid schema: "
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "INVALID_SCHEMA_ERROR"
    domain: "documentai.googleapis.com"
  }
}

OcrConfig Unsupported

כשמוציאים בקשת עיבוד למעבד שלא תומך ב-OcrConfig.

message: "OcrConfig is not supported for processor type: 'foo'."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "OCR_CONFIG_UNSUPPORTED"
    domain: "documentai.googleapis.com"
  }
}

הגדרות ייבוא לא תקינות

אם הגדרת הייבוא לא תקינה.

message: "The import config is invalid: foo"
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "INVALID_IMPORT_CONFIG"
    domain: "documentai.googleapis.com"
  }
}

הגרסה של מעבד המקור לא תקינה

כשמנסים לייבא גרסה של מעבד, גרסת המעבד של המקור לא תקינה לייבוא.

message: "The source processor version is invalid in import processor version."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "INVALID_SOURCE_PROCESSOR_VERSION_ERROR"
    domain: "documentai.googleapis.com"
  }
}

גודל המקטע לא תקין

כשההגדרה של גודל החלק לא תקינה.

message: "Invalid chunk size. Requested chunk size (${CHUNK_SIZE}) must be in the range of [${MIN_CHUNK_SIZE}, ${MAX_CHUNK_SIZE}]."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "INVALID_ARGUMENT"
    domain: "documentai.googleapis.com"
  }
}

הייתה חריגה ממגבלת הגודל של ההנחיה למסמך

כאשר מספר הסמלים של הנחיית המסמך גדול מהמגבלה.

message: "Document prompt must be at most ${MAX_DOCUMENT_PROMPT_LENGTH} characters."

הנחיה למסמך לא זמינה לסוג המעבד

כשההנחיה למסמך לא ריקה בסכימה שמוקצית לסוג מעבד שלא עומד בדרישות.

message: "Document prompt is not supported for processor type: ${PROCESSOR_TYPE}"

התנאי המוקדם נכשל

כדי לפתור את הבעיה, צריך לבצע כמה שלבים שמתוארים בהודעת השגיאה.

מפתח KMS לא תקין

אם סופק מפתח לא תקין (למשל, אם הוא מושבת).

message: "KMS key 'projects/1/keys/abc' is invalid (KEY_DISABLED)."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "KMS_KEY_INVALID"
    domain: "documentai.googleapis.com"
    metadata { key: "details" value: "KEY_DISABLED" }
    metadata { key: "kms_key_name" value: "projects/1/keys/abc" }
  }
}

שינוי במצב המעבד

כשמונפקת בקשה לא חוקית לשינוי המצב של מעבד.

message: "Processor state cannot be changed to 'DISABLED' since it is 'DISABLED'."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PROCESSOR_STATE_CHANGE_INVALID"
    domain: "documentai.googleapis.com"
    metadata { key: "current_state" value: "DISABLED" }
    metadata { key: "processor_id" value: "xyz" }
    metadata { key: "target_state" value: "DISABLED" }
  }
}

שינוי מצב של גרסת מעבד

כשמונפקת בקשה לא חוקית לשינוי המצב של גרסת מעבד.

message: "ProcessorVersion state cannot be changed to 'DEPLOYING' since it is 'DEPLOYED'."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PROCESSOR_VERSION_STATE_CHANGE_INVALID"
    domain: "documentai.googleapis.com"
    metadata { key: "current_state" value: "DEPLOYED" }
    metadata { key: "processor_id" value: "abc" }
    metadata { key: "target_state" value: "DEPLOYING" }
    metadata { key: "version_id" value: "xyz" }
  }
}

המעבד לא מופעל

כשמוציאים בקשה שתלויה במעבד ספציפי, אבל המעבד לא מופעל.

message: "Processor 'xyz' is not enabled."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PROCESSOR_NOT_ENABLED"
    domain: "documentai.googleapis.com"
    metadata { key: "processor_id" value: "xyz" }
    metadata { key: "state" value: "DISABLED" }
  }
}

גרסת המעבד לא נפרסה

כשמוגשת בקשה שתלויה בפריסה של גרסה ספציפית של מעבד, אבל המעבד לא נפרס.

message: "ProcessorVersion 'abc' is not deployed."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PROCESSOR_VERSION_NOT_DEPLOYED"
    domain: "documentai.googleapis.com"
    metadata { key: "processor_id" value: "xyz" }
    metadata { key: "state" value: "TRAINING" }
    metadata { key: "version_id" value: "abc" }
  }
}

גרסת ברירת המחדל של המעבד

כשמוגשת בקשה שתלויה בהגדרת גרסת ברירת מחדל, אבל לא מוגדרת גרסה כזו.

message: "Processor 'xyz' does not have a default version configured."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PROCESSOR_DEFAULT_VERSION_UNSET"
    domain: "documentai.googleapis.com"
    metadata { key: "processor_id" value: "xyz" }
  }
}

הסרת גרסת ברירת המחדל של מעבד

כשהוגשה בקשה לביטול הפריסה או למחיקה של גרסת מעבד, אבל היא מוגדרת כגרסת ברירת המחדל.

message: "ProcessorVersion 'xyz' cannot be undeployed or deleted as it is the default version."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PROCESSOR_REMOVE_DEFAULT_VERSION"
    domain: "documentai.googleapis.com"
    metadata { key: "processor_id" value: "abc" }
    metadata { key: "version_id" value: "xyz" }
  }
}

מערך הנתונים לא אותחל

כשמונפקת בקשה שדורשת אתחול של מערך נתונים, אבל מערך הנתונים לא מאותחל.

message: "Dataset is not initialized."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DATASET_NOT_INITIALIZED"
    domain: "documentai.googleapis.com"
  }
}

מערך הנתונים אותחל או נמצא בתהליך אתחול

כשמוציאים בקשה שדורשת שמערך נתונים לא יהיה מאותחל, אבל מערך הנתונים כבר מאותחל או נמצא בתהליך אתחול.

message: "Dataset is already initialized or is initializing."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DATASET_INITIALIZED_OR_INITIALIZING"
    domain: "documentai.googleapis.com"
  }
}

שגיאה: המיקום של מערך הנתונים לא ריק

כשבקשה דורשת שמיקום האחסון של מערך הנתונים יהיה ריק, אבל התיקייה מכילה אובייקטים.

message: "Given dataset location is not empty. Please select an empty folder."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DATASET_LOCATION_NOT_EMPTY"
    domain: "documentai.googleapis.com"
  }
}

הייתה שגיאה בפעולת החסימה

אם יש פעולות אחרות שפועלות ומונעות את הפעולה הנדרשת.

message: "The operation cannot be performed due to an ongoing 'EXAMPLE_OPERATION_TYPE' blocking operation. Try again after the operation finishes."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "HAS_BLOCKING_OPERATION_ERROR"
    domain: "documentai.googleapis.com"
  }
}

שגיאה: טווח הדפים לא נתמך

כשהשדה page_range לא נתמך בפעולה מסוימת, כמו בתהליך אצווה.

message: "Page range is not supported."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PAGE_RANGE_UNSUPPORTED"
    domain: "documentai.googleapis.com"
  }
}

התיקייה ב-Cloud Storage מכילה שגיאה במערך הנתונים

כשתיקייה ב-Cloud Storage כבר מכילה מערך נתונים.

message:  "The folder 'folder_uri' already has dataset 'dataset-id' under it."
details {
   [type.googleapis.com/google.rpc.ErrorInfo] {
     reason: "GCS_FOLDER_CONTAINS_DATASET_ERROR"
     domain: "documentai.googleapis.com"
   }
}

שגיאה: חסרה תמונה ממוזערת

כשלא ניתן לאחזר תמונה ממוזערת של מסמך במערך נתונים.

message:  "Failed to get dataset document thumbnail, consider running re-sync on the dataset."
details {
   [type.googleapis.com/google.rpc.ErrorInfo] {
     reason: "THUMBNAIL_MISSING"
     domain: "documentai.googleapis.com"
   }
}

חרגת ממגבלת הדפים של מערך הנתונים

כשחורגים ממגבלת הדפים הכוללת של מערך נתונים.

message: "Dataset page count exceeds the limit of 5. Got 6."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DATASET_PAGE_LIMIT_EXCEEDED"
    domain: "documentai.googleapis.com"
  }
}

מעבד מידע שלא תומך בעיבוד סינכרוני

כשמתבצעת בקשה לגרסת מעבד שכבר לא נתמכת לעיבוד סנכרוני.

message: "Processor ${PROCESSOR_ID} version ${VERSION_ID} of type ${TYPE_NAME} is no longer supported for sync processing. Please upgrade to a newer version: https://cloud.google.com/document-ai/docs/manage-processor-versions."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "UNSUPPORTED_PROCESSOR"
    domain: "documentai.googleapis.com"
  }
}

הקובץ לא נמצא

כדי לפתור את הבעיה, צריך לבצע כמה שלבים שמתוארים בהודעת השגיאה.

ההערכה לא נמצאה

כשלא ניתן למצוא הערכה לגרסת מעבד.

message: "Evaluation with ID 'qrs' not found."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "EVALUATION_NOT_FOUND"
    domain: "documentai.googleapis.com"
    metadata { key: "evaluation_id" value: "qrs" }
    metadata { key: "processor_id" value: "xyz" }
    metadata { key: "version_id" value: "abc" }
  }
}

המסמך לא נמצא

כשלא ניתן למצוא מסמך שנדרש לפעולה מסוימת.

message: "Document not found: 'gs://foo'."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "DOCUMENT_NOT_FOUND"
    domain: "documentai.googleapis.com"
    metadata { key: "document" value: "gs://foo" }
  }
}

המעבד לא נמצא

כשאי אפשר למצוא מעבד שנדרש לפעולה.

message: "Processor with id 'xyz' not found."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PROCESSOR_NOT_FOUND"
    domain: "documentai.googleapis.com"
    metadata { key: "processor_id" value: "xyz" }
  }
}

לא נמצאה גרסת המעבד

כשלא ניתן למצוא גרסת מעבד שנדרשת לפעולה.

message: "ProcessorVersion with id 'abc' not found."
details {
  [type.googleapis.com/google.rpc.ErrorInfo] {
    reason: "PROCESSOR_VERSION_NOT_FOUND"
    domain: "documentai.googleapis.com"
    metadata { key: "processor_id" value: "xyz" }
    metadata { key: "version_id" value: "abc" }
  }
}

לא נמצאה משימת יצירת תוויות לנתונים

כשלא ניתן למצוא משימה של תיוג נתונים.

message: "Data labeling job with id 'EXAMPLE_DATA_LABELING_JOB' not found in processor EXAMPLE_PROCESSOR."

לא נמצאה גרסת סכימה

כשלא ניתן למצוא גרסת סכימה.

message: "Schema version with id 'EXAMPLE_SCHEMA_VERSION' not found."

הסכימה לא נמצאה

אם לא ניתן למצוא סכימה.

message: "Schema with id 'EXAMPLE_SCHEMA' not found."

השם כבר קיים

כדי לפתור את הבעיה, צריך לבצע כמה שלבים כמו שמתואר בהודעת השגיאה.

כבר קיים מתייג מסוג 'אדם בתהליך'

כשמנסים ליצור מאגר תיוג שכבר קיים.

message: "The labeler pool already exists."

כבר קיים שם מוצג לגרסת הסכימה

כשיוצרים גרסת סכימה עם שם מוצג שכבר קיים.

message: "A schema version with the name 'EXAMPLE_SCHEMA_VERSION' already exists."

השם המוצג של הסכימה כבר קיים

כשיוצרים סכימה עם שם מוצג שכבר קיים.

message: "A schema with the name 'EXAMPLE_SCHEMA' already exists."

מכסות ומגבלות

כדי לפתור את הבעיה, צריך לבצע כמה שלבים שמתוארים בהודעת השגיאה.

חריגה מהמכסה

אם קיבלתם את ההודעה הזו:

RESOURCE_EXHAUSTED: Quota exceeded.

הגעתם למכסה לדקה או למכסה היומית. כדאי לעיין במכסות ובמגבלות לשימוש ב-Document AI.

אפשר לבקש להגדיל את המכסות דרך Google Cloud המסוף.

הפסקות שירות וזמני אחזור (latency)

כדי לפתור את הבעיה, צריך לבצע כמה שלבים שמתוארים בהודעת השגיאה.

חסימות זמניות

הפעולה לא הושלמה במסגרת הזמן הקצוב שהוגדר.

אם אתם מקבלים את הודעות השגיאה הבאות (או הודעות דומות) כשאתם שולחים בקשות לפעולה ממושכת (LRO):

google.api_core.future.polling._OperationNotComplete
...
google.api_core.exceptions.RetryError: Deadline of 0.0s exceeded while calling target function, last exception:
...
concurrent.futures._base.TimeoutError: Operation did not complete within the designated timeout.

במקרה כזה, הערך של הזמן הקצוב לתפוגה שהמשתמש הגדיר להשלמת הפעולה נמוך מדי בשביל המסמך שעובר עיבוד. השגיאה הזו לא מעידה על כך שהפעולה של תהליך האצווה נכשלה. הפעולה תימשך ללא קשר לערך הזמן הקצוב לתפוגה שהמשתמש הגדיר.

שגיאה במסנן הבטיחות

התרחשה שגיאה פנימית בצד השרת כי הבקשה או התגובה נחסמו על ידי מסנני הבטיחות של מודל השפה הגדול (LLM). אי אפשר לנסות שוב לבצע את הפעולה הזו.

message: "Safety filter error."

SchemaGenerationError

מציין שהייתה שגיאה במהלך יצירת הסכימה.

message: "Schema generation failed."

שגיאה פנימית

אירעה שגיאה פנימית בצד השרת. מנסים להתחבר שוב.

message: "Internal error encountered."