מורפולוגיה ועצי תלות

השיטה analyzeSyntax מחזירה פרטים על המבנה הלשוני של הטקסט שצוין. לכל טוקן בטקסט, Natural Language API מספק מידע על המבנה הפנימי שלו (מורפולוגיה) ועל התפקיד שלו במשפט (תחביר).

מורפולוגיה היא חקר המבנה הפנימי של מילים. מורפולוגיה מתמקדת באופן שבו הרכיבים בתוך מילה (שורשים, מילים בסיסיות, תחיליות, סיומות וכו') מסודרים או משתנים כדי ליצור משמעויות שונות. לדוגמה, באנגלית מוסיפים בדרך כלל את הסיומות ‎-s או ‎-es לשם עצם שניתן לספירה כדי לציין רבים, ואת הסיומות ‎-d או ‎-ed לפועל כדי לציין עבר. הסיומת ‎-ly מתווספת לשמות תואר כדי ליצור תואר פועל (לדוגמה, happy [שמח] ו-happily [בשמחה]).

‫Natural Language API משתמש בניתוח מורפולוגי כדי להסיק מידע דקדוקי על מילים.

יש הבדלים גדולים במורפולוגיה בין השפות. בשפות כמו רוסית, סיומות של מילים מציינות את התפקיד של המילה במשפט (לדוגמה, המילה книга [ספר – מקרה נומינטיבי] הופכת ל-книгу [מקרה אקוזטיבי] כשהיא מושא ישיר של פועל). כלומר, סדר המילים יכול להשתנות בלי לשנות את משמעות המשפט, אבל סדר מילים שונה משפיע על ההתאמה להקשר. בשפות כמו אנגלית ומנדרינית, שאין בהן תוספות שמציינות את המין, הסדר של המילים במשפט חשוב יותר כדי להבין את התפקיד של כל מילה. לכן, ניתוח מורפולוגי תלוי מאוד בשפת המקור, ובהבנה של מה נתמך בשפה הזו.

תחביר הוא חקר המבנה של ביטויים ומשפטים. התחביר והמורפולוגיה פועלים יחד כדי לציין קשרים דקדוקיים, ובשפות שונות חלוקת העבודה ביניהם שונה. לדוגמה, ברוסית משתמשים בנספח כדי לציין את התפקיד של מושא ישיר (у ב-книгу), בעוד שבאנגלית משתמשים בסדר המילים, שבו המושא הישיר מופיע אחרי הפועל (read the book).

התשובה analyzeSyntax מחזירה מידע מורפולוגי בשדה partOfSpeech ואת הקשר התחבירי בין מילים בשדה dependencyTree.

חלקי דיבור

בבקשה תחבירית, מידע על חלקי הדיבור ומידע מורפולוגי מוחזרים בשדה partOfSpeech של התשובה. השדה partOfSpeech מכיל קבוצה של שדות משנה עם מידע על חלק הדיבור (POS) וגם מידע מורפולוגי מפורט יותר. השדות המשניים האלה מפורטים בהמשך.

  • tag מציין את חלק הדיבור באמצעות תג POS גס (שם עצם, פועל וכו'), ומספק מידע על תחביר ברמה העליונה. תגי POS שימושיים אם רוצים ליצור דפוסים או לצמצם את הדו-משמעות בניתוח שפה עתידי (לדוגמה, train שתויג כ-NOUN לעומת VERB).

  • number מציין את המספר הדקדוקי של מילה. בעברית, מוסיפים את הסיומת 'ים' לשמות עצם בנייה כדי לציין שיש יותר מאחד (לדוגמה, 'כלב+ים' מציין שיש יותר מכלב אחד). היעדר הסיומת לרבים נקרא לעיתים קרובות צורת היחיד. יש שפות, כמו ערבית, שבהן יש גם מושג של מספר כפול. השדה הזה יכול להכיל את הערכים הבאים:

    • SINGULAR מציין כמות אחת.
    • PLURAL מציין יותר מכמות אחת.
    • DUAL מציין בדיוק שתי כמויות.
  • person מציין את הגוף הדקדוקי של מילה. באנגלית, המילים I ו-me הן גוף ראשון יחיד ומתייחסות לדובר (או לכותב) של הביטוי, בעוד שהמילים you ו-she/her ו-he/him מתייחסות לנמען המיועד (המאזין) ולאדם אחר, בהתאמה. השדה הזה יכול להכיל את הערכים הבאים:

    • FIRST person denotes the speaker.
    • SECOND person מציין את הנמען המיועד, כלומר האדם שאליו מדברים.
    • THIRD מציין שאדם מסוים לא מדבר או לא שומע.
    • REFLEXIVE_PERSON מציין, לדוגמה, שהנושא והאובייקט מתייחסים לאותה ישות, כמו במשפט 'החתול ליקק את עצמו', שבו ‎-self מצורף לכינוי גוף כדי לציין רפלקסיביות. ברוסית וביפנית, המילה הרפלקסיבית היא כינוי גוף עצמאי. (לדוגמה, המשפט 'John loves himself' באנגלית הוא 'Джон любит себя' ברוסית, כאשר המילה 'себя' היא ניטרלית מבחינת מגדר ומשמעותה 'עצמו'. ביפנית, המשפט הוא 'Tarō wa zibun o aisuru' (גרסה ברומג'י), כאשר המילה 'zibun' היא ניטרלית מבחינת מגדר ומשמעותה 'עצמו'. ראו כינוי רפלקסיבי).
  • gender מציין את המין הדקדוקי של שם העצם. השדה הזה יכול להכיל את הערכים הבאים:

    • FEMININE לשון הפנייה
    • MASCULINE לשון הפנייה
    • NEUTER לשון הפנייה
  • case מציין את התפקיד הדקדוקי של המילה ואת התפקיד שלה בביטוי או במשפט. השדה הזה יכול להכיל את הערכים הבאים::

    • ACCUSATIVE case מציין את האובייקט הישיר של פועל יוצא.
    • השימוש ב-ADVERBIAL case מציין צורה תואמת של שם תואר. שימו לב שבשפה האנגלית יש מילים נפרדות לשמות תואר ("good") ולתואר הפועל ("well"). הסיומת ‎-ly באנגלית יוצרת תואר פועל משם תואר (לדוגמה, happy,‏ happily), אבל היא לא נחשבת ל'מקרה'.
    • המקרה COMPLEMENTIVE (סינית) מציין מילה שנדרשת להשלמת המשמעות של ביטוי פוטנציאלי, תיאורי או תוצאתי באמצעות חלקיק מחבר.
    • במקרה DATIVE, יש אובייקט עקיף שמתייחס לאובייקט הישיר שמקבל את האובייקט. באנגלית, מושא עקיף מסומן בדרך כלל על ידי מילת היחס to, כמו במשפט He gave the ball to Bobby, שבו Bobby הוא המושא העקיף, והוא מקבל את הכדור. לעומת זאת, בדוגמה הזו מרוסית: Иван дал книгу маше (איוון נתן את הספר למאשה),‏ ‎“-e”‎ מציין ש-маше הוא מושא עקיף, ומאשה היא מקבלת הספר.
    • האובייקט GENITIVE case מציין בעלות. שימו לב שבשפה האנגלית, לעיתים קרובות מציינים בעלות באמצעות התוספת ‎-'s במקום באמצעות יחסת השייכות. התחילית ‎"-'s"‎ יכולה להופיע בסוף של צירוף מילים (לדוגמה, ‎“[The man who ran the bill up]’s wife paid a dear price for his excess.”‎). לעומת זאת, בדוגמה הזו ברוסית, הסיומת ‎"-а"‎ מציינת את המילה ‎"Антон-"‎ כשייכת: ‎"Где книга Антона?"‎ (איפה הספר של אנטון?). ברוסית, מקרה הגניטיב מופיע גם כמשלים של מילים כמו 'כמה' או 'מעט'. לדוגמה: Зимой здесь мало снега (בחורף יש כאן מעט שלג) – הסיומת ‎-a מציינת ש-снег- (שלג) הוא גניטיב, כי הוא המשלים של мало (מעט). אין כאן בעלות.
    • התג INSTRUMENTAL case מציין אם שם העצם הוא הכלי שבאמצעותו הפעולה הושלמה. ברוסית, המשפט באנגלית, "He opened the door with a key" (הוא פתח את הדלת עם מפתח), יהיה: “он открыл дверь ключом” (הוא פתח את הדלת עם מפתח) כאשר הסיומת ‎-om מתווספת למילה ключ (מפתח) ומציינת את המקרה האינסטרומנטלי.
    • השימוש במונח LOCATIVE מציין שהמילה מתייחסת למיקום. בעברית, אין יחסת מיקום.
    • NOMINATIVE הנושא משויך לנושא של הפועל. באנגלית, הנושא של המשפט מצוין באמצעות סדר המילים, ולא באמצעות אותיות רישיות. במשפט "הילדה ניצחה במרוץ", הביטוי "הילדה" הוא הנושא, והוא מופיע מימין לפועל "ניצחה". ברוסית, המילה девушка (הילדה) יכולה להופיע לפני הפועל או אחריו: "девушка выиграла гонку" או "гонку выиграла девушка", כאשר הפועל הוא выиграла (ניצחה).
    • האותיות OBLIQUE מציינות שימוש במילה כנושא של פועל או מילת יחס.
    • התג PARTITIVE case מציין את ה"חלקיות" של מילה או את העובדה שאין לה זהות ספציפית. דוגמה ל-partitive באנגלית היא 'three of my friends'. ברוסית, זה יהיה 'трое моих друзей', כאשר 'трое' הוא 'three of' (בהשוואה ל-'три друга', שבו 'три' הוא 'three').
    • PREPOSITIONAL case מציין את האובייקט של מילת יחס.
    • המאפיין REFLEXIVE_CASE מציין את הזהות של אובייקט של פועל ביחס לנושא שלו. ברוב השפות לא משתמשים בנטייה רפלקסיבית, כי השימוש הזה מסומן באמצעות שימוש בכינויי גוף רפלקסיביים מיוחדים (כמו 'עצמו', 'עצמי' וכו').
    • התו RELATIVE_CASE (סיני) מציין את מילת הקישור של פסוקית יחסית שמקשרת בין שם עצם לפועל או לשם תואר. דוגמאות: 工作 [的] 地方 (work [] place :: "place [where I] work"). ‫便宜 的 餐馆 (מסעדות זולות :: מסעדות [שהן] זולות).
    • VOCATIVE מקרה מציין שם עצם שמשמש לפנייה למישהו או למשהו, בדרך כלל כשמדברים אליו.
  • tense מציין את הזמן הדקדוקי של הפועל, שמציין את ההתייחסות של הפועל למיקום בזמן. שימו לב שהמאפיין tense שונה מהמאפיין aspect, שגם הוא מתייחס לקשר בין הפועל לזמן, אבל מתמקד במאפיינים של רצף הזמן הזה ולא במיקום שלו. במקרים רבים, הזמנים IMPERFECT ו-PLUPERFECT בשפות רבות מתייחסים באופן מדויק יותר לשילובים ספציפיים של זמן ופועל. השדה הזה יכול להכיל את הערכים הבאים:

    • CONDITIONAL_TENSE הוא מונח חלופי למונח המורפולוגי הנפוץ יותר 'מצב מותנה'. (ראו CONDITIONAL_MOOD בהמשך).
    • FUTURE מציין פעולה שתתבצע בעתיד. שימו לב שבעברית, כדי לציין זמן עתיד, בדרך כלל מוסיפים את המילה 'יהיה' לצירוף פועל.
    • PAST מציין פעולה שהתרחשה בעבר.
    • PRESENT מציין פעולה שמתבצעת כרגע.
    • IMPERFECT מציין פעולה שהתרחשה בעבר, אבל לא הושלמה במסגרת הזמן של הזמן הזה. שימו לב שבעברית, כדי לציין זמן עבר מתמשך, מוסיפים את הצורה המתמשכת של הפועל לזמן העבר, כמו במשפט 'הלכתי'. אירוע בזמן עבר לא מושלם מתרחש בעבר, אבל הוא לא מושלם ביחס לזמן העבר הזה.
    • PLUPERFECT מציין פעולה שהתרחשה בעבר והושלמה גם היא במסגרת הזמן של הזמן הזה. לדוגמה, הפועל 'הלכתי' מתייחס לעבר, אבל הפעולה גם הושלמה במסגרת הזמן של העבר.
  • aspect מציין את ההיבט הדקדוקי של הפועל, את הביטוי של רצף הזמן. בניגוד ל-tense, שמתמקד במיקום של הפועל בציר הזמן, aspect מתמקד במאפיינים של ציר הזמן שבו הפועל מתרחש. השדה הזה יכול להכיל את הערכים הבאים:

    • ההיבט PERFECTIVE מציין אירוע ש "הושלם" כי הוא התרחש בעבר או יתרחש בעתיד.
    • המאפיין IMPERFECTIVE aspect מציין אירוע לא שלם, כי הוא מתמשך או חוזר.
    • ההיבט PROGRESSIVE מציין אירוע מתמשך. בדרך כלל מתייחסים להיבט מתמשך כמקרה מיוחד של היבט לא מושלם כללי יותר (שכולל גם חזרה).

  • mood מציין את המודוס הדקדוקי של הפועל, שמצביע על הגישה לפעולה הבסיסית. השדה הזה יכול להכיל את הערכים הבאים:

    • CONDITIONAL_MOOD מציין פעולה שהיא תלויה. הערה: באנגלית, צורות הפועל לא מותנות. במקום זאת, התנהגות מותנית מצוינת באמצעות שימוש במילה would בשילוב עם צורת המקור של הפועל.
    • IMPERATIVE מציין פקודה או בקשה באמצעות פנייה בגוף שני.
    • INDICATIVE מציין עובדה, או באופן כללי יותר, מצב עובדתי.
    • INTERROGATIVE מציין שאלה.
    • JUSSIVE מציין פקודה או בקשה בגוף ראשון או בגוף שלישי. באנגלית אין מצב ציווי, אבל פניות שמתחילות במילה "Let us" (בואו) או במילה דומה, מעבירות את מצב הציווי הזה.
    • SUBJUNCTIVE מציין איכות של אי-ודאות שקשורה לפעולה, שנקראת גם מצב רוח 'לא מציאותי' (בניגוד למצב הרוח 'מציאותי'). באנגלית אין מצב רוח סובייקטיבי ספציפי. במקום זאת, מילים כמו want,‏ wish,‏ hope וכו' מעבירות את המשמעות של מצב הרוח הסובייקטיבי.
  • voice מציין את הקול הדקדוקי של הפועל, את היחס בין פעולה לבין נושא או מושא. השדה הזה יכול להכיל את הערכים הבאים:

    • ACTIVE voice מציין פעולה שהנושא שלה מבצע את הפעולה.
    • קול CAUSATIVE מציין פעולה שההשפעה שלה מתבצעת על הנושא. באנגלית, אין קול סביל ישיר שמשמש לציון סיבתיות. במקום זאת, משתמשים בפועל make, כמו במשפט Mom made me go to school (אמא גרמה לי ללכת לבית הספר).
    • קול PASSIVE מציין פעולה שההשפעה שלה מתבצעת על הנושא. במקרים רבים, ה'גורם' הפסיבי לא מוזכר או לא ידוע.
  • הסימן reciprocity מציין הדדיות של מילה (בדרך כלל כינוי גוף), ומציין שכינוי הגוף מתייחס לצירוף שם עצם במקום אחר במשפט. השדה הזה יכול להכיל את הערכים הבאים:

    • RECIPROCAL מציין שהכינוי הוא הדדי.
    • NON_RECIPROCAL מציין שהכינוי לא הדדי.
  • proper מציין אם שם עצם הוא חלק משם פרטי. שימו לב ששמות עצם רבים מורכבים מכמה מילים. אם הביטוי הזה מזוהה כשם עצם, כל טוקן יזוהה כשם עצם גם כן. (לדוגמה, גם 'Wrigley' וגם 'Field' בשם העצם 'Wrigley Field' יקבלו את הערך PROPER במאפיין proper). השדה הזה יכול להכיל את הערכים הבאים:

    • PROPER מציין שהטוקן הוא חלק משם פרטי.
    • NOT_PROPER מציין שהטוקן לא מהווה חלק משם פרטי.
  • form מציין צורות מורפולוגיות נוספות שלא מתאימות באופן ברור לקבוצה הקודמת של צורות נפוצות (tense,‏ mood,‏ person וכו'). רוב הצורות האלה ספציפיות לשפות ייחודיות. השדה הזה יכול להכיל את הערכים הבאים:

    • ADNOMIAL (קוריאנית/יפנית) מציין סיומת של מילה (קוריאנית) או פועל (יפנית) שמשנה צירוף שם עצם. דוגמאות: 밥을 먹는 사람 [מישהו שאוכל אורז] ו-書く人 [מישהו שכותב].
    • AUXILIARY (קוריאנית) מציין סיומת מילה שמקשרת בין שני נשואים סמוכים, ראשי ומשני: 밥을 먹게 하다 [make (someone) to eat]
    • COMPLEMENTIZER (קוריאנית) מציין סיומת של מילה שמקשרת בין שני פסוקיות שונות או יותר: 밥을 먹고 물을 마신다 [ (I) eat rice and drink water]
    • FINAL_ENDING (קוריאנית/יפנית) מציין סיומת של מילה שמסיימת את הפסוקית או המשפט, ומופיעה בסוף הפסוקית או המשפט. דוגמאות: 밥을 먹는다 [(I) eat rice] ו-手紙を書く [write a letter].
    • GERUND (קוריאנית/יפנית) מציין סיומת של מילה שהופכת פעלים או שמות תואר לשמות עצם: (קוריאנית) 밥 먹기 [לאכול אורז] או מקשרת בין פעלים לפעלים עזר שונים: (יפנית) 書きたい [רוצה לכתוב]
    • REALIS (יפנית) מציין צורות מותנות וסובייקטיביות עם חלקיק מחבר ば: 書けば [אם (אני) אכתוב].
    • IRREALIS (יפנית) מציין חיבור פעלים עם פעלים עזר שליליים, פסיביים או סיבתיים: 書かない [לא לכתוב], 書かれる [להיכתב], 書かせる [לגרום (למישהו) לכתוב].
    • ORDER (יפנית) מציין פועל פקודה, בדומה לציווי: 書け! [write!]
    • SPECIFIC (יפנית) מציין טפסים מיוחדים שלא נכללים בשש הקטגוריות שלמעלה. השימוש הנפוץ ביותר בטופס הזה הוא נגזרת של שם עצם משם תואר על ידי הוספת סיומת לטופס: かわいさ [חמידות]
    • SHORT (רוסית) מציין שם תואר או פועל בצורת בינוני בזמן הווה בפורמט קצר.
    • LONG (רוסית) מציין שם תואר או שם פועל ארוך, בניגוד לצורה SHORT שלמעלה.

שימו לב ש-Natural Language API מספק מידע מורפולוגי על בסיס כל טוקן (ולא על בסיס כל ביטוי). יכול להיות שלא תהיה תמיכה במבנים מורפולוגיים שחוצים את הגבולות של מילים.

עצי תלות

בבקשה תחבירית, מידע על חלקי הדיבור ומידע מורפולוגי מוחזרים בשדה partOfSpeech של התשובה.

לכל משפט בטקסט שמועבר ל-Natural Language API לצורך ניתוח תחבירי, ה-API יוצר עץ תלות שמתאר את המבנה התחבירי של המשפט. המידע התחבירי מוחזר בשדה dependencyEdge של התגובה.

דיאגרמה של עץ התלות עבור המשפט היחיד הזה מתוך John F. ‫Kennedy's Inaugural speech appears below:

בכל אסימון, האלמנט dependencyEdge מזהה אילו אסימונים אחרים הוא משנה (בשדה headTokenIndex) ואת הקשר התחבירי בין האסימון הזה לבין אסימון הראש שלו (בשדה label). לדוגמה, הנה רכיב dependencyEdge של הטוקן your (המופע הראשון) בביטוי your country:

      "dependencyEdge": {
        "headTokenIndex": 4,
        "label": "POSS"
      },

האלמנט הזה מציין שהמילה 'your' משנה את הטוקן החמישי (headTokenIndex uses a zero-based offset) ושהיא משמשת כמשנה שייכות.

כל עץ תלות כולל רכיב ROOT ("label": ROOT), שמתאים לפועל העיקרי במשפט. בדוגמה שלמעלה, הרכיב ROOT הוא המילה הראשונה במשפט ("headTokenIndex": 0). המילה ROOT "Ask" היא האינדקס של עצמה (headTokenIndex).

אף על פי שעצי ניתוח תחבירי לא חוצים גבולות של משפטים, Natural Language API יוצר אינדקס של משפטים וטוקנים באמצעות ערכי היסט מבוססי-אפס בטקסט כולו.

ה-Natural Language API מתייג קשרים תחביריים באמצעות קבוצה משותפת של יחסי תלות שחלים על השפות הנתמכות. התוויות מתוארות בהמשך. בדוגמה של הטקסט, הכותרת והתווית מופיעות מתחת לטוקנים שאליהם הן מתייחסות.

תווית תיאור
UNKNOWN קשר לא ידוע
ABBREV קיצור של טוקן הכותרת.
British Broadcasting Company (BBC)
                     Head     ABBREV
ACOMP צירוף שם תואר שמשמש כמשלים (כמו מושא הפועל). הקשר הזה כולל באופן ספציפי מבני copula עם פרידיקטים של שם תואר.
The book looks heavy.
         Head  ACOMP

The book is   heavy.
         Head ACOMP
התג חל גם על תוספות של שמות תואר שאינן ארגומנטים ועל מבני העלאה עם נשואים שהם שמות תואר.
She arrived sad.
    Head    ACOMP

I consider John intelligent.
  Head          ACOMP
ADVCL פסית המשמשת כתואר פועל ומשנה פועל, כמו פסית של זמן, תוצאה, תנאי או מטרה.
The accident happened as the night was falling.
             Head                      ADVCL

If you know who did it, you should tell the teacher.
       ADVCL                       Head

He talked to him in order to secure the account.
   Head                      ADVCL
ADVPHMOD Adverbial phrase modifier (Japanese)
ADVMOD תואר פועל (שאינו תלוי) או צירוף של תואר פועל שמשמשים לשינוי המשמעות של מילה.
Genetically modified food.
ADVMOD      Head

less   often
ADVMOD Head

About  200 people came to the party.
ADVMOD Head
AMOD ביטוי תיאורי שמשמש לשינוי המשמעות של צירוף שם עצם.
Sam eats red  meat.
         AMOD Head

Sam took out a 3 million dollar loan.
                         AMOD   Head
APPOS צירוף שם עצם שנמצא מיד משמאל לצירוף שם עצם אחר, כאשר הצירוף השני משמש להגדרה או לשינוי של הצירוף הראשון.
Sam, my brother, arrived.
Head    APPOS

Bill (John’s cousin)
Head         APPOS
ATTR צירוף שמני שבראשו פועל מקשר. הערה: המאפיין <code>ATTR</code> שונה מהמאפיין <code>ACOMP</code> בכך שהתלות היא צירוף שם עצם ולא תואר.
He is  a doctor.
   Head ATTR

She resembles her mother.
    Head          ATTR
בשאלות, כינוי השאלה או שם העצם בצירוף השאלה נמצאים בקשר ``ATTR`` ל-``ROOT``.
What is  your name?
ATTR Head     NSUBJ

What breed is   the dog?
     ATTR  Head     NSUBJ
בניית משפטים עם העלאה עם פרדיקטים נומינליים משתמשת גם בקשר ``ATTR``.
I consider John an intelligent person.
  Head                         ATTR
AUX פועל לא ראשי, כמו פועל עזר מודאלי או צורה של הפועלים be,‏ do או have בזמן דקדוקי מורכב. לא כולל שימוש ב-``be`` כפועל עזר במבנה סביל.
Reagan has died.
       AUX Head

He should leave.
   AUX    Head
AUXPASS פועל לא ראשי של פסוקית בסביל.
Kennedy has been    killed.
        AUX AUXPASS Head

Kennedy was/got killed.
        AUXPASS Head
CC הקשר בין רכיב של צירוף לבין מילת הקישור. אחד מהרכיבים של צירוף (בדרך כלל הראשון) נחשב לראש הצירוף.
Bill is big  and honest.
        Head CC

They either ski  or snowboard.
            Head CC

Bill went to Florida but Jane traveled to Alaska.
     Head            CC
CCOMP פסית משועבדת עם נושא פנימי שמתפקדת כמו מושא של הפועל או שם התואר.
He says that you like  to swim.
   Head          CCOMP

I am certain that he did   it.
     Head            CCOMP

I admire the fact that you are   honest.
             Head          CCOMP
CONJ הקשר בין שני רכיבים שמחוברים באמצעות מילת קישור מתאמת, כמו 'ו' או 'או'. הרכיב הראשי של הקשר הוא הרכיב הראשון, ומילות קישור אחרות תלויות בו באמצעות הקשר 'conj'.
Bill is big and honest.
        Head    CONJ

They either ski  or snowboard.
            Head    CONJ

We have apples, pears, oranges, and bananas.
        DOBJ    CONJ   CONJ         CONJ
CSUBJ נושא תחבירי של פסוקית; כלומר, הנושא הוא פסוקית בעצמו ("What she said" בדוגמה שלמטה).
What she said  makes sense.
         CSUBJ Head
CSUBJPASS נושא תחבירי של פסוק פסיבי.
That she lied was suspected by everyone.
         CSUBJ    Head
DEP המערכת לא מצליחה לקבוע יחס תלות מדויק יותר בין שתי מילים.
Then, as if  to show that he could, . . .
         DEP    Head

travel agency florence kentucky
       Head   DEP
DET הקשר בין הראש של צירוף שם עצם לבין המגדיר שלו.
The man is here.
DET Head

Which book do you prefer?
DET   Head
DISCOURSE מילות קריאה ורכיבים אחרים בשיח שלא קשורים באופן ברור למבנה המשפט, אלא אם הם משמשים להבעת רגש. דוגמאות: מילות קריאה (``'oh'``, ``'uh-huh'``,‏ ``'Welcome'``), מילות מילוי (``'um'``,‏ ``'ah'``) ומילות קישור (``'well'``,‏ ``'like'``,‏ ``'actually'``, אבל לא ``'you know'``).
Iguazu is   in Argentina :)
       Head              DISCOURSE
DOBJ צירוף השם שהוא מושא ([אקוזטיבי](https://en.wikipedia.org/wiki/Accusative_case)) של פועל.
She gave me a raise.
    Head      DOBJ

They win  the lottery.
     Head     DOBJ
EXPL שם עצם פלאונסטי. באנגלית, אלה כמה דוגמאות לשימוש במילים it ו-there: המילה there במשמעות של קיום, והמילה it כשמשתמשים בה במבני extraposition. שם עצם פליאונסטי או קללה הוא שם עצם שלא ממלא תפקיד סמנטי של הנשוא. בשפות שכוללות מילים גסות, אפשר למקם אותן במשבצות של הנושא והמושא הישיר.
There is   a ghost in the room.
EXPL  Head   NSUBJ

It   is clear that we should decline.
EXPL Head
GOESWITH קישור בין שני חלקים של מילה שמופרדים בטקסט.
IOBJ צירוף השם שהוא האובייקט העקיף ([דאטיב](https://en.wikipedia.org/wiki/Dative_case)) של הפועל.
She gave me   a present.
    Head IOBJ   DOBJ
MARK המילה שפותחת פסוקית סופית או לא סופית, כמו'ש' או'אם'. המילה הראשית היא המילה הראשית של הפסוקית.
Forces engaged in fighting after insurgents attacked.
                           MARK             Head

He says that you like to swim.
        MARK     Head
MWE אחד משני היחסים (לצד NN) לצירוף. היא משמשת לביטויים מסוימים קבועים עם מילים פונקציונליות שמתנהגות כמו מילה פונקציונלית אחת. ביטויים שמורכבים מכמה מילים מסומנים במבנה שטוח שבו המילה הראשונה היא המילה הראשית, וכל המילים בביטוי משנות את המילה הראשונה באמצעות התווית 'MWE'.
I like dogs as   well as  cats.
            Head MWE  MWE

He cried because of  you.
         Head    MWE
MWV ביטוי מילולי שמורכב מכמה מילים.
NEG הקשר בין מילת שלילה לבין המילה שהיא משנה.
Bill is    not a scientist.
     Head  NEG

Bill is no  scientist.
        NEG Head
NN כל שם עצם שמשמש לשינוי שם העצם הראשי.
phone book
NN    Head

oil price futures
NN  NN    Head
NPADVMOD צירוף שם עצם שמשמש כתיאור פועל.
The director is 65 years    old.
                   NPADVMOD Head

Six feet     long
    NPADVMOD Head

Shares eased a fraction.
       HEAD    NPADVMOD

The silence is itself   significant.
               NPADVMOD Head

90% of Australians like him, the most     of any country.
                   Head          NPADVMOD
NSUBJ צירוף שם עצם שהוא הנושא התחבירי של פסוקית.
Clinton defeated Dole.
NSUBJ   Head

The baby  is   cute
    NSUBJ Head
NSUBJPASS צירוף שם עצם שהוא הנושא התחבירי של פסוק פסיבי.
Dole       was defeated by Clinton.
NSUBJPASS      Head
NUM כל צירוף מילים שכולל מספר ומשמש לשינוי המשמעות של שם העצם באמצעות כמות.
Sam ate three sheep.
        NUM   Head
NUMBER חלק מביטוי מספרי.
I have four   thousand sheep.
       NUMBER Head
P כל סימן פיסוק בתוך פסקה.
PARATAXIS הקשר parataxis (מיוונית, 'הצבה זה לצד זה') הוא קשר בין מילה (לרוב הנשוא העיקרי של משפט) לבין רכיבים אחרים שמוצבים זה לצד זה ללא קשר תיאום, קשר של תלות או קשר של ארגומנט עם מילת הראש. פאראטקסיס היא מקבילה לתיאום בשיח.
Let's face it we're annoyed.
Head                PARATAXIS

The guy, John said,     left early in the morning.
              PARATAXIS Head
PARTMOD תואר פועל
PCOMP משתמשים בו כשמשלים של מילת יחס הוא פסוקית או צירוף מילת יחס (או לפעמים, צירוף תואר פועל).
We have no information on   whether users are   at risk.
                       Head               PCOMP

They heard about you missing classes.
           Head      PCOMP
POBJ הראש של צירוף שם עצם אחרי מילת יחס או תואר הפועל'כאן' ו'שם'.
I sat on   the chair.
      Head     POBJ

What does CPR stand for?
POBJ                Head
POSS מילת שייכות או תיאור שייכות.
their offices
POSS  Head

Bill’s clothes.
POSS   Head
POSTNEG מילית שלילה אחרי הפועל
PRECOMP משלים של נשוא
PRECONJ מילה שמופיעה בתחילת סוגריים של מילת קישור, כמו ״either״,‏ ״both״,‏ ״neither״).
Both    the boys and the girls are here.
PRECONJ     Head
PREDET מילה שמופיעה לפני שם עצם ומשנה את המשמעות של שם העצם.
All    the boys are here.
PREDET     Head
PREF תחילית
PREP כל צירוף מילת יחס שמשמש לשינוי המשמעות של פועל, שם תואר, שם עצם או אפילו מילת יחס אחרת.
I saw a cat  in   a hat.
        Head PREP

I saw  a cat with a telescope.
  Head       PREP

He is responsible for  meals.
      Head        PREP
PRONL הקשר בין פועל למורפמה ורבלית (צרפתית)
PRT מילית של פועל.
They shut down the station.
     Head PRT

He would not put  up  with it.
             Head PRT
PS סמן אסוציאטיבי או סמן של בעלות
QUANTMOD ערך לשינוי ביטוי כמותי
RCMOD קישור משם עצם לפועל שבראש משפט יחסי.
I saw the man  you love.
          Head     RCMOD

the book that you bought
    Head          RCMOD

Bell, a company which is based in LA, makes and distributes computer products.
        Head             RCMOD
RCMODREL מילת קישור במשפט יחסי (סינית)
RDROP Ellipsis without a preceding predicate (Japanese)
REF הגורם שאליו מתייחסים (הינדית)
REMNANT משמש לסימן שלוש הנקודות.
John won bronze, Mary silver, and Sandy gold.
         Head         REMNANT           REMNANT
REPARANDUM מציין שיבושים בדיבור שבוטלו בתיקון הדיבור.
Go to         the righ- to   the left.
   REPARANDUM           Head
ROOT השורש של המשפט. ברוב המקרים, מדובר בפועל.
SNUM סיומת שמציינת יחידת מספר(יפנית)
SUFF סיומת
TMOD צירוף שם עצם ללא תוספות שמטרתו לשנות את המשמעות של הרכיב על ידי ציון זמן. ‫``TMOD`` מתעד נקודות זמן ומשך; הוא לא מתעד חזרה (``'two times'``, שיהיה ``'NPADVMOD'``).
Last night, I swam in the pool.
     TMOD     Head
TOPIC סמן נושא (סינית)
VMOD פסוקית שמתחילה בצורת האינפיניטיב של הפועל.
Berries gathered on this side of the mountain are sweeter.
Head    VMOD

He sat  in the armchair reading the morning newspaper.
   Head                 VMOD

I have nothing to say  to them.
       Head       VMOD
VOCATIVE סימון של משתתף בדיאלוג שמוזכר בטקסט (נפוץ באימיילים ובפוסטים בקבוצות דיון).
Anna,    can you bring a tent?
VOCATIVE         Head
XCOMP משלים פסוקי ללא נושא משלו, שההפניה שלו נקבעת על ידי נושא חיצוני.
He says that you like to swim.
                 Head    XCOMP

I am ready to leave.
     Head     XCOMP
SUFFIX סיומת שם
TITLE שם הכותרת
AUXCAUS פועל עזר סיבתי (יפנית)
AUXVV Helper auxiliary (Japanese)
DTMOD Rentaishi (Prenominal modifier)
FOREIGN מילים בשפה זרה
KW מילת מפתח
LIST רשימה של שרשראות פריטים דומים
NOMC פסוקית נומינלית
NOMCSUBJ נושא משפטי ששם הפעולה שלו הופך לשם עצם
NOMCSUBJPASS סביל משפטי עם שם פעולה
NUMC צירוף של משנה מספרי (יפנית)
COP פועל מקשר (ספרדית)
DISLOCATED קשר מנותק (לרכיבים שמוצגים בחזית או לפי נושא)
ASP סמן כיוון המדרון
GMOD מגביל גנטיבי
GOBJ מושא גנטיבי
INFMOD תואר פועל אינפיניטיבי
MES מדידה
NCOMP משלים שמני של שם עצם

מידע נוסף על עצי תלות זמין בפרויקט Universal Dependency Treebank. בנוסף, במאמר Universal Dependency Annotation for Multilingual Processing מופיע מידע רקע על המתודולוגיה שמשמשת לפרשנות של עץ תלות כזה.

ניתוח של תגובה לניתוח תחבירי

הקוד המדומה הבא מספק תבנית נפוצה לשימוש כשמבצעים פעולות איטרטיביות בתגובה של הניתוח התחבירי:

index = 0
  for sentence in self.sentences:
    content  = sentence['text']['content']
    sentence_begin = sentence['text']['beginOffset']
    sentence_end = sentence_begin + len(content) - 1
    while index < len(self.tokens) and self.tokens[index]['text']['beginOffset'] <= sentence_end:
      # This token is in this sentence
      index += 1