השיטה analyzeSyntax מחזירה פרטים על המבנה הלשוני של הטקסט שצוין. לכל טוקן בטקסט, Natural Language API מספק מידע על המבנה הפנימי שלו (מורפולוגיה) ועל התפקיד שלו במשפט (תחביר).
מורפולוגיה היא חקר המבנה הפנימי של מילים. מורפולוגיה מתמקדת באופן שבו הרכיבים בתוך מילה (שורשים, מילים בסיסיות, תחיליות, סיומות וכו') מסודרים או משתנים כדי ליצור משמעויות שונות. לדוגמה, באנגלית מוסיפים בדרך כלל את הסיומות -s או -es לשם עצם שניתן לספירה כדי לציין רבים, ואת הסיומות -d או -ed לפועל כדי לציין עבר. הסיומת -ly מתווספת לשמות תואר כדי ליצור תואר פועל (לדוגמה, happy [שמח] ו-happily [בשמחה]).
Natural Language API משתמש בניתוח מורפולוגי כדי להסיק מידע דקדוקי על מילים.
יש הבדלים גדולים במורפולוגיה בין השפות. בשפות כמו רוסית, סיומות של מילים מציינות את התפקיד של המילה במשפט (לדוגמה, המילה книга [ספר – מקרה נומינטיבי] הופכת ל-книгу [מקרה אקוזטיבי] כשהיא מושא ישיר של פועל). כלומר, סדר המילים יכול להשתנות בלי לשנות את משמעות המשפט, אבל סדר מילים שונה משפיע על ההתאמה להקשר. בשפות כמו אנגלית ומנדרינית, שאין בהן תוספות שמציינות את המין, הסדר של המילים במשפט חשוב יותר כדי להבין את התפקיד של כל מילה. לכן, ניתוח מורפולוגי תלוי מאוד בשפת המקור, ובהבנה של מה נתמך בשפה הזו.
תחביר הוא חקר המבנה של ביטויים ומשפטים. התחביר והמורפולוגיה פועלים יחד כדי לציין קשרים דקדוקיים, ובשפות שונות חלוקת העבודה ביניהם שונה. לדוגמה, ברוסית משתמשים בנספח כדי לציין את התפקיד של מושא ישיר (у ב-книгу), בעוד שבאנגלית משתמשים בסדר המילים, שבו המושא הישיר מופיע אחרי הפועל (read the book).
התשובה analyzeSyntax מחזירה מידע מורפולוגי בשדה partOfSpeech
ואת הקשר התחבירי בין מילים בשדה dependencyTree.
חלקי דיבור
בבקשה תחבירית, מידע על חלקי הדיבור ומידע מורפולוגי מוחזרים בשדה partOfSpeech של התשובה. השדה partOfSpeech מכיל קבוצה של שדות משנה עם מידע על חלק הדיבור (POS) וגם מידע מורפולוגי מפורט יותר. השדות המשניים האלה מפורטים בהמשך.
tagמציין את חלק הדיבור באמצעות תג POS גס (שם עצם, פועל וכו'), ומספק מידע על תחביר ברמה העליונה. תגי POS שימושיים אם רוצים ליצור דפוסים או לצמצם את הדו-משמעות בניתוח שפה עתידי (לדוגמה, train שתויג כ-NOUN לעומת VERB).
numberמציין את המספר הדקדוקי של מילה. בעברית, מוסיפים את הסיומת 'ים' לשמות עצם בנייה כדי לציין שיש יותר מאחד (לדוגמה, 'כלב+ים' מציין שיש יותר מכלב אחד). היעדר הסיומת לרבים נקרא לעיתים קרובות צורת היחיד. יש שפות, כמו ערבית, שבהן יש גם מושג של מספר כפול. השדה הזה יכול להכיל את הערכים הבאים:-
SINGULARמציין כמות אחת. -
PLURALמציין יותר מכמות אחת. -
DUALמציין בדיוק שתי כמויות.
-
personמציין את הגוף הדקדוקי של מילה. באנגלית, המילים I ו-me הן גוף ראשון יחיד ומתייחסות לדובר (או לכותב) של הביטוי, בעוד שהמילים you ו-she/her ו-he/him מתייחסות לנמען המיועד (המאזין) ולאדם אחר, בהתאמה. השדה הזה יכול להכיל את הערכים הבאים:FIRSTperson denotes the speaker.SECONDperson מציין את הנמען המיועד, כלומר האדם שאליו מדברים.THIRDמציין שאדם מסוים לא מדבר או לא שומע.-
REFLEXIVE_PERSONמציין, לדוגמה, שהנושא והאובייקט מתייחסים לאותה ישות, כמו במשפט 'החתול ליקק את עצמו', שבו -self מצורף לכינוי גוף כדי לציין רפלקסיביות. ברוסית וביפנית, המילה הרפלקסיבית היא כינוי גוף עצמאי. (לדוגמה, המשפט 'John loves himself' באנגלית הוא 'Джон любит себя' ברוסית, כאשר המילה 'себя' היא ניטרלית מבחינת מגדר ומשמעותה 'עצמו'. ביפנית, המשפט הוא 'Tarō wa zibun o aisuru' (גרסה ברומג'י), כאשר המילה 'zibun' היא ניטרלית מבחינת מגדר ומשמעותה 'עצמו'. ראו כינוי רפלקסיבי).
genderמציין את המין הדקדוקי של שם העצם. השדה הזה יכול להכיל את הערכים הבאים:FEMININEלשון הפנייהMASCULINEלשון הפנייהNEUTERלשון הפנייה
caseמציין את התפקיד הדקדוקי של המילה ואת התפקיד שלה בביטוי או במשפט. השדה הזה יכול להכיל את הערכים הבאים::ACCUSATIVEcase מציין את האובייקט הישיר של פועל יוצא.- השימוש ב-
ADVERBIALcase מציין צורה תואמת של שם תואר. שימו לב שבשפה האנגלית יש מילים נפרדות לשמות תואר ("good") ולתואר הפועל ("well"). הסיומת -ly באנגלית יוצרת תואר פועל משם תואר (לדוגמה, happy, happily), אבל היא לא נחשבת ל'מקרה'. - המקרה
COMPLEMENTIVE(סינית) מציין מילה שנדרשת להשלמת המשמעות של ביטוי פוטנציאלי, תיאורי או תוצאתי באמצעות חלקיק מחבר. - במקרה
DATIVE, יש אובייקט עקיף שמתייחס לאובייקט הישיר שמקבל את האובייקט. באנגלית, מושא עקיף מסומן בדרך כלל על ידי מילת היחס to, כמו במשפט He gave the ball to Bobby, שבו Bobby הוא המושא העקיף, והוא מקבל את הכדור. לעומת זאת, בדוגמה הזו מרוסית: Иван дал книгу маше (איוון נתן את הספר למאשה), “-e” מציין ש-маше הוא מושא עקיף, ומאשה היא מקבלת הספר. - האובייקט
GENITIVEcase מציין בעלות. שימו לב שבשפה האנגלית, לעיתים קרובות מציינים בעלות באמצעות התוספת -'s במקום באמצעות יחסת השייכות. התחילית "-'s" יכולה להופיע בסוף של צירוף מילים (לדוגמה, “[The man who ran the bill up]’s wife paid a dear price for his excess.”). לעומת זאת, בדוגמה הזו ברוסית, הסיומת "-а" מציינת את המילה "Антон-" כשייכת: "Где книга Антона?" (איפה הספר של אנטון?). ברוסית, מקרה הגניטיב מופיע גם כמשלים של מילים כמו 'כמה' או 'מעט'. לדוגמה: Зимой здесь мало снега (בחורף יש כאן מעט שלג) – הסיומת -a מציינת ש-снег- (שלג) הוא גניטיב, כי הוא המשלים של мало (מעט). אין כאן בעלות. - התג
INSTRUMENTALcase מציין אם שם העצם הוא הכלי שבאמצעותו הפעולה הושלמה. ברוסית, המשפט באנגלית, "He opened the door with a key" (הוא פתח את הדלת עם מפתח), יהיה: “он открыл дверь ключом” (הוא פתח את הדלת עם מפתח) כאשר הסיומת -om מתווספת למילה ключ (מפתח) ומציינת את המקרה האינסטרומנטלי. - השימוש במונח
LOCATIVEמציין שהמילה מתייחסת למיקום. בעברית, אין יחסת מיקום. NOMINATIVEהנושא משויך לנושא של הפועל. באנגלית, הנושא של המשפט מצוין באמצעות סדר המילים, ולא באמצעות אותיות רישיות. במשפט "הילדה ניצחה במרוץ", הביטוי "הילדה" הוא הנושא, והוא מופיע מימין לפועל "ניצחה". ברוסית, המילה девушка (הילדה) יכולה להופיע לפני הפועל או אחריו: "девушка выиграла гонку" או "гонку выиграла девушка", כאשר הפועל הוא выиграла (ניצחה).- האותיות
OBLIQUEמציינות שימוש במילה כנושא של פועל או מילת יחס. - התג
PARTITIVEcase מציין את ה"חלקיות" של מילה או את העובדה שאין לה זהות ספציפית. דוגמה ל-partitive באנגלית היא 'three of my friends'. ברוסית, זה יהיה 'трое моих друзей', כאשר 'трое' הוא 'three of' (בהשוואה ל-'три друга', שבו 'три' הוא 'three'). PREPOSITIONALcase מציין את האובייקט של מילת יחס.- המאפיין
REFLEXIVE_CASEמציין את הזהות של אובייקט של פועל ביחס לנושא שלו. ברוב השפות לא משתמשים בנטייה רפלקסיבית, כי השימוש הזה מסומן באמצעות שימוש בכינויי גוף רפלקסיביים מיוחדים (כמו 'עצמו', 'עצמי' וכו'). - התו
RELATIVE_CASE(סיני) מציין את מילת הקישור של פסוקית יחסית שמקשרת בין שם עצם לפועל או לשם תואר. דוגמאות: 工作 [的] 地方 (work [] place :: "place [where I] work"). 便宜 的 餐馆 (מסעדות זולות :: מסעדות [שהן] זולות). VOCATIVEמקרה מציין שם עצם שמשמש לפנייה למישהו או למשהו, בדרך כלל כשמדברים אליו.
tenseמציין את הזמן הדקדוקי של הפועל, שמציין את ההתייחסות של הפועל למיקום בזמן. שימו לב שהמאפייןtenseשונה מהמאפייןaspect, שגם הוא מתייחס לקשר בין הפועל לזמן, אבל מתמקד במאפיינים של רצף הזמן הזה ולא במיקום שלו. במקרים רבים, הזמניםIMPERFECTו-PLUPERFECTבשפות רבות מתייחסים באופן מדויק יותר לשילובים ספציפיים של זמן ופועל. השדה הזה יכול להכיל את הערכים הבאים:-
CONDITIONAL_TENSEהוא מונח חלופי למונח המורפולוגי הנפוץ יותר 'מצב מותנה'. (ראוCONDITIONAL_MOODבהמשך). -
FUTUREמציין פעולה שתתבצע בעתיד. שימו לב שבעברית, כדי לציין זמן עתיד, בדרך כלל מוסיפים את המילה 'יהיה' לצירוף פועל. -
PASTמציין פעולה שהתרחשה בעבר. -
PRESENTמציין פעולה שמתבצעת כרגע. IMPERFECTמציין פעולה שהתרחשה בעבר, אבל לא הושלמה במסגרת הזמן של הזמן הזה. שימו לב שבעברית, כדי לציין זמן עבר מתמשך, מוסיפים את הצורה המתמשכת של הפועל לזמן העבר, כמו במשפט 'הלכתי'. אירוע בזמן עבר לא מושלם מתרחש בעבר, אבל הוא לא מושלם ביחס לזמן העבר הזה.-
PLUPERFECTמציין פעולה שהתרחשה בעבר והושלמה גם היא במסגרת הזמן של הזמן הזה. לדוגמה, הפועל 'הלכתי' מתייחס לעבר, אבל הפעולה גם הושלמה במסגרת הזמן של העבר.
-
aspectמציין את ההיבט הדקדוקי של הפועל, את הביטוי של רצף הזמן. בניגוד ל-tense, שמתמקד במיקום של הפועל בציר הזמן,aspectמתמקד במאפיינים של ציר הזמן שבו הפועל מתרחש. השדה הזה יכול להכיל את הערכים הבאים:- ההיבט
PERFECTIVEמציין אירוע ש "הושלם" כי הוא התרחש בעבר או יתרחש בעתיד. - המאפיין
IMPERFECTIVEaspect מציין אירוע לא שלם, כי הוא מתמשך או חוזר. - ההיבט
PROGRESSIVEמציין אירוע מתמשך. בדרך כלל מתייחסים להיבט מתמשך כמקרה מיוחד של היבט לא מושלם כללי יותר (שכולל גם חזרה).
- ההיבט
moodמציין את המודוס הדקדוקי של הפועל, שמצביע על הגישה לפעולה הבסיסית. השדה הזה יכול להכיל את הערכים הבאים:-
CONDITIONAL_MOODמציין פעולה שהיא תלויה. הערה: באנגלית, צורות הפועל לא מותנות. במקום זאת, התנהגות מותנית מצוינת באמצעות שימוש במילה would בשילוב עם צורת המקור של הפועל. -
IMPERATIVEמציין פקודה או בקשה באמצעות פנייה בגוף שני. -
INDICATIVEמציין עובדה, או באופן כללי יותר, מצב עובדתי. INTERROGATIVEמציין שאלה.-
JUSSIVEמציין פקודה או בקשה בגוף ראשון או בגוף שלישי. באנגלית אין מצב ציווי, אבל פניות שמתחילות במילה "Let us" (בואו) או במילה דומה, מעבירות את מצב הציווי הזה. -
SUBJUNCTIVEמציין איכות של אי-ודאות שקשורה לפעולה, שנקראת גם מצב רוח 'לא מציאותי' (בניגוד למצב הרוח 'מציאותי'). באנגלית אין מצב רוח סובייקטיבי ספציפי. במקום זאת, מילים כמו want, wish, hope וכו' מעבירות את המשמעות של מצב הרוח הסובייקטיבי.
-
voiceמציין את הקול הדקדוקי של הפועל, את היחס בין פעולה לבין נושא או מושא. השדה הזה יכול להכיל את הערכים הבאים:ACTIVEvoice מציין פעולה שהנושא שלה מבצע את הפעולה.- קול
CAUSATIVEמציין פעולה שההשפעה שלה מתבצעת על הנושא. באנגלית, אין קול סביל ישיר שמשמש לציון סיבתיות. במקום זאת, משתמשים בפועל make, כמו במשפט Mom made me go to school (אמא גרמה לי ללכת לבית הספר). - קול
PASSIVEמציין פעולה שההשפעה שלה מתבצעת על הנושא. במקרים רבים, ה'גורם' הפסיבי לא מוזכר או לא ידוע.
הסימן
reciprocityמציין הדדיות של מילה (בדרך כלל כינוי גוף), ומציין שכינוי הגוף מתייחס לצירוף שם עצם במקום אחר במשפט. השדה הזה יכול להכיל את הערכים הבאים:-
RECIPROCALמציין שהכינוי הוא הדדי. -
NON_RECIPROCALמציין שהכינוי לא הדדי.
-
properמציין אם שם עצם הוא חלק משם פרטי. שימו לב ששמות עצם רבים מורכבים מכמה מילים. אם הביטוי הזה מזוהה כשם עצם, כל טוקן יזוהה כשם עצם גם כן. (לדוגמה, גם 'Wrigley' וגם 'Field' בשם העצם 'Wrigley Field' יקבלו את הערךPROPERבמאפיין proper). השדה הזה יכול להכיל את הערכים הבאים:-
PROPERמציין שהטוקן הוא חלק משם פרטי. -
NOT_PROPERמציין שהטוקן לא מהווה חלק משם פרטי.
-
formמציין צורות מורפולוגיות נוספות שלא מתאימות באופן ברור לקבוצה הקודמת של צורות נפוצות (tense,mood,personוכו'). רוב הצורות האלה ספציפיות לשפות ייחודיות. השדה הזה יכול להכיל את הערכים הבאים:-
ADNOMIAL(קוריאנית/יפנית) מציין סיומת של מילה (קוריאנית) או פועל (יפנית) שמשנה צירוף שם עצם. דוגמאות: 밥을 먹는 사람 [מישהו שאוכל אורז] ו-書く人 [מישהו שכותב]. -
AUXILIARY(קוריאנית) מציין סיומת מילה שמקשרת בין שני נשואים סמוכים, ראשי ומשני: 밥을 먹게 하다 [make (someone) to eat] -
COMPLEMENTIZER(קוריאנית) מציין סיומת של מילה שמקשרת בין שני פסוקיות שונות או יותר: 밥을 먹고 물을 마신다 [ (I) eat rice and drink water] -
FINAL_ENDING(קוריאנית/יפנית) מציין סיומת של מילה שמסיימת את הפסוקית או המשפט, ומופיעה בסוף הפסוקית או המשפט. דוגמאות: 밥을 먹는다 [(I) eat rice] ו-手紙を書く [write a letter]. -
GERUND(קוריאנית/יפנית) מציין סיומת של מילה שהופכת פעלים או שמות תואר לשמות עצם: (קוריאנית) 밥 먹기 [לאכול אורז] או מקשרת בין פעלים לפעלים עזר שונים: (יפנית) 書きたい [רוצה לכתוב] -
REALIS(יפנית) מציין צורות מותנות וסובייקטיביות עם חלקיק מחבר ば: 書けば [אם (אני) אכתוב]. -
IRREALIS(יפנית) מציין חיבור פעלים עם פעלים עזר שליליים, פסיביים או סיבתיים: 書かない [לא לכתוב], 書かれる [להיכתב], 書かせる [לגרום (למישהו) לכתוב]. -
ORDER(יפנית) מציין פועל פקודה, בדומה לציווי: 書け! [write!] -
SPECIFIC(יפנית) מציין טפסים מיוחדים שלא נכללים בשש הקטגוריות שלמעלה. השימוש הנפוץ ביותר בטופס הזה הוא נגזרת של שם עצם משם תואר על ידי הוספת סיומת לטופס: かわいさ [חמידות] -
SHORT(רוסית) מציין שם תואר או פועל בצורת בינוני בזמן הווה בפורמט קצר. -
LONG(רוסית) מציין שם תואר או שם פועל ארוך, בניגוד לצורהSHORTשלמעלה.
-
שימו לב ש-Natural Language API מספק מידע מורפולוגי על בסיס כל טוקן (ולא על בסיס כל ביטוי). יכול להיות שלא תהיה תמיכה במבנים מורפולוגיים שחוצים את הגבולות של מילים.
עצי תלות
בבקשה תחבירית, מידע על חלקי הדיבור ומידע מורפולוגי מוחזרים בשדה partOfSpeech של התשובה.
לכל משפט בטקסט שמועבר ל-Natural Language API לצורך ניתוח תחבירי, ה-API יוצר עץ תלות שמתאר את המבנה התחבירי של המשפט. המידע התחבירי מוחזר בשדה dependencyEdge של התגובה.
דיאגרמה של עץ התלות עבור המשפט היחיד הזה מתוך John F. Kennedy's Inaugural speech appears below:
בכל אסימון, האלמנט dependencyEdge מזהה אילו אסימונים אחרים הוא משנה (בשדה headTokenIndex) ואת הקשר התחבירי בין האסימון הזה לבין אסימון הראש שלו (בשדה label). לדוגמה, הנה רכיב dependencyEdge של הטוקן your (המופע הראשון) בביטוי your country:
"dependencyEdge": {
"headTokenIndex": 4,
"label": "POSS"
},
האלמנט הזה מציין שהמילה 'your' משנה את הטוקן החמישי (headTokenIndex uses
a zero-based offset) ושהיא משמשת כמשנה שייכות.
כל עץ תלות כולל רכיב ROOT ("label": ROOT), שמתאים לפועל העיקרי במשפט. בדוגמה שלמעלה, הרכיב ROOT הוא המילה הראשונה במשפט ("headTokenIndex": 0). המילה ROOT "Ask" היא האינדקס של עצמה (headTokenIndex).
אף על פי שעצי ניתוח תחבירי לא חוצים גבולות של משפטים, Natural Language API יוצר אינדקס של משפטים וטוקנים באמצעות ערכי היסט מבוססי-אפס בטקסט כולו.
ה-Natural Language API מתייג קשרים תחביריים באמצעות קבוצה משותפת של יחסי תלות שחלים על השפות הנתמכות. התוויות מתוארות בהמשך. בדוגמה של הטקסט, הכותרת והתווית מופיעות מתחת לטוקנים שאליהם הן מתייחסות.
| תווית | תיאור |
|---|---|
UNKNOWN |
קשר לא ידוע |
ABBREV |
קיצור של טוקן הכותרת.
British Broadcasting Company (BBC)
Head ABBREV
|
ACOMP |
צירוף שם תואר שמשמש כמשלים (כמו מושא הפועל). הקשר הזה כולל באופן ספציפי מבני copula עם פרידיקטים של שם תואר.
The book looks heavy.
Head ACOMP
The book is heavy.
Head ACOMP
She arrived sad.
Head ACOMP
I consider John intelligent.
Head ACOMP
|
ADVCL |
פסית המשמשת כתואר פועל ומשנה פועל, כמו פסית של זמן, תוצאה, תנאי או מטרה.
The accident happened as the night was falling.
Head ADVCL
If you know who did it, you should tell the teacher.
ADVCL Head
He talked to him in order to secure the account.
Head ADVCL
|
ADVPHMOD |
Adverbial phrase modifier (Japanese) |
ADVMOD |
תואר פועל (שאינו תלוי) או צירוף של תואר פועל שמשמשים לשינוי המשמעות של מילה.Genetically modified food. ADVMOD Head less often ADVMOD Head About 200 people came to the party. ADVMOD Head |
AMOD |
ביטוי תיאורי שמשמש לשינוי המשמעות של צירוף שם עצם.
Sam eats red meat.
AMOD Head
Sam took out a 3 million dollar loan.
AMOD Head
|
APPOS |
צירוף שם עצם שנמצא מיד משמאל לצירוף שם עצם אחר, כאשר הצירוף השני משמש להגדרה או לשינוי של הצירוף הראשון.Sam, my brother, arrived. Head APPOS Bill (John’s cousin) Head APPOS |
ATTR |
צירוף שמני שבראשו פועל מקשר. הערה: המאפיין <code>ATTR</code> שונה מהמאפיין <code>ACOMP</code> בכך שהתלות היא צירוף שם עצם ולא תואר.
He is a doctor.
Head ATTR
She resembles her mother.
Head ATTR
What is your name?
ATTR Head NSUBJ
What breed is the dog?
ATTR Head NSUBJ
I consider John an intelligent person. Head ATTR |
AUX |
פועל לא ראשי, כמו פועל עזר מודאלי או צורה של הפועלים be, do או have בזמן דקדוקי מורכב. לא כולל שימוש ב-``be`` כפועל עזר במבנה סביל.
Reagan has died.
AUX Head
He should leave.
AUX Head
|
AUXPASS |
פועל לא ראשי של פסוקית בסביל.
Kennedy has been killed.
AUX AUXPASS Head
Kennedy was/got killed.
AUXPASS Head
|
CC |
הקשר בין רכיב של צירוף לבין מילת הקישור. אחד מהרכיבים של צירוף (בדרך כלל הראשון) נחשב לראש הצירוף.
Bill is big and honest.
Head CC
They either ski or snowboard.
Head CC
Bill went to Florida but Jane traveled to Alaska.
Head CC
|
CCOMP |
פסית משועבדת עם נושא פנימי שמתפקדת כמו מושא של הפועל או שם התואר.
He says that you like to swim.
Head CCOMP
I am certain that he did it.
Head CCOMP
I admire the fact that you are honest.
Head CCOMP
|
CONJ |
הקשר בין שני רכיבים שמחוברים באמצעות מילת קישור מתאמת, כמו 'ו' או 'או'. הרכיב הראשי של הקשר הוא הרכיב הראשון, ומילות קישור אחרות תלויות בו באמצעות הקשר 'conj'.
Bill is big and honest.
Head CONJ
They either ski or snowboard.
Head CONJ
We have apples, pears, oranges, and bananas.
DOBJ CONJ CONJ CONJ
|
CSUBJ |
נושא תחבירי של פסוקית; כלומר, הנושא הוא פסוקית בעצמו ("What she said" בדוגמה שלמטה).
What she said makes sense.
CSUBJ Head
|
CSUBJPASS |
נושא תחבירי של פסוק פסיבי.
That she lied was suspected by everyone.
CSUBJ Head
|
DEP |
המערכת לא מצליחה לקבוע יחס תלות מדויק יותר בין שתי מילים.
Then, as if to show that he could, . . .
DEP Head
travel agency florence kentucky
Head DEP
|
DET |
הקשר בין הראש של צירוף שם עצם לבין המגדיר שלו.The man is here. DET Head Which book do you prefer? DET Head |
DISCOURSE |
מילות קריאה ורכיבים אחרים בשיח שלא קשורים באופן ברור למבנה המשפט, אלא אם הם משמשים להבעת רגש. דוגמאות: מילות קריאה (``'oh'``, ``'uh-huh'``, ``'Welcome'``), מילות מילוי (``'um'``, ``'ah'``) ומילות קישור (``'well'``, ``'like'``, ``'actually'``, אבל לא ``'you know'``).
Iguazu is in Argentina :)
Head DISCOURSE
|
DOBJ |
צירוף השם שהוא מושא ([אקוזטיבי](https://en.wikipedia.org/wiki/Accusative_case)) של פועל.
She gave me a raise.
Head DOBJ
They win the lottery.
Head DOBJ
|
EXPL |
שם עצם פלאונסטי. באנגלית, אלה כמה דוגמאות לשימוש במילים it ו-there: המילה there במשמעות של קיום, והמילה it כשמשתמשים בה במבני extraposition. שם עצם פליאונסטי או קללה הוא שם עצם שלא ממלא תפקיד סמנטי של הנשוא. בשפות שכוללות מילים גסות, אפשר למקם אותן במשבצות של הנושא והמושא הישיר.There is a ghost in the room. EXPL Head NSUBJ It is clear that we should decline. EXPL Head |
GOESWITH |
קישור בין שני חלקים של מילה שמופרדים בטקסט. |
IOBJ |
צירוף השם שהוא האובייקט העקיף ([דאטיב](https://en.wikipedia.org/wiki/Dative_case)) של הפועל.
She gave me a present.
Head IOBJ DOBJ
|
MARK |
המילה שפותחת פסוקית סופית או לא סופית, כמו'ש' או'אם'. המילה הראשית היא המילה הראשית של הפסוקית.
Forces engaged in fighting after insurgents attacked.
MARK Head
He says that you like to swim.
MARK Head
|
MWE |
אחד משני היחסים (לצד NN) לצירוף. היא משמשת לביטויים מסוימים קבועים עם מילים פונקציונליות שמתנהגות כמו מילה פונקציונלית אחת. ביטויים שמורכבים מכמה מילים מסומנים במבנה שטוח שבו המילה הראשונה היא המילה הראשית, וכל המילים בביטוי משנות את המילה הראשונה באמצעות התווית 'MWE'.
I like dogs as well as cats.
Head MWE MWE
He cried because of you.
Head MWE
|
MWV |
ביטוי מילולי שמורכב מכמה מילים. |
NEG |
הקשר בין מילת שלילה לבין המילה שהיא משנה.
Bill is not a scientist.
Head NEG
Bill is no scientist.
NEG Head
|
NN |
כל שם עצם שמשמש לשינוי שם העצם הראשי.phone book NN Head oil price futures NN NN Head |
NPADVMOD |
צירוף שם עצם שמשמש כתיאור פועל.
The director is 65 years old.
NPADVMOD Head
Six feet long
NPADVMOD Head
Shares eased a fraction.
HEAD NPADVMOD
The silence is itself significant.
NPADVMOD Head
90% of Australians like him, the most of any country.
Head NPADVMOD
|
NSUBJ |
צירוף שם עצם שהוא הנושא התחבירי של פסוקית.
Clinton defeated Dole.
NSUBJ Head
The baby is cute
NSUBJ Head
|
NSUBJPASS |
צירוף שם עצם שהוא הנושא התחבירי של פסוק פסיבי.Dole was defeated by Clinton. NSUBJPASS Head |
NUM |
כל צירוף מילים שכולל מספר ומשמש לשינוי המשמעות של שם העצם באמצעות כמות.
Sam ate three sheep.
NUM Head
|
NUMBER |
חלק מביטוי מספרי.
I have four thousand sheep.
NUMBER Head
|
P |
כל סימן פיסוק בתוך פסקה. |
PARATAXIS |
הקשר parataxis (מיוונית, 'הצבה זה לצד זה') הוא קשר בין מילה (לרוב הנשוא העיקרי של משפט) לבין רכיבים אחרים שמוצבים זה לצד זה ללא קשר תיאום, קשר של תלות או קשר של ארגומנט עם מילת הראש. פאראטקסיס היא מקבילה לתיאום בשיח.
Let's face it we're annoyed.
Head PARATAXIS
The guy, John said, left early in the morning.
PARATAXIS Head
|
PARTMOD |
תואר פועל |
PCOMP |
משתמשים בו כשמשלים של מילת יחס הוא פסוקית או צירוף מילת יחס (או לפעמים, צירוף תואר פועל).
We have no information on whether users are at risk.
Head PCOMP
They heard about you missing classes.
Head PCOMP
|
POBJ |
הראש של צירוף שם עצם אחרי מילת יחס או תואר הפועל'כאן' ו'שם'.
I sat on the chair.
Head POBJ
What does CPR stand for?
POBJ Head
|
POSS |
מילת שייכות או תיאור שייכות.their offices POSS Head Bill’s clothes. POSS Head |
POSTNEG |
מילית שלילה אחרי הפועל |
PRECOMP |
משלים של נשוא |
PRECONJ |
מילה שמופיעה בתחילת סוגריים של מילת קישור, כמו ״either״, ״both״, ״neither״).Both the boys and the girls are here. PRECONJ Head |
PREDET |
מילה שמופיעה לפני שם עצם ומשנה את המשמעות של שם העצם.All the boys are here. PREDET Head |
PREF |
תחילית |
PREP |
כל צירוף מילת יחס שמשמש לשינוי המשמעות של פועל, שם תואר, שם עצם או אפילו מילת יחס אחרת.
I saw a cat in a hat.
Head PREP
I saw a cat with a telescope.
Head PREP
He is responsible for meals.
Head PREP
|
PRONL |
הקשר בין פועל למורפמה ורבלית (צרפתית) |
PRT |
מילית של פועל.
They shut down the station.
Head PRT
He would not put up with it.
Head PRT
|
PS |
סמן אסוציאטיבי או סמן של בעלות |
QUANTMOD |
ערך לשינוי ביטוי כמותי |
RCMOD |
קישור משם עצם לפועל שבראש משפט יחסי.
I saw the man you love.
Head RCMOD
the book that you bought
Head RCMOD
Bell, a company which is based in LA, makes and distributes computer products.
Head RCMOD
|
RCMODREL |
מילת קישור במשפט יחסי (סינית) |
RDROP |
Ellipsis without a preceding predicate (Japanese) |
REF |
הגורם שאליו מתייחסים (הינדית) |
REMNANT |
משמש לסימן שלוש הנקודות.
John won bronze, Mary silver, and Sandy gold.
Head REMNANT REMNANT
|
REPARANDUM |
מציין שיבושים בדיבור שבוטלו בתיקון הדיבור.Go to the righ- to the left. REPARANDUM Head |
ROOT |
השורש של המשפט. ברוב המקרים, מדובר בפועל. |
SNUM |
סיומת שמציינת יחידת מספר(יפנית) |
SUFF |
סיומת |
TMOD |
צירוף שם עצם ללא תוספות שמטרתו לשנות את המשמעות של הרכיב על ידי ציון זמן. ``TMOD`` מתעד נקודות זמן ומשך; הוא לא מתעד חזרה (``'two times'``, שיהיה ``'NPADVMOD'``).
Last night, I swam in the pool.
TMOD Head
|
TOPIC |
סמן נושא (סינית) |
VMOD |
פסוקית שמתחילה בצורת האינפיניטיב של הפועל.
Berries gathered on this side of the mountain are sweeter.
Head VMOD
He sat in the armchair reading the morning newspaper.
Head VMOD
I have nothing to say to them.
Head VMOD
|
VOCATIVE |
סימון של משתתף בדיאלוג שמוזכר בטקסט (נפוץ באימיילים ובפוסטים בקבוצות דיון).Anna, can you bring a tent? VOCATIVE Head |
XCOMP |
משלים פסוקי
ללא נושא משלו, שההפניה שלו נקבעת על ידי נושא חיצוני.
He says that you like to swim.
Head XCOMP
I am ready to leave.
Head XCOMP
|
SUFFIX |
סיומת שם |
TITLE |
שם הכותרת |
AUXCAUS |
פועל עזר סיבתי (יפנית) |
AUXVV |
Helper auxiliary (Japanese) |
DTMOD |
Rentaishi (Prenominal modifier) |
FOREIGN |
מילים בשפה זרה |
KW |
מילת מפתח |
LIST |
רשימה של שרשראות פריטים דומים |
NOMC |
פסוקית נומינלית |
NOMCSUBJ |
נושא משפטי ששם הפעולה שלו הופך לשם עצם |
NOMCSUBJPASS |
סביל משפטי עם שם פעולה |
NUMC |
צירוף של משנה מספרי (יפנית) |
COP |
פועל מקשר (ספרדית) |
DISLOCATED |
קשר מנותק (לרכיבים שמוצגים בחזית או לפי נושא) |
ASP |
סמן כיוון המדרון |
GMOD |
מגביל גנטיבי |
GOBJ |
מושא גנטיבי |
INFMOD |
תואר פועל אינפיניטיבי |
MES |
מדידה |
NCOMP |
משלים שמני של שם עצם |
מידע נוסף על עצי תלות זמין בפרויקט Universal Dependency Treebank. בנוסף, במאמר Universal Dependency Annotation for Multilingual Processing מופיע מידע רקע על המתודולוגיה שמשמשת לפרשנות של עץ תלות כזה.
ניתוח של תגובה לניתוח תחבירי
הקוד המדומה הבא מספק תבנית נפוצה לשימוש כשמבצעים פעולות איטרטיביות בתגובה של הניתוח התחבירי:
index = 0
for sentence in self.sentences:
content = sentence['text']['content']
sentence_begin = sentence['text']['beginOffset']
sentence_end = sentence_begin + len(content) - 1
while index < len(self.tokens) and self.tokens[index]['text']['beginOffset'] <= sentence_end:
# This token is in this sentence
index += 1