בחירה של פונקציית עיבוד שפה טבעית

במאמר הזה מוצגות השוואות בין הפונקציות לעיבוד שפה טבעית (NLP) שזמינות ב-BigQuery ML:‏ AI.GENERATE_TEXT,‏ ML.TRANSLATE ו-ML.UNDERSTAND_TEXT. המידע במאמר הזה יכול לעזור לכם להחליט באיזו פונקציה להשתמש במקרים שבהם יש חפיפה בין היכולות של הפונקציות.

ככלל, ההבדל בין הפונקציות האלה הוא:

  • AI.GENERATE_TEXT היא בחירה טובה לביצוע משימות מותאמות אישית של עיבוד שפה טבעית (NLP) בעלות נמוכה יותר. הפונקציה הזו מציעה תמיכה בשפות נוספות, תפוקה מהירה יותר ויכולת כוונון של המודל, והיא פועלת גם עם מודלים מרובי-אופנים.
  • ML.TRANSLATE היא בחירה טובה לביצוע משימות NLP ספציפיות לתרגום, שבהן צריך לתמוך בקצב גבוה של שאילתות לדקה.
  • ML.UNDERSTAND_TEXT הוא בחירה טובה לביצוע משימות NLP שנתמכות על ידי Cloud Natural Language API.

השוואה בין פונקציות

בטבלה הבאה אפשר להשוות בין הפונקציות AI.GENERATE_TEXT, ML.TRANSLATE ו-ML.UNDERSTAND_TEXT:

AI.GENERATE_TEXT ML.TRANSLATE ML.UNDERSTAND_TEXT
מטרה

מבצעים כל משימה של עיבוד שפה טבעית (NLP) על ידי העברת הנחיה ל-Gemini או למודל של שותף או למודל פתוח.

לדוגמה, כדי לבצע משימה של מענה לשאלות, אפשר להזין הנחיה שדומה ל-CONCAT("What are the key concepts in the following article?: ", article_text).

אפשר להשתמש ב-Cloud Translation API כדי לבצע את המשימות הבאות: אפשר להשתמש ב-Cloud Natural Language API כדי לבצע את המשימות הבאות:
חיוב

השימוש ב-BigQuery ML כרוך בחיובים על עיבוד נתונים. מידע נוסף זמין במאמר בנושא תמחור BigQuery ML.

השימוש במודל כרוך בחיובים ב-Vertex AI. אם אתם משתמשים במודל Gemini 2.0 ומעלה, החיוב על השיחה הוא לפי התעריף של Batch API. מידע נוסף מפורט במאמר עלות הפיתוח והפריסה של מודלים של AI ב-Vertex AI.

השימוש ב-BigQuery ML כרוך בחיובים על עיבוד נתונים. מידע נוסף זמין במאמר בנושא תמחור BigQuery ML.

השימוש ב-Cloud Translation API כרוך בחיוב. מידע נוסף מופיע במאמר בנושא תמחור של Cloud Translation API.

השימוש ב-BigQuery ML כרוך בחיובים על עיבוד נתונים. מידע נוסף זמין במאמר בנושא תמחור BigQuery ML.

השימוש ב-Cloud Natural Language API כרוך בחיובים. מידע נוסף מופיע במאמר בנושא תמחור של Cloud Natural Language API.

בקשות בדקה לא רלוונטי למודלים של Gemini. בין 25 ל-60 למודלים של השותפים. מידע נוסף זמין במאמר בנושא מגבלות על מספר הבקשות בדקה. ‫200. מידע נוסף זמין במאמר בנושא פונקציות של שירותי AI ב-Cloud. ‫600. מידע נוסף זמין במאמר בנושא פונקציות של שירותי AI ב-Cloud.
טוקנים בדקה הטווח הוא מ-8,192 ועד יותר ממיליון, בהתאם למודל שבו משתמשים. אין מגבלת טוקנים. עם זאת, יש ל-ML_TRANSLATE מגבלה של 30,000 בייטים. 100,000.
נתוני קלט תומך בטקסט ובנתונים לא מובנים מטבלאות רגילות ומטבלאות אובייקטים של BigQuery. תומך בנתוני טקסט מטבלאות רגילות ב-BigQuery. תומך בנתוני טקסט מטבלאות רגילות ב-BigQuery.
פלט הפונקציה התוצאות יכולות להיות שונות בשיחות עם המודל, גם אם ההנחיה זהה. מפיקה את אותו פלט עבור סוג משימה נתון לכל קריאה מוצלחת ל-API. הפלט כולל מידע על שפת הקלט. מפיקה את אותו פלט עבור סוג משימה נתון לכל קריאה מוצלחת ל-API. הפלט כולל מידע על עוצמת הסנטימנט במשימות של ניתוח סנטימנטים.
הקשר הנתונים אתם יכולים לספק הקשר לנתונים כחלק מההנחיה שאתם שולחים. לא נתמך. לא נתמך.
כוונון בפיקוח כוונון בפיקוח נתמך בחלק מהמודלים. לא נתמך. לא נתמך.
שפות נתמכות התמיכה משתנה בהתאם למודל השפה הגדול שתבחרו. תומך בשפות של Cloud Translation API. תומך בשפות של Cloud Natural Language API.
אזורים נתמכים נתמך בכל האזורים של AI גנרטיבי ב-Vertex AI. האפשרות הזו נתמכת במספר אזורים: EU ו-US. האפשרות הזו נתמכת במספר אזורים: EU ו-US.