Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

יצירת אודיו מטקסט באמצעות שורת הפקודה

במאמר הזה מוסבר איך להגיש בקשה ל-Cloud Text-to-Speech באמצעות שורת הפקודה. כדי לקרוא מידע נוסף על מושגי היסוד ב-Cloud Text-to-Speech, אפשר לעיין במאמר Cloud Text-to-Speech Basics.

לפני שמתחילים

לפני ששולחים בקשה ל-Cloud Text-to-Speech API, צריך לבצע את הפעולות הבאות. פרטים נוספים מופיעים בדף לפני שמתחילים.

הפעלת Cloud Text-to-Speech בפרויקט ב-GCP.
מוודאים שהחיוב מופעל עבור Cloud Text-to-Speech.
התקינו את ה-CLI של Google Cloud. אחר כך, אתחלו את ה-CLI של Google Cloud באמצעות הפקודה הבאה:
```
gcloud init
```
אם אתם משתמשים בספק זהויות חיצוני (IdP), קודם אתם צריכים להיכנס ל-CLI של gcloud באמצעות המאגר המאוחד לניהול זהויות.

סינתוז אודיו מטקסט

כדי להמיר טקסט לאודיו, שולחים בקשת HTTP POST לנקודת הקצה https://texttospeech.googleapis.com/v1/text:synthesize. בגוף של פקודת ה-POST, מציינים את סוג הקול לסינתזה בקטע voice configuration, מציינים את הטקסט לסינתזה בשדה text בקטע input, ומציינים את סוג האודיו ליצירה בקטע audioConfig.

מריצים את בקשת ה-REST שבהמשך בשורת הפקודה כדי לבצע סינתזה של אודיו מטקסט באמצעות Cloud TTS. הפקודה משתמשת בפקודה gcloud auth application-default print-access-token כדי לאחזר טוקן הרשאה לבקשה.

לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:
- ‫PROJECT_ID: המזהה האלפאנומרי של הפרויקט ב- Google Cloud .
ה-method של ה-HTTP וכתובת ה-URL:
```
POST https://texttospeech.googleapis.com/v1/text:synthesize
```
תוכן בקשת JSON:
```
{
  "input": {
    "text": "Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets."
  },
  "voice": {
    "languageCode": "en-gb",
    "name": "en-GB-Standard-A",
    "ssmlGender": "FEMALE"
  },
  "audioConfig": {
    "audioEncoding": "MP3"
  }
}
```
כדי לשלוח את הבקשה צריך להרחיב אחת מהאפשרויות הבאות:
‫Curl (Linux,‏ macOS או Cloud Shell)

הערה: הפקודה הבאה מבוססת על ההנחה שנכנסתם ל-CLI של gcloud באמצעות חשבון המשתמש שלכם, על ידי הרצת gcloud init או gcloud auth login, או באמצעות Cloud Shell שמחבר אתכם אוטומטית ל-CLI של gcloud. כדי לבדוק איזה חשבון פעיל, אפשר להריץ את הפקודה gcloud auth list.

שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
```
curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: PROJECT_ID" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://texttospeech.googleapis.com/v1/text:synthesize"
```
‎PowerShell (Windows)

הערה: הפקודה הבאה מבוססת על ההנחה שנכנסתם ל-CLI של gcloud באמצעות חשבון המשתמש שלכם, על ידי הרצת gcloud init או gcloud auth login. כדי לבדוק איזה חשבון פעיל, אפשר להריץ את הפקודה gcloud auth list.

שומרים את גוף הבקשה בקובץ בשם request.json ומריצים את הפקודה הבאה:
```
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "PROJECT_ID" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://texttospeech.googleapis.com/v1/text:synthesize" | Select-Object -Expand Content
```
אתם אמורים לקבל תגובת JSON שדומה לזו:
```
{
  "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.."
}
```
פלט ה-JSON של פקודת ה-REST מכיל את האודיו המסונתז בפורמט קידוד base64. מעתיקים את התוכן של השדה audioContent לקובץ חדש בשם synthesize-output-base64.txt. הקובץ החדש ייראה בערך כך:
```
//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o
...
VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
```
מפענחים את התוכן של הקובץ synthesize-output-base64.txt לקובץ חדש בשם synthesized-audio.mp3. מידע על פענוח של קידוד base64 זמין במאמר פענוח של תוכן אודיו בקידוד Base64.
Linux
1. מעתיקים רק את התוכן בקידוד Base64 לקובץ טקסט.
2. מפענחים את קובץ הטקסט של המקור באמצעות הכלי base64 של שורת הפקודה עם הדגל -d:
```
    $ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
```
Mac OSX
1. מעתיקים רק את התוכן בקידוד Base64 לקובץ טקסט.
2. מפענחים את קובץ הטקסט של המקור באמצעות כלי שורת הפקודה base64:
```
    $ base64 --decode SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
```
Windows
1. מעתיקים רק את התוכן בקידוד Base64 לקובץ טקסט.
2. מפענחים את קובץ הטקסט של המקור באמצעות הפקודה certutil.
```
   certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE
```
להפעיל את התוכן של synthesized-audio.mp3 באפליקציית אודיו או במכשיר אודיו. אפשר גם לפתוח את synthesized-audio.mp3 בדפדפן Chrome כדי להפעיל את האודיו. לשם כך, צריך לנווט לתיקייה שמכילה את הקובץ, למשל file://my_file_path/synthesized-audio.mp3

הסרת המשאבים

כדי להימנע מחיובים מיותרים ב-Google Cloud Platform, כדאי להשתמש בGoogle Cloud console כדי למחוק את הפרויקט אם הוא לא נחוץ לכם.

המאמרים הבאים

מידע נוסף על Cloud Text-to-Speech זמין במאמר מושגי יסוד.
אפשר לעיין ברשימה של הקולות הזמינים שאפשר להשתמש בהם לדיבור מסונתז.

יצירת אודיו מטקסט באמצעות שורת הפקודה

לפני שמתחילים

סינתוז אודיו מטקסט

‫Curl (Linux,‏ macOS או Cloud Shell)

‎PowerShell (Windows)

Linux

Mac OSX

Windows

הסרת המשאבים

המאמרים הבאים