כששולחים נתוני אודיו ל-Speech-to-Text API, אפשר לשלוח את הנתונים ישירות (בשדה content של הבקשה) או לבקש מה-API לבצע זיהוי מרחוק של נתונים שמאוחסנים בקטגוריה של Cloud Storage. כדי לעשות את זה, צריך לציין את אובייקט האחסון בשדה uri של הבקשה.
כל נתוני האודיו בשדה content בבקשות HTTP חייבים להיות בפורמט base64.
בדף הזה מוסבר איך להמיר אודיו מקובץ בינארי לנתונים בקידוד Base64.
שימוש בשורת הפקודה
בבקשת gRPC, אפשר פשוט לכתוב נתונים בינאריים ישירות. עם זאת, כשמבצעים בקשת REST, משתמשים ב-JSON. JSON הוא פורמט טקסט שלא תומך ישירות בנתונים בינאריים, ולכן תצטרכו להמיר נתונים בינאריים כאלה לטקסט באמצעות קידוד Base64.
רוב סביבות הפיתוח מכילות כלי עזר מקורי של base64 לקידוד קובץ בינארי לנתוני טקסט ב-ASCII. כדי לקודד קובץ:
Linux
מקודדים את הקובץ באמצעות הכלי base64 בשורת הפקודה, ומוודאים שמונעים גלישת שורות באמצעות הדגל -w 0:
base64 INPUT_FILE -w 0 > OUTPUT_FILE
macOS
מקודדים את הקובץ באמצעות הכלי base64 של שורת הפקודה:
base64 -i INPUT_FILE -o OUTPUT_FILE
Windows
מקודדים את הקובץ באמצעות הכלי Base64.exe:
Base64.exe -e INPUT_FILE > OUTPUT_FILE
PowerShell
מבצעים קידוד של הקובץ באמצעות ה-method Convert.ToBase64String:
[Convert]::ToBase64String([IO.File]::ReadAllBytes("./INPUT_FILE")) > OUTPUT_FILE
יוצרים קובץ בקשת JSON, ומוסיפים את הנתונים בקידוד base64:
JSON
{
"recognizer": "projects/PROJECT_ID/locations/global/recognizers/_",
"content": "ZkxhQwAAACIQABAAAAUJABtAA+gA8AB+W8FZndQvQAyjv..."
}
שימוש בספריות לקוח
הטמעה של נתונים בינאריים בבקשות באמצעות עורכי טקסט היא לא רצויה ולא מעשית. בפועל, תטמיעו קבצים בקידוד base64 בקוד הלקוח. לכל שפות התכנות הנתמכות יש מנגנונים מובנים לקידוד תוכן ב-Base64.
Python
ב-Python, מקודדים קובצי אודיו בקידוד Base64 באופן הבא:
# Import the base64 encoding library.
import base64
# Pass the audio data to an encoding function.
def encode_audio(audio_file):
with open(audio_file, "rb") as f:
encoded_content = base64.b64encode(f.read())
return encoded_content
Node.js
// Read the file into memory.
var fs = require('fs');
var audioFile = fs.readFileSync('/full/path/to/audio/file.wav');
// Convert the audio data to a Buffer and base64 encode it.
var encoded = Buffer.from(audioFile).toString('base64');
Java
// Import the Base64 encoding library.
import org.apache.commons.codec.binary.Base64;
// Encode the audio.
byte[] audioData = Base64.encodeBase64(audioFile.getBytes());
String encodedString = Base64.getEncoder().encodeToString(audioData);
Go
import (
"bufio"
"encoding/base64"
"io"
"os"
)
// Open audio file.
f, _ := os.Open("/full/path/to/audio/file.wav")
// Read entire audio into byte slice.
reader := bufio.NewReader(f)
content, _ := io.ReadAll(reader)
// Encode audio as base64.
base64.StdEncoding.EncodeToString(content)