אפשר להשתמש במודל מאומן של Custom Speech-to-Text באפליקציית הייצור או בתהליכי העבודה של השוואת הביצועים. ברגע שפורסים את המודל דרך נקודת קצה ייעודית, מקבלים באופן אוטומטי גישה פרוגרמטית דרך אובייקט מזהה, שאפשר להשתמש בו ישירות דרך Cloud Speech-to-Text V2 API או במסוף Google Cloud .
לפני שמתחילים
מוודאים שנרשמתם לחשבון Google Cloud , יצרתם פרויקט, אימנתם מודל מותאם אישית לזיהוי דיבור ופרסתם אותו באמצעות נקודת קצה.
ביצוע הסקה בגרסה 2
כדי שמודל מותאם אישית של תמלול יהיה מוכן לשימוש, הסטטוס של המודל בכרטיסייה Models צריך להיות Active, ונקודת הקצה הייעודית בכרטיסייה Endpoints צריכה להיות Deployed.
בדוגמה שלנו, שבה Google Cloud מזהה הפרויקט הוא custom-models-walkthrough, נקודת הקצה שמתאימה למודל המותאם אישית של Speech-to-Text quantum-computing-lectures-custom-model היא quantum-computing-lectures-custom-model-prod-endpoint. האזור שבו הוא זמין הוא us-east1, ובקשת התמלול באצווה היא:
from google.api_core import client_options
from google.cloud.speech_v2 import SpeechClient
from google.cloud.speech_v2.types import cloud_speech
def quickstart_v2(
project_id: str,
audio_file: str,
) -> cloud_speech.RecognizeResponse:
"""Transcribe an audio file."""
# Instantiates a client
client = SpeechClient(
client_options=client_options.ClientOptions(
api_endpoint="us-east1-speech.googleapis.com"
)
)
# Reads a file as bytes
with open(audio_file, "rb") as f:
content = f.read()
config = cloud_speech.RecognitionConfig(
auto_decoding_config=cloud_speech.AutoDetectDecodingConfig(),
language_codes=["en-US"],
model="projects/custom-models-walkthrough/locations/us-east1/endpoints/quantum-computing-lectures-custom-model-prod-endpoint",
)
request = cloud_speech.RecognizeRequest(
recognizer=f"projects/custom-models-walkthrough/locations/us-east1/recognizers/_",
config=config,
content=content,
)
# Transcribes the audio into text
response = client.recognize(request=request)
for result in response.results:
print(f"Transcript: {result.alternatives[0].transcript}")
return response
המאמרים הבאים
אפשר להיעזר במקורות המידע כדי להשתמש במודלים מותאמים אישית של דיבור באפליקציה. איך מעריכים מודלים מותאמים אישית