Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

שימוש במודלים

אפשר להשתמש במודל מאומן של Custom Speech-to-Text באפליקציית הייצור או בתהליכי העבודה של השוואת הביצועים. ברגע שפורסים את המודל דרך נקודת קצה ייעודית, מקבלים באופן אוטומטי גישה פרוגרמטית דרך אובייקט מזהה, שאפשר להשתמש בו ישירות דרך Cloud Speech-to-Text V2 API או במסוף Google Cloud .

לפני שמתחילים

מוודאים שנרשמתם ל Google Cloud חשבון, יצרתם פרויקט, אימנתם מודל מותאם אישית לזיהוי דיבור ופרסתם אותו באמצעות נקודת קצה.

ביצוע הסקה בגרסה 2

כדי שמודל מותאם אישית של המרת דיבור לטקסט יהיה מוכן לשימוש, הסטטוס של המודל בכרטיסייה Models צריך להיות Active, ונקודת הקצה הייעודית בכרטיסייה Endpoints צריכה להיות Deployed.

בדוגמה שלנו, שבה מזהה הפרויקט Google Cloud הוא custom-models-walkthrough, נקודת הקצה שמתאימה למודל מותאם אישית של Speech-to-Text quantum-computing-lectures-custom-model היא quantum-computing-lectures-custom-model-prod-endpoint. האזור שבו הוא זמין הוא us-east1, ובקשת התמלול של קבוצת הקבצים היא:

from google.api_core import client_options
from google.cloud.speech_v2 import SpeechClient
from google.cloud.speech_v2.types import cloud_speech

def quickstart_v2(
    project_id: str,
    audio_file: str,
) -> cloud_speech.RecognizeResponse:
    """Transcribe an audio file."""
    # Instantiates a client
    client = SpeechClient(
    client_options=client_options.ClientOptions(
      api_endpoint="us-east1-speech.googleapis.com"
    )
  )

    # Reads a file as bytes
    with open(audio_file, "rb") as f:
        content = f.read()

    config = cloud_speech.RecognitionConfig(
        auto_decoding_config=cloud_speech.AutoDetectDecodingConfig(),
        language_codes=["en-US"],
        model="projects/custom-models-walkthrough/locations/us-east1/endpoints/quantum-computing-lectures-custom-model-prod-endpoint",
    )
    request = cloud_speech.RecognizeRequest(
        recognizer=f"projects/custom-models-walkthrough/locations/us-east1/recognizers/_",
        config=config,
        content=content,
    )

    # Transcribes the audio into text
    response = client.recognize(request=request)

    for result in response.results:
        print(f"Transcript: {result.alternatives[0].transcript}")

    return response

המאמרים הבאים

כדאי לעיין במקורות המידע כדי ללמוד איך להשתמש במודלים מותאמים אישית של דיבור באפליקציה. איך מעריכים מודלים מותאמים אישית