Podcasts generieren (API-Methode)

Gemini Enterprise bietet eine API, mit der Sie Podcasts basierend auf Quelldokumenten generieren können. Die Ausgabe ähnelt sehr den Podcasts, die Endnutzer in ihren Notebooks generieren können.

Die Podcast-Generierung über die API eignet sich gut für Batchjobs, bei denen Sie möglicherweise Dutzende oder Hunderte von Büchern, Artikeln oder Kursen haben und für jeden einen Podcast generieren möchten.

Die Podcast API ist eine eigenständige API. Sie benötigen also kein NotebookLM Enterprise-Notebook, keine Gemini Enterprise-Lizenz und keinen Datenspeicher. Sie benötigen lediglich ein aktiviertes Google Cloud Projekt und die Rolle „Podcast API User“.

Eingaben

Die Eingabe für die API ist ein Array von context-Elementen. Dies ist das Quellmaterial, aus dem der Podcast generiert wird. Die Eingabe kann die Form von Text, Bildern, Audio und Video haben. Der gesamte Inhalt des Kontextarrays muss weniger als 100.000 Tokens umfassen.

Eine Liste der unterstützten Typen finden Sie unter Gemini 2.5 Flash in den technischen Spezifikationen für Bilder, Dokumente, Videos und Audio.

Ausgabe

Die Ausgabe der API ist der Podcast im MP3-Format.

Voraussetzungen

Bevor Sie einen Podcast mit der API erstellen können, benötigen Sie Folgendes:

Ein Google Cloud -Projekt mit aktivierter Discovery Engine API. Weitere Informationen finden Sie unter Projekt erstellen und API aktivieren.
Die IAM-Rolle (Identity and Access Management) „Podcast API User“ (roles/discoveryengine.podcastApiUser). Allgemeine Informationen zum Zuweisen von Rollen finden Sie unter NotebookLM Enterprise einrichten.

Podcast aus Kontexteingabe generieren

Verwenden Sie den folgenden Befehl, um einen Podcast zu generieren, indem Sie die Methode podcast aufrufen.

Die Eingabe ist ein Array von Multimedia-Objekten wie Text, Bildern sowie Audio- und Videoclips.

REST

So generieren und exportieren Sie einen Podcast:

Führen Sie den folgenden curl-Befehl aus:

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/podcasts" \
  -d '{
      "podcastConfig": {
        "focus": "FOCUS",
        "length": "LENGTH",
        "languageCode": "LANGUAGE_CODE"
      },
      "contexts": [
        {
          "MEDIA_TYPE_1": "MEDIA_CONTENT_1"
        },
        {
          "MEDIA_TYPE_2": "MEDIA_CONTENT_2"
        }
      ],
      "title": "PODCAST_TITLE",
      "description": "PODCAST_DESCRIPTION"
  }'

Ersetzen Sie Folgendes:

PROJECT_ID: die Projekt-ID
FOCUS: ein Prompt, in dem Sie den Schwerpunkt des Podcasts vorschlagen
LENGTH: Es gibt zwei Möglichkeiten:
- SHORT (in der Regel 4 bis 5 Minuten)
- STANDARD (in der Regel etwa 10 Minuten, kann bei kleineren Datasets aber auch kürzer sein)
LANGUAGE_CODE: optional. Geben Sie den Sprachcode für den Podcast an. Verwenden Sie Sprach-Tags, wie von BCP47 definiert. Wenn der Sprachcode nicht angegeben ist, wird der Podcast auf Englisch generiert.
MEDIA_TYPE_N: Geben Sie den Medientyp an, auf den Sie sich beziehen, um den Podcast zu generieren. Die folgenden Typen sind zulässig:
- text: Nur-Text.
- blob: Verwenden Sie diesen Typ für alle Medientypen außer Nur-Text und laden Sie die Daten als Rohbyte hoch.
MEDIA_CONTENT_N: der Inhalt selbst als Nur-Text oder Rohbyte. Der gesamte Inhalt des Kontextarrays muss weniger als 100.000 Tokens umfassen.
PODCAST_TITLE: ein Titel für den Podcast. Er kann für den internen Gebrauch bestimmt sein oder Sie können ihn Ihren Endnutzern anzeigen lassen.
PODCAST_DESCRIPTION: eine Beschreibung des Podcasts. Sie kann für den internen Gebrauch bestimmt sein oder Sie können sie Ihren Endnutzern anzeigen lassen.

Beispielbefehl und -ergebnis

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/podcasts" \
-d '{
    "podcastConfig": {
      "focus": "Can you talk about how to find a job in Google?",
      "length": "SHORT"
    },
    "contexts": [
      {
        "text": "Breaking into Google is a highly competitive endeavor, attracting millions of applicants globally due to its reputation as a top employer, its innovative work, and comprehensive perks. Success hinges on a multi-faceted approach, starting with meticulously tailored online applications that incorporate job description keywords for ATS and showcasing Googlyness—a blend of curiosity, collaborative spirit, and leadership potential. The rigorous, multi-stage interview process involves recruiter screens, behavioral interviews (often using the STAR method), and for technical roles, demanding coding challenges and system design questions that assess not just correct answers but also problem-solving thought processes and communication skills. Networking for referrals and informational interviews can significantly boost visibility, but ultimately, thorough preparation through mock interviews and platforms like LeetCode, combined with patience and resilience through the often lengthy process, are paramount for navigating this challenging but rewarding path."
      },
      {
        "text": "Finding your way into a career at Google begins with their comprehensive careers website, a digital gateway brimming with opportunities. To embark on this journey, you first navigate the job board, using keywords like software engineer or product manager to pinpoint potential roles. To refine your search, utilize the array of filters available for location, experience level, degree, skills, and even specific Google organizations. You can even browse by team if you have a particular department in mind, like Engineering and Technology or Marketing and Communications. Once you discover a promising position, delve into its detailed description, paying close attention to the minimum qualifications – these are the foundational criteria against which your application will be assessed. Remember, Google seeks out leaders who can perform at the highest level, and while experience is valued, internships or graduate programs can be a great entry point for those earlier in their career. When you are ready to apply, you will need to create a Careers Profile, using your Google Account for seamless sign-in and communication. Crucially, tailor your resume for each specific role, highlighting relevant experiences and quantifying your achievements with concrete data. While a one-page resume is generally preferred, a two-page resume is acceptable for those with more extensive experience. Notably, cover letters are not typically required unless explicitly stated in the job description. Google encourages quality over quantity, so strategically apply for up to three jobs every 30 days, choosing roles that truly align with your skills and passions. Once you have submitted your applications, your Careers Profile becomes your tracking center, where you can monitor the status of each submission, from Draft to Submitted. If you do not hear back within eight weeks, the search continues, though Google recruiters may proactively reach out for other opportunities later. Remember, perseverance and a solid understanding of Google values, combined with a continuously refined skill set and a well-prepared resume, will greatly enhance your chances of securing a position at this innovative company."
      }
    ],
    "title": "Find a job at Google ",
    "description": "This podcast is based on two plain text documents that describe various aspects of getting a job at Google."
}'

{
"name": "projects/123456/locations/global/operations/create-podcast-54321"
}

Das Erstellen eines Podcasts dauert einige Minuten.

Notieren Sie sich den Namen des Vorgangs. Sie benötigen ihn in Schritt 4, um den Podcast herunterzuladen. Im obigen Beispiel lautet der Vorgangsname projects/123456/locations/global/operations/create-podcast-54321.
Optional. Fragen Sie den Status des Vorgangs zur Podcast-Erstellung ab. Weitere Informationen finden Sie unter Details zu einem Vorgang mit langer Ausführungszeit abrufen.

Führen Sie nach Abschluss des Vorgangs den folgenden curl-Befehl aus, um den Podcast herunterzuladen:

curl -v \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  "https://discoveryengine.googleapis.com/v1/OPERATION_NAME:download?alt=media" \
  --output FILENAME.mp3 -L

Ersetzen Sie Folgendes:

OPERATION_NAME: der Name des Vorgangs, den Sie sich in Schritt 2 notiert haben
FILENAME: ein Dateiname für den Podcast

Mit diesem Befehl wird der Podcast als MP3-Datei in Ihr lokales Verzeichnis heruntergeladen.

Beispielbefehl und -ergebnis

curl -v \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  "https://discoveryengine.googleapis.com/v1/projects/123456/locations/global/operations/create-podcast-54321:download?alt=media" \
  --output my-podcast.mp3 -L
  
% Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                               Dload  Upload   Total   Spent    Left  Speed
0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0* Host discoveryengine.googleapis.com:443 was resolved.
  ...
{ [42044 bytes data]
100 14.3M  100 14.3M    0     0  10.9M      0  0:00:01  0:00:01 --:--:-- 29.7M
* Connection #0 to host discoveryengine.googleapis.com left intact

Compliance

Die Podcast API entspricht nicht den kundenverwalteten Verschlüsselungsschlüsseln (Customer-Managed Encryption Keys, CMEK). Siehe Vom Kunden verwaltete Verschlüsselungsschlüssel.

Podcasts generieren (API-Methode) Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Eingaben

Ausgabe

Voraussetzungen

Podcast aus Kontexteingabe generieren

REST

Beispielbefehl und -ergebnis

Beispielbefehl und -ergebnis

Compliance

Podcasts generieren (API-Methode)