Membuat podcast (metode API)

Gemini Enterprise menawarkan API yang memungkinkan Anda membuat podcast berdasarkan dokumen sumber. Outputnya sangat mirip dengan podcast yang dapat dibuat pengguna akhir dari dalam notebook mereka.

Pembuatan podcast melalui API sangat cocok untuk tugas batch yang mungkin memiliki puluhan atau ratusan buku, artikel, atau kursus, dan Anda ingin membuat podcast untuk setiap item tersebut.

Podcast API adalah API mandiri. Artinya, Anda tidak memerlukan notebook NotebookLM Enterprise, lisensi Gemini Enterprise, atau penyimpanan data. Yang Anda butuhkan hanyalah project Google Cloud yang diaktifkan dan peran Pengguna Podcast API.

Input

Input untuk API adalah array elemen context. Ini adalah materi sumber yang digunakan untuk membuat podcast. Input dapat berupa teks, gambar, audio, dan video. Total konten array konteks harus kurang dari 100.000 token.

Untuk mengetahui daftar jenis yang didukung, lihat spesifikasi teknis untuk gambar, dokumen, video, dan audio di halaman ini tentang Gemini 2.5 Flash.

Output

Output dari API adalah podcast, dalam format MP3.

Sebelum memulai

Sebelum dapat membuat podcast menggunakan API, Anda harus memiliki hal berikut:

Membuat podcast dari input konteks

Gunakan perintah berikut untuk membuat podcast dengan memanggil metode podcast.

Input berupa array objek multimedia seperti teks, gambar, dan klip audio dan video.

REST

Untuk membuat dan mengekspor podcast, lakukan hal berikut:

  1. Jalankan perintah curl berikut:

    curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/podcasts" \
      -d '{
          "podcastConfig": {
            "focus": "FOCUS",
            "length": "LENGTH",
            "languageCode": "LANGUAGE_CODE"
          },
          "contexts": [
            {
              "MEDIA_TYPE_1": "MEDIA_CONTENT_1"
            },
            {
              "MEDIA_TYPE_2": "MEDIA_CONTENT_2"
            }
          ],
          "title": "PODCAST_TITLE",
          "description": "PODCAST_DESCRIPTION"
      }'
    

    Ganti kode berikut:

    • PROJECT_ID: ID project Anda.
    • FOCUS: perintah tempat Anda menyarankan fokus podcast.
    • LENGTH: ada dua opsi:
      • SHORT (biasanya 4-5 menit)
      • STANDARD (biasanya sekitar 10 menit, tetapi bisa lebih singkat dengan set data yang lebih kecil)
    • LANGUAGE_CODE: optional. Tentukan kode bahasa untuk podcast. Gunakan tag bahasa yang ditentukan oleh BCP47. Jika kode bahasa tidak diberikan, podcast akan dibuat dalam bahasa Inggris.
    • MEDIA_TYPE_N: menentukan jenis media yang Anda rujuk untuk membuat podcast. Jenis yang diizinkan adalah berikut:
      • text. Teks biasa.
      • blob. Untuk semua jenis media kecuali teks biasa, gunakan jenis ini dan upload data sebagai byte mentah.
    • MEDIA_CONTENT_N: konten itu sendiri dalam teks biasa atau byte mentah. Total konten array konteks harus kurang dari 100 ribu token.
    • PODCAST_TITLE: judul untuk podcast. Deskripsi ini dapat digunakan untuk penggunaan internal, atau Anda dapat memilih untuk menampilkannya kepada pengguna akhir.
    • PODCAST_DESCRIPTION: deskripsi podcast. Deskripsi ini dapat digunakan untuk penggunaan internal, atau Anda dapat memilih untuk menampilkannya kepada pengguna akhir.

    Proses pembuatan podcast memerlukan waktu beberapa menit.

  2. Catat nama operasi; Anda memerlukannya untuk mendownload podcast pada langkah 4. Pada contoh di atas, nama operasi adalah projects/123456/locations/global/operations/create-podcast-54321.

  3. Opsional. Lakukan polling status operasi pembuatan podcast. Lihat Mendapatkan detail tentang operasi yang berjalan lama.

  4. Setelah operasi selesai, jalankan perintah curl berikut untuk mendownload podcast:

    curl -v \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      "https://discoveryengine.googleapis.com/v1/OPERATION_NAME:download?alt=media" \
      --output FILENAME.mp3 -L
    

    Ganti kode berikut:

    • OPERATION_NAME: nama operasi yang Anda catat di langkah 2.
    • FILENAME: nama file untuk podcast.

    Perintah ini akan mendownload podcast ke file MP3 di direktori lokal Anda.

Kepatuhan

Podcast API tidak mematuhi kunci enkripsi yang dikelola pelanggan, CMEK untuk Gemini Enterprise.