生成 Podcast (API 方法)

Gemini Enterprise 提供 API,可根據來源文件生成 Podcast。輸出內容與使用者在筆記本中產生的播客非常相似。

透過 API 生成 Podcast 非常適合批次作業,例如您可能有數十或數百本書籍、文章或課程,並想為每項內容生成 Podcast。

Podcast API 是獨立的 API,也就是說,您不需要 NotebookLM Enterprise 筆記本、Gemini Enterprise 授權或資料存放區。您只需要已啟用的 Google Cloud 專案和 Podcast API 使用者角色。

輸入內容

API 的輸入內容是 context 元素陣列。這是生成 Podcast 的來源素材。輸入內容可以是文字、圖片、音訊和影片。內容陣列的權杖總數必須少於 100,000 個。

如需支援的類型清單,請參閱本頁的「Gemini 2.5 Flash」一節,瞭解圖片、文件、影片和音訊的技術規格。

輸出

API 會輸出 MP3 格式的 Podcast。

事前準備

使用 API 生成 Podcast 前,請務必備妥下列項目:

根據脈絡輸入內容生成 Podcast

使用下列指令呼叫 podcast 方法,產生 Podcast。

輸入內容為多媒體物件陣列,例如文字、圖片,以及音訊和影片片段。

REST

如要生成及匯出 Podcast,請按照下列步驟操作:

  1. 執行下列 curl 指令:

    curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/podcasts" \
      -d '{
          "podcastConfig": {
            "focus": "FOCUS",
            "length": "LENGTH",
            "languageCode": "LANGUAGE_CODE"
          },
          "contexts": [
            {
              "MEDIA_TYPE_1": "MEDIA_CONTENT_1"
            },
            {
              "MEDIA_TYPE_2": "MEDIA_CONTENT_2"
            }
          ],
          "title": "PODCAST_TITLE",
          "description": "PODCAST_DESCRIPTION"
      }'
    

    更改下列內容:

    • PROJECT_ID:專案 ID。
    • FOCUS:提示,建議 Podcast 的主題。
    • LENGTH:有兩個選項:
      • SHORT (通常需要 4 到 5 分鐘)
      • STANDARD (通常約 10 分鐘,但如果資料集較小,時間可能會更短)
    • LANGUAGE_CODE:選用。指定 Podcast 的語言代碼。請使用 BCP47 定義的語言標記。如果未提供語言代碼,系統會以英文生成 Podcast。
    • MEDIA_TYPE_N:指定要用來生成 Podcast 的媒體類型。允許的類型如下:
      • text. 純文字。
      • blob。如為純文字以外的所有媒體類型,請使用這個類型,並以原始位元組上傳資料。
    • MEDIA_CONTENT_N:內容本身,以純文字或原始位元組表示。內容陣列的權杖總數不得超過 10 萬個。
    • PODCAST_TITLE:Podcast 的標題。這項資訊可供內部使用,您也可以選擇向使用者顯示。
    • PODCAST_DESCRIPTION:Podcast 的說明。這項資訊可供內部使用,您也可以選擇向使用者顯示。

    生成 Podcast 需要幾分鐘的時間。

  2. 記下作業名稱,您需要在步驟 4 中使用這個名稱下載 Podcast。在上述範例中,作業名稱為 projects/123456/locations/global/operations/create-podcast-54321

  3. (選用步驟) 輪詢 Podcast 建立作業的狀態。請參閱「取得長時間執行作業的詳細資料」。

  4. 作業完成後,請執行下列 curl 指令來下載 Podcast:

    curl -v \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      "https://discoveryengine.googleapis.com/v1/OPERATION_NAME:download?alt=media" \
      --output FILENAME.mp3 -L
    

    更改下列內容:

    • OPERATION_NAME:您在步驟 2 記下的作業名稱。
    • FILENAME:Podcast 的檔案名稱。

    這個指令會將 Podcast 下載到本機目錄中的 MP3 檔案。

法規遵循

Podcast API 不符合客戶自行管理的加密金鑰 (CMEK) 規定,因此無法搭配 Gemini Enterprise 適用的 CMEK 使用。