Esta página foi traduzida pela API Cloud Translation.

Gerar podcasts (método da API)

O Gemini Enterprise oferece uma API que permite gerar podcasts com base em documentos de origem. A saída é muito semelhante aos podcasts que os usuários finais podem gerar nos notebooks.

A geração de podcasts pela API é adequada para jobs em lote em que você tem dezenas ou centenas de livros, artigos ou cursos e quer gerar um podcast para cada um deles.

A API Podcast é independente. Ou seja, não é necessário ter um notebook do NotebookLM Enterprise, uma licença do Gemini Enterprise ou um repositório de dados. Você só precisa de um projeto Google Cloud ativado e da função de usuário da API Podcast.

Entradas

A entrada da API é uma matriz de elementos context. Esse é o material de origem usado para gerar o podcast. A entrada pode ser na forma de texto, imagens, áudio e vídeo. O conteúdo total da matriz de contexto precisa ser menor que 100.000 tokens.

Para conferir uma lista de tipos aceitos, consulte as especificações técnicas de imagens, documentos, vídeos e áudios nesta página sobre o Gemini 2.5 Flash.

Saída

A saída da API é o podcast no formato MP3.

Antes de começar

Antes de gerar um podcast usando a API, você precisa ter o seguinte:

Um projeto do Google Cloud com a API Discovery Engine ativada. Consulte Criar um projeto e ativar a API.
O papel de Identity and Access Management (IAM) do usuário da API Podcast (roles/discoveryengine.podcastApiUser). Para informações gerais sobre como conceder papéis, consulte Configurar o NotebookLM Enterprise.

Gerar um podcast com base em entradas de contexto

Use o comando a seguir para gerar um podcast chamando o método podcast.

A entrada é uma matriz de objetos multimídia, como texto, imagens e clipes de áudio e vídeo.

REST

Para gerar e exportar um podcast, faça o seguinte:

Execute o seguinte comando curl:

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/podcasts" \
  -d '{
      "podcastConfig": {
        "focus": "FOCUS",
        "length": "LENGTH",
        "languageCode": "LANGUAGE_CODE"
      },
      "contexts": [
        {
          "MEDIA_TYPE_1": "MEDIA_CONTENT_1"
        },
        {
          "MEDIA_TYPE_2": "MEDIA_CONTENT_2"
        }
      ],
      "title": "PODCAST_TITLE",
      "description": "PODCAST_DESCRIPTION"
  }'

Substitua:

PROJECT_ID: ID do projeto.
FOCUS: uma solicitação em que você sugere o foco do podcast.
LENGTH: há duas opções:
- SHORT (normalmente de 4 a 5 minutos)
- STANDARD (normalmente cerca de 10 minutos, mas pode ser mais curto com conjuntos de dados menores)
LANGUAGE_CODE: opcional. Especifique o código de idioma do podcast. Use tags de idioma definidas pelo BCP47 (em inglês). Se o código de idioma não for fornecido, o podcast será gerado em inglês.
MEDIA_TYPE_N: especifique o tipo de mídia que você está referenciando para gerar o podcast. Os tipos permitidos são:
- text. Texto simples.
- blob. Para todos os tipos de mídia, exceto texto simples, use esse tipo e faça upload dos dados como bytes brutos.
MEDIA_CONTENT_N: o conteúdo em texto simples ou bytes brutos. O conteúdo total da matriz de contexto precisa ser menor que 100 mil tokens.
PODCAST_TITLE: um título para o podcast. Isso pode ser para uso interno ou você pode escolher exibir para seus usuários finais.
PODCAST_DESCRIPTION: uma descrição do podcast. Isso pode ser para uso interno ou você pode escolher exibir para seus usuários finais.

Exemplo de comando e resultado

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/podcasts" \
-d '{
    "podcastConfig": {
      "focus": "Can you talk about how to find a job in Google?",
      "length": "SHORT"
    },
    "contexts": [
      {
        "text": "Breaking into Google is a highly competitive endeavor, attracting millions of applicants globally due to its reputation as a top employer, its innovative work, and comprehensive perks. Success hinges on a multi-faceted approach, starting with meticulously tailored online applications that incorporate job description keywords for ATS and showcasing Googlyness—a blend of curiosity, collaborative spirit, and leadership potential. The rigorous, multi-stage interview process involves recruiter screens, behavioral interviews (often using the STAR method), and for technical roles, demanding coding challenges and system design questions that assess not just correct answers but also problem-solving thought processes and communication skills. Networking for referrals and informational interviews can significantly boost visibility, but ultimately, thorough preparation through mock interviews and platforms like LeetCode, combined with patience and resilience through the often lengthy process, are paramount for navigating this challenging but rewarding path."
      },
      {
        "text": "Finding your way into a career at Google begins with their comprehensive careers website, a digital gateway brimming with opportunities. To embark on this journey, you first navigate the job board, using keywords like software engineer or product manager to pinpoint potential roles. To refine your search, utilize the array of filters available for location, experience level, degree, skills, and even specific Google organizations. You can even browse by team if you have a particular department in mind, like Engineering and Technology or Marketing and Communications. Once you discover a promising position, delve into its detailed description, paying close attention to the minimum qualifications – these are the foundational criteria against which your application will be assessed. Remember, Google seeks out leaders who can perform at the highest level, and while experience is valued, internships or graduate programs can be a great entry point for those earlier in their career. When you are ready to apply, you will need to create a Careers Profile, using your Google Account for seamless sign-in and communication. Crucially, tailor your resume for each specific role, highlighting relevant experiences and quantifying your achievements with concrete data. While a one-page resume is generally preferred, a two-page resume is acceptable for those with more extensive experience. Notably, cover letters are not typically required unless explicitly stated in the job description. Google encourages quality over quantity, so strategically apply for up to three jobs every 30 days, choosing roles that truly align with your skills and passions. Once you have submitted your applications, your Careers Profile becomes your tracking center, where you can monitor the status of each submission, from Draft to Submitted. If you do not hear back within eight weeks, the search continues, though Google recruiters may proactively reach out for other opportunities later. Remember, perseverance and a solid understanding of Google values, combined with a continuously refined skill set and a well-prepared resume, will greatly enhance your chances of securing a position at this innovative company."
      }
    ],
    "title": "Find a job at Google ",
    "description": "This podcast is based on two plain text documents that describe various aspects of getting a job at Google."
}'

{
"name": "projects/123456/locations/global/operations/create-podcast-54321"
}

A geração de um podcast leva alguns minutos.

Anote o nome da operação. Você vai precisar dele para baixar o podcast na etapa 4. No exemplo acima, o nome da operação é projects/123456/locations/global/operations/create-podcast-54321.
Opcional. Pesquise o status da operação de criação de podcast. Consulte Acessar os detalhes sobre uma operação de longa duração.

Depois que a operação terminar, execute o seguinte comando curl para baixar o podcast:

curl -v \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  "https://discoveryengine.googleapis.com/v1/OPERATION_NAME:download?alt=media" \
  --output FILENAME.mp3 -L

Substitua:

OPERATION_NAME: o nome da operação que você anotou na etapa 2.
FILENAME: um nome de arquivo para o podcast.

Esse comando baixa o podcast para um arquivo MP3 no seu diretório local.

Exemplo de comando e resultado

curl -v \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  "https://discoveryengine.googleapis.com/v1/projects/123456/locations/global/operations/create-podcast-54321:download?alt=media" \
  --output my-podcast.mp3 -L
  
% Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                               Dload  Upload   Total   Spent    Left  Speed
0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0* Host discoveryengine.googleapis.com:443 was resolved.
  ...
{ [42044 bytes data]
100 14.3M  100 14.3M    0     0  10.9M      0  0:00:01  0:00:01 --:--:-- 29.7M
* Connection #0 to host discoveryengine.googleapis.com left intact

Compliance

A API Podcast não está em conformidade com as chaves de criptografia gerenciadas pelo cliente, CMEK para Gemini Enterprise.

Gerar podcasts (método da API) Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Entradas

Saída

Antes de começar

Gerar um podcast com base em entradas de contexto

REST

Exemplo de comando e resultado

Exemplo de comando e resultado

Compliance

Gerar podcasts (método da API)