Gemini Enterprise는 소스 문서를 기반으로 팟캐스트를 생성할 수 있는 API를 제공합니다. 출력은 최종 사용자가 노트북 내에서 생성할 수 있는 팟캐스트와 매우 유사합니다.
API를 통한 팟캐스트 생성은 수십 또는 수백 개의 책, 기사 또는 강의가 있고 각각에 대해 팟캐스트를 생성하려는 일괄 작업에 적합합니다.
팟캐스트 API는 독립형 API입니다. 즉, NotebookLM Enterprise 노트북, Gemini Enterprise 라이선스 또는 데이터 스토어가 필요하지 않습니다. 사용 설정된 Google Cloud 프로젝트와 팟캐스트 API 사용자 역할만 있으면 됩니다.
입력
API의 입력은 context 요소의 배열입니다. 팟캐스트가 생성되는 소스 자료입니다. 입력은 텍스트, 이미지, 오디오, 동영상 형식일 수 있습니다. 컨텍스트 배열의 총 콘텐츠는 100,000개 미만의 토큰이어야 합니다.
지원되는 유형 목록은 Gemini 2.5 Flash에 관한 이 페이지의 이미지, 문서, 동영상, 오디오 기술 사양을 참고하세요.
출력
API의 출력은 MP3 형식의 팟캐스트입니다.
시작하기 전에
API를 사용하여 팟캐스트를 생성하려면 다음이 필요합니다.
Discovery Engine API가 사용 설정된 Google Cloud 프로젝트 프로젝트를 만들고 API를 사용 설정을 참고하세요.
Podcast API 사용자 (
roles/discoveryengine.podcastApiUser)의 Identity and Access Management(IAM) 역할입니다. 역할 부여에 관한 일반적인 정보는 NotebookLM Enterprise 설정을 참고하세요.
컨텍스트 입력에서 팟캐스트 생성
다음 명령어를 사용하여 podcast 메서드를 호출하여 팟캐스트를 생성합니다.
입력은 텍스트, 이미지, 오디오 및 동영상 클립과 같은 멀티미디어 객체의 배열입니다.
REST
팟캐스트를 생성하고 내보내려면 다음 단계를 따르세요.
다음 curl 명령어를 실행합니다.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/podcasts" \ -d '{ "podcastConfig": { "focus": "FOCUS", "length": "LENGTH", "languageCode": "LANGUAGE_CODE" }, "contexts": [ { "text": "TEXT_CONTENT" }, { "inlineData": { "mimeType": "MIME_TYPE", "data": "BASE64_ENCODED_DATA" } } ], "title": "PODCAST_TITLE", "description": "PODCAST_DESCRIPTION" }'다음을 바꿉니다.
PROJECT_ID: 프로젝트의 ID입니다.FOCUS: 팟캐스트의 초점을 제안하는 프롬프트입니다.LENGTH: 두 가지 옵션이 있습니다.SHORT(일반적으로 4~5분)STANDARD(일반적으로 약 10분이지만 데이터 세트가 작으면 더 짧을 수 있음)
LANGUAGE_CODE: 선택사항입니다. 팟캐스트의 언어 코드를 지정합니다. BCP47에 정의된 언어 태그를 사용합니다. 언어 코드가 제공되지 않으면 팟캐스트가 영어로 생성됩니다.TEXT_CONTENT: 포함할 텍스트 콘텐츠입니다.inlineData: 텍스트가 아닌 미디어 객체입니다.MIME_TYPE: blob 데이터의 MIME 유형입니다 (예: 'image/png').BASE64_ENCODED_DATA: 미디어 데이터의 base64로 인코딩된 원시 바이트입니다.PODCAST_TITLE: 팟캐스트 제목입니다. 이는 내부용일 수도 있고 최종 사용자에게 표시할 수도 있습니다.PODCAST_DESCRIPTION: 팟캐스트에 대한 설명입니다. 내부용으로 사용할 수도 있고 최종 사용자에게 표시할 수도 있습니다.
팟캐스트를 생성하는 데 몇 분 정도 걸립니다.
작업 이름을 기록해 둡니다. 4단계에서 팟캐스트를 다운로드하는 데 필요합니다. 위의 예에서 작업 이름은
projects/123456/locations/global/operations/create-podcast-54321입니다.선택사항입니다. 팟캐스트 생성 작업의 상태를 폴링합니다. 장기 실행 작업에 대한 세부정보 가져오기를 참고하세요.
작업이 완료되면 다음 curl 명령어를 실행하여 팟캐스트를 다운로드합니다.
curl -v \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://discoveryengine.googleapis.com/v1/OPERATION_NAME:download?alt=media" \ --output FILENAME.mp3 -L
다음을 바꿉니다.
OPERATION_NAME: 2단계에서 적어둔 작업의 이름입니다.FILENAME: 팟캐스트의 파일 이름입니다.
이 명령어는 팟캐스트를 로컬 디렉터리의 MP3 파일로 다운로드합니다.
규정 준수
포드캐스트 API는 고객 관리 암호화 키인 Gemini Enterprise용 CMEK를 준수하지 않습니다.