En esta página, se proporciona una colección de implementaciones de referencia para la API de Gemini Live en Gemini Enterprise Agent Platform. Desde iniciadores de JavaScript sin dependencias hasta arquitecturas integrales basadas en React, estas demostraciones muestran cómo crear agentes de voz sólidos y en tiempo real con la API de Gemini Live y el ADK.
Apps de demostración
- App de demostración de React : Un cliente integral de React que incluye transmisión en tiempo real, uso de herramientas y manejo de contenido multimedia.
- App de demostración de JS sin formato: Una implementación de JavaScript sin dependencias para comprender la mecánica principal de la API.
- Asesor en: Una persona asesora especializada que puede cambiar entre los modos silencioso y expresivo modos.
- Agente de asistencia al cliente: Un agente avanzado con detección de emociones, entrada multimodal y ejecución de herramientas.
- Asistente de juegos: Un compañero de juegos con cambio de persona y capacidades para compartir pantalla.
- App de telefonía de Gemini Live: Una aplicación de voz a IA en tiempo real que usa Twilio para la telefonía, un backend de FastAPI y la API de Gemini Live para la IA conversacional.
Guía de desarrollo de transmisión bidireccional del ADK
El Kit de desarrollo de agentes (ADK) proporciona un framework listo para producción para crear aplicaciones de transmisión bidireccional con la API de Live. En la siguiente guía y demostraciones, se presenta la arquitectura de transmisión del ADK, que permite la comunicación bidireccional en tiempo real entre los usuarios y los agentes de IA a través de canales multimodales (texto, audio y video).
- Serie de guías de desarrollo de transmisión bidireccional del ADK
- Demostración de transmisión bidireccional
Otras herramientas
- Depurador de audio PCM: Una herramienta independiente para probar y depurar transmisiones de audio PCM sin procesar y conexiones WebSocket.