Esta página oferece uma coleção de implementações de referência para a API Gemini Live na Gemini Enterprise Agent Platform. Desde iniciadores JavaScript sem dependências até arquiteturas abrangentes baseadas em React, essas demonstrações mostram como criar agentes de voz robustos e em tempo real usando a API Gemini Live e o ADK.
Apps de demonstração
- App de demonstração do React: um cliente abrangente do React com streaming em tempo real, uso de ferramentas e processamento de mídia.
- App de demonstração em JS simples: uma implementação JavaScript sem dependências para entender a mecânica principal da API.
- Consultor em tempo real: uma persona de consultor especializada que pode alternar entre os modos silencioso e falante.
- Agente de suporte ao cliente: um agente avançado com detecção de emoções, entrada multimodal e execução de ferramentas.
- Assistente de jogos: um companheiro de jogos com recursos de troca de persona e compartilhamento de tela.
- App de telefonia do Gemini Live: um aplicativo de voz para IA em tempo real que usa o Twilio para telefonia, um back-end do FastAPI e a API Gemini Live para IA conversacional.
Guia de desenvolvimento de streaming bidirecional do ADK
O Kit de Desenvolvimento de Agente (ADK) oferece um framework pronto para produção para criar aplicativos de streaming bidirecional com a API Live. O guia e as demonstrações a seguir apresentam a arquitetura de streaming do ADK, que permite a comunicação bidirecional em tempo real entre usuários e agentes de IA por canais multimodais (texto, áudio, vídeo).
- Série de guias de desenvolvimento de streaming bidirecional do ADK
- Demonstração de streaming bidirecional
Outras ferramentas
- Depurador de áudio PCM: uma ferramenta independente para testar e depurar streams de áudio PCM brutos e conexões WebSocket.