Esta página fornece uma coleção de implementações de referência para a API Gemini Live no Vertex AI. Desde inícios de JavaScript sem dependências a arquiteturas abrangentes baseadas em React, estas demonstrações mostram como criar agentes de voz robustos em tempo real usando a API Gemini Live e o ADK.
Apps de demonstração
- App de demonstração do React: um cliente do React abrangente com streaming em tempo real, utilização de ferramentas e processamento de multimédia.
- App de demonstração de JS simples: Uma implementação de JavaScript sem dependências para compreender os mecanismos da API principal.
- Conselheiro em tempo real: uma personalidade de conselheiro especializada que pode alternar entre os modos silencioso e explícito.
- Agente do apoio ao cliente: um agente avançado com deteção de emoções, entrada multimodal e execução de ferramentas.
- Assistente de jogos: Um companheiro de jogos com capacidades de mudança de personalidade e partilha de ecrã.
- App Gemini Live Telephony: Uma aplicação de voz para IA em tempo real que usa o Twilio para telefonia, um back-end FastAPI e a API Gemini Live para IA conversacional.
Guia de desenvolvimento de streaming bidirecional do ADK
O Agent Development Kit (ADK) fornece uma framework pronta para produção para criar aplicações de streaming bidirecional com a API Live. O seguinte guia e demonstrações apresentam a arquitetura de streaming do ADK, que permite a comunicação bidirecional em tempo real entre os utilizadores e os agentes de IA através de canais multimodais (texto, áudio e vídeo).
- Série de guias de desenvolvimento de streaming bidirecional do ADK
- Demonstração de streaming bidirecional
Outras ferramentas
- Depurador de áudio PCM: uma ferramenta autónoma para testar e depurar streams de áudio PCM não processado e ligações WebSocket.