このページでは、Gemini Enterprise Agent Platform 上の Gemini Live API のリファレンス実装のコレクションを提供します。依存関係のない JavaScript スターターから包括的な React ベースのアーキテクチャまで、これらのデモでは、Gemini Live API と ADK を使用して堅牢なリアルタイム音声エージェントを構築する方法を示します。
デモアプリ
- React デモアプリ アプリ: リアルタイム ストリーミング、ツール使用、および メディア処理を備えた包括的な React クライアント。
- プレーン JS デモ アプリ: コア API の仕組みを理解するための依存関係のない JavaScript 実装。
- リアルタイム アドバイザー: サイレント モードと発言モードを切り替えることができる特別なアドバイザー ペルソナ。
- カスタマー サポート エージェント: 感情検出、マルチモーダル入力、ツール 実行を備えた高度なエージェント。
- ゲーム アシスタント: ペルソナの切り替えと画面共有機能を備えたゲーム コンパニオン。
- Gemini Live Telephony App: Twilio をテレフォニーに使用し、FastAPI バックエンドと Gemini Live API を会話型 AI に使用する、リアルタイムの音声から AI へのアプリケーション。
ADK 双方向ストリーミング開発ガイド
Agent Development Kit(ADK)は、 Live API を使用して双方向ストリーミングアプリケーションを構築するための プロダクション レディのフレームワークを提供します。次のガイドとデモでは、ADK のストリーミング アーキテクチャを紹介します。これにより、マルチモーダル チャネル(テキスト、音声、動画)を介してユーザーと AI エージェント間のリアルタイムの双方向通信が可能になります。
その他のツール
- PCM 音声 デバッガ: 生の PCM 音声ストリームと WebSocket 接続をテストしてデバッグするためのスタンドアロン ツール。