En este tutorial se muestra cómo configurar y ejecutar una aplicación de demostración basada en React para la API Live. La aplicación incluye streaming de audio y vídeo en tiempo real y usa un proxy WebSocket de Python para gestionar la autenticación segura conGoogle Cloud.
En el siguiente diagrama se muestra la estructura del proyecto:
Antes de empezar
Asegúrate de que tienes instalado lo siguiente:
- Python 3.9 o versiones posteriores
pipgit
Configurar el entorno
Para configurar tu entorno local, sigue estos pasos:
Clona el repositorio.
git clone https://github.com/GoogleCloudPlatform/generative-ai.git cd generative-ai/gemini/multimodal-live-api/native-audio-websocket-demo-apps/react-demo-appCrea y activa un entorno virtual de Python.
# Create the virtual environment python -m venv .venv # Activate the virtual environment in each new terminal # For macOS or Linux: source .venv/bin/activate # For Windows CMD: .venv\Scripts\activate.bat # For Windows PowerShell: .venv\Scripts\Activate.ps1Instala las dependencias de Python necesarias.
pip install -r requirements.txtAutentícate con Google Cloud.
gcloud auth application-default login
Ejecutar la aplicación
Una vez que hayas configurado el entorno, ejecuta la aplicación:
Inicia el servidor proxy de Python.
python server.pyEn un terminal nuevo, instala los módulos de Node e inicia el servidor de desarrollo de React.
# Install Node modules npm install # Start development server npm run devAbre
http://localhost:5173en tu navegador para ver la aplicación.
Siguientes pasos
- Empezar a usar la API Live con el SDK de IA generativa de Google
- Empezar a usar la API Live con WebSockets