Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Uso del computer

Anteprima

Questa funzionalità è soggetta ai "Termini delle Offerte pre-GA" nella sezione dei Termini di servizio generali dei Termini specifici dei servizi. Questa funzionalità fornisce un ambiente sandbox per gli agenti AI, pertanto si applicano i "Termini specifici dei servizi di AI agentica". Per utilizzare questa funzionalità, dovrai abilitare l'accesso completo alla rete per il tuo agente AI, quindi prima di farlo valuta le misure di sicurezza applicabili (inclusa la supervisione umana) e le norme della tua organizzazione. Per le misure di sicurezza integrate per l'utilizzo del computer, prendi in considerazione lo strumento di utilizzo del computer della Agent Platform.

Le funzionalità pre-GA sono disponibili "così come sono" e potrebbero avere un supporto limitato. Per ulteriori informazioni, consulta le descrizioni della fase di lancio.

Le sandbox di utilizzo del computer di Agent Platform forniscono un ambiente browser sicuro e isolato con cui gli agenti possono interagire. Queste sandbox consentono agli agenti di automatizzare le attività che imitano le interazioni umane (ad esempio fare clic, navigare nei siti e acquisire screenshot).

Come funziona

Quando crei una sandbox di utilizzo del computer, Gemini Enterprise Agent Platform esegue il provisioning di un ambiente containerizzato che esegue un agente del browser web. Puoi controllare il browser in due modi:

Richieste API: invia comandi alla sandbox per eseguire azioni come navigare verso un URL, fare clic sugli elementi o digitare testo.
Controllo del browser: connettiti al browser utilizzando una connessione standard Chrome DevTools Protocol (CDP), che ti consente di utilizzare strumenti di automazione del browser (come Playwright) per automatizzare il browser.

Considerazioni

Durante l'anteprima, la latenza della sandbox di utilizzo del computer della piattaforma dell'agente è ottimizzata per volumi di traffico ridotti. Volumi di traffico più elevati potrebbero riscontrare temporaneamente una latenza maggiore.

Controllare il browser utilizzando l'API

Puoi inviare richieste API alla sandbox per eseguire azioni comuni del browser. La sandbox gestisce l'esecuzione di queste azioni all'interno del suo ambiente isolato.

Le azioni supportate includono:

Navigare verso un URL.
Fare clic su coordinate specifiche.
Digitare testo nei campi.
Acquisire screenshot.

Per un esempio di come inviare comandi, consulta la guida rapida all'utilizzo del computer.

Controllare il browser utilizzando una connessione CDP

Per un'automazione più avanzata, puoi connetterti al browser della sandbox tramite una connessione Chrome DevTools Protocol (CDP). Questo metodo ti consente di utilizzare strumenti di automazione del browser standard, come Playwright, per interagire con la pagina web.

Per connettere Playwright alla sandbox:

Genera l'URL WebSocket e le intestazioni richieste per la sandbox utilizzando il metodo generate_browser_ws_headers dell'SDK Python.

  service_account_email = "SERVICE_ACCOUNT_EMAIL"
  ws_url, ws_headers = client.agent_engines.sandboxes.generate_browser_ws_headers(
      sandbox_environment=sandbox,
      service_account_email=service_account_email,
  )

Utilizza il metodo connect_over_cdp di Playwright per stabilire una connessione.

Utilizza l'URL WebSocket e le intestazioni generate per connetterti tramite CDP utilizzando Playwright:

  import asyncio
  from playwright.async_api import async_playwright
  import nest_asyncio
  nest_asyncio.apply()

  async def connect_over_cdp(ws_url, ws_headers):
      async with async_playwright() as p:
          try:
              browser = await p.chromium.connect_over_cdp(
                  endpoint_url=ws_url,
                  headers=ws_headers
              )
              print("Successfully connected to browser over CDP.")

              # You can now interact with the browser
              page = browser.contexts[0].pages[0]
              await page.goto("https://www.example.com")
              print(f"Page title: {await page.title()}")

              await browser.close()
              print("Browser connection closed.")
          except Exception as e:
              print(f"An error occurred: {e}")

  # Run CDP connection
  asyncio.run(connect_over_cdp(ws_url, ws_headers))

Visualizzazione live streaming

Le sandbox di utilizzo del computer supportano una visualizzazione live streaming (VNC), che ti consente di monitorare visivamente le azioni dell'agente in tempo reale. Puoi eseguire il debug e osservare il comportamento dell'agente.

Ad esempio, puoi utilizzare noVNC per connetterti alla sandbox tramite WebSocket.

Passaggi successivi

Guida rapida all'utilizzo del computer
Esplora snapshot per la gestione del ciclo di vita della sandbox.

Uso del computer Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.