Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Uso de computador

Visualizar

Este recurso está sujeito aos "Termos das Soluções Pré-GA" na seção Termos Gerais de Serviço dos Termos Específicos de Serviço. Esse recurso oferece um ambiente de sandbox para agentes de IA. Portanto, os Termos Específicos de Serviço "Serviços de IA agênticos" se aplicam. Para usar esse recurso, você precisa ativar o acesso total à rede para o Agent de IA. Considere as salvaguardas aplicáveis (incluindo a supervisão humana) e as políticas da sua organização antes de fazer isso. Para salvaguardas de uso do computador integradas, considere a Agent Platform Ferramenta de Uso do Computador.

Os recursos pré-GA estão disponíveis "no estado em que se encontram" e podem ter suporte limitado. Para mais informações, consulte as descrições da fase de lançamento.

Os sandboxes de uso do computador da Agent Platform oferecem um ambiente de navegador seguro e isolado com que os agentes podem interagir. Esses sandboxes permitem que os agentes automatizem tarefas que imitam interações humanas, como clicar, navegar em sites e fazer capturas de tela.

Como funciona

Ao criar um sandbox de uso do computador, a Gemini Enterprise Agent Platform provisiona um ambiente em contêiner que executa um agente de navegador da Web. É possível controlar o navegador de duas maneiras:

Solicitações de API: envie comandos para o sandbox para realizar ações como navegar até um URL, clicar em elementos ou digitar texto.
Controle do navegador: conecte-se ao navegador usando uma conexão padrão do Chrome DevTools Protocol (CDP), permitindo que você use ferramentas de automação do navegador (como o Playwright) para automatizar o navegador.

Considerações

Durante o pré-lançamento, a latência do sandbox de uso do computador do Agent Platform é otimizada para volumes de tráfego baixos. Volumes de tráfego mais altos podem encontrar latência elevada temporariamente.

Controlar o navegador usando a API

É possível enviar solicitações de API para o sandbox para realizar ações comuns do navegador. O sandbox processa a execução dessas ações no ambiente isolado.

As ações compatíveis incluem:

Navegar até um URL.
Clicar em coordenadas específicas.
Digitar texto em campos.
Fazer capturas de tela.

Para ver um exemplo de como enviar comandos, consulte o guia de início rápido sobre o uso do computador.

Controlar o navegador usando uma conexão CDP

Para uma automação mais avançada, é possível se conectar ao navegador do sandbox por uma conexão do Chrome DevTools Protocol (CDP). Esse método permite usar ferramentas de automação de navegador padrão, como o Playwright, para interagir com a página da Web.

Para conectar o Playwright ao sandbox:

Gere o URL do WebSocket e os cabeçalhos necessários para o sandbox usando o método generate_browser_ws_headers do SDK do Python.

service_account_email = "SERVICE_ACCOUNT_EMAIL"
ws_url, ws_headers = client.agent_engines.sandboxes.generate_browser_ws_headers(
    sandbox_environment=sandbox,
    service_account_email=service_account_email,
)

Use o método connect_over_cdp do Playwright para estabelecer uma conexão.

Use o URL e os cabeçalhos do WebSocket gerados para se conectar ao CDP usando o Playwright:

import asyncio
from playwright.async_api import async_playwright
import nest_asyncio
nest_asyncio.apply()

async def connect_over_cdp(ws_url, ws_headers):
    async with async_playwright() as p:
        try:
            browser = await p.chromium.connect_over_cdp(
                endpoint_url=ws_url,
                headers=ws_headers
            )
            print("Successfully connected to browser over CDP.")

            # You can now interact with the browser
            page = browser.contexts[0].pages[0]
            await page.goto("https://www.example.com")
            print(f"Page title: {await page.title()}")

            await browser.close()
            print("Browser connection closed.")
        except Exception as e:
            print(f"An error occurred: {e}")

# Run CDP connection
asyncio.run(connect_over_cdp(ws_url, ws_headers))

Visualização de transmissão ao vivo

Os sandboxes de uso do computador oferecem suporte a uma visualização de transmissão ao vivo (VNC), permitindo que você monitore visualmente as ações do agente em tempo real. É possível depurar e observar o comportamento do agente.

A seguir

Guia de início rápido sobre o uso do computador
Conheça os snapshots para o gerenciamento do ciclo de vida do sandbox.

Uso de computador Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.