Einführung in Agent Platform Workbench

Gemini Enterprise Agent Platform Workbench-Instanzen sind Jupyter Notebook-basierte Entwicklungsumgebungen für den gesamten Data-Science-Workflow. Sie können über das Jupyter-Notebook einer Agent Platform Workbench-Instanz mit der Gemini Enterprise Agent Platform und anderen Google Cloud -Diensten interagieren.

Durch die Integrationen und Funktionen von Agent Platform Workbench können Sie leichter auf Ihre Daten zugreifen, Daten schneller verarbeiten und Notebook-Ausführungen planen.

Agent Platform Workbench-Instanzen sind mit JupyterLab vorverpackt und bieten eine vorinstallierte Suite von Deep-Learning-Paketen, einschließlich der Unterstützung für TensorFlow- und PyTorch-Frameworks. Sie können entweder ausschließlich CPU-basierte oder GPU-fähige Instanzen konfigurieren.

Agent Platform Workbench-Instanzen unterstützen die Synchronisierung mit einem GitHub-Repository.

Agent Platform-Workbench-Instanzen sind durch die Google Cloud Authentifizierung und Autorisierung geschützt.

Datenzugriff

Sie können auf Ihre Daten zugreifen, ohne die JupyterLab-Benutzeroberfläche zu verlassen.

Im JupyterLab-Navigationsmenü auf einer Agent Platform Workbench-Instanz können Sie die Cloud Storage-Einbindung verwenden, um in Daten und anderen Dateien zu suchen, auf die Sie Zugriff haben. Auf Cloud Storage-Buckets und -Dateien über JupyterLab zugreifen

Mit der BigQuery-Integration können Sie auch Tabellen durchsuchen, auf die Sie Zugriff haben, Abfragen schreiben, Ergebnisse in der Vorschau anzeigen und Daten in Ihr Notebook laden. Daten in BigQuery-Tabellen über JupyterLab abfragen

Notebook-Ausführungen ausführen

Führen Sie mit dem Executor eine Notebookdatei als einmalige Ausführung oder nach einem Zeitplan aus. Wählen Sie die Umgebung und Hardware aus, in der die Ausführung ausgeführt werden soll. Der Code Ihres Notebooks wird in dem benutzerdefinierten Agent Platform-Training ausgeführt, was das Ausführen verteilter Trainings, das Optimieren von Hyperparametern oder das Planen kontinuierlicher Trainingsjobs erleichtern kann.

Sie können Parameter in Ihrer Ausführung verwenden, um bestimmte Änderungen an jeder Ausführung vorzunehmen. Sie können beispielsweise ein anderes zu verwendendes Dataset angeben, die Lernrate für Ihr Modell oder die Version des Modells ändern.

Sie können ein Notebook so einstellen, dass es nach einem wiederkehrenden Zeitplan ausgeführt wird. Selbst wenn die Instanz heruntergefahren wurde, führt Gemini Enterprise Agent Platform Workbench Ihre Notebookdatei aus und speichert die Ergebnisse, sodass Sie sie ansehen und mit anderen teilen können. Weitere Informationen finden Sie unter Notebookausführung planen.

Informationen teilen

Ausgeführte Notebookausführungen werden in einem Cloud Storage-Bucket gespeichert, sodass Sie Ihre Informationen mit anderen teilen können, indem Sie Zugriff auf die Ergebnisse gewähren. Informationen dazu finden Sie im vorherigen Abschnitt zum Ausführen der Notebook-Ausführungen.

Instanz sichern

In den folgenden Abschnitten werden unterstützte Funktionen beschrieben, mit denen Sie Ihre Agent Platform Workbench-Instanz schützen können.

VPC

Sie können Ihre Agent Platform Workbench-Instanz über das von Google verwaltete Standardnetzwerk bereitstellen, das ein Standard-VPC-Netzwerk und ein Subnetz verwendet. Anstelle des Standardnetzwerks können Sie ein VPC-Netzwerk angeben, das mit Ihrer Instanz verwendet werden soll.

Informationen zur Verwendung von Agent Platform Workbench innerhalb eines Dienstperimeters finden Sie unter Agent Platform Workbench-Instanz innerhalb eines Dienstperimeters verwenden.

Kundenverwaltete Verschlüsselungsschlüssel (CMEK, Customer-Managed Encryption Keys)

Standardmäßig verschlüsselt Google Cloud Daten im inaktiven Zustand automatisch mit von Google verwalteten Verschlüsselungsschlüsseln. Wenn Sie bestimmte Compliance- oder behördliche Anforderungen in Bezug auf die Schlüssel zum Schutz Ihrer Daten haben, können Sie mit Ihren Gemini Enterprise Agent Platform Workbench-Instanzen kundenverwaltete Verschlüsselungsschlüssel (Customer-Managed Encryption Keys, CMEK) verwenden. Weitere Informationen finden Sie unter Kundenverwaltete Verschlüsselungsschlüssel.

Confidential Computing

Mit Confidential Computing können Sie Ihre aktiven Daten verschlüsseln. Wenn Sie Confidential Computing verwenden möchten, aktivieren Sie den Confidential VM-Dienst, wenn Sie eine Agent Platform Workbench-Instanz erstellen. Informationen zum Erstellen einer Instanz mit Confidential Computing

Automatisiertes Herunterfahren bei inaktiven Instanzen

Zur Kostensenkung werden Agent Platform Workbench-Instanzen standardmäßig heruntergefahren, nachdem sie für einen bestimmten Zeitraum inaktiv waren. Sie können den Zeitraum ändern oder diese Funktion deaktivieren. Weitere Informationen finden Sie unter Herunterfahren bei Inaktivität.

Conda-Umgebungen hinzufügen

Agent Platform Workbench-Instanzen verwenden Kernels, die auf Conda-Umgebungen basieren. Sie können Ihrer Agent Platform Workbench-Instanz eine Conda-Umgebung hinzufügen. Die Umgebung wird in der JupyterLab-Benutzeroberfläche Ihrer Instanz als Kernel angezeigt.

Wenn Sie Conda-Umgebungen hinzufügen, können Sie Kernel verwenden, die in der Standard-Agent Platform Workbench-Instanz nicht verfügbar sind. Sie können beispielsweise Conda-Umgebungen für R und Apache Beam hinzufügen. Oder Sie können Conda-Umgebungen für bestimmte ältere Versionen der verfügbaren Frameworks wie TensorFlow, PyTorch oder Python hinzufügen.

Weitere Informationen finden Sie unter Conda-Umgebung hinzufügen.

Benutzerdefinierte Container

Sie können eine Agent Platform Workbench-Instanz auf Basis eines benutzerdefinierten Containers erstellen. Beginnen Sie mit einem von Google bereitgestellten Basiscontainer-Image und passen Sie es an Ihre Anforderungen an. Erstellen Sie dann eine Instanz auf Grundlage des benutzerdefinierten Containers.

Weitere Informationen finden Sie unter Instanz mit einem benutzerdefinierten Container erstellen.

Integration von Managed Service for Apache Spark

Sie können Daten schnell verarbeiten, indem Sie ein Notebook in einem Managed Service for Apache Spark-Cluster ausführen. Wenn der Cluster eingerichtet ist, können Sie eine Notebookdatei darauf ausführen, ohne die JupyterLab-Benutzeroberfläche zu verlassen. Weitere Informationen finden Sie unter Managed Service for Apache Spark-fähige Instanz erstellen.

VM-Ressourcen reservieren

Verwenden Sie Compute Engine-Reservierungen, um sicherzustellen, dass Ihre Agent Platform Workbench-Instanzen genügend VM-Ressourcen (virtuelle Maschinen) für die Ausführung haben.

Reservierungen sind eine Compute Engine-Funktion. Sie sorgen dafür, dass die Ressourcen jederzeit verfügbar sind, die Sie zum Erstellen von VMs mit derselben Hardware (Arbeitsspeicher und vCPUs) und optionalen Ressourcen (GPUs und lokalen SSD-Laufwerken) benötigen.

Weitere Informationen finden Sie unter Reservierungen verwenden.

Instanzen mit Anmeldedaten von Drittanbietern erstellen

Sie können Gemini Enterprise Agent Platform Workbench-Instanzen mit Anmeldedaten von Drittanbietern erstellen und verwalten, die von der Mitarbeiteridentitätsföderation bereitgestellt werden. Die Mitarbeiteridentitätsföderation verwendet Ihren externen Identitätsanbieter (Identity Provider, IdP), um einer Gruppe von Nutzern über einen Proxy Zugriff auf Agent Platform Workbench-Instanzen zu gewähren.

Der Zugriff auf eine Agent Platform Workbench-Instanz wird durch Zuweisung eines Workforce-Pool-Hauptkontos zu dem Dienstkonto der Agent Platform Workbench-Instanz gewährt.

Weitere Informationen finden Sie unter Instanz mit Drittanbieteranmeldedaten erstellen.

Tags für Agent Platform Workbench-Instanzen

Die zugrunde liegende VM einer Agent Platform Workbench-Instanz ist eine Compute Engine-VM. Sie können Ihrer Agent Platform Workbench-Instanz über ihre Compute Engine-VM Ressourcen-Tags hinzufügen und diese verwalten.

Wenn Sie eine Agent Platform Workbench-Instanz erstellen, wird das Compute Engine-Ressourcentag vertex-workbench-instances:prod=READ_ONLY angehängt. Dieses Ressourcen-Tag wird nur für interne Zwecke verwendet.

Weitere Informationen zum Verwalten von Tags für Compute Engine-Instanzen finden Sie unter Tags für Ressourcen verwalten.

Beschränkungen

Beachten Sie beim Planen Ihres Projekts die folgenden Einschränkungen von Agent Platform Workbench-Instanzen:

  • JupyterLab-Erweiterungen von Drittanbietern werden nicht unterstützt.

  • Wenn Sie Access Context Manager und Chrome Enterprise Premium zum Schutz von Agent Platform Workbench-Instanzen mit kontextsensitiver Zugriffssteuerung verwenden, wird der Zugriff bei jeder Authentifizierung des Nutzers bei der Instanz ausgewertet. Beispielsweise wird der Zugriff ausgewertet, wenn der Nutzer zum ersten Mal auf JupyterLab zugreift und bei jedem Zugriff, nachdem das Cookie seines Webbrowsers abgelaufen ist.

  • Die Verwendung eines benutzerdefinierten Containers, der nicht vom Von Google bereitgestellter Basiscontainer (gcr.io/deeplearning-platform-release/workbench-container:latest) abgeleitet ist, erhöht das Risiko von Kompatibilitätsproblemen mit unseren Diensten und wird nicht unterstützt. Ändern Sie stattdessen den Basiscontainer, um einen benutzerdefinierten Container zu erstellen, der Ihren Anforderungen entspricht, und erstellen Sie dann eine Instanz mit dem benutzerdefinierten Container.

  • Für Agent Platform Workbench-Instanzen werden Bilder aus dem cloud-notebooks-managed-Projekt erwartet. Die Liste der Imagenamen ist auf der Erstellungsseite in der Google Cloud Console verfügbar. Obwohl die Verwendung von benutzerdefinierten virtuellen Maschinen (VMs) oder Deep Learning-VM-Images mit Agent Platform Workbench-Instanzen möglich ist, bietet Agent Platform Workbench keine Unterstützung für unerwartete Verhaltensweisen oder Fehlfunktionen bei der Verwendung dieser Images.

  • Sie können die zugrunde liegende VM einer Agent Platform Workbench-Instanz nicht mit der Google Cloud Console oder der Compute Engine API bearbeiten. Verwenden Sie zum Bearbeiten der zugrunde liegenden VM einer Agent Platform Workbench-Instanz die Methode projects.locations.instances.patch in der Notebooks API oder den Befehl gcloud workbench instances update im Agent Platform SDK.

  • In Instanzen, die VPC Service Controls verwenden, wird die Verwendung des executor nicht unterstützt.

  • Wenn Sie Beschleuniger mit Agent Platform Workbench-Instanzen verwenden möchten, muss der gewünschte Beschleunigertyp in der Zone Ihrer Instanz verfügbar sein. Informationen zur Beschleunigerverfügbarkeit nach Zone finden Sie unter Verfügbarkeit von GPU-Regionen und -Zonen.

Nächste Schritte