Dies ist eine umfassende Anleitung, die Ihnen zeigt, wie Sie mit dem Agent Platform SDK für Python ein benutzerdefiniert trainiertes Modell erstellen. Sie führen Code in einer Notebook-Datei (IPYNB) aus, in der ein Docker-Container zum Trainieren und Erstellen des Modells verwendet wird. Diese Anleitung richtet sich an Data Scientists, die mit der Gemini Enterprise Agent Platform noch nicht vertraut sind, sich aber mit Notebooks, Python und maschinellem Lernen (ML) auskennen.
Der Prozess beginnt mit der Erstellung des Projekts, das Ihre Arbeit enthält, in der Google Cloud Console. In Ihrem Projekt verwenden Sie Vertex AI Workbench, um ein Jupyter-Notebook zu erstellen. In der Notebookumgebung führen Sie Code aus, der ein Dataset herunterlädt und vorbereitet. Dann verwendest du das Dataset zum Erstellen und Trainieren eines Modells. Am Ende des Tutorials generiert das trainierte Modell Vorhersagen.
Das Ziel dieser Anleitung ist es, Sie in weniger als einer Stunde durch alle Schritte zu führen, die zum Erstellen von Vorhersagen erforderlich sind. Das verwendete Dataset ist relativ klein, sodass das Trainieren Ihres Modells nicht sehr lange dauert. Anschließend können Sie das Gelernte auf größere Datasets anwenden. Je größer Ihr Datensatz ist, desto genauer sind Ihre Vorhersagen.
Anleitungsschritte
Voraussetzungen: Erstellen Sie Ihr Google Cloud-Konto und -Projekt.
Notebook erstellen: Erstellen Sie ein Jupyter-Notebook und seine Umgebung und bereiten es vor. Sie verwenden das Notebook, um Code auszuführen, der Ihr Dataset erstellt, Ihr Modell erstellt und trainiert und Vorhersagen generiert.
Dataset erstellen: Laden Sie ein öffentlich verfügbares BigQuery-Dataset herunter und erstellen Sie damit ein tabellarisches Dataset für die Gemini Enterprise Agent Platform. Das Dataset enthält die Daten, die Sie zum Trainieren Ihres Modells verwenden.
Trainingsskript erstellen: Erstellen Sie ein Python-Skript, das Sie an den Trainingsjob übergeben. Das Skript wird ausgeführt, wenn der Trainingsjob trainiert und das Modell erstellt wird.
Modell trainieren: Verwenden Sie Ihr tabellarisches Dataset, um ein Modell zu trainieren und bereitzustellen. Sie verwenden das Modell, um Vorhersagen zu treffen.
Vorhersagen treffen: Erstellen Sie mit Ihrem Modell Vorhersagen. In diesem Abschnitt werden Sie auch durch das Löschen von Ressourcen geführt, die Sie im Laufe dieser Anleitung erstellen, sodass keine unnötigen Kosten anfallen.
Was Sie erreichen
In dieser Anleitung erfahren Sie, wie Sie das Agent Platform SDK für Python für Folgendes verwenden:
- Cloud Storage-Bucket zum Speichern eines Datasets erstellen
- Daten für das Training vorverarbeiten
- Verarbeitete Daten zum Erstellen eines Datasets in BigQuery verwenden
- BigQuery-Dataset verwenden, um ein tabellarisches Dataset für die Gemini Enterprise Agent Platform zu erstellen
- Benutzerdefiniert trainiertes Modell erstellen und trainieren
- Benutzerdefiniert trainiertes Modell auf einem Endpunkt bereitstellen
- Vorhersage generieren
- Bereitstellung des Modells aufheben
- Alle im Rahmen der Anleitung erstellten Ressourcen löschen, damit keine weiteren Kosten anfallen.
Verwendete abrechenbare Ressourcen
In dieser Anleitung werden kostenpflichtige Ressourcen verwendet, die mit den Diensten Gemini Enterprise Agent Platform, BigQuery und Cloud Storage Google Cloud zusammenhängen. Wenn Sie neu bei Google Cloudsind, können Sie möglicherweise einen oder mehrere dieser Dienste kostenlos nutzen. Die Gemini Enterprise Agent Platform bietet Neukunden ein Guthaben von 300 $und Cloud Storage und BigQuery haben kostenlose Stufen. Hier finden Sie weitere Informationen:
- Preise für die Gemini Enterprise Agent Platform und Kostenlose Cloud-Features und Testangebote
- BigQuery – Preise und Nutzung der kostenlosen Stufe von BigQuery
- Cloud Storage – Preise und Nutzung der kostenlosen Stufe von Cloud Storage
- Google Cloud Preisrechner
Um weitere Gebühren zu vermeiden, wird im letzten Schritt dieser Anleitung die Entfernung aller kostenpflichtigen Google Cloud Ressourcen, die Sie erstellt haben, beschrieben.