Compute-Infrastruktur mit Gemini entwerfen

In diesem Dokument wird erläutert, wie Sie Ihre Compute-Infrastruktur planen und entwerfen, indem Sie Prompts an Gemini senden.

Sie können Gemini in der Google Cloud Console als KI-gestützte Schnittstelle verwenden, um Hardwareoptionen zu bewerten, Bereitstellungskosten zu schätzen und empfohlene Konfigurationen für Ihre Compute Engine-Instanzen anzusehen. Um die Empfehlungen anzupassen, wertet Gemini Ihr Google Cloud Projekt aus. Dabei werden Ihre Kontingentlimits, vorhandenen Reservierungen, Zusicherungen für die Nutzung mit Rabatt (Committed Use Discounts, CUDs), die Standardregion und ‑zone, sowie alle Einschränkungen für den Ressourcenstandortberücksichtigt. Wenn Sie Gemini bei der Planung verwenden, können Sie eine optimale Konfiguration für Ihre Arbeitslast erreichen, bevor Sie eine Compute-Instanz erstellen oder ändern.

Weitere Informationen zu den Komponenten, die Sie vor oder beim Erstellen einer Compute-Instanz konfigurieren müssen, finden Sie unter Übersicht zum Erstellen von Compute Engine-Instanzen.

Beschränkungen

Wenn Sie in der Google Cloud Console Prompts an Gemini senden, können Sie mit Gemini keine Ressourcen erstellen, ändern oder löschen.

Hinweis

Wenn Sie über die Google Cloud Console auf Google Cloud Dienste und APIs zugreifen, müssen Sie die Authentifizierung nicht einrichten.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute-Betrachter (roles/compute.viewer) für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie für den Zugriff auf Gemini und das Senden von Prompts an Gemini benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die für den Zugriff auf Gemini und das Senden von Prompts an Gemini erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen , um die notwendigen Berechtigungen anzuzeigen, die erforderlich sind:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind für den Zugriff auf Gemini und das Senden von Prompts an Gemini erforderlich:

  • Liste der Instanzen ansehen: compute.instances.list

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

In der Google Cloud Console auf Gemini zugreifen

Führen Sie die folgenden Schritte aus, um in der Google Cloud Console auf Gemini zuzugreifen:

  1. Rufen Sie in der Google Cloud Console die Seite Übersicht auf.

    Zur Übersicht

  2. Im Abschnitt Infrastruktur mit Compute Advisor gestalten können Sie Folgendes sehen:

    Ein Screenshot der Compute Advisor-Seite und der UI-Elemente, aus denen sie besteht.

    Die UI-Elemente, die im vorherigen Screenshot angezeigt werden, sind folgende:

    • Prompt-Karten für Schnellaktionen: Eine Reihe von Karten, die jeweils einen Beispiel prompt enthalten. Wenn Sie auf eine Karte klicken, wird die Google Cloud Console automatisch mit dem Beispielprompt gefüllt.

    • Prompt-Feld: In diesem Feld können Sie Prompts eingeben und senden. Klicken Sie zum Senden eines Prompts auf Prompt senden.

    • Vorherige Unterhaltungen ansehen: Mit dieser Funktion können Sie die Details einer früheren Unterhaltung ansehen und sie fortsetzen oder Unterhaltungen löschen, wenn Sie sie nicht mehr benötigen.

Prompts an Gemini senden

Nachdem Sie einen Prompt gesendet haben, beginnt Gemini mit der Generierung einer Antwort. Ein Bereich wird angezeigt und Google Cloud die Antwort auf Ihren Prompt wird in derConsole angezeigt wie im folgenden Screenshot dargestellt:

Ein Screenshot der Seite „Compute Advisor“ nach dem Senden eines Prompts.

Abhängig von Ihrem Prompt enthält der Antwortbereich die folgenden Elemente:

  • Kontextbezogene Informationen: Gemini wertet automatisch den Kontext Ihres Projekts aus, um hochgradig angepasste Empfehlungen zu geben, einschließlich Kontingent limits, vorhandener Reservierungen, CUDs, Ihrer Standardregion und ‑zone sowie aller Einschränkungen für den Ressourcenstandort.

  • Interaktive Code-Snippets: Gemini generiert gcloud-Befehle, REST API-Methoden oder Terraform-Ressourcen. Sie können diese Code-Snippets kopieren und einfügen oder in Cloud Shell ausführen.

  • Visuelle Canvas: Gemini organisiert Empfehlungen in strukturierten Tabellen und nebeneinanderliegenden Vergleichen. Diese Ansicht hilft Ihnen, Produktfunktionen und Architekturansätze zu bewerten. Außerdem wird ein Implementierungsplan für Ihren Anwendungsfall bereitgestellt.

In den folgenden Abschnitten werden die Best Practices für das Schreiben von Prompts und Beispielprompts beschrieben, die Sie verwenden können, bevor Sie eine Compute-Instanz erstellen oder ändern.

Best Practices für Prompts

Damit Sie von Gemini möglichst genaue und umsetzbare Empfehlungen erhalten, empfehlen wir, Ihre Prompts so zu strukturieren wie einen Codeblock. Bei diesem Ansatz wird die generative KI durch klare Parameterdeklarationen, Rollendefinitionen, spezifische Anweisungen und explizite Ausgabeformate unterstützt.

Beachten Sie beim Senden von Prompts an Gemini die folgenden Best Practices:

  • Fokus auf Design und Planung: Wir empfehlen, Gemini nicht nach Lösungen für Fehler bei Compute-Instanzen zu fragen. Informationen zum Beheben dieser Fehler finden Sie stattdessen unter Fehlerbehebung beim Erstellen, Aktualisieren und Löschen von Compute-Instanzen.

  • Rolle oder Persona angeben: Deklarieren Sie eine Zielrolle oder ‑persona, z. B. IT-Administrator, KI-Forscher oder Plattformtechniker, die Gemini annehmen soll. Dieser Ansatz bestimmt den Ton, die Tiefe und das Fachwissen der resultierenden Empfehlungen.

  • Explizite, nummerierte Anweisungen geben: Teilen Sie Ihr Ziel in konkrete, schrittweise Fragen oder Aufgaben auf. Dieser Ansatz strukturiert den Denkprozess von Gemini und trägt dazu bei, dass Gemini alle Ihre Anforderungen erfüllt.

  • Bestimmtes Ausgabeformat definieren: Geben Sie explizit an, wie die Empfehlung formatiert werden soll, z. B. als Schritt-für-Schritt-Anleitung, als Markdown-Vergleichstabelle oder als sofort einsatzbereiter gcloud-Code block.

  • Automatische Kontextinformationen nutzen: Sie müssen Ihre Standardregion oder ‑zone, verfügbaren Kontingente, CUDs oder Einschränkungen für den Ressourcenstandort nicht in Ihren Prompt aufnehmen. Gemini kann auf diese Informationen in Ihrem Google Cloud Projekt zugreifen.

  • Designs iterativ verfeinern: Sie können die Antwort ändern oder erweitern, die von Gemini generiert wurde, indem Sie neue Prompts senden. Sie können den Assistenten beispielsweise bitten, Ihrem Bereitstellungsplan Netzwerkanempfehlungen hinzuzufügen oder die Speicheranforderungen zu ändern, ohne eine neue Unterhaltung zu starten.

Prompt-Beispiele

Im Folgenden finden Sie Beispiele für Prompts, mit denen Sie Ihre Compute-Infrastruktur entwerfen und optimieren können:

  • Topologie und Placement-Strategie für Compute-Instanzen: Um das optimale Bereitstellungsmodell und die optimale Platzierungsrichtlinie für eine hochverfügbare Arbeitslast zu ermitteln, verwenden Sie einen Prompt wie den folgenden:

    Act as a cloud architect. I need to design a compute instance topology for a
    distributed database that balances multi-zone resilience with
    sub-millisecond latency.
    
    Please provide the following:
    1. A side-by-side comparison of regional MIGs against zonal MIGs.
    2. An explanation of whether compact placement policies work regionally.
    3. The optimal autoscaling configuration for this workload.
    
    Format the comparison as a Markdown table, and provide the deployment steps
    as ready-to-use gcloud code blocks.
    
  • Bereitstellungsmodell und Kostenoptimierung: Um Bereitstellungsmodelle zu bewerten und die Kosten für die Batchverarbeitung zu senken, verwenden Sie einen Prompt wie den folgenden:

    Act as a platform engineer. I need to find the cheapest way to run large,
    interruptible analytics jobs on our cloud servers without risking data loss.
    
    Please provide the following:
    1. A cost and reliability comparison of standard discounted servers against
       queue-based servers.
    2. An explanation of how to boot all our compute power at the exact same
       time.
    3. A deployment script that gives our jobs a two-minute warning before a
       server gets reclaimed.
    
    Format the comparison as a Markdown table, and provide the script as a
    ready-to-use code block.
    

Nächste Schritte