Agenten

Der Begriff Agent kann verschiedene Bedeutungen haben. In einem Multi-Agent-System, das einen hierarchischen Agent-Baum bildet, wird der gesamte Agent-Baum als Agent-Anwendung bezeichnet.

Eine Agent-Anwendung besteht aus einem oder mehreren Agents, wobei jeder Agent entweder der Root-Agent oder ein Sub-Agent sein kann.

Ein Root-Agent (auch als Steuerungs-Agent bezeichnet) dient als primärer Einstiegspunkt und Orchestrator für die gesamte Agent-Anwendung. Er ist in der Regel für die Hauptinteraktion mit dem Endnutzer zuständig, muss die allgemeinen Ziele verstehen und delegiert bestimmte Aufgaben an geeignete Unter-Agents.

Ein Unteragent (auch untergeordneter Agent genannt) ist ein spezialisierterer Agent, der für die Bearbeitung einer bestimmten Aufgabe, Domain oder Funktion entwickelt wurde. Ein untergeordneter Agent könnte beispielsweise damit beauftragt werden, eine bestimmte Datenbank zu durchsuchen oder einen bestimmten Datentyp zu analysieren. Untergeordnete Agents fördern die Modularität und Wiederverwendbarkeit in Ihrer Agent-Anwendung.

Root-Agents können Sub-Agents aufrufen und Sub-Agents können andere Sub-Agents aufrufen.

Diagramm für Route und untergeordneten Agenten

Sprachunterstützung

Sie sollten Ihre Agents auf Englisch entwickeln. Agents können jedoch die Sprache der Endnutzereingabe automatisch erkennen und antworten dann automatisch in derselben Sprache. Eine Liste der unterstützten Sprachen finden Sie in der Sprachreferenz.

Agent-Anwendung und Root-Agent erstellen

So erstellen Sie eine Agent-Anwendung und einen Root-Agent:

  1. Öffnen Sie die Gemini Enterprise for CX-Konsole.
  2. Wählen Sie Ihr Projekt aus.
  3. Klicken Sie auf Erstellen oder Agent erstellen.
  4. Geben Sie einen Namen für die Agent-Anwendung an.
  5. Klicken Sie auf Erstellen. Wenn dies die erste Agent-Anwendung ist, die Sie für das Projekt erstellt haben, kann die Erstellung 1 bis 2 Minuten dauern. Das Tool zur Agent-Erstellung wird angezeigt und ein Stamm-Agent wird für Sie erstellt.
  6. Klicken Sie oben rechts im Stamm-Agent auf das Pluszeichen.
  7. Klicken Sie auf Anleitung hinzufügen, um Anleitungen für den Stamm-Agent hinzuzufügen.
  8. Klicken Sie auf Tool hinzufügen, um Tools für den Stamm-Agent hinzuzufügen.

Sub-Agent erstellen

So erstellen Sie einen untergeordneten Agent:

  1. Klicken Sie unten auf das Pluszeichen des Stamm-Agents.
  2. Klicken Sie auf Unteragent hinzufügen.

Agent-Anwendungen verwalten

So verwalten Sie Agent-Anwendungen für Ihr Projekt:

  1. Öffnen Sie die Gemini Enterprise for CX-Konsole.
  2. Wählen Sie Ihr Projekt aus. Die Liste der Agent-Anwendungen für Ihr Projekt wird angezeigt.

Für jede Agent-Anwendung sind die folgenden Informationen und Aktionen verfügbar:

  • Klicken Sie auf den Namen der Agent-Anwendung, um die Anwendung im Agent-Builder zu öffnen.
  • In der Spalte Bereitgestellt für wird die Anzahl der Kanäle angezeigt, für die die Anwendung bereitgestellt wird.
  • In der Spalte Sitzungen sehen Sie die Anzahl der Sitzungen in den letzten 24 Stunden, in denen ein Bereitstellungschannel verwendet wurde.
  • In der Spalte Eskalierung sehen Sie die Anzahl der Eskalierungen in den letzten 24 Stunden, bei denen ein Bereitstellungschannel verwendet wird.
  • Der Zeitpunkt der letzten Aktualisierung der Agent-Anwendung wird angezeigt.
  • Sie können auf das Kontextmenü für eine bestimmte Agent-Anwendung klicken und dann Agent importieren, Agent exportieren oder Agent löschen auswählen. Weitere Informationen finden Sie unter Exportieren und importieren.

Agent-Anwendungseinstellungen

So bearbeiten Sie globale Agent-Anwendungseinstellungen:

  1. Klicken Sie rechts im Builder auf das Symbol für die Einstellungen.

Die folgenden Einstellungen für Agent-Anwendungen sind verfügbar:

  • Basic:
    • Interaktionen:
      • Globales Modell: Das Standardmodell, das verwendet wird, sofern es nicht von einzelnen Agents überschrieben wird. Einige Modelle sind möglicherweise für Text oder Sprache optimiert.
      • Spracheinstellungen:
        • Standardsprache: Alle Unterhaltungen in dieser Sprache starten.
        • Zusätzliche Sprachen: Wenn Ihre Agent-Anwendung mehrsprachig ist, geben Sie zusätzliche Sprachen an. Ihre Agent-Anwendung wechselt automatisch die Sprache, um der Nutzereingabe zu entsprechen.
        • Umgang mit nicht unterstützten Sprachen: Wenn die Nutzereingabe in einer nicht unterstützten Sprache erfolgt, fordert die Agent-Anwendung den Nutzer auf, die Eingabe zu wiederholen. Wenn für die neue Eingabe auch eine nicht unterstützte Sprache verwendet wird, wählen Sie die Aktion aus, die ausgeführt werden soll.
    • Verhalten:
      • Stimme: Die Stimme, die für die Sprachsynthese verwendet wird.
      • Umgebungsgeräusche: Hintergrundgeräusche, die vom Agenten abgespielt werden.
      • Länge der Antwort: Hier können Sie festlegen, wie ausführlich der Agent antworten soll.
      • Nutzerunterbrechungen zulassen: Ermöglichen Sie dem Endnutzer, den Agent zu unterbrechen.
      • Bei Unterbrechung anpassen: Wenn diese Option aktiviert ist, versuchen Agents, ihre Antwort so anzupassen, dass der Nutzer möglicherweise nicht alles gehört hat.
    • Agentendetails:
      • Anzeigename: Anzeigename für die Agent-Anwendung.
      • Agent sperren: So verhindern Sie, dass Änderungen angewendet werden.
      • Hinweise: Eine für Menschen lesbare Beschreibung der Agent-Anwendung. Diese werden nicht an das Modell gesendet.
  • Erweitert:
    • Sprache:
      • Zeitüberschreitung bei Stille: Warten Sie auf eine Nutzereingabe und fordern Sie den Nutzer dann auf, die Interaktion fortzusetzen.
      • Verstärkung der Lautstärke von Umgebungsgeräuschen: Hier können Sie die Lautstärke von Umgebungsgeräuschen anpassen.
      • Tastatureingabe: Richten Sie die Doppelton-Mehrfrequenzsignalisierung (Dual-Tone Multi-Frequency, DTMF) für Telefonanrufe ein.
    • Logging:
      • Protokolle und Datenfreigabe: Hier können Sie agentenweite Einstellungen für Protokolle und die Agentenentwicklung verwalten.
        • Interaktionsdaten: Speichern Sie Interaktionsdaten, um detailliertere Statistiken zu erhalten und als Referenz zu nutzen. Dazu gehören simulierte und Live-Interaktionen, Tracing-Daten und mehr. Wenn diese Option deaktiviert ist, können Sie keine früheren Unterhaltungen mit Ihrem Kundenservicemitarbeiter sehen.
      • Entfernung aktivieren: Sensible Daten automatisch finden und entfernen.
      • Cloud Logging aktivieren: Logs werden automatisch an Cloud Logging gestreamt.
      • Logs nach BigQuery exportieren: Logs zur benutzerdefinierten Analyse nach BigQuery exportieren.
      • Audioaufzeichnung: Cloud Storage-Bucket-Speicherort für Audioausgabedateien.
    • Tools:
      • Ausführungsmodus: Tool-Aufrufe parallel oder sequenziell ausführen.
    • Globale Anleitung: Anweisungen für alle Kundenservicemitarbeiter in der Agent-Anwendung. Mit dieser Anleitung können Sie eine stabile Identität oder Persönlichkeit für alle Agents einrichten.

Agent-Einstellungen

So bearbeiten Sie die Einstellungen für den Stamm- oder untergeordneten Agent:

  1. Klicken Sie im Titelkästchen des Agent auf das Kontextmenü.
  2. Wählen Sie Konfiguration bearbeiten aus.

Die folgenden Einstellungen für Root- und untergeordnete Agents sind verfügbar:

  • Agent-Name: Anzeigename für den Agent. Verwenden Sie Snake Case.
  • Modell: Das für den Agent verwendete Modell.
  • Description (Beschreibung): Eine Beschreibung des Agents. Diese Beschreibung wird anderen KI-Agenten in der Agent-Anwendung zur Verfügung gestellt.
  • Benutzerdefinierter Code: Geben Sie Code für Callbacks an.