In diesem Dokument werden die wichtigsten Konzepte für die Verwendung der Conversational Analytics API (geminidataanalytics.googleapis.com
) beschrieben. Mit dieser API können Sie Daten-KI-Agenten erstellen, die Fragen zu Ihren strukturierten Daten in natürlicher Sprache beantworten, und mit den Agenten interagieren. Dieses Dokument beschreibt die Funktionsweise von KI-Agenten, typische Workflows, Konversationsmodi, IAM-Rollen (Identity and Access Management) und die Gestaltung von Systemen mit mehreren Agenten.
Funktionsweise von Daten-KI-Agenten
Die Daten-KI-Agenten der Conversation Analytics API nutzen den von Ihnen bereitgestellten Kontext (Informationen zum Unternehmen und Daten) sowie Tools (wie SQL und Python). Sie interpretieren damit in natürlicher Sprache gestellte Fragen und generieren aus Ihren strukturierten Daten Antworten.
Das folgende Diagramm zeigt die Phasen des Workflows, wenn ein Nutzer eine Frage stellt:
Die Verarbeitung einer Nutzeranfrage durchläuft die folgenden im Diagramm dargestellten Phasen:
- Nutzereingabe: Der Nutzer stellt eine Frage in natürlicher Sprache und gibt gegebenenfalls zusätzlichen Kontext an.
- Datenquellen: Der KI-Agent verbindet sich in Looker, BigQuery und Looker Studio mit Ihren Daten und ruft die erforderlichen Informationen ab.
- Reasoning Engine: Im Herzstück des KI-Agenten wird die Frage des Nutzers mit den verfügbaren Tools verarbeitet.
- Agent-Ausgabe: Der KI-Agent generiert eine Antwort, die aus Text, Datentabellen oder Spezifikationen für Diagramme bestehen kann.
Workflows zum Erstellen und Nutzen von KI-Agenten
Die Conversational Analytics API unterstützt Workflows für Ersteller, die KI-Agenten erstellen und konfigurieren, und Nutzer, die mit KI-Agenten interagieren.
Das folgende Diagramm veranschaulicht den gesamten Prozess von der ersten Einrichtung durch einen Ersteller bis zu den endgültigen Interaktionen durch einen Nutzer:
In den folgenden Abschnitten werden die Workflows für Ersteller und Nutzer genauer beschrieben.
Der Workflow des KI-Agenten-Erstellers
Der Ersteller ist für die Einrichtung und Konfiguration von KI-Agenten verantwortlich. Dieser Workflow umfasst die folgenden Schritte:
- KI-Agent erstellen: Der Ersteller erstellt zuerst einen neuen KI-Agenten und stellt den erforderlichen Kontext bereit, darunter auch Systemanweisungen und Verbindungen zu Datenquellen. Dieser Schritt ist wichtig, damit der KI-Agent die Fragen der Nutzer verstehen und effektiv beantworten kann.
- KI-Agent freigeben: Der konfigurierte KI-Agent wird für andere Nutzer freigegeben. Dabei werden auch die passenden rollenbasierten Zugriffssteuerungen für die Berechtigungen festgelegt.
Workflow des Nutzers von KI-Agenten
Der Nutzer ist in der Regel ein geschäftlicher Nutzer, der Antworten von einem konfigurierten KI-Agenten benötigt. Dieser Workflow umfasst die folgenden Schritte:
- KI-Agent suchen: Der Nutzer sucht zuerst nach einem KI-Agenten, der für ihn freigegeben wurde.
- Frage stellen: Der Nutzer stellt eine Frage in natürlicher Sprache. Die Frage kann einzeln gestellt werden oder Teil einer wechselseitigen Konversation sein.
- KI-Agent „denkt“: Die Reasoning Engine des KI-Agenten verarbeitet die Frage. Dafür verarbeitet sie das vordefinierte Wissen des KI-Agenten und die verfügbaren Tools (z. B. SQL, Python und Diagramme) in einem „Reasoning Loop“ und sucht die bestmögliche Antwort auf die Frage.
- KI-Agent antwortet: Der KI-Agent gibt eine Antwort zurück, die aus Text, Datentabellen oder Diagramme bestehen kann.
Konversationsmodi
KI-Agenten der Conversational Analytics API unterstützen verschiedene Konversationsmodi. Diese legen fest, wie Konversationsverlauf und kontextuelle Persistenz in den Interaktionen verarbeitet werden. Die folgenden Konversationsmodi sind verfügbar:
- Zustandsloser Modus: Der KI-Agent speichert den Konversationsverlauf nicht. Jede Interaktion wird unabhängig behandelt. Dieser Modus ist nützlich für Anwendungen, bei denen der Kontext nicht über mehrere Konversationsrunden hinweg abrufbar sein muss.
- Zustandsorientierter Modus: Der KI-Agent bewahrt den Kontext und den Konversationsverlauf auf, sodass kontextbezogenere Interaktionen möglich sind. Dieser Modus ist nützlich für Anwendungen, bei denen der Kontext über mehrere Konversationsrunden hinweg abrufbar sein muss. Der zustandsorientierte Modus wird für eine höhere Genauigkeit und personalisierte Antworten empfohlen.
Wählen Sie den Konversationsmodus basierend auf den Anforderungen Ihrer Anwendung an den Konversationsverlauf und die kontextuelle Persistenz.
IAM-Rollen
IAM-Rollen steuern, wer Conversational Analytics API-Agenten erstellen, verwalten, freigeben und mit ihnen interagieren kann. In der folgenden Tabelle werden die wichtigsten IAM-Rollen für die Conversational Analytics API beschrieben:
Rolle | Typischer Zugriffsbereich | Berechtigungen der Rolle | Berechtigter |
---|---|---|---|
Gemini Data Analytics Data Agent Creator (roles/geminidataanalytics.dataAgentCreator ) |
Projekt | KI-Agenten erstellen und Eigentümerberechtigungen für den Agenten übernehmen. | Jeder Datenanalyst |
Gemini Data Analytics Data Agent Owner (roles/geminidataanalytics.dataAgentOwner ) |
Projekt, KI-Agent | KI-Agenten bearbeiten, freigeben oder löschen. | Senior Data Analyst |
Gemini Data Analytics Data Agent Editor (roles/geminidataanalytics.dataAgentEditor ) |
KI-Agent, Projekt | Konfiguration oder Kontext eines KI-Agenten aktualisieren. | Junior Data Analyst |
Gemini Data Analytics Data Agent User (roles/geminidataanalytics.dataAgentUser ) |
KI-Agent, Projekt | Mit einem Agenten chatten | Werbetreibender, Geschäftsinhaber |
Gemini Data Analytics Data Agent Viewer (roles/geminidataanalytics.dataAgentViewer ) |
Projekt, KI-Agent | KI-Agenten auflisten und ihre Details abrufen. | Alle Nutzer |
Gemini Data Analytics Data Agent Stateless User (roles/geminidataanalytics.dataAgentStatelessUser ) |
Projekt | Mit einem KI-Agenten chatten, ohne dass Kontext oder Unterhaltungsverlauf gespeichert wird. | Alle Nutzer |
Systeme mit mehreren KI-Agenten
Sie können komplexe Systeme entwerfen, indem Sie mehrere Conversational Analytics API-Agenten einbinden. Dabei ist es gängig, einen primären KI-Agenten als „Orchestrator“ einzusetzen, der Aufgaben an einen oder mehrere spezialisierte KI-Agenten delegiert, die sich um bestimmte Bereiche wie Verkaufs- oder Marketingdaten kümmern. Mit diesem Ansatz können Sie ein System aufbauen, das die Stärken mehrerer KI-Agenten kombiniert und dadurch ein breites Spektrum an Fragen bearbeiten kann.
Das folgende Diagramm veranschaulicht dieses Multi-Agenten-Muster und zeigt, wie ein primärer KI-Agent eine Datenanfrage an einen spezialisierten Conversational Analytics-Agenten delegieren kann:
Der typische Workflow für ein Multi-Agenten-System umfasst die folgenden Schritte:
- Ein geschäftlicher Nutzer oder Datenanalyst stellt eine Frage in natürlicher Sprache, z. B. „Zeige mir die drei umsatzstärksten Filialen“.
- Ein primärer „Orchestrator“-Agent leitet die Anfrage an den entsprechenden spezialisierten KI-Agenten weiter.
- Ein spezialisierter KI-Agent empfängt die übertragene Anfrage, stellt eine Verbindung zu den relevanten Datenquellen her, generiert mit seinen Tools die erforderlichen SQL-Abfragen und Diagramme und erstellt eine Antwort.
- Die Antwort des spezialisierten KI-Agenten wird an den Nutzer zurückgegeben, z. B. „Die Filialen 4, 9 und 3 haben den höchsten Umsatz. Hier ist ein Diagramm.“
Nächste Schritte
Nachdem Sie die wichtigsten Konzepte der Conversational Analytics API kennengelernt haben, erfahren Sie, wie Sie diese Funktionen implementieren:
- Informationen zum Authentifizieren und Herstellen einer Verbindung zu einer Datenquelle.
- Informationen zum Erstellen und Konfigurieren von KI-Agenten mit HTTP.
- Informationen zum Erstellen und Konfigurieren von KI-Agenten mit Python.
- Weitere Informationen zum Steuern des Verhaltens von KI-Agenten mit selbst erstelltem Kontext.
- Zugriffssteuerung mit IAM für die Conversational Analytics API.