Présentation de Conversational Analytics

Conversational Analytics dans BigQuery vous permet de discuter avec des agents de vos données en langage naturel. Pour obtenir des réponses sur vos données, vous pouvez procéder comme suit :

  • Créez des agents de données qui définissent automatiquement le contexte des données et les instructions de traitement des requêtes pour un ensemble de sources de connaissances, telles que des tables, des vues ou des fonctions définies par l'utilisateur (UDF) que vous sélectionnez.
  • Si nécessaire, vous pouvez créer du contexte et des instructions pour un agent sous la forme de métadonnées de table et de champ personnalisées, d'instructions à l'agent pour interpréter et interroger les données, ou en créant des requêtes validées (anciennement appelées requêtes de référence) pour configurer l'agent de données afin qu'il puisse répondre efficacement aux questions pour des cas d'utilisation spécifiques.

Avant de personnaliser un agent, nous vous recommandons de commencer par travailler avec le contexte et les instructions qu'il crée.

Voici quelques exemples de contexte et d'instructions que vous pouvez fournir à l'agent :

  • Contexte Un agent de données pour l'analyse des ventes peut être configuré pour comprendre que "meilleurs commerciaux" fait référence aux commerciaux ayant généré le plus de revenus, et pas seulement à ceux ayant conclu le plus de contrats.
  • Instructions : Vous pouvez demander à un agent de données de toujours filtrer les données sur le trimestre le plus récent lorsqu'il est interrogé sur les "tendances", ou de regrouper les résultats par "catégorie de produit" par défaut.

Une fois les agents de données créés, vous pouvez discuter avec eux pour poser des questions sur les données BigQuery en langage naturel. Vous pouvez également créer des conversations directes avec une ou plusieurs sources de données pour répondre à des questions ponctuelles et simples.

L'analyse conversationnelle est optimisée par Gemini pour Google Cloud et est compatible avec certaines fonctions BigQuery ML. Pour en savoir plus, consultez la page Compatibilité avec BigQuery ML.

Découvrez comment et quand Gemini pour Google Cloud utilise vos données.

Agents de données

Les agents de données se composent d'une ou de plusieurs sources de connaissances et d'un ensemble d'instructions spécifiques à un cas d'utilisation pour le traitement de ces données. Lorsque vous créez un agent de données, vous pouvez le configurer à l'aide des options suivantes :

  • Utilisez des sources de connaissances telles que des tables, des vues et des UDF avec un agent de données.
  • Fournissez des métadonnées personnalisées pour les tables et les champs afin de décrire les données de la manière la plus appropriée pour le cas d'utilisation donné.
  • Fournissez des instructions pour interpréter et interroger les données, par exemple en définissant les éléments suivants :
    • Synonymes et termes commerciaux pour les noms de champs
    • Champs et valeurs par défaut les plus importants pour le filtrage et le regroupement
  • Créez des requêtes validées que l'agent de données peut utiliser pour définir la structure de réponse d'un agent et pour apprendre la logique métier utilisée par votre organisation. Les requêtes validées étaient auparavant appelées requêtes de référence. Les requêtes validées peuvent utiliser les fonctions BigQuery ML compatibles.

Gérer les agents de données

Vous pouvez créer, gérer et utiliser les types d'agents de données suivants dans l'onglet Catalogue d'agents de la console Google Cloud  :

  • Un agent exemple prédéfini pour chaque projet Google Cloud .
  • Liste des agents que vous avez créés, mis en brouillon et publiés.
  • Liste des agents créés et partagés avec vous par d'autres personnes.

Pour en savoir plus, consultez Créer des agents de données.

D'autres services du projet compatibles avec les agents de données, tels que l'API Conversational Analytics et Looker Studio Pro, peuvent accéder aux agents de données que vous créez dans BigQuery. Vous pouvez également accéder à un agent créé dans la console Google Cloud en l'appelant à l'aide de l'API Conversational Analytics.

Conversations

Les conversations sont des discussions persistantes avec un agent de données ou une source de données. Vous pouvez poser aux agents de données des questions en plusieurs parties qui utilisent des termes courants tels que "ventes" ou "le plus populaire", sans avoir à spécifier les noms des champs de table ni à définir de conditions pour filtrer les données. Vous pouvez également poser des questions sur les données contenues dans des objets tels que des PDF.

La réponse du chat qui vous est renvoyée propose les fonctionnalités suivantes :

  • La réponse à votre question sous forme de texte, de code ou d'images (multimodale). La réponse peut inclure les fonctions BigQuery ML compatibles.
  • Graphiques générés, le cas échéant.
  • Raisonnement de l'agent concernant les résultats.
  • Métadonnées sur la conversation, telles que l'agent et les sources de données utilisées.

Lorsque vous créez une conversation directe avec une source de données, l'API Conversational Analytics interprète votre question sans le contexte ni les instructions de traitement qu'un agent de données propose. Par conséquent, les résultats des conversations directes peuvent être moins précis. Utilisez des agents de données pour les cas qui nécessitent une plus grande précision.

Vous pouvez créer et gérer des conversations dans BigQuery à l'aide de la consoleGoogle Cloud . Pour en savoir plus, consultez Analyser les données avec des conversations.

Assistance BigQuery ML

L'analyse conversationnelle est compatible avec les fonctions BigQuery ML suivantes en réponse aux discussions avec les agents de données et les sources de données, ainsi qu'avec les requêtes SQL validées que vous créez.

Pour utiliser les fonctions AI.GENERATE compatibles, vous devez disposer des autorisations requises pour exécuter des requêtes d'IA générative.

Cas d'utilisation de BigQuery ML

Pour activer les fonctions BigQuery ML compatibles, utilisez-les de l'une des manières suivantes :

  • Lorsque vous créez un agent et ajoutez une requête validée (par exemple, si vous êtes un data scientist qui prépare un rapport récurrent), vous pouvez utiliser les fonctions BigQuery ML compatibles dans une requête validée pour décrire les valeurs par défaut et automatiser le rapport.
  • Lorsque vous posez des questions générales sur les données à un agent, dans une conversation ou dans une requête validée à l'aide de mots clés, l'agent génère le code SQL BigQuery ML en réponse à vos questions.

Le tableau suivant présente des exemples d'invites one-shot qui activent l'utilisation de BigQuery ML :

Cas d'utilisation Exemple d'utilisation Ensemble de données public
Prévision "Prédire le nombre de trajets pour le mois prochain" bigquery-public-data.san_francisco_bikeshare.bikeshare_trips
Détection d'anomalies "Trouve les valeurs aberrantes dans les trajets par jour pour 2018 en utilisant 2017 comme référence." bigquery-public-data.san_francisco_bikeshare.bikeshare_trips
Génération de texte par LLM "Pour chaque article de la catégorie 'sports', résume la colonne 'body' en une ou deux phrases." bigquery-public-data.bbc_news.fulltext

Sécurité

Vous pouvez gérer l'accès à l'analyse conversationnelle dans BigQuery à l'aide des rôles et autorisations IAM de l'API Conversational Analytics. Pour en savoir plus sur les rôles requis pour des opérations spécifiques, consultez les sections Rôles requis pour l'agent de données et Rôles requis pour les conversations.

Emplacements

Les analyses conversationnelles fonctionnent à l'échelle mondiale. Vous ne pouvez pas choisir la région à utiliser.

Tarifs

Les requêtes exécutées lorsque vous créez des agents de données et que vous avez des conversations avec des agents de données ou des sources de données vous sont facturées au tarif de calcul BigQuery. La création et l'utilisation d'agents de données et de conversations ne sont pas facturées pendant la période de preview.

Bonnes pratiques

Lorsque vous utilisez l'analyse conversationnelle, des requêtes sont automatiquement exécutées pour répondre à vos questions. Des frais imprévus peuvent vous être facturés dans les cas suivants :

  • Si vos tables sont volumineuses
  • Si les requêtes utilisent des jointures de données
  • Si les requêtes effectuent de nombreux appels aux fonctions d'IA

Pour éviter ce problème, tenez compte de la taille lorsque vous sélectionnez des sources de connaissances et, lorsque vous avez des conversations, pensez à utiliser des jointures.

Quota partagé dynamique

Le quota partagé dynamique (DSQ) dans Vertex AI gère la capacité du modèle Gemini. Contrairement aux quotas classiques, DSQ vous permet d'accéder à un grand pool de ressources partagées sans limite fixe par projet pour le débit du modèle.

Les performances, comme la latence, peuvent varier en fonction de la charge globale du système. En cas de forte demande dans le pool partagé, vous pouvez parfois rencontrer des erreurs 429 Resource Exhausted temporaires. Ces erreurs indiquent que la capacité du pool partagé est momentanément limitée, mais pas que vous avez atteint une limite de quota spécifique dans votre projet. Pour vérifier la capacité, relancez la requête après un court délai.

Étapes suivantes