Présentation de l'IA dans BigQuery

BigQuery propose diverses fonctionnalités d'IA qui vous permettent d'effectuer les opérations suivantes :

  • Effectuer du machine learning (ML) prédictif
  • Exécuter des inférences sur des grands modèles de langage (LLM) tels que Gemini
  • Créer des applications à l'aide d'embeddings et de la recherche vectorielle
  • Utiliser des agents intégrés pour vous aider à coder
  • Créer des pipelines de données
  • Accéder aux fonctionnalités BigQuery avec des outils d'agent

Machine learning

Avec BigQuery ML, vous pouvez entraîner, évaluer et exécuter des inférences sur des modèles pour des tâches telles que la prévision de séries temporelles, la détection d'anomalies, la classification, la régression, le clustering, la réduction de la dimensionnalité et les recommandations.

Vous pouvez utiliser les fonctionnalités BigQuery ML via la Google Cloud console, l'outil de ligne de commande bq, l'API REST ou dans des notebooks Colab Enterprise. Comme BigQuery ML permet aux professionnels du SQL d'utiliser les outils et compétences SQL existants pour créer et évaluer des modèles, il démocratise le ML et accélère le développement de modèles en intégrant le ML aux données au lieu de nécessiter un déplacement des données. Vous pouvez utiliser BigQuery ML pour vous aider à effectuer les types de tâches de ML suivants :

Pour en savoir plus, consultez le Présentation du ML dans BigQuery.

Fonctions d'IA

BigQuery propose diverses fonctions SQL que vous pouvez utiliser pour des tâches d'IA telles que la génération de texte, l'analyse de texte ou de données non structurées, et la traduction. Ces fonctions accèdent aux modèles Gemini et LLM partenaires disponibles à partir de Gemini Enterprise Agent Platform, des API IA Cloud ou des modèles BigQuery intégrés pour effectuer ces tâches.

Il existe plusieurs catégories de fonctions d'IA :

  • Fonctions d'IA générative Ces fonctions vous aident à effectuer des tâches telles que la génération de contenu, l'analyse, la synthèse, l'extraction de données structurées, la classification, la génération d'embeddings et l'enrichissement des données. Il existe deux types de fonctions d'IA générative :

    • Les fonctions d'IA à usage général vous offrent un contrôle et une transparence complets sur le choix du modèle, de la requête, et des paramètres à utiliser.
    • Les fonctions d'IA gérées offrent une syntaxe simplifiée pour les tâches de routine telles que le filtrage, l'évaluation, et la classification. BigQuery peut choisir un modèle pour vous afin d'optimiser les coûts et la qualité.
  • Fonctions spécifiques à une tâche Ces fonctions vous aident à utiliser les API IA Cloud pour des tâches telles que les suivantes :

Pour en savoir plus, consultez Présentation des solutions spécifiques à une tâche.

BigQuery propose diverses fonctions et fonctionnalités de recherche pour vous aider à trouver efficacement des données spécifiques ou à découvrir des similitudes entre des données, y compris des données multimodales.

  • Recherche textuelle Vous pouvez utiliser la SEARCH fonction pour effectuer une recherche tokenisée sur du texte non structuré ou des données JSON semi-structurées. Vous pouvez améliorer les performances de recherche en créant un index de recherche, qui permet à BigQuery d'optimiser les requêtes qui utilisent la fonction SEARCH, ainsi que d'autres fonctions et opérateurs. Pour en savoir plus, consultez Rechercher des données indexées.

  • Génération d'embeddings Les embeddings sont des vecteurs numériques de grande dimension qui représentent des entités telles que du texte ou des images, et sont souvent générés par des modèles de ML. Vous pouvez générer des embeddings multimodaux à l'aide de modèles fournis par ou hébergés sur Agent Platform, ou à l'aide de modèles importés et exécutés dans BigQuery.

    Vous pouvez également demander à BigQuery de gérer automatiquement une colonne d' embeddings en activant la génération autonome d'embeddings (aperçu).

  • Recherche vectorielle Vous pouvez utiliser la VECTOR_SEARCH fonction pour rechercher des embeddings afin de trouver des éléments sémantiquement similaires. Vous pouvez utiliser la AI.SEARCH fonction (aperçu) pour effectuer des recherches dans des tables pour lesquelles la génération autonome d'embeddings est activée. Vous pouvez améliorer les performances de la recherche vectorielle en créant un index vectoriel, qui utilise des techniques de recherche approximative du voisin le plus proche pour fournir des résultats plus rapides et plus approximatifs.

    Les cas d'utilisation courants de la recherche vectorielle incluent la recherche sémantique, la recommandation et la génération augmentée par récupération (RAG). Pour en savoir plus, consultez Présentation de la recherche vectorielle.

Fonctionnalités d'IA d'assistance

Les fonctionnalités d'assistance basées sur l'IA dans BigQuery, collectivement appelées Gemini dans BigQuery, vous aident à découvrir, préparer, interroger et visualiser vos données.

  • Insights sur les données Générez des questions en langage naturel sur vos données, ainsi que les requêtes SQL permettant d'y répondre.
  • Préparation des données Générez des recommandations contextuelles pour nettoyer, transformer et enrichir vos données.
  • Assistance au codage SQL Générez, complétez et expliquez des requêtes SQL.
  • Assistance au codage Python Générez, complétez et expliquez du code Python, y compris PySpark et BigQuery DataFrames.
  • Data Canvas Interrogez vos données en langage naturel, visualisez les résultats à l'aide de graphiques et posez des questions de suivi.
  • Traducteur SQL Créez des règles de traduction SQL améliorées par Gemini pour vous aider à migrer des requêtes écrites dans un dialecte différent vers GoogleSQL.

Agents

Les agents sont des outils logiciels qui peuvent utiliser l'IA pour effectuer des tâches en votre nom. Vous pouvez utiliser des agents intégrés ou créer vos propres agents pour vous aider à traiter, gérer, analyser et visualiser vos données :

  • Utilisez l'agent Data Science pour automatiser l'analyse exploratoire des données, le traitement des données, les tâches de ML et les insights de visualisation dans un notebook Colab Enterprise.

  • Utilisez l' agent Data Engineering pour créer, modifier et gérer des pipelines de données afin de charger et de traiter des données dans BigQuery. Vous pouvez utiliser des requêtes en langage naturel pour générer des pipelines de données à partir de différentes sources de données ou adapter des pipelines de données existants à vos besoins en ingénierie des données.

  • Utilisez l' agent Conversational Analytics pour interagir avec vos données en langage naturel. Cet agent se compose d'une ou de plusieurs sources de données et d'un ensemble d'instructions spécifiques à un cas d'utilisation pour le traitement de ces données. L'analyse de conversation est compatible avec l'utilisation de certaines fonctions BigQuery ML.

  • Utilisez la Gemini CLI pour interagir avec les données BigQuery dans votre terminal à l'aide de requêtes en langage naturel.

  • Créez des agents rapidement et de manière itérative à l'aide de la boîte à outils MCP Open Source ou des outils ADK.

Étape suivante