Présentation de l'IA dans BigQuery

BigQuery propose diverses fonctionnalités d'IA qui vous permettent d'effectuer les opérations suivantes :

  • Effectuez du machine learning (ML) prédictif.
  • Exécutez l'inférence sur des grands modèles de langage (LLM) tels que Gemini.
  • Créez des applications à l'aide d'embeddings et de la recherche vectorielle.
  • Utilisez des agents intégrés pour vous aider à coder.
  • Créez des pipelines de données.
  • Accédez aux fonctionnalités BigQuery avec les outils de l'agent.

Machine learning

Avec BigQuery ML, vous pouvez entraîner, évaluer et exécuter l'inférence sur des modèles pour des tâches telles que la prévision de séries temporelles, la détection d'anomalies, la classification, la régression, le clustering, la réduction de dimensionnalité et les recommandations.

Vous pouvez utiliser les fonctionnalités BigQuery ML via la consoleGoogle Cloud , l'outil de ligne de commande bq, l'API REST ou dans les notebooks Colab Enterprise. BigQuery ML permet aux utilisateurs de SQL de mettre à profit leurs propres compétences et outils SQL pour créer et évaluer des modèles. Il démocratise ainsi le machine learning et accélère le développement de modèles en appliquant le ML aux données, sans avoir à les déplacer. Vous pouvez utiliser BigQuery ML pour vous aider à effectuer les types de tâches de ML suivants :

Pour en savoir plus, consultez la présentation du ML dans BigQuery.

Fonctions d'IA

BigQuery propose différentes fonctions SQL que vous pouvez utiliser pour les tâches d'IA telles que la génération de texte, l'analyse de texte ou de données non structurées, et la traduction. Ces fonctions accèdent aux modèles LLM Gemini et partenaires disponibles dans Vertex AI, les API Cloud AI ou les modèles BigQuery intégrés pour effectuer ces tâches.

Il existe plusieurs catégories de fonctions d'IA :

  • Fonctionnalités d'IA générative. Ces fonctions vous aident à effectuer des tâches telles que la génération de contenu, l'analyse, la synthèse, l'extraction de données structurées, la classification, la génération d'embeddings et l'enrichissement de données. Il existe deux types de fonctions d'IA générative :

    • Les fonctions d'IA à usage général vous offrent un contrôle et une transparence totaux sur le choix du modèle, de l'invite et des paramètres à utiliser.
    • Les fonctions d'IA gérées offrent une syntaxe simplifiée pour les tâches de routine telles que le filtrage, l'évaluation et la classification. BigQuery choisit un modèle pour vous, optimisé pour le coût et la qualité.
  • Fonctions spécifiques à une tâche Ces fonctions vous aident à utiliser les API Cloud AI pour des tâches telles que les suivantes :

Pour en savoir plus, consultez Présentation des solutions spécifiques à une tâche.

BigQuery propose diverses fonctions et fonctionnalités de recherche pour vous aider à trouver efficacement des données spécifiques ou à découvrir des similitudes entre des données, y compris des données multimodales.

  • Recherche textuelle Vous pouvez utiliser la fonction SEARCH pour effectuer une recherche tokenisée sur du texte non structuré ou des données JSON semi-structurées. Vous pouvez améliorer les performances de recherche en créant un index de recherche, qui permet à BigQuery d'optimiser les requêtes qui utilisent la fonction SEARCH, ainsi que d'autres fonctions et opérateurs. Pour en savoir plus, consultez Rechercher des données indexées.

  • Génération d'embeddings : Les embeddings sont des vecteurs numériques de grande dimension qui représentent des entités telles que du texte ou des images, et sont souvent générés par des modèles de ML. Vous pouvez générer des embeddings multimodaux à l'aide de modèles fournis ou hébergés sur Vertex AI, ou à l'aide de modèles importés et exécutés dans BigQuery.

    Vous pouvez également demander à BigQuery de gérer automatiquement une colonne d'embeddings en activant la génération autonome d'embeddings (aperçu).

  • Recherche vectorielle : Vous pouvez utiliser la fonction VECTOR_SEARCH pour rechercher des embeddings afin d'identifier des éléments sémantiquement similaires. Vous pouvez utiliser la fonction AI.SEARCH (Aperçu) pour effectuer des recherches dans les tables pour lesquelles la génération autonome d'embeddings est activée. Vous pouvez améliorer les performances de la recherche vectorielle en créant un index vectoriel, qui utilise des techniques de recherche approximative du voisin le plus proche pour fournir des résultats plus rapides et plus approximatifs.

    Les cas d'utilisation courants de la recherche vectorielle incluent la recherche sémantique, la recommandation et la génération augmentée par récupération (RAG). Pour en savoir plus, consultez Présentation de la recherche vectorielle.

Fonctionnalités d'IA d'assistance

Les fonctionnalités d'assistance optimisées par l'IA dans BigQuery, collectivement appelées Gemini dans BigQuery, vous aident à découvrir, préparer, interroger et visualiser vos données.

  • Insights sur les données. Générez des questions en langage naturel sur vos données, ainsi que les requêtes SQL permettant d'y répondre.
  • Préparation des données Générez des recommandations adaptées au contexte pour nettoyer, transformer et enrichir vos données.
  • Assistance au codage SQL Générez, exécutez et expliquez des requêtes SQL.
  • Assistance au codage Python Générez, exécutez et expliquez du code Python, y compris PySpark et BigQuery DataFrames.
  • Canevas de données Interrogez vos données en langage naturel, visualisez les résultats à l'aide de graphiques et posez des questions complémentaires.
  • Traducteur SQL Créez des règles de traduction SQL optimisées par Gemini pour vous aider à migrer les requêtes écrites dans un autre dialecte vers GoogleSQL.

Agents

Les agents sont des outils logiciels qui peuvent utiliser l'IA pour effectuer des tâches à votre place. Vous pouvez utiliser des agents intégrés ou créer vos propres agents pour vous aider à traiter, gérer, analyser et visualiser vos données :

  • Utilisez l'agent Data Science pour automatiser l'analyse exploratoire des données, le traitement des données, les tâches de ML et les insights de visualisation dans un notebook Colab Enterprise.

  • Utilisez l'agent Data Engineering pour créer, modifier et gérer des pipelines de données afin de charger et de traiter des données dans BigQuery. Vous pouvez utiliser des requêtes en langage naturel pour générer des pipelines de données à partir de différentes sources de données ou adapter des pipelines de données existants à vos besoins en ingénierie des données.

  • Utilisez la CLI Gemini pour interagir avec les données BigQuery dans votre terminal à l'aide de requêtes en langage naturel.

  • Utilisez la boîte à outils MCP pour connecter votre propre outil d'IA à BigQuery et interagir avec vos données.

Étapes suivantes